Формализация знаний
Стадия формализации. Процесс формализации предусматривает перевод основных концепций, подзадач, характеристик информационного потока в более формальное представление. На этой стадии главную роль играет инженер знаний. Он объясняет эксперту методы, представления, типы задач, соответствующие рассматриваемой проблеме. Если ИЗ считает, что какой-либо метод подходит, то делается попытка удовлетворить требования выбранной схемы. Выводом данного этапа является набор частных утверждений, описывающих, как проблема может быть представлена в рамках выбранного метода или схемы.
В процессе формализации выделяются пространство гипотез, модель процесса, характеристика данных.
Чтобы понять структуру пространства гипотез, необходимо формализовать концепции и определить, как они связываются между собой, образуя гипотезы. Определяется форма и структура концепций: например, выгодно ли описывать концепции как структурированные объекты или рассматривать их как простые понятия? Являются ли причинно-следственные или пространственно-временные связи между концепциями важными? Следует ли представлять их в явном виде?
Концепции являются основополагающими при определении характера пространства гипотез. Конечно оно или бесконечно? Состоит ли из заранее определенных классов, или должно генерироваться из концепций по некоторой процедуре? Полезно или нет рассматривать гипотезы в иерархическом виде? Присутствуют ли неопределенность или спорные, неоднозначные элементы, относящиеся к конечным и промежуточным гипотезам? Следует ли использовать различные уровни абстракции?
Полезно построить модель процесса генерации решений. В ее состав могут входить как математические, так и поведенческие методы Если эксперт применяет упрощенную поведенческую модель при выводе решения или его обосновании, то при анализе модели можно получить много важных концепций и связей. Если часть концептуальной структуры описывается математической (аналитической или статистической) моделью, то ее можно включить в ЭС и использовать для доказательства непротиворечивости причинно-следственных связей в базе знаний ЭС.
Важно выявить природу данных предметной области. Если данные могут быть объяснены в терминах некоторых гипотез, то надо указать, является ли зта связь причинно-следственной, дефинитивной, корреляционной.
Для выявления природы данных необходимо ответить на следующие вопросы.
- Являются ли данные редкими, недостаточными, избыточными?
- Имеется ли неопределенность в данных?
- Зависит ли логическая интерпретация данных от порядка их появления во времени?
- Какова стоимость приобретения данных?
- Как приобретаются или извлекаются данные?
- Какие вопросы необходимо задавать для их получения?
- Как получить некоторые характеристики данных на основании выборки из непрерывного потока данных?
- Как извлечь свойства данных из графиков, рисунков, грамматического разбора ввода на естественном языке?
- Являются ли данные надежными, устойчивыми, точными, однозначными или нет?
- Являются ли данные непротиворечивыми и полными для решения поставленных задач?
Результатом формализации потока концептуальной информации и элементов подзадач оказывается частичная спецификация для построения прототипа базы знаний. Спецификации содержат организационную схему, явное представление основных концепций и связей проблемы. На этом же этапе выбираются языки и схема, минимизирующая несоответствие при представлении подзадач.
