11.2.2.
Общность эвристической классификации
Интересной
особенностью методики анализа, предложенной Кленси, является то, что она подходит
для большого спектра экспертных систем. Оказывается, что, несмотря на различие
областей применения, многие экспертные системы функционируют, в принципе, одинаково.
В своей статье Кленси продемонстрировал применение предложенной методики на
множестве систем, помимо MYC1N.
Программа
SAGON [Bennett et al., 1978] предназначена для выработки рекомендаций
относительно использования программного пакета MARC, с помощью которого выполняется
анализ характеристик механических систем методом конечных элементов. MARC —
это достаточно сложный программный продукт, который предоставляет в распоряжение
пользователей огромное количество опций. Разумное использование широких возможностей
MARC представляет серьезную проблему для неопытных пользователей. Роль программы
SAGON состоит именно в том, чтобы помочь таким пользователям. Программа формирует
стратегию анализа, которая основывается на введенном пользователем описании
компонентов.
Рис. 11.4.
Структура логических связей в системе MYCIN ([Clancey, 1985])
Программа
SAGON располагает знаниями о более чем 30 классах анализа. При определении типа
анализа, наиболее подходящего для заданной пользователем проблемы, программа
использует два этапа эвристического сопоставления, которые аналогичны описанным
Кленси. Первый этап — выбор математической модели для оценки напряжений и деформаций
при различных условиях, которая учитывает введенную пользователем информацию
о геометрии моделируемой конструкции и нагрузках. Второй этап — выбор стратегии
анализа этой модели, руководствуясь принципом наихудшего случая распределения
напряжений и деформаций.
Оба этапа
включают выбор из набора альтернативных вариантов и эвристическое сопоставление
различных абстрактных категорий. Этап конкретизация решения отсутствует,
поскольку на втором этапе определяются только подходящие классы программ из
комплекта MARC, хотя формируемая стратегия анализа включает и рекомендации о
выборе специфических функций из числа тех, которые имеются в MARC. В отличие
от MYCIN, при сопоставлении не используются коэффициенты уверенности. Это объясняется
тем, что за основу принят принцип наихудшего случая, который позволяет давать
категоричные рекомендации даже в случае не совсем точного сопоставления.
Кленси обратил
также внимание на то, что в большинстве экспертных систем используется не одна,
а несколько родовых операций из тех, что представлены на рис. 11.1 и 11.2. В
частности, процесс выработки рекомендаций о курсе лечения в системе MYCIN включает
мониторинг состояния пациента, диагностирование категории заболевания,
идентификацию микроорганизмов и модификацию состояния пациента
(или состояния организма). Программа SACON идентифицирует типы структур,
предсказывает в терминах математической модели, как такие структуры будут
себя вести, и затем идентифицирует подходящий метод анализа.
В своей статье
Кленси также проанализировал и систему SOPHIE ([Brown et ai, 1982]), предназначенную
для поиска неисправностей в электронных схемах. Программа создавалась как инструмент
для проведения исследований в области обучения с использованием компьютера,
но включенный в ее состав модуль решения проблем способен классифицировать электронные
схемы в терминах компонентов, которые вызывают неправильное функционирование
схемы. Заранее пронумерованное пространство решений этого модуля содержит описания
дозволенных и ошибочных пар вход/выход.
На рис. 11.5
схематически показано, каким образом структуру логического вывода в системе
SOPHIE можно трактовать в качестве примера эвристической классификации. Результаты
измерений в различных точках электронной схемы позволяют SOPHIE формировать
количественные утверждения о поведении схемы, например о напряжении между
двумя точками электрической цепи. Программа затем может преобразовать их в утверждения
относительно качества функционирования схемы (например, слишком высокое
напряжение), а последние эвристически сопоставляются с отказами на уровне
модуля. Таким образом, в терминах задач анализа, представленных на рис. 11.1,
можно говорить о том, что в системе SOPHIE выполняется мониторинг состояния
схемы и диагностирование отказавших модулей и компонентов.
В системе
COMPASS, описанной в предыдущей главе, также используется некоторая форма эвристической
классификации как часть процесса декомпозиции проблем. При анализе отказов системы
переключений телефонной сети программа сначала разбивает сообщения об ошибках
на группы. Это можно рассматривать как этап формирования абстрактной категории
данных в соответствии с методикой Кленси. Во-первых, такое разбиение необходимо,
поскольку для идентификации отказа недостаточно единственного сообщения, а во-вторых,
разбиение возможно, поскольку существует эвристика, позволяющая сопоставлять
отказы с набором сообщений определенных групп. Но в этой системе можно найти
и аналог этапа конкретизации, на котором устраняются неопределенности, остающиеся
после группирования. Без неявной абстракции данных на этапе группирования не
удалось бы сопоставить сообщения и отказы, а без последующего этапа конкретизации
рекомендации, которые формирует система, были бы слишком расплывчаты и неконкретны.
Ценность предложенной
Кленси методики анализа заключается в том, что она непосредственна связана с
поиском ответов на сформулированные в начале этой главы вопросы. В частности,
эта методика позволяет определить базовый метод решения проблем, который может
быть с успехом применен в различных предметных областях. В следующей главе мы
попытаемся четче обозначить различие между эвристической классификацией и другими
методами и выделим тот класс проблем, по отношению к которым применение эвристической
классификации наиболее целесообразно.
Рис. 11.5.
Структура логических связей в системе SOPHIE ([Clancey, 1985])
Нужно отметить,
что предложенная Кленси методика анализа фундаментальных аспектов решения проблем
с помощью технологии экспертных систем не является единственной. Например, в
работе [Chandrasekaran, 1986] получило дальнейшее развитие понятие
родовой задачи (generic task). Родовая задача представляет собой, по сути,
спецификацию задачи, включающую описание различных форм знаний о предметной
области и их организации для выполнения задачи вручную и набор режимов выполнения
задачи.
Примерами
таких задач являются иерархическая классификация, сопоставление или оценка гипотез
и передача информации, направляемая знаниями.
Задача иерархической
классификации включает отбор гипотез из иерархически организованного пространства
альтернатив, а затем уточнение этих гипотез с учетом' имеющихся данных. Гипотезами
могут быть, например, заболевания или неисправности оборудования. Каждая такая
гипотеза может быть порождена имеющимися данными, но прежде чем развивать ее
дальше, необходимо выполнить определенные проверки или уточнить гипотезу таким
образом, чтобы она соответствовала более широкому набору имеющихся фактов. Экспертные
системы, в которых выполняются такие родовые задачи, мы рассмотрим в главах
13 и 16.
Под сопоставлением
гипотез понимается выполнение количественной оценки свидетельств в пользу
достоверности гипотез или того, насколько полным является соответствие между
имеющимися данными и гипотезами. В такую оценку иногда включается априорная
вероятность гипотез, поиск возможных конкурирующих гипотез и т.п. Все операции,
связанные с обработкой коэффициентов уверенности в системе MYCIN, можно рассматривать
как реализацию механизма родовых задач этого вида. Некоторые из этих тем мы
рассмотрим в главе 12.
Передача
информации, направляемой знаниями, проявляется в виде неочевидных логических
связей, которые трудно классифицировать, но которые характерны для способа мышления
эксперта. Например, врач не оставит без внимания тот факт, что пациент недавно
перенес хирургическую операцию, поскольку, скорее всего, он подвергся анестезии,
а это может косвенно сказаться на формировании диагноза. В логических рассуждениях
такого типа используются "фоновые" знания о предметной области, а
не те порождающие правила, с которыми мы связываем свое представление об экспертной
системе медицинской диагностики. Ниже, в главе 12, мы обсудим дифференциацию
разных видов знаний.
Итак, одно
из отличий между подходами Кленси и Чандрасекарана состоит в том, что для первого
характерно стремление разбить решение проблемы на мелкие абстрактные категории.
Подход Кленси приводит к поглощению этапа сопоставления гипотез эвристической
классификацией, в то время как Чандрасёкаран делает акцент на том, что обработка
гипотез может рассматриваться как самостоятельная родовая задача со своими собственными
правами вне контекста классификации. Таким образом, появляется проблема, до
какого уровня "зернистости" целесообразно доводить абстрагирование
и какие критерии следует выбрать для оценки этой "грануляции". Рассмотрение
этих вопросов выходит за рамки вводного курса, однако те, кто собирается профессионально
заниматься конструированием экспертных систем, должны не упускать из виду существование
множества способов разрешения этих проблем.
11.1.
Определение понятия "оружие нападения"
Под
термином "оружие нападения" чаще всего понимаются различные виды полуавтоматического
индивидуального стрелкового оружия, подобного тому, которое используется в профессиональной
армии. Довольно трудно дать точное определение оружия нападения, из которого
было бы ясно, чем отличается такое оружие от спортивного, например. Но в таком
определении весьма заинтересованы законодатели на самых различных уровнях— федеральном,
штата и местном. В сборниках законодательных актов можно встретить самые разные
толкования этого термина. В контексте этой книги попытка сформулировать такое
определение может быть хорошим примером эвристической классификации.
Определение,
данное законодателями города Рочестер, шт. Нью-Йорк, включает пять частей. В
первых трех специфицируются свойства стрелкового оружия, которые позволяют отнести
его к категории оружия нападения. В части 4 просто перечисляются модели оружия,
которые следует отнести к этой категории. В части 5 перечисляются типы огнестрельного
оружия, которые не считаются относящимися к категории оружия нападения.
Можно
считать, что в первых трех частях выполняется абстрагирование от данных, как,
например, в этом предложении:
"Любая
винтовка с центральным боем или охотничье ружье, в котором используется сила
пороховых газов для перезаряжания после каждого выстрела и которое заряжается
или может быть заряжено обоймой на 6 и более боеприпасов".
Этим
определением "накрывается" большинство полуавтоматических винтовок
и охотничьих ружей, оснащенных магазином, в который помещается более пяти патронов.
В
части 4 перечисляются 17 моделей индивидуального стрелкового оружия, причем
некоторые из них уже подходят под определение, которое дано в первых трех частях.
Но некоторые модели отнесены к этой категории, несмотря на то, что они не обладают
признаками, обозначенными ранее. В, частности, к таким моделям относится полуавтоматический
пистолет с 30-зарядным магазином Gobray М11. Можно считать, что в этой части
рассматриваются специальные случаи, не учтенные при составлении предыдущих трех.
Часть
5 можно рассматривать как аналог этапа конкретизация решения. В этой части некоторые
из типов оружия, "подпадающие" под действие частей 1-3, исключаются
из категории при наличии дополнительных признаков.
В разделе упражнений вы встретите набор правил на языке CLIPS, которые соответствуют определению, сформулированному в рассматриваемом документе.