logo
Базы знаний интелл

3.3.3. Гносеологический аспект извлечения знаний

Гносеология — это раздел философии, связанный с теорией познания, или теорией отражения действительности в сознании человека. Гносеологический аспект (A3) извлечения знаний объединяет методологические проблемы получения нового научного знания, поскольку при создании БЗ эксперт часто впервые формулирует некоторые закономерности, до того момента составлявшие его личный опыт.

Инженерия знаний как наука, если можно так выразиться, дважды гносеологична — сначала действительность (О) отражается в сознании эксперта (M1), а затем деятельность и опыт эксперта интерпретируются сознанием инженера по знаниям (М2), что служит уже основой для построения третьей интерпретации (Р) — поля знаний экспертной системы (см. рис. 3.5). Процесс познания, в сущности, направлен на создание внутренней репрезентации окружающего мира в сознании человека.

Предметом данного учебника являются в основном процессы отображения 12 и 13 (I1 — изучают психология и философия); подробно интерпретация 13 будет рассмотрена далее.

Если описать процессы I2 и I3 в терминологии, введенной в главе 1, то мы имеем дело с превращением экспертного знания и теоретического (книжного) опыта Z1 в поле знаний Z2, которое есть материализация модели мира М2 инженера по знаниям.

В процессе извлечения знаний аналитика в основном интересует компонент Z1, связанный с неканоническими индивидуальными знаниями экспертов, поскольку предметные области, требующие именно такого типа знаний, считаются наиболее восприимчивыми к внедрению экспертных систем. Эти области обычно называют эмпирическими, так как в них накоплен большой объем отдельных эмпирических фактов и наблюдений, в то время как их теоретическое обобщение — вопрос будущего.

Если считать, что инженер по знаниям извлекает только фрагмент Z1', то есть часть из системы знаний эксперта Z1, то его задача, во-первых, стараться, чтобы структура Z1' соответствовала Z1, и, во-вторых, чтобы Z1' как можно более полно отражал Z1.

Познание часто сопровождается созданием новых понятий и теорий. Иногда эксперт порождает новые знания прямо в ходе беседы с аналитиком. Такая генерация знаний полезна и самому эксперту, который до того момента мог не осознавать ряд соотношений и закономерностей предметной области. Аналитику может помочь тут и инструментарий системной методологии, позволяющий использовать известные принципы логики научных исследований, понятийной иерархии науки. Эта методология заставляет его за частным всегда стремиться увидеть общее, то есть строить цепочки.

Н

Гносеологическая цепочка: факт ® обобщенный факт ® эмпирический закон ® теоретический закон.

е всегда удается дойти до последнего звена этой цепочки, но уже само стремление к движению бывает чрезвычайно плодотворным. Такой подход полностью согласуется со структурой самого знания, которое имеет два уровня:

1. Эмпирический (наблюдения, явления).

2. Теоретический (законы, абстракции, обобщения).

Но теория — это не только стройная система обобщения научного знания, это также некоторый способ производства новых знаний. Основными методологическими критериями научности, позволяющими считать научным и само новое знание и способ его получения, являются [Коршунов, Манталов, 1988]:

A3 = {S31, S32, 533} = {внутренняя согласованность, системность, объективность, историзм}.

Внутренняя согласованность(S31)

Основные характеристики эмпирического знания:

S31 = {s31_i} = {модальность, противоречивость, неполнота}.

На первый взгляд критерий внутренней согласованности знания не соответствует реальным характеристикам, описывающим знания с точки зрения слоя s31_i. Эти характеристики эмпирических знаний подчеркивают его «многоуклад-ность» — столь часто факты не согласуются друг с другом, определения противоречат, критерии диффузны и т. д. Аналитику, знающему особенности эмпирического знания, — приходится сглаживать эти «шероховатости» эмпирики.

Модальность (s31_1) знания означает возможность его существования в различных категориях, то есть в конструкциях существования и долженствования. Таким образом, часть закономерностей возможна, другая обязательна и т.д. Кроме того, приходится различать такие оттенки модальности, как:

• эксперт знает, что...;

• эксперт думает, что...;

• эксперт хочет, чтобы...;

• эксперт считает, что... .

Возможная противоречивость (s31_2) эмпирического знания — естественное следствие из основных законов диалектики, и противоречия эти не всегда должны разрешаться в поле знаний, а напротив, именно противоречия служат чаще всего отправной точкой в рассуждениях экспертов.

Неполнота (s31_3) знания связана с невозможностью полного описания предметной области. Задача аналитика эту неполноту ограничить определенными рамками «полноты», то есть сузить границы предметной области либо ввести ряд ограничений и допущений, упрощающих проблему.

Системность (S32)

Системно-структурный подход к познанию (восходящий еще к Гегелю) ориентирует аналитика на рассмотрение любой предметной области с позиций закономерностей системного целого и взаимодействия составляющих его частей. Современный структурализм исходит из многоуровневой иерархической организации любого объекта, то есть все процессы и явления можно рассматривать как множество более мелких подмножеств (признаков, деталей) и, наоборот, любые объекты можно (и нужно) рассматривать как элементы более высоких классов обобщений. Например, системный взгляд на проблематику структурирования знаний позволяет увидеть его иерархическую организацию. Подробнее об этом в параграфе 3.4.

Объективность (S33)

Процесс познания глубоко субъективен, то есть он существенно зависит от особенностей самого познающего субъекта. «Факты существуют для одного глаза и отсутствуют для другого» (Виппер). Таким образом, субъективность начинается уже с описания фактов и увеличивается по мере углубления идеализации объектов.

Следовательно, более корректно говорить о глубине понимания, чем об объективности знания. Понимание — это сотворчество, процесс истолкования объекта с точки зрения субъекта. Это сложный и неоднозначный процесс, совершающийся в глубинах человеческого сознания и требующий мобилизации всех интеллектуальных и эмоциональных способностей человека. Все свои усилия аналитик должен сосредоточить на понимании проблемы.

В психологии известен результат [Величковский, Капица, 1987], подтверждающий факт, что люди, быстро и успешно решающие интеллектуальные задачи, большую часть времени тратят на понимание ее, в то время как плохие решатели быстро приступают к поискам решения и чаще всего не могут его найти.

Историзм (S34)

Этот критерий связан с развитием. Познание настоящего — есть познание породившего его прошлого. И хотя большинство экспертных систем дают «горизонтальный» срез знаний — без учета времени (в статике), инженер по знаниям должен всегда рассматривать процессы с учетом временных изменений — как связь с прошлым, так и связь с будущим. Например, структура поля знаний и база знаний должны допускать подстройку и коррекцию как в период разработки, так и во время эксплуатации ЭС.

Рассмотрев основные критерии научности познания, попытаемся теперь описать его структуру. Методологическая структура познания может быть представлена как некоторая последовательность этапов [Коршунов, Манталов, 1988].

Параметры {S3i} органически вписываются в эту структуру познания, которая может быть представлена как последовательность этапов, описанных далее с позиций инженера по знаниям:

• Э_1: описание и обобщение фактов;

• Э_2: установление логических и математических связей, дедукция и индукция законов;

• Э_3: построение идеализированной модели;

• Э_4: объяснение и предсказание явлений.

Э_1. Описание и обобщение фактов

Тщательность и полнота ведения протоколов во время процесса извлечения и пунктуальная «домашняя работа» над ними — вот залог продуктивного первого этапа познания и материал для описания и обобщения фактов.

На практике оказывается трудным придерживаться принципов объективности и системности, описанных выше. Чаще всего на этом этапе факты просто собирают и как бы бросают в «общий мешок»; опытный инженер по знаниям часто сразу пытается найти «полочку» или «ящичек» для каждого факта, тем самым подспудно готовясь к этапу концептуализации.

Э_2. Установление связей и закономерностей

В памяти эксперта все понятия увязаны и закономерности установлены, хотя часто и неявно задача инженера — выявить каркас умозаключений эксперта. Реконструируя рассуждения эксперта, инженер по знаниям может опираться на две наиболее популярные теории мышления — логическую и ассоциативную. При этом если логическая теория благодаря горячим поклонникам в лице математиков широко цитируется и всячески эксплуатируется в работах по искусственному интеллекту, то вторая, ассоциативная, гораздо менее известна и популярна, хотя имеет также древние корни. Так, Р. Фейнман в своих «Лекциях по физике» отмечает, что в физике по-прежнему преобладающим является вавилонский, а не греческий метод построения знаний. Известно, что древневосточные математики умели делать сложные вычисления, но формулы их не были логически увязаны. Напротив, греческая математика дедуктивна (например, «Начала» Евклида).

Традиционная логика формирует критерии, которые гарантируют точность, валидность, непротиворечивость общих понятий рассуждений и выводов. Ее основы заложены еще в «Органоне» Аристотеля в 4 в. до н. э. Большой вклад в развитие логики внес Джон Стюарт Милль (1806-1873).

Инженер по знаниям и сам использует операции традиционной логики и выделяет их в схеме рассуждений эксперта. Это следующие операции:

• определение;

• сравнение и различение;

• анализ;

• абстрагирование;

• обобщение;

• классификация;

• категоризация;

• образование суждений;

• умозаключение;

• составление силлогизмов и т. д.

Однако красота и стройность логической теории не должны заслонять того, что человек редко мыслит в категориях математической логики [Поспелов, 1989]. Теория ассоциаций представляет мышление как цепочку идей, связанных общими понятиями. Основными операциями такого мышления являются:

• ассоциации, приобретенные на основе различных связей;

• припоминание прошлого опыта; пробы и ошибки со случайными успехами;

• привычные («автоматические») реакции и пр.

Однако эти две теории не исчерпывают всего многообразия психологических школ. Большой интерес для инженерии знаний может представлять гештальт-психология. Одним из ее основателей является выдающийся немецкий психолог М. Вертгеймер (1880-1943). Под гештальтом (нем. Gestalt) понимается принцип целостности восприятия — как основа мышления. Гештальт-психологи стараются во всем выделять некий целостный образ или структуру как базис для понимания процессов и явлений окружающего мира. Эта теория близка теории фреймов и объектному подходу и направлена на постижение глубинного знания, которое характеризуется стабильностью и симметрией. При этом важен так называемый «центр ситуации», относительно которого развивается знание о предметной области.

Для инженера по знаниям это означает, что, выявляя различные фрагменты знаний, он не должен забывать о главном, о гештальте фрагмента, который влияет на остальные компоненты и связывает их в некоторую структурную единицу. Гештальтом может быть некий главный принцип, или идея, или гипотеза эксперта, или его вера в силу каких-то отдельных концепций. Этот принцип редко формулируется экспертом явно, он всегда как бы за «кадром», и искусство инженера по знаниям обнаружить этот основной гештальт эксперта.

В гештальт-теории существует закон «стремления к хорошему гештальту», согласно которому структуры сознания стремятся к гармонии, связности, простоте. Это близко к старинному классическому принципу «бритвы Оккама» — «сущности не должны умножаться без необходимости» — и формулируется как принцип прегнантности Вертгеймера [Вертгеймер, 1987]: «Организация поля имеет тенденцию быть настолько простой и ясной, насколько позволяют данные условия». Рассуждения о гештальте подводят вплотную к третьему этапу в структуре познания.

Э_3. Построение идеализированной модели

Для построения модели, отражающей представление субъекта о предметной области, необходим специализированный язык, с помощью которого можно описывать и конструировать те идеализированные модели мира, которые возникают в процессе мышления. Язык этот создается постепенно с помощью категориального аппарата, принятого в соответствующей предметной области, а также формально-знаковых средств математики и логики. Для эмпирических предметных областей такой язык пока не разработан, и поле знаний, которое полуформализованным способом опишет аналитик, может быть первым шагом к созданию такого языка.

Любое познавательное отражение включает в себя условность, то есть упрощение и идеализацию. Инженеру по знаниям необходимо овладение такими специфическими гносеологическими приемами, как идеализация, огрубление, абстрагирование, которые позволяют адекватно отображать в модели реальную картину мира. Эти приемы доводят свойства и признаки объектов до пределов, позволяющих воспроизводить законы действительности в более лаконичном виде (без влияния несущественных деталей).

На тернистом пути познания проверенный диалектический подход оказывается лучшим «поводырем». Инженер по знаниям, который стремится познать проблемную область, должен быть готов постоянно изменять свои уже утвердившиеся способы восприятия и оценки мира и даже отказываться от них. При этом тщательнее всего следует проверять правильность суждений, которые кажутся самыми очевидными.

Э_4. Объяснение и предсказание моделей

Этот завершающий этап в структуре познания является одновременно и частичным критерием истинности полученного знания. Если выявленная система знаний эксперта полна и объективна, то на ее основании можно делать прогнозы и объяснять любые явления из данной предметной области. Обычно базы знаний ЭС страдают фрагментарностью и модульностью (несвязанностью) компонентов. Все это не позволяет создавать действительно интеллектуальные системы, которые, равняясь на человека, могли бы предсказывать новые закономерности и объяснять случаи, не указанные в явном виде в базе. Исключением тут являются обучающие системы, которые ориентированы на генерацию новых знаний и «предсказание».

Предлагаемая методология вооружает аналитика аппаратом, позволяющим избежать традиционных ошибок, приводящих к неполноте, противоречивости, фрагментарности БЗ, и указывает направление, в котором необходимо двигаться разработчикам. И хотя на сегодняшний день большинство БЗ прорабатываются лишь до этапа Э_3, знание полной схемы обогащает и углубляет процесс проектирования.