Базы знаний интелл

5.1.1. Семантические пространства и психологическое шкалирование

Основным методом экспериментальной психосемантики является метод реконструкции субъективных семантических пространств. Здесь психосемантика тесно сплетается с психолингвистикой и лингвистической семантикой — с методологией выявления значений слов, лексикографией, «падежной грамматикой» и структурными исследованиями [Апресян, 1977; Мельчук, 1974; Соссюр, 1977; Филлмор, 1983; Щерба, 1974]. Однако лингвистические методы в основном направлены на анализ текстов, отчужденных от субъекта, от его мотивов и замыслов.

Психолингвистические методы обращаются непосредственно к испытуемому. Большинство из них связано с различными формами субъективного шкалирования. Перед испытуемым ставится задача оценить «сходство знаний» с помощью некоторой градуированной шкалы, например от 0 до 5 или от 0 до 9. В этом случае исследователь получает в руки численно представленные стандартизированные данные, легко поддающиеся статистической обработке.

Психосемантика — как одно из молодых направлений современной психологии [Петренко, 1988; Шмелев, 1983] — сразу была оценена специалистами в области искусственного интеллекта как перспективный инструмент, позволяющий реконструировать семантическое пространство памяти как психологическую модель глубинной структуры знаний эксперта. Уже первые приложения психосемантики в ИИ в середине 80-х годов позволили получить достаточно наглядные результаты. В психологии семантические пространства выступают как модель категориальной структуры индивидуального сознания. При концептуальном анализе знаний структуру семантического пространства эксперта можно считать основой для формирования поля знаний. При этом отдельные параметры семантического пространства соответствуют различным компонентам поля (размерность пространства соотносится со сложностью поля, выделенные понятийные структуры с метапонятиями, содержательные связи между понятиями-стимулами — это суть отношения и т. д.).

Легче всего познакомиться с экспериментальной психосемантикой на примере, связанном с выявлением структуры и размерности семантического пространства знаний из некоторой предметной области [Петренко, 1988].

В основе построения семантических пространств, как правило, лежит статистическая процедура (например, факторный анализ [Аверкин, Батыршин, Блишун и др., 1986], многомерное шкалирование [Тиори, Фрай, 1985] или кластерный анализ [Дюран, Оделл, 1977]), позволяющая группировать ряд отдельных признаков описания в более емкие категории-факторы. Говоря на языке поля знаний, это — построение концептов более высокого уровня абстракции. При геометрической интерпретации семантического пространства значение отдельного признака отображается как точка или вектор с заданными координатами внутри n-мерного пространства, координатами которого выступают выделенные факторы. Построение семантического пространства, таким образом, включает переход к описанию предметной области на более высоком уровне абстракции, то есть переход от языка, содержащего большой алфавит признаков описания, к более емкому языку концептуализации, содержащему меньшее число концептов и выступающему своеобразным метаязыком по отношению к первому.

В зависимости от опыта и профессиональной компетентности испытуемых размерность пространства и расположение в ней первичных понятий может существенно варьироваться. Эта особенность семантических пространств может быть использована на стадии контроля в процессах обучения, при тестировании экспериментов и пользователей.

Пример 5.1

Так, для проверки знаний и понимания английского языка в работе [Терехина, 1988] были взяты десять наиболее распространенных предлогов, достаточно трудно переводимых. На экране дисплея испытуемому предъявлялась пара предлогов и спрашивалось, часто ли у него вызывает затруднения выбор одного из этих предлогов. Степень затруднения оценивалась в баллах от 1 до 9. На этих данных методами многомерного шкалирования была построена структура сложности употребления английских предлогов с точки зрения носителя русского языка. Эта модель существенно зависит от уровня знаний. Так, модель новичка не представляет организованной структуры. У людей, имеющих определенные навыки, проявилась некоторая структурированность семантического пространства, в нем отчетливо обозначились пары и тройки сходных предлогов.

Рис. 5.1. Семантическое пространство близости английских предлогов

Наиболее четкая и связная структура приведена на рис. 5.1. По ней можно объяснить особенности дифференциации предлогов в английском языке. Основа структуры представляется в виде окружности, близкие точки на которой соответствуют трудно дифференцируемым предлогам. Структура опирается на две ортогональные оси. Ось абсцисс соответствует предлогам направления движения, а ось ординат — предлогам цели — средства.

На основании получаемых методами психосемантики моделей можно проводить контроль знаний. При анализе индивидуальных семантических пространств выявляются вопросы, которые не усвоены и не уложились в систему. Контроль структуры знаний проводится на основе сопоставления семантических пространств хороших специалистов и новичков (студентов, слушателей, молодых специалистов). Степень согласованности семантических пространств (их размерности, признаки и конфигурации понятий) будет определять уровень знаний новичка.

Однако здесь необходимо учесть, что семантические пространства двух квалифицированных специалистов могут быть разными, так как содержат индивидуальные различия восприятия, отражающие опыт и характер деятельности человека. Поэтому не всегда можно формально сравнить семантические пространства эксперта и новичка, следует предварительно изучить семантические пространства нескольких специалистов, а затем уж производить сравнение.

В работе [Кук, Макдональд, 1986] описан подобный эксперимент. Были получены когнитивные структуры знаний опытного летчика-истребителя и пилота-новичка, с использованием двух методов: многомерного шкалирования (алгоритм MDS — Alscal) и сетевого шкалирования со взвешенными связями (алгоритм Pathfinder). Оба алгоритма основаны на использовании оценок психологической близости. Опытный пилот и пилот-новичок оценивали все возможные парные сочетания 30 связанных с полетом понятий, приписывая числа от 0 до 9 каждой паре, где 0 обозначал самую слабую степень связи между понятиями, а 9 — самую сильную. Эти оценки затем обрабатывались с применением обоих алгоритмов шкалирования.

В соответствии с алгоритмами MDS каждый концепт, выражающий некоторое понятие, помещается в к-мерное пространство таким образом, что расстояние между точками отражает психологическую близость соответствующих концептов. Алгоритм Pathfinder строит семантическую сеть [Schvaneveldt, Durso, Dearholt, 1985]. Дуги могут быть либо ориентированными (несимметричное отношение), либо неориентированными (симметричное отношение). Оба метода обеспечивают сжатия больших объемов данных (в форме попарных оценок) к меньшему набору параметров; однако нацелены они на выявление разных свойств исследуемых структур. Если в алгоритме Pathfinder центром внимания являются локальные отношения между концептами, то алгоритм MDS обеспечивает более широкое понимание свойств метризуемого пространства концептов.

Результирующие когнитивные структуры оказались близкими для летчиков-истребителей с одинаковым уровнем опыта, но были различными для разных групп испытуемых. Авторы экспериментов обнаружили, что по когнитивной структуре, характерной для летчика-истребителя, можно установить, новичок он или опытный пилот. Наконец, проведенный ими же анализ когнитивных структур выявил наличие концептов и отношений, общих для представлений опытного специалиста и новичка, и, кроме того, ряд концептов и отношений, которые появились только в одном из представлений. Прямым развитием рассмотренной работы стала экспертная система управления воздушным боем ACES [Goldsmith, Schvaneveldt, 1985].

Аналогичное исследование механизмов накопления опыта было проведено в области программирования на ЭВМ [Cooke, 1985]. С помощью методов шкалирования было показано, что один из аспектов программистского опыта включает в себя организацию знаний соответственно замыслу программы, или семантике, а не в соответствии с синтаксисом.

Пример 5.2

Сетевое представление абстрактных понятий программирования на основе оценок связности концептов у программистов показано на рис. 5.2. Эксперимент показал, что всех программистов на основе анализа структуры семантического пространства можно разбить на три группы: новички, неопытные специалисты среднего уровня, опытные специалисты. Это заключение совпадает с результатами, полученными в работе [Гаврилова, 1984]. Кроме того, исследовалась эволюция когнитивной структуры программиста по мере его продвижения от новичка до опытного специалиста.

Рис. 5.2. Ассоциативная сеть структуры знаний эксперта-программиста

Интерпретация выявленных отношений (связей) между понятиями требует дополнительных усилий от коллектива разработчиков ЭС. Так, например, означивание дуг на рис. 5.2. потребовало дополнительного эксперимента, участникам которого была предложена пара понятий и поставлена задача дать словесное описание связи между понятиями пары. Результаты представлены в табл. 5.1. Таким образом, ассоциативная сеть на рис. 5.2 может быть превращена в семантическую.

Таблица 5.1.

Описание связи между понятиями

Связанные пары понятий	Отношение между связанной парой понятий
Подпрограмма — программа	Есть часть
Символьные данные — выход	Есть тип
Параметр — программа	Используется
Программа — выход	Производит
Сортировка — поиск	Включает в себя
Численные данные — параметр	Может быть
Функция — оператор	Есть
Функция — программа	Есть часть
Отладка — программа	Подвергается
Выход — численные данные	Состоит из
Массив — символьные данные	Может состоять из
Функция — подпрограмма	Есть
Присваивание значений —параметр	Используется для
Массив — глобальная перемена	Может быть
Массив — численные данные	Может состоять из
Повторение — сортировка	Есть часть
Программа — алгоритм	Есть выполнение
Сортировка —алгоритм	Есть
Сортировка — численные данные	Делается на
Присваивание —оператор	Есть

Все упомянутые выше методы (включая кластерный анализ) можно отнести к методам психологического шкалирования. Их основу составляют алгоритмы преобразования сложных структур данных в более понятную форму, которая предполагается психологически содержательной. Результирующее представление зависит от метода:

• кластерный анализ порождает древовидную структуру [Дюран, Оделл, 1977];

• многомерное шкалирование и факторный анализ — пространственную [Окунь, 1974; Терехина, 1986];

• алгоритм MDS — сетевую [Кук, Макдональд, 1986];

• репертуарные решетки (см. параграф 5.2 и работу [Франселла, Баннистер, 1987]) порождают конструкты или метаизмерения [Kintsch, 1974].

Формальная методология психосемантического шкалирования позволяет частично автоматизировать процесс структурирования знаний и получать «когнитивный разрез» его представлений о предметной области. Методология шкалирования позволяет выявлять структуры знания косвенным путем при получении ответов от экспертов на довольно простые вопросы (например, «насколько близки понятия X, и Х₂» вместо «скажите, какова связь между X, и Х₂ как они влияют друг на друга»).

Почти все эксперименты позволили выявить одну закономерность. Размерность семантического пространства с повышением уровня профессионализма уменьшается. Этот вывод согласуется с известными положениями когнитивной психологии о том, что процесс познания сопровождается обобщением. Построение семантического пространства обычно включает три последовательных шага [Петренко, 1983].

1. Выбор и применение соответствующего метода оценки семантического сходства. Этот шаг включает в себя эксперимент с испытуемыми, которым предлагается оценить общность предъявляемых стимульных признаков на некоторой шкале.

2. Построение структуры семантического пространства на основе математического анализа полученной матрицы сходства. При этом происходит уменьшение числа исследуемых понятий за счет обобщения и получения генерализованных осей.

3. Идентификацию, интерпретацию выделенных факторных структур, кластеров или групп объектов, осей и т. д. На этом шаге необходимо найти смысловые эквиваленты, языковые «ярлыки» для выделенных структур. Здесь большое значение приобретает лингвистическое чутье и профессионализм специалиста, проводящего исследование, и экспертов-испытуемых. Часто к интерпретации привлекают группу экспертов.

Содержание