logo
Основы_информатики

Автоматическое индексирование запросов

Автоматизированное индексирование запросов выполняется теми же 3 методами, но при индексировании запроса производится его усиление. Под усилением понимают дополнение к терминам ПОЗа совокупности близких по смыслу терминов. Как правило, полную автоматизацию процедуры индексирования запроса при проведении усиления осуществить не удается, поэтому на экран дисплея выводятся фрагменты тезауруса, дающие возможность пользователю самому выбрать соответствующие термины для расширения запроса.

Экспертные системы (ЭС). Системы принятия решений.

Отличие ЭС от ИПС – ЭС работают с базами знаний, а не с базами данных, следовательно, возникает проблема в создании способа представления этих знаний. Также отличие в том, что ИПС выдает ту информацию, которая в ней заложена, а ЭС выводит новую информацию.

ЭС – человеко-машинная система, состоящая из:

, ч – человек

Характерная особенность ЭС, отличающая их от традиционных ИПС, - использование нового вида информации – знаний. Знания – хранимая в ЭВМ информация, формализованная в соответствии с определенными структурными правилами, которые ЭВМ может использовать при решении проблем по таким алгоритмам как логические выводы. Знания – обычно, факты (классы объектов)+взаимосвязи между ними. Формализм описания такого рода знаний – представление знаний, а компонент, использующий для решения проблем знания экспертов, описанных в специальной форме представления – механизм вывода.

Представление знаний – средство описания знаний человека.

Основные способы представления знаний:

ПРОДУКЦИОННЫЕ ПРАВИЛА (ПП)

Один из наиболее простых. В таких ЭС все знания представлены описаниями в форме ЕСЛИ–ТО. Часть ЕСЛИ – посылка, ТО – вывод.

если А12…Ап то В

Это означает, что если все условия А12…Ап истинны, то посылка В тоже истинна.

Продукционные системы – системы обработки знаний, использующие представление знаний продукционными правилами.

Структура продукционной системы:

Рассмотрим правило (..)

если (1) y является отцом x (А1)

(2) z является братом у (А2) n=2

то z является дядей x (В)

Если n=0, то знание состоит только из вывода – факт.

Механизм вывода связывает знания воедино, а затем выводит из последовательности знаний заключение.

Положим, что в базе знаний вместе с описанными ранее знаниями содержатся и такие:

если z является отцом x

z является отцом y

x и y не являются одним и тем же лицом

то x и y являются братьями, сестрами или братом и сестрой

Петр является отцом Ивана

Петр является отцом Николая

Иван является отцом Василия

Из этого можно вывести заключение, что Николай – дядя Василия.

Иван-Василий-Петр (подставляем в x,y,z) можно вывести уже сделанное заключение и полученные ранее результаты. Эта полностью формализованная процедура, использующая такие методы как согласование образов (устанавливается, совпадают ли между собой 2 формы представления), поиск в базе данных, возврат (возврат к исходному при неудаче решения) – механизм вывода.

ФРЕЙМОВЫЕ СИСТЕМЫ

Идея принадлежит Марвину Мински.

Фрейм – структура данных для представления стереотипной ситуации. Его можно представить в виде сети из узлов и связей между ними. Каждый узел – определенное понятие, которое может или не может быть задано в явном виде.

Терминалы – не заданные в явном виде узлы. Они образуют нижние уровни графовой структуры, когда на верхних – понятия, которые всегда справедливы в отношении представленной данным фреймом ситуации. Следовательно, эти узлы должны быть заполнены конкретными данными, представляющими собой их возможные задания в процессе приспособления фрейма к определенной ситуации из того класса ситуаций, которые представляет данный фрейм. Каждый терминал может устанавливать условия, которым должны отвечать их задания: простые условия устанавливаются маркерами, которые могут, например, потребовать, чтобы заданием терминала было какое-либо лицо, предмет, элементарное действие или указатель на какой-либо другой фрейм, представляющий собой другую, более частичную ситуацию – субфрейм. Таким образом, совокупность заданных в явном виде узлов-понятий образует основу для «понимания» любой конкретной ситуации.

Понимание происходит путем конкретизации терминалов и согласования возможных для каждого из них понятий со вполне определенной обстановкой в окружающем мире.

В своей теории Мински не проводит границы между теорией человеческого мышления и теорией построения систем искусственного интеллекта. Он считает, что процессы человеческого мышления базируются на хранящихся в его памяти многочисленных заполненных структурах данных – фреймах, с помощью которых человек осознает зрительные образы (фреймы визуальных образов), понимание слова (семантические фреймы), рассуждения, действия (фреймы-сценарии). Процесс понимания при этом сопровождается активизацией в памяти соответствующего фрейма и согласовании его терминальных вершин с текущей ситуацией.

Фрейм-сценарий – последовательность действий, описывающих часто встречающуюся ситуацию. В этой последовательности действий используется принцип казуальной связи, то есть результатом каждого действия являются условия, при которых может произойти следующее действие. Каждый сценарий имеет своих исполнителей ролей, различные интерпретации, отражающие точки зрения различных исполнителей ролей, следовательно, сценарий – система фреймов.

ПРИМЕР

Сценарий посещения ресторана представлен с точки зрения посетителя.

Сценарий: РЕСТОРАН

Роли: посетитель

официантка

шеф

кассир

Цель: получить пищу, чтобы утолить голод

Сцена I: Вход

1. Войти в ресторан

2. Глаза направить туда, где есть пустые столы

3. Выбрать, где сесть

4. Направиться к столу

5. Сесть

Сцена II: Заказ

6. Получить меню

7. Прочитать меню

8. Решить, что хочешь заказать

9. Сделать заказ официантке

Сцена III: Еда

10. Получить пищу

11. Съесть пищу

Сцена IV: Уход

12. Попросить счет

13. Получить чек

14. Направиться к кассиру

15. Заплатить деньги

16. Выйти из ресторана

В каждом сценарии средства выполнения могут варьироваться по обстоятельствам. Например, в сцене 2 заказ модно сделать так:

письменно

устно

жестами

В сцене 4 выплата денег может быть осуществлена так:

кассиру

официантке

словами «включите в мой счет»

Одним из множества возможных способов формализации фрейма-сценария предполагается представление его в виде сети или иерархической структуры. Узел самого верхнего уровня сети отождествляется с заголовком сценария. Дочерние варианты этого узла – терминалы фрейма.

Фрейм-сценарий «РЕСТОРАН» изображен в виде графической структуры И/ИЛИ.

Каждой из 4 сцен соответствует вершина И, вершина графа – заголовок сценария. Первые 2 вершины (Вход и Заказ) имеют по 2 вершины ИЛИ, а остальные – по одной. Первые 2 вершины ИЛИ первых двух вершин И соответствуют действию, совершенному при утвердительном ответе на вопросы «А если посетитель уже в ресторане?» и «А если заказ сделан другом?» В этом случае действия не нужны и вершины пусты. Все остальные вершины, так же как и их материнские вершины соответствуют входу, еде, заказу, уходу. Каждая из этих вершин имеет вершины и соответствует действиям, помеченным в сценарии арабскими цифрами. Вершины 9 и 10 имеют по 3 дочерние вершины ИЛИ, соответствующие вариантам заказа и уплаты денег.

ПРЕДСТАВЛЕНИЕ ЗНАНИЙ СЕМАНТИЧЕСКИМИ СЕТЯМИ (с. с)

В с.с знаки имеют интерпретацию, а отношения между ними образуют сеть, воспроизводящую определенные стороны связей между понятиями в психике человека.

Язык с.с включает множество базовых понятий, каждое их которых характеризуется своими признаками и их значениями, например:

техникум – понятие, определяемое 2 признаками (переменными):

«дает специальное образование»

«готовит специалистов для»

1 признак может иметь 2 значение – среднее и высшее

2 признак имеет значения – для производства, для народного образования

Для техникума 1 признак – среднее, 2 признак – для производства.

пединститут

Значения тех же признаков иные – высшее и для народного образования соответственно.

Совокупность понятий, которая вносится в конкретную сеть, зависит от целевого назначения системы или ее конкретного использования. Если она предназначена для ответов на вопросы о состоянии образования в стране, то она должна содержать понятия «школа, студент, ВУЗ», то есть совокупность понятий должна быть проблемно ориентирована.

Язык содержит базовое множество отношений. Входящие в него отношения связывают между собой элементы среды или их кодовые имена (элементы языка):

часть-целое

действие-объект

действие-время

действие-место

Система базовых отношений (в отличие от системы базовых понятий, которая проблемно ориентирована) носит универсальный характер, то есть мало зависит от предметной области. Анализ текстов на русском, английском и итальянском языках показал, что число базовых отношений, посредством которых можно выразить любые отношения ЕЯ приблизительно равно 200.

Семантический язык содержит и правила оперирования базовыми отношениями, позволяющие посредством четко определенных операций формировать более сложные отношения. Итак, семантические языки содержат:

проблемно-ориентированную совокупность базовых понятий

универсальный слой базовых отношений и производных от них

Они позволяют зафиксировать в памяти системы базовое множество знаний, необходимое для формирования «модели мира». Эти семантические языки позволяют посредством семантических сетей представить неязыковые знания. Форма выражения семантического языка - с.с, т.к понятия и отношения между ними можно описать сетью, состоящей из узлов и дуг. Узлы – сущности и понятия, дуги – их отношений. Все узлы и дуги снабжены метками, показывающими, что именно они описывают. Такой формализм представления знаний - с.с.

Системы искусственного интеллекта формируют искусственную модель мира, используя семантический язык. Этот процесс начинается со сбора информации о реальной среде. Далее особый блок – блок селекции – выделяет предметы, соответствующие понятиям, определяемым признаками, и их значениям. Например, если речь идет об управлении в порту, то блок селекции находит различные предметы, склад, контейнеры в определенный момент времени.

Другой блок – пространственной ориентации – фиксирует их координаты, то есть посредством базовых и производных отношений описывается взаимное расположение предметов (находится га, внутри, под). Таким образом создается моментальный снимок ситуации на управляемом объекте.

Логический блок на основании правил комбинирования базовых отношений порождает новые отношения, специфические для каждой предметной области. При наступлении нового момента времени исходная модель первого уровня сменяется новой – другим «моментальным снимком». Информация о предшествующем моменте времени не стирается, а передается в память. Таким образом, в памяти находится информация о последовательно сменяющихся состояниях «внешнего мира», то есть управляемого объекта. Это дает возможность поиска закономерных связей в изменениях, происходящих во времени. Такой поиск с семантических системах является функцией особого блока – блока гипотез. Процедура формирования гипотезы на основе причинно-следственной связи выглядит так:

В определенный момент времени в определенном месте есть предмет Р1 или происходит событие С1, а в следующий момент времени в этом месте появляется Р2 или происходит С2. Факт следования вторых за первыми записывается в памяти и если при повторных появлениях Р1 за ним НЕ следует Р2, то связь из памяти стирается. В противном случае можно полагать, что Р1 является причиной Р2. После заранее предусмотренного числа повторений связь между двумя конкретными предметами «осознается», то есть фиксируется определенным знаком и вносится в базу знаний о мире. Таким образом, место модели первого уровня, которая является моментальным снимком ситуации, то есть содержит только текущие данные об объекте, заменяется моделью второго уровня, в которой представлены знания об объекте. На следующих уровнях происходит последующее обобщение модели, классификация предметов и связей, приписывая переменным кванторов всеобщности и существования. Таким образом, структура представления знаний в виде с.с. позволяет создать в экспертной системе «внутреннюю модель» внешнего мира, выполняя следующие операции:

пополнение знаний о мире (перестройка модели)

обобщение собираемой информации и фиксация на основе этого закономерных связей (причина - следствие)

формирование новых понятий определенного типа

Для описания структуры данных в системах подобного типа используют язык ЛИСП. В отличие от фрейма, в с.с. узлы заполнены, во фреймах же они пусты для новой информации. В с.с. все уровни полностью фиксированы, а во фреймах нижние звенья иерархии (терминалы) содержат условия-запросы, ответы на которые формируются в процессе взаимодействия системы с ситуацией. С.с. стабильны.

МОДЕЛЬ ДОСКИ ОБЪЯВЛЕНИЙ (МДО)

Ряд практических задач можно решить лишь разбив их на подзадачи, каждой из которых соответствует некоторая подобласть некоторой предметной области, где решается именно эта подзадача. В экспертных системах, предназначенных для решения подобных задач, находит применение так называемая «архитектура доски объявлений». МДО является способом организации и использования, а не способом представления знаний. Фактически, МДО является одной из развитых модификаций продукционной системы. В этой модели для каждой отдельной проблемы, которые в совокупности составляют единое целое, имеется соответствующее множество знаний. Все множества через общую рабочую область памяти – доску объявлений – управляются так, что все знания используются согласованно, как единое целое. Такие отдельные множества знаний – источники знаний (ИЗ), каждый из которых строится как продукционная система. Они не вызывают один другого и обычно не содержат знаний друг о друге. В то же время они действуют совместно, так как вносят элементы решения в общую задачу, влияя на поведение друг друга путем анонимного отклика на информацию, записанную на доске объявлений. Для эффективной реализации процесса обработки знаний в целом система содержит механизм управления допуском ИЗ в соответствии с текущей ситуацией. Этот механизм управления – планировщик системы – анализирует сложившуюся ситуацию, выносит решение о том, какой уровень обработки должен обладать наибольшим приоритетом и осуществлять планирование запуска ИЗ.

Этот способ реализуется в экспертной системе «Hearsay». Это система распознавания речи. Для нее характерна многоступенчатая иерархическая структура ИЗ, каждый из которых распределен в своей предметной области и принадлежит к различным иерархическим уровням. Задача, решаемая системой, - интерпретация исходных данных, содержащихся в речевом сигнале, чтобы обеспечить понимание речи. По мере перехода от !!!!!!!!!!!!! менее абстрактных иерархических уровней к высшим, более абстрактным, меняется характер интерпретации данных, последовательно идентифицируются параметры речевого сигнала, сегменты сигнала, слогов, слова, последовательности слов и фраз.

При этом элементы решения задач, полученные на нижних иерархических уровнях, служат исходными данными для высших иерархических уровней, и решение, принятое на наивысшем уровне иерархии, - полное решение задачи.

ИТАК: сейчас экспертные системы называют электронными суперкомплексами. Основные задачи, решаемые ими:

распознавание речи

распознавание образов

обучение (в том числе иностранным языкам) – экспертные обучающие системы – ЭОС.