Синтаксические указатели (роли и связи).
При описании содержания документа посредством дескрипторов и их синонимов можно образовывать так называемые цепочки дескрипторов, которые содержат логически взаимосвязанные признаки. Синтаксический указатель состоит из двух частей:
1)номер цепочки, в которой стоит дескриптор ( номер - это указатель связи)
2)позиционный номер дескриптора в цепочке, т. е. номер позиции в цепочке(указатель рода).
ПОЗ- список ключевых слов (здесь цепочка дескрипторов).
Логические связи.
(Конъюктивные).
" ^ " двух терминов обозначает (т.е. имеет выражение): Т1 +Т2 - в поисковом образе документа должен присутствовать как термин Т1 ,так и термин Т2 , совместное присутствие этих терминов обеспечивает релевантность рассматриваемого документа.
"Т1 * Т2" - если в ПОЗе имеется такая запись, то в ПОДе релевантными документами будут все документы, которые содержат либо Т1, либо Т2, либо оба термина. "#Т1" - использование этой связки требует, чтобы последующий термин отсутствовал в документе.
Например:
Нужно найти все документы главной темой которых являются "ИПС".Фонд документов может быть организован либо на магнитных лентах, либо на магнитных текстах. Искомые документы могут быть на любом языке кроме японского.
("ИПС" и "фонд документов" и ("МЛ" или "МД") и (не "японский язык").
(ИПС + фонд документов + (МЛ*МД)) + (#ЯЯ).
1)Соединение поисковых признаков посредством связки +Ц - обеспечивает релевантность только тех документов, которые содержат все требуемые признаки в одной и той же дескрипторной цепочке, независимо от того, в какой позиции они в этой цепочке располагаются.
2)Связка "+Р" - соединение поисковых признаков посредством этой связки обеспечивает релевантность тех документов, которые содержат все признаки одной и той же дескрипторной цепочки, и позиции которых граничат друг с другом в возрастающей последовательности.
3)Связка"+У" - соединение поисковых признаков посредством связки"+У" обеспечивает релевантность только тех документов, которые содержат все дескрипторы в одной и той же дескрипторной цепочке, а номера позиций которых являются возрастающими друг к другу.
Например, поисковый образ запроса «ИП» (Ц 01, 01) + «ИС» (02)
Это выражение требует, чтобы в ПОДе ключевое слово «информационный поиск» стояло в первой цепочке и в первой позиции, а ключевое слово «информационная система» – в той же цепочке, но во второй позиции.
Если при поиске в к.-л. Документу обнаружиться подобное расположение этих терминов, то такой документ будет удовлетворять требованиям релевантности.
Существующим расширением выдачи являются операторы значения
Р(=) М(<) MБ(<>) Б(>) МР(<=) БР(>=). За основу сравнения берется термин в запросе.
Документ является релевантным, если сравниваемое выражение равно выражению в запросе. Для расширения возможностей информационного поиска в системе «АИДОС» используется:
1) иерархия тезауруса путем включения в поиск к термину поиска ассоциативного поиска, выше стоящего и ниже стоящего дескриптора;
2) синтаксические указатели;
3) частичное сравнение (ЧС)
Суть (ЧС): дополнительно к термину запроса включаются в процессе поиска все ключевые слова, которые в начале слова имеют ту же комбинацию символов, что и в поисковом термине. Сравнение осуществляется по длине термина, указанного в запросе.
Дополнительно полученные таким образом поисковые термины связываются с помощью «V» с поисковым термином из запроса.
Запрос: ЕС (Единосистема)
С указанием проведения частичного сравнения
Дополнительно к этому дескриптору в поиск включаются все дескрипторы, которые имеют одинаковую начальную комбинацию символов.
В результате: ЕС+ЕС10+ЕС1022+ЕС20+ЕС30 (марки компьютеров)
Частичное сравнение удобно использовать в тех случаях, когда пользователя интересует информация, содержащая любые признаки определенного вида, но он не знает, какие более глубокие деления этого вида имеются в тезаурусе. При информационном поиске реализация частичного сравнения заключается в следующем: сравнивается отдельное высказывание, начиная с первого, с комбинацией символов поискового признака. Если комбинация символов, указанная в запросе, совпадает с информацией документа, то этот документ принимается в качестве релевантного.
Сравнение
4) скользящее сравнение
При скользящем сравнении отдельное высказывание документа сравнивается с комбинацией символов поискового признака, согласно его длине. Если в любой части документа находится такая же комбинация символов, то документ считается релевантным.
Для усиления критерия выдачи в «АИДОС» можно использовать библиографические характеристики документов, такие как имена авторов, название журналов, год публикации, язык документа, издательство, степень секретности.
В «АИДОС» используются специальные методы поиска информации:
1) пакетный запрос (режим «ретро»)
2) режим ИРИ (избирательное распространение информации)
3) запрос в режиме диалога
1. Пакетный запрос – этот вид поиска удобно применять там, где запрашивающему нужно получить как можно более исчерпывающую информацию определенного содержания, и он не желает проводить поиск во всем фонде документов. В результате: сколько вопросов, столько и ответов.
2. ИРИ – особый вид пакетного запроса. Он может быть использован для того, чтобы периодически доставлять пользователю новейшую релевантную информацию по мере ее поступления. Для этого в памяти системы постоянно храниться профиль, то есть профильный запрос пользователя, который периодически сравнивается со всеми вновь вводимыми и накапливаемыми в системе документами.
3. Диалоговый режим служит для оперативного получения информации. Когда краткосрочно возникающая информационная потребность возникает, которая может быть удовлетворена путем прямой связи пользователя с компьютером. Таким образом, диалог целесообразно применять, если речь идет о быстром получении специальной информации.
- 1.Устранение синонимии
- 3. Указатель иерархических отношений
- Практические рекомендации для составления пс Анализ содержания документов и выявления ключевых слов
- Как осуществить перевод с ея на ипя?
- 3.Ипс «синтол» [документальная, синтагматический язык с грамматикой]
- I. Синтагматическая организация «синтола».
- II.Парадигматическая организация (словарь)
- III. Поиск информации
- Ипс аидос (ппп) [документально-фактографическая, с грамматикой]
- 1) Тезаурус
- Критерий выдачи(кв)
- Синтаксические указатели (роли и связи).
- Система «smart»
- Анализ документов
- Стратегия поиска
- Анализ языка
- Структура словаря синонимов
- Тезаурус основ слов и список суффиксов
- Иерархия понятий
- Принципы построения тезауруса в системе smart
- Особенности фактографических информационно-поисковых систем(фипс)
- Способы представления информации в фипс
- Автоматизированные фипс (афипс)
- Автоматизация индексирования документов в афипс
- Автоматическое индексирование запросов
- Автоматизированные обучающие системы(аос)
- Язык обучающих курсов (яок)
- Автоматизированный учебный курс (аук) по иносранным языкам
- Структура аук
- Автоматизированный учебный словарь (аус)
- Интернет (the internet)
- Сервисные службы интернета.
- Пакет прикладных программ microsoft office (’95 – под windows ’95)