logo
Учебник

9.3.4. Указатели роли и связи

Роль термина индексирования указывают в ПОД для уточнения места соответствующего понятия в содержании документа.

Как правило, тезаурусы являются основой ИПЯ, не использующего текстуальных отношений (грамматических средств). Но требования к точности выдачи, а также необходимость использования системы в режиме, близком к фактографическому поиску, ставит перед фактом использования грамматических средств в ИПЯ. Перестраивать лексику действующей поисковой системы трудно, поэтому эту возможность необходимо учесть на стадии построения ИПТ.

В качестве простых грамматических средств ИПЯ рекомендуется использовать указатели роли и указатели связи. Уже на стадии набора лексики ИПТ, в процессе составления поисковых аннотаций документов, использование этих грамматических средств существенно влияет на лексический состав тезауруса, особенно при решении вопросов выбора словосочетаний – их количество заметно уменьшается.

Существенный вклад в разработку проблемы грамматических отношений внес В. Ш. Рубашкин. В работе «О грамматических средствах информационных языков» (1975) он использовал аппарат логики предикатов для представления текстов на дескрипторном ИПЯ в виде модели. Основной единицей его модели является предикатная структура. Любой текст можно разбить на высказывания (фразы). Чтобы раскрыть смысл этих высказываний, нужно указать, о каких предметах идет речь и какие признаки, свойства, отношения приписываются этим предметам.

Элементами предикатной структуры являются следующие логические составляющие: предикатные термины, предметные термины и определители места в предикате, занимаемого данным предметным термином.

Грамматические средства привлекаются для того, чтобы с помощью фрагментирования определить место каждого дескриптора в предикатной структуре, а также роль каждого дескриптора в соответствующих предикатных структурах (предикатный и предметный термины, определитель места в предикате).

В качестве средств представления синтагматических отношений в рамках предикатной структуры любой сложности используется древовидная структура графа. Такая структура позволяет связать все дескрипторы высказывания (ПОД или ПП запроса) таким образом, что для каждого дескриптора определены его место и роль в предикатной структуре. Смысл заключается в том, что предикатный термин всегда связан отношениями подчинения («выше – ниже») с предметными терминами, заполняющими его места. Ветви дерева выполняют функцию определителя места в предикате. Перечень значений ветвей представляется в виде списка указателей роли, принятых в определенной ИПС.

Представление текстов на дескрипторном языке в виде совокупности предикатных структур помогает решить проблему разграничения лексики и грамматики. Суть заключается в том, что смысловые средства указателей роли выражаются в виде категорий: «конечный продукт», «исходный продукт», «среда, окружение, атмосфера» и т. д. Эти категории включаются в лексический состав дескрипторного языка и используются в процессе координатного индексирования. В результате система указателей роли переходит из сферы грамматики в сферу лексики. Таким образом, логические составляющие предикатной структуры – предикатные и предметные термины – относятся к лексическому составу ИПЯ.

Термины – определители места в предикате (средства интерпретирования ветвей древовидного графа) относятся к сфере грамматики. К грамматическим средствам ИПЯ можно отнести и указатели связи. Указатель связи представляет собой символ (буква, цифра, знак пунктуации), который приписывается всем лексическим единицам, входящим в данный фрагмент. Некоторые лексические единицы могут входить в несколько фрагментов, а это означает – иметь несколько указателей связи. По сути дела, указатели связи определяют, какие из дескрипторов имеют между собой связь в ПОД. Таким образом, указатели роли и указатели связи являются средством выделения отдельных фрагментов (предложений, фраз), соответствующих законченному высказыванию, а также средством определения смысловой роли лексических единиц, входящих в выделенные фрагменты. Иными словами, они выполняют фрагментирующие и смыслоразличительные грамматические функции.