logo
Учебник

7.1.2. Терминосистема процесса предметизации

Одним из исходных, основополагающих для теории и практики всех видов индексирования является термин «предмет документа».

В теории предметизации это основная понятийная единица. Здесь, так же как и в классической логике, термин «предмет» трактуется весьма широко.

Под «предметом» понимаются любые объекты мысли, рассматриваемые в документе.

Предмет (документа, информационного запроса) – конкретный объект (материальная вещь, понятие, свойство или отношение), который рассматривается или упоминается в документе или информационном запросе. Обычно в каждом документе упоминается или рассматривается не один, а некоторое множество таких объектов.

Предметом документа является все, что может быть объектом информационного поиска:

Предмет раскрывает основную тему документа, его форму и читательское назначение.

Предмет, интересующий пользователя, может формулироваться в произвольной форме, с помощью любых слов естественного языка. В процессе предметизации эта форма преобразуется в предметную рубрику, которая формулируется посредством специально разработанного предметизационного ИПЯ.

ГОСТ 7.74–96 «Информационно-поисковые языки. Термины и определения» дает данному термину следующую трактовку:

Предметизационный ИПЯ. или язык предметных рубрик, – это информационно-поисковый язык, предназначенный для индексирования документов (частей документов) и информационных запросов посредством предметных рубрик.

Он является контролируемым языком предкоординированного типа. Это означает, что для представления группы однородных или родственных понятий выбирается единая форма ПР. Все остальные понятия, имеющие тот же объем содержания, принимаются вариантными (от них делаются ссылки к понятиям, принятым в данном ИПЯ). В контролируемом словаре, как правило, в явном виде представлены иерархические и ассоциативные связи. Определяются области использования данной ПР.

Омонимы помечаются с помощью реляторов. Релятор – это символ или слово, используемое для различения значений многозначного термина. Он не является независимой лексической единицей ИПЯ.

Основу языка предметных рубрик составляют лексические единицы. Лексика языка предметных рубрик контролируется с помощью авторитетных файлов.

Язык предметных рубрик является языком предкоординированного типа, то есть ПР представляют собой линейную последовательность ЛE с заранее установленными отношениями между ними.

Порядок следования лексических единиц, составляющих предметную рубрику, является жестким и устанавливается индексатором в ходе обработки документа.

Поскольку предметная рубрика – многозначный термин, существуют его различные определения.

Предметная рубрика – унифицированное языковое выражение, представленное средствами естественного языка, отражающее предмет документа и используемое для обеспечения контролируемого доступа к его содержанию. Это одно из наиболее современных определений, применяемое в машиночитаемой каталогизации.

В ГОСТ 7.74–96 «Информационно-поисковые языки. Термины и определения» отмечено, что предметная рубрика – элемент ИПЯ, представляющий собой краткую формулировку темы на естественном языке.

Здесь отсутствует определение рубрики как элемента ИПС (каталогов, картотек, вспомогательных указателей и т. п.), посредством которых формируется структура поисковых систем, организуется поиск библиографических записей и искомых фрагментов текста.

ОСТ 29.130–97 «Издания. Термины и определения» в разделе, посвященном составным частям и элементам аппарата издания, определяет термин «предметная рубрика» следующим образом: «предметная рубрика – структурная единица предметного вспо­могательного указателя, представляющая собой слово(а) или символ), передающие в свернутом виде основные характеристики того или иного отрезка текста и служащие для его опознавания при поиске».

Выделив то, что сближает данные определения, получаем следующее: Предметная рубрика – результат процесса предметизации, краткая формулировка предмета (факта, события, аспекта и т. п.), рассматриваемого в документе и созданная на основе принципов и правил специально разработанного предметизационного ИПЯ в целях информационного поиска.

Сущность предметизации заключается в анализе содержания документа, определении основных предметов документа, в выборе терминов индексирования и формулировании ПР.

Выделенные (точнее, отобранные) предметы (и различные аспекты их исследования) получают отражение в виде краткой словесной формулировки – предметной рубрики. Практически ПР, выполняя аннотационную функцию, становится свернутым содержанием документа.

Предмет, выявленный при анализе документа, отличается от предметной рубрики формой представления. Так, предмет учебника для основной школы «Азбука гражданина» можно сформулировать как «Права россиян», а рубрика на эту книгу будет выглядеть так: «Право – Российская Федерация – Учебные издания для средней школы».

Рубрика представляет собой краткую формулировку темы конкретного документа, выраженную не только словами и словосочетаниями естественного языка, но и цифрами и другими обозначениями, используемыми в естественном языке. Рубрики – это термины индексирования, поисковые, организующие, комплексирующие средства.

Таким образом, предметизатор должен определить предмет до­кумента и преобразовать его в предметную рубрику.

ГОСТ 7.74–96 «Информационно-поисковые языки: термины и определения» дает определение, связанное с лингвистической предметизацией.

Предметизация – это предметное индексирование средствами языка предметных рубрик (или предметизационного ИПЯ), а предметное индексирование – это индексирование предметного содержания документов.

Документная предметизация – это процесс представления содержания, формы и назначения документа посредством специально разработанных предметных рубрик.