9.6. Автоматизация координатного индексирования
Автоматизация координатного индексирования осуществляется по единому алгоритму, что позволяет достичь единообразия, полноты, точности, последовательности этого процесса, а также экономии времени, материальных и человеческих ресурсов.
Для координатного индексирования документов в автоматизированных ИПС используют информационно-поисковые языки дескрипторного типа. Парадигматические и синтагматические отношения, существующие между понятиями в этих языках, отражаются в тезаурусах с помощью отнесения их к определенным категориям или путем использования специальных грамматических средств (указателей роли и связи).
Сегодня нет единой концепции разработки алгоритма формирования поискового образа документа, так как одни исследователи предлагают формировать поисковый образ документа на основе анализа полного текста (первичного документа), другие – текста реферата.
Индексирование по тексту документа предполагает процедуру сжатия поискового образа документа. В связи с этим автоматизация координатного индексирования может быть полной и частичной. В процессе полной автоматизации в ЭВМ вводятся, как правило, рефераты, которые с помощью программных средств формируют поисковые образы документов.
В процессе частичной автоматизации к формированию поисковых образов документов привлекается человек. Чаще всего его участие заключается в предварительной формализации описаний документов, которая заключается в выборе информативных слов и словосочетаний и вводе их в ЭВМ. А дальше автоматически с помощью специальных алгоритмов эти слова и словосочетания заменяются на машинные индексы.
В практике используют два метода координатного индексирования документов:
с контролем лексики по тезаурусу;
свободное индексирование.
В процессе индексирования с контролем лексики ключевые слова, выбранные из текста документа заменяются на эквивалентные им по смыслу понятия; более широкие по смыслу; понятия, ассоциированные с исходным, взятым из тезауруса. Иногда индексатор, используя свои профессиональные знания, опыт и тезаурус, включает в поисковый образ документа лексические единицы используемого ИПЯ, отсутствующие в тексте.
В результате многолетней практики индексирования документов с использованием дескрипторного ИПЯ выработались общие методические рекомендации последовательности этого процесса. Этап анализа содержания документов можно выразить следующей схемой: выделение предмета (темы) документа, аспекта, свойства предмета, области применения предмета, видов и методов исследования свойств предмета, конкретной методики исследования предмета и т. д.
Свободное индексирование заключается в формировании поискового образа документа из ключевых слов и словосочетаний, выбранных из текста документа. При этом нет ограничений на ввод в систему новых понятий. В практике используются оба метода индексирования.
Анализ этих методов показал, что свободное индексирование по удобству использования и доступности превосходит индексирование с контролем лексики. Но автоматизация процессов обработки, поиска документов больше ориентирована на работу со строго формализованной информацией, где все поисковые признаки и понятия представляются в единообразной форме.
- Раздел III. Заголовок, точки доступа и авторитетная запись 91
- Глава 4. Формирование заголовка и точки доступа библиографической записи 91
- Глава 5. Авторитетные/нормативные записи 112
- Глава 9. Координатное индексирование 166
- Раздел V. Аннотирование и реферирование 193
- Глава 10. Аннотирование документа 193
- 10.1. Теоретические основы аннотирования 193
- Глава 11. Реферирование документа 198
- Предисловие
- Введение
- Раздел I.ОсновыАналитико-синтетической переработки информации
- Глава 1. Значение процессов обработки документа
- 1.1. Аналитико-синтетическая переработка информации как учебная дисциплина
- 1.2. Роль обработки документа в организациях системы документальных коммуникаций
- Титульная страница книги
- Оборот титульного листа книги
- 129075, Москва, Звездный бульвар, 23
- 103473, Москва, Краснопролетарская, 16
- 1.3. Объект обработки документа
- 1.4. Классификация документа
- Глава 2. Виды и результаты обработки документа
- 2.1. Виды обработки
- 2.1.1. Семантическая обработка документа
- 2.2. Библиографическая запись — главный результат обработки
- 2.3. Виды библиографических записей
- 2.4. Автоматизация процессов обработки
- 2.4.1. Система форматов rusmarc. Общая характеристика
- 2.4.2. Российский формат машиночитаемой каталогизации (rusmarc)
- Раздел II. Библиографическое описание документа
- Глава 3. Теоретические основы составления библиографического описания
- 3.1. Стандартизация библиографического описания
- 3.2. Библиографическое описание: определение, состав и назначение
- Перечень элементов и областей библиографического описания
- 3.3. Виды библиографического описания
- 3.4. Общая методика библиографического описания
- 3.4.1. Пунктуация в библиографическом описании
- 3.4.2. Источник информации для составления библиографического описания
- 3.4.3. Сокращения слов в библиографическом описании
- 3.4.4. Язык библиографического описания
- 3.4.5. Орфография в библиографическом описании
- 3.4.6. Отражение в описании ошибок и опечаток, допущенных в документе
- 3.5. Одноуровневое библиографическое описание
- 3.5.1. Область заглавия и сведений об ответственности
- 3.5.2. Область издания
- 3.5.4. Область выходных данных
- 3.5.6. Область серии
- 3.5.7. Область примечания
- 3.5.8. Область стандартного номера (или его альтернативы) и условий доступности
- 3.5.9. Этапы составления одноуровневого библиографического описания
- Распределение библиографических сведений по областям описания
- 3.6. Многоуровневое библиографическое описание
- 3.6.1. Многоуровневое описание многотомного документа
- 3.6.2 Многоуровневое описание сериальных документов
- 3.6.3. Многоуровневое описание составной части документа (Аналитическое библиографическое описание)
- Раздел III. Заголовок, точки доступа и авторитетная запись
- Глава 4. Формирование заголовка и точки доступа библиографической записи
- 4.1. Заголовок и точки доступа библиографической записи: определение, назначение, виды
- 4.2. История разработки заголовка библиографической записи
- 4.3. Общая методика формирования заголовка библиографической записи
- 4.4. Заголовок, содержащий имя лица. Форма, структура, правила приведения
- 4.5. Заголовок, содержащий наименование организации. Форма, структура, правила приведения
- 4.6. Заголовок, содержащий унифицированное заглавие. Форма, структура, правила приведения
- 4.7. Заголовок, содержащий обозначение документа. Форма, структура, правила приведения
- 4.8. Заголовок, содержащий географическое название. Форма, структура, правила составления
- Глава 5. Авторитетные/нормативные записи
- 5.1. Значение авторитетных/нормативных записей
- 5.2. Структура формата
- 5.3. Методика формирования авторитетных файлов
- 5.3.1. Авторитетные/нормативные записи имен лиц
- 5.3.2. Авторитетные/нормативные записи под наименованием организации
- 5.3.3. Авторитетные/нормативные записи географических названий
- 5.3.4. Авторитетные/нормативные записи унифицированных заглавий
- 5.3.5. Авторитетные/нормативные записи предметных рубрик
- Раздел IV. Индексирование документа
- Глава 6. Теоретические основы индексирования
- 6.1. Общие положения индексирования
- 6.2. Требования к информационно-поисковым языкам
- 6.3. Общие правила индексирования
- Глава 7. Предметизация документа
- 7.1. Теоретические основы предметизации
- 7.1.1. Значение предметизации
- 7.1.2. Терминосистема процесса предметизации
- 7.2. Предметизационный ипя – средство предметизации
- 7.2.1. Характеристика предметизационного ипя
- 7.2.2. Структура предметизационного ипя
- 7.3. Общая методика предметизации
- 7.3.1. Основные этапы процесса предметизации
- 7.3.2. Структура предметной рубрики
- 7.3.3. Правила предметизации
- 7.4. Предметная рубрика – результат процесса предметизации
- Глава 8. Систематизация документа
- 8.1. Значение систематизации
- 8.2. Классификационный ипя — средство реализации процесса систематизации
- 8.2.1. Терминосистема классификационного ипя
- 63.3 (2)4 Период феодализма (IV в. – 1861 г.)
- 63.3(2)41 Период зарождения и становления феодальных отношений (IV-XI вв.)
- 8.2.2. Классификационные системы, используемые в России
- 8.3. Общая методика систематизации
- 8.3.1. Принципы систематизации
- 8.3.2. Методы систематизации
- 8.3.3. Правила систематизации
- 8.4. Алгоритм поиска индексов в классификационной системе
- 8.5. Классификационный индекс – результат систематизации
- Глава 9. Координатное индексирование
- 9.1. Теоретические основы координатного индексирования
- 9.2. Информационно-поисковый тезаурус (ипт)
- 9.2.1. Структура ипт
- 9.3. Методика разработки информационно-поискового тезауруса
- 9.3.1 Составление словаря ключевых слов
- 9.3.2. Дескрипторизация ключевых слов
- 9.3.4. Указатели роли и связи
- 9.4. Автоматизация процессов построения ипт
- 9.5. Методика координатного индексирования
- 9.6. Автоматизация координатного индексирования
- 9.6.1. Основные методы автоматизированного индексирования
- Раздел V. Аннотирование и реферирование
- Глава 10. Аннотирование документа
- 10.1. Теоретические основы аннотирования
- 10.2. Методика аннотирования документа
- 10.2.1. Основные требования к составлению аннотации
- 10.2.2. Этапы аннотирования
- 10.3. Автоматизация аннотирования
- Глава 11. Реферирование документа
- 11.1. Теоретические основы реферирования
- 11.2. Виды рефератов
- 11.3. Общая методика реферирования документа
- 11.4. Методы реферирования
- 11.4.1. Методика составления информативного реферата
- 11.4.2. Особенности текста реферата
- Заключение
- Приложения
- Российский формат машиночитаемой каталогизации
- Пример машиночитаемой библиографической записи, созданной в формате rusmarc в Российской национальной библиотеке на книгу е. В. Пчелова «Рюриковичи. История династии»
- Примеры библиографических записей, содержащих библиографическое описание и заголовок Книги. Однотомные издания
- Многотомные издания
- Депонированная научная работа
- Неопубликованные документы
- Сериальные и другие продолжающиеся ресурсы
- Изоиздание
- Составные части документов
- Isbn 978-s