logo search
Основы_информатики

Автоматизация индексирования документов в афипс

Существующие методы автоматического индексирования делят на 3 группы:

1) дериватное индексирование (индексирование извлечением)

2) приписное индексирование

3) автоматическая классификация

1. При индексировании извлечением ЭВМ анализирует лексический состав текстов и выбирает из текстов те слова и их сочетания, которые удовлетворяют заранее установленным критериям.

2. При приписном индексировании ЭВМ сравнивает лексический состав текстов с индексными терминами, предварительно полученной классификационной схемы, и приписывает документам одну или несколько релевантных предметных рубрик в соответствии с установленными формальными критериями.

3. Метод автоматической классификации включает автоматическое построение ИПЯ и автоматическое приписное индексирование. При автоматическом построении ИПЯ система устанавливает основные тематические группы терминов на основании статистического анализа частоты их употребления в заданном массиве документов.