logo search
2 курс_ВСЕ_УМКИИ_Липницкая Попова

Вопрос 2. Полнотекстовая база данных таст.

Широко известна среди историков программа ТАСТ, реализующая работу с электронным текстом. Программа создана в 1984 г. в Компьютерном центре гуманитарных наук при университете Торонто (Канада). В настоящее время большинство систем обработки полнотекстовых баз данных в состоянии распознать такие элементы, как слова, строки и параграфы без указания исследователя. Ряд рутинных операций решается программным путем, например автоматическое составление списка всех слов текста с указанием частот их встречаемости в источнике, поиск слов и контекста, вывод на печать.

Работа с ТАСТом имеет ряд последовательных этапов. Первоначально исследователь должен преобразовать текстовый файл в текстовую базу данных. Далее, используя любой из трех предложенных программой описательных языков разметки документа, структурировать текст.

После образования базы из размеченного текста программа показывает список всех структурных элементов и словарный список текста. С помощью полнотекстовой базы данных можно анализировать полученный машиночитаемый источник.