3.1 Последовательность действий
1. Подбираем текст-источник. Чем четче описание проблемы в тексте-источнике, тем качественнее и точнее окажется результат. Размытый и путаный текст-источник найдёт в поисковой системе столь же ненужные документы.
2. Удаляем из текста стоп - слова (их можно просто вычеркивать).
3. Вычисляем частоту вхождения каждого термина. Причем делаем это без учета морфологии слов. Так, слова «ship» и «ships» будут разными терминами. Не нужно учитывать и регистр, все буквы считаем строчными.
4. Выписываем на отдельный лист термины в порядке убывания их частоты вхождения (первыми должны идти те, которые встречаются чаще).
5. Выбираем диапазон частот. Он должен лежать где-нибудь посередине. Не нужно брать слишком часто или, наоборот, слишком редко встречающиеся термины. Выбор диапазона субъективен. Вам следует ориентироваться на конкретный смысл текста. Необходимость выбирать диапазон вручную не должна смущать, ведь теперь вы выбираете термины не из текста, а из построенного по определенному закону упорядоченного списка.
- Введение
- 1. Информационные системы
- 1.1 Понятие информационных систем
- 1.3 Классификация информационных систем
- 2. Информационно поисковые системы
- 2.1 Исторические предпосылки развития поисковых систем
- 2.3 Особенности поисковых систем
- 2.3.1 Первый закон Зипфа
- 2.3.2 Второй закон Зипфа "количество - частота"
- 2.4 Механизм работы поисковых систем
- 2.5 Основные параметры поисковых систем
- 2.6 Классификация поисковых систем по авторитетности
- Классификация поисковых систем по авторитетности:
- 2.7. Проблемы и возможности поисковых систем
- 3. Стратегия поиска
- 3.1 Последовательность действий
- Информационно-поисковая система
- Информационный поиск, информационно-поисковая система и его среда.
- Тема 1.Виды информационно-поисковых систем
- Информационно-поисковые системы
- 1. Информационно-справочные и информационно-поисковые системы
- Информационные системы и технологии
- Информационно-аналитические и справочно-поисковые системы
- Информационно–поисковые системы
- 5.3.3. Информационные средства обучения информатике
- 1.9. Информационно-поисковые системы Документальные информационные системы