5.3.6.3. Проблемы работы с информационными ресурсами Интернета
Можно предположить, что в Интернете можно найти информацию практически по любой тематике. Однако сделать это достаточно сложно, т. к. наиболее распространенные и известные поисковые инструменты - справочники и поисковые серверы - не позволяют эффективно структурировать результаты поиска. Кроме того, возникает задача отсеивания данных, т. е. отсечения ненужной и несвязной информации от той ее части, которая будет полезной. Существует несколько проблем, возникающих при работе с информацией в Интернете и препятствующих быстрому и качественному поиску.
Недостаточная структурированность информации (наличие так называемых слабоструктурированных данных). Для облегчения поиска в таких документах было предложено несколько моделей представления такой информации, в том числе Stanford's Object Exchange Model (http://www.rocq.mria.fr/~simeon/semistructure/art.html), в рамках которой данные представляются в виде направленного графа с поименованными вершинами и дугами.
Избыточность информации. Около трети информации в Интернете является точными или приблизительными копиями других документов.
Наличие противоречивых и недостоверных сведений. Типичным примером является включение некорректных ключевых слов в группу инструкций МЕТА, специально предназначенных для описания и индексирования документов поисковыми машинами. Некоторые поисковые машины сделали попытку решить эту проблему с помощью полнотекстовой индексации документов. Однако сетевые мастера Интернета предложили сразу несколько способов обмануть поисковый робот, например, писать белым шрифтом по белому фону все то, что ранее включалось в инструкцию МЕТА.
Большое количество ошибок (например, опечаток, грамматических ошибок, ошибок оцифровки). Эти ошибки являются следствием неконтролируемого качества, включая отсутствие редакторского контроля над публикуемой информацией.
Укажем на ряд особенностей поиска в Интернете, связанных с понятием человеческий фактор [Jansen, Sprink, Saracevic 2000].
Поведение пользователя. Пользователь не готов долго ждать результата и не готов даже искать его в предоставленной поисковой системой выборке. Практически половина пользователей не идет далее первого экрана, предложенного информационно-поисковой системой.
Неумение делать запросы. Большинство пользователей не использует расширенные возможности поиска, такие как логические выражения. Кроме того, типичные поисковые запросы очень коротки - более 60% запросов состоят всего из 1-2 слов.
Существует необходимость в совершенствовании программного обеспечения, которое поможет пользователю в интеллектуальном поиске и отборе нужной информации.
- 5. Системы программирования
- 5.1. Введение в системы программирования
- 5.1.1. Основные понятия и определения
- 5.1.2. История и эволюция
- 5.1.2.1. Некоторые важные даты
- 5.1.2.2. Основные этапы в формировании состава систем программирования
- 5.1.2.3. История развития системы программирования компании Borland Inc. На базе языка Pascal
- 5.1.3. Классификация
- 5.1.3.1. Классификация по ориентации на поддержку процессов
- 5.1.3.2. Функциональная классификация
- 5.1.3.3. Классификация по категориям
- 5.1.3.4. Классификация по предоставляемому интерфейсу
- 5.1.4. Проблемы и перспективы развития
- 5.1.5. Рекомендации по литературе
- 5.2. Процесс-ориентированный инструментарий
- 5.2.1. Возникновение и исследование идеи
- 5.2.2. Управление
- 5.2.2.1. Системы управления проектами
- 5.2.2.2. Организационные средства
- 5.2.2.3. Средства оценки качества
- 5.2.3. Анализ требований и проектирование
- 5.2.3.1. Системы на основе структурной методологии
- 5.2.3.2. Системы на основе объектно-ориентированной методологии
- 5.2.4. Программирование (реализация)
- 5.2.4.1. Трансляторы
- 5.2.4.2. Компиляторы
- 5.2.4.3. Системы генерации трансляторов
- 5.2.4.4. Системы анализа корректности программного кода
- 5.2.4.5. Интерпретаторы
- 5.2.4.6. Декомпиляторы
- 5.2.4.7. Усложнители декомпиляции (шифраторы, обфускаторы)
- 5.2.4.8. Системы управления компиляцией и построением программ
- 5.2.5. Тестирование и отладка
- 5.2.5.1. Тестовые мониторы
- 5.2.5.2. Средства отслеживания тестового покрытия
- 5.2.5.3. Средства динамического построения профиля программы
- 5.2.5.4. Системы построения срезов программы
- 5.2.5.5. Отладчики
- 5.2.5.6. Системы отслеживания проблем (ошибок)
- 5.2.6. Ввод в действие
- 5.2.7. Сопровождение
- 5.2.8. Завершение эксплуатации
- 5.3. Универсальный инструментарий
- 5.3.1. Инструменты работы с текстом
- 5.3.1.1. Средства, базирующиеся на регулярных выражениях
- 5.3.1.2. Средства поиска различий
- 5.3.1.3. Средства поиска на основе шаблонов
- 5.3.1.4. Обозреватели и базы данных программ
- 5.3.1.5. Средства обнаружения плагиата
- 5.3.1.6. Текстовые редакторы
- 5.3.1.7. Синтаксически-ориентированные редакторы
- 5.3.1.8. Гипертекстовые средства
- 5.3.2. Системы документирования
- 5.3.3. Системы разработки интерфейсов
- 5.3.4. Системы управления базами данных
- 5.3.5. Системы управления базами знаний и экспертные системы
- 5.3.5.1. Системы искусственного интеллекта
- 5.3.5.2. Механизмы выводов на знаниях
- 5.3.5.3. Неточный вывод на знаниях
- 5.3.6. Электронные библиотеки и инструментарий Интернета
- 5.3.6.1. Парадигма усиления информации
- 5.3.6.2. Профессиональный поиск информации
- 5.3.6.3. Проблемы работы с информационными ресурсами Интернета
- 5.3.6.4. Коллекции информационных ресурсов в Интернете
- 5.3.6.5. Базы данных в Интернете
- 5.3.6.6. Краткая история поисковых средств Интернета
- 5.3.6.7. Искусственный интеллект и задача поиска в Интернете
- 5.4. Инструментарий поддержки процессов некоторых технологических подходов
- 5.4.1. Системы формального преобразования и верификации программ
- 5.4.2. Средства сборочного программирования
- 5.5. Инструментальные системы
- 5.5.1. Инструментальные среды программирования
- 5.5.2. Средства автоматизации разработки программ (case-средства)
- 5.5.3. Интегрированные среды
- 5.5.4. Репозитории проекта
- 5.6. Средства поддержки коллективной разработки
- 5.6.1. Системы разделения файлов
- 5.6.1.1. Система управления версиями файлов
- 5.6.1.2. Система управления пространствами
- 5.6.1.3. Система синхронизации удаленных пространств
- 5.6.2. Системы поддержки работы виртуальных групп
- 5.7. Естественно-языковый интерфейс
- 5.7.1. Диалоговые системы
- 5.7.2. Вопросно-ответные системы
- 5.7.3. Автоматизированные обучающие системы и системы контроля знаний
- 5.7.4. Системы искусственного интеллекта