36.Системы информационного поиска сети Интернет
Информационный поиск (ИП) (англ. Information retrieval) — процесс поиска неструктурированной документальной информации и наука об этом поиске.
История
Термин «информационный поиск» был впервые введён Кельвином Муром в 1948 в его докторской диссертации, опубликован и употребляется в литературе с 1950.
Сначала системы автоматизированного ИП, или информационно-поисковые системы (ИПС), использовались лишь для управления информационным взрывом в научной литературе. Многие университеты и публичные библиотеки стали использовать ИПС для обеспечения доступа к книгам, журналам и другим документам. Широкое распространение ИПС получили с появлением сети Интернет. У русскоязычных пользователей наибольшей популярностью пользуются поисковые системы Google, Яндекс и Рамблер.
Информационный поиск как процесс
Поиск информации представляет собой процесс выявления в некотором множестве документов (текстов) всех таких, которые посвящены указанной теме (предмету), удовлетворяют заранее определенному условию поиска (запросу) или содержат необходимые (соответствующие информационной потребности) факты, сведения, данные.
Процесс поиска включает последовательность операций, направленных на сбор, обработку и предоставление необходимой информации заинтересованным лицам.
В общем случае поиск информации состоит из четырех этапов:
определение (уточнение) информационной потребности и формулировка информационного запроса;
определение совокупности возможных держателей информационных массивов (источников);
извлечение информации из выявленных информационных массивов;
ознакомление с полученной информацией и оценка результатов поиска.
Виды поиска
Полнотекстовый поиск — поиск по всему содержимому документа. Пример полнотекстового поиска — любой интернет-поисковик, например www.yandex.ru, www.google.com. Как правило, полнотекстовый поиск для ускорения поиска использует предварительно построенные индексы. Наиболее распространенной технологией для индексов полнотекстового поиска являются инвертированные индексы.
Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).
Поиск по изображению — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы:
Xcavator
Retrievr
PolarRose
Picollator Online by Recogmission
Методы поиска
Адресный поиск
Процесс поиска документов по чисто формальным признакам, указанным в запросе. Для осуществления нужны следующие условия:
Наличие у документа точного адреса
Обеспечение строгого порядка расположения документов в запоминающем устройстве или в хранилище системы.
Адресами документов могут выступать адреса веб-серверов и веб-страниц и элементы библиографической записи, и адреса хранения документов в хранилище.
Семантический поиск
Процесс поиска документов по их содержанию. Условия:
Перевод содержания документов и запросов с естественного языка на информационно-поисковый язык и составление поисковых образов документа и запроса.
Составление поискового описания, в котором указывается дополнительное условие поиска.
Принципиальная разница между адресным и семантическим поисками состоит в том, что при адресном поиске документ рассматривается как объект с точки зрения формы, а при семантическом поиске - с точки зрения содержания. При семантическом поиске находится множество документов без указания адресов. В этом принципиальное отличие каталогов и картотек. Библиотека - собрание библиографических записей без указания адресов.
Документальный поиск
Процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя.
Два вида документального поиска:
Библиотечный, направленный на нахождение первичных документов.
Библиографический, направленный на нахождение сведений о документах, представленных в виде библиографических записей.
Фактографический поиск
Процесс поиска фактов, соответствующих информационному запросу. К фактографическим данным относятся сведения, извлеченные из документов, как первичных, так и вторичных и получаемые непосредственно из источников их возникновения.
Различают два вида:
Документально-фактографический, заключается в поиске в документах фрагментов текста, содержащих факты.
Фактологический (описание фактов), предпологающий создание новых фактографических описаний в процессе поиска путем логической переработки найденной фактографической информации.
- 1. Основные понятия информатики. Данные. Информация. Информатика.
- 2. Пользовательский интерфейс. Программный интерфейс. Аппаратно-программный интерфейс.
- 3. Система счисления. Позиционные и непозиционные системы счисления. Основание. Разряд.
- 4. Алгоритмы перевода из десятичной системы в двоичную и из десятичной системы в двоичную. Привести пример а10 а2 и а2 а10
- 5. Алгоритмы перевода из двоичной системы в восьмеричную и из восьмеричной системы в двоичную. Привести пример а10 а2 а8 и а8а2 а10
- 6. Алгоритмы перевода из двоичной системы в шестнадцатеричную из шестнадцатеричной системы в двоичную. Привести пример а10 а2 а16 и а16 а2 а10
- 7. Аппаратное обеспечение. Машина Джон фон Неймана.
- 8. Главные компоненты персонального компьютера.
- 9. Компоненты системного блока.
- 10.Назначение материнской платы.
- 11.Устройства для ввода и вывода данных.
- 12.Запоминающие устройства и их виды.
- 13.Программное обеспечение. Классификация по.
- 14.Системное программное обеспечение.
- 15.Прикладное программное обеспечение.
- 16.Инструментальное программное обеспечение.
- 17.Алгоритм. Основные способы описания алгоритмов.
- 18.Словесно формульный способ описания алгоритмов.
- 19.Графический способ описания алгоритмов.
- 20.Псевдокоды.
- 21.Структура данных. Классификация структур данных.
- 22.Основные алгоритмические конструкции.
- 23.Линейный алгоритм. Графические блоки для описания линейного алгоритма. Привести пример. Линейный алгоритм.
- 24.Ветвящийся алгоритм. Графические блоки для описания ветвящегося алгоритма. Привести пример.
- 25.Циклический алгоритм. Графические блоки для описания циклического алгоритма. Привести пример.10 Циклический алгоритм.
- 26.Оператор цикла с предусловием. Привести фрагмент программы.
- 27.Оператор цикла с постусловием. Привести фрагмент программы.
- 28.Оператор цикла с параметром. Привести фрагмент программы.
- 29.Условный оператор перехода. Привести фрагмент программы.
- 30.Компьютерная сеть. Виды топологий компьютерных сетей
- 31.Виды компьютерных сетей
- 32.Роли компьютеров в компьютерной сети
- 33.Устройства соединения локальных сетей
- 34.Протокол коммуникации tcp/ip .
- 35.Основные сервисы системы Интернет.
- 5.1.1. Интернет. Основные сервисы
- 36.Системы информационного поиска сети Интернет
- 37. Основные понятия html
- 38.Информационная безопасность и её составляющие
- 39.Угрозы безопасности информации в компьютерных системах
- 40.Вредительские программы
- 41.Методы защиты информации.
- 42.Компьютерные вирусы
- Компьютерные вирусы могут существовать в системе в разных стадиях функционирования:
- 43.Профилактика заражения вирусами компьютерных систем.
- 44.Офисные программы. Программа Microsoft Access.
- 46.Программа Microsoft Excel.
- 45.Программа Microsoft Word.