Русскоязычные поисковые системы
Rambler (http://www.rambler.ru). «Поисковик номер один» среди специализирующихся на российской части Интернет. А заодно – и крупнейший каталог. Поисковая система Rambler была изначально создана в фирме "Стек" для возможности поиска по русскоязычным серверам и состоит из двух частей: поисковой программы-робота и базы данных. Компания "СТЕК" образовалась в Научном Центре Биологических Исследований в г. Пущино (Московская область) в 1991 году, а автором поисковой системы является Дмитрий Крюков.
Первая часть является роботом, который может получать адреса документов через прокси-сервер или непосредственно с указанного узла, индексирует содержание документа и помещает результаты этого индексирования в базу данных. Робот может рекурсивно сканировать определенные хосты. Он поддерживает стандартный механизм исключения роботов через файлы ROBOTS.TXT.
Второй частью Rambler является собственно сама поисковая система по серверам России и стран СНГ, содержащая миллионы документов с более чем 15,000 сайтов (имен DNS). Система поддерживает логические операции И, ИЛИ, НЕ, логические группы, метасимволы «?» и «*», заменяющие один символ или их группу, а также позволяет увеличивать и уменьшать значимость вводимых слов с помощь коэффициентов «+» и «─». Есть возможность поиска документов «похожих» на приглянувшийся среди найденных, а также поиска среди уже найденных документов. Поиск в различных кодировках дает одинаковый результат. Особой популярностью пользуется служба Rambler’s Top 100, позволяющая каждому установить счетчик на своей страничке и участвовать в рейтинге.
Яndex (http://yandex.ru). Эта поисковая система Интернета - часть проекта фирмы Comptek по разработке набора средств полнотекстовой индексации и поиска в текстовых данных с учетом морфологии русского языка. Яndex (произносится как "яндекс") расшифровывается как Языковый Индекс или, в английском написании, Yandex - Yet Another Index.
Как указывается в документе на сервере, продукты Яndex предназначены для работы с большими объемами русских текстов всех типов - в виде файлов различных форматов, полей баз данных и страничек Интернет.
Поисковая машина Яndex была запущена в эксплуатацию в конце сентября 1997 года и область поиска системы - русскоязычный Интернет. Отличительные особенности системы, в соответствии с описанием на http://yandex.ru:
-
полнотекстовый поиск с полным учетом морфологии русского и английского языков
-
мощный язык запросов (в том числе возможность поиска с расстоянием)
-
возможность запроса на естественном языке
-
корректная обработка сленговых слов
-
возможность поиска похожего документа
-
очень компактный индекс
-
подсветка слов из запроса в найденных документах
-
развитая релевантность, позволяющая найти искомую информацию, не перегружая пользователя тысячами ссылок на не нужные документы;
-
высокая скорость поиска.
Основным достоинством Яndex’а является способность находить заданные слова независимо от формы, в которой они употребляются в документах. Интересно, что система может образовывать словоформы даже для тех слов, которых нет в словаре. Система поддерживает логические операции И, ИЛИ и НЕ, логические группы, поиск по фразам, причем действие операторов И и НЕ может распространяться как на один абзац, так и на весь документ в целом. Поиск может вестись как по всем формам ключевых слов, так и по конкретно заданной форме. Возможно определение расстояния между словами с учетом их порядка, указание значимости ключевых слов, а также использование уточняющих слов. Специальный поиск можно вести по заголовкам документов и находящимся в них ссылкам. Кроме того, имеется возможность попросить систему найти документы схожие с наиболее приглянувшимися вам из найденных по предыдущему запросу. Можно также ограничить поиск уже найденными документами. А в том случае, если нужные документы не будут найдены, можно продолжить поиск через AltaVista, куда автоматически передается уже обработанный системой запрос. Поиск в различных кодировках дает одинаковый результат.
Апорт! (http://www.aport.ru). Поисковая система Апорт! - это проект фирмы Агама при поддержке российского отделения Intel. Система задумана и реализована как Web-индекс для осуществления поиска в Российской части Интернета, на русскоязычных серверах СНГ и мирового Интернет
Поиск ведется более чем по полутора миллионам документам. Система умеет искать по различным словоформам введенных слов и даже исправляет во введенных словах ошибки, поддерживает логические операторы И, ИЛИ, НЕ, логические группы, поиск по фразам, ограничение в расстоянии между словами, заданное числом слов или фраз. Мало того, система может переводить с русского на английский и с английского на русский не только запрос, но и полученную в результате поиска информацию. Возможен поиск по URL, а также указание допустимого времени создания документов.
Turtle (http://www.turtle.ru). В течение почти пяти лет монополии трех поисковиков в Рунете ничто не угрожало. Новички появлялись с завидной периодичностью, однако ни один из них так и не смог достичь хотя бы уровня Апорта, самого скромного представителя «триады».
Однако в начале 2002 года ситуация изменилась: на рынке появился еще один амбициозный и умелый поисковик, немедленно окрещенный особо журналистами «убийцей Яндекса» — Turtle.
Ожидания, связанные с «Черепашкой», объяснялись просто: Turtle стал вторым детищем компании Stack Group — после самого Rambler! Видимо, отчаявшись привести в соответствие с требованиями времени механизм старого поисковика, разработчики решили по максимуму вложить свои силы в создание нового.
По заявлениям создателей, поисковый механизм Turtle отличается рекордной точностью (хотя большинство экспертов и указывает, что результаты поиска с использованием того же Яndex выглядят куда лучше), а также содержит ряд абсолютно новых возможностей. Например, в дополнение к обычному и расширенному поиску в Turtle введен еще и «Поиск по фрагменту»: вы можете задать в качестве запроса не только слово или фразу, но и целый (и довольно объемный) фрагмент текста. Мастера сетевого поиска оценят и язык запросов Turtle, который содержит ряд новых и весьма интересных операторов.
Yandex.RTB R-A-252273-3- Информатизация общества
- Роль и значение информационных революций
- Что такое информационное общество?
- Процесс информатизации общества
- Информационная культура
- Информационные ресурсы
- Информационные продукты и услуги
- Контрольные вопросы по теме «Информатизация общества»
- Информатика — предмет и задачи
- Появление и развитие информатики
- Структура информатики
- Контрольные вопросы по теме «Информатика ‑ предметы и задачи»
- Информация в материальном мире
- Сигналы и данные
- Данные и методы
- Понятие об информации
- Диалектическое единство данных и методов в информационном процессе
- Свойства информации
- Носители данных
- Операции с данными
- Кодирование данных двоичным кодом
- Кодирование текстовых данных
- Универсальная система кодирования текстовых данных
- Единицы измерения данных
- Единицы хранения данных
- Понятие о файловой структуре
- Контрольные вопросы по теме «Информация в материальном мире»
- Информационные системы
- Понятие информационной системы
- Этапы развития информационных систем
- Процессы в информационной системе
- Структура информационной системы
- Классификация информационных систем по функциональному признаку
- Контрольные вопросы по теме «Информационные системы»
- Информационные технологии
- Понятие информационной технологии
- Этапы развития информационных технологий
- Виды информационных технологий
- Контрольные вопросы по теме «Информационные технологии»
- Устройство персонального компьютера
- Системный блок
- Монитор
- Клавиатура
- Внутренние устройства системного блока
- Материнская плата
- Жесткий диск
- Дисковод гибких дисков
- Дисковод компакт-дисков cd-rom
- Периферийные устройства персонального компьютера
- Устройства ввода знаковых данных
- Устройства вывода данных
- Устройства хранения данных
- Устройства обмена данными
- Операционные системы
- Контрольные вопросы по теме «Устройство персонального компьютера»
- Основы программирования
- Алгоритм и программа
- Что такое язык программирования
- Компиляторы и интерпретаторы
- Уровни языков программирования
- Поколения языков программирования
- Обзор языков программирования высокого уровня
- Прочие языки программирования
- Средства создания программ
- Контрольные вопросы по теме «Основы программирования»
- Компьютерная графика
- Виды компьютерной графики
- Растровая графика
- Векторная графика
- Фрактальная графика
- Представление графических данных
- Средства для работы с растровой графикой
- Классификация баз данных
- Функциональные возможности субд
- Обзор субд
- Характеристики субд:
- Контрольные вопросы по теме «Базы данных»
- Компьютерные сети
- Локальные и глобальные сети. Основные понятия
- Протоколы компьютерной сети
- Контрольные вопросы по теме «Компьютерные сети»
- Интернет. Основные понятия
- Теоретические основы Интернета
- Службы Интернета
- Терминальный режим
- Электронная почта (e-Mail)
- Списки рассылки (Mail list)
- Служба телеконференций (Usenet)
- Служба World Wide Web (www)
- Служба irc
- Служба icq
- Поиск в Интернете
- Всемирные поисковые машины
- Русскоязычные поисковые системы
- Сложный поиск в Интернет
- Контрольные вопросы по теме «Интернет. Основные понятия»
- Защита информации
- Компьютерные вирусы и их классификация
- Средства защиты от вирусов
- Разработка политики информационной безопасности
- Технические, организационные и программные средства обеспечения сохранности и защиты от несанкционированного доступа
- 2. Защита пароля.
- 4. Предосторожности при работе.
- Защита носителей информации (исходных документов, лент, картриджей, дисков, распечаток).
- Контрольные вопросы по теме «Защита информации»
- Список литературы по информатике