Поиск информации в профессиональных базах
Интенсивное развитие информационно-коммуникационных технологий повлекло за собой лавинообразный рост накапливаемой информации. Было замечено, что рост документальной информации подчиняется закону Мура с небольшой корректировкой, т.е. объем документальной информации удваивается каждые три года.
Большие массивы информации ведут к увеличению затрат на приобретение доступа к информационным ресурсам и времени для работы с ними. Эффективность работы с информационными ресурсами зависит во многом от методов структуризации информации в базах данных, программного обеспечения для работы с большим массивом информации и, конечно, от квалификации специалистов, где большое значение приобретают знания и умения поиска информации.
Одним из основных преимуществ профессиональных баз данных перед ресурсами Интернета является обработка поступающей информации, т.е. разнесение ее по рубрикам, выделение в документах сегментов, таких, как автор, заголовок, дата и т.п. Например, информационные ресурсы в системе LexisNexis иерархически структурированы, что обеспечивает пользователю дополнительные возможности для проведения поиска.
Вся информация, находящаяся в LexisNexis, расположена в различных библиотеках, всего 180 библиотек. Каждая библиотека представляет собой коллекцию источников информации, относящихся к определенной тематике; например, библиотека NEWS (газеты, журналы, сообщения информационных агентств, бюллетени), библиотека COMPANY (разнообразная справочная информация о компаниях), библиотека MARKET (содержит источники информации о рекламе, маркетинге, исследованиях, рынка, сбыте, состоянии мирового и регионального рынков различных товаров) и т.д., или же библиотеки формируются по географическому признаку, например, WORLD, EUROPE, ASIA и т.д.
Каждая библиотека содержит файлы. Файл является минимальной единицей, в которой проводится поиск. Файл содержит документы, поступающие от одного или нескольких источников информации.
Каждый документ в файле состоит из нескольких частей, которые называются сегментами. Общими сегментами для всех документов являются: название (сегмент HEADLINE); автор (сегмент BYLINE); дата (сегмент DATE); текст документа (сегмент BODY). Кроме того, дополнительно в зависимости от тематики документа выделяются сегменты "компания" (куда заносятся наименования всех компаний, упоминавшихся в документе); продукт (название продуктов или услуг, о которых идет речь в документе); регион; персонал и т.д. В зависимости от типа документа — статья в газете, маркетинговый отчет, судебное дело, биография известного человека — будет меняться набор сегментов, из которых состоит документ, и названия сегментов.
Поисковые инструменты информационных систем могут иметь как общие черты, так и существенные различия. В некоторых видах систем удобство инструментов для работы с массивами документов является основным конкурентным преимуществом. Например, на российском рынке правовой информации производители справочно-правовых систем борются за потребителя путем совершенствования интерфейса и поисковых инструментов своих систем.
Поиск информации является важной составляющей работы с информационными ресурсами и занимает значительное время работы пользователя с системой. Для повышения эффективности процесса поиска и сокращения затрачиваемого на него времени разрабатываются различные поисковые инструменты и формы предоставления информации. Файлы могут быть либо фактографические, либо документальные.
Выполнение информационного поиска возможно либо по тексту (полнотекстовый поиск), либо при помощи каталога. При полнотекстовом поиске отыскиваются слова в тексте документа либо в его сегменте, например, в заголовках статей и рефератах, перебирая все варианты написания и синонимы. В некоторых системах поисковая программа позволяет вводить набор слов и учитывает некоторые формы слова, например, множественное число.
Каталог в информационной системе — это оглавление файлов, составленное по тематическому или региональному признаку, имеющее иерархическую структуру.
Полнотекстовый поиск и поиск при помощи каталога не являются взаимоисключающими, напротив, наиболее эффективные стратегии поиска получаются при их комбинации.
Несмотря на разнообразие поисковых инструментов, процесс поиска информации можно разбить на четыре этапа.
1. Формулировка задачи. Цель этого этапа состоит в четком определении информационной потребности. Информационной потребностью может быть определенный документ, например закон или публикация, конкретная информация или информация, посвященная определенному кругу вопросов. Исходя из формулировки потребности, можно выбрать наиболее подходящие методы поиска, подобрать ключевые слова, которые могут встречаться в искомых документах.
2. Выбор информационного ресурса. После формулировки информационной задачи необходимо выбрать информационный ресурс, который может содержать неполную информацию. Выбор информационного ресурса ограничивается возможностями получения доступа.
3. Построение запроса. После того как информационная задача строго сформулирована и выбран информационный ресурс, необходимо составить поисковый запрос.
Для документальной информационной системы может быть предложена следующая последовательность действий:
выбрать соответствующую тематическую рубрику (как правило, в базах данных информация разнесена по рубрикам);
разбить вопрос на понятия, которые следует искать отдельно, а затем объединить их соответствующими логическими операторами (and, or, not), если в системе поиска предусмотрены булевы операции.
Практически во всех информационных системах существует свой язык построения поисковых запросов для проведения Поиска слов и выражений по тексту документа. Общими элементами этих языков является булева логика, разработанная английским математиком Джорджем Булем (1815-1864). Булева логика используется тогда, когда поисковый запрос содержит более одного понятия. В этом случае можно применить операции: "И" (AND - требует наличия всех терминов, в результате уменьшает число найденных документов), "ИЛИ" (OR - требует наличия в документе хотя бы одного понятия, в результате увеличивает число документов), "НЕ" (NOT - требует отсутствия термина, в результате уменьшает число найденных документов);
учесть все варианты написания слов и синонимы при поиске произвольного текста. Необходимо использовать соответствующие классификаторы, словари и тезаурусы, что может значительно повысить эффективность запроса.
4. Оценка результатов поиска является важным этапом информационного поиска. Она зависит от того, для каких целей будут использованы результаты поиска.
Критерии оценки поиска:
количество найденных документов;
найденные источники информации;
оперативность информации.
По результатам поиска, как правило, запрос корректируется. Для достижения наилучшего результата специалисты составляют несколько запросов на поиск информации. При поиске информации большое значение имеют знание специалиста инструментов поиска и умение их применять. При подписке на информационную систему сотрудники фирмы, как правило, проходят обучение работе с этой системой.
Таким образом, информационный поиск представляет собой упорядоченную последовательность действий, для того. чтобы отыскать необходимую информацию.
Особое внимание следует уделить вопросам минимизации стоимости получаемой информации от источников. В ряде случаев поиск информации производится в рамках выделенной для этого суммы. Работая с метаинформацией, возможно предварительно оценить стоимость необходимой информации.
Высокая квалификация пользователя и умение работать на предварительном этапе с документацией резко снижают общую стоимость информации, необходимой пользователю.
- 080801.65 «Прикладная информатика в экономике»
- Пояснительная записка
- 1. Место дисциплины в государственном образовательном стандарте высшего профессионального образования
- 2. Образовательные цели и задачи обучения
- 3. Требования к уровню освоения содержания дисциплины
- 4. Роль дисциплины и ее место в системе подготовки специалиста
- 5. Организационно-методические указания к преподаванию курса
- 6. Контроль качества освоения материала дисциплины
- 7. Тематический план курса
- 1.7.1. Тематический план учебной дисциплины
- 1.7.2. Тематический план учебной дисциплины для студентов заочной формы обучения
- 8. Содержание дисциплины
- 8.1. Содержание лекционного курса
- Лекция №5. Мировые информационные ресурсы (2 часа)
- Характеристика Интернет. Принципы работы поисковых систем. Правила поиска информационных ресурсов в мировых информационных сетях.
- Модуль 4. Технология и практика взаимодействия индивидуального и коллективного пользователя с мировыми ресурсами через специализированные сетевые структуры
- 8.2. Содержание практикума
- 8.2.1. Тематика семинарских занятий (18 часов)
- 8.2.2. Тематика лабораторных работ (18 часов)
- 8.3. Лекционный курс
- Тема 2. Рынок информации: особенности спроса, предложения, рыночного равновесия
- 1. Первичная и тиражированная информация
- 2. Носители и проводники информации
- 3. Механизм функционирования рынка первичной информации
- 1. Государственные информационные ресурсы
- 2. Представление информации в государственные информационные ресурсы
- 3. Категории доступа к информации
- 4. Ограничения на содержимое средств массовой информации
- 5. Авторское право
- Тема 4. Управление информационными ресурсами на предприятии, фирме
- 2. Информационные потребности при планировании деятельности предприятия
- 3. Бизнес-план и выявление требований к информационному обеспечению
- 4. Внешнеэкономическая деятельность и выявление требований к информационному обеспечению
- Выводы по модулю 1
- Тема 5. Мировые информационные ресурсы
- 1. Классификация мировых информационных ресурсов
- 2. Структура информационного рынка
- 3 Основные источники информационных ресурсов
- Источники юридической информации
- Информация для специалистов
- Массовая, потребительская информация
- 1. Этапы развития мирового рынка информации
- 2. Профессиональные базы данных Информационная корпорация 'Dun and Bradstreet (d and в) Corp. ("Дан энд Брэдстрит")
- Информационная корпорация Dialog ("Диалог")
- Информационное агентство Data-Star
- Информационная корпорация QuestelOrbit
- База данных QuestelOrbit
- Информационное агентство LexisNexis
- 3. Деловые ресурсы Интернета
- 4. Виды информации в Интернете и профессиональных базах
- Тема 7. Состояние российского рынка информации. Справочная правовая информация
- 1. Государственные системы справочной правовой информации
- 2. Коммерческие системы справочной правовой информации
- Тема 8. Состояние российского рынка информации. Биржевая и финансовая информация
- 1. Основные зарубежные производители информационных продуктов и услуг на биржевом и финансовом рынках
- Агентство Рейтер
- Агентство Телерейт
- Агентство Тенфор
- Агентство "Блумберг"
- 2. Российские информационные агентства и службы в сфере биржевой и финансовой информации Информационное агентство РосБизнесКонсалтинг
- Акционерное общество ак&м
- Информационное агентство "Финмаркет"
- Компания Парк.Ру
- Агентство экономической информации "прайм-тасс"
- Общество с ограниченной ответственностью мфд "ИнфоЦентр"
- Агентство "Интериндекс»"
- Агентство Интерфакс
- Отраслевая информация
- Аналитическая информация (профили компаний, обзоры рынков, индексы, рейтинги)
- Тема 9. Состояние российского рынка информации. Коммерческая информация
- 1. Понятие коммерческой информации.
- Агентство деловой информации (ади) Бизнес-Карта
- Агентство "асу-Импульс"
- "ИнформСистема"
- Инфогруппа Компас
- Институт промышленного развития (Информэлектро) Министерства экономического развития и торговли Российской Федерации
- Информационное агентство "Норма"
- Информационно-консультативный центр"Мосвнешинформ"
- Информационное агентство Вдохновение
- Агентство социум инфополис
- Тема 10. Информационные образовательные ресурсы
- 1. Виды информационных образовательных ресурсов
- 2. Уровни интеграции информационных ресурсов в образовании
- 3. Использование цифровых информационных ресурсов в учебном процессе
- Информационная грамотность
- Обучение на базе мировых информационных ресурсов
- Тема 11. Зарубежный и российский рынки знаний
- 1. Зарубежный рынок знаний
- 2. Российский рынок знаний
- 2.1. Библиотечная сеть
- 2. Электронные библиотеки
- Система научно-технической информации
- Система патентной информации
- Тема 12-13. Международные и российские статистические ресурсы
- 1. Система международной статистики
- 2. Национальные системы статистики
- 4. Федеральная служба государственной статистики (Росстат)
- Тема 14. Технология доступа к информационным ресурсам и ресурсам знаний
- 1. Какие информационные ресурсы выбрать?
- 2. Как извлечь из информационных ресурсов необходимые сведения?
- Выбор информационных ресурсов
- Поиск информации в профессиональных базах
- Тема 15. Структура представления информации в мировых информационных сетях
- Принципы работы поисковых систем
- Правила поиска информационных ресурсов в мировых информационных сетях
- Тема 16. Технология доступа к деловым ресурсам Интернета
- 1. Поисковые машины
- Глубина индексирования веб-сайтов
- 2. Каталоги в Интернете
- 3. Технология доступа к информации в электронных библиотеках
- 4. Сравнительные характеристики эффективности поиска в различных системах и оценка достоверности
- 1. Технология взаимодействия со специализированными сетевыми структурами, агрегирующими информационные ресурсы
- Технология взаимодействия со специализированными сетевыми структурами, производящими информационные ресурсы
- Тема 18. Перспективы развития мирового рынка информации и знаний
- 1. Комплексная оценка эффективности использования мировых ресурсов
- 2. Перспективы развития мирового рынка информации и знаний
- 9. Учебно-методическое обеспечение курса
- 5. Мировые информационные ресурсы. Интернет: практикум/кол.Авторов; под общ.Ред. П.В.Акинина.- м.:кнорус, 2008.-356 с.
- 11. Холмогоров в. Поиск в Интернете и сервисы Яндекс.- сПб.:Питер, 2006.-123 с.
- 10. Материально-техническое, информационное и программное обеспечение курса
- 11. Вопросы для итогового контроля и самоанализа
- 12. Глоссарий
- 13. Тест для контроля и самоконтроля по темам курса
- 56. Кто является наиболее крупным поставщиком баз данных и справочников по производителям товаров и услуг в России?
- 58. Какая из российских фирм на регулярной основе обеспечивает потребителей информацией о зарубежных фирмах?
- 61. К какому источнику следует обратиться за метаинформацией о базах данных, представленных на мировом рынке информационных услуг?
- 62. Какие организации не являются источником официальной статистической информации?
- Автор-составитель:Елисеева е.В. «Мировые информационные ресурсы» Учебно-методический комплекс