4. Виды информации в Интернете и профессиональных базах
Информация о предметной области, т. е. об объектах и их связях, может быть представлена в двух видах: формализованном и в виде текста на естественном языке.
Формализованное описание конкретного объекта включает имя, свойства (характеристики) и значение этого свойства для данного объекта. Имя свойства отражает грамматическую роль значения этого свойства по отношению к данному классу объектов. Значение свойства (характеристики) может задаваться нормированным словарем или произвольно. Например, значение свойства "организационно-правовая форма фирмы, организации" должно выбираться из нормированного словаря, а значение свойства "название организации" является произвольным. Формализованное описание объекта во многом схоже с анкетной формой описания объекта. Некоторые авторы называют формализованное описание информации числовым. Это не совсем точное определение, так как фамилия лица или название организации задается не числовым значением, но может быть представлено в формализованном виде.
Названия классов объектов, свойств и областей возможных значений этих свойств (характеристик), т. е. язык формализованного описания для каждой предметной области, разрабатывают квалифицированные специалисты. С помощью отдельных свойств устанавливаются связи между объектами. Например, если описаны два объекта: фирма и товар, то между ними устанавливается связь-отношение, указывающее, что эта фирма выпускает этот товар. Описание такого формализованного языка после согласования с источниками и потребителями информации в данной предметной области издается в виде нормативного документа, и на основе его создаются базы данных формализованной информации. Описание информации в таких базах в максимальной степени приближено к представлению специалиста о предметной области, в которой он работает.
Формализованный язык описания предметной области выполняет следующие основные функции:
позволяет источнику отбирать лишь ту информацию и описывать ее так, как это необходимо потребителю;
позволяет в базах данных отражать информацию в том же виде, в каком она отражена в сознании специалиста данной предметной области;
позволяет в информационных системах по указанию потребителя проводить автоматическую обработку формализованной информации;
существенно облегчает поиск нужной информации в базах данных.
Другим видом информации о предметной области является информация, представленная в виде текста на естественном языке.
Для того чтобы понять, в какой степени информация на естественном языке, накапливаемая в информационных системах, подходит для удовлетворения информационных потребностей пользователя, рассмотрим в общих чертах природу восприятия человеком реальной действительности и отображение этой действительности на естественном языке. Индивидуальное знание предметной области источником и потребителем информации складывается из совокупности представлений и понятий.
Представления — это чувственно-наглядные образы объектов реального мира. Источником формирования представлений являются психологические процессы ощущения и восприятия, а также информация, получаемая от других членов общества в процессе общения. В результате создаются представления об объектах реального мира. Представления носят субъективный характер, который определяется внутренним психологическим миром данного человека. Хотя у разных людей создаются разные представления о реальном мире, в них присутствует элемент общности, который позволяет использовать представления в процессе общения.
Понятия образуются в результате логического осмысления представлений об объектах реального мира и являются формой абстрактного мышления, отражающей и фиксирующей существенные признаки данных объектов. Понятия более объективны и в большей степени отражают коллективный опыт. Понятия и представления тесно взаимосвязаны и являются формой отражения реальной действительности в мышлении.
Язык - это средство, с помощью которого люди передают друг другу информацию о реальном мире. Словарные выражения являются материальной формой понятий и представлений. Естественный язык является результатом длительного развития общества. Поскольку для различных слоев общества характерна разная степень общности представлений, возникла многозначность слов естественного языка: одно и то же слово приобретало множество различных значений и для одного и того же слова использовалось несколько словесных выражений. Таким образом, общим недостатком естественного языка с позиций оценки эффективности поиска является избыточность и недостаточность.
Избыточность проявляется в следующем:
для передачи содержания текста активную роль играют только некоторые слова или словосочетания, так называемые ключевые слова. Другие можно отбросить практически без ущерба для понимания смысла;
в естественном языке употребляются синонимы, т. е. слова, различающиеся по звучанию и написанию, но тождественные или близкие по смыслу;
неоднозначность выражения, т. е. возможность выразить одну и ту же мысль словами, не являющимися синонимами (уменьшение сопротивления - увеличение проводимости).
Недостаточность проявляется в следующем:
1) многозначность слов - омонимия — совпадение по звучанию и написанию разных по значению слов: ключ (для двери), ключ (источник);
2) эллипсность - пропуск в тексте подразумеваемых слов.
Если рассматривать процесс отражения объектов реального мира текстом на естественном языке, то можно выделить план содержания—смысл сообщения, т. е. результат процесса мышления, и план выражения — произвольный текст на естественном языке. Таким образом, тексты на естественном языке, хранящиеся в информационных системах, находятся на уровне плана выражения и характеризуются всеми недостатками естественного языка, отмеченными выше. Следует иметь в виду, что выявленные недостатки следует рассматривать лишь с позиций эффективного поиска сообщений в информационных системах. Причина неоднозначности выражений при рассмотрении под другим углом будет отнесена к достоинствам естественного языка, например эллипсность.
Отметим, что потребитель информации - пользователь нуждается в получении информации о предметной области в соответствии со своими представлениями об объектах, свойствах и отношениях в этой области. Свой запрос он также формулирует на уровне плана выражения.
Таким образом, в самой информационной системе, содержащей тексты на естественном языке, мы имеем массив планов выражения источников на естественном языке, а на входе информационной системы — множество запросов в виде планов выражения, сформулированных потребителями информации.
Для того чтобы решить задачу поиска требуемой потребителю информации, необходимо смоделировать, представить, о каком фрагменте предметной области потребитель хочет получить информацию. Затем нужно просмотреть хранящиеся документы—планы выражения, составленные источниками, представить и смоделировать, что хотел сказать источник о предметной области и на основе научно обоснованной методики отобрать те из них, которые отвечают на поставленный вопрос полностью или частично.
Работы в областях теории построения документальных информационных систем и машинного перевода, проводимые последние 50 лет в нашей стране и за рубежом, показали, что процесс выявления смысла из произвольного текста на естественном языке не может быть реализован автоматически, а лишь с участием человека, обладающего глубокими знаниями в данной предметной области.
Однако общество нуждалось в построении документальных информационных систем в первую очередь в области научно-технической информации. Для того чтобы облегчить поиск в больших массивах текстовой информации, стали строить информационно-поисковые системы, в которых документы описывались с помощью специальных поисковых языков. С помощью элементов этого же языка описывались и запросы. Для отбора документов в ответ на запрос осуществлялось сравнение поисковых образов запросов и поисковых образов документов, которое проводилось на одном и том же искусственном языке.
Такой подход является вынужденным. Из-за недостатков естественного языка, отмеченных выше, документальные информационные системы не дают ответа на вопрос потребителя, а выдают ему документы, в которых может содержаться ответ на его запрос, предоставляя потребителю самостоятельно выявить смысловое содержание этих документов. Вопросы оценки эффективности поиска информации в документальных информационных системах будут рассмотрены ниже.
Выводы
Мировой рынок деловой информации представлен более чем 8 тыс. крупных информационных агентств, в полном объеме обеспечивающих потребности в деловой информации различных видов бизнеса. Эти агентства предоставляют услуги доступа к 19,4 тыс. информационных баз, содержащих биржевую и финансовую информацию, сведения о фирмах, товарах, услугах, рынках сбыта, статистическую, научно-техническую, правовую информацию и деловые новости. К большинству баз имеется режим непосредственного доступа из любой точки мира.
Наряду с собранной из различных источников информацией ряд информационных агентств предоставляют информацию с собственной оценкой финансового состояния этой фирмы, что крайне важно при установлении партнерских отношений или рассмотрении вопроса о выдаче кредита.
Основная информация из профессиональных баз (свыше 85% общего объема) предоставляется на коммерческой основе. Несмотря на относительно высокие цены, спрос на деловую информацию постоянно растет. За 5 лет (с 1992 по 1997 г.) доходы от продаж информации через Интернет возросли в 28 раз и, по мнению экспертов, в ближайшее время должны составить 20 млрд. долларов.
Информационные ресурсы стали одними из важнейших ресурсов государств. США - лидер мировой экономики формирует более 70% мировых ресурсов деловой информации.
Бизнесмены в развитых странах стараются недостаток информации о фирме будет, как правило, преградой на пути делового сотрудничества с такой фирмой.
- 080801.65 «Прикладная информатика в экономике»
- Пояснительная записка
- 1. Место дисциплины в государственном образовательном стандарте высшего профессионального образования
- 2. Образовательные цели и задачи обучения
- 3. Требования к уровню освоения содержания дисциплины
- 4. Роль дисциплины и ее место в системе подготовки специалиста
- 5. Организационно-методические указания к преподаванию курса
- 6. Контроль качества освоения материала дисциплины
- 7. Тематический план курса
- 1.7.1. Тематический план учебной дисциплины
- 1.7.2. Тематический план учебной дисциплины для студентов заочной формы обучения
- 8. Содержание дисциплины
- 8.1. Содержание лекционного курса
- Лекция №5. Мировые информационные ресурсы (2 часа)
- Характеристика Интернет. Принципы работы поисковых систем. Правила поиска информационных ресурсов в мировых информационных сетях.
- Модуль 4. Технология и практика взаимодействия индивидуального и коллективного пользователя с мировыми ресурсами через специализированные сетевые структуры
- 8.2. Содержание практикума
- 8.2.1. Тематика семинарских занятий (18 часов)
- 8.2.2. Тематика лабораторных работ (18 часов)
- 8.3. Лекционный курс
- Тема 2. Рынок информации: особенности спроса, предложения, рыночного равновесия
- 1. Первичная и тиражированная информация
- 2. Носители и проводники информации
- 3. Механизм функционирования рынка первичной информации
- 1. Государственные информационные ресурсы
- 2. Представление информации в государственные информационные ресурсы
- 3. Категории доступа к информации
- 4. Ограничения на содержимое средств массовой информации
- 5. Авторское право
- Тема 4. Управление информационными ресурсами на предприятии, фирме
- 2. Информационные потребности при планировании деятельности предприятия
- 3. Бизнес-план и выявление требований к информационному обеспечению
- 4. Внешнеэкономическая деятельность и выявление требований к информационному обеспечению
- Выводы по модулю 1
- Тема 5. Мировые информационные ресурсы
- 1. Классификация мировых информационных ресурсов
- 2. Структура информационного рынка
- 3 Основные источники информационных ресурсов
- Источники юридической информации
- Информация для специалистов
- Массовая, потребительская информация
- 1. Этапы развития мирового рынка информации
- 2. Профессиональные базы данных Информационная корпорация 'Dun and Bradstreet (d and в) Corp. ("Дан энд Брэдстрит")
- Информационная корпорация Dialog ("Диалог")
- Информационное агентство Data-Star
- Информационная корпорация QuestelOrbit
- База данных QuestelOrbit
- Информационное агентство LexisNexis
- 3. Деловые ресурсы Интернета
- 4. Виды информации в Интернете и профессиональных базах
- Тема 7. Состояние российского рынка информации. Справочная правовая информация
- 1. Государственные системы справочной правовой информации
- 2. Коммерческие системы справочной правовой информации
- Тема 8. Состояние российского рынка информации. Биржевая и финансовая информация
- 1. Основные зарубежные производители информационных продуктов и услуг на биржевом и финансовом рынках
- Агентство Рейтер
- Агентство Телерейт
- Агентство Тенфор
- Агентство "Блумберг"
- 2. Российские информационные агентства и службы в сфере биржевой и финансовой информации Информационное агентство РосБизнесКонсалтинг
- Акционерное общество ак&м
- Информационное агентство "Финмаркет"
- Компания Парк.Ру
- Агентство экономической информации "прайм-тасс"
- Общество с ограниченной ответственностью мфд "ИнфоЦентр"
- Агентство "Интериндекс»"
- Агентство Интерфакс
- Отраслевая информация
- Аналитическая информация (профили компаний, обзоры рынков, индексы, рейтинги)
- Тема 9. Состояние российского рынка информации. Коммерческая информация
- 1. Понятие коммерческой информации.
- Агентство деловой информации (ади) Бизнес-Карта
- Агентство "асу-Импульс"
- "ИнформСистема"
- Инфогруппа Компас
- Институт промышленного развития (Информэлектро) Министерства экономического развития и торговли Российской Федерации
- Информационное агентство "Норма"
- Информационно-консультативный центр"Мосвнешинформ"
- Информационное агентство Вдохновение
- Агентство социум инфополис
- Тема 10. Информационные образовательные ресурсы
- 1. Виды информационных образовательных ресурсов
- 2. Уровни интеграции информационных ресурсов в образовании
- 3. Использование цифровых информационных ресурсов в учебном процессе
- Информационная грамотность
- Обучение на базе мировых информационных ресурсов
- Тема 11. Зарубежный и российский рынки знаний
- 1. Зарубежный рынок знаний
- 2. Российский рынок знаний
- 2.1. Библиотечная сеть
- 2. Электронные библиотеки
- Система научно-технической информации
- Система патентной информации
- Тема 12-13. Международные и российские статистические ресурсы
- 1. Система международной статистики
- 2. Национальные системы статистики
- 4. Федеральная служба государственной статистики (Росстат)
- Тема 14. Технология доступа к информационным ресурсам и ресурсам знаний
- 1. Какие информационные ресурсы выбрать?
- 2. Как извлечь из информационных ресурсов необходимые сведения?
- Выбор информационных ресурсов
- Поиск информации в профессиональных базах
- Тема 15. Структура представления информации в мировых информационных сетях
- Принципы работы поисковых систем
- Правила поиска информационных ресурсов в мировых информационных сетях
- Тема 16. Технология доступа к деловым ресурсам Интернета
- 1. Поисковые машины
- Глубина индексирования веб-сайтов
- 2. Каталоги в Интернете
- 3. Технология доступа к информации в электронных библиотеках
- 4. Сравнительные характеристики эффективности поиска в различных системах и оценка достоверности
- 1. Технология взаимодействия со специализированными сетевыми структурами, агрегирующими информационные ресурсы
- Технология взаимодействия со специализированными сетевыми структурами, производящими информационные ресурсы
- Тема 18. Перспективы развития мирового рынка информации и знаний
- 1. Комплексная оценка эффективности использования мировых ресурсов
- 2. Перспективы развития мирового рынка информации и знаний
- 9. Учебно-методическое обеспечение курса
- 5. Мировые информационные ресурсы. Интернет: практикум/кол.Авторов; под общ.Ред. П.В.Акинина.- м.:кнорус, 2008.-356 с.
- 11. Холмогоров в. Поиск в Интернете и сервисы Яндекс.- сПб.:Питер, 2006.-123 с.
- 10. Материально-техническое, информационное и программное обеспечение курса
- 11. Вопросы для итогового контроля и самоанализа
- 12. Глоссарий
- 13. Тест для контроля и самоконтроля по темам курса
- 56. Кто является наиболее крупным поставщиком баз данных и справочников по производителям товаров и услуг в России?
- 58. Какая из российских фирм на регулярной основе обеспечивает потребителей информацией о зарубежных фирмах?
- 61. К какому источнику следует обратиться за метаинформацией о базах данных, представленных на мировом рынке информационных услуг?
- 62. Какие организации не являются источником официальной статистической информации?
- Автор-составитель:Елисеева е.В. «Мировые информационные ресурсы» Учебно-методический комплекс