logo
мир_умк_самый последний

12. Глоссарий

C

Crawler (путешествующий, ползающий паук) – компонент поисковой системы, программа, автоматически переходящая к ресурсам по всем ссылкам, найденным на исследуемой странице.

Cистема выдачи результатов (Search engine results engine) – компонент поисковой системы, извлекающий результаты поиска из базы данных.

D

Database (база данных) - хранилище скачанных и обработанных страниц.

Dialog - информационная корпорация, основанная в 1972 году. Объем ее баз данных – 12 терабайт. Тематика – бизнес, правительственные и законодательные акты, наука, социальная сфера, новости и текущие события.

Dun and Bradstreet - информационная корпорация, созданная 150 лет назад. Оно предоставляет пользователям информацию о финансовом состоянии и кредитоспособности компаний; справочники-рейтинги долговых обязательств; международные программы подготовки специалистов в области финансов, маркетинга, информационного обеспечения бизнес-справки, кредитно-аналитические справки, платежно-аналитические справки и др.

E

Elsevier (Эльзевир) — электронная библиотека научной информации. Собрание 24,6% всех опубликованных научных статей в мире на английском языке.

I

Indexer (индексатор) – компонент поисковой системы, «слепая» программа, которая анализирует веб-страницы, скачанные программами-пауками.

L

LEXIS - NEXIS – крупнейшая в мире полнотекстовая онлайновая информационная система. Создана для удовлетворения спроса на юридическую информацию. В настоящее время агрегирует базы данных различных направлений.

M

MDConsult – источник электронной информации, объединяющий онлайновые услуги по медицинской информации для практикующих врачей, специалистов по здравоохранению и студентов-медиков.

Q

Questel - Orbit – информационная корпорация, агрегирующая более 267 баз данных на различную тематику. Интересна экономистам. (Экономическая и деловая информация, торговые марки, патенты по отдельным отраслям, странам).

S

ScienceDirect - источник научной электронной информации, предлагающий доступ к полным текстам 1800 журналов, к ресурсам Эльзевир. Возможен доступ к ретроспективной информации (старейший журнал датирован 1823 годом).

Scirus - сетевая поисковая система, разработанная специально для ученых. Позволяет быстро и легко находить нужные для исследования сведения, включая экспертную оценку статей, патентную информацию, домашние страницы авторов и веб-сайты университетов, избегая «информационного шума», неизбежного при использовании обычных поисковых систем.

Search engine, results engine (система выдачи результатов) – компонент поисковой системы, извлекающий результаты поиска из базы данных.

Spider (паук) – компонент поисковой системы, браузероподобная программа, которая скачивает веб-страницы.

А

Архивный фонд РФ (АФ РФ) – система архивов, находящихся в ведении Федеральной архивной службы (Росархив). Объем фондов — 460 млн. единиц хранения. Архивы предназначены для хранения государственных и муниципальных архивов, государственных музеев и библиотек, учреждений системы РАН. Архивные документы временно могут храниться министерствами, ведомствами, учреждениями, организациями и предприятиями, отнесенными к источникам комплектования государственных и муниципальных архивов.

Б

База данных (database) - хранилище скачанных и обработанных страниц.

Библиотечная сеть РФ - система государственных библиотек, включающая публичные библиотеки федерального, регионального и муниципального уровня; научно-технические библиотеки и справочно-информационные фонды, входящие в российскую государственную систему научно-технической информации (ГСНТИ); информационно-библиотечную систему Российской академии наук (РАН); библиотечную систему высших учебных заведений; сеть муниципальных библиотек; сеть сельскохозяйственных библиотек; другие системы и сети.

Г

Гипертекст – система связанных документов на серверах WWW, содержащих ссылки на другие, связанные по смыслу документы.

Госкомстат – государственное учреждение, отвечающее за сбор и выпуск статистической информации, отчеты, анализ, прогнозы в различных областях..Выпускает периодические издания

Государственные информационные ресурсы - ресурсы, формируемые за счет государственного бюджета и др. законными способами

Д

Деловая информации - биржевая и финансовая информация, (например, о курсах валют, котировках ценных бумаг, учетных ставках, рынках и пр); экономическая и статистическая информация; коммерческая информация (о предприятиях, фирмах и их продукции, руководителях).

Документ – по законодательству РФ – материальный объект с зафиксированной на нем информацией в виде текста, звукозаписи или изображения, предназначенный для передачи во времени и пространстве в целях хранения и общественного использования. Документ обязательно содержит реквизиты, позволяющие однозначно идентифицировать, содержащуюся в нем информацию

И

Индексатор (I ndexer) – компонент поисковой системы, «слепая» программа, которая анализирует веб-страницы, скачанные программами-пауками.

Интернет – объединение множества глобальных сетей в соответствии с соглашением о стандартах их взаимодействия.

Информатизация – в РФ – комплекс мер, направленных на обеспечение оперативного доступа к информационным ресурсам.

Информатизация – организационный социально-экономический и научно-технический процесс создания оптимальных условий для удовлетворения информационных потребностей и реализации прав граждан, органов государственной власти, органов местного самоуправления, организаций, общественных объединений на основе формирования и использования информационных ресурсов .

Информационная экономика (Information economy; Knowledge economy) – экономика, основанная на знаниях, в которой большая часть валового внутреннего продукта обеспечивается деятельностью по производству, обработке, хранению и распространению информации и знаний, причем в этой деятельности участвуют более половины занятого населения.

Информационные ресурсы – в широком смысле - совокупность данных, организованных для эффективного получения достоверной информации. (www.glossary.ru)

Информационные ресурсы – по законодательству РФ - отдельные документы и отдельные массивы документов, документы и массивы документов в информационных системах: библиотеках, архивах, фондах, банках данных, других видах информационных систем.

Информационный продукт (Information production; Information product) – документированная информация, подготовленная в соответствии с потребностями пользователей и представленная в форме товара. Информационными продуктами являются программные продукты, базы и банки данных и другая информация.

Информационный шум - семантический показатель качества поиска, рассчитывающийся как процентное отношение количества нерелевантных выданных системой документов к общему количеству выданных документов.

Рис. 12. Формула расчета полноты выдачи информации ,где:

a – множество релевантных и выданных системой документов;

б – множество нерелевантных но выданных системой документов;

в – множество релевантных, но не выданных системой документов.

Информация (informatio лат.), – сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представления, уменьшающие степень неопределенности, неполноту знаний.

Информография – наука, изучающая топологию распределения, особенности и доступность информационных ресурсов в мировом сообществе и в отдельных странах.

Информрегистр - государственный орган, учрежденный для регистрации баз данных.

Н

Научно-техническая информация - справочная информация и данные различных областей науки (физики, техники, медицины, педагогики, информатики и др.), а также профессиональная информация и т. д.

Негосударственные информационные ресурсы - ресурсы, принадлежащие физическим и юридическим лицам, созданные их за счет, приобретенные на законных основаниях, полученные в дар или в наследство.

О

Обязательные экземпляры — экземпляры различных видов тиражированных документов, подлежащие передаче производителями в соответствующие учреждения и организации в порядке и в количестве, установленных Федеральным законом.

П

Параметры информации – характеристики, с помощью которых оцениваются информационные ресурсы, например: содержание, охват источников, время получения, источники, качество, соответствие потребностям, способ фиксации, язык; стоимость.

Паук (S pider) – компонент поисковой системы, браузероподобная программа, которая скачивает веб-страницы.

Пертинентность - субъективно оцениваемое соответствие содержания документов информационным интересам потребителя.

Поисковые системы - совокупность программ, предназначенных для организации поиска информации в массивах документов.

Полнота выдачи информации - семантический показатель качества поиска, рассчитывающийся как процентное отношение количества релевантных и выданных системой документов к общему количеству релевантных выданных и не выданных системой документов (см. рис).

Рис. 13. Формула расчета полноты выдачи информации, где:

a – множество релевантных и выданных системой документов;

б – множество нерелевантных но выданных системой документов;

в – множество релевантных, но не выданных системой документов.

Поставщики информации - коммерческие структуры, государственные и общественные организации, частные лица, обычно именуемые информационными корпорациями, информационными агентствами, информационными службами, информационными центрами.

Потери информации - семантический показатель качества поиска, рассчитывающийся как процентное отношение количества не выданных системой релевантных документов к общему количеству релевантных выданных и не выданных системой документов.

Рис.14. Формула расчета потерь информации где:

a – множество релевантных и выданных системой документов;

б – множество нерелевантных но выданных системой документов;

в – множество релевантных, но не выданных системой документов.

Правовые основы работы с информацией – комплекс мер, определяющихся государственными законодательными актами, законами, положениями.

Р

Релевантность – объективно существующее смысловое соответствие между содержанием документа и запроса. Оценка устанавливается экспертным путем.

Рынок программного обеспечения - все виды программной продукции: коммерческие программные продукты; программы с открытым кодом.

Рынок систем сетевых коммуникаций - различные виды сетевых коммуникационных услуг: системы электронной почты; телеконференции; электронные сетевые доски объявлений (BBS); системы, объединяющие пользователей компьютеров .

Т

Точность выдачи информации - семантический показатель качества поиска, рассчитывающийся как процентное отношение количества релевантных выданных системой документов к общему количеству выданных документов релевантных и нерелевантных.

Рис.15. Формула расчета полноты выдачи информации

где:

a – множество релевантных и выданных системой документов;

б – множество нерелевантных но выданных системой документов;

в – множество релевантных, но не выданных системой документов.

Э

Эльзевир (Elsevier) — электронная библиотека научной информации. Собрание 24,6% всех опубликованных научных статей в мире на английском языке.

Ю

Юридическая информация – тексты законов, постановлений; нормативы и другая информация о правах, имеющие международное значение, государственное и местное.