5.2 Структурированные текстовые данные
Другим видом информационных ресурсов/источников являются источники структурированных текстовых данных, в том числе — формализованный текст, таблицы, базы и хранилища данных, предоставляющие возможности поиска и фильтрации данных в таблицах, организации виртуальных таблиц и витрин данных. Этот тип ресурсов обладает своей спецификой, поскольку для интерпретации данных, как правило, требуются двухуровневые модели интерпретации: потребитель данных должен располагать моделью организации данных (логических связей между таблицами и записями), а также моделью предметной области, в то время как для обычного текста достаточно только второго класса моделей. Более того, коммерчески распространяемые базы данных, как правило, представляют собой неоперативный источник информации, структурированный в соответствии с представлениями поставщика о потребностях клиентов. То есть, эти информационные продукты не всегда адаптированы к реальным потребностям и часто содержат устаревшую или неполную информацию. По этой причине, большинство организаций, осуществляющих функции ИАО субъектов управления в некоторой области деятельности создают свои собственные базы данных, в большей степени отражающие их информационные потребности.
В связи с этим, чрезвычайно важным фактором, определяющим успешность применения созданной базы данных, является структура описаний (совокупность атрибутов, используемых для описания объектов учета). Если структура описаний не обеспечивает тех возможностей, которые необходимы потребителю для производства работ с ресурсами базы данных, то из эффективного инструмента информационной работы база данных превращается в кладбище данных, где на покосившихся крестах и памятниках давно повыцвели надписи. Уже на уровне структуры описаний должны быть учтены особенности технологии обработки информации, структура деловых процессов, возможности дальнейшего наращивания комплекса средств автоматизации, возможность востребования данных и без применения специализированных интерфейсов (программ иных, нежели программы системы управления базами данных) и так далее. В противном случае, в какой-то момент времени, когда очередная смена технологии потребует заменить интерфейсное программное обеспечение, вам придется проводить на заслуженный отдых не только эти программы, но и все те данные, которые были накоплены за годы работы вашей организации.
Вопросу атрибуции данных мы посвятим отдельный подраздел в данной главе. При этом мы не будем затрагивать проблему синтеза классификаций, которые используются для декомпозиции некоторой системы или предметной области на классы сущностей, описываемых набором атрибутов — эти вопросы подробно рассматриваются в специализированной литературе, посвященной вопросам теории баз данных, их проектирования, организации процесса проектирования и создания86. При рассмотрении вопросов, связанных с атрибуцией данных, наше внимание будет сосредоточено на проблеме создания специфических баз данных — баз данных, предназначенных для хранения первичных материалов ИАР (сообщений) и описания источников информации, адаптированных к решению задач автоматизированного анализа ситуаций.
Однако, прежде, чем перейти к рассмотрению этого блока вопросов, рассмотрим специфику структурированных источников информации.
Мы уже указали на необходимость использования для работы со структурированными данными двухуровневых моделей интерпретации, а именно — модели организации данных (метаданных или метамодели). Располагая такой моделью, аналитик получает уникальную возможность получения специализированных массивов данных, отражающих состояние некоторого атрибута объекта анализа. В том числе, благодаря наличию структурной организации, может быть легко получен упорядоченный во времени массив численных значений некоторого параметра системы или процесса, или, наоборот — мгновенный срез состояния системы, образованный совокупностью измерений всех ее параметров.
В этом смысле, база данных представляет собой уникальный источник информации, использование которого в сочетании со средствами автоматизации ИАР способно многократно повысить продуктивность труда аналитика. Характерно, что большинство технических средств сбора информации, выражающих результаты в символьном виде, способно служить источниками только таких — специализированных данных. Как следствие, методологическое обеспечение систем анализа структурированных и числовых параметрических данных во многом совпадает. Даже в случае, когда в качестве параметров используются естественно-языковые термины, они могут рассматриваться как численные оценки значения атрибута, между которыми могут быть установлены те или иные отношения (порядка, величины, объема понятия и т. д.). В результате для обработки таких данных могут быть (хоть и с некоторыми изменениями) применены пакеты автоматизированной статистической обработки данных наблюдений, системы математического моделирования и иные программные средства, располагающие широкими возможностями для проведения статистических исследований, анализа временных рядов, спектрального анализа и так далее.
По существу, одной из задач информационной работы и является построение именно такого, структурированного ресурса для «внутреннего потребления» субъектом ИАР. Однако на пути к этому необходимо решить целый ряд сложных проблем, связанных с переходом от символьных данных произвольной семантики к символьным данным специальной семантики, обладающих метризованным словарем. Здесь, в частности, используются методы нечетких множеств, многозначной и нечеткой логики (работы А. Лукасевича, Л. Заде и их последователей).
- Оглавление
- К читателю
- Введение
- Глава I сущность, структура и задачи аналитики
- 1 Понятие и сущность аналитики
- 2 Структура, задачи и место аналитики в современных интеллектуальных технологиях
- 3 Аналитика как средство добывания знаний
- 4 Понятийный аппарат аналитики
- Глава II. Методология аналитической деятельности
- 1 Основные методологические системы
- 1.1 Философия, логика, семиотика
- 1.2 Естественнонаучные концепции
- 1.3 Кибернетика и системный анализ
- 1.4 Гуманитарные науки
- 1.5 Теоретические основы системного анализа как методологического ядра аналитики
- 2 Методы формализации предметной области и моделирование
- 2.1 Понятие сложной системы
- 2.2 Моделирование как метод познания
- 2.3 Вербальные или понятийные модели
- 2.4 Логико-лингвистические и семиотические модели и представления
- 2.5 Логические модели
- 2.6 Статистические, теоретико-вероятностные модели
- 2.7 Аналитические модели
- 2.8 Имитационные модели
- 3 Аналитика как интерфейс между теорией и практикой
- 3.1 Методы активизации мышления
- 3.2 Методы структурирования информации
- 3.3 Методы обработки и анализа числовых данных
- Глава III принципы организации аналитической деятельности
- 1 Ситуация в россии, проблемы и задачи информационно-аналитического обеспечения
- 2 Задачи и определение иао
- 3 Субъект информационно-аналитической работы
- 3.1 Противоречия в сфере организации иар
- 3.2 Организационные формы субъектов иар
- 3.3 Серединный путь?
- 3.4 Системы, управляемые потоком событий
- 4 Целеполагание в организационных системах
- 4.1 Базовые утверждения и определения
- 4.2 Модель иерархии целей
- 5 Методики социальных технологий а.А. Шияна
- 5.1 Теоретические основы социальных технологий
- 5.2 Человек (эксперт-аналитик) как двухкомпонентный абстрактный информационный автомат
- 6 Требования к организации информационно-аналитического обеспечения управленческой деятельности
- 7. Разработка организационной структуры аналитического подразделения
- Глава IV аналитические технологии
- 1 Противоречия в сфере развития средств автоматизации и информатизации иар
- 2 Технологический цикл иар
- 3 Первичная обработка имеющихся данных и анализ модельной информации
- 4 Поиск, отбор и экспресс-анализ данных
- 5 Работа с источниками текстовой информации
- 5.1 Неструктурированные текстовые данные
- 5.2 Структурированные текстовые данные
- 5.3 Взаимные преобразования различных типов данных
- 5.4 Анализ информативности источников
- 5.5 Проблема активной фильтрации сообщений
- 6 Аналитический режим потребления информации
- 6.1 Акт коммуникации и ошибки интерпретации
- 6.2 Управление элементами модели мира
- 6.3 Режимы восприятия информации
- 7 Атрибуция сообщений
- 8 Выявление неполноты, противоречивости и недостоверности информации
- 8.1 Логико-лингвистические средства анализа достоверности
- 8.2 Нетекстовые модели как инструмент верификации данных
- 9 Средства автоматизации иар
- 9.1 Средства сбора информации
- 9.2 Средства хранения данных
- 9.3 Экспертные системы
- 9.4 Системы искусственного интеллекта и интеллектуального анализа данных
- 9.5 Средства структурирования и визуализации данных. Электронные помощники аналитика
- 9.6 Системы гибридного интеллекта
- 9.7 Средства снижения размерности массива измерений
- 9.8 Инструментальные средства представления и доведения результатов иар
- Глава V аналитика как взвешенный подход к разработке и оцениванию управленческих решений
- 1 Проблема принятия решений
- 2 Разработка и анализ управленческих решений
- 2.1 Образование, карьера и лицо, принимающее решение
- 2.2 Концептуализация проблемы
- 2.3 Оценивание эффективности
- 2.4 Технологии прогнозирования
- 3 Методика выявления неформальных управляющих структур (центров сил) в регионах россии
- 3.1 Проблемы и противоречия в регионах россии как следствие борьбы центров сил
- 3.2 Введение в концептуальную систему
- 3.3 Методики проведения исследований
- 3.4 Экспертная система социально-экономического мониторинга, основанная на концепции центров сил
- 3.5 Показатели и алгоритмы выявления центров сил
- Заключение
- Список литературы
- Вариант организации процесса перспективного планирования на примере плана usaf-2025
- Примеры применения методик социальных технологий
- Пример аналитического разбора сообщения
- Глоссарий
- Список используемых сокращений