5.3 Взаимные преобразования различных типов данных
Структурированные текстовые данные занимают промежуточную ступень между численными и естественно-языковыми данными. К этому виду могут быть приведены практически любые числовые данные, при этом речь идет не о преобразовании записи числа из системы цифровой записи в запись с помощью числительных натурального языка, а реальной трансляции числа в термин. Примером такого преобразования может выступать преобразование числовых данных «длина отражаемой или излучаемой объектом волны светового колебания» в текстовые данные типа «цвет объекта» и тому подобные. При этом используются не только значения величин, но и производные первого и второго порядков, результаты интегрирования, вычисления дискретной суммы и тому подобных вычислительных процедур.
Инструментом выполнения таких преобразований служат модели трансляции, задачей которых является установление взаимно однозначного соответствия между параметром (группой параметров) и термином на основе объективных критериев. В наглядной интерпретации процесс трансляции данных с частной семантикой (областью определения терминов знаковой системы) к виду данных универсальных знаковых систем может быть представлен так, как это сделано на рисунке, приведенном ниже.
Рисунок 4.1 — Графическое представление процесса трансляции.
Графическая интерпретация процесса трансляции иллюстрирует частный случай применения модели трансляции для преобразования данных, отображающих процесс, характеризующийся одним параметром, в совокупность терминов четырех классов: имена (имя процесса, имя параметра, имя состояния, предикат и характеристика предиката). С помощью подобной модели трансляции могут быть получена следующая совокупность высказываний: «Процесс (имя) пребывает в состоянии (Т1). Значение параметра (имя параметра) (характеристика крутизны Д1, наречие) (предикат П1, глагол)». Усложнение подобной модели трансляции может позволить формировать и более сложные высказывания, но это потребует усложнения тезауруса. Однако уже в таком виде при использовании системы координат параметр/время высказывания будут содержать существительные, наречия и глаголы.
Введение в модель трансляции иерархического тезауруса, позволяет использовать шкалу уровня абстракции, с помощью которой потребитель сообщений сможет управлять степенью детализации информации. Например, нормализованный иерархический тезаурус, состоящий из трех уровней, позволяет описывать некоторое состояние параметра (имя параметра) в терминах, определенных на трех уровнях иерархии. Термин «нормализованный» в применении к этому тезаурусу указывает на то, что между термином и состоянием может быть установлено взаимно однозначное соответствие, то есть, ни в одном высшем уровне абстракции не существует такого термина, границы области определения которого не совпадают с одной из границ области определения терминов низшего уровня. В языках естественного общения такое требование в большинстве случаев не выполняется (до тех пор, пока для решения задач практической деятельности такой термин не будет введен и не заместит общеупотребительный термин).
Модели трансляции в принципе могут быть построены для любой предметной области, для которой в языке естественного общения существует разработанная терминология, которая может быть спроецирована на пространство формальных признаков (модель фрагмента реальности). К числу предметных областей поддающихся трансляции в терминологическую систему относится, в том числе, и пространственная семантика. В частности, этот принцип используется в географии при именовании объектов, размещение которых может быть отображено на некоторой модели.
Большим преимуществом структурированных текстовых данных перед неструктурированными тестовыми данными является возможность их перевода к графическому представлению, которое, как известно, способно стимулировать мыслительную деятельность, а также позволяет в сжатом виде выразить большое количество информации. То есть, модели трансляции могут использоваться и для обратного преобразования, однако точность такого преобразования довольно низка и определяется количеством терминов, включенных в состав модели трансляции. При этом существует проблема совместимости тезауруса источника и модели трансляции.
Благодаря своим уникальным свойствам модели трансляции являются весьма полезным инструментом при работе как с текстами различной тематики, так и при работе с источниками числовых и структурированных данных.
- Оглавление
- К читателю
- Введение
- Глава I сущность, структура и задачи аналитики
- 1 Понятие и сущность аналитики
- 2 Структура, задачи и место аналитики в современных интеллектуальных технологиях
- 3 Аналитика как средство добывания знаний
- 4 Понятийный аппарат аналитики
- Глава II. Методология аналитической деятельности
- 1 Основные методологические системы
- 1.1 Философия, логика, семиотика
- 1.2 Естественнонаучные концепции
- 1.3 Кибернетика и системный анализ
- 1.4 Гуманитарные науки
- 1.5 Теоретические основы системного анализа как методологического ядра аналитики
- 2 Методы формализации предметной области и моделирование
- 2.1 Понятие сложной системы
- 2.2 Моделирование как метод познания
- 2.3 Вербальные или понятийные модели
- 2.4 Логико-лингвистические и семиотические модели и представления
- 2.5 Логические модели
- 2.6 Статистические, теоретико-вероятностные модели
- 2.7 Аналитические модели
- 2.8 Имитационные модели
- 3 Аналитика как интерфейс между теорией и практикой
- 3.1 Методы активизации мышления
- 3.2 Методы структурирования информации
- 3.3 Методы обработки и анализа числовых данных
- Глава III принципы организации аналитической деятельности
- 1 Ситуация в россии, проблемы и задачи информационно-аналитического обеспечения
- 2 Задачи и определение иао
- 3 Субъект информационно-аналитической работы
- 3.1 Противоречия в сфере организации иар
- 3.2 Организационные формы субъектов иар
- 3.3 Серединный путь?
- 3.4 Системы, управляемые потоком событий
- 4 Целеполагание в организационных системах
- 4.1 Базовые утверждения и определения
- 4.2 Модель иерархии целей
- 5 Методики социальных технологий а.А. Шияна
- 5.1 Теоретические основы социальных технологий
- 5.2 Человек (эксперт-аналитик) как двухкомпонентный абстрактный информационный автомат
- 6 Требования к организации информационно-аналитического обеспечения управленческой деятельности
- 7. Разработка организационной структуры аналитического подразделения
- Глава IV аналитические технологии
- 1 Противоречия в сфере развития средств автоматизации и информатизации иар
- 2 Технологический цикл иар
- 3 Первичная обработка имеющихся данных и анализ модельной информации
- 4 Поиск, отбор и экспресс-анализ данных
- 5 Работа с источниками текстовой информации
- 5.1 Неструктурированные текстовые данные
- 5.2 Структурированные текстовые данные
- 5.3 Взаимные преобразования различных типов данных
- 5.4 Анализ информативности источников
- 5.5 Проблема активной фильтрации сообщений
- 6 Аналитический режим потребления информации
- 6.1 Акт коммуникации и ошибки интерпретации
- 6.2 Управление элементами модели мира
- 6.3 Режимы восприятия информации
- 7 Атрибуция сообщений
- 8 Выявление неполноты, противоречивости и недостоверности информации
- 8.1 Логико-лингвистические средства анализа достоверности
- 8.2 Нетекстовые модели как инструмент верификации данных
- 9 Средства автоматизации иар
- 9.1 Средства сбора информации
- 9.2 Средства хранения данных
- 9.3 Экспертные системы
- 9.4 Системы искусственного интеллекта и интеллектуального анализа данных
- 9.5 Средства структурирования и визуализации данных. Электронные помощники аналитика
- 9.6 Системы гибридного интеллекта
- 9.7 Средства снижения размерности массива измерений
- 9.8 Инструментальные средства представления и доведения результатов иар
- Глава V аналитика как взвешенный подход к разработке и оцениванию управленческих решений
- 1 Проблема принятия решений
- 2 Разработка и анализ управленческих решений
- 2.1 Образование, карьера и лицо, принимающее решение
- 2.2 Концептуализация проблемы
- 2.3 Оценивание эффективности
- 2.4 Технологии прогнозирования
- 3 Методика выявления неформальных управляющих структур (центров сил) в регионах россии
- 3.1 Проблемы и противоречия в регионах россии как следствие борьбы центров сил
- 3.2 Введение в концептуальную систему
- 3.3 Методики проведения исследований
- 3.4 Экспертная система социально-экономического мониторинга, основанная на концепции центров сил
- 3.5 Показатели и алгоритмы выявления центров сил
- Заключение
- Список литературы
- Вариант организации процесса перспективного планирования на примере плана usaf-2025
- Примеры применения методик социальных технологий
- Пример аналитического разбора сообщения
- Глоссарий
- Список используемых сокращений