7. Модели описания баз данных
Модель данных описывает набор базовых признаков, которыми должны обладать все конкретные СУБД и управляемые ими базы данных. База данных оперирует с различными объектами (сущностями), какими, к примеру, могут быть:
-
покупатель (атрибуты: название, адрес, телефон, факс, ИНН, расчетный счет, корреспондентский счет);
-
номенклатура (атрибуты: название, единица измерения, группа номенклатуры);
-
документ (атрибуты: тип документа, номер документа, дата выписки);
-
банк (атрибуты: БИК, название, адрес);
-
банковский счет (атрибуты: грузополучатель и его адрес, плательщик, наименование товара, единица измерения, количество, цена, сумма, НДС);
-
кладовщик (атрибуты: фамилия, имя, отчество, табельный номер, подразделение);
-
операция (атрибуты: документ, номенклатура, материал, количество, цена за единицу, налог, счет по дебету, счет по кредиту, от кого, кому, вид операции, примечание — расшифровка смысла операции).
Типы объектов предприятия, для управления которыми создается информационная технология, изменяются во времени достаточно редко, поэтому и структура данных для этих объектов достаточно стабильна. По этой причине возможно построение информационной базы с постоянной структурой и изменяемыми значениями данных. Взаимосвязи между логическими записями и элементами базы данных классифицируются по следующим видам:
-
«один к одному», когда одна запись может быть связана только с одной записью;
-
«один ко многим», когда одна запись взаимосвязана со многими другими;
-
«многие ко многим», когда одна и та же запись может входить в отношения со многими другими записями в различных вариантах.
Названные варианты взаимосвязей определяют три основные модели баз данных.
Иерархическая модель предполагает использование для описания базы данных древовидных структур, состоящих из определенного числа уровней. «Дерево» представляет собой иерархию элементов, называемых узлами. В качестве примера простой иерархической структуры можно привести административную структуру высшего учебного заведения, элементам которой являются: «Университет» — Факультет» — «Группа».
На каждом уровне иерархии данной структуры могут быть использованы различные атрибуты. Например, атрибутами третьего уровня (Группа) могут быть: специализация группы, численный состав, фамилия старосты группы и другие. В данной модели имеется корневой узел или просто корень — «Университет», который находится на самом верхнем уровне иерархии, а потому не имеет узлов, стоящих выше его. Каждый узел модели имеет только один исходный, находящийся по отношению к нему на более высоком уровне корень. На последующих уровнях классификации он может иметь один, два или большее количество узлов, либо не иметь их вообще.
Принципы построения иерархической структуры:
-
иерархия всегда начинается с главного узла;
-
главный узел называется корневым или просто корнем, причем одно дерево может иметь только один корень;
-
узел может содержать один или несколько атрибутов, описывающих находящийся в нем объект;
-
порожденные узлы могут встраиваться в «дерево» как в горизонтальном так и в вертикальном направлении;
-
доступ к порожденным узлам возможен только через исходный узел, поэтому существует только один путь доступа к каждому узлу.
Достоинством модели является наличие промышленных систем управления базами данных, поддерживающих ее, простота понимания принципа иерархии. Однако такая система обладает жесткой, заранее задаваемой структурой, что не позволяет осуществлять классифицирование объектов по не предусмотренным ее схемой признакам. Иерархия усложняет операции включения информации о новых объектах и удаления устаревшей информации из базы данных, что затрудняет использование системы.
Сетевая модель описывает данные и отношения между ними в виде ориентированной сети. Такая модель представляется в виде диаграммы связей, когда каждый порожденный элемент в отношениях имеет более одного исходного и может быть связан с любым другим элементом структуры. Например, в структуре управления учебным заведением порожденный элемент «Студент» может иметь не один, а два исходных элемента: «Студент» — «Учебная группа» и «Студент» — «Комната в общежитии».
Сетевые структуры могут быть многоуровневыми и иметь разную степень сложности. База данных, описываемая сетевой моделью, состоит из областей, каждая из которых состоит из записей, а последние — из полей. Недостатком сетевой модели является ее сложность, возможность потери независимости данных при реорганизации базы данных, возможность нарушения логического представления данных при росте базы данных.
Реляционная модель имеет в своей основе понятие «отношения», и ее данные формируются в виде таблиц. Реляционная база данных воспринимается ее пользователем как совокупность таблиц, каждая из которых имеет свое название. Например, одна таблица может представлять номенклатуру поставляемых материалов, вторая — поставщиков соответствующих материалов, третья — связывать две таблицы и отражать особенности поставки. Минимальным объектом действий, сохраняющим структуру таблицы, является строка таблицы (кортеж), состоящая из ячеек таблицы (полей). Каждый столбец таблицы соответствует только одной компоненте этого отношения. С логической точки зрения реляционная база данных представляется множеством двумерных таблиц различного предметного наполнения.
Достоинства реляционной модели: простота построения, доступность понимания, возможность эксплуатации базы данных без знания методов и способов ее построения, независимость данных, гибкость структуры и другие. Недостатки модели: низкая производительность по сравнению с иерархической и сетевой моделями, сложность программного обеспечения, избыточность. В зависимости от содержания отношения реляционной базы данных бывают объектными и связными. Первые хранят данные о каком-либо одном объекте сущности. В них один из атрибутов однозначно определяет объект и называется ключом отношения или первичным атрибутом (для удобства он записывается в первом столбце таблицы). Остальные атрибуты функционально зависят от этого ключа. В объектном отношении не может быть дублирующих объектов и в этом — основное ограничение реляционной базы данных. Вторые хранят ключи нескольких объектных отношений, по которым между ними устанавливаются связи.
Ограничения на отношения реляционной базы данных:
-
каждый элемент таблицы представляет собой один элемент данных;
-
в отношении не может быть одинаковых первичных ключей;
-
все строки таблицы должны иметь одну и ту же структуру, т.е. одно и то же количество атрибутов с соответственно совпадающими именами;
-
в таблице не может быть двух или более одинаковых строк;
-
столбцам таблицы присваиваются уникальные имена;
-
имена столбцов должны быть различными, а их значения — одинаковыми;
-
в операциях с таблицей все строки и столбцы могут просматриваться в любом порядке и в любой последовательности.
Нормализация отношений базы данных
Данные, представленные в виде дерева или сети, могут быть свернуты в двумерные таблицы. Такое преобразование называется нормализацией. Задача нормализации отношений состоит в том, чтобы выделить набор отношений, в котором отсутствуют аномалии, связанные с включением новых записей, их удалением и корректировкой. Теория нормализации оперирует с пятью нормальными формами, предназначенными для уменьшения избыточности информации. При этом каждая последующая форма удовлетворяет требованиям предыдущей. При практическом проектировании базы данных четвертой и пятой нормальных форм, как правило, не используются.
Объектно-ориентированные базы данных объединяют в себе две модели данных — реляционную и сетевую и используются для создания крупных баз данных со сложными структурами данных.
Visual FoxPro 5.0 представляет собой СУБД реляционного типа с развитыми средствами создания базы данных, организации запросов к ним, построения приложений с использованием визуального, объектно-ориентированного программирования. СУБД может работать в среде Windows-95 и Windows NT. В ней реализованы все атрибуты реляционной СУБД, система обладает высокой скоростью обслуживания базы данных, позволяет работать с данными в формате СУБД Access, Paradox, dBase, с серверами базы данных Microsoft SQL Server Oracle и другими. Приложение Visual FoxPro может работать одновременно как с собственными, так и с сетевыми таблицами, расположенными на на других компьютерах локальной сети.
Автоматизированный банк документов
Банки документов иначе называются документальными информационно-поисковыми системами, объектами хранения в которых являются либо сами документы, либо извлекаемые из них факты. Соответственно и сам информационный поиск подразделяется на документальный и фактографический. Целью документального поиска является нахождение документов, соответствующих запросу пользователя, и выдача по назначению либо самих документов, либо сведений о них. Целью информационного поиска является поиск не документов или сведений о них, а непосредственно запрашиваемых фактов, содержащихся в документах.
Работа банков документов может быть организована в двух режимах — в режиме избирательного распределения информации или в режиме ретроспективного поиска. В первом случае обеспечивается текущее информирование пользователей о новых поступлениях документов, периодически производится поиск в массиве новых поступлений в соответствии с их запросами. Во втором случае обеспечивается справочное обслуживание пользователей по разовым запросам путем поиска необходимых документов в долговременном массиве документов.
Структура автоматизированного банка документов:
-
массивы документов, текстов либо фактов, выступающих в качестве объектов поиска;
-
информационно-поисковый язык, предназначенный для отображения содержания документов и запросов пользователей для последующего осуществления запроса;
-
алгоритмы и методы индексирования, позволяющие перевести содержание документов и запросов с естественного языка на информационно-поисковый язык;
-
алгоритмы и методы поиска документов, соответствующие запросу и задаваемые в виде критерия соответствия;
-
комплекс программных и технических средств, предназначенных для реализации процессов накопления, хранения и поиска документов;
-
специалисты, обеспечивающие функционирование банка документов.
Информационно-поисковые языки
Информационно-поисковый язык является важным составляющим элементом информационной базы банка документов. Различают языки классификационные, дескрипторные, комбинированные. Целесообразность применения того или иного языка зависит от назначения информационной системы и степени ее оснащенности техническими средствами. Для описания документов в библиотеках, архивах, в центрах научно-технической информации обычно применяют классификационные языки. В автоматизированных информационно-поисковых системах используются преимущественно дескрипторные языки.
Требования к информационно-поисковым языкам:
-
однозначность — каждая запись, сделанная с использованием соответствующего языка, должна иметь только один смысл, и наоборот, любой смысл должен получать единообразное представление в определенном информационно- поисковом языке;
-
удобство пользования языком;
-
компактность записей;
-
открытость языка поиска — возможность его пополнения и корректировки.
Автоматизированный банк знаний
Знания являются обязательным элементом, определяющим эффективность функционирования любой системы искусственного интеллекта. С одной стороны, знания — это особая форма информации, а с другой — это особая система отношений.
Под автоматизированным банком знаний понимается хранилище информации (знаний), имеющее в своем составе интеллектуальный интерфейс, обеспечивающий непосредственное взаимодействие пользователей с вычислительной системой. В этом состоит отличие банка знаний от банков данных и документов, которые, хотя и отличаются друг от друга по принципам функционирования, но схожи в том, что предполагают взаимодействие с посредником (например, программистом-аналитиком). В таких системах сам пользователь от ЭВМ удален, а вовлечение посредников в процесс решения задач приводит к снижению эффективности основной работы пользователя, увеличению времени ожидания решения, ошибкам и искажениям в постановке задачи.
В базе знаний функции такого посредника выполняет интеллектуальный интерфейс — специальный программно-алгоритмический комплекс, который призван автоматизировать функции, выполняемые аналитиком (функцию понимания сущности поставленной задачи и представления полученных результатов решения в удобном для восприятия виде).
Для реализации названных функций интеллектуальный интерфейс должен быть обеспечен:
-
знаниями о закономерностях, существующих в предметной области и позволяющих выводить новые факты, имеющие место в данном состоянии предметной области, но не зафиксированные в базе данных в явном виде;
-
знаниями о предметной среде, в которой работает конечный пользователь;
-
знаниями о структуре и содержании базы данных;
-
лингвистическими знаниями, обеспечивающими понимание входного языка.
Знания отличаются:
-
внутренней интерпретируемостью, вместе с информацией в базе знаний представлены информационные структуры, позволяющие не только хранить знания, но и использовать их;
-
структурированностью, обеспечивающей декомпозицию сложных объектов на более простые и установление связей между ними;
-
связанностью, отражающей закономерности относительно фактов, процессов, явлений и причинно-следственных отношений между ними;
-
активностью, предполагающей целенаправленное использование информации, способность управлять информационными процессами решения задач.
В совокупности названные свойства обеспечивают возможность интеллектуальной системы моделировать рассуждения человека при решении прикладных задач.
Представление знаний
Система представления знаний — это совокупность средств; позволяющих описывать знания о предметной области с помощью языка представления знаний, организовывать хранение знаний, вводить новые знания и выводить новые знания из имеющихся, находить требуемые знания, устранять устаревшие, осуществлять интерфейс между пользователем и знаниями.
Центральное место в системе представления знаний занимает язык представления знаний, возможности которого определяются лежащей в его основе моделью представления знаний. Такие модели могут быть универсальными, применимы, ми для большинства программ, или специализированными, разрабатываемыми для конкретного программного обеспечения. Моделями представления знаний являются: семантические сети, фреймы, продукционные системы, логические модели.
Взаимодействие пользователя с банками информации
Взаимодействие пользователя с банками информации осуществляется посредством информационных языков и языков запросов.
Информационные языки — это искусственные языки, являющиеся основным средством представления информации для ввода, хранения, поиска и обработки и предназначенные для записи семантической информации с целью последующего ее использования в различных системах. Информационный язык должен:
-
однозначно представлять информацию на лексическом и грамматическом уровне, так как различная трактовка в представлении данных неизбежно приведет к искажению информации;
-
иметь достаточную для решения задач степень полноты и детализации представления информации, подлежащей хранению и обработке. Документальная автоматизированная база данных создается под круг интересов пользователей и при этом безразлично, каковы состав и глубина описаний сведений, которые пользователь будет извлекать из найденного документа. Фактографический автоматизированный банк данных создается под задачи, решаемые на основе хранимой в нем информации, и они определяют набор хранимых сведений и глубину их описания;
-
быть ориентированным на пользователя-непрограммиста, максимально опираться на элементы привычного для него естественного языка;
-
обеспечивать стандартное описание однотипных элементов информации и высокую надежность идентификации описаний. Если одни и те же сведения, поступающие в базу данных, будут описаны по-разному, они будут рассматриваться как различные и храниться раздельно, что приведет к избыточности данных. Кроме того, банк данных не сможет осуществлять обобщение сведений, относящихся к одному и тому же объекту;
-
допускать возможность внесения изменений и дополнений без изменения основ языка. Необходимость изменения языка определяется как непрерывным совершенствованием задач, так и введением новых задач, которые могут повлечь за собой расширение состава и глубины описания фактов.
Языки запросов (языки общения) включают не только средства описания фактов, но и средства, указывающие, какую именно обработку отобранных фактов следует провести, какие элементы описаний и в какой форме следует выдавать. С автоматизированным банком данных взаимодействуют источники и пользователи информации (внешние пользователи) и персонал банка данных (внутренние пользователи). Источниками информации могут быть конкретный работник, техническое устройство, взаимодействующая с банком данных система, которые передают автоматизированному банку сведения, предназначенные для корректировки хранимых в нем данных.
Потребители информации посылают в систему различного вида запросы, которые должны быть гибкими и позволять пользователю просматривать данные так, как это ему необходимо. Запрос содержит следующие обязательные элементы: категорию срочности, номер, указатель отбора, указатель обработки, код пользователя, адрес ответа, указатель выдачи. От автоматизированного банка данных к пользователю поступают сообщения сигнального информирования, сообщения о неправильно составленных запросах с отметкой о месте ошибки. Сообщение, содержащее ответы на запросы пользователя, содержит обязательные элементы: категорию срочности, номер или содержание запроса, ответ на запрос, время выдачи ответа.
Автоматизированное рабочее место (АРМ)
Автоматизированное рабочее место (АРМ) это совокупность информационно -программно-технических ресурсов, обеспечивающую конечному пользователю обработку данных и автоматизацию управленческих функций в конкретной предметной области.
Создание АРМ предполагает, что основные операции по накоплению, хранению и переработке информации возлагаются на вычислительную технику, а экономист выполняет часть ручных операций, требующих творческого подхода при подготовке управленческих решений.
АРМ как инструмент управленческой деятельности создается для обеспечения выполнения некоторой группы функций. Наиболее простой функцией является информационно-справочное обслуживание.
АРМ имеют проблемно-профессиональную ориентацию на конкретную предметную область. Часто они выполняют роль рабочих станций в локальных сетях. АРМ выполняют децентрализованную одновременную обработку экономической информации в составе распределенной базы данных. При этом они имеют выход на ПЭВМ и базы данных других пользователей, обеспечивая их совместное функционирование в процессе коллективной обработки информации.
Создание АРМ на базе персональных компьютеров обеспечивает:
-
простоту, удобство и дружественность по отношению к пользователю,
-
простоту адаптации к конкретным функциям пользователя,
-
компактность размещения и невысокие требования к условиям эксплуатации,
-
высокую надежность и живучесть,
-
сравнительно простую организацию технического обслуживания.
Контрольные вопросы
-
Каково назначение первичных документов?
-
Чем объясняется информационная важность и значимость документа?
-
Как классифицируются используемые документы?
-
Дайте определение документооборота.
-
Как обрабатываются документы, поступившие в организацию.
-
Какую обработку проходят документы, отправляемые из организации?
-
В чем отличия российской и западной технологий работы с документами?
-
Назовите направления автоматизации документооборота.
-
Назовите наиболее известные системы автоматизации документооборота.
-
Перечислите функциональные возможности систем автоматизации документооборота.
-
Каким образом система «Евфрат» способна повысить исполнительскую дисциплину сотрудников?
-
Что позволяет системе «Евфрат» обеспечить информационную безопасность?
-
Назовите дополнительные возможности системы.
-
Какая из названных моделей документооборота наиболее распространена?
-
В чем достоинства полной модели документооборота?
-
По каким направлениям совершенствуются системы управления документами?
-
Назовите категории существующих стандартов.
-
Дайте определение автоматизированного банка данных.
-
В чем преимущества работы с банком данных?
-
Как классифицируются СУБД?
-
Назовите функции СУБД.
-
Каковы перспективы развития СУБД?
-
Как осуществляется общение между прикладной программой и СУБД?
-
Для чего предназначен язык манипулирования данными?
-
Каковы функции автономных языков конечных пользователей?
-
Дайте определение базы данных.
-
Назовите требования к базе данных.
-
Назовите модели описания баз данных.
-
Перечислите достоинства и недостатки иерархической модели.
-
Что составляет основу реляционной модели?
-
В чем отличия банка знаний от банка данных и банка документов?
-
Какова цель представления знаний?
-
Назовите требования, предъявляемые к информационным языкам.
-
Каковы обязательные элементы ответа на запрос?
-
Что является объектом хранения в банках документов?
-
Каковы режимы функционирования банков документов?
- 1. Организационно-методический раздел
- Цель преподавания дисциплины
- Задачи изучения дисциплины
- Место дисциплины в профессиональной подготовки специалистов
- Объем часов по видам занятий и контроль по формам обучения
- 2. Тематический план учебной дисциплины
- 3. Содержание дисциплины
- 3.1. Темы лекций и их краткое содержание Лекция 1. Налоговая информация и информационные процессы в налоговой сфере.
- Содержание дисциплины
- 1. Содержание дисциплины:
- 2. Структура аттестационных педагогических измерительных материалов:
- 3. Информация и информационные процессы в налоговой сфере.
- Лекция 2. Понятие, концепции, проблемы налоговых информационных систем; роль и место информационных систем в деятельности налоговых органов, основные принципы их построения и использования.
- 1. Понятие «Система» и ее свойства
- 2. Определение автоматизированной информационной системы.
- 3. Классификация информационных систем
- 4. Основные элементы информационной системы
- 5. Понятие и функции информационной технологии
- 6. Классификация информационных технологий
- 7. Тенденции развития информационных технологий
- 8. Роль и место информационных систем в деятельности налоговых органов
- 9. Роль и место ис в деятельности налоговых органов
- 10. Основные принципы создания ис
- Лекция 3. Структура налоговых информационных систем: функциональные и обеспечивающие подсистемы.
- Назначение и функции подсистем. Характеристика функциональных задач, решаемых в органах налоговой службы.
- Содержание правового, эргономического, организационного, математического, лингвистического, информационного обеспечения.
- 3. Понятие технического обеспечения системы. Состав комплекса технических средств аис и его характеристика. Критерии выбора средств технического обеспечения
- Лекция 4. Особенности документооборота в налоговых органах; организация баз данных; создание и функционирование информационного хранилища; автоматизированное рабочее место налогового инспектора.
- Назначение и классификация документов.
- Реквизиты документов.
- Организация документооборота.
- Системы автоматизации документооборота.
- Понятие и структура автоматизированного банка данных.
- 6. Классификация и функции субд
- 4. Понятия и требования к базе данных
- 7. Модели описания баз данных
- 3.2. Темы практических занятий и их краткое содержание Практическое занятие 1. Современные средства проектирования информационных систем налоговых органов.
- 1 Стадия – предпроектное обследование:
- 2 Стадия – проектирование:
- 3 Стадия – ввод системы в действие:
- 4 Стадия – промышленная эксплуатация:
- Содержание, организация и результаты выполнения этапов проектирования.
- Раздел 2. Требования к комплексу технических средств и системному программному обеспечению.
- Раздел 3. Требования к квалификации пользователей
- Практическое занятие 2. Интеллектуальные технологии и системы в деятельности налоговых органов
- 1. Предметные области для экспертных систем
- 2.Обобщенная структура экспертной системы. Основные понятия и определения
- 3. Классификация экспертных систем
- 4. Инструментальные средства построения экспертных систем
- Обзор современных программных продуктов, поддерживающих технологию экспертных систем в экономике
- Практическое занятие 3. Сертификация и оценка качества информационных систем.
- Оценка качества ис с точки зрения функциональной полноты, эффективности сопровождения, гибкости программ.
- 2 Сущность, содержание и средства информационной поддержки системы.
- Практическое занятие 4. Обеспечение безопасности защиты информационных систем.
- 1. Виды угроз безопасности ис и ит
- 2. Методы и средства зашиты информации
- 3. Криптографические методы зашиты информации
- 4. Зашита информации в корпоративных сетях ис управления
- 5. Этапы разработки систем зашиты
- Практическое занятие 5. Перспективы развития налоговых информационных систем.
- 1. Тенденции развития налоговых информационных систем.
- 2. Перспективы развития автоматизированных систем
- 3. Режимы взаимодействия пользователя с эвм
- 3.3. Темы лабораторных работ и их содержание Лабораторная работа 1. Структура официальных сайтов налоговых органов
- Лабораторная работа 2. Ис анализа финансово-хозяйственной деятельности фирмы
- Лабораторная работа 3. Ис налогового планирования фирмы
- 1. Назначение и основные функции программы Project Eхpert
- Лабораторная работа 4. Программное обеспечение налоговых ис
- Пример заполнения документа налоговой отчетности
- Лабораторная работа 5. Ис «Полный отчет налоговой инспекции»
- 4. Темы для самостоятельной работы студентов
- 5. Вопросы для аттестации
- 6. Учебно-методическое обеспечение дисциплины Основная литература:
- Дополнительная литература: