logo
Разработка и стандартизация ПС и ИТ

46. Классификации. Типология классификаций на основе отношений, возможных между классами и атрибутами.

В основе любой классификации лежит принцип деления объектов рассматриваемой предметной области. Каждый объект (материальный или нематериальный) с точки зрения решаемых классификацией задач характеризуется фиксированным множеством свойств, совокупность значений которых может говорить об эквивалентности (или близости) данного объекта некоторому множеству объектов. Назовем такие характеристические свойства объекта атрибутами. Тогда классификацией назовем выделение из некоторого множества объектов, принадлежащих универсальному классу, всех подклассов на основе значений выделенных в предметной области атрибутов и установление между выделенными подклассами отношений порядка. Атрибуты, участвующие в делении на классы, называются классификационными или основаниями деления.

Классификация должна подчиняться следующим формально-логическим правилам:

    1. очередной шаг классификации проводится только по одному атрибуту;

    2. получаемые в результате деления подклассы не должны пересекаться (однако, в общем случае это не обязательно);

    3. деление на подклассы должно быть соразмерным.

Пусть К — некоторый класс, который на основе заданного множества n значений некоторого атрибута разделен на подклассы k1 k2, k3, . . ., kn. Тогда сформулированные выше правила в обобщенном виде можно записать следующим образом:

Каждый из классов в свою очередь может быть подвергнут дальнейшему разбиению на подклассы:

В результате продолжения процесса деления на подклассы возникает определенная структура взаимосвязей между классами, которая содержит важную семантическую информацию о предметной области. В частности, между классами устанавливается отношение порядка:

Отношение, при котором один класс является подклассом другого, более широкого (), называетсяиерархией.

Отношением соподчинения связаны классы (k1, k2, k3,…, kn), которые являются подклассами одного, более широкого класса ().

Итак, классификационная схема характеризуется множеством атрибутов и множеством различных классов, которые могут быть выделены на базе зафиксированных множеств значений атрибутов.

Проведем типологию классификаций на основе отношений, возможных между классами и атрибутами.

Иерархические классификации

Фасетные классификации

Сущность фасетного анализа состоит в выделении в рассматриваемой предметной области атрибутов классификации и в описании значений этих атрибутов множеством терминов. При этом атрибуты называются фасетами, а каждый термин фасета называется фокусом.

Булевы классификации

Частным случаем комбинативной классификации является так называемая булева классификация. Классификационная схема булевой классификации строится на основе всего одного возможного значения для каждого из атрибутов: «имеет» или «обладает» и т.п. Примером такой классификационной схемы может служить использование дескрипторов для классификации документов: каждый дескриптор выступает в роли классификационного атрибута, а фасет атрибута содержит ровно одно значение – «принадлежит документу».

Для рассматриваемого примера «Преподаватели факультета» классификационная схема должна быть задана следующим образом:

«Экономический факультет»

Да

«Факультет Управления»

Да

«Юридический факультет»

Да

«до 40»

Да

«40-55»

Да

«старше 55»

Да

«Имеет ученую степень»

Да

«Не имеет ученой степени»

Да

В такой классификации могут быть построены классы, существование которых в предыдущем примере фасетной классификации невозможно, например:

Критерии

Иерархическая

Фасетная

Структура

Жесткая, задается фиксированной последовательностью классификационных признаков

Учитывает все многообразие сочетаний классификационных признаков

Механизм построения

Простой, строго фиксированный

Сложный

Число возможных группировок для N классификационных атрибутов

N (для зафиксированной последовательности классификационных атрибутов)

Возможность группировать объекты по заранее не предусмотренным сочетаниям признаков

Отсутствует

Присутствует

Внесение изменений

Жесткая структура приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки

Возможна простая модификация всей системы классификации без изменения структуры существующих группировок

Многоаспектное описание документов

Невозможно

Возможно

Информационный поиск по любому сочетанию атрибутов

Непредусмотрен

Предусмотрен

Механизм пересмотра классификации (изменение состава атрибутов, добавление новых значений)

Требует перестройки всей классификации

Требует добавления новых классов (ранее построенные классы не меняются)

Пригодность для каталогов и указателей, имеющих любую физическую форму

Пригодна

Непригодна

Расход квалифицированного труда

Не требует применения высококвалифицированного труда

Требует применения высококвалифицированного труда