logo
Прототип системы интеллектуального поиска документов на основе онтологии предметной области

4.4 Требования к системе

Требования к системе в целом.

Требования к структуре и функционированию системы

Разрабатываемая система должна обладать модульной структурой, состав которой описан в перечне подсистем. Требуемые режимы функционирования системы:

- Стандартный режим - активны все функции системы. Используется при нормальном функционировании системы;

- Ограниченный (демонстрационный) - доступна только одна онтология, не более 5 элементов в пользовательском запросе, не более 3-х типов искомых в онтологии элементов, не более 20 (двадцати) элементов в результате поиска;

- Профилактический - функционирование системы без графического интерфейса. Используется при разработке, тестировании и отладке.

Перечень подсистем, их назначение и основные характеристики

Разрабатываемая система должна включать следующие подсистемы:

- подсистема морфологии - предназначается для морфологической обработки запроса с целью подготовки его к дальнейшему преобразованию при помощи онтологии предметной области;

- подсистема онтологии - предназначается для преобразования (расширения) поискового запроса при помощи онтологии предметной области;

- подсистема формирования запроса - предназначается для формирования итоговых поисковых запросов, полученных из исходного пользовательского запроса путем расширения при помощи онтологии предметной области;

- подсистема поиска - предназначается для проведения поиска документов по полученным поисковым запросам;

- подсистема документов - предназначается для загрузки метаинформации и формирования списка результатов поиска;

- поисковое ядро - предназначается для управления процессом обработки поискового запроса;

- подсистема графического интерфейса - предназначается для обеспечения взаимодействия пользователя с системой.

Требования к способам и средствам связи для информационного обмена между компонентами системы

Требования к способам и средствам связи для информационного обмена между компонентами Системы должны быть сформированы на этапе технического проектирования Системы.

Требования к численности и квалификации персонала системы

Персонал, обеспечивающий функционирование системы и ее информационное наполнение должен быть обучен принципам работы с программным обеспечением, обеспечивающим функционирование системы, а так же подготовку и загрузку ее информационного обеспечения (метаинформация документов).

Таблица 2 - Функции и обязанности ответственных лиц

Ответственное лицо

Функции и обязанности

Количество человек

Руководитель

Обеспечивает общее руководство группой поддержки и обслуживания информационной системы

1

Администратор системы

Обеспечивает техническую и программную поддержку функционирования системы, техническую поддержку обслуживающего персонала системы

1

Обслуживающий персонал системы

Обеспечивает информационное наполнение системы, регистрацию и техническую поддержку пользователей системы

3

Администратор поисковой системы обязан быть обучен всем программным и техническим средствам, использовавшимся при разработке системы, а так же средствам, использующимся для обеспечения полноценного функционирования системы в соответствии с заявленными в Настоящем Техническом Задании требованиями;

Обслуживающий персонал системы обязан быть обучен работе с программным обеспечением, предназначенным для формирования и загрузки информационного наполнения системы, а так же с программным обеспечением, предназначенным для регистрации пользователей в системе.

Показатели назначения

Разрабатываемая система должна обеспечивать поддержку внедрения новых алгоритмов применения онтологии предметной области для расширения пользовательского поискового запроса. Степень соответствия функционирования системы требованиям оценивается показателями результатов поиска:

- релевантности;

- пертинентности

Показатели релевантности результатов поиска относительно пользовательского и расширенного поисковых запросов определяются системой.

Показатели пертинентности результатов поиска формируются специалистами предметных областей, в которых производится поиск на основе статистических показателей результатов поиска.

В дальнейшем показатели назначения могут быть сформированы в процессе проектирования и разработки системы, а так же в ходе дальнейших исследований в сфере применения онтологий предметной области в задачах информационного поиска.

Требования к надежности

Разрабатываемая система должна обеспечивать стабильную работу всех пользователей системы при помощи ограничения количества одновременно работающих с системой пользователей. Количество одновременно работающих с системой пользователей должно зависеть от характеристик используемого аппаратного обеспечения.

При превышении числа подключений система должна выдавать сообщение о том, что количество пользователей достигло предела и подключение к системе будет возможно только через некоторое время.

В случае аварий система должна обеспечивать сохранность информационного обеспечения.

Требования к сохранности информационного обеспечения системы приведены в п.4.4.1.9.

Требования к безопасности

Система должна обеспечивать полный доступ к поисковому интерфейсу только авторизованным в системе пользователям.

Регистрация пользователей в системе должна проводиться администратором системы по письменному запросу пользователей и письменному подтверждению заказчика.

Система должна обеспечивать ограниченный доступ к поисковому интерфейсу всем пользователям системы, не прошедшим процедуру авторизации в системе. Ограниченный доступ ограничивает поисковые возможности пользователя: не более 2-х онтологий, не более 5-ти элементов в пользовательском поисковом запросе, не более 20-ти документов в списке результатов поиска.

Авторизация, аутентификация и идентификация пользователей в системе должна производиться автоматически по IP-адресу, с которого работает пользователь. При этом пользователь в системе идентифицируется по IP-адресу, что позволяет предоставлять коллективный доступ пользователей к системе с определенного разрешенного IP-адреса.

Требования к эргономике и технической эстетике

Требования не предъявляются

Требования к транспортабельности для подвижных АС

Требования не предъявляются.

Требования к защите информации от несанкционированного доступа

Система должна обеспечивать доступ к поиску только авторизованным в системе по логину и паролю пользователям.

Доступ к базе данных документов поисковой системой должен осуществляться в режиме "только чтение".

Доступ к базе данных документов программным обеспечением, предназначенным для загрузки информационного наполнения системы должен быть полным (чтение/запись/удаление).

Доступом к серверам, обеспечивающим функционирование систем должен обладать только администратор системы или администратор сети организации Заказчика.

Требования по сохранности информации при авариях

В целях обеспечения сохранности информации при авариях необходимо обеспечить резервное копирование:

- базы данных документов;

- базы данных онтологий;

- базы данных индексов документов;

- исходных кодов функциональных компонентов системы;

Резервные копии вышеописанных элементов системы должны создаваться на отдельном сервере периодически с интервалом в 1 (один) месяц. Каждая резервная копия должна храниться не менее 6 (шести) месяцев в архиве формата tar. gz. Наименование файла экземпляра резервной копии должно содержать дату создания и порядковый (уникальный) номер резервной копии в формате: "ДД-ММ-ГГГГ-ЧЧ-ММ-№№". В Системе должны быть предоставлены средства для восстановления данных из резервной копив течении суток.

Требования к защите от влияния внешних воздействий

Требования не предъявляются.

Требования к патентной частоте

По всем техническим и программным средствам, применяемым в системе, должны соблюдаться условия лицензионных соглашений и обеспечиваться патентная чистота, заключающаяся в том, что они могут быть свободно использованы в РФ без опасности нарушения действующих на ее территории патентов исключительного права, принадлежащего третьим лицам.

Требования по стандартизации и унификации

При создании информационной системы должно использоваться общесистемное программное обеспечение (операционные системы, СУБД, серверы приложений и т.д.) с открытым исходным кодом.

Применяемые при создании Системы технические средства (форматы данных, протоколы передачи и др.) и организационные решения (инструкции, требования и др.) должны быть доступны для свободного использования и документированы в виде, достаточном для независимой реализации третьими сторонами (без обращения к Разработчику).

При выборе применяемых технологических решений преимущество должно отдаваться стандартизированным решениям (т.е. прошедшим процедуру стандартизации и утвержденным в качестве стандарта либо рекомендации каким-либо признанным международным, федеральным, отраслевым, промышленным органом по стандартизации), а также решениям с открытым кодом с лицензией, допускающим их свободное использование, распространение и модификацию.

Применяемое программное обеспечение сторонних производителей также должно поставляться с учетом вышеуказанных требований. Применяемое программное обеспечение сторонних производителей должно полностью поддерживаться Разработчиком, возможно с привлечением услуг соответствующего производителя.

Программная архитектура системы должна соответствовать стандартизированным шаблонам и обеспечивать:

- Маштабируемость;

- Надежность;

- Конфигурируемость

Программный код реализации системы должен соответствовать единому стандарту именования переменных, функций и классов.

Дополнительные требования

Графический интерфейс стартовой страницы системы должен содержать:

- Цветной логотип системы, предоставляемый Заказчиком в формате PNG размером 150x300 пикселей;

- Текстовое поле для ввода текста пользовательского поискового запроса, вместимостью 256 символов и шрифтом "Verdana" размером 14.

- Список зарегистрированных в системе и доступных в настоящий момент для использования в процессе обработки системой поискового запроса онтологий, предназначенный для указания используемых онтологий, число одновременно выбранных в котором должно зависеть от режима функционирования системы и уровня доступа пользователя:

тестовый режим - не более 2-х онтологий;

ограниченный режим - не более 2-х онтологий;

стандартный режим - не более 4 онтологий;

- Список зарегистрированных в системе и доступных в настоящий момент типов связей элементов пользовательского поискового запроса с терминами онтологий, предназначенный для указания искомых типов связей, число одновременно выбранных в котором должно зависеть от режима функционирования системы и уровня доступа пользователя:

тестовый режим - не более 3-х типов связей;

ограниченный режим - не более 3-х типов связей;

стандартный режим - нет ограничений;

- Кнопку "Поиск" для выполнения поискового запроса;

- Кнопку "Очистить" для удаления введенного запроса и снятия выделений со всех онтологий;

- Копирайт и данные организации Заказчика.

Графический интерфейс страницы просмотра результатов поиска должен содержать:

- Списки результатов поиска для каждой из использованных в процессе обработки поискового запроса онтологий в виде наборов карточек документов;

- Конструктор нового запроса для каждой из использованных в процессе обработки поискового запроса онтологий, в виде наборов найденных в процессе поиска по онтологиям элементов, которые можно добавить в новый запрос;

- Кнопку "Поиск" для выполнения поискового запроса;

Списки результатов поиска для каждой из использованных в процессе поиска онтологий должны быть разделены вертикально и располагаться параллельно друг с другом.

При количестве списков результатов больше двух, необходимо разделить списки по вкладкам, реализованным средствами языка разметки HTML.

Цветовая гамма оформления графического интерфейса системы должна состоять из серебристо-серых тонов.

В качестве шрифта должен использоваться "Verdana" размером 14 с нулевым отступом.

Так же дополнительные требования могут быть сформулированы на этапах проектирования и разработки Системы.

Требования к функциям (задачам), выполняемым системой

В системе должно быть реализовано выполнение следующих функций:

Морфологическая обработка запроса:

- выделение искомых элементов из пользовательского поискового запроса;

- нормализация морфологических форм выделенных элементов запроса;

Онтологическая обработка запроса:

- загрузка схем используемых онтологий из указанных источников;

- поиск в онтологиях элементов указанного типа, соответствующих элементам запроса (поиск первого уровня);

- формирование списков найденных элементов;

Формирование запросов:

- формирование расширенных поисковых запросов на основе найденных в онтологии предметной области;

Поиск документов:

- поиск документов по исходному пользовательскому поисковому запросу;

- поиск документов по сформированным на основе онтологий расширенным запросам;

Обработка результатов поиска:

- формирование списков результатов поиска документов;

Требования к видам обеспечения

Требования к математическому обеспечению системы

Требования к математическому обеспечению системы могут быть определены и сформулированы на стадии проектирования и разработки Системы.

Требования информационному обеспечению системы

Массивы информационных данных должны представлять собой единую совокупность данных для работы функциональных задач информационной системы.

В состав данных Системы должны входить следующие виды информации:

- содержимое документов, по которым осуществляется поиск;

- онтологии предметных областей;

- графические файлы и файлы мультимедиа;

- метаинформация документов по которым осуществляется поиск;

- иные виды информации, определяемой прикладным программным обеспечением, используемым в Системе;

- служебная информация об управлении: программным и техническим обеспечением подсистем, их взаимодействии между собой.

- файлы с технической и организационной документацией;

- другие данные о внутреннем информационном обеспечении функционирования Системы.

При необходимости в структуру информационных данных Системы могут быть включены дополнительные массивы данных (временные или постоянные) с целью обобщения информации, организации взаимосвязей, обработки и подготовки информации для отдельных пользователей системы, обеспечения сквозного поиска по предоставляемой информации и обработки определенных данных.

Для хранения информации Системы должны использоваться СУБД с поддержкой языка SQL в соответствии со стандартом ISO/IEC 9075: 1992, "Язык баз данных SQL" (Database Language SQL). Записи базы данных должны сопровождаться дополнительной информацией об источнике данных, внесение изменений в базу данных рекомендуется реализовать по принципу неприменения операций удаления и коррекции записей (разрешено только дополнение), должен быть предусмотрен регламент регулярного автоматического копирования информации из баз данных на внешние носители для архивного хранения.

Для хранения метаинформации документов по которым осуществляется поиск в системе должна использоваться реляционная СУБД. Структура данных в системе должна состоять из одной основной области хранения данных стандартной безопасности.

Области хранения метаинформации документов должны строиться на основе модели данных, физически реализованной в СУБД.

Контроль доступа к метаинформации документов должен обеспечиваться средствами СУБД.

Требования к лингвистическому обеспечению системы

Разрабатываемая система должна создаваться с использованием следующих языков программирования высшего уровня:

- Java - для реализации компонентов бизнес-логики системы;

- Java Server Pages - для реализации компонентов графического интерфейса системы;

- HTML - для реализации графического интерфейса системы;

- Java Script - для реализации компонентов бизнес-логики на уровне графического интерфейса системы;

- SQL - для реализации управления данными в базе данных системы:

Требования к программному обеспечению системы

Используемое при реализации системы программное обеспечение должно удовлетворять следующим требованиям:

- Обеспечивать возможность взаимодействий со смежными системами и программным обеспечением;

- Иметь соответствующую документацию для используемой в системе версии;

- Иметь соответствующую техническую поддержку в течении всего периода эксплуатации в системе;

- Функционировать на техническом обеспечении указанной в требованиях к техническому обеспечению вычислительной мощности.

Требования к техническому обеспечению

Техническое (аппаратное) обеспечение системы (сервера) должно удовлетворять следующим требования:

- Обеспечивать полноценное функционирование описанного в требованиях к программному обеспечению ПО;

- Обеспечивать необходимую вычислительную мощность для функционирования системы и используемого ею программного обеспечения;

- Обеспечивать бесперебойное функционирование системы в случаях перебоев в электрическом питании технического обеспечения путем использования блоков бесперебойного питания.

Требования к метрологическому обеспечению

Требования не предъявляются.

Требования к организационному обеспечению

Для обеспечения защиты системы от ошибочных действий персонала в система должна предусматриваться возможность отката внесенных изменений по редактированию данных.

Требования к методическому обеспечению

Нормативно-техническая документация системы должна содержать:

- Техническое задание на разработку информационной системы;

- Технический проект системы;

- Рабочий документ системы;

- Руководство администратора системы;

- Руководство разработчика системы;

- Руководство пользователя системы;

Техническое задание, технический проект и рабочий проект системы должны соответствовать ГОСТ 34.