logo
Конспект лекцій з дисципліни

11.1.Основні поняття, компоненти та архітектура

У 70-х роках минулого століття основні зусилля були сконцентровані на розробці методів подання (способів формулювання проблеми таким чином, щоб її можна було розв’язати) та методів пошуку (способів такого керування ходом розв’язування, яке мінімізувало б витрати часу та пам’яті). Це було наслідком труднощів забезпечення універсальності програми розв’язування широкого кола задач, внаслідок чого основні зусилля були зосереджені на загальних методах та прийомах програмування, які були б придатними для більш спеціалізованих задач. Такий підхід дав деякі позитивні результати, але кардинального прогресу не забезпечив.

І лише наприкінці 70-х років була прийнята принципово нова концепція — для того, щоб інтелектуалізувати програму, необхідно надати їй множину високоякісних фахових знань із деякої предметної галузі. Це було наслідком зрозуміння того факту, що ефективність систем ШІ залежить не лише від формалізмів та схем виведення, які вона використовує, а насамперед від знань, які вона має в своєму розпорядженні. Почали розвиватися спеціалізовані системи, кожна з яких була експертом в певній предметній галузі, які отримали назву експертних систем (EC). На початку розробка та побудова експертної системи більшою мірою нагадувала досягнення в мистецтві програмування, ніж наукову розробку. На сучасному етапі процес побудови тієї чи іншої експертної системи став набагато чіткішим та зрозумілішим внаслідок його впорядкування та на деяких етапах формалізації. Експертні системи становлять найсуттєвішу складову систем ШІ. По суті експертні системи є комп’ютерними програмами, що моделюють дії людини-експерта в вузькій предметній галузі на ґрунті накопичених знань, що складають базу знань (БЗ). Сформувалася технологія побудови експертних систем, що отримала назву інженерії знань. Процес побудови експертної системи не дав сподіваних результатів внаслідок своєї загальності — розробка універсальних програм виявилася неефективною, оскільки чим ширше коло задач, які може розв’язувати програма, тим, більше вимагає специфічної форми взаємодії розробника EC — інженера знань — з одним або декількома експертами в предметній галузі, для якої створюється система. Інженер знань "видобуває" з експертів процедури, стратегії, емпіричні правила, які вони використовують при розв’язуванні задач та "вбудовує" ці знання в експертну систему.

Загальна структура такої системи показана на малюнку (рис. 11.1).

Рис. 11.1. Узагальнена структура експертної системи

З нього видно, що до складу експертних систем входять типові блоки: діалоговий процесор, база знань, планувальник Новим блоком є підсистема пояснення Її поява пов’язана з характером експертних систем. Їх основною задачею є допомога фахівцям за рахунок використовування знань про проблемну галузь, одержаних з найрізноманітніших джерел: книг, статі, науково-технічної документації, експертів-фахівців тощо. Таким чином, в експертних системах зберігається колективний досвід, накопичений в даній проблемній галузі, наприклад, в медицині або геології, археології або історії. Експертні системи виступають як експерти-консультанти, коли фахівець звертається до них за допомогою. Це може бути, наприклад, молодий археолог, що веде самостійні польові дослідження, або молодий лікар, що зіткнувся з незрозумілими йому симптомами захворювання. Задача експертної системи - пояснити користувачу незрозуміле для нього явище.

Пошук інформації для консультації за запитом користувача здійснює планувальник. Але якщо фахівцю повідомити лише кінцевий результат пошуку (наприклад, передбачуваний діагноз захворювання або висновок про датування даного культурного шару), то він навряд чи цьому результату так просто повірить. Він повинен сам переконатися в обґрунтованості висновків, одержаних машиною. Для розсіювання його сумнівів із цього приводу передбачена підсистема пояснення. Вона стежить за роботою планувальника і описує його діяльність у стислій формі, зручній для аналізу людиною. Опускаючи опис невизначальних і неістотних кроків у роботі планувальника, підсистема чітко фіксує всі міркування, прийняті ним при альтернативних виборах.

На малюнку, окрім кінцевого користувача, показаний ще й експерт (Е). У реальних системах це може бути і цілий колектив експертів або інформаційний вхід для введення текстів з книг.

У галузі роботи зі знаннями існують наступні напрямки

Дослідження в напрямку видобування знань реалізуються двома розділами: формування якісних знань та інтеграція знань.

Формалізація якісних знань полягає у створенні методів, що дозволяють переходити від знань у текстовій формі до їх аналогів, ‘ придатних для введення в пам’ять та використання інтелектуальною системою. З розв’язанням цієї проблеми пов’язаний розвиток не лише класичних методів опрацювання експериментальних даних, але й відносно нового напрямку - нечіткої математики. Нечітка математика та її методи суттєво вплинули на багато областей штучного інтелекту, і практично на весь комплекс проблем, пов’язаний з переробкою та поданням якісної інформації.

Інтеграція знань полягає в необхідності (насамперед для інженера знань) створення на ґрунті отриманих знань із різних джерел несуперечливої та взаємопов’язаної системи знань про предметну галузь. Здобування знань від фахівців необхідне тому, що знання, отримані з різних джерел відчужено від фахівця-експерта не дозволяють побудувати ефективну інтелектуальну систему. Це пояснюється тим, що значна частина знань набувається експертами у вигляді професійного досвіду, вміння та інтуїції, і значну частину саме цих знань фахівці не можуть висловити словесно або тeкcтoвo. Для того, щоб здобути такі знання, необхідні спеціальні прийоми та методи, які використовуються в інструментальних системах здобування знань, створення яких є одним із завдань інженерії знань. Знання, отримані від експертів, необхідно оцінити з точки зору відповідності їх до тих знань, що накопичені системою раніше, та формалізувати (підготувати до введення в систему). Окрім того знання, що отримані від різних експертів, можуть бути взаємно суперечливими, і тому виникає завдання їх узгодження. Інженер знань шляхом роботи з експертами (наприклад шляхом повторного опитування) повинен забезпечити несперечливість знань, які отримує ЕС. Архітектура обробки знань в інтелектуальних експертних системах наведена на рис. 11.2.

Рис. 11.2. Архітектура обробки знань в інтелектуальних експертних системах

Моделі продукції та логічні системи — ґрунтуються на класичній логічній моделі доведення. Це з одного боку логічні, числення на кшталт числення предикатів та його розширень, або ж системи продукцій, що задають елементарні кроки перетворень або умовиводів. Внаслідок орієнтації цих двох моделей на процедури вони найкраще описують процедурні знання, а моделі знань, що спираються на семантичні мережі — декларативні знання. І процедурні, і декларативні знання можуть співіснувати (наприклад, значеннями деяких слотів у фреймі можуть бути продукції).

Вищенаведені моделі знань за своєю суттю є нормативними, тобто не спираються на аналоги когнітивних структур подання знань, якими користуються люди, а є наслідком теоретичних побудов та досліджень. Тому, внаслідок недостатнього вивчення форм подання знань у людини, у психології під впливом досліджень в галузі штучного інтелекту виник новий напрямок — когнітивна психологія.

Для зберігання та використання знань у ЕС створюються спеціальні системи оперування та подання знань, що включають до свого складу сукупність процедур, які необхідні для запису знань, отримання їх з пам’яті та підтримки їх в робочому стані. Системи оперування знаннями та подання знань по суті є базами знань — природним розвитком концепції баз даних. Саме в базах знань зосереджені основні процедури оперування (маніпулювання) знаннями.

Процедури оперування знаннями підрозділяються наступні основні класи:

    1. поповнення знань;

    2. класифікація знань;

    3. узагальнення (агрегування) знань;

    4. виведення за допомогою знань.

Абсолютна більшість знань людей, які є в текстовому вигляді, принципово неповні. Сприймаючи тексти, ми ніби поповнюємо їх за рахунок відомої нам інформації, яка має відношення до тексту (йому релевантна). Процедури аналогічного типу повинні реалізовуватись й в базах знань. Нові знання, що надходять до БЗ разом з уже наявними в базі після роботи процедур поповнення знань повинні сформувати розширення наявних знань, що зовсім не еквівалентне простому накопиченню інформації. Особливе місце серед цих процедур посідають псевдофізичні логіки (часу, простору, дій і таке інше), які спираючись на закони зовнішнього світу поповнюють інформацію в БЗ.

Процедури класифікації забезпечують системне зберігання знань у ЕС, тобто утворення певних структур, що полегшує пошук потрібних знань та забезпечує підтримання працездатності БЗ. Ці процедури є двох основних типів:

  1. родовидова класифікація (за типом "частина — ціле");

  2. ситуативна класифікація (в одну множину об’єднуються знання, що релевантні до деякої типової ситуації).

У цій галузі штучного інтелекту дослідження тісно пов’язані з кластерним аналізом — теорією класифікації, яка існує в якості самостійної науки.

Процедури агрегації та абстрагування приводять до абстрактних знань, що не мають прямого прообразу в реальному світі. У багатьох випадках абстрагування від окремих елементів опису, окремих фрагментів знань про об’єкти або явища реалізується в процесі класифікації. Узагальнення може відбуватися на протязі декількох кроків. Маніпулювання абстрактними знаннями підвищує інтелектуальні можливості систем, дозволяючи оперувати загальними категоріями і отримувати загальні результати.

Виведення на ґрунті знань реалізується за допомогою методу резолюцій, квазіаксіоматичних систем та систем правдоподібного виведення і залежить від моделі, що використана для подання знань. Якщо для подання знань використовуються логічні системи або продукції, чи знання, подані в казуальній формі, то виведення на знаннях буде близьким до стандартного логічного виведення, і в цьому випадку в ЕС використовуються методи, що ґрунтуються на ідеї резолюції.

Виведення в ЕС суттєво відрізняється від методів формальної математичної логіки за характером об’єктів, до яких цей процес застосовується. В основу функціонування всіх систем, що вивчаються математичною логікою, покладено принцип монотонності. Згідну до цього принципу, якщо якесь твердження виводиться в даній логічній системі, то ніяка додаткова інформація не може змінити його правильності, тобто логічна система є закритою. На відміну від логічних систем бази знань та бази даних ЕС є принципово відкритими системами, тобто нова інформація може змінити ситуацію, і зроблене раніше виведення може виявитися невірним.

Ця ситуація, а саме немонотонність виведення в відкритих системах, викликає достатньо суттєві труднощі. І хоча останнім часом прихильники логічних методів в штучному інтелекті роблять спроби побудувати логічні системи з можливістю немонотонного виведення, отримані результати достатньо скромні.

Відкритість — це не лише немонотонність виведений, але й відсутність строгої аксіоматичності, як наслідок подання знань про предметні галузі. В класичних логічних системах аксіоми описують "вічні" логічні істини, істинні для будь-якої предметної галузі. На відміну від цього в ЕС кожна предметна галузь використовує власні, специфічні, істинні лише в ній твердження. Тому такі системи є по суті квазіаксіоматичні, в яких у процесі тривалого виведення можлива зміна вихідних аксіом, і як наслідок зміна результату виведення.

Характерною для відкритих ЕС є неповнота та нечіткість інформації про предметну галузь та процеси, що в ній відбуваються, неточність вхідної інформації, неповна впевненість в правильності квазіаксіом Як наслідок виведення в інтелектуальних системах принципово мають наближений, правдоподібний характер на відміну від класичних формально-логічних систем. Таким чином достовірне виведення є лише складовою теорії виведення, що інтенсивно розвивається.

З іншого боку в ЕС доцільно застосувати основні особливості роздумів та аргументації, характерних для людей, міркування за аналогією та асоціаціями, досвід фахівців з їх професійними вміннями в певній предметній галузі, формування висновків в системі наявних прагматичних цінностей та багато інших прийомів, якими люди користуються в своїй повсякденній практиці. Впровадження таких прийомів забезпечить більшу гнучкість, "людяність" та адаптованість ЕС.