You are on page 1of 92

ЛЕКЦІЯ 3.

ЗНАННЯ ЯК
ІНФОРМАЦІЙНА ОСНОВА
ІНТЕЛЕКТУАЛЬНИХ СИСТЕМ
Глибовець М.М.
glib@ukma.edu.ua
Філософія розділу

● Вірне рішення, що прийняте із запізненням, є


помилкою.
Лi Якокка

● Не кажи, що ти навчався (навчаєшся) -


покажи, що ти знаєш (вивчив).
Микола Глибовець
3.1. Основні підходи до побудови систем ШІ
• Існують різні підходи до побудови систем ШІ (логічний,
структурний, еволюційний)
• Це розділення не є історичним (за часом), коли одна думка
поступово змінює інше.
• Різні підходи існують і зараз.
• Оскільки по-справжньому повних систем ШІ в даний час
немає, то не можна сказати, що якийсь підхід є правильним,
а якийсь помилковим.
Логічний підхід

• Для початку короткого розглянемо логічний підхід.


• Чому він виник?
• Людина займається не тільки логічними вмсновками.
• Цей вислів хоча і вірний, але саме здібність до логічного
мислення сильно відрізняє людину від тварин.
• Основою для даного логічного підходу служить булева
алгебра.
• Свій подальший розвиток булева алгебра отримала у вигляді
числення предикатів — в якому вона розширена за рахунок
введення наочних спеціальних символів, відношень між ними,
кванторів існування і загальності.
Логічний підхід
● Практично кожна система ШІ, яка побудована на логічному
принципі, є машиною доказу теорем.
● При цьому початкові дані зберігаються в базі даних у вигляді
аксіом, а правила логічного виводу задаються як визначені
відношення між ними.
● Кожна така машина має блок генерації мети, і система виводу
намагається довести цю мету як теорему.
● Якщо мета доведена, то трасування застосованих правил
дозволяє отримати ланцюжок дій, необхідних для реалізації
поставленої мети.
● Потужність такої системи визначається можливостями
генератора цілей і машиною доказу теорем.
Нечітка логіка
● Основною її відмінністю є те, що правдивість висловлення
може приймати в ній окрім так/ні (1/0) ще і проміжні значення
— не знаю (0.5), пацієнт швидше живий, ніж мертвий (0.75),
пацієнт швидше мертвий, ніж живий (0.25).
● Цей підхід більше схожий на мислення людини, оскільки вона
на питання рідко відповідає тільки так чи ні. Хоча правда, на
іспиті прийматимуться тільки відповіді з розряду класичної
булевої алгебри.
● Для більшості логічних методів характерна велика
трудомісткість, оскільки під час пошуку доказу можливий
повний перебір варіантів.
● Тому цей підхід вимагає ефективної реалізації обчислювального
процесу, і хороша робота зазвичай гарантується при порівняно
невеликому розмірі бази даних.
Структурний підхід
● Під структурним підходом мається на увазі спроба побудови
ШІ шляхом моделювання структури людського мозку.
● Однією з перших таких спроб був перцептрон Френка
Розенблатта.
● Основною модельованою структурною одиницею в перцептронах (як і
в більшості інших варіантів моделювання мозку) є нейрон.
● Пізніше виникли і інші моделі, які для широкого загалу
зазвичай відомі під терміном "нейронні мережі" (НМ).
● Ці моделі розрізняються по будові окремих нейронів, по
топології зв'язків між ними і по алгоритмах навчання.
Структурний підхід
● Серед найбільш відомих зараз варіантів НМ можна назвати НМ
із зворотним розповсюдженням помилки, рекурентні НМ,
мережі Хопфілда, стохастичні нейронні мережі.
● НМ найуспішніше застосовуються в завданнях розпізнавання
образів, зокрема сильно зашумлених, проте є і приклади
успішного застосування їх для побудови інших систем ШІ.

● Для моделей, побудованих на засадах моделювання людського


мозку характерна не дуже велика виразність, легкість
розпаралелювання алгоритмів, і пов'язана з цим висока
продуктивність паралельної реалізації НМ.
Структурний підхід
● Також для НМ характерна ще одна властивість, яка дуже
зближує їх з людським мозком, — нейронні мережі працюють
навіть за умови неповної інформації про навколишнє
середовище, тобто як і людина, вони на питання можуть
відповідати не тільки "так і ні" але і "не знаю точно, але
швидше так".

● Досить великого поширення набув і еволюційний підхід.


Еволюційний підхід
● При побудові систем ШІ згідно цього підходу основна увага
приділяється побудові початкової моделі, і правилам, по
яких вона може змінюватися (еволюціонувати).
● Причому модель може бути складена на основі різних методів,
це може бути і НМ і набір логічних правил і будь-яка інша
модель.
● Після цього ми застосовуємо комп'ютер і він, на підставі
перевірки моделей відбирає найкращі з них, на підставі яких по
самих різних правилах генеруються нові моделі, з яких знову
вибираються найкращі і так далі…
Еволюційний підхід
● В принципі можна сказати, що еволюційних моделей як
таких не існує, існують тільки еволюційні алгоритми
навчання, але моделі, отримані при еволюційному підході
мають деякі характерні особливості, що й дозволяє виділити
їх в окремий клас.
● Такими особливостями є перенесення основної роботи
розробника з побудови моделі на алгоритм її модифікації і те,
що отримані моделі практично не супроводять витяганню
нових знань про середовище, що оточує систему ШІ, тобто
вона стає як би річчю в собі.
● Ще один широко використовуваний підхід до побудови систем
ШІ — імітаційний. Цей підхід є класичним для кібернетики з
одним з її базових понять — "чорним ящиком" (ЧЯ).
Імітаційний підхід
● ЧЯ — пристрій, програмний модуль або набір даних,
інформація про внутрішню структуру і зміст яких відсутні
повністю, але відомі специфікації вхідних і вихідних даних.
● Об'єкт, поведінка якого імітується, якраз і є таким "чорним
ящиком".
● Нам не важливо, що у нього і у моделі усередині і як він
функціонує, головне, щоб наша модель в аналогічних
ситуаціях поводилася так само.
● Таким чином тут моделюється інша властивість людини —
здатність копіювати те, що роблять інші, не вдаючись до
подробиць, навіщо це потрібно.
● Часто ця здатність економить йому масу часу, особливо на початку його
життя.
Імітаційний підхід
● ЧЯ — пристрій, програмний модуль або набір даних,
інформація про внутрішню структуру і зміст яких відсутні
повністю, але відомі специфікації вхідних і вихідних даних.
● Об'єкт, поведінка якого імітується, якраз і є таким "чорним
ящиком".
● Нам не важливо, що у нього і у моделі усередині і як він
функціонує, головне, щоб наша модель в аналогічних
ситуаціях поводилася так само.
● Таким чином тут моделюється інша властивість людини —
здатність копіювати те, що роблять інші, не вдаючись до
подробиць, навіщо це потрібно.
● Часто ця здатність економить йому масу часу, особливо на початку його
життя.
3.2. ЗНАННЯ І ДЕЯКІ ПІДХОДИ ДО ЇХ ПОДАННЯ
○ У “Філософському словнику” знання визначаються як
“відображення об’єктивних властивостей та
зв’язків світу”.
○ Знання є інформаційною основою інтелектуальних
систем, оскільки інтелектуальна система завжди
співставляє зовнішню ситуацію зі своїми знаннями
та керується ними при прийнятті рішень.
3.2.1. ЗНАННЯ І ДЕЯКІ ПІДХОДИ ДО ЇХ
ПОДАННЯ
○ Не менш важливим є те, що знання - це
систематизована інформація, яка може
певним чином поповнюватися і на основі
якої можна отримувати нову інформацію,
тобто нові знання.
ЗНАННЯ І ДЕЯКІ ПІДХОДИ ДО ЇХ ПОДАННЯ

○ На сучасному етапі домінуючою парадигмою,


що лежить в основі найбільш відомих
моделей подання знань у системах штучного
інтелекту, можна вважати парадигму,
характерну для символьного підходу.
○ Символьний підхід до побудови та опису

систем штучного інтелекту полягає у тому, що


кожне поняття задається окремим словом
(“символом”); зміст цього слова розкривається
через його зв’язок з іншими поняттями.
ЗНАННЯ І ДЕЯКІ ПІДХОДИ ДО ЇХ ПОДАННЯ
○ Цю парадигму можна охарактеризувати як вербально-

дедуктивну (або словесно-логічну), оскільки:


● будь-яка інформаційна одиниця задається
вербально, тобто у формі, наближеній до словесної; у
вигляді набору явно сформульованих тверджень або
фактів;
● основним механізмом отримання нової інформації на
базі існуючої є дедукція, тобто вивід “від загального
до часткового”. Такий дедуктивний вивід є
бездоганним з логічної точки зору; в його основі
лежать транзитивність імплікації і дія квантора
ЗНАННЯ І ДЕЯКІ ПІДХОДИ ДО ЇХ ПОДАННЯ
○ Але вербально-дедуктивне подання знань не є повним,
оскільки:
● дедуктивний вивід не є єдино можливим. Провести
дедуктивні логічні побудови з самого початку до
самого кінця на практиці, як правило, неможливо.
Без підсвідомого мислення стає неможливим будь-
яке відкриття.
● далеко не всі знання є вербальними. Так, жодне
твердження не зберігається в пам’яті людини явно.
Відомо, що в основі діяльності мозку людини лежить
передача сигналів між нервовими клітинами. Часто
людина не може сформулювати свої знання явно.
ЗНАННЯ І ДЕЯКІ ПІДХОДИ ДО ЇХ ПОДАННЯ
○ Тому необхідно розвивати інші моделі знань, окрім
вербально-дедуктивних.
○ В рамках конекціоністського підходу можна
розглядати моделі на основі однорідного поля знань.
○ Однорідним полем знань будемо називати сукупність
простих однорідних елементів, які обмінюються між
собою інформацією; нові знання породжуються на
основі певних процедур, визначених над полем знань.
○ Конекціоністським називається підхід, в рамках якого
система штучного інтелекту розглядається як
однорідна сукупність порівняно простих елементів,
які взаємодіють між собою.
3.2.2. Приклади засосування
• Укладено партнерську угоду між Google DeepMind і
Оксфордським університетом, які мають намір
спільно розвивати технології ШІ.
• Йдеться про когнітивні обчислення і машинне
навчання для осмислення природної мови та
інструментарій візуального розпізнавання.
• Подібні розробки дозволять машинам розуміти
людську мову і сприймати зображення реального
світу так, як це роблять люди.
«Живі Машини»
• Майбутні версії роботів можуть бути застосовані для
очищення океанів від забруднення мікропластиком,
виявлення й поглинання токсичних матеріалів,
доставки ліків в потрібні місця всередині тіла .
• Одне з найбільш успішних творінь має дві
приземкуваті ноги, які рухаються під умовним
«тулубом»
«Живі Машини»
● У США дослідники створили перші живі машини, склавши до
купи стовбурові клітини африканської жаби в крихітних
роботів, здатних рухатися у власному потоці.
● Як пише The Guardian, одне з найбільш успішних творінь має
дві приземкуваті ноги, які рухаються під умовним
«тулубом» та має дірку посередині, яку дослідники
використовують як сумку, щоб доставляти крихітні
вантажі.
«Живі Машини»
● Це абсолютно нові форми життя. Вони ніколи не існували на
Землі», - сказав директор Allen Discovery Center в Університеті
Тафта Майкл Левін.
● «Це живі організми, придатні для програмування», - додав він.
● Зазвичай роботів роблять з металу й пластику заради міцності й
тривалого періоду використання.
● Але Левін й його колеги бачать вигоду у тому, щоб робити
роботів з біологічних тканин.
● В разі пошкодження, живі роботи можуть залікувати свої
рани.
● А коли їхнє завдання виконане, вони можуть померти, як
природні організми.
Ера когнітивних обчислень
● Зміни базуються на 5-ти технологіях

Cloud
Computing
Mobile Social Media

'01'oil
оюоюююо,^
010 lomo^oVj' $ °IC°
010101010101
1 00101010101 101010101010
ov (4фію>і 0101
пі 0101011101 1010101
10№
°nl«0

Sensors, IoT
© 2016 IBM Corporation
Big Data
в 44 рази в 2020 40 зеттабайт

у 2009 800000 не структурованої


петабайт інформації
Ера інтернет речей, «розумних» систем
IBM Watson
Мета розробки - створити комп’ютерну систему, здатну
на рівні людини відповідати на питання, викладені на
природній мові, причому швидко, точно і достовірно.
Система Watson не підключена до Інтернету, вона
аналізує власну базу неструктурованих даних
еквівалентну 1 млн. книг.
Продуктивність 80 Тфлопс. Побудована на базі 8-
ядерних процесорів Power7 (всього 2880 ядер, 15 Тб
ОЗУ).
Висока енергоефективність - споживання без системи
охолодження всього 80 кВт. Охолодження вимагає ще
стільки ж.
Інтернету речей (Internet of Things - IoT).
● Безліч сучасних пристроїв, в тому числі
інтелектуальних і оснащених сенсорами, здатні
підключатися до Інтернету і завантажувати нові
додатки і рішення.
● Істотне здешевлення технічних засобів і повсюдна
поширеність здійснювати підключення до мережі
дозволили технології Інтернету речей увійти в наше
повсякденне життя.
Хмари трансформують бізнес-процеси в цифрові сервіси
.
85% нових 1/4 світових додатків
доступні в хмарі в 2016 р.
програмних додатків

проектуються для хмар

72% розробників
заявляють, що

хмарні сервіси або

API є частиною їх

додатків
3.2.3. Зберігання знань
○ Будемо казати, що знання про відповідні факти або
поняття зберігаються полем знань вербально, якщо
використання фіксованого набору процедур, що задані над
полем знань, дозволяє за розумний час отримати вербальне
формулювання деякого факту або вербальний опис
поняття.
○ Знання зберігаються полем невербально, якщо
використання фіксованого набору процедур, що задані над
полем знань, дозволяє використовувати факт або поняття
без отримання їх вербального опису.
Зберігання знань
○ Людина в своїй діяльності комбінує дедуктивні
висновки з рефлекторними рішеннями.
○ Таке комбінування повинно бути характерним і

для розвинених інтелектуальних систем.


● Наприклад, можна організувати паралельне
функціонування механізмів дедуктивного
виведення і конекціоністських механізмів.
ВЕРБАЛЬНО-ДЕДУКТИВНЕ
ВИЗНАЧЕННЯ
○ Знаннями інтелектуальної системи (у вербально-
дедуктивному розумінні) називається трійка <F, R,
P>,
● де F - сукупність явних фактів, які зберігаються в
пам’яті системи в явному вигляді,
● R - сукупність правил виведення, які дозволяють на
основі відомих знань отримувати нові знання,
● P - сукупність процедур, які визначають, яким чином слід
застосовувати правила.
○ Базою знань інтелектуальної системи будемо
називати сукупність усіх знань, що зберігаються в
пам’яті системи.
3.3. База знань
○ У базах знань прийнято виділяти екстенсіональну та
інтенсіональну частини.
○ Екстенсіональною частиною бази знань називається

сукупність усіх явних фактів.


○ Інтенсіональною частиною бази знань називається

сукупність усіх правил виведення та процедур, за


допомогою яких з існуючих фактів можна виводити
нові твердження.
База знань
○ Приклад 1. Розглянемо таку базу знань.
● Ф1. Заєць їсть траву.
● Ф2. Вовк їсть м’ясо.
● Ф3. Заєць є м’ясом.
● П1. Якщо А є м’ясом, а В їсть м’ясо, то В їсть
А.
● П2. Якщо А їсть м’ясо, то А є хижаком.
● П3. Якщо А їсть В, то В є жертвою.
● П4. Якщо хижак вимирає, жертва швидко
розмножується.
● П5. Якщо жертва вимирає, хижак вимирає.
База знань

○ Літерами Ф позначені явні факти, які


відображають елементарні знання; і їх
безпосередній аналіз дозволяє експертній системі
відповідати на найпростіші запитання, такі, як "
Вовк їсть м’ясо?".
○ Для позитивної відповіді на це та подібні йому

запитання досить просто знайти відповідний


факт в екстенсіональній частині бази знань.
База знань
○ Принципово іншим є запитання типу "Вовк є
хижаком?".
○ Для відповіді на це запитання необхідно

застосовувати правила виведення, які


дозволяють на основі існуючих явних фактів
отримувати нові знання, тобто нові факти.
○ Такі правила позначені у нашому прикладі літерою

П.
○ Так, для відповіді на поставлене запитання досить

знання факту Ф2 і правила П2.


База знань

○ Процедури визначають, яким саме чином слід


застосовувати правила.
○ Часто ці процедури є складовою частиною

мови, якою програмується експертна система.


○ Якщо ж таких процедур недостатньо,

програміст має сам подбати про їх написання.


3.4. ЕКСПЕРТНІ СИСТЕМИ
○ Експертними системами будемо називати інтелектуальні
програмні засоби, здатні у ході діалогу з людиною
одержувати, накопичувати та коригувати знання з
заданої предметної галузі, виводити нові знання,
розв’язувати на основі цих знань практичні задачі та
пояснювати хід їх розв’язку.
ЕКСПЕРТНІ СИСТЕМИ
○ Експертні системи акумулюють знання експертів –
провідних спеціалістів у даній предметній області.
○ В основі роботи експертних систем лежить
дедуктивне виведення нових тверджень з існуючих.
○ Типове застосування експертних систем -
консультації для фахівців середньої кваліфікації і
неспеціалістів у тій галузі, для якої вона розроблена.
ЕКСПЕРТНІ СИСТЕМИ
○ Необхідно розуміти, що створити універсальну
експертну систему практично неможливо.
● По-перше, це пов’язано з “прокляттям розмірності” –
зовнішній світ надто багатий і різноманітний.
● По-друге, експертна система повинна акумулювати знання
людей-експертів, а “універсальних” експертів не існує і не
може існувати.
● По-третє, ніяке логічне виведення не може замінити
інтуїцію та досвід експерта.
○ Можна створювати лише експертні системи, які
відносяться до певної предметної галузі.
ЕКСПЕРТНІ СИСТЕМИ
○ У створенні експертних систем повинні брати участь
фахівці як мінімум двох категорій:
● експерт, що є висококваліфікованим фахівцем у даній
предметній галузі і знання якого потрібно передати
експертній системі;
● інженер знань, завдання якого - формалізувати знання
експерта і привести їх до вигляду, придатного для
занесення до бази знань.
○ Дуже серйозна проблема пов’язана з тим, що знання
експерта важко формалізувати.
3.5. ЕКСТЕНСІОНАЛЬНІ ТА
ІНТЕНСІОНАЛЬНІ ЗАДАННЯ ДАНИХ.
○ Як уже зазначалося, база знань складається з
екстенсіональної та інтенсіональної частини.
○ Екстенсіональна частина містить факти, які
запам’ятовуються явно, а інтенсіональна - правила, які
дозволяють отримувати нові факти.
○ Можна вважати, що саме наявність розвиненої
інтенсіональної частини є однією з основних рис, які
відрізняють знання від традиційних даних.
○ Взагалі, інтенсіональним відношенням, яке описує базу
даних, часто називають правило або сукупність правил,
яким підпорядковується кожний запис у базі даних.
ЕКСТЕНСІОНАЛЬНІ ТА
ІНТЕНСІОНАЛЬНІ ЗАДАННЯ ДАНИХ
○ Уявимо собі базу даних методиста деканату, яка
містить дані про те, які курси прослухав кожний
студент.
● Відомо, що жоден студент не має права слухати курс
“Бази даних”, якщо він не прослухав курсу “Комп’ютерні
технології”.
● Правило: Якщо Прослухав(Х, Бази даних), то
Прослухав(Х, Комп’ютерні технології).
○ Наявність такого правила дозволяє скоротити базу
знань: твердження, істинність яких можна
встановити за допомогою правил, не обов’язково
запам’ятовувати в явному вигляді.
ЕКСТЕНСІОНАЛЬНІ ТА
ІНТЕНСІОНАЛЬНІ ЗАДАННЯ ДАНИХ
○ Можна зробити висновок, що пошук в
інтенсіональній базі знань складається з двох етапів:
● пошук потрібного факту в екстенсіональній частині;
● дедуктивне виведення факту на основі правил
інтенсіональної частини.
3.6. ЗВ’ЯЗКИ МІЖ ІНФОРМАЦІЙНИМИ
ОДИНИЦЯМИ
○ У базі знань можуть зберігатися відомості про різні
об’єкти, поняття, процеси і т.п; відповідні описи ми
неформально називаємо інформаційними одиницями.
○ Опис, який утворює інформаційну одиницю,
розглядається як деяка абстракція реальної сутності,
що існує в реальному світі.
○ Це означає, що ця абстракція описує деякі риси
реальної сутності.
ЗВ’ЯЗКИ МІЖ ІНФОРМАЦІЙНИМИ
ОДИНИЦЯМИ
○ У реальному світі все тісно взаємопов’язане;
відповідні зв’язки повинні знайти адекватне
відображення і в базі знань.
○ Основними зв’язками між інформаційними
одиницями вважаються узагальнення та агрегація
ЗВ’ЯЗКИ МІЖ ІНФОРМАЦІЙНИМИ
ОДИНИЦЯМИ
○ Є велика група зв’язків, за допомогою яких можна
описувати:
● просторові відношення “знизу”, ”зверху”, ”поруч”, ”між” і
т.п.);
● часові відношення (“раніше”, “пізніше”,”під час”,
“одночасно” і т.п.),
● причинно-наслідкові відношення і т.п..
○ Ці відношення є спільними для всіх предметних областей.
○ Логічні системи, що грунтуються на цих відношеннях,
прийнято називати псевдофізичними логіками.
○ Використання псевдофізичних логік дає можливість
інтелектуальній системі поповнювати первинні описи.
ЗВ’ЯЗКИ МІЖ ІНФОРМАЦІЙНИМИ
ОДИНИЦЯМИ
○ Основними зв'язками між інформаційними
одиницями є узагальнення та агрегація.
○ Агрегація дозволяє задавати будову об’єкту та його
складові частини, визначати в базі знань аудиторію як
об’єкт, який має вікна, двері і т.п.
● Вікна, в свою чергу, теж можна розглядати як агрегований
об’єкт: вони мають ручки, рами і т.п.
○ Іншими словами, відношення “Має”, яке описує
агрегацію, означає, що певний об’єкт має в своєму
складі деякий інший об’єкт.
○ За цим відношенням закріпилася спеціальна назва
HAS_PART.
ЗВ’ЯЗКИ МІЖ ІНФОРМАЦІЙНИМИ
ОДИНИЦЯМИ
○ Узагальнення (відношення «Є») задає ієрархію класів
(екземпляр - клас - надклас).
○ Так, наприклад:
● можна говорити, що об’єкт Вася Петров відноситься до класу
Студент.
● відповідно, інформаційна одиниця, яка описує Васю Петрова
може бути описана на основі більш загальної інформаційної
одиниці Студент (більш точно, вона задається як екземпляр
інформаційної одиниці Студент).
● Клас Студент, в свою чергу, є підкласом типу Людина і т.п.
○ Надклас об’єднує атрибути, або ознаки, спільні для його
підкласів; підкласи можуть успадковувати ті чи інші
властивості надкласів.
ЗВ’ЯЗКИ МІЖ ІНФОРМАЦІЙНИМИ
ОДИНИЦЯМИ
○ Саме з відношенням “Є” пов’язаний один з основних
відомих механізмів логічного виведення - механізм
виведення за успадкуванням (інша назва - за
наслідуванням).
○ Суть цього механізму можна сформулювати так:
● якщо деяка умова виконується для всього класу, то вона
виконується і для кожного представника цього класу, а
також для усіх підкласів цього класу (якщо інше не задано
явним чином).
○ Іншими словами, екземпляри успадковують властивості
класів, підкласи успадковують властивості надкласів.
ЗВ’ЯЗКИ МІЖ ІНФОРМАЦІЙНИМИ ОДИНИЦЯМИ
○ В усіх системах керування базами знань повинна бути забезпечена
належна підтримка успадкування.
○ Розглянемо приклад.
○ В базі знань міститься така інформація:
● Всі птахи літають.
● Ластівка є птахом.
● Юкко є ластівкою.
○ Маємо загальний клас “Птахи”, його підклас “Ластівки”, та об’єкт
“Юкко”, який є екземпляром класу “Ластівка”.
○ На підставі цих знань будь-яка система, яка підтримує успадкування,
повинна зробити висновки, що Юкко є птахом; всі ластівки літають;
Юкко теж літає.
ЗВ’ЯЗКИ МІЖ ІНФОРМАЦІЙНИМИ ОДИНИЦЯМИ
○ Насправді замість єдиного відношення “Є” необхідно
розглядати цілу систему споріднених, але не
ідентичних відношень.
○ Інакше легко припуститися логічних помилок, подібних до
таких:
● Юкко є ластівкою.
● Ластівка є видом, який вивчається натуралістами.
● Отже, і Юкко вивчається натуралістами. (Або: Юкко є видом,
який вивчається натуралістами).
ЗВ’ЯЗКИ МІЖ ІНФОРМАЦІЙНИМИ ОДИНИЦЯМИ

○ Слід розглядати такі відношення:


● -відношення “клас-підклас”, яке є відношенням
часткового порядку (як правило, строгого).
○ Відтак, для цього відношення виконуються всі

властивості часткового (строгого або


нестрогого) порядку, зокрема, транзитивність;
● відношення “екземпляр – клас”.
○ Екземпляри успадковують властивості своїх

класів, але саме відношення “екземпляр-клас”


не є транзитивним.
ЗВ’ЯЗКИ МІЖ ІНФОРМАЦІЙНИМИ ОДИНИЦЯМИ
○ Крім того, необхідно чітко розрізняти поняття “клас” та
“множина”, “належність до класу” та “належність до
множини”.
○ Поняття класу має відкритий, інтенсіональний характер; поняття
множини – закритий, екстенсіональний.
○ Поняття множини передбачає певну сукупність об’єктів.
○ З іншого боку, поняття класу характеризує набір властивостей, які
повинні бути притаманні екземплярам цього класу.
○ Клас за визначенням об’єднує однотипні елементи, множина – не
обов’язково.
ЗВ’ЯЗКИ МІЖ ІНФОРМАЦІЙНИМИ ОДИНИЦЯМИ

○ Корисно виділити такі типи множин:


● екстенсіонал класу – множина екземплярів класу; можна розглядати
ті чи інші підмножини множини екземплярів класу;
● агрегатна множина – множина, яка складається з різнотипних
елементів.
○ З сказанного випливає, що відношення “елемент – множина”
відноситься до агрегації, а не до узагальнення.
○ Це відношення, так само, як і відношення “екземпляр-клас” не
є транзитивним
3.7. ПОНЯТТЯ КАНОНІЧНОЇ ФОРМИ
СКЛАДНОЇ СИСТЕМИ
○ Між узагальненням та агрегацією існує тісний
взаємозв’язок.
○ Складні системи можуть бути описані у вигляді
деякої канонічної форми, яка являє собою
композицією двох ієрархій - ієрархії класів та ієрархії
об’єктів.
○ Ієрархія класів задається відношенням
узагальнення
○ ієрархія об’єктів задається відношенням агрегації
ПРОБЛЕМА ВИКЛЮЧЕНЬ
○ З успадкуванням пов’язана дуже серйозна проблема –
проблема виключень. Вона пов’язана з тим, що деякі
підкласи можуть не успадковувати ті чи інші
властивості надкласів.
● Іншими словами, проблема полягає в тому, що характерні
риси класу успадковуються всіма його підкласами, крім
деяких.
○ Нехай, наприклад, відомо, що літають всі птахи,
крім пінгвінів (існують деякі інші види птахів, які не
літають, але для наших цілей це не має суттєвого
значення).
ПРОБЛЕМА ВИКЛЮЧЕНЬ
○ Експерт не завжди може сформулювати свої знання в
явному вигляді.
○ Зокрема, він може не знати або не пам’ятати всіх
виключень.
○ Тому він може спочатку включити до бази знань
твердження про те, що всі птахи літають, а потім
пригадати, що пінгвіни не літають, і додати це до
бази знань.
ПРОБЛЕМА ВИКЛЮЧЕНЬ
○ У цьому випадку кажуть про втрату монотонності
дедуктивної системи.
○ Система дедуктивного виведення називається
монотонною, якщо виконується наступна
властивість:
● якщо з набору тверджень (q1, … ,qn) випливає твердження
v, то v випливає і з набору тверджень (q1, … ,qn, r).
○ Іншими словами, в монотонній теорії додавання
нових фактів та правил не повинно впливати на
істинність висновків, які могли бути отримані без них.
ПРОБЛЕМА ВИКЛЮЧЕНЬ
○ Додавання ж виключень до наявної бази знань може
порушити монотонність.
○ Існує багато підходів до вирішення цієї проблеми.
○ Розвиваються спеціальні немонотонні логіки.
ПРОБЛЕМА ВИКЛЮЧЕНЬ
○ Корисний прийом: у випадку виникнення
суперечностей підклас успадковує відповідну
властивість лише від найближчого попередника,
тобто від класу, найближчого до нього в ієрархії
класів.
ПРОБЛЕМА ВИКЛЮЧЕНЬ
○ Проаналізувавши усе обговорене спробуємо
сформулювати властивості знань, що відрізняють їх
від даних.
3.8. ВЛАСТИВОСТІ ЗНАНЬ
○ Особливості знань, які відрізняють знання від
традиційних даних:
● внутрішня інтерпретованість: кожна інформаційна
одиниця повинна мати унікальне ім'я, за яким
інформаційна система її знаходить, а також відповідає на
запити, в яких це ім’я згадується;
● структурованість: знання повинні мати гнучку
структуру; одні інформаційні одиниці можуть включатися
до складу інших (відношення типу "частина-ціле",
"елемент-клас");
ВЛАСТИВОСТІ ЗНАНЬ
● зв’язність: в інформаційній системі повинна бути
передбачена можливість встановлення різних типів
зв’язків між різними інформаційними одиницями
(причинно-наслідкові, просторові та ін.);
● семантична метрика: на множині інформаційних
одиниць корисно задавати відношення, які характеризують
ситуаційну близькість цих одиниць;
● активність: виконання програм в інтелектуальній
системі повинно ініціюватися поточним станом бази
знань.
3.9. ЗАГАЛЬНА ХАРАКТЕРИСТИКА
МОДЕЛЕЙ ПОДАННЯ ЗНАНЬ
○ Для формалізації задання знань в системах штучного
інтелекту необхідні певні формалізми, які
називаються моделями задання знань, або просто
моделями знань.
○ Моделлю знань називається фіксована система
формалізмів (понять і правил), у відповідності до
яких інтелектуальна система подає знання в своїй
пам’яті та здійснює операції над ними.
ЗАГАЛЬНА ХАРАКТЕРИСТИКА
МОДЕЛЕЙ ПОДАННЯ ЗНАНЬ
○ Моделі задання знань необхідні:
● для створення спеціальних мов описів знань і
маніпулювання ними;
● для формалізації процедур співставлення нових
знань з уже існуючими;
● для формалізації механізмів логічного виведення.
ЗАГАЛЬНА ХАРАКТЕРИСТИКА
МОДЕЛЕЙ ПОДАННЯ ЗНАНЬ
○ Найбільш відомими є чотири класи моделей знань:
● логічні моделі;
● продукційні моделі;
● фреймові моделі;
● семантичні мережі.
3.10. НЕОДНОРІДНІСТЬ ЗНАНЬ.
ОБЛАСТІ ТА РІВНІ ЗНАНЬ
○ Для успішного здійснення операцій зі знаннями
необхідно виділяти в базі знань певні фрагменти, які
називаються областями знань.
○ Ці області знань повинні бути відносно незалежними
між собою.
○ Відносна незалежність означає таке:
● зміни в одній області знань не повинні призводити до
суттєвих змін в інших областях;
● вирішення складної задачі можна, як правило, звести до
підзадач так, що для вирішення кожної з цих підзадач
достатньо знань з однієї області.
НЕОДНОРІДНІСТЬ ЗНАНЬ. ОБЛАСТІ
ТА РІВНІ ЗНАНЬ
○ В залежності від постановки задачі можна по-різному
розділяти знання на області.
○ Так, для експертних систем, які ведуть діалог з
користувачем мовою, наближеною до природної,
можна виділяти такі області знань :
● предметна область, яка містить знання про
конкретну предметну галузь, в якій працює
експертна система;
● область мови, яка містить знання про мову, якою
ведеться діалог;
● область системи, яка містить знання експертної
системи про власні можливості;
НЕОДНОРІДНІСТЬ ЗНАНЬ. ОБЛАСТІ
ТА РІВНІ ЗНАНЬ
● область користувача, яка містить знання про
користувача. Наявність таких знань дозволяє
враховувати індивідуальні особливості кожного
користувача. Наприклад, пояснення користувачеві
можуть даватися в залежності від рівня його
підготовленості;
● область діалогу, яка містить знання про мету
діалогу, а також про форми та методи його
організації.
НЕОДНОРІДНІСТЬ ЗНАНЬ. ОБЛАСТІ
ТА РІВНІ ЗНАНЬ
○ Знання можуть розрізнятися за рівнем задання і
рівнем детальності.
● За рівнями задання виділяють знання нульового рівня
(конкретні і абстрактні знання) і знання більш високих
рівнів (метазнання). Перший рівень складають знання
про задання знань нульового рівня. Число рівнів може
бути продовжено.
● При класифікації знань за рівнями детальності береться
до уваги ступінь деталізації знань. Кількість рівнів
детальності залежить від специфіки задачі, обсягу знань і
моделі їх задання.
3.11. БАЗА ЗНАНЬ ЯК ОБ’ЄДНАННЯ
БІЛЬШ ПРОСТИХ ОДИНИЦЬ
○ Традиційно база знань є кон’юнкцією більш простих
тверджень.
○ Можна вважати, що кожне з яких відповідає окремому
реченню природної мови.
○ Подібні твердження часто називають концептуальними
одиницями.
○ Концептуальна одиниця може бути або фактом, або
правилом виведення.
○ Якщо концептуальна одиниця являє собою факт, вона може
бути описана деяким предикатом, тобто логічною
функцією, що залежить від певної кількості змінних і може
приймати одне з двох можливих значень: істинність або
хибність.
БАЗА ЗНАНЬ ЯК ОБ’ЄДНАННЯ БІЛЬШ
ПРОСТИХ ОДИНИЦЬ
○ Конкретні твердження утворюються з відповідних
предикатів шляхом підстановки конкретних значень
аргументів.
○ При цьому для опису одного й того самого
твердження можна використовувати різні предикати.
БАЗА ЗНАНЬ ЯК ОБ’ЄДНАННЯ БІЛЬШ
ПРОСТИХ ОДИНИЦЬ
○ Так, наприклад, три твердження:
7+5=12
8+9=17
3+4=7
відповідають одному предикатові
Плюс(a,b,c).
БАЗА ЗНАНЬ ЯК ОБ’ЄДНАННЯ БІЛЬШ
ПРОСТИХ ОДИНИЦЬ
○ Але можна розглядати інший, більш загальний
предикат:
● Операція (назва_операції,а,b,c),
○ який можна використовувати для запису тверджень не
тільки про додавання, але й про будь-яку іншу
бінарну операцію: множення, ділення і т.п..
○ Зокрема, можливим є запис:
● Операція(Плюс, 7,5,12).
БІНАРНІ ПРЕДИКАТИ ТА ТРІАДА
“ОБ’ЄКТ-АТРИБУТ-ЗНАЧЕННЯ”
○ Концептуальна одиниця може бути достатньо
складною.
○ Тому концептуальну одиницю, що є фактом, часто
зручно розглядати як кон’юнкцію більш
елементарних тверджень, а саме – бінарних фактів,
кожний з яких описується бінарним предикатом,
тобто предикатом, який залежить від двох змінних.
○ Якщо формалізувати правила об’єднання бінарних
предикатів у більш складні одиниці, на основі
бінарних предикатів можуть бути сконструйовані як
завгодно складні твердження та системи знань.
БІНАРНІ ПРЕДИКАТИ ТА ТРІАДА
“ОБ’ЄКТ-АТРИБУТ-ЗНАЧЕННЯ”
○ Розглянемо приклад.
○ Маємо твердження “Студент Іванов отримав
п’ятірку на іспиті з штучного інтелекту”.
○ Якщо переписати цю фразу у вигляді кон’юнкції
бінарних фактів, запис може мати вигляд:
● Є (Іванов, Студент)
● Є (Ісп_Шт_Інт, Іспит)
● Ісп_Шт_Інт (Іванов, 5)
○ Предикат Ісп_Шт_Інт був введений для задання
зв’язку між різними інформаційними одиницями.
БІНАРНІ ПРЕДИКАТИ ТА ТРІАДА
“ОБ’ЄКТ-АТРИБУТ-ЗНАЧЕННЯ”
○ У вигляді бінарного можна переписати і унарний
предикат, тобто предикат, який залежить від однієї
змінної.
● Наприклад, предикат Птах(Х), який означає, що Х є
птахом, можна переписати в еквівалентному вигляді
○Є (Х, Птах).
○ Якщо певний унарний предикат описує властивість
об’єкту, наприклад:
● Літає(Х),
○ її можна переписати у вигляді
● Літає(Х, так)
БІНАРНІ ПРЕДИКАТИ ТА ТРІАДА
“ОБ’ЄКТ-АТРИБУТ-ЗНАЧЕННЯ”
○ Бінарним предикатам і бінарним фактам
безпосередньо відповідає тріада “об’єкт-атрибут-
значення”.
● “Об’єкт” у цій тріаді – це, як правило, назва деякої
інформаційної одиниці.
● “Атрибут” – це назва деякої ознаки
● “значення” – конкретне значення цієї ознаки для даного
об’єкта.
○ Тріада “об’єкт-атрибут-значення” є просто іншою
формою запису бінарного факту.
3.12. ПРОБЛЕМА НЕТОЧНИХ ТА
НЕПОВНИХ ЗНАНЬ
○ Знання можуть бути неповними.
○ Це означає, що для доведення або спростування
певного твердження може не вистачати інформації.
○ У багатьох системах логічного виведення прийнятий
постулат замкненості світу.
○ Це означає, що на запит про істинність деякого
твердження система відповідає «так» тоді і тільки
тоді, коли його можна довести; якщо ж довести це
твердження неможливо, система відповідає «ні».
ПРОБЛЕМА НЕТОЧНИХ ТА
НЕПОВНИХ ЗНАНЬ
○ Водночас «неможливо довести через нестачу
інформації» і «доведено, що ні» - це зовсім не одне й
те саме.
○ З огляду на це бажано, щоб експертна система
запитувала у користувача про факти, яких не
вистачає.
ПРОБЛЕМА НЕТОЧНИХ ТА
НЕПОВНИХ ЗНАНЬ
○ Знання можуть бути недостовірними.
○ Наприклад, на результат виконання продукції можуть
впливати випадкові чинники (“об’єктивна”
невизначеність), або ж експерт може бути не зовсім
упевненим у деякому факті чи правилі виведення
(“суб’єктивна” невизначеність).
○ Ненадійність знань і недостовірність наявних фактів
обов’язково повинні враховуватися в процесі логічних
побудов.
3.13. ПрикладиБЗ
○ Приклад бази знань – Cyc.
○ Cyc (від encyclopaedia) — проект в галузі штучного
інтелекту що старається скласти вичерпну онтологію
та базу знань повсякденного здорового глузду, з
метою дати змогу застосуванням штучного інтелекту
виконувати міркування як люди.
○ Проект початий в 1984 Дугласом Ленатом в
Microelectronics and Computer Technology Corporation
і розробляється в компанії Cycorp.
○ Частини проекту випущена як OpenCyc.
○ Назви коцептів в Cyc відомі як константи.
○ Константи починаються з необов'язкового "#$" та
чутливі до регістру.
○ Існують константи для:
● Окремих речей, названих особовими, таких як
#$BillClinton чи #$France.
● Колекцій, таких як #$Tree-ThePlant (містить всі дерева, не
графи) чи #$EquivalenceRelation (містить всі відношення
еквівалентності). Член колекції називається її екзепляром.
○ Функції істини що можуть застосовуватись до одного
чи кількох концептів, і повертати true чи false.
● Наприклад #$siblings - відношення брат-або-сестра, яке
має значення true якщо два аргументи - брати або сестри.
● За домовленістю константи функцій істини починаюються
з літери в нижньому регістрі.
○ Функції істини можуть розбиватись на логічні зв'язки
(такі як #$and, #$or, #$not, #$implies), квантори
(#$forAll, #$thereExists, і т. д.) та предикатів.
○ Функції, які утворюють нові терми з наявних.
● Наприклад, #$FruitFn, коли їй дадуть аргумент що описує
тип (чи колекцію) рослин, поверне колекцію їх фруктів.
● За домовленістю константи функцій починаються з
великої літери і закінчуються символами "Fn".
○ Найважливішими предикатами є #$isa та #$genls.
● Перший визначає чи є елемент екземпляром колекції,
інший чи є колекція підколекцією іншої.
○ Приклади:
● (#$isa #$BillClinton #$UnitedStatesPresident)
○ Білл Клінтон належить колекції американських
президентів
● (#$genls #$Tree-ThePlant #$Plant)
○ "Всі дерева - рослини“
● (#$capitalCity #$France #$Paris)
○ "Париж це столиця Франції."
КРИТИКА CYC
○ Проект Cyc описувався як "одне з найсуперечливіших зусиль в
історії штучного інтелекту“, і звісно отримав свою долю
критики.
○ Вона включала:
● Складність системи - можливо вимушена її енциклопедичними
амбіціями - і як наслідок складність в ручному додаванні інформації
до системи
● Проблеми з масштабованістю, пов'язані з тим, що твердження
мають залежні твердження, і як наслідок кількість зв'язків між ними
зростає експоненційно.
● Відсутність способів оцінки продуктивності машини виведення
● Поточна незавершеність системи як в ширину так і в глибину, і
складність в оцінці її завершеності.
● Обмежена документація, і нестача навчального матеріалу
● Велика кількість пропусків не тільки в онтології рядових об'єктів,
але й майже повна нестача прийнятних тверджень що описують ті
об'єкти.
WOLFRAMALPHA
○ WolframAlpha — база знань і набір обчислювальних
алгоритмів.
○ Не є пошуковою системою.
○ Запущено 15 травня 2009.
WOLFRAMALPHA
○ WolframAlpha не видає перелік посилань, що
ґрунтується на результатах запиту, а обчислює
відповідь, ґрунтуючись на власній базі знань, яка
містить дані з математики, фізики, астрономії, хімії,
біології, медицини, історії, географії, політики,
музики, кінематографії, а також інформацію про
відомих людей та інтернет-сайти.
WOLFRAMALPHA
○ Він здатний переводити дані між різними одиницями
вимірювання, системами числення, підбирати
загальну формулу послідовності, знаходити можливі
замкнуті форми для наближених дробових чисел,
обчислювати суми, границі, інтеграли, розв'язувати
рівняння і системи рівнянь, проводити операції з
матрицями, визначати властивості чисел і
геометричних фігур.
○ Однак, розрахунок на підставі власної бази має і свої
недоліки, в тому числі — вразливість до помилок
даних.
ТЕМИ ДЛЯ ОБГОВОРЕННЯ
○ Охарактеризуйте основні проблеми, які доводиться
вирішувати при розробці експертних систем і баз
знань.
● Наведіть приклади.
○ Дякую за увагу.

You might also like