You are on page 1of 8

Лекція 1. Тема: «Інформація, дані та інформаційні системи.

Технології баз даних»


План лекції

1 Інформація й дані
2 Інформаційні системи
3 Основні підходи до обробки інформації в автоматизованих інформаційних
системах.
4 Технології баз даних
Зміст лекції
1. Інформація й дані
Перш ніж перейти до обговорення поняття інформаційної системи (ІС),
спробуємо з'ясувати, що ж розуміється під словом "інформація". Відповісти на це
питання і просто, і складно: слово "інформація" пов'язане із широким колом понять.
Змістовна сторона поняття "інформація" дуже багатогранна й не має чітких
семантичних меж. Однак завжди можна сказати, що можна з нею робити. Саме
відповідь на це запитання найчастіше й цікавить як системних аналітиків і
розроблювачів ІС, так і користувачів інформації (її основних споживачів).
З погляду як користувачів, так і розроблювачів ІС в інформації є одна важлива
властивість - вона є одиницею даних, яка підлягає обробці. Звичайно інформація
надходить споживачеві саме у вигляді даних: таблиць, графіків, малюнків, фільмів,
усних повідомлень, які фіксують у собі інформацію певної структури й типу. Таким
чином, дані виступають як засіб подання інформації у певній, фіксованій формі,
придатній для обробки, зберігання й передачі. Хоча дуже часто терміни "інформація" й
"дані" виступають як синоніми, варто пам'ятати про цю їхню істотну відмінність. Саме
в даних інформація знаходить інтерпретацію у конкретній ІС.
При згадуванні про "форму" подання інформації варто сказати ще про одну,
"людську" властивість інформації - її сприйняття різними категоріями людей. Дані
можуть бути згруповані спільно у документ. Документ може мати або не мати певної
внутрішньої структури. Дані можуть бути відображені на екрані дисплея комп'ютера.
Документи можуть мати аудіо- або відеоформу. Розробляючи ІС, ніколи не слід
забувати, для кого вони (системи) створюються і хто буде їх використовувати. Форма
подання інформації в ІС визначає також і категорії користувачів. ІС створюються для
конкретних груп користувачів, тобто вони, як правило, проблемно-орієнтовані.
Інформація є даними, яким надається деякий зміст (інтерпретація) у конкретній
ситуації у рамках деякої системи понять. Інформація подається за допомогою
кодування даних і здобувається шляхом їхнього декодування та інтерпретації.
У цьому визначенні фіксується три основних перетворення інформації й даних у
процесі їхньої обробки в ІС: інформація – дані, дані – дані, дані – інформація.
На рисунку 1 наведені дві сторони визначення поняття інформації:
функціональна й представницька. Перша загалом визначає коло дій над інформацією,
а друга – результат виконання цих дій.
Рисунок 1 – Зміст поняття "інформація"
2. Інформаційні системи
Основною метою створення ІС є задоволення інформаційних потреб
користувачів шляхом надання необхідної їм інформації на основі збережених даних.
Потреба в інформації як такій не вичерпує поняття інформаційних потреб. Звичайно в
поняття інформаційних потреб включають певні вимоги до якості інформаційного
обслуговування й поводження системи в цілому (продуктивність, актуальність і
надійність даних, орієнтація на користувача та ін.).
Під інформаційною системою розуміється організаційна сукупність технічних
засобів, технологічних процесів і кадрів, що реалізують функції збору, обробки,
зберігання, пошуку, видачі й передачі інформації.
Необхідність підвищення продуктивності праці у сфері інформаційної діяльності
приводить до того, що в якості зовнішніх засобів зберігання й швидкого доступу до
інформації найчастіше використовуються засоби обчислювальної техніки (цифровий і
аналоговий) на основі комп'ютерів. Сучасні ІС - складні комплекси апаратних і
програмних засобів, технології й персоналу, які ще називають автоматизованими
інформаційними системами.
Структурно ІС містять у собі апаратне (hardware), програмне (software), комунікаційне
(netware), проміжного шару (middleware), лінгвістичне й організаційно-технологічне
забезпечення.
Апаратне забезпечення ІС містить у собі широкий набір засобів обчислювальної
техніки, передачі даних, а також цілий ряд спеціальних технічних пристроїв (пристрою
графічного відображення інформації, аудио- і відеопристрою, засобу мовного уведення
й т.д.). Апаратне забезпечення є основою будь-якої ІС.
Комунікаційне (мережне) забезпечення містить у собі комплекс апаратних
мережних комунікацій і програмних засобів підтримки комунікацій в ІС. Воно має
істотне значення при створенні розподілених ІС й ІС на основі Інтернету.
Програмне забезпечення ІС забезпечує реалізацію функцій введення даних, їх
розміщення на носіях, модифікації даних, доступ до даних, підтримку функціонування
устаткування. Програмне забезпечення можна розділити на системне (яке завершує
процес вибору апаратно-програмного рішення або платформи) і користувацьке (яке
застосовується для вирішення завдань задоволення потреб користувача у
комп'ютерному середовищі).
Лінгвістичне забезпечення ІС призначене для вирішення завдань формалізації
змісту повнотекстової і спеціальної інформації для створення пошукового образу даних
(профілю). У класичному змісті звичайно воно включає процедури індексування
текстів, їхню класифікацію і тематичну рубрикацію. Найчастіше ІС, що містять
складно-структуровану інформацію, містять у собі тезауруси термінів і понять. Сюди
можна віднести й створення процесорів спеціалізованих формальних мов кінцевих
користувачів, наприклад, мов для маніпулювання бухгалтерською інформацією і т.д.
Найчастіше працям з розроблення лінгвістичного забезпечення не надається належного
значення. Подібні недогляди найчастіше призводять до несприйняття користувачами
самої інформації. Це стосується в першу чергу вузько спеціалізованих ІС.
У міру зростання складності і масштабів ІС важливу роль починає відігравати
організаційно-технологічне забезпечення, що з'єднує різнорідні компоненти
(апаратури, програми й персонал) у єдину систему й забезпечує процедури її керування
й функціонування. Недооцінка цієї складової ІС найчастіше призводить до зриву
строків впровадження системи й виведення її на виробничі потужності.
На рисунку 2 наведені функції ІС через її основні структурні компоненти.

Рисунок 2 – Визначення інформаційної системи

3 Основні підходи до обробки інформації в автоматизованих інформаційних


системах
Одним з головних питань розроблення програмного забезпечення ІС є питання
про співвіднесення програм і даних, тому що вирішення цього питання, в остаточному
підсумку, визначає вибір алгоритмів обробки інформації, апаратних засобів і
технологічної платформи. Фундаментальним принципом у вирішенні питання про
співвіднесення програм і даних є концепція незалежності прикладних програм від
даних, і неважливо, яка обробка даних передбачається: централізована або розподілена.
Суть цієї концепції полягає не стільки у відділенні програм від даних, скільки у розгляді
їх як самостійних взаємодіючих об'єктів.
Однією з останніх модифікацій цього принципу є концепція незалежності
прикладних програм від даних разом із процедурами їхньої обробки (об’єктно-
орієнтований підхід у програмуванні), що дозволяє вирішити ряд питань обробки
даних, пов'язаних з інтерпретацією семантичного змісту даних.
Формування концепції БД і створення на її основі методу баз даних для
вирішення завдань обробки інформації відбулося у 1962 році. До середини 60-х років
минулого століття основною концепцією побудови програмного забезпечення були
концепція файлової системи і так званий позадачний метод. Наприкінці 80-х років
минулого століття була запропонована концепція об’єктно-орієнтованих баз даних й
об’єктно-орієнтований підхід розроблення програм на основі обробки подій. На
рисунок 3 наведені основні ознаки для кожної з зазначених вище концепцій. На рисунку
4 проведене зіставлення основних методів обробки даних.

Рисунок 3 – Основні концепції обробки інформації

Рисунок 4 – Основні проблеми методів обробки інформації


Основний зміст позадачного методу зводиться до декомпозиції програми зі
своїми окремими блоками даних та алгоритмами; методу баз даних – до наявних
окремих описів логічної структури даних та єдиної точки зору щодо процедури
обробки даних; об'єктно- орієнтованого методу – полягає в тому, що програми
розглядаються як сукупність об'єктів, між якими відбувається обмін інформацією.
Об'єкту притаманні такі властивості:
інкапсуляція – об'єкти наділяються структурою й мають певне поводження
(набором операцій). Операції над об'єктами становлять його методи. Структура
об'єкта захована від користувача, що маніпулює об'єктом через його операції.
Об'єкт розглядається як абстракція реального світу Для того щоб об'єкт виконав
деяку дію, йому потрібно надіслати повідомлення.
Об'єкт взаємодіє з іншими об'єктами через події; спадкування – являє собою
механізм, що дозволяє робити одні об'єкти з інших, при цьому властивості
батьківського об'єкта зберігаються у нащадка;
поліморфізм – різні об'єкти можуть одержувати однакові повідомлення, але
реагувати на них по-різному відповідно до реалізації своїх однойменних методів.
Отже, при розробленні автоматизованих ІС слід пам’ятати:
ІС створюються для конкретних груп користувачів, тобто вони є проблемно-
орієнтовані;
основною метою створення ІС є задоволення інформаційних потреб користувачів
шляхом надання необхідної їм інформації на основі збережених даних;
сучасні ІС - складні комплекси апаратних і програмних засобів, технології й
персоналу, які ще називають автоматизованими інформаційними системами;
дотримання концепції незалежності прикладних програм від даних разом із
процедурами їхньої обробки (об’єктно орієнтований підхід у програмуванні)
дозволяє вирішити ряд питань обробки даних, пов'язаних з інтерпретацією
семантичного змісту даних;
ІС працює з упорядкованими взаємозалежними даними, які зберігаються з
мінімальною надлишковістю та становлять базу даних. Системою керування
базами даних називається сукупність програмних засобів, необхідних для
використання БД і подання розробникам і користувачам безлічі різних подань
даних.
4. Технології баз даних
Виникнення технологій баз даних припадає на початок 60-х років. Їх швидкому
розвитку сприяли потреби в обробці інформації, досягнення в суміжних областях
інформаційних технологій таких, як операційні системи, мови програмування, технічне
забезпечення. Спочатку зароджувалися певні ідеї щодо управління ресурсами даних,
формувалися основи методології побудови систем баз даних. Із самого початку було
зрозуміло, що цей напрям має самостійне значення і буде відігравати одну з ключових
ролей у побудові інформаційних систем різного призначення.
Інформаційні задачі на відміну від обчислювальних мають такі особливості:
− збереження даних складної структури;
− відносно прості алгоритми обробки;
− великі обсяги оброблюваної інформації.
Інформаційна система виконує функції збирання, зберігання, розповсюдження і
обробки інформації. Під інформацією розуміють будь-які відомості про будь-яку
подію, сутність, процес і т.ін., які є об'єктом певних операцій: передачі, перетворення,
зберігання або використання. Дані можна визначити, як інформацію зафіксовану у
певній формі, яка придатна для подальшої обробки, зберігання і передачі (рис. 5).
Предметна область – область застосування конкретної бази даних.
Інформації відповідає
інфологічне представлення,
яке розглядає питання пов'язані
зі змістом інформації,
незалежно від представлення її
в пам'яті комп'ютера.
Даталогічне представлення
розглядає питання
представлення даних в пам'яті
комп'ютера.
Функції управління
інформацією в інформаційних
системах виконують системи
управління базами даних.
Рис.5. Зв'язок між інформацією і даними
Спочатку для збереження даних застосовувалися файлові системи (рис. 6). Для
цих систем були характерні такі особливості:
− структура запису файла даних була відома тільки прикладній програмі, яка з ним
працювала, а система управління файлами її не знала; кожна програма, яка
працювала з файлом даних, повинна була мати у себе структуру даних, яка
відповідала цьому файлу (така ситуація характеризувалась, як залежність
програм від даних);
− система управління файлами повинна була забезпечити авторизацію доступу до
файлів для різних користувачів, але були відсутні централізовані методи
управління доступом до інформації;
− для організації паралельної роботи користувачів з даними необхідне узгоджене
управління, а система управління файлами при цьому працювала надто повільно.
Для подолання цих недоліків практично паралельно почалися роботи над
ієрархічними і мережними базами даних (БД) і над відповідними системами
управління цими БД − СУБД. В основі цих БД лежали відповідні моделі даних:
ієрархічні і мережні (рис. 6).
Ці моделі належать до теоретико-графових моделей. До переваг цих БД можна
віднести ефективне використання пам'яті комп'ютера, швидке виконання основних
операцій над даними. Недоліками цих БД є таке:
− труднощі при обробці інформації з достатньо складними зв'язками;
− складність розуміння змісту звичайним користувачем, залежність від
фізичної реалізації.
На початку 70-х років були сформовані теоретичні основи сучасних
технологій БД і остаточно сформувався самостійний напрям інформаційних
технологій – наука о базах даних. Головною подією цього періоду стало
виникнення реляційних баз даних. В основі реляційної моделі лежить поняття
відношення. Реляційна модель є простою і зрозумілою, а її фізичне представлення
добре реалізується на комп'ютері. До недоліків реляційних моделей можна
віднести складність реалізації ієрархічних і мережних зв'язків.
У 70-х роках почали формуватися підходи в БД, які пов'язані з
використанням апарата логіки в якості моделі даних. Ці роботи привели до
створення дедуктивних БД. Розвиток цього напряму дозволяє створювати бази
знань.

Рис. 6. Етапи розвитку баз даних


У 80-х роках реляційні БД набули домінуючого положення. Однак уже тоді
існувало і постійно розширювалося коло застосувань, для яких ця технологія була
неадекватною. Це стосується мультимедійних застосувань, систем, які оперують
просторовими даними і т.ін. В середині 80-х років успіхів досягло об'єктно-
орієнтоване програмування. Під його впливом і в зв'язку з необхідністю реалізації
нетрадиційних застосувань, вимоги яких погано узгоджуються з можливостями
реляційних систем, почались роботи з практичної реалізації об'єктно-
орієнтованих БД. Логічна структура об'єктно-орієнтованої БД зовні схожа на
структуру ієрархічної БД, але вона доповнена об'єктно-орієнтованими
механізмами. Об'єктно-орієнтовані БД у порівнянні з реляційними БД мають
можливість відображати інформацію о складних взаємозв'язках об'єктів,
визначати функції обробки окремих записів. До недоліків об'єктно-орієнтованих
моделей належить висока понятійна складність, низька швидкість
виконання запитів, незручність обробки даних.
Бажання розробників реляційних БД зберегти лідируючі позиції і
підвищити ефективність реляційної моделі, привели до розробки об'єктно-
реляційної моделі, на основі якої почали розроблятися об'єктно-реляційні БД. В
цих моделях припускається застосування багатозначних полів – полів, які
складаються з підзначень. Ці БД дозволяють забезпечити високу наглядність
представлення інформації і підвищити ефективність її обробки. До недоліків
об'єктно-реляційних моделей можна віднести складність рішення забезпечення
цілісності і несуперечливості даних.
На початку 90-х років почало збільшуватися значення інформаційного
забезпечення систем підтримки прийняття рішень. Це привело до необхідності
створення багатомірних СУБД і на їх основі розробки інформаційних сховищ. Ці
системи використовують історичну інформацію, яка представляється в
агрегованому вигляді. На основі цієї інформації виконується аналітична обробка,
прогнозування даних, а також інтелектуальний аналіз даних.
В цей час також велика увага приділялася розвитку розподілених систем.
Успіхи в розробці комп'ютерних мереж стимулювали дослідження в технологіях
розподілених БД, були розроблені архітектурні концепції клієнт – сервер.
Одним з найбільших досягнень 90-х років в області інформаційних
технологій стало створення відкритої глобальної розподіленої неоднорідної
гіпермедійної інформаційної системи, яка використовує комунікаційну мережу
Internet. Ця система отримала назву WWW (Web). З самого початку виконувались
спроби інтегрувати системи БД у Web. Одним з напрямів роботи є інтеграція
структурованих даних БД і слабкоструктурованих даних Web, проводяться
роботи зі створення БД на мові XML.
У даний час в багатьох комп'ютерних компаніях здійснюються роботи зі
створення цифрових бібліотек −інформаційних систем, які призначені для
зберігання, пошуку, обробки, аналізу і розповсюдження інформаційних ресурсів
різної природи – структурованих і слабкоструктурованих даних, мультимедійної
інформації, повнотекстових документів. Для створення таких систем
використовуються Web-технології, розробляються методи інтеграції
неоднорідних ресурсів, розпізнавання і пошуку інформаційних ресурсів.

You might also like