You are on page 1of 5

Лабораторна робота №4 з курсу “Інформатика

(обчислювальна техніка та програмування)”


Тема: Отримання регресійних та кореляційних моделей для прогнозування
процесів

Мета: ознайомлення зі способами побудови за експериментальними даними


регресійної та кореляційної моделі процесу та графічного тренду засобами Microsoft
Excel.

Завдання:
1. Побудова регресійної моделі та графічного тренду ринку професій.
2. Визначення кореляційних залежностей між об'єктами впливу на ринок
професій.

Теоретичні відомості
Залежність між величинами та їх вплив на кінцевий результат діяльності можна
встановити лише експериментальним шляхом: за допомогою збору численних даних,
їх аналізу та узагальнення.
Під час вирішення таких проблем на допомогу приходить статистика. Існують
медична статистика, економічна статистика, соціальна статистика та інші.
Математичний апарат статистики розробляє наука під назвою математична
статистика.
Поставивши за мету визначити залежність, фахівці зі статистики проводять збір
даних. Отримані дані можна звести до таблиці, а також подати у вигляді точкової
діаграми.

Приклад табличного та графічного зображення залежності

Статистичні дані завжди є наближеними, усередненими. Тому вони мають


оціночний характер, але вірно відбивають характер залежності величин. Важливе
зауваження: для достовірності результатів, отриманих шляхом аналізу
статистичних даних, цих даних має бути багато.
З отриманих даних можна визначити залежність між різними аспектами. Для
того, щоб побудувати математичну модель певного явища, потрібно отримати
формулу, яка відображає цю залежність. Мовою математики це називається функцією
залежності. Вигляд такої функції невідомий, її слід шукати методом підбору за
експериментальними даними.
Графік функції, яку необхідно визначити, має проходити близько до точок
діаграми експериментальних даних. Будувати функцію так, щоб її графік точно
проходив через усі дані точки, не має сенсу. По-перше, математичний вигляд такої
функції може виявитися занадто складним. По-друге, експериментальні значення є
наближеними.
Основні вимоги до функції, яку необхідно підібрати:
– вона має бути досить простою для використання її у подальших обчисленнях;
– графік цієї функції повинен проходити поблизу експериментальних точок так,
щоб відхилення цих точок від графіка були мінімальні та рівномірні.

Приклад побудови графічної залежності за експериментальними даними

Отриману функцію, у статистиці прийнято називати регресійною моделлю.


Отримання регресійної моделі відбувається у два етапи:
1) добір виду функції;
2) обчислення параметрів функції.
Перший етап спирається на досвід та інтуїцію дослідника, або на метод перебору
з кінцевого числа функцій та вибір кращої з них.
Найчастіше вибір проводиться серед таких функцій:
y=ax+b – лінійна функція;
y=ax2+bx+c - квадратична функція;
у = а ln(x) + b - логарифмічна функція;
у = аеbх – експоненціальна функція;
у = ахb - ступенева функція.

Графік регресійної моделі називається трендом. Англійське слово trend можна


перекласти як «загальний напрям» або «тенденція»).
Графік лінійної функції - це пряма. Отримана пряма відображає факт зростання
зменшення факторів, але за цим графіком важко щось сказати про характер цього
зростання. А ось квадратичний та експоненційний тренди є більш правдоподібними.
На графіках присутня величина, отримана внаслідок побудови трендів. Вона
позначена як R2 • У статистиці ця величина називається коефіцієнтом
детермінованості. Саме вона визначає, наскільки вдалою є одержана регресійна
модель. Коефіцієнт детермінованості завжди укладено в діапазоні від 0 до 1. Якщо він
дорівнює 1, то функція точно проходить через табличні значення, якщо 0, то
вибраний вид регресійної моделі гранично невдалий.
Регресійні математичні моделі будуються в тих випадках, коли відомо, що
залежність між двома факторами існує і потрібно отримати її математичний опис. Але
в статистиці існують більш розширені задачі, що враховують більш значну кількість
факторів. Нехай важливою характеристикою деякої складної системи є фактор А. На
нього можуть впливати одночасно багато інших фактори: В, С, D тощо.
1) Чи надає фактор В помітний регулярний вплив на фактор А?
2) Які з факторів В, С, D надають найбільший вплив на чинник А?
Фахівці зі статистики знають, що для того, щоб виявити залежність від якогось
певного чинника, потрібно максимально виключити вплив інших чинників.
Підсумки збору даних зазвичай зведені в електронну таблицю. Залежність між
величинами, кожна з яких піддається не повністю контрольованому розкиду,
називаються кореляційними залежностями.
Розділ математичної статистики, який досліджує такі залежності, називається
кореляційним аналізом. Кореляційний аналіз вивчає усереднений закон
поведінки кожної з величин в залежності від значень іншої величини, а також міру
такої залежності.
Оцінку кореляції величин починають з висловлювання гіпотези про можливий
характер залежності між їх значеннями.
Найчастіше припускають наявність лінійної залежності. У такому випадку мірою
кореляційної залежності є величина, яка називається коефіцієнтом кореляції.
Основні характеристики коефіцієнта кореляції:
– коефіцієнтом кореляції ρ є число з діапазону від -1 до +1;
– якщо це число по модулю близько до 1, то має місце сильная кореляція; якщо
ближче до 0 – слабка;
– близькість ρ до +1 означає, що зростанню значень одного набору відповідає
зростання значень іншого набору, близькість ρ до -1 означає, що зростання значень
одного набору відповідає спадання значень іншого набору;
Значення ρ легко знайти за допомогою Microsoft Excel, оскільки в цю програму
вбудовано відповідні формули.

Порядок виконання роботи

Частина 1. Побудова регресійної моделі для аналізу ринку професій


Визначення залежності заробітної плати від кількості населення у населенному
пункті
1. Створити таблицю засобами Microsoft Excel, в якій розмістити дані про середню
заробітну плату по містах за обраною професією в залежності від кількості
населення.
a. Створити у програмному середовищі Microsoft Excel таблицю, що
складається з трьох колонок – «середня заробітна плата», «місто або
населений пункт» та «кількість населення» та 10-ти рядків для
заповнення
Середня Місто або Кількість
заробітна населений населення,
плата, грн пункт тис.чол.

b. Обрати професію, для якої буде побудовано регресійну модель. За


допомогою інтернет-ресурсу www.work.ua визначити середню зарплатню
з обраної вакансії у 10-ти містах України.
Середню зарплатню визначати як середнє арифметичне з вакансій по
місту. Для розгляду бажано брати не тільки обласні центри, а і
маленькі міста, де представлені вакансії з обраної галузі.
c. Заповнити таблицю даними. Внести у таблицю дані по кожному з десяти
обраних міст – середню зарплату, назву міста та кількість населення в
ньому.
d. Провести сортування даних у порядку зменшення за колонкою «кількість
населення».
2. Представити залежність у вигляді точкової діаграми, обрати варіант
оформлення, створити позначення осей діаграми. Діаграму створювати за
значеннями колонок «кількість населення» – вісь Х та «середня заробітна
плата» – вісь У.
3. Отримати три варіанти регресійних моделей (три графічних тренди)
залежності суми заробітної плати від кількості населення певного регіону
a. Для отримання лінійного тренду виконати наступні дії:
–Діаграма/Додати лінію тренда/обрати Тип Лінійний тренд. У вкладці
Параметри встановити властивості Показувати рівняння на діаграмі та
Розмістити на діаграмі величину R2 .
– (при використанні редактора Google Таблиць – Діаграма/Діапазон
даних/Додатково/Лінія тренду. Обрати тип залежності Лінійний,
увімкнути функцію показати R2, у пункті Ярлик обрати значення
Рівняння).
b. Отримати експоненціальний тренд. Повторити дії з попереднього пункту,
у вкладці Тип обрати Експоненціальний тренд
c. Отримати квадратичний тренд. Повторити дії з попереднього пункту, у
вкладці Тип обрати Поліномальний тренд
4. Зробити висновки відносно взаємозалежності різних аспектів даного
дослідження.

Частина 2. Визначення кореляційних залежностей між об'єктами впливу


на ринок професій
Аналіз звязку рівня ВВП областей України з рівнем середньої заробітної плати
по регіону та результатми ЗНО
1. Створити у програмному середовищі Microsoft Excel таблицю, що складається з
чотирьох колонок – «середня заробітна плата», «назва області», «ВВП області»,
«середній бал ЗНО» та 5-ти рядків для заповнення
Назва області ВВП області, Середня Середній
млн.грн заробітна бал ЗНО
плата, грн

2. Обрати професію, для якої буде побудовано регресійну модель. За допомогою


інтернет-ресурсу www.work.ua визначити середню зарплатню з обраної вакансії
у 5-ти областях України.
3. Заповнити таблицю даними. Внести у таблицю дані по кожній з п'яти областей
– середню зарплату, назву області,ВВП області та середній результат тестування
ЗНО за 2022 рік (дані про результати ЗНО можна брати з ресурсу
https://osvita.ua/school/rating/83737/).
4. Провести сортування даних у порядку зменшення за колонкою «ВВП області».
5. Представити залежність у вигляді двох точкових діаграм (на одному аркуші),
обрати варіант оформлення, створити позначення осей діаграми. Діаграми
створювати за значеннями колонок:
–для першої діаграми: «ВВП області» – вісь Х, «середня заробітна плата» –
вісь У «середня заробітна плата» – вісь У
–для другої діаграми: «ВВП області» – вісь Х, «середня заробітна плата» – вісь
У «середній бал ЗНО» – вісь У
6. Отримати два варіанти регресійних моделей (два графічних тренди) залежності
суми заробітної плати від кількості населення певного регіону та середніх
результатів ЗНО по регіону.
7. Зробити висновки відносно чинників, що впливають на тенденції росту чи
зменшення заробітної плати та рівня навчання населення в регіоні.
8. Оформити протокол роботи у вигляді звіту. Звіт повинен містити: титульний
аркуш із зазначенням теми роботи та даними студента, мету та завдання
лабораторної роботи, опис виконання ходу роботи з відповідними графічними
матеріалами, висновки.

You might also like