You are on page 1of 8

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ

ТЕРНОПІЛЬСЬКИЙ НАЦІОНАЛЬНИЙ ТЕХНІЧНИЙ УНІВЕРСИТЕТ


ІМЕНІ ІВАНА ПУЛЮЯ

Кафедра комп’ютерних наук

ЗВІТ
до лабораторної роботи №1
На тему: «Первинна статистична обробка даних. Дослідження розподілу
даних»
З дисципліни: «Інтелектуальний аналіз даних»

Виконала:
студентка групи СН-32
Мельничук О. С.
Перевірила:
Козбур Г. В.

Тернопіль 2022
Тема: Первинна статистична обробка даних. Дослідження розподілу даних.
Мета: Освоєння методів первинної статистичної обробки та дослідження
закону розподілу даних.
Завдання: використовуючи електронні таблиці Excel, навчитись знаходити
числові характеристики та визначати тип розподілу неперервних даних.
Хід виконання роботи
Робота над лабораторною роботою проводилася згідно 1 варіанту (рис. 1).

Рисунок 1 – Скріншот індивідуального завдання з номером варіанту

З усіх наявних абітурієнтів 121 спеціальності обираємо конкурсні бали лише


тих, які були зараховані. Декілька перших зарахованих студентів та шапку таблиці
можна побачити на рисунку 2.

Рисунок 2 – Скріншот шапки таблиці та перших студентів

А також декілька останніх зарахованих студентів можна побачити на


рисунку 3.

2
Рисунок 3 – Скріншот останніх зарахованих студентів

Дані навчальної вибірки, згідно з призначеним варіантом, переносимо в


електронні таблиці MS Excel. Для цього скористаємося вбудованою можливістю
імпорту даних з інших джерел у програму (рис. 4).

Рисунок 4 – Спосіб перенесення даних

Далі вставляємо посилання сайту з таблицею абітурієнтів (рис. 5).

3
Рисунок 5 – Вставка посилання

В навігаторі бачимо усі таблиці, які використані на вказаному сайті.


Обираємо необхідну, з конкурсними балами, та тиснемо на «Перетворити дані»
(рис. 6).

Рисунок 6 – Вибір таблиці

Тепер редагуємо таблицю, а саме видаляємо всі зайві стовпці з прізвищами


та іншими непотрібними даними. За допомогою фільтру залишаємо лише тих
студентів, вступ яких позначений «+» (рис. 7), після чого також видаляємо
непотрібний стовпець, залишаючи виключно конкурсні бали різних абітурієнтів.
Вкінці натискаємо «Закрити й завантажити», аби відредагована таблиця з’явилася
на робочому аркуші.

4
Рисунок 7 – Редагування таблиці

Аби таблиця легше сприймалася, займала менше місця та була готова до


роботи, за допомогою сторонньої утиліти Kutools, переводимо один довгий
стовпець в кілька коротких рядків, обираємо місце вставки (рис. 8). Далі
залишається просто відредагувати назву та зовнішній вигляд таблиці.

Рисунок 8 – Переведення стовпця в діапазон

5
Надалі працюємо за наведеними у методичці зразками. Результат першого
пункту можна побачити на рисунку 9.

Рисунок 9 – Результат початкових операцій з даними

Далі проводимо по аналогії з методичкою операції з даними до 5 пункту,


результат наведений на рисунку 10.

Рисунок 10 – Результат подальших операцій з даними

Тепер будуємо гістограму для візуалізації розподілу даних. У даній версії


програми це можна зробити за допомогою розділу «Вставлення», де бачимо
швидке створення потрібної гістограми (рис. 11).

6
Рисунок 11 – Побудова гістограми

Обираємо місце для гістограми, її назву, зовнішній вигляд та кількість


секцій у налаштуваннях формату осі. Результат зображений на рисунку 12.

Рисунок 12 – Готова гістограма

Тепер будуємо криву розподілу даних згідно 6 пункту методички. Результат


можна побачити на рисунку 13.
Візуально по гістограмі видно, що розподіл більше схожий на обрізану ліву
частину гаусівського, тобто з негативним перекосом, J-подібний. А за кривою
розподілу, асиметрією та ексцесом бачимо, що він асиметричний та
гостровершинний.

7
Рисунок 13 – Крива розподілу даних

І, на кінець, згідно 8 пункту методички виконуємо аналіз даних за


допомогою інструменту «Описова статистика». Результат можна побачити на
рисунку 14.

Рисунок 14 – Результати застосування аналізу даних

Як бачимо, отримані дані збігаються з тим, що можна помітити за


допомогою гістограми та кривої розподілу, а також з обчисленням. Загальна
кількість чисел, мінімальне та максимальне аналогічні. Оскільки середнє значення
191.6, медіана 195.4, а мода 200, при мінімальному 152.1, яскраво видно лівий
перекос та асиметрію. Це говорить про те, що на даній спеціальності висока
конкуренція, а серед абітурієнтів дуже багато відмінників, що робить практично
неможливим попасти на бюджет студентам з конкурсним балом меншим за 191.
Висновок: Під час виконання даної лабораторної роботи я засвоїла методи
первинної статистичної обробки та дослідила закон розподілу даних.

You might also like