You are on page 1of 4

Перевірка адекватності функції регресії

Н.П. Селезньова НТУУ "КПІ", Київ, Україна nadijasel@gmail.com

О.В. Українець НТУУ "КПІ", Київ, Україна saharoza48@gmail.com


Для встановлення впливу рівня знань студентів першого курсу ФМФ НТУУ
«КПІ» з курсу шкільної математики на їх успішність з математичного аналізу
проведено регресійний аналіз між оцінками, отриманими абітурієнтами із ЗНО
з математики та вже студентами з математичного аналізу на першій сесії у
2015 році.

В роботі [1] на основі отриманих емпіричних даних (оцінок студентів)


обчислено коефіцієнт кореляції Спірмена [2] між оцінками з математичного
аналізу та оцінками отриманими тими ж студентами із ЗНО з математики:
. Цей коефіцієнт співпав з лінійним коефіцієнтом кореляції. Його
величина вказує на те що певний кореляційний зв'язок між успішністю
студентів з математичного аналізу у ВНЗ та рівнем знань з математики у школі
(на рівні тестів ЗНО) існує, але очевидно цей зв'язок не є лінійним. За
допомогою регресійного аналізу спробуємо встановити форму такого зв'язку.
Для цього оцінки отримані із ЗНО переведемо у сто-бальну систему, оскільки
оцінки з математичного аналізу – поставлено за сто-бальною системою.

На наступних діаграмах представлено лінії лінійної та нелінійної регресії. Під


кожною діаграмою у вигляді таблиць наведено результати обчислень таких
параметрів:

- загальна сума квадратів (SST); - сума

квадратів, що пояснює регресію (SSR); - сума квадратів

помилок (SSE) ; . Основне варіаційне рівняння

. (1)

Для кожної із побудованих ліній регресії обчислено ці показники. Вважатимемо


найбільш адекватною моделлю ту модель, для якої рівняння (1) виконується з
найменшою похибкою.

Для перевірки статистичної значущості рівняння регресії, у кожному випадку

знайдено статистику за такою формулою: ( - обсяг вибірки, -


кількість параметрів лінії регресії), - знайдено за статистичними таблицями
-розподілу Фішера і рівнем значущості . Якщо , то
побудована нами регресійна модель є цілком відповідною реальній дійсності.

f(x) = NaN x + NaN


Лінійна залежність
12
10
8
6
4
2
0
84 86 88 90 92 94 96 98 100 102

Object 9

7473,62 98,87 7245,91

0,001
12,896 37
0,478 2

f(x) = NaN x^NaN


Степенева залежність
12

10

0
84 86 88 90 92 94 96 98 100 102

9906,057 1198,901 7543,404


0,001
12,896 37
5,563 2
f(x) = NaN ln(x) NaN
Логарифмічна залежність
12

10

6
4

0
84 86 88 90 92 94 96 98 100 102

9906,057 2388,277 7249,707


0,001
12,89634 37
11,53008 2

f(x) = NaN exp( NaN x )


Експоненціальна залежність
12

10

0
84 86 88 90 92 94 96 98 100 102

9906,057 1185,277 7548,544


0,001
12,896 37
5,496 2
Параболічна залежність
12
10
8
6
4
2
0 f(x) = 0
30 40 R² = 0 50 60 70 80 90 100 110

199,676 241,550 199,172


0,001
8,522 37
3,617 3

Зведемо отримані дані до такої таблиці:

Параболіч- Степенева Лінійна Логарифмічна Експоненціальна


на
41,88 1163,75 128,85 268,73 1172,24
4,91 7,33 12,42 1,366 7,40

Як видно з останньої таблиці, найменша похибка, з якою може виконуватись


рівняння (1) відповідає параболічній залежності. В той же час найкраще
відповідає критерію Фішера логарифмічна залежність. Як видно з наведених
досліджень, обрати "найкращу" лінію регресії досить складно.

Література

1. Селезньова Н.П. Моніторинг якості освіти через призму кореляційного


аналізу./Н.П. Селезньова, О.В.Українець. Сімнадцята міжнародна наукова
конференція ім. акад. Михайла Кравчука, 19-20 травня, 2016 р. Київ:
Матеаріали конф. Т. 3. Теорія ймовірностей та математична статистика.
Історія та методика математики ̶ К.: НТУУ "КПІ", 2016. ̶ с. 146-149.
1. Селезньова Н.П. Кореляційний аналіз навчального процесу на прикладі
підсумкових оцінок учнів /Н.П. Селезньова, Н.В. Селезньова, С.В.
Селезньов//Вісник НТУУ "КПІ" №1, 2012 р. Філософія, психологія,
педагогіка. С. 136-138.

You might also like