You are on page 1of 10

МАТЕМАТИЧНА СТАТИСТИКА

СТАТИСТИЧНІ РОЗПОДІЛИ ВИБІРКИ.


СТАТИСТИЧНІ ОЦІНКИ ПАРАМЕТРІВ ГЕНЕРАЛЬНОЇ
СУКУПНОСТІ
Лекція №1

ВСТУП

Основним змістом математичної статистики є систематизація,


обробка та використання статистичної інформації для виявлення
статистичних закономірностей ознаки або ознак певної сукупності
елементів.
Оскільки суцільна обробка всіх елементів сукупності практично
неможлива, то, як правило, застосовується вибірковий метод. Отже,
розрізняють генеральну і вибіркову сукупність.
Множина Ω однотипних елементів, яким притаманні певні кількісні
ознаки (розміри, вага, маса тощо), утворює генеральну сукупність.
Кількість усіх елементів генеральної сукупності називають її обсягом і
позначають символом N, значення якого здебільшого невідоме.
Кожна непорожня підмножина А множини Ω (А⊂ Ω ) випадково
вибраних елементів із генеральної сукупності називається вибіркою.
Кількість всіх елементів вибірки називають її обсягом і позначають
символом п. Його значення відоме, причому воно набагато менше обсягу
генеральної сукупності (п<<N).
Математична статистика розв'язує дві категорії завдань:
1) статистичне оцінювання (точкове, інтервальне) параметрів
генеральної сукупності;
2) перевірка правдивості статистичних гіпотез про значення
параметрів генеральної сукупності або закон розподілу ознаки
генеральної сукупності на підставі обробки результатів вибірки.

1. СТАТИСТИЧНІ РОЗПОДІЛИ ВИБІРОК ТА ЇХ ЧИСЛОВІ


ХАРАКТЕРИСТИКИ
1.1 Загальна інформація
Кількісні ознаки елементів генеральної сукупності можуть бути
одновимірними багатовимірними, дискретними і неперевними.
Коли реалізується вибірка, кількісна ознака, наприклад Х, набуває
конкретних числових значень (Х = хі), які називають варіантою.
Зростаючий числовий ряд варіант називають варіаційним.
Кожна варіанта вибірки може бути спостережена пі, раз (пі > 1),
число пі, називають частотою варіанти хі. При цьому:
k

п = ∑ ni
i=1

де k — кількість варіант, що різняться числовим значенням; п-


обcяг вибірки. Відношення частоти п, варіанти хі, до обсягу вибірки п
називають її відносною частотою і позначають через Wі, тобто:
ni
Wі =
n
Для кожної вибірки виконується рівність:
k

∑ W i = 1.
i=1

Якщо досліджується ознака генеральної сукупності Х, яка є


неперервною, то варіант буде багато. У цьому випадку варіаційний ряд -
це певна кількість рівних або нерівних частинних інтервалів або груп
варіант зі своїми частотами.
Такі частинні інтервали варіант, які розміщені у зростаючій
послідовності, утворюють інтервальний варіаційний ряд. На практиці
для зручності, як правило, розглядають інтервальні варіаційні ряди, у яких
інтервали є рівними між собою.

1.2 Дискретний статистичний розподіл вибірки та її числові


характеристики
Перелік варіантів варіаційного ряду і відповідних ним частот, або
відносних частот, називають дискретним статистичним розподілом
вибірки.
У табличній формі він має такий вигляд:

Х = хі х1 х2 х3 ... хk
пі п1 п2 п3 ... пk
Wі W1 W2 W3 ... Wk

Дискретний статистичний розподіл вибірки можна подати


емпіричною функцією F*(х).
Емпірична функція F*(х) та iї властивості. Функція аргументу х, що
визначає відносну частоту події X < х, тобто:
F*(х) = пх / п ,
називається емпіричною, або комулятою. Тут п – обсяг вибірки; пх
— кількість варіант статистичного розподілу вибірки, значення яких
менші за фіксовану варіанти х; F*(х) — називають ще функцією
нагромадження відносних частот.
Властивості F*(х):
1) 0 ≤ F*(х) ≤ 1;
2) F(xmin) = 0, де хmin є найменшою варіантою варіаційного ряду;
3) F(x)| x>хmax =1, де хmax є найбільшою варіантою варіаційного ряду;
4) F(x) є неспадною функцією аргументу х, а саме: F(x2) ≥ F(x1) при х2
≥ х1.

Полігон частот і відносних частот. Дискретний статистичний


розподіл вибірки можна зобразити графічно у вигляді ламаної лінії,
відрізки якої сполучають координати точок (хі; пі), або (хі;Wі)
У першому випадку ламану лінію називають полігоном частот, в
іншому полігоном відносних частот
Приклад. За даним дискретним статистичним розподілом вибірки
необхідно:
1. Побудувати емпіричну функцію F*(х) і зобразити ї графічно;
2. Накреслити полігони частот та відносних частот.

варіанта 100 101 102 103 104 105 106 107 108
частота 2 3 8 12 8 7 5 3 2
відносна
0,04 0,06 0,16 0,24 0,16 0,14 0,1 0,06 0,04
частота

Розв'язання. Полігон частот (полігон відносних частот) – це ламані


на графіку, які відображають зв'язок варіанти з їх частотою (відносною
частотою).
Щоб побудувати полігон частот відкладаємо на осі абсцис значення
варіант xi, а на осі ординат – частоти ni , що їм відповідають.
Такий же алгоритм побудови справедливий для полігону відносних
частот Wi=ni/n.
З'єднавши точки (xi;ni) відрізками прямих, одержимо шуканий полігон
частот (відносних частот):
Емпіричну функцію розподілу визначатимемо за формулою

F *(х) = пх / п
В результаті простих обчислень для кожного з інтервалів отримаємо
значення функції F*(х) =Fn(x)
Графік емпіричної функції F*(х) розподілу має вигляд:

Числові характеристики:

1) вибіркова середня величина .


Величину, яку визначається формулою:
називають вибірковою середньою величиною дискретного
статистичного розподілу вибірки, де хі варіанта варіаційного ряду
вибірки; пі - частота цієї варіанти; п - загальний обсяг вибірки.
Якщо всі варіанти з'являються у вибірці лише по одному разу, тобто пі
= 1, тоді:

2) відхилення варіант. Різницю (хі - )пі, називають відхиленням


варіант. При цьому:

Отже, сума відхилень усіх варіантів варіаційного ряду вибірки завжди


дорівнює нульо;
3) мода (Мо*). Модою дискретного статистичного розподілу вибірки
називають варіанту, що має найбільшу частоту появи. Мод може бути
кілька. Коли дискретний статистичний розподіл має одну моду він
називається одномодальним, коли має дві моди - двомодальним;
4) медіана (Ме*). Медіаною дискретного статистичного розподілу
вибірки називають варіанту, яка поділяє варіаційний ряд на дві частини,
рівні за кількістю варіант;
5) дисперсія. Для вимірювання розсіювання варіант вибірки відносно

використовується дисперсія.
Дисперсія вибірки — це середнє арифметичне квадратів відхилень

варіант відносно , яка обчислюється за формулою:


або

6) При обчисленні Dв відхілення підноситься до квадрата, а отже,


змінюється одиниця виміру ознаки Х, тому на основі дисперсії вводиться
середнє квадратне відхилення:

Воно вимірює розсіювання варіант вибірки відносно , але в тих


самих одиницях, в яких вимірюється ознака X;
7) розмах (R). Для грубого оцінювання розсіювання варіант відносно

застосовується величина, яка дорівнює різниці між найбільшою хmax i


найменшою хmin ваpiантами варіаційного ряду. Ця величина називається
розмахом:
R = хmax - хmin
8) коефіціснт варіації V. Для порівняння оцінок варіацій статистичних

рядів із різними значеннями , які не дорівнюють нулю, вводиться


коефіцієнт варіації, який обчислюється за формулою:

Приклад. За заданим статистичним розподілом вибірки


X = xi 2,5 4,5 6,5 8,5 10,5
ni 10 20 30 30 10
1) обчислити , Dв, ;
2) знайти Мо*, Me*;
3) обчислити R, V.

Розв'язання. Оскільки п = ∑

ni=100, то згідно з вищенаведеними

формулами отримаєм:

Для обчислення Dв визначим:

Отже, наведений статистичний розподіл вибірки буде двомодальним.


Ме* = 6,5, оскільки ваpiанта х= 6,5 поділяє варіаційний ряд 2,5; 4,5; 6,5;
8,5; 10,5 на дві частини: 2,5; 4,5 і 8,5; 10,5, які мають однакову кількість
варіант.
Розмах: R = хmax - хmin =10,5 - 2,5 = 8.
Коефіціснт варіації:

You might also like