Professional Documents
Culture Documents
Лаб роб стат теор
Лаб роб стат теор
Теоретичні відомості
Головна мета наукових досліджень - це отримання нового знання про великі класи
явищ, осіб або подій, які прийнято називати генеральною сукупністю.
3
Рандомізована вибірка (від анг. random - випадковий) - це репрезентативна вибірка, яка
сформована за стратегією випадкових випробувань.
Для того, щоб мати можливість перенесення вибіркових показників або на інші, або на
більш поширені сукупності, необхідно мати математично обгрунтовані положення щодо
відповідності і спроможності вибіркових характеристик характеристиками цих
поширених так званих генеральних сукупностей. Такі положення базуються на
теоретичних підходах і схемах, пов'язаних з імовірнісними моделях реальності,
наприклад, на аксіоматичному підході, на законі великих чисел і т.д. Тільки з їхньою
допомогою можна переносити властивості, які встановлено за результатами аналізу
обмеженої емпіричної інформації, або на інші, або на поширені сукупності. Отже,
побудова, закони функціонування, використання імовірнісних моделей, що є предметом
математичної галузі під назвою "теорія ймовірностей", стає суттю статистичних методів.
Послідовність рішення:
Атрибутивні розподіли
Послідовність рішення:
o для розрахунку відносних частот п/п у комірку Н3 внести вираз: =в3/$в$7, аналогічні
вирази внести у комірки Н4:Н6. У комірку Н7 внести вираз =СУММ(Н3:Н6).
а в с|0 еір gн
№ результати тестування
1 типи внд частоти
з/п імена внд
студентів Г
2 і х/
П;
г 18,75
1 к.в.і. холерик 1 холерик 1 3
о %
43,75
4 2 а. o.a. сангвінік 2 сангвінік 2 7
%
меланхол 31,25
5 3 д.в.р. меланхолік 3 3 5
ік %
флегмат
6 4 п.п.о. сангвінік 2 4 1 6,25%
ик
1 100,00
7 5 в.о.а. сангвінік 2 загалом:
6 %
с
6 г.в.а. меланхолік 3
о
9 7 в.н.с. флегматик 4
1
8 ш.з.і. холерик 1
0
1
9 б.р.а. сангвінік 2
1
1
10 с.н.і. меланхолік 3
2
1
11 к.т.о. меланхолік 3
3
1
12 ч.о.м. сангвінік 2
4
1
13 в.н.о. сангвінік 2
5
1
14 п.в.і. меланхолік 3
6
1
15 р.о.а. сангвінік
7
21
1
16 b.h.k. холерик
8
Як бачимо з розподілу осіб за типами ВНД (рис. 2.18), у вибірці маємо 3 особи за
типом "холерик" (18,75%), 7 - за типом "сангвінік" (43,75%), 5 -"меланхолік" (31,25%) і 1 -
"флегматик" (6,25%).
Ранжировані розподіли
Послідовність рішення:
1) - РАНГ(В2;В$2:В$10; 0))/2+РАНГ(В2;В$2:В$10;1));
Мода Мо - це значення, яке найчастіше трапляється серед емпіричних даних. Так, для ряду зн
дорівнює 3 (Мо = 3). Зверніть увагу на те, що мода є значення з найбільшою частотою (у прик
частота цього значення (у прикладі вона дорівнює 4).
o якщо варіанти суміжні і мають однакову частоту, мода визначається як середнє значення сусід
2, 3, 4, 4, 4, 5, 5, 5 мода Мо = (4+5)/2=4,5;
o якщо варіанти несуміжні, може існувати декілька мод. Так, для даних 2,
3, 3, 3, 4, 4, 4, 5, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 8, 9, 9, 9, 9 мають одну велику моду Мо1 = 6 та дві малі моди
На графіках розподілу мода - це варіанта з максимальною частотою. На рис. 2.25 варіанта х 6=5
є модою Мо = 5. Медіана Мсі - це значення, яке приходиться на середину упорядкованої пос
непарної кількості даних медіана визначається середнім елементом Мй = х( п+1)/2. Наприклад, для 1
Мй
= х(п+1)/2 = х(11+1)/2 = х6 = 5 ■
Мй _ хп/2 + хп/2+1 _ х12/2 + х12/2+1 _ х6 + х7 _ 5 + 6 _ _ 55
~ 2 2 2 2 ~ 2 _,.
Середнє арифметичне X (вибіркове середнє або середнє) сукупності п значень дорівнює:
- 1 п - 1
п
і=1 п
X =І£і 'хі (2.2)
І /і
де х,- - варіанти незгрупованих частот або центральні значення класових інтервалів у разі згру
частоти. Особливості мір центральної тенденції:
o мода вибірки обчислюється просто, її можна визначити "на око". Для дуже великих груп дани
центру розподілу;
o середнє арифметичне передбачає використовування всіх значень вибірки, причому всі вони впл
Розглянемо, що може відбутися з модою, медіаною і середнім, коли зміниться удвічі лише одне
вибірки (рис. 2.28).
Як бачимо, мода і медіана залишилися незмінними, у той час як середнє змінилося значною
середнього особливо суттєво впливають значення, що перебувають далеко від центру групи даних
З точки зору помилок, що виникають через те, коли для характеристики цілої сукупнос
статистична міра (мода, медіана чи середнє), кожна міра центральної тенденції має свою інтерпрета
Медіана - це таке значення, для якого сума абсолютних різниць усіх значень менша за сум
значення. Наприклад, для сукупності {1, 3, 6, 8, 9} медіана Мсі = 6. Абсолютні різниці становлять:
6|=3. Сума всіх цих різниць 5+3+0+2+3=13 менша за суму різниць щодо будь-якого іншого знач
різниці |1-1|=0, |3-1|=2, |6-1|=5, |8-1|=7, |9-1|=8, а їхня сума 0+2+5+7+8=22. Інші розрахунки дадуть
Проте вибірки мають істотну різницю значень основних ММ: дисперсій * х і
стандартних відхилень 8х (див. два останні стовпчики рис. 2.29). Можна відзначити
своєрідну "чутливість" показників ММ щодо властивостей сукупності.
^ =-:-, (2.3)
п-1
п п - 1 п - 1
Різницю п-1 називають числом степенів вільності к - кількість об'єктів або значень у
складі обмеженої статистичної сукупності, які можуть вільно варіювати. Якщо обмежень
вільності варіації існує декілька (у), то число степенів вільності дорівнюватиме к= п-у (де у
- грецька літера "ню").
п-1
п -1
де Хі - варіанти незгрупованих частот або центральні значення класових інтервалів у
разі згрупованих частот;/ - диференціальні частоти, X - середнє.
П
■ (Sx ) i=1
Для асиметрії
На рис. 2.30 показано, що коефіцієнти К], К 2 і К3 при збільшені обсягу
вибірки п асимптотично наближаються до одиниці (приблизно для п>30), а формули
(2.12а) і (2.126) переходять у формули (2.11) і (2.12) відповідно.
Мй - Хп/2 + Хп/2+1 _ Х12/2 + Х12/2+1 _ Х6 + Х7 _ 2 + 2 _ 4 _ 2
~ 2 2 ~ 2 ~ 2 ~2~ .
п 12
Обсяг вибірки
Дисперсія =дисп()
=СЧЁТ()
Ст. =СТАНДОТКЛО
Середнє =СРЗНАЧ()
відхилення Н()
Мода =МОДА() Асиметрія =СКОС()
Медіана
Ексцес =ЭКСЦЕСС()
=МЕДИАНА()
Рис. 2.39. Розрахунки розподілу, МЦТ і ММ за допомогою функцій табличного
процесора MS Excel
v
k =ехк * Їі . (2.13)
п _
т
к =е(х "х)к *Л , (2.14)
і=і
т
1 =ххі " -/і = х . (2.15)
п_
п _
т
2 =е(х ~х)2 ■ /і = ях2. (2.17)
7% £ (х - Х)3 У = А* . (2.18)
С5*) С5*) 1=1
-3-[5(х;-Х)3Л]-3-Ех (2.19)
що витікає з перетворень:
пппп
п п
Отже, якщо т2 = v2 =е хі ' ї; , vl =ех;' ї; , то можна отримати ще одне співвідношення, яке
використовується для розрахунку дисперсії:
п ( п 2
і=1 v і=1 )
Центральні моменти 3-го і 4-го порядку теж можна записати за допомогою початкових
моментів:
Квантилі
o кварталі 62, 6з).
Таблиця 2.3
Нормовані дані
Нормовані дані - це дані, наприклад, масиву X (див. рис. 2.48), що отримані шляхом
математичного перетворення їх за формулою
х. -X
*> , (2.21)
21 = *^ - ь379 ,-1,71 1 Ух 1,63 1
(а) (б)
Сутність кореляції
Таблиця 2.4
Дихотомічний коефіцієнт
Інтервальна
кореляції <р ;
(відношень)
Тетрахоричний коефіцієнт
кореляції тш
Коефіцієнти
кореляції
Коефіцієнт Спірмена г" (при
Спірмена
умові, якщо для х шкалу інтервалів
Рангова
або відношень перетворити в
т Кендалла;
рангову шкалу)
Коефіцієнт
конкордації У
Коефіцієнт
асоціації Ф;
Коефіцієнт
Рангово- контингенції Юла
Точково-бісеріальний коефіцієнт
бісеріальний 6;
Номінальна кореляції Тр^; Бісеріальний
коефіцієнт
коефіцієнт кореляції гьії
кореляції Коефіцієнти
спряженості
Чупрова К
і Пірсона С
Лінійна кореляція
8
Зазначені методи розрахунку з використанням комп'ютерної техніки можна знайти у
підручнику [56].
Формула (2.22) може бути перетворена, якщо замінити значення змінних Хі і у
і нормованими значеннями 2х і гу, і виглядатиме так:
Послідовність рішення:
¡=1 ,=1
¿=1
Спосіб 2.
Послідовність рішення:
Нелінійна кореляція
Послідовність рішення:
o оцінити характер лінійності (нелінійності) зв'язку між значеннями ознак віку (X) і
тесту (Y) за допомогою діаграми розсіяння (рис. 2.57);
o розрахувати квадрати різниць s¡ окремо для кожної вікової групи (вікові групи
виділено зафарбованими рядками, результати розрахунків і відповідних формул
показано на рис. 2.58 і 2.59);
o розрахувати коефіцієнти кореляції окремо для частин масиву: у комірці D22 для віку
від 10 до 22, у комірці D23 для віку від 26 до 38 .
Отже, для віку від 10 до 22 років коефіцієнт кореляції має високе додатне значення
(rxy=+0,83), що підтверджує прямий зв'язок, який можна спостерігати на діаграмі. Для
віку від 26 до 38 років коефіцієнт кореляції має від'ємне значення (^=-0,69), що
інтерпретується як зворотний зв'язок. Значення кореляційного відношення " 0,67
підтверджує високій рівень не лінійності зв'язку змінних X Y.
Слід звернути увагу на те, що для коефіцієнта rfyxc спочатку вказують індекс у, а потім -
х, який є мірою прогнозування Y по X. Важливо зазначити, що для лінійного
кореляційного зв'язку виконується співвідношення rxy = ryx, проте rfyxc і rfxyy матимуть різні
значення. Якщо звернутися до діаграми розсіяння (рис. 2.57), то можна відзначити той
факт, що для особи, наприклад, віком 10 років (Х=10), можна прогнозувати середню
оцінку тесту у 8 балів (Y=(7+9)/2=8), у той час як для оцінки тесту, наприклад, у 8 балів вік
особи може бути як близько 10, так і близько 38 років.
Таблиця 2.5
Послідовність рішення:
o Внести емпіричні дані у таблицю рис. 9.20 і виконати такі дії: - розписати докладніше
вираз <р2, виходячи з умов к, = 3 і к2 = 4:
Рис. 2.60. Результати розрахунку коефіцієнта Чупрова К
Рис. 2.61. Формули для розрахунку коефіцієнта Чупрова К
К -і = , ^ 0,45.
Випробування - це здійснення певних дій або умов, які можна відновити довільне
число разів (наприклад, виконання студентами або учнями тесту).
Сукупність усіх можливих елементарних подій {а> 1, а>2, соп} утворює простір
елементарних подій єО.). Запис у дужках читається: "Елементи ю належать до простору
О". У подальшому вважатиме, що простір елементарних подій О є величина скінчена.
Рішення:
Добуток подій В-С і сума подій В+С, визначених вище за аналогією операцій теорії
множин (рис. 3.1 ґ, д ), мають місце для так званих сумісних подій B і C, які можуть
відбуватися разом. Проте події, які в результаті випробовувань не можуть відбутися
одночасно, єнесумісними. Операції добутку несумісних подій B-D і суми цих подій B+D
продемонстровано на рис. 3.1е, є;
е) за умовами прикладу добуток несумісних подій B-D визначається перетином
відповідних множин В і D: B Г| D = {2,3,4,5} Г| {6,7,8,9}={}=0. В результаті отримаємо так
звану порожню підмножину 0, якій відповідає неможлива подія. Як бачимо з рис. 3.1е,
підмножини В і D не мають спільних елементів - вони несумісні. Отже добуток
несумісних подій В-С є неможливою подією;
Таким чином, операції над подіями можна розглядати як операції над відповідними
підмножинами. Алгебра подій ізоморфно відтворюється на алгебрі множин. Однак у
теорії ймовірностей для позначення власних понять використовуються свої терміни, які
дещо відрізняються від термінів теорії множин. Відповідність між термінологічними
рядами цих двох математичних дисциплін можна представити за допомогою табл. 3.1.
Таблиця 3.1
Ймовірність подій
Р(А) =
: : ттт-. (3.1)
Отже, для випадкової вибірки обсягом п відносні частоти /Цх 1)=ті/п можна трактувати
як ймовірності р(х) появи значень варіант х,-.
£ РИ = 1. (3.3)
weq
Р( А) =Е РИ. (3.4)
Тоді будь-яку числову функцію Р(А), визначену на скінченій множині Сі={ю}, яка є
простором елементарних подій ю, називають імовірністю, якщо виконуються три умови
(аксіоми Колмогорова):
2) ДП)=1;
З визначення імовірності події, а також умов (3.3) і (3.4) випливають інші властивості
ймовірностей:
Р( А) + Р( А) = 1.
10) Ймовірність добутку АР несумісних подій А і В дорівнює нулю. З діаграми рис. 3.3а
видно, що несумісні події А і В не мають спільної площі, перетин відповідних підмножин
є порожня множина 0 подій, тому ймовірність добутку несумісних подій Р(АР) = 0.
12) Сума ймовірностей всіх несумісних подій {А 1, ^42, Ап}, що утворюють повну групу,
дорівнює одиниці
Основні операції над подіями можна продемонструвати прикладами алгебри подій - алгебри
3.1).
Рішення:
а) за умовами прикладу всі елементи підмножини Б={2,3,4,5} належать до множини ^={1, 2,
операцій над множинами це значить, що і відповідна подія б належить до простору подій О, тобт
б) усі елементи підмножини ^4={2,3} належать до підмножини Б={2,3,4,5}, тому у разі появу под
ситуації можна стверджувати, що у разі здійснення подія а спричинює появу події Б. Таку
записують як а с б (рис. 3.16);
Добуток подій В-С і сума подій В+С, визначених вище за аналогією операцій теорії множин
званих сумісних подій B і C, які можуть відбуватися разом. Проте події, які в результаті ви
одночасно, єнесумісними. Операції добутку несумісних подій B-D і суми цих подій B+D продемон
Таким чином, операції над подіями можна розглядати як операції над відповідними підмнож
відтворюється на алгебрі множин. Однак у теорії ймовірностей для позначення власних понять
дещо відрізняються від термінів теорії множин. Відповідність між термінологічними рядами
можна представити за допомогою табл. 3.1.
Таблиця 3.1
Умовна ймовірність має сенс для залежних подій. Для незалежних подій А і В умовна
ймовірність перетворюється на звичайну:
Настання події В1 змінює умови для оцінки ймовірності події _82, а саме: зменшується і
кількість дівчат (10-1)=9, і загальна кількість студентів (9+15)=24. Тоді ймовірність події
_82 як відношення кількості дівчат (9) до за-
З рис. 3.4 видно, що подію А можна уявити як суму добутків події А і кожної з подій
Н1,Н2,...,Нп (сума перетинів підмножин А з підмножинами Я):
Р( А) = £Р( А ■ Я,.).
¿=1
Р(А) = £Р(А |H[) o Р(Я,) = Р( А | o РЯ1) + Р(А | Я2) o Р(Н2) + Р(А | Я3) o Р(Н,).
¿=1
28 + 20 + 25 73
25 25
28 + 20 + 25 73
Умовні ймовірності події А для кожної гіпотези розраховуються як: Р( Л|Я.) = ^ = 0,25;
Р( ЛН 2) = ^- = 0,10; Р( ЛН 3) = ^ = 0,20.
28 20 25
Р(Л) = Р(Л | Я1) o Р(Я1) + Р(Л | Я2) o Р(Я2) + Р(Л | Я3) o Р(Я3) або
Р(Л) = 0,25 o 0,38 + 0,10o 0,27 + 0,20o 0,34 " 0,095 + 0,027 + 0,068 " 0,19.
Відповідь: ймовірність Р(А) події А про те, що навмання вибраний з трьох груп студент
є відмінником, складає приблизно 0,19 або 19%.
Р( А) =Е Р(А|Я,) o Р(Я,).
¿=1
або
Р(А) = 1-0,3+0,63-0,4+0,24-0,2+0,053-0,1 = 0,605 =
60,5%. Відповідь: ймовірність Р(А) події А про те, що викликаний навмання студент
відповість на два заданих питання, складає приблизно 0,605 або 60,5%.
Таблиця 3.2
Таблиця 3.3
Послідовність рішення:
винна скласти обсяг вибірки, тобто ^ ті = 20 (див. комірку С10 рис. 3.8);
і=1
Сукупність ймовірностей р'і = Р(Х = хі) має назву щільності розподілу змінної X (див.
стовпчик Б рис. 3.8 і гістограму рис. 3.9). Кожне окреме значення щільності розподілу
визначає ймовірність р',- кожного окремого значення X! змінної X , тобто Р(Х = хі). Сума
ймовірностей р',- усіх елементарних значень X! змінної X (за умови повної системи
випадкових значень) дорівнює
і=1
Сукупність ймовірностей р! = Р(Х < X!) має назву розподілу змінної X (див. стовпчик Е
рис. 3.6 і дискретний графік рис. 3.7 у вигляді сходинок з насиченням до 1,00). Розподіл
випадкової величини показує ймовірність для змінної X, значення якої не перевищує х^ ,
тобто Р(Х < х^. Кожне значення розподілу є сумою ймовірностей р'і усіх попередніх
елементарних значень х, і
змінної X, тобто: рі =^р'І. Наприклад, для і = 4 значення ймовірність р4
і=1
і=1
- щільність розподілу Дх) = Р '(х). Це значить, що щільність Дх) є першою похідною від
функції розподілу Р(х);
- щільність розподілу для будь-якої випадкової величини невід'ємна, тобто Лх) > 0, і
має таку властивість:
складатиме р4 р'. = 0,00 + 0,05 + 0,10 + 0,20 = 0,35 (див. комірку Е6 рис. 3.6).
¡=1
і=1
-ОС
гґ 1 -0,5((х-1в)/<7)2 г г, . 1 | (х - І02 і
де /(х) - ймовірність Р(І<2 = х) того, що ї<2 прийме значення х; І<2 і а -середнє
арифметичне і стандартне відхилення генеральної сукупності; % ~ 3,14; е ~ 2,71. Для
певного контингенту індивідуумів середнє значення 1<2=100 і а =15.
Рішення:
12
Докладніше щодо нормального закону розподілу див. розділ 3.4.
Слід звернути увагу на те, що ймовірність Р(/£> < 100) = 0,50. Інакше кажучи,
ймовірність отримати значення 12 на рівні не більше середнього значення ї<2=100 складає
50%. На рис. 3.13 це відповідає зафарбованій площі, яка складає 50% від загальної.
Аналітично це можна записати так:
100
-сс
80
-сс
110
-сс
Значення Р(110) = 0,748 можна отримати з табл. рис. 3.12. Отже, ймовірність Р(/((>110) ~
25,2%.
в) Визначити ймовірність того, що ¡2 прийматиме значення не менше 70, але не більше
90, тобто Р(70< ¡2 <90). Зафарбована площа рис. 3.16 відповідає ситуації, коли з події ^{¡2 <
90} треба вилучити елементи події А2{12 < 70}. Тоді ймовірність Р(А) бажаної події А
дорівнюватиме різниці ймовірностей Р(40 і Р(А,) подій Ах і ^2, тобто Р(70< 1(2 < 90) = Р(/( <
90) - Р(Р2 < 70). Визначення ймовірності за допомогою функцій розподілу матиме вигляд:
90 90 70
Р(90) - Р(70) = 0,253 - 0,023 = 0,23. Отже, ймовірність Р(70< ¡2 < 90) = 23%.
г) Визначити ймовірність того, що І<О прийматиме значення поза межами інтервалу
80 < О < 120, тобто ,Р(80 > О >120). Цій події відповідає сума двох зафарбованих частин
площі рис. 3.17. Рішення можна отримати у 2-х варіантах:
80
120
-ос
120
-ос
Ймовірність Р(А) події А складається з суми ймовірностей Р(АА і Р(А2) подій А1 і А2,
тобто Р(А) = Р(А1) + Р(А2) = 0,091 + 0,091 ~ 0,182 = 18,2%.
Подія _8{80< ¡2 <120} відповідає попередній ситуації (див. вище п. "в"), коли з події В 1 {¡2
< 120} треба вилучати елементи події В2{2< 80}. Ймовірність Р(В) події В є різниця
ймовірностей Р(В{) і Р(В2)
Р(В) = Р(12 < 120) - Р(12 < 80). Ймовірність Р(А) бажаної події А дорівнюватиме
Р(А) = 1- Р(В) = 1 - [Р(Щ < 120) - Р(12 < 80)]. Визначення ймовірності за допомогою
функцій розподілу матиме вигляд:
120 Г120 80 ~|
1 - | Л(х)Сх = 1 - | Л(х)Сх - | Л(х)Сх = 1 - [Р(120) - Р(80)], або 1- [Р(120) - Р(80)] = 1 - [0,909 -
0,091] = 1- 0,818 = 0,182 = 18,2%.
Так, за даними прикладу 3.12 можна стверджувати, що на рівні ймовірності 0,05 (5%)
коефіцієнт інтелекту ¡2 не перевищуватиме значення 75,3. З графіка функції розподілу
Р(2) рис. 3.18 видно, що ймовірності 0,05 відповідає зафарбована площа, яка обмежена
графіком щільностіЛ(Ш) і ординатою ¡2 = 75,3. Інакше кажучи, Р(!2) = ^(¡2 < 75,3) = 0,05.
Аналогічно можна отримати значення змінної ¡2, ймовірність якої складає 20% або
0,20. З рис. 3.19 видно, що ймовірності 0,20 відповідає зафарбована площа, яка обмежена
графіком щільностіЛ(Ш) і ординатою ¡2 = 87,4.
Значення функції розподілу F(X), які знаходяться у межах від 0 для F(-") до 1 для F(+co),
також зручно поділити на сто частин і представляти функцію розподілу у вигляді
процентилів. Якщо ціна шкали функції розподілу F(x) становить 0,01 (1%), отримані
вище результати можна прокоментувати у такій спосіб:
Біноміальний розподіл
р(1) = р = 0,5 ;
n
m!(n - m)!
На рис. 3.36 у табличній формі показана залежність цих показників розподілу від
ймовірності р елементарної бажаної події.
Як бачимо з таблиці рис. 3.36, для "байдужого" студента (р = 0,5) середнє значення
складає 3 бажаних події, для "слабкого" (р = 0,3) - в середньому 1,8 бажаних подій; для
"сумлінного" студента (р = 0,7) - в середньому 4,2 бажаних подій з 6 можливих.
Завдання: визначити ймовірністьр*.
Рішення:
4. СТАТИСТИЧНЕ ОЦІНЮВАННЯ
Таблиця 4.1
Генеральна
Вибірка
Показники сукупність
сукупностей статистик
параметри:
и:
Середнє
ц X
арифметичне
2 2
Дисперсія
а Sx
Стандартне
а 5х
відхилення
Обсяг N п
M[0n -0]2 = min. (4.1)
При оцінюванні бажано, щоб втрата інформації, яка може бути суттєвою для
прийняття статистичних рішень, була мінімальною. Отже, для того, щоб оцінки були
надійними, вони мають відповідати деяким вимогам, тобто володіти певними
властивостями.
limP{©n -0>є = 0. (4.2)
1 Г 2 1 2 (л 1 1 2 2
п п п) п п
,^г2п п -1 2 2 а2
*2 =-- 3 2. (4.5)
п -1
222
19
Див., наприклад, Кобзар А.И. Прикладная математическая статистика. - М., 2006
[37].
Рішення:
л/2я-сг2 І 2° J
n
і=1
1"
ﳥ1
Рішення системи рівнянь дає оцінки середнього juMM і дисперсії сгмм за методом
моментів
Ь = 2 (4.7)
<т = з
20
Див., наприклад, Н.Кремер [41, С. 303-305].
ТІ 1 п
п п п п 1 п ,
ї ™ = (4.12)
= ^ (4.13)
Статистичні критерії
23
Див. також розділ 4 "Інтервальне оцінювання"
Помилка 1-го роду - це помилка відхилення нульової гіпотези, тоді як вона правильна.
Ймовірність такої помилки позначається яка (рівень значущості). Отже, а=р{¥є ¥ кр | H0} -
це ймовірність події {¥є ¥ кр}, за умови, що нульова гіпотеза Н 0 істина. Якщо ймовірність
помилки - це а, то ймовірність правильного рішення (1- а). Чим менше а, тим більша
достовірність прийняття правильного рішення.
Таблиця 5.і
Послідовність рішення.
o Формулювання гіпотез:
A I |Ex|
і
а = ^ і ^ = , (5.5)
де Ax і Ex - емпіричні коефіцієнти асиметрії та ексцесу; mA і mE дорівнюють: m I 6-(n-
1)
; mE - p4-n-(n-2Hn-3HnEI. (5.6)
o Розрахунки емпіричних критеріїв tA і tE (рис. 5.4) виконано за допомогою формул (див.
рис. 5.5). Вибіркові значення асиметрії (4Х) та ексцесу (Ех) за формулами (2.12а) і (2.126)
розраховано за допомогою функцій MS Excel =СКОС() і =ЗКСЦЕСС().
Проте порівняння графіків цих розподілів дають підстави для сумніву щодо
відповідності емпіричного розподілу нормальному законові (див. рис. 5.6), що потребує
додаткової перевірки.
Рис. 5.6. Емпіричний і нормальний теоретичний розподіли
ЛІТЕРАТУРА
6. Берк К., Кейри П. Анализ данных с помощью Microsoft Excel / Пер. с англ. - М.:
Вильяме, 2005.
7. Бешелев С.Д., Гурвич Ф.Г. Математико-статистические методы экспертных оценок. -
М.: Статистика, 1974. - 159 с.
9. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. Вып. 1,2. - М.:
Мир, 1974.
12. Брандт 3. Статистические методы анализа наблюдений / Пер. с англ.- М.: Мир, 1975.
16. Гаек Я., Шидак 3. Теория ранговых критериев / Пер. с англ. - М.: Наука, 1971.
1995.
32. Кендал М.Д., Стьюарт А. Статистические выводы и связи / Пер. с англ. - М.: Наука,
1973. - 900 с.
33. Кендал М.Д., Стьюарт А. Теория распределений / Пер. с англ. - М.: Наука, 1966.
44. Леман Э.А. Проверка статистических гипотез / Пер. с англ. - 2-е изд. - М.: Наука,
1979.
М: МГУ, 1993.
1989.
73. Шеффе Г. Дисперсионный анализ / Пер. с англ. - 2-е изд. - М.: Наука, 1980. - 512 с.
77. Estes W.K. Toward a statistical theory of learning.- Psychol. Rev., 1950, vol. 57, p. 94-107.
80. Thorndike R.L., Hagen E. Measurement and evaluation in psychology and education. N. Y.:
L.: Wiley, 1961. 597 p.