You are on page 1of 10

Національний технічний університет України

“Київський Політехнічний Інститут” ім. І. Сікорського

фізико-математичний факультет

Курсова робота на тему:

“Основи математичної статистики”

Студента 3-го курсу, групи ОМ-92,

Готвянського Савелія Миколайовича

Перевірив - д.ф.-м.н. професор О.В. Іванов.

Київ, 2022
Зміст
1 Вступ.................................................................................................................................1

2 Теоретична частина.......................................................................................................2

3 Висновки..........................................................................................................................7

4 Використана література................................................................................................8
1 Вступ

Точкова оцінка, оскільки це одне число, сама по собі не дає інформації про
точність і надійність оцінки. Розглянемо, наприклад, використання статистики X для
обчислення точкової оцінки справжньої середньої міцності на розрив (g) паперового
рушника певної марки, і припустимо, що це x=9322.7 . Через мінливість вибірки
практично ніколи не буває так, що x=µ .Точкова оцінка не говорить нічого про те,
наскільки це може бути близько до µ . Альтернативою повідомленню єдиного
розумного значення для оцінюваного параметра є обчислення та звітування про весь
інтервал правдоподібних значень — інтервальну оцінку або довірчий інтервал (CI).
Довірчий інтервал завжди обчислюється, спочатку вибираючи рівень довіри, який є
мірою ступеня надійності інтервалу. Довірчий інтервал з рівнем довіри 95% для
справжньої середньої міцності на розрив може мати нижню межу 9162,5 і верхню
межу 9482,9. Тоді на рівні довіри 95% будь-яке значення µ між 9162,5 і 9482,9 є
правдоподібним.
Рівень впевненості 95% означає, що 95% всіх вибірок дадуть інтервал, який
включає µ або будь-який інший параметр, який оцінюється, і лише 5% усіх вибірок
дадуть помилковий інтервал. Найбільш часто використовувані рівні довіри – 95%,
99% і 90%. Чим вищий рівень довіри, тим сильніше ми віримо, що значення
оцінюваного параметра знаходиться в межах інтервалу (інтерпретація будь-якого
конкретного рівня довіри буде дана незабаром).
Інформація про точність оцінки інтервалу передається шириною інтервалу.
Якщо рівень довіри високий, а результуючий інтервал досить вузький, наше знання
значення параметра досить точне. Однак дуже широкий довірчий інтервал свідчить
про те, що існує велика невизначеність щодо цінності того, що ми оцінюємо.

1
2 Теоретична частина

Інші рівні впевненості


Рівень довіри 95% був успадкований від ймовірності 0,95 для початкової нерівності
в (8.2). Якщо бажаний рівень довіри 99%, початкова ймовірність .95 необхідно
замінити на .99, що вимагає зміни критичного значення z 1,96 до 2,58. Тоді 99% ДІ є
результатом використання 2,58 замість 1,96 у формулі для 95% СІ.

Це говорить про те, що будь-який бажаний рівень впевненості може бути


досягнутий, достатньо замінити 1,96 або 2,58 відповідним стандартним нормальним
критичним значенням. Як показано на рисунку 8.4, що ймовірність 1 – α досягається
використанням 𝑧𝛼⁄2 замість 1,96.

ВИЗНАЧЕННЯ:

Довірчий інтервал 𝟏𝟎𝟎(𝟏 − 𝜶)% для середнього 𝜇 нормальної популяції коли


значення s відоме, визначається як

або, еквівалентно, .
Приклад 8.3

Нещодавно був змінений курс кінцевої математики, і тепер домашнє завдання


виконується онлайн через комп’ютер замість вправ за підручником. Як ми можемо
побачити, чи відбулося покращення? Минулий досвід свідчить про те, що розподіл
2
остаточний, оцінки іспитів зазвичай розподіляються із середнім значенням 65 і
стандартним відхиленням 13. Це дає змогу вважати, що розподіл все ще
нормальний зі стандартним відхиленням 13, але середнє, ймовірно, змінилося.
Вибірка з 40 студентів має середній бал на підсумковому іспиті 70.7. Давайте
обчислимо довірчий інтервал для середньої сукупності, використовуючи рівень
довіри 90%. Для цього потрібно, щоб 100(1 - 𝛼) = 90, з яких α = .10 та 𝑧𝛼⁄2 = 𝑧.05 =
1.645 (відповідає кумулятивній площі z-кривої 0,9500). Тоді бажаний інтервал має
вигляд:

З достатньо високим ступенем достовірності можна сказати, що 67,3 < µ < 74,1.
Крім того, ми впевнені, що середній показник покращився, адже попереднє
значення 65.

Рівень довіри, точність і вибір розміру вибірки


Навіщо задовольнятися рівнем довіри 95%, якщо рівень 99% досяжний? Тому що
ціна, сплачена за вищий рівень довіри, є ширшим інтервалом. 95% інтервал
розширюється на 1.96 до кожної сторони від 𝑥̅, отже, ширина інтервалу
дорівнює 2(1.96 . Аналогічно, ширина інтервалу 99%
дорівнює 2(2.58) . Тобто ми більше довіряємо 99% інтервалу
саме тому, що він ширший. Чим вищий бажаний ступінь впевненості, тим ширше
отриманий інтервал. Фактично, єдиним 100% СІ для 𝜇 з (−∞; ∞) який не є дуже
інформативним, тому що ще до відбору проб ми знали, що це інтервал охоплює µ.
Якщо ми думаємо, що ширина інтервалу визначає його точність, тоді рівень довіри
(або надійності) інтервалу знаходиться в оберненій залежності від його точності.
Високонадійна оцінка інтервалу може бути неточною, оскільки кінцеві точки
інтервалу можуть бути далеко одна від одної, тоді як точний інтервал може мати
відносно низький рівень надійності. Таким чином, не можна однозначно сказати,
що має бути 99% інтервал чи 95%, адже підвищення надійності тягне за собою
втрату точності.

Приваблива стратегія полягає в тому, щоб вказати як бажаний рівень впевненості,


так і ширину інтервалу, а потім визначити необхідний розмір вибірки.

Приклад 8.4
Великий моніторинг комп'ютерної системи розподілу часу показав, що час відповіді
на конкретну команду редагування зазвичай розподіляється зі стандартним
відхилення 25 мс. Встановлено нову операційну систему, і ми бажаємо оцінити

3
справжній середній час відгуку µ для нового середовища. Припускаючи, що час
відповіді все ще нормально розподіляється з 𝜎 = 25, який розмір вибірки необхідно
забезпечити, щоб отриманий 95% СІ мав ширину (найбільшу) 10? Розмір вибірки n
повинен задовольняти

Переставлення цього рівняння дає

тому

𝑛 = 9.802 = 96.04
Оскільки n має бути цілим числом, необхідний розмір вибірки 97.

Загальна формула для розміру вибірки n необхідна для забезпечення інтервалу,


ширина w отримана за формулою 𝑤 = 2 ∙ 𝑧𝛼⁄2 ∙ 𝜎⁄√𝑛 , як

Чим менше бажана ширина w, тим більше має бути n. Крім того, n та 𝜎 є
зростаючими функціями (більш мінлива сукупність вимагає більшого розміру
вибірки). А рівень довіри має вигляд 100(1 – α), при чому α, якщо функція спадає, і
𝑧𝛼⁄2 , якщо зростає.

Напівширину 1.96 з 95% СІ іноді називають зв’язною похибкою оцінки,


що пов'язана з рівнем довіри 95%; Тобто з 95% впевненістю, можна сказати, що
точкова оцінка 𝑥̅ буде не далі ніж µ. Отримавши дані, дослідник може визначити
розмір вибірки, для якої досягається конкретне значення зв'язку. Наприклад, з µ, що
представляє середню ефективність палива (миль на галлон) для всіх автомобілів
певного типу, мета дослідження може полягати в тому, щоб оцінити µ з точністю до
1 mpg та достовірністю 95%. Більше того, зазвичай, якщо ми хочемо оцінити µ з
точністю до величини В (зазначена межа похибки) з впевненістю 100(1 – α)%, то
необхідний результат досягається заміною 2⁄𝑤 на 1⁄В в (8.6).

Виведення довірчого інтервалу

Нехай X1, X2, ... , Xn позначають вибірку, на якій має бути CI для параметра 𝜃 у
основі. Припустимо, що випадкову величину, що задовольняє наступним двом
властивостям, можна знайти:

1. Змінна функціонально залежить від X1, ... , Xn і 𝜃.


4
2. Розподіл ймовірностей змінної не залежить ні від 𝜃, ні від будь-якого іншого
невідомого параметра.

Нехай h(X1, X2, ... , Xn; 𝜃) позначення цієї випадкової величини. Наприклад,
якщо розподіл є нормальним з відомими 𝜎 та 𝜃 = 𝜇, та змінною h(X1, X2, ... , Xn;𝜃)
, то умова задовольняє обидві властивості; Це однозначно
функціонально залежить від 𝜇, але має стандартний нормальний розподіл
ймовірностей, який не залежить від 𝜇. Загалом, вигляд функції h пропонується
шляхом вивчення розподілу відповідної оцінки 𝜃̂. Для будь-якого α між 0 і 1 можна
знайти константи a і b, які задовольняють
𝑃[𝑎 < ℎ(X1, X2,. . . , Xn; 𝜃) < b] = 1 − 𝛼 (8.7)

За другою властивістю а і b не залежать від значення 𝜃. У звичайному прикладі,


а=−𝑧𝛼⁄2 та 𝑏 = 𝑧𝛼⁄2. Тепер припустимо, що нерівностями в (8.7) можна
маніпулювати, щоб виділити 𝜃, даючи еквівалентні формули ймовірності 𝑃[𝑙(𝑋1,
… , 𝑋𝑛) < 𝜃 < 𝑢(𝑋1, … , 𝑋𝑛)] = 1 − 𝛼

Тоді 𝑙(𝑥1,𝑥2,…,𝑥𝑛) та 𝑢(𝑥1,𝑥2,…,𝑥𝑛) є нижньою та верхньою межами довіри, відповідно


для 100(1 – α)% СІ. У звичайному прикладі ми це бачили 𝑙(𝑋1,… , 𝑋𝑛) =

Приклад 8.5

Теоретична модель припускає, що час розпаду ізоляційної рідини між електродами


при певній напрузі має експоненціальний розподіл λ (див. Розділ 4.4). Отримана
випадкова вибірка з n = 10 разів розбивки маэ такі зразки даних (у хв):
𝑥1 = 41.53, 𝑥2 = 18.73, 𝑥3 = 2.99, 𝑥4 = 30.34, 𝑥5 = 12.33, 𝑥6 = 117.52, 𝑥7 = 73.02, 𝑥8 =
223.63, 𝑥9 = 4.00, 𝑥10 = 26.78. Бажано 95% CІ для l і для справжнього середнього
часу пробою.

Нехай ℎ(X1,X2, . . . , Xn; 𝜆) = 2λ∑ 𝑋𝑖. Використовуємо функцію генерації моменту.


Аргументом можна показати, що ця випадкова величина має розподіл ксі-квадрат з
2n ступенями свободи (df)(v = 2n, як обговорено в Розділі 6.4). Додаток. У таблиці
A.6 зображено типову криву щільності ксі-квадрат і наведено критичні значення,
які захоплюють певні області хвоста. Тут є відповідна кількість ступенів свободи
2(10) = 20. Рядок v = 20 таблиці показує, що 34,170 захоплює область верхнього
хвоста .025 і 9.591 захоплює область нижнього хвоста .025 (верхня область
хвоста .975).
Таким чином, для n =10,
5
𝑃(9.591 < 2λ∑𝑋𝑖 < 34.170) = .95

Поділ на 2λ∑𝑋𝑖 виділяє λ, дає результат

𝑃[9.591/(2λ∑𝑋𝑖) < 𝜆 < 34.170/(2λ∑𝑋𝑖)] = .95

Нижня межа 95% CІ для λ становить 9.591/(2λ∑𝑋𝑖) а верхня межа 34.170/(2λ∑𝑋𝑖).


Для наведених даних ∑𝑋𝑖 = 550.87, що дає інтервал (.00871, .03101). Очікуване
значення експоненціального rv становить µ = 1/λ. Оскільки

𝑃(2∑𝑋𝑖/34.170 < 1⁄𝜆 < 2∑𝑋𝑖/9.591) = .95


95% CІ для справжнього середнього часу пробою становить:

(2∑𝑋𝑖/34.170, 2∑𝑋𝑖/9.591) = (32.24, 114.87).


Очевидно, що цей інтервал є досить широким, що відображає значну мінливість у
часі пробою та невеликий розмір вибірки.

Загалом, верхня та нижня межі довіри є результатом заміни кожного < в (8.7)
розв’язуючи для 𝜃. У щойно розглянутому прикладі ізоляційної рідини, 2λ∑𝑋𝑖 =
34.170 дає λ = 34.170/(2∑𝑋𝑖) як верхню межу довіри, а нижня межа виходить з
іншого рівняння. Зверніть увагу, що два обмежувальні інтервали не є
рівновіддаленими від точкової оцінки, оскільки інтервал не має вигляду 𝜃̂ ± с.

6
3 Висновки
Отже, в роботі було розглянуто теорію з тем: “Рівні впевненості ”, “ Рівень довіри,
точність і вибір розміру вибірки” та “ Виведення довірчого інтервалу”. Розглянуто
приклади таких процесів у житті. З’ясували, що чим вищий рівень довіри, тим
сильніше ми віримо, що значення оцінюваного параметра знаходиться в межах
інтервалу. Інформація про точність оцінки інтервалу передається шириною
інтервалу.

7
4 Використана література
1. “Modern Mathematical Statistics with Applications” Jay L. Devore and Kenneth N.
Berk, 2012

2. https://www.stat.auckland.ac.nz/ fewster/325/notes/ch6.pdf

3. Hahn, Gerald and William Meeker “Statistical Intervals”, Wiley, New York, 1991.

4. Larsen, Richard, and Morris Marx “Introduction to Mathematical Statistics”, Prentice


Hall, Englewood Cliffs, NJ, 2005.

You might also like