лекція - вибірка

Точність вибіркових оцінок
Функції і властивості вибіркових оцінок
Головне завдання вибіркового обстеження – за даними вибірки

визначити якомога точніші значення (оцінки) невідомих параметрів первинної
сукупності. Схема розрахунків, за якими визначаються статистичні оцінки
невідомих параметрів, називається процедурою оцінювання.
У статистиці застосовують два типи оцінок параметрів генеральної
сукупності — точкові та інтервальні. Точкова оцінка — це значення параметра
за даними вибірки: вибіркова середня та вибіркова частка р. Інтервальною

оцінкою називають інтервал, який з певною ймовірністю покриває істинне
значення параметра генеральної сукупності, - довірчий інтервал.
Вимірювання точності статистичного оцінювання здійснюється за

допомогою усереднення (з усіх можливих вибірок) відхилень оцінки z від
істинного значення параметра Z. Очевидно, чим менше відхилення, тим
точніша оцінка. Точність будь-якої вибіркової оцінки залежить від двох
факторів: методу оцінювання і способу формування вибіркової сукупності. У
теорії вибіркового методу усі доведення ґрунтуються на простій випадковій
вибірці, де немає обмежень на дію механізму закону великих чисел (саме цей
закон визначає логічну конструкцію вибіркового методу).
Оскільки на практиці генеральна дисперсія ознаки невідома, в

розрахунках можна використати вибіркову незсунену оцінку дисперсії: для
повторної вибірки , для безповторної . Середнє квадратичне відхи-

лення вибіркових оцінок від значення параметра в генеральній сукупності
називають стандартною похибкою вибірки . Отже, формули стандартної
похибки такі:
для повторної вибірки
,
для безповторної вибірки
μ=
√ σ2
n−1
n
(1− ¿ )¿
N
Коригувальний множник
( N−n
)
N−1 називають «поправкою на скінченність
сукупності», а обернена до нього величина розглядається як міра відносної

надійності схеми безповторного добору. Оскільки це відношення перевищує
одиницю для будь-якого обсягу вибірки, окрім n=1, то можна сказати, що
результати безповторної вибірки завжди надійніші порівняно з повторною:
( N−1
N−n ) ≥ 1
Практика вибіркових обстежень спирається саме на схеми безповторного

добору, які забезпечують високу точність вибіркових оцінок при меншому
обсязі вибірки. Щодо практичного використання наведених формул, то слід
урахувати таке:
а) у сукупностях біноміального типу, коли ознака має лише два значення,
які вказують на наявність (1) чи відсутність (0) певної властивості, основним
параметром оцінювання є частка одиниць сукупності з певною властивістю;
дисперсія частки як відомо, становить:
,
де р і q — частки вибіркової сукупності, яким відповідно властива і
невластива ознака, сума цих часток (р+ q) =1;
б) у великих за обсягом сукупностях (30 і більше одиниць) поправка

не вносить істотних змін у розрахунки, а тому береться до уваги лише у
вибірках з невеликою кількістю елементів;
в) коригувальний множник для безповторної вибірки при
малих величинах наближається до 1, що видно з даних табл.2.1. Отже, у

випадках, коли частка обстеженої сукупності < 5 %, розрахунок похибки
вибірки можна виконувати за формулою для повторної вибірки; коригувальний
множник доцільно застосовувати при ≥ 5 %.
У практичних розрахунках зазвичай використовують не стандартну, а

граничну похибку , яка є добутком стандартної похибки на довірче число t:
.
Значення t залежить від імовірності, з якою гарантують результат
оцінювання. t – довірче число, яке залежить від рівня ймовірності. На
практиці найбільш поширеними рівнями ймовірності є:
ймовірність 0,683 довірче число t = 1
ймовірність 0,954 довірче число t = 2
ймовірність 0,997 довірче число t = 3;
З урахуванням викладеного формули граничних похибок середньої та

частки записують так:
Повторна Безповторна вибірка
вибірка
Для
середньої
Для частки
Як видно з формул, розмір граничної похибки залежить від:

 варіації ознаки ,
 обсягу вибірки n,
 частки вибірки в генеральній сукупності ,

 узятого рівня довіри, якому відповідає квантиль t.
Чим більша варіація ознаки в генеральній сукупності, тим більша в
середньому похибка вибірки. Залежність похибки від обсягу вибіркової
сукупності обернено пропорційна. Щоб зменшити похибку вибірки вдвічі, обсяг
останньої має зрости в 4 рази. При безповторному доборі похибка буде тим
менша, чим більша частка обстеженої сукупності . Очевидно, при суцільному

спостереженні похибка репрезентативності відсутня ( = 0).
Довірчі межі
Межі довірчого інтервалу визначаються на основі точкової оцінки та

граничної похибки вибірки :
для середньої
для частки
p−tμ≤р 0 ≤p +tμ
,
де — стандартна похибка вибірки;

Наприклад. З метою визначення швидкості розрахунків з кредиторами
однієї фірми була здійснена вибірка 100 платіжних документів, за якими
середній термін перерахунку і отримання грошей виявився 27,2 днів з
дисперсією 30,25. Кожний десятий платіжний документ був з порушенням
терміну розрахунків з кредиторами.
Визначимо середній термін проходження усіх платежів протягом року і
частку платежів з порушенням термінів розрахунку з імовірністю 0,954 (t = 2).
Гранична похибка для середнього терміну проходження платежів
Δ x̄ =2
√ 30 ,25
100
=2⋅0 , 55=1, 1
дня.
Це дає підставу стверджувати з імовірністю 0,954, що середній термін
проходження платежів протягом року щонайменше 26,1 днів і не
перевищують 28,3 днів.
¿
27,2−1,1≤› ≤27,2+1,1
.
Перш ніж визначити граничну похибку для частки платежів з
порушенням терміну оплати, необхідно обчислити дисперсію частки:
s2
= 0,1(1 – 0,1) = 0,09.
Гранична похибка частки платежів з порушенням терміну оплати
Δ p =2
√ 0 , 09
100
=0 , 06
або 6,0 %.
Щодо інтервалу можливих значень частки платежів з порушенням
терміну оплати у генеральній сукупності, то межі його досить широкі: від 4,0 до
16,0 %:
10−6,0≤p ≤10 ±6 ,0
Відносна точність оцінок
У статистичному аналізі часто постає потреба порівняти похибки вибірки

різних ознак або однієї і тієї самої ознаки в різних сукупностях.
Такі порівняння виконують за допомогою відносної похибки, яка показує,
на скільки процентів вибіркова оцінка може відхилятися від параметра
генеральної сукупності. Відносна стандартна похибка середньої — це
коефіцієнт варіації вибіркових середніх:
μ x̄
V μ= ¿
x
.
Її розмір можна визначити також на основі коефіцієнта варіації ознаки :

для повторної вибірки
для безповторної вибірки

.
Так, в нашому прикладі стандартна похибка для середнього терміну
проходження платежів становить = 0,55, а відносна похибка
0 , 55
V μ= 100=0 , 02
27 , 2
або 2%.
Такий самий результат дає розрахунок відносної похибки на основі

коефіцієнта варіації :
V x= √
30,25
100=20,2%.
27 ,2
20 ,2
V μ= =2 , 0 %.
√ 100
Вибіркову похибку частки також слід порівнювати з величиною частки

р, адже одна і та сама похибка = 2 % для р = 80 % є малою, для р = 40 % —
допустимою, для р = 10 % — завеликою. Відносну похибку частки обчислюють
за формулою
У нашому прикладі стандартна похибка частки платежів з порушенням

терміну оплати становить = 3,0%, а відносна:
V μ=
3,0
=
√ 0,9
10 ,0 100⋅0 , 1
=0 ,3
або 30%,
що значно більше порівняно з похибкою для середнього терміну проходження
платежів (2,0%).
Отже, відносну похибку можна використати для порівняння вибіркових
оцінок різних ознак. На практиці достатнім рівнем точності вважається V μ ≤10 %.

Іноді використовують граничну відносну похибку, яка враховує ймовірність
статистичного висновку V Δ =tV μ .

У процесі проектування вибіркових спостережень визначають
мінімально достатній обсяг вибірки, при якому вибіркові оцінки
репрезентували б основні властивості генеральної сукупності. Занадто
великий обсяг вибірки потребує зайвих витрат, а занадто малий призведе до
збільшення похибки репрезентативності. Теорія вибіркового методу дає змогу
науково обґрунтувати достатній обсяг вибірки. Обсяг вибіркової сукупності
буде залежати від:
 ступеня варіації, 2
 точності вибіркових оцінок, Δ
 рівня ймовірності, t
2 2
t ∙σ
n= 2
∆
У випадку, коли обсяг вибіркової сукупності перевищує 5% обсягу

генеральної сукупності, його корегують:
' n
n=
n
1+
N
Практичне використання цієї формули ускладняється через відсутність

оцінки варіації. Як правило, використовують варіації, отримані в попередніх
або аналогічних обстеженнях. Якщо аналогічні обстеження не проводились
або в генеральній сукупності відбулися істотні зміни, точнішу
характеристику варіації дають пробні (пілотні) обстеження.
Для альтернативної ознаки, коли відсутня будь-яка інформація про

структуру сукупності, використовують максимальне значення дисперсії 2 =
0,25.
В розглянутих формулах розрахунку мінімально достатнього обсягу
вибірки як міра точності результатів контролюється абсолютна гранична
похибка вибірки Δх. Іноді доцільно контролювати відносну граничну похибку
V :
коли мірою варіації ознаки є коефіцієнт варіації Vx
2 2
n  t V 2x .
V

на основі відносної похибки вибірки для частки:

t2q
n .
V 2 p
Очевидно, чим більша частка р, тим менший обсяг вибірки

забезпечить необхідну точність результатів обстеження, і навпаки: для
малих значень р обсяг вибірки збільшується.

лекція - вибірка

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

лекція - вибірка

Uploaded by

Copyright:

Available Formats

Точність вибіркових оцінок

Функції і властивості вибіркових оцінок

Головне завдання вибіркового обстеження – за даними вибірки

за даними вибірки: вибіркова середня та вибіркова частка р. Інтервальною

Вимірювання точності статистичного оцінювання здійснюється за

Оскільки на практиці генеральна дисперсія ознаки невідома, в

повторної вибірки , для безповторної . Середнє квадратичне відхи-

для безповторної вибірки

сукупності», а обернена до нього величина розглядається як міра відносної

Практика вибіркових обстежень спирається саме на схеми безповторного

б) у великих за обсягом сукупностях (30 і більше одиниць) поправка

в) коригувальний множник для безповторної вибірки при

малих величинах наближається до 1, що видно з даних табл.2.1. Отже, у

множник доцільно застосовувати при ≥ 5 %.

У практичних розрахунках зазвичай використовують не стандартну, а

З урахуванням викладеного формули граничних похибок середньої та

Як видно з формул, розмір граничної похибки залежить від:

 частки вибірки в генеральній сукупності ,

менша, чим більша частка обстеженої сукупності . Очевидно, при суцільному

Межі довірчого інтервалу визначаються на основі точкової оцінки та

де — стандартна похибка вибірки;

Гранична похибка частки платежів з порушенням терміну оплати

10−6,0≤p ≤10 ±6 ,0

Відносна точність оцінок

У статистичному аналізі часто постає потреба порівняти похибки вибірки

Її розмір можна визначити також на основі коефіцієнта варіації ознаки :

для безповторної вибірки

Так, в нашому прикладі стандартна похибка для середнього терміну

проходження платежів становить = 0,55, а відносна похибка

Такий самий результат дає розрахунок відносної похибки на основі

Вибіркову похибку частки також слід порівнювати з величиною частки

У нашому прикладі стандартна похибка частки платежів з порушенням

оцінок різних ознак. На практиці достатнім рівнем точності вважається V μ ≤10 %.

статистичного висновку V Δ =tV μ .

 точності вибіркових оцінок, Δ

У випадку, коли обсяг вибіркової сукупності перевищує 5% обсягу

Практичне використання цієї формули ускладняється через відсутність

Для альтернативної ознаки, коли відсутня будь-яка інформація про

на основі відносної похибки вибірки для частки:

Очевидно, чим більша частка р, тим менший обсяг вибірки

You might also like