You are on page 1of 22

Бізнес-статистика.

Тема 6
ТЕМА 7. Вибіркові обстеження суб'єктів бізнесу

План
1. Основні поняття вибіркових обстежень
2.Обчислення похибок вибірки
3. Визначення необхідного обсягу вибірки
4. Способи формування вибірок
5. Поширення результатів вибіркових обстежень.

Ключові поняття і терміни: вибірка, репрезентативна вибірка,


дизайн вибірки, похибка вибірки, стандартна і гранична похибка
вибірки, довірчі інтервали. коефіцієнт варіації похибки, проста
випадкова вибірка, механічна/систематична вибірка, серійна вибірка,
стратифікована вибірка.

1
1. Основні поняття вибіркових обстежень
Вибірковий метод – це система наукових принципів
випадкового добору певної частини генеральної сукупності,
яка представляла б усю сукупність і характеристики якої
слугували б надійною основою статистичного висновку.

●Генеральна сукупність – сукупність статистичних


одиниць, які повністю характеризують об’єкт спостереження.
●Вибірка – частина одиниць генеральної сукупності, яку
відібрано за певними правилами і безпосередньо обстежують.

●Дизайн вибірки – організаційно-логічна модель


структури вибірки та принципи її формування

2
1. Основні поняття вибіркових обстежень
Оскільки вибірка неточно відтворює структуру генеральної сукупності, то
вибіркові оцінки також не збігаються з характеристиками генеральної сукупності.
Розбіжності між ними називають похибками репрезентативності.

Похибки репрезентативності

Систематичні похибки
Випадкові похибки
(тенденційні)

• Виникають внаслідок порушення


принципів випадковості добору • Виникають внаслідок
(упереджений відбір елементів, випадковості відбору
недосконала основа вибірки елементів.
тощо). • Їх уникнути неможливо,
• Їх ще називають похибками але можна оцінити та
зміщення. регулювати величину
• Їх важливо запобігати

3
2. Обчислення похибок вибірки
Випадкова
●   стандартна похибка вибірки  є середнім квадратичним відхиленням
вибіркових точкових оцінок: середньої або частки  від значень відповідних
параметрів генеральної сукупності.
При відборі за схемою поверненої кулі – повторному відборі

(1) 

При відборі за схемою неповерненої кулі – безповторному


 
  (2)

де 2 – вибіркова дисперсія; n та N – відповідно обсяг вибіркової та генеральної


сукупностей.

4
2. Обчислення похибок вибірки

У практичному використанні наведених формул враховують таке:

1)дисперсія вибіркової частки  є добутком часток:

2)у великих за обсягом вибірках (n  30) поправка

не вносить істотних змін у розрахунки, а тому враховується лише у малих вибірках,


тобто;

3) коригуючий множник для безповторної вибірки (1-n/N) за малих значень n/N


наближається до 1, а тому при 1...5%-й вибірці (n/N = 0,01...0,05)  врозраховують
за формулою для повторної вибірки.

5
2. Обчислення похибок вибірки

Для повторного відбору


2 w(1  w)
x  t i p  t ; (3)
n 1 n 1

Для безповторного відбору


2  n  w(1  w)  n 
x  t 1   i p  t 1   . (4)
n  N n  N

6
2. Обчислення похибок вибірки

У практичному використанні наведених формул враховують таке:


1)дисперсія вибіркової частки  є добутком часток ;

2)у великих за обсягом вибірках (n  30) поправка

не вносить істотних змін у розрахунки, а тому враховується лише у малих вибірках,


тобто;

3)коригуючий множник для безповторної вибірки за малих значень n/N


наближається до 1, а тому при 1...5%-й вибірці (n/N = 0,01...0,05)  врозраховують
за формулою для повторної вибірки.

7
2. Обчислення похибок вибірки
Гранична похибка вибірки  для прийнятої ймовірності Р є
максимальним відхиленням вибіркової оцінки від невідомого параметра
генеральної сукупності.
Розмір граничної похибки обчислюють за такими формулами:
Для повторного відбору
2 w(1  w)
x  t i p  t ; (3)
n 1 n 1

Для безповторного відбору


2  n  w(1  w)  n 
x  t 1   i p  t 1   . (4)
n  N n  N

t – квантиль розподілу ймовірностей (довірче число для заданого значення


ймовірності Р),

8
2. Обчислення похибок вибірки
Для малих вибірок (n30) квантиль t визначають за розподілом
імовірностей Стьюдента (псевдонім англійського математика В. Госета). Малі
вибірки використовують у технічному нормуванні, контролі якості продукції,
вибіркових фотографіях робочого дня тощо.
Найчастіше вживані значення t наведено в таблиці

Імовірність розподілу похибок вибірки


Розподіл
Стьюдента для малої вибірки
Значення t
нормальний обсягом n
8-10 11-15
1,6 0,890 0,928 0,933
1,7 0,911 0,938 0,943
1,8 0,928 0,947 0,952
1,9 0,942 0,955 0,960
2,0 0,954 0,962 0,969
2,1 0,964 0,967 0,972
2,2 0,972 0,972 0,977
2,3 0,979 0,977 0,981
2,4 0,983 0,980 0,984
2,5 0,987 0,983 0,987
3,0 0,997 0,993 0,995

99
2. Обчислення похибок вибірки
Коефіцієнт варіації похибки – це відносна стандартна похибка, яку
визначають діленням абсолютної стандартної похибки на вибіркову оцінку
показника і виражають як коефіцієнт або у відсотках:

V  CV    100% . (5)
x
Обчислення відносної стандартної похибки рекомендується для додатних
кількісних показників і не рекомендується для відносних величин, особливо
часток, величин динаміки, тому що в цих випадках дуже легко неправильно
зрозуміти її зміст.
У вибіркових обстеженнях малих підприємств в Україні для
характеристики точності вибіркових оцінок використовують порогові значення
коефіцієнтів варіації, наведені у таблиці.

Категорії точності оцінок у вибіркових обстеженнях малих підприємств


Категорія Відносна стандартна похибка
Рівень точності/надійності
точності/надійності вибірки (коефіцієнт варіації), %
А не більше 5 високий
Б від 5,1 до 10 достатній
В від 10,1 до 15 задовільний
низький (придатні лише для
Г від 15,1 до 25
якісного аналізу)

10 Д більше 25
незадовільний (малопридатні до
аналізу)
3. Визначення необхідного обсягу вибірки
Враховуючи формули обчислення стандартної похики , а також те, що
гранична похибка =t, необхідний обсяг вибірки n визначають за формулами:

при повторному відборі

t 2 2 t 2 w(1  w)
для середньої n 2 , для частки n ; (2.8)
 2

при безповторному відборі

t 2 2 N
для середньої n 2 , (2.9)
 N t  2 2

t 2 w(1  w) N
для частки n 2 . (2.10)
 N  t 2 w(1  w)

11
3. Визначення необхідного обсягу вибірки
Оскільки на етапі проектування вибірки 2 невідома, для визначення n
використовують оцінки дисперсій 2 аналогічних пробних обстежень. Якщо
такі обстеження відсутні, то можна скористатися співвідношенням
xmax  xmin R
  , (2.11)
6 6

а для частки взяти найбільше значення дисперсії 2 = pq = 0,50,5 = 0,25.

Якщо в основу розрахунку n покласти відносну граничну похибку


 t tV 
вибірки V    , яку ще можна виразити як V   , де V  –
x x n x
квадратичний коефіцієнт варіації ознаки х, то формули обсягу вибірки
відповідно модифікуються:
 для середньої величини
t 2V2
n 2 ; (2.12)
V
 для частки
t 2 (1  w)
n , де q = 1-p. (2.13)
V2 w

12
3. Визначення необхідного обсягу вибірки

У практиці вибіркових обстежень одночасно вивчають декілька


ознак.
Якщо бажаний ступінь точності визначити для кожної ознаки
окремо, то результатом розрахунків буде низка значень обсягу вибірки.

Для їх узгодження використовують або максимальний обсяг n (тоді


решта ознак оцінюється „надто точно”), або обсяг головної ознаки.

13
4. Способи формування вибірок

Залежно від основи вибірки використовують різні способи її


формування, зокрема:
● простий випадковий,
● механічний (систематичний),
● розшарований (районований, типовий, стратифікований),
● серійний.

Простий випадковий відбір проводиться жеребкуванням або на основі


таблиць випадкових чисел. Це класичний спосіб формування вибіркової
сукупності і саме на ньому ґрунтується теорія вибіркового методу.
В Excel просто випадкову вибірку можна сформувати за допомогою
інструменту Вибірка. (вкладка Аналіз даних)

14
4. Способи формування вибірок

Механічний (систематичний) відбір передбачає, що основою вибірки є


впорядкована сукупність одиниць генеральної сукупності.
Відбір елементів здійснюють через однакові інтервали, крок інтервалу
залежить від частки вибірки D=n/N і визначається як 1/D=N/n. Початковий
елемент відбору визначають як випадкове число всередині першого інтервалу
жеребкування (іноді розпочинають з середини інтервалу), другий елемент
залежить від початкового числа і кроку інтервалу.
Наприклад, для частки вибірки D=0,05 кроком інтервалу є число
1/0,05=20, тобто у вибірку має потрапити кожний двадцятий елемент. Якщо
початковий елемент – випадкове число 3, то другий елемент становить
3+20=23, третій – 23+20=43 і т. д.
Похибка вибірки за механічного відбору визначається за формулою
простої випадкової безповторної вибірки.

15
4. Способи формування вибірок
Розшарований (районований, типовий, стратифікований) відбір
передбачає попередню структуризацію неоднорідної генеральної сукупності та
незалежний відбір елементів у кожній її складовій.
Обсяг розшарованої вибірки – це сума частинних вибірок nj, тобто
m
n   n j , де m – кількість складових (груп, типів, районів, страт тощо).
j 1
Для обчислення похибки розшарованої вибірки використовують середню
з групових дисперсій
m

  2j n j
j 1
 2j  m
. (2.14)
nj
j 1

А відповідно до правила складання дисперсій  2j   2   2 , або


 
 2j   2 1   2 , де  2  
2
2
– кореляційне відношення, яке визначає
щільність зв’язку між ознаками, що відображають причину і наслідок. Отже,
розшарування (типізація) сукупності зменшує похибку вибірки на частку

16 1-2. Чим щільніший зв’язок між ознаками, тим помітніше зменшення похибки
вибірки.
4. Способи формування вибірок

У практиці вибіркових обстежень застосовують різні способи визначення


обсягу частинних вибірок nj.
До найпростішого з них вдаються, коли всі m груп представлені
однаковою кількістю елементів; тоді
n
nj  . (2.15)
m
Проте застосування цього способу обмежене, оскільки якщо чисельності
груп Nj дуже відрізняються, може скластися ситуація, коли nj > Nj
(N=N1+ N2+…+ Nj+…+ Nm).
Найчастіше використовують пропорційний відбір, який передбачає
однакове для всіх складових представництво у вибірці. Обсяг частинних
вибірок у цьому випадку визначається як
n j  DN j , (2.16)

де D=n/N – частка вибірки.

17
4. Способи формування вибірок
За серійного відбору основа вибірки складається з серій елементів
сукупності, пов’язаних територіально (райони, селища), організаційно (фірми,
акціонерні товариства) тощо. Серії відбирають за схемою механічної або
простої випадкової вибірки, обстежують всі елементи серії. Обчислюючи
похибку вибірки, враховують міжсерійну варіацію

  xk  x 
m 2
nk
k 1
2  m
, (2.19)
 nk
k 1
де nk та xk – відповідно обсяг і середня k-ї серії.
Похибка серійної вибірки визначається за формулою

2  s
t 1   , (2.20)
s  S
де S – загальна кількість серій у генеральній сукупності; s – кількість
відібраних серій для обстеження. Ця похибка буде меншою за похибку простої
випадкової чи механічної вибірки за умови, що серії більш-менш однорідні і
варіація серійних середніх незначна.

18
5. Поширення результатів вибіркових обстежень

Наприклад, якщо середній товарооборот одного магазину за звітний


період становив 350 тис. грн, а генеральна сукупність складається з 1500
однорідних магазинів, то можна стверджувати, що загальний товарооборот
сукупності магазинів дорівнюватиме приблизно 525 млн грн (350 тис. грн.
×1500). Однак гранична похибка вибірки вказує на можливість відхилення
генеральної середньої від вибіркової середньої. Припустімо, що з імовірністю
0,954 у цьому прикладі гранична похибка становить 15 тис. грн. Вона визначає
межі генеральної середньої, тобто довірчий інтервал 335  x  365. Враховуючи
цей інтервал, з імовірністю 0,954 можна стверджувати, що загальний
товарооборот у генеральній сукупності магазинів перебуватиме в інтервалі від
502,5 млн грн до 547,5 млн грн.

19
5. Поширення результатів вибіркових обстежень

Якщо за даними вибірки визначались середнє значення ознаки ( ~ x ) або


частка одиниць сукупності з певним значенням ознаки (  ), то поширення
вибіркових оцінок на генеральну сукупність зводиться до визначення того
довірчого інтервалу, в якому з прийнятою ймовірністю може знаходитися
характеристика генеральної сукупності (див. формули 2.6).
Якщо метою вибіркового обстеження є не лише оцінка середніх значень
або часток, а й визначення повного обсягу значень ознаки (сумарного значення
показника), то використовують два способи:
 прямий перерахунок даних вибірки на всю сукупність;
 спосіб коефіцієнтів.
За способом прямого поширення сумарне значення показника може бути
визначене за формулою
N
 xi  x  N , (2.21)
1
а з урахуванням похибок вибірки представлене у вигляді довірчого інтервалу
N
( x   x ) N   xi  ( x   x ) N . (2.22)
1

20
Автор Гринькевич Ольга Степанівна

Email…olha.hrynkevych@lnu.edu.ua

You might also like