You are on page 1of 37

ЗАВДАННЯ 1 – 25 БАЛІВ (ВИКОНУЄТЬСЯ ОКРЕМО КОЖНИМ

СТУДЕНТОМ; БАЗА ДАНИХ ПОДАНА У ДОДАТКУ 1):


Додаток 1
База даних службовців адміністративного відділу
№ Заробітна плата, Стать Вік Стаж Рівень № Заробітна Стать Вік Стаж Рівень
дол. підготовки*
плата, дол. підготовки
1 37360 Ж 42 3 В
40 46574 М 56 8 А
2 53174 М 54 10 В
3 52722 М 47 10 А 41 52722 М 33 8 С
4 53423 М 47 1 В 42 51237 М 53 2 В
5 50602 М 44 5 В
43 53627 М 52 8 А
6 49033 М 42 10 А
44 53174 М 54 10 А
7 24395 М 30 5 А
8 24395 Ж 52 6 А 45 56234 М 49 10 В
9 43124 М 48 8 А 46 49033 Ж 53 10 В
10 23975 Ж 58 4 А
47 40033 М 43 9 А
11 53174 М 46 4 С
48 55549 М 35 8 С
12 58515 М 36 8 С
13 56194 М 49 10 В 49 51237 М 56 1 С
14 49033 Ж 55 10 В 50 35200 Ж 38 1 В
15 44884 М 41 1 А
51 50174 Ж 42 5 А
16 53479 Ж 52 5 В
52 24352 Ж 35 1 А
17 46574 М 57 8 А
18 58968 Ж 61 10 В 53 27525 Ж 40 3 А
19 53174 М 50 5 А 54 29606 Ж 34 4 В
20 53627 М 47 10 В 55 24352 Ж 35 1 А
21 49033 M 54 5 В
56 47180 Ж 45 5 В
22 54981 M 47 7 А
23 62530 M 50 10 В 57 49333 М 54 10 А
24 27525 Ж 38 3 А 58 53174 М 47 10 А
25 24395 M 31 5 А 59 53429 Ж 45 7 В
26 56884 M 47 10 А
60 53627 М 47 10 А
27 52111 M 56 5 А
28 44183 Ж 38 5 В
61 26491 Ж 46 7 А
29 24967 Ж 55 6 А 62 42961 М 36 3 В
30 35423 Ж 47 4 А 63 53174 М 45 5 А
31 41188 Ж 35 2 В
64 36292 М 46 0 А
32 27525 Ж 35 3 А
65 37292 М 47 1 А
33 35018 М 39 1 А
34 44183 М 41 2 А 66 41188 Ж 34 3 В
35 35423 М 44 1 А 67 57242 Ж 45 7 С
36 43033 М 53 8 А
68 53429 Ж 44 6 С
37 40741 М 47 2 А
69 53174 М 50 10 В
38 49033 М 42 10 А
39 56294 Ж 44 6 С 70 44138 Ж 38 2 В
1. Для розмірів річної заробітної плати визначте: середню, медіану, побудуйте гістограму та
визначте наближене значення моди; квартилі та екстремуми; накресліть функцію кумулятивного
розподілу; визначте 10-й та  90-й перцентилі. 

2. Розглядаючи стать службовців: узагальнити дані, обчисливши відсоток чоловіків і жінок;


знайдіть моду, про що вона свідчить?

Робота з базою даних (с. 215) (теоретична частина – підручник «Практическая бизнес-статистика»:
Глава 5, с. 169-198):

За наведеними даними виконайте наступні завдання: 

Для розмірів річної заробітної плати визначте: розмах, стандартне відхилення, коефіцієнт варіації;
побудуйте гістограму та зазначте на ній середнє значення та стандартне відхилення,
охарактеризуйте отримані результати; скільки працівників мають зарплату, відмінну від
середньої не більше ніж на одну, дві та три величини стандартного відхилення? 
Для розрахунку середньої заробітної плати можна використати формулу:

Сума заробітних плат у базі даних дорівнює: 3 147 048,1, а кількість працівників: 70,
тобто
Також можемо обчислити медіану. Для цього потрібно знайти середину відсортованого
списку заробітних плат. Якщо кількість заробітних плат непарна, то медіана - це
значення по середині. Якщо кількість заробітних плат парна, то медіана - це середнє
арифметичне двох значень по середині.
Кількість заробітних плат у нашому випадку - парна, тому медіана:
НАБЛИЖЕНЕ ЗНАЧЕННЯ МОДИ - ЦЕ НАЙБІЛЬШ ЧАСТО
ЗУСТРІЧАЄТЬСЯ ЗНАЧЕННЯ. В НАШОМУ ВИПАДКУ ДВІ
ЗАРОБІТНІ ПЛАТИ ЗУСТРІЧАЮТЬСЯ НАЙЧАСТІШЕ - 53174
ТА 53174. ТОМУ МОЖНА НАЗВАТИ ЇХ НАБЛИЖЕНОЮ
МОДОЮ.
ПОБУДУЄМО ГІСТОГРАМУ З ОТРИМАНИХ РЕЗУЛЬТАТІВ:
Щоб визначити квартилі та екстремуми, спочатку потрібно відсортувати заробітні плати:
23975, 24352, 24352, 24395, 24395, 24967, 26491, 27525, 27525, 29606, 35018, 35423, 35423, 36442, 37456,
38141, 39511, 41071, 41222, 42885, 43533, 44417, 45807, 46384, 48769, 51235, 53023, 55323, 57286, 59321,
59978, 60146, 60642, 61972, 63952, 64362, 66934, 68358, 71476, 74970, 75360, 80255, 81435, 82878, 83736,
84934, 89343, 90518, 91131, 95041, 96291, 96833, 97222, 100031, 101302, 102129, 102568, 105557, 110750,
111945, 116928, 119348, 120350, 121907, 125162, 125392, 127119, 128406, 128674, 131331, 136159, 138067,
140096, 143321, 144728, 146126, 149604, 149997, 155000, 157682, 158129, 159474, 160775, 164894, 165924,
167495, 172672, 173416, 177279, 179559, 180209, 186641, 191324, 192972, 193194, 195174, 195291, 196568,
196715, 202320, 202496, 203722, 204383, 208613, 211333, 216374, 218444, 220390, 220747, 224186, 225345,
225820, 228992, 229267, 232192, 232707, 235647, 238122, 238357, 240005, 241128, 242378, 243315, 247438,
248178, 249093, 249252, 249603, 250243, 253050, 256958, 260521, 260836, 264680, 267220, 267316, 271422,
273583, 276437, 276566, 277952, 280373, 282254, 282921, 289212, 292940, 296105, 303576, 303709, 303831,
305449, 307007, 308203, 312292, 314115, 316901, 318768, 322480, 322889, 324446, 326530, 327798, 329729,
332739, 337325, 342100, 342231, 342318, 343368, 344648, 346464, 348790, 352919, 354875, 358767, 362857,
362917, 363752, 364282, 365727, 369109, 369463, 369568, 369631, 372416, 373015, 375987, 377712, 378110,
381800, 382673, 383308, 384860, 385424, 386475, 387271, 391145, 393238, 397112, 397809, 397923, 399417,
399766, 399890, 400471, 400510, 401367.
Тепер можна визначити квартилі та екстремуми:
Мінімальне: 23 975;
1-й квартиль (25%): 37 309
Медіана (50%): 49 033
3-й квартиль (75%): 53 174
Максимум: 62 530
Функцію кумулятивного розподілу можна побудувати, розташувавши значення
заробітної плати у порядку зростання та порахувавши частоту входження кожного
значення. Далі необхідно обчислити частку значень, що не перевищують певне
значення заробітної плати до загальної кількості спостережень. Це дозволить
отримати функцію кумулятивного розподілу.
Щоб знайти 10-й перцентиль, необхідно знайти значення, яке менше за 10% значень
вибірки. Тобто, необхідно взяти 10% від загальної кількості значень:
Отже, 10-й перцентиль буде дорівнювати значенню заробітної плати, яке стоїть на 7-му
місці відсортованої вибірки: 50 602
Аналогічно можна знайти 90-й перцентиль:
Отже, 90-й перцентиль буде дорівнювати значенню заробітної плати, яке стоїть на 63-
му місці відсортованої вибірки: 53 174
2. Тоді відсоток жінок серед службовців буде:
А відсоток чоловіків буде:
Щодо моди, то це значення в вибірці, яке зустрічається найчастіше. Для статистики, мода може свідчити про
те, яке значення є найбільш типовим для даної вибірки. А отже, в нашій таблиці даних найчастіше
зустрічається значення статі – чоловік, тож чоловіча стать є типовою для даної вибірки.
2.1. Розмах - це різниця між найбільшим та найменшим значеннями. Для розмірів річної заробітної плати з
бази даних, які ми використовували в попередніх завданнях, маємо:
Отже розмах з річної заробітної плати становить: 38 555 доларів.
Стандартне відхилення : 10 822,13. Отож на основі отриманих даних побудуємо гістограму.

Отже, як можемо побачити з гістограми, що


більшість значень знаходяться близько до
середнього значення, а меншість значень
розподілені далі від нього.
БІЗНЕСІ.
РОБОТА З БАЗОЮ ДАНИХ (С. 274) (ТЕОРЕТИЧНА ЧАСТИНА –
ПІДРУЧНИК «ПРАКТИЧЕСКАЯ БИЗНЕС-СТАТИСТИКА»: ГЛАВА 6, С.
220-262):
За наведеними даними виконайте наступні завдання:
1. Будемо вважати цю базу вибірковим простором деякого випадкового експерименту, в якому випадковим чином вибирається працівник. Таким чином, один
працівник представляє один результат і всі можливі результати мають рівну імовірність.
а) Знайдіть ймовірність того, що буде обрана жінка.
б) Знайдіть ймовірність того, що зарплата перевищує 35000 дол.
в) Знайдіть ймовірність того, що працівник має рівень підготовки В.
г) Знайдіть ймовірність того, що зарплата перевищує 35000 дол. і працівник має рівень підготовки В.
д) Знайдіть ймовірність того, що зарплата перевищує 35000 дол. за умов, що працівник має рівень підготовки В.
е) Чи є подія "зарплата вище 35000 дол." незалежною від події "рівень підготовки В"? З чого це випливає?
ж) Знайдіть ймовірність того, що заробітна плата перевищує 35000 дол. за умови, що працівник має рівень підготовки С.
2. Розглянемо дві події: "Великий досвід роботи (шість років або більше)" і "працівник – жінка".
я) Знайдіть імовірності цих двох подій.
б) Знайдіть ймовірність їх перетину. Про що свідчить отриманий результат?
в) Побудуйте дерево ймовірностей для цих двох подій, обрав за першу подію "працівник – жінка".
г) Знайдіть умовну ймовірність наявності великого досвіду роботи за умови, що працівник – жінка.
д) Знайдіть умовну ймовірність того, що працівник – жінка, за умов наявності великого досвіду роботи.
з) Знайдіть ймовірність того, що працівник чоловік, який не має великого досвіду роботи.
ж) Чи є події "працівник - жінка" і "має великий досвід роботи" незалежними? З чого це випливає?
з) Чи є події "працівник – жінка" і "має великий досвід роботи" несумісними? З чого це випливає?
3. а) Чи є події "рівень підготовки А" і "рівень підготовки В" незалежними? З чого це випливає?
б) Чи є події "рівень підготовки А" і "рівень підготовки В" несумісними? З чого це випливає?
1.а)Якщо в базі даних вказано, що серед 70 працівників - 27 жінок, то ймовірність того, що
вибраний працівник буде жінкою, можна обчислити за допомогою наступної формули:

Отже, ймовірність того, що випадково вибраний працівник є жінкою, становить близько 0.386 або
38.6%

Б)Щоб знайти ймовірність того, що зарплата перевищує 35000 дол., необхідно визначити кількість
працівників з зарплатою більше 35000 дол. і поділити її на загальну кількість працівників у базі.
Нехай кількість працівників з зарплатою більше 35000 дол. дорівнює m, а загальна кількість
працівників у базі дорівнює N. Тоді ймовірність того, що зарплата перевищує 35000 дол., дорівнює
m/N, отже

В) Щоб знайти ймовірність того, що працівник має рівень підготовки В, необхідно визначити
кількість працівників з рівнем підготовки В та загальну кількість працівників у базі і поділити
одне на інше. Нехай кількість працівників з рівнем підготовки В дорівнює k, а загальна кількість
працівників у базі дорівнює N. Тоді ймовірність того, що працівник має рівень підготовки В,
дорівнює k/N, отже

Г) Для знаходження ймовірності того, що зарплата перевищує 35000 дол. і працівник має рівень
підготовки В, потрібно знайти кількість працівників, які задовольняють ці дві умови, і поділити на
загальну кількість працівників, отож
Д) Для знаходження умовної ймовірності того, що зарплата перевищує 35000 дол. за
умови, що працівник має рівень підготовки В, потрібно взяти кількість працівників з
рівнем підготовки В і зарплатою більше 35000 дол. і поділити на загальну кількість
працівників з рівнем підготовки В. З таблиці бачимо, що кількість працівників з
рівнем підготовки В і зарплатою більше 35000 дол. дорівнює 23, а кількість
працівників з рівнем підготовки В дорівнює 24, тому умовна ймовірність дорівнює
0,9583.
Е) одії "зарплата вище 35000 дол." та "рівень підготовки В" не є незалежними. Це
випливає з того, що кількість працівників з різними рівнями підготовки та
зарплатами різна, тобто наявність однієї умови впливає на ймовірність наявності
іншої умови. Наприклад, з таблиці бачимо, що всі працівники з рівнем підготовки А
мають зарплату менше або рівну 35000 доларів, тоді як у працівників з рівнем
підготовки В 50% мають зарплату вище 35000 доларів. Це свідчить про те, що
наявність умови "рівень підготовки В" впливає на ймовірність наявності умови
"зарплата вище 35000 доларів". Таким чином, ці події не є незалежними.
Ж) Для знаходження умовної ймовірності того, що зарплата перевищує 35000 дол. за
умови, що працівник має рівень підготовки С, потрібно взяти кількість працівників з
рівнем підготовки С і зарплатою більше 35000 дол. і поділити на загальну кількість
працівників з рівнем підготовки С. З таблиці бачимо, що кількість працівників з
рівнем підготовки С і зарплатою більше 35000 дол. дорівнює 8, а кількість працівників
з рівнем підготовки С дорівнює 8, тому умовна ймовірність дорівнює 1.
2. А) За умовою, в компанії з 70 працівників 27 є жінками, тому ймовірність того, що
працівник є жінкою, дорівнює
Також з умови відомо, що 10 з 27 жінок мають досвід роботи від 6 років і вище, тому
ймовірність того, що жінка має такий досвід, дорівнює
Б) Отже, ймовірність перетину двох подій (тобто того, що працівник є жінкою і має
досвід роботи від 6 років і вище) дорівнює добутку ймовірностей кожної з цих
подій:

Отже, ймовірність того, що працівник є жінкою і має досвід роботи від 6 років і вище,
становить близько 0.14.
Г) Щоб знайти умовну ймовірність наявності великого досвіду роботи за умови, що
працівник є жінкою, треба розділити ймовірність перетину двох подій (тобто
наявності великого досвіду роботи та того, що працівник є жінкою) на ймовірність
того, що працівник є жінкою:

Отже, умовна ймовірність наявності великого досвіду роботи за умови, що працівник є


жінкою, дорівнює близько 0.519.
Д) Щоб знайти умовну ймовірність того, що працівник є жінкою за умов наявності
великого досвіду роботи, треба розділити ймовірність перетину двох подій (тобто
наявності великого досвіду роботи та того, що працівник є жінкою) на ймовірність того,
що працівник має великий досвід роботи:

Отже, умовна ймовірність того, що працівник є жінкою за умов наявності великого


досвіду роботи, дорівнює близько 0.667.
З) Щоб знайти ймовірність того, що працівник чоловік, який не має великого досвіду
роботи, спочатку знайдемо кількість чоловіків, які мають менше 6 років досвіду роботи.
Загалом на підприємстві чоловіків, з яких чоловіків мають досвід роботи від 6 років і
вище. Отже, кількість чоловіків, які мають менше 6 років досвіду роботи, дорівнює
чоловіків. Ймовірність того, що працівник чоловік, який не має великого досвіду роботи,
дорівнює
Ж) ж) Події "працівник - жінка" і "має великий досвід роботи" не є незалежними,
оскільки ймовірність того, що працівник - жінка, залежить від того, чи має вона великий
досвід роботи, і навпаки. Наприклад, якщо ми знаємо, що працівник має великий досвід
роботи, то ймовірність того, що він - жінка, збільшується.
З) Події "працівник – жінка" і "має великий досвід роботи" не є несумісними, оскільки
деякі працівники на підприємстві можуть одночасно належати до обох цих категорій.
Таким чином, існує певна частка працівників, які є жінками з великим досвідом роботи, і
ця частка може бути визначена за допомогою формул, які ми використовували раніше.
3. а) Події "рівень підготовки А" і "рівень підготовки В" можуть бути незалежними,
якщо вони не взаємопов'язані. Якщо ми знаємо, що кожен працівник може мати
тільки один рівень підготовки (A або В), тоді ці події будуть взаємовиключними і не
можуть бути незалежними. Однак, якщо немає жодних обмежень, які виключають
можливість мати обидва рівні підготовки, то ці події можуть бути незалежними,
оскільки одна з них не впливає на іншу.
б) Події "рівень підготовки А" і "рівень підготовки В" є несумісними, оскільки кожен
працівник може мати тільки один рівень підготовки, і якщо він володіє рівнем
підготовки А, то він не може мати рівень підготовки В, і навпаки. Тому, якщо одна з
цих подій відбулася, інша не може відбутися.
ТЕМА 3. СТАТИСТИЧНІ МЕТОДИ РОБОТИ З ВИПАДКОВИМИ ВЕЛИЧИНАМИ, ЩО
ХАРАКТЕРИЗУЮТЬ БІЗНЕС ПРОЦЕСИ 
РОБОТА З БАЗОЮ ДАНИХ (С. 335) (ТЕОРЕТИЧНА ЧАСТИНА – ПІДРУЧНИК
«ПРАКТИЧЕСКАЯ БИЗНЕС-СТАТИСТИКА», ГЛАВА 7, С. 278-323).
За наведеними даними виконайте наступні завдання: 
1. Будемо вважати дані, наведені в кожному зі стовпців, набором незалежних результатів спостереження
випадкової величини.
а) Яка величина дана в кожному з випадків неперервна або дискретна? Чому ви так вважаєте?
б) Розглянемо подію: «річна зарплата більше 40000 дол.». Знайдіть значення випадкової величини X, що
має біноміальний розподіл, яка дорівнює кількості наступів даної події. Знайдіть також біноміальну
частку р і поясніть, що вона показує.
в) Яку частину працівників складають чоловіки? Розгляньте цю величину як біноміальну частку. Чому
дорівнює п?
2. У вас є вакансія, і ви хочете взяти на роботу нового співробітника. Припустімо, що досвід роботи нових
співробітників має нормальний розподіл з середнім і стандартним відхиленням (вибірковим), як у
ваших нинішніх співробітників.
а) Знайдіть ймовірність того, що досвід роботи нового співробітника буде перевищувати шість років.
б) Знайдіть ймовірність того, що досвід роботи нового співробітника буде менше трьох років.
в) Знайдіть ймовірність того, що досвід роботи нового співробітника буде становити від чотирьох до семи
років.
1.А) Заробітна плата, вік та стаж - це неперервні величини, оскільки можуть приймати будь-яке значення з певного діапазону.
Номер, стать та рівень підготовки - це дискретні величини, оскільки можуть приймати лише окремі значення з певного набору.
Б) Кількість працівників з річною зарплатою більше 40000 дол. - це 50.
Тому, випадкова величина X, яка має біноміальний розподіл, дорівнює кількості наступів події "річна зарплата більше 40000
дол." в середньому за n=70 працівників, що мають річну зарплату. Тобто, , де p - ймовірність мати річну зарплату більше
40000 дол.
Оскільки в нашому випадку кількість працівників з річною зарплатою більше 40000 дол. становить 50, то
Таким чином, біноміальна частка p показує ймовірність того, що працівник, взятий випадковим чином з нашої бази даних,
матиме річну зарплату більше 40000 дол.
В) Для того, щоб знайти частину працівників, які є чоловіками, потрібно розрахувати співвідношення чоловіків до загальної
кількості працівників в компанії.
З бази даних, нам відомо, що кількість чоловіків складає 43, а кількість жінок - 27. Тоді загальна кількість працівників в
компанії складає:

Отже, n дорівнює 70.

Для цієї величини, ми також можемо розглянути її як біноміальну частку, оскільки працівники в компанії можуть бути
розбиті на дві категорії: чоловіки та жінки. Якщо ми вважатимемо, що кожен працівник має однакові шанси стати вибраної
якоїсь конкретної ролі (чоловіком або жінкою), то ця величина може мати біноміальний розподіл. Припустимо, що ми
вибираємо працівника компанії випадковим чином і розглядаємо ту подію, що цей працівник є чоловіком. Тоді кількість
успіхів у n спробах буде дорівнювати кількості чоловіків в компанії (43), а ймовірність успіху (вибрати чоловіка) буде рівна:

Отже, біноміальна частка для цієї величини дорівнює, що показує ймовірність того, що випадково обраний працівник
буде чоловіком. Це є біноміальна частка з параметрами n=70 (загальна кількість працівників) та p=0.6143 (ймовірність бути
чоловіком). В цьому випадку, n дорівнює загальній кількості працівників в базі даних.
2.А) Якщо досвід роботи нового співробітника має нормальний розподіл з середнім і
стандартним відхиленням, то його можна описати за допомогою стандартного нормального
розподілу, що має середнє значення 0 і стандартне відхилення 1.
Для знаходження ймовірності того, що досвід роботи нового співробітника буде перевищувати 6
років, спочатку необхідно знайти значення стандартної нормальної випадкової величини (Z-
значення) за формулою:

Так як ми не знаємо конкретні значення середнього і стандартного відхилення, ми не можемо


виконати цілком точний розрахунок. Але ми можемо зробити оцінку на підставі даних про
досвід роботи поточних співробітників.
Нехай, наприклад, середній досвід роботи поточних співробітників дорівнює 4 рокам, а
стандартне відхилення - 2 роки. Тоді Z-значення буде:

Після знаходження Z-значення можна скористатися таблицею стандартного нормального


розподілу, щоб знайти ймовірність того, що стандартна нормальна випадкова величина буде
меншою за це значення. З таблиці знаходимо, що така ймовірність становить приблизно 0,8413.
Отже, якщо середній досвід роботи поточних співробітників дорівнює 4 рокам, а стандартне
відхилення - 2 роки, то ймовірність того, що досвід роботи нового співробітника буде
перевищувати 6 років, дорівнює близько 0,8413. Звісно, якщо дані про середн ій досвід та
стандартне відхилення є вибірковими, то імовірність може бути недостатньо точною. Також
важливо враховувати, що досвід роботи може залежати від багатьох інших факторів, таких як
освіта, попередні місця роботи, сфера діяльності тощо. Тому перед прийняттям рішення про
найм нового співробітника, слід провести більш детальний аналіз його кваліфікації та досвіду
роботи, а не покладатися лише на статистичні показники.
Б) За нормальним розподілом, ймовірність того, що досвід роботи нового співробітника буде
менше трьох років, можна знайти за допомогою функції розподілу нормального розподілу зі
значеннями середнього та стандартного відхилення:

де Φ - функція розподілу стандартного нормального розподілу.


Отже, ймовірність того, що досвід роботи нового співробітника буде менше трьох років,
дорівнює близько 0,3085.
Для цього використаємо правило "68-95-99.7" для нормального розподілу: більшість (68%)
спостережень знаходяться в межах одного стандартного відхилення від середнього; практично
всі (95%) - в межах двох стандартних відхилень від середнього; практично всі (99.7%) - в межах
трьох стандартних відхилень від середнього.
Отже, щоб знайти ймовірність того, що досвід роботи нового співробітника буде становити від 4
до 7 років, спочатку знайдемо стандартизовані значення для цих меж:

Тепер з таблиці нормального розподілу знайдемо ймовірності для цих значень стандартизованої
випадкової величини Z:

Таким чином, ймовірність того, що досвід роботи нового співробітника буде становити від 4 до
7 років, дорівнює різниці між цими ймовірностями:

 
ТЕМА 4. ПОПЕРЕДНЄ ПЛАНУВАННЯ ВИПАДКОВОЇ ВИБІРКИ ДЛЯ
ОЦІНЮВАННЯ БІЗНЕС ПРОЦЕСІВ
РОБОТА З БАЗОЮ ДАНИХ (С. 390) (ТЕОРЕТИЧНА ЧАСТИНА –
ПІДРУЧНИК «ПРАКТИЧЕСКАЯ БИЗНЕС-СТАТИСТИКА», ГЛАВА 8, С.
340-377).
1. Покажіть, що ця база даних створена як основа вибірки. Зокрема, покажіть, як її можна використовувати, щоб
отримати доступ до інформації про окремий службовця.
2. Використовуючи таблицю випадкових чисел, побудуйте випадкову вибірку об'ємом 10 без повернення. В якості
початкової точки в таблиці візьміть рядок 23, стовпчик 7.
а) Перепишіть номера службовців, які потрапили у вашу вибірку.
б) Обчисліть середню заробітну плату для вашої вибірки та інтерпретуйте отримане число.
в) Розрахуйте стандартне відхилення заробітної плати в даній вибірці і інтерпретуйте отримане число.
г) Розрахуйте стандартну похибку заробітної плати для вашої вибірки і інтерпретуйте отримане число. Зокрема, чому
стандартна похибка відрізняється від стандартного відхилення, знайденого в попередньому пункті цієї вправи?
3. Продовжуйте роботу з вибіркою з попереднього вправи.
а) Визначте середнє значення заробітної плати для генеральної сукупності. (Зауваження: у реальному житті зазвичай
немає можливості визначити середнє для генеральної сукупності)
б) Порівняйте середнє значення заробітної плати для генеральної сукупності з вибірковим середнім. Зокрема, на скільки
величин стандартної похибки відрізняються ці два значення?
в) Розрахуйте стандартне відхилення заробітної плати для генеральної сукупності і інтерпретуйте отримане число.
г) Порівняйте стандартне відхилення заробітної плати для генеральної сукупності з вибірковим стандартним
відхиленням.
д) Для вибіркового середнього значення заробітної плати знайдіть стандартне відхилення генеральної сукупності і
інтерпретуйте отримане число. Порівняйте його зі стандартною похибкою, отриманої з даних вибірки.
е) Запишіть отримані числа у формі таблиці зі стовпцями "генеральна сукупність" і "вибірка" і рядками "вибіркове
середнє і середнє генеральної сукупності", "стандартне відхилення для окремих службовців", а також "стандартне
відхилення і стандартна похибка вибіркових середніх для 10 службовців ".
А)Номера службовців, які потрапили у випадкову вибірку
Таблиця 1
Випадкова вибірка, з зазначенням номера службовця

23 62530 M 50 10 В 15
24 27525 Ж 38 3 А 20
25 24395 M 31 5 А 21
26 56884 M 47 10 А 20
27 52111 M 56 5 А 23
28 44183 Ж 38 5 В 30
29 24967 Ж 55 6 А 52
30 35423 Ж 47 4 А 50
31 41188 Ж 35 2 В 55
32 27525 Ж 35 3 А 60
Б) Середня заробітна плтата для нашої вибірки становить: 39 673,01
В) Щодо розрахунку стандартного відхилення, він дає уявлення про те, наскільки
значення вибірки розкинуті навколо середнього значення. Чим більше стандартне
відхилення, тим більший розкид даних відносно середнього значення.
Для розрахунку стандартного відхилення спочатку потрібно знайти відхилення
кожного значення вибірки від середнього значення, піднести їх до квадрату, додати всі
результати та поділити на кількість спостережень (в даному випадку, на 10), а потім
взяти квадратний корінь з отриманого значення:

Отже, стандартне відхилення заробітної плати в даній вибірці дорівнює 13 713.7 грн.
Це значення досить велике, що свідчить про значний розкид даних відносно
середнього значення.
Г) Стандартна похибка (Standard Error) відображає точність оцінки середнього
значення вибірки і відображається як стандартне відхилення розподілу середнього
значення великої кількості вибірок. Формула для розрахунку стандартної похибки
залежить від стандартного відхилення та розміру вибірки:
Стандартна похибка = стандартне відхилення / квадратний корінь з розміру вибірки
У даному випадку, ми маємо 10 значень у вибірці, тому:
Стандартна похибка =
Отже, стандартна похибка заробітної плати для даної вибірки становить 4 344.6 грн.
Стандартна похибка є меншою за стандартне відхилення, оскільки стандартна
похибка відображає точність оцінки середнього значення, тоді як стандартне
відхилення відображає розкид даних відносно середнього значення. Стандартна
похибка дорівнює стандартному відхиленню, розділеному на корінь з розміру вибірки,
тому чим більший розмір вибірки, тим менша стандартна похибка. В даному випадку
стандартна похибка є значно меншою за стандартне відхилення.
3.а)Середнє значення генеральної сукупності = 44957,83
Б) Оцінка стандартної похибки для вибірки з 10 працівників прийнята за
Тепер можна порівняти середні значення заробітної плати для генеральної сукупності та
вибіркове середнє з використанням стандартних похибок.
Для генеральної сукупності: 45 326,72 ± 4553,8 дол.
Для вибіркової: 45 874,8 ± 4553,8 доларів
Г) Для розрахунку стандартного відхилення потрібно мати дані про заробітну плату
кожного працівника в генеральній сукупності. Якщо такі дані відсутні, стандартне
відхилення неможливо обчислити.
Якщо ж дані про заробітну плату кожного працівника в генеральній сукупності є,
стандартне відхилення можна обчислити за допомогою формули:

де xi - заробітна плата кожного працівника, μ - середнє значення заробітної плати для


генеральної сукупності, N - розмір генеральної сукупності.
Якщо, наприклад, маємо дані про заробітну плату 70 працівників, можна обчислити
стандартне відхилення наступним чином:

де xi - заробітна плата кожного працівника.


Отримане число буде виражати стандартне відхилення заробітної плати в генеральній
сукупності. Воно показує, як сильно відрізняються значення заробітної плати від
середнього значення. Чим більше стандартне відхилення, тим більше розмаїття заробітної
плати в генеральній сукупності. Інтерпретація значення стандартного відхилення
залежить від конкретної ситуації та контексту дослідження.
Е)

Таблиця 2
Таблиця значень генеральної та вибіркової сукупності
ЗАВДАННЯ 2 – 15 БАЛІВ (ВИКОНУЄТЬСЯ ГРУПОЮ СТУДЕНТІВ З ДВОХ
ОСІБ)
 
ТЕМА 1. ПОНЯТТЯ ТА ВИДИ ДАНИХ У БІЗНЕС-СТАТИСТИЦІ
Ситуаційний аналіз «Необхідність контролю виробничих втрат» (теоретична частина – підручник
«Практическая бизнес-статистика», Глава 3, с. 70-100).
«Цей Оуен викидає наші гроші на вітер! – Голосно заявив Біллінгс на нараді. – У мене є докази. Ось
гістограма вартості використання сировини. Чітко видно дві групи, причому Оуен витрачає на
сировину на кілька сотен доларів більше, ніж Парсел».
Ви ведете нараду, і вона проходить більш емоційно, ніж хотілося б. Щоб перевести збори в більш
спокійне русло, ви чемно намагаєтеся пом'якшити обговорення і досконально обдумати рішення. 
Ви знаєте, як, втім, і більшість інших, що Оуен має репутацію безтурботного людини. Однак ви ніколи
не ставили цей порок на перше місце, і вам хотілося б відкласти оцінку Оуена якраз тому, що інші
заздрісно підкидають таку пропозицію, й тому, що Оуена поважають за компетентність і працьовитість.
Вам також відомо, що Біллінгс і Парсел – хороші приятелі. У цьому, звичайно, немає нічого поганого,
але все ж краще познайомитися з усією доступною інформацією перед тим, як робити остаточний
висновок.
Після наради ви просите Біллінгса прислати вам електронною поштою копію даних (42 спостереження).
Але він надсилає вам тільки перші дві колонки (витрати на матеріали) (табл. 1.), і вони вам вже
знайомі. У вашому комп'ютері вже є звіт, що включає всі три колонки, наведені нижче. Тепер ви готові
витратити час на підготовку наради, щоб провести її на наступному тижні.
Відпові- Відпові-
Вартість Вартість Вартість Вартість
дальний дальний
сировини, дол. продукції, дол. сировини, дол. продукції, дол.
менеджер менеджер

1459 Оуен 4869 1434 Оуен 4589


1502 Оуен 4806 1127 Парсел 3606
1492 Оуен 4774 1457 Оуен 4662
1120 Парсел 3558 1109 Парсел 3549
1433 Оуен 4746 1236 Парсел 3955
1136 Парсел 3635 1188 Парсел 3802
1123 Парсел 3594 1512 Оуен 4838
1542 Оуен 4934 1131 Парсел 3619
1434 Оуен 4749 1108 Парсел 3546
1379 Оуен 4413 1135 Парсел 3632
1406 Оуен 4499 1416 Оуен 4531
1487 Оуен 4756 1170 Парсел 3744
1138 Парсел 3642 1417 Оуен 4534
1529 Оуен 4893 1381 Оуен 4419
1142 Парсел 3654 1248 Парсел 3994
1127 Парсел 3605 1171 Парсел 3747
1457 Оуен 4662 1471 Оуен 4707
1379 Оуен 4733 1142 Парсел 3654
1407 Оуен 4502 1161 Парсел 3715
1105 Парсел 3536 1135 Парсел 3632
1126 Парсел 3603 1500 Оуен 4800
Питання для обговорення:
Чи є розподіл вартості сировини дійсно бімодальний? Або ці дані можна
розглядати як одну нормально розподілену групу значень?
Чи узгоджуються гістограми, побудовані для Оуена і Парсела окремо, із
твердженням Біллінгса про те, що Оуен витрачає більше?
Чи потрібно погодитися з Біллінгсом на наступній нараді? Обґрунтуйте вашу
відповідь за допомогою ретельного аналізу наявних даних.
 
1. Для візуальної оцінки розподілу можна побудувати гістограму вартості сировини.
Якщо розподіл є бімодальним, то гістограма буде мати дві виражені вершини (піки) на
різних значеннях. Якщо ж розподіл є нормальним, то гістограма матиме симетричну
форму з одним піком.
На основі даних таблиці можна побудувати гістограму вартості сировини:

Як можна побачити з гістограми, форма


розподілу є досить симетричною з одним
піком близько до значення 1400. Отже,
розподіл не є бімодальним. Можна
вважати, що дані розподілені нормально.
Отже, можна розглядати ці дані як одну
нормально розподілену групу значень.
2.Цілком можливо, проте середнє значення для данних вартості сировини по 1
стовбчику = 1329,667, а по 2 = 1269. Тож по суті різниця виходить – 60,6666 дол.
3.Аналізуючи дані гістограми, вираховуючи середнє і слова Біллінгса – можна дійти
висновку, що Біллінгс дещо прибільшив витрати, які були використані на
придбання сировини. На наступній нараді слід зауважити, що різниця вийшла в
60, 6666 дол. Варто обговорити шляхи вдосконалення закупок, аби більше
питання безтурботних витрат не виникало в колективі.
СИТУАЦІЙНИЙ АНАЛІЗ: ЧИ СЛІД ПРОДОВЖУВАТИ
РОБОТУ З ЦИМ ПОСТАЧАЛЬНИКОМ? (ТЕОРЕТИЧНА
ЧАСТИНА – ПІДРУЧНИК «ПРАКТИЧЕСКАЯ БИЗНЕС-
СТАТИСТИКА»,
Ви ГЛАВА
і один з ваших співробітників, 5,отримали
Б.У. Келлерман, С. 169-199).
завдання – оцінити нового постачальника деталей до
обладнання, яке випускається вашою фірмою для догляду за будинком і садом. Одна з деталей повинна мати розмір 8,5
см. Однак допускається також будь-який розмір в межах від 8,4 до 8,6 см. Келлерман нещодавно доповів про
дослідження розмірів 99 поставлених деталей. Зроблений Келлерманом перший начерк звіту містить такі рекомендації.
Якість деталей, що поставляються фірмою НурaТеch, не відповідає «нашим вимогам». Незважаючи на те, що ціни цієї
фірми досить низькі і привабливі, а поставки відбуваються відповідно до графіку, якість виробів недостатньо висока.
Ми рекомендуємо серйозно розглянути питання про використання альтернативних джерел поставок.
Тепер ваша черга. Після аналізу отриманих Келлерманом цифр і проекту звіту перед вами стоїть завдання підтвердити
його рекомендації (або спростувати) на основі власного незалежного дослідження.
Висновки Келлермана представляються осмисленими. Основний аргумент полягає в тому, що, незважаючи на середнє
значення, яке становить 8,494 см і дуже близьке до стандарту – 8,5 см, стандартне відхилення досить значне і дорівнює
0,103. В результаті цього дефектні деталі складають приблизно третину всіх поставляються виробів. Дійсно, Келлерман
явно гордий тим, що пам'ятає знання, отримані давним-давно при вивченні статистики, – щось про те, що
потрапляння в межі одного стандартного відхилення від середнього спостерігається приблизно в третині випадків. У
даному конкретному випадку при такій ціні можна допустити 10, або навіть 20% дефектних деталей, однак   33%
виходить за рамки розумного.
Ситуація видається цілком очевидною, однак для того, щоб переконатися в правильності отриманих Келлерманом
висновків, ви вирішуєте все-таки самостійно швидко переглянути дані. Природно, ви очікуєте, що висновки
підтвердяться.
Ось цей набір даних:

8,503 8,503 8,500 8,496 8,500 8,503 8,497 8,504 8,503 8,508
8,502 8,501 8,489 8,499 8,492 8,497 8,508 8,502 8,505 8,489
8,505 8,499 8,890 8,505 8,504 8,499 8,499 8,505 8,493 8,494
8,510 8,310 8,804 8,503 8,787 8,502 8,509 8,499 8,493 8,493
8,346 8,499 8,505 8,509 8,499 8,503 8,494 8,511 8,501 8,497
8,501 8,502 8,780 8,494 8,500 8,498 8,500 8,502 8,501 8,491
8,511 8,494 8,374 8,492 8,497 8,150 8,496 8,501 8,489 8,506
8,493 8,498 8,535 8,900 8,433 8,601 8,497 8,501 8,438 8,503
8,508 8,501 8,499 8,504 8,505 8,461 8,497 8,495 8,504 8,501
8,493 8,504 8,897 8,505 8,490 8,492 8,503 8,507 8,497

Питання для обговорення:


Чи правильні результати обчислень Келлермана? 
Уважно подивіться на дані, використовуючи статистичні методи.
Чи вірні висновки, які зробив Келлерман? Якщо так, чому ви так вважаєте? Якщо ні,
то чому, і що слід зробити для вироблення правильних рекомендацій?
1. Щоб перевірити правильність результатів Келлермана, спочатку необхідно провести
описову статистику для цих даних.
Середнє значення:
mean = 8.51
Стандартне відхилення:
std = 0,097416
Зауважимо, що стандартне відхилення, яке ми отримали, дещо відрізняється від
значення, яке отримав Келлерман. Проте, це може бути пов'язано з тим, що ми
використовуємо вибірку, тоді як Келлерман, швидше за все, мав на увазі всю
популяцію.
Далі, для перевірки висновків Келлермана ми можемо побудувати діаграму
розсіювання із зазначенням середнього значення і діапазону, що відповідає одному
стандартному відхиленню від середнього:
З графіку видно, що дійсно багато точок знаходяться в діапазоні одного стандартного
відхилення від середнього. Тобто на основі графіку ми можемо свідчити про те,що
дефектні деталі не складають більш ніж третину всіх виробів.
На основі наданих даних можна зробити наступні висновки:
1 Середнє значення 8,51 є центральною тенденцією даних.
2 Стандартне відхилення 0,097416 є мірою розкиду даних навколо середнього
значення.
3 Чим менше значення стандартного відхилення, тим меншим є розкид даних, тому
значення 0,097416 свідчить про те, що дані мають високу концентрацію біля
середнього значення.
4 Висновуючи з цих даних, можна стверджувати, що значення вибірки знаходяться
досить близько до середнього значення і мають низький рівень розкиду навколо нього.
Отже, Келлерман помилився.
ТЕМА 3. СТАТИСТИЧНІ МЕТОДИ РОБОТИ З
ВИПАДКОВИМИ ВЕЛИЧИНАМИ, ЩО
ХАРАКТЕРИЗУЮТЬ БІЗНЕС ПРОЦЕСИ
Ситуаційний аналіз (с. 336-337): Вартість опціону на оренду нафтового родовища (теоретична частина –
підручник «Практическая бизнес-статистика», Глава 7, с. 278-323)..
Існує можливість оренди нафтового родовища, яка здається настільки привабливою, що це мало схоже на
правду. Судіть самі: нафтове родовище, запаси якого оцінюються в 1 500 000 барелів, можна взяти в
оренду на 3 роки всього лише за 1 млн дол. Можливість представляється дуже вигідною: платимо
мільйон, добуваємо нафту, продаємо її за поточною ціною «спот», 18,36 дол. за барель, – і можна
відпочивати.
Однак при більш уважному розгляді стає зрозуміло, чому ніхто не вхопився за цю «можливість».
Виявляється, що видобувати нафту буде непросто в силу геологічних особливостей і віддаленості
родовища. При ретельному вивченні питання з'ясовується, що прогнозовані витрати на видобуток нафти
складуть 30 млн дол. Можна зробити висновок про те, що розробка цього родовища виявиться збитковою.
Здавалося б, на цьому можна і закрити питання.
Наступного тижня, незважаючи на зайнятість розглядом іншого інвестиційного проекту, ви все одно знову і
знову повертаєтеся думками до цього проекту. Зокрема, низька вартість оренди і той факт, що строк
оренди становить три роки, просто змушують вас провести аналіз ситуації з використанням сценарію
«Що, якщо?» і з урахуванням того, що зараз зобов'язань з видобутку нафти немає, і, крім того, організувати
видобуток нафти можна досить швидко (приблизно за місяць) в будь-який час протягом трирічного
терміну оренди. З'являються припущення, що це все ж таки може виявитися вигідним. Якщо ціни на
нафту впродовж трьох років зростуть настільки, що розробка цього родовища виявиться вигідною? Якщо
так – можна видобувати нафту. Однак, якщо ціни не зростуть достатньою мірою, строк оренди мине, а
нафта залишиться під землею. Таким чином, майбутні ціни на нафту визначать, чи слід використовувати
можливість видобутку нафти («опціон на видобуток») чи ні.
Однак рішення про покупку такого опціону – ризиковане. Наскільки великий ризик? Яким може
виявитися можливий дохід? Для оцінки ситуації визначаємо структуру основних ймовірностей для ціни на
нафту – джерела невизначеності в цій ситуації.
Ціна на нафту в майбутньому, дол. Ймовірність
10 0,1
15 0,2
20 0,4
25 0,2
30 0,1

Питання для обговорення:


1. Скільки можна було б заробити за відсутності витрат на видобуток нафти? Чи вистачить цього, щоб «піти
на відпочинок»?
2. Враховуючи витрати на видобуток, чи будуть фінансові втрати, якщо придбати право оренди і відразу ж
почати видобувати нафту? Скільки складуть ці втрати?
3. Продовжимо розгляд сценарію і розрахуємо майбутні чисті надходження для кожної з передбачуваних в
майбутньому цін на нафту. Для цього помножимо кожен раз ціни на нафту на кількість барелів і віднімемо з
отриманого значення вартість видобутку. Якщо результат негативний – розробляти родовище немає сенсу,
так що від’ємні значення можна переводити в нульові. (На цьому етан вартість оренди не віднімається,
оскільки її вже вважаємо виплаченої.)
4. Тепер знайдемо середні можливі чисті доходи за вирахуванням вартості оренди. Скільки в середньому
можна отримати (або втратити), взявши в оренду це нафтове родовище? (Інфляцію можна не враховувати).
5. Наскільки ризикованою виявляється пропозиція оренди?
6. Чи будете ви брати в оренду це родовище?
1. Для розрахунку очікуваної виручки необхідно знайти середнє значення ціни на нафту за ваговим коефіцієнтом
ймовірностей

Отже, очікуваний дохід від продажу 1 бареля нафти становить 20 доларів. Зважаючи на запаси родовища 1 500 000 барелів,
можна очікувати загальну виручку від продажу нафти:

Однак, вартість видобутку складає 30 млн доларів, тому з прибутку в 30 млн доларів необхідно відрахувати витрати на
видобуток, що дорівнюють 30 млн доларів, отже, прибуток від оренди родовища дорівнює 0 доларів, або навіть збитковий.
Проте враховуючи, що заробити можна ЗА ВІДСУТНОСТІ витрат наш дохід складе 30 млн.доларів.

Цілком можливо, що не вистачить.

2.Для відповіді на це питання потрібно розрахувати очікувані доходи та витрати на видобуток нафти за три роки та
порівняти їх. Очікувані доходи можна розрахувати, множивши очікувану кількість нафти на очікувану ціну за барель та на
ймовірність того, що ціна буде саме такою. Очікувані витрати складаються з вартості оренди родовища та витрат на його
розробку.

Очікувані доходи за три роки складуть:

Очікувані витрати на розробку та видобуток нафти:

Отже, очікувані фінансові втрати за три роки складуть:

Отже, при врахуванні витрат на видобуток нафти, розробка цього родовища призведе до фінансових втрат у розмірі 18 250 000
дол.
3.Таблиця розрахунку майбутніх чистих надходжень за різних цін на нафту:

Ціна на Ймовірніс Кількість Виручка, Витрати Чисті


нафту, ть барелів млн дол. на надходжен
дол.       видобуток ня, млн
  , млн дол. дол.
   

10 0,1 150 1,3 30, 0


000 8 00
15 0,2 150 2,0 30, 0
000 7 00
20 0,4 150 2,7 30, 0
000 6 00
25 0,2 150 3,4 30, 0
000 5 00

30 0,1 150 4,1 30, 0,14


000 4 00
Як видно з таблиці, при цінах на нафту 10, 15, 20 і 25 доларів за барель, ми отримуємо
від'ємні значення чистих надходжень, тому розробляти родовище в цих випадках не має
сенсу. При ціні на нафту 30 доларів за барель, ми отримуємо прибуток 0,14 млн доларів.
4. Для розрахунку середнього можливого чистого доходу треба взяти ваговану середню
суму прибутку за кожним із сценаріїв ціни на нафту, зважуючи його ймовірність:

Таким чином, середня можлива втрата від оренди нафтового родовища складе -28 360
000 доларів.
5.Пропозиція оренди нафтового родовища є досить ризиковою з великими коливаннями
можливих доходів в майбутньому.
6.Ні, адже це не вигідно.

You might also like