Professional Documents
Culture Documents
контр пр
контр пр
Робота з базою даних (с. 215) (теоретична частина – підручник «Практическая бизнес-статистика»:
Глава 5, с. 169-198):
Для розмірів річної заробітної плати визначте: розмах, стандартне відхилення, коефіцієнт варіації;
побудуйте гістограму та зазначте на ній середнє значення та стандартне відхилення,
охарактеризуйте отримані результати; скільки працівників мають зарплату, відмінну від
середньої не більше ніж на одну, дві та три величини стандартного відхилення?
Для розрахунку середньої заробітної плати можна використати формулу:
Сума заробітних плат у базі даних дорівнює: 3 147 048,1, а кількість працівників: 70,
тобто
Також можемо обчислити медіану. Для цього потрібно знайти середину відсортованого
списку заробітних плат. Якщо кількість заробітних плат непарна, то медіана - це
значення по середині. Якщо кількість заробітних плат парна, то медіана - це середнє
арифметичне двох значень по середині.
Кількість заробітних плат у нашому випадку - парна, тому медіана:
НАБЛИЖЕНЕ ЗНАЧЕННЯ МОДИ - ЦЕ НАЙБІЛЬШ ЧАСТО
ЗУСТРІЧАЄТЬСЯ ЗНАЧЕННЯ. В НАШОМУ ВИПАДКУ ДВІ
ЗАРОБІТНІ ПЛАТИ ЗУСТРІЧАЮТЬСЯ НАЙЧАСТІШЕ - 53174
ТА 53174. ТОМУ МОЖНА НАЗВАТИ ЇХ НАБЛИЖЕНОЮ
МОДОЮ.
ПОБУДУЄМО ГІСТОГРАМУ З ОТРИМАНИХ РЕЗУЛЬТАТІВ:
Щоб визначити квартилі та екстремуми, спочатку потрібно відсортувати заробітні плати:
23975, 24352, 24352, 24395, 24395, 24967, 26491, 27525, 27525, 29606, 35018, 35423, 35423, 36442, 37456,
38141, 39511, 41071, 41222, 42885, 43533, 44417, 45807, 46384, 48769, 51235, 53023, 55323, 57286, 59321,
59978, 60146, 60642, 61972, 63952, 64362, 66934, 68358, 71476, 74970, 75360, 80255, 81435, 82878, 83736,
84934, 89343, 90518, 91131, 95041, 96291, 96833, 97222, 100031, 101302, 102129, 102568, 105557, 110750,
111945, 116928, 119348, 120350, 121907, 125162, 125392, 127119, 128406, 128674, 131331, 136159, 138067,
140096, 143321, 144728, 146126, 149604, 149997, 155000, 157682, 158129, 159474, 160775, 164894, 165924,
167495, 172672, 173416, 177279, 179559, 180209, 186641, 191324, 192972, 193194, 195174, 195291, 196568,
196715, 202320, 202496, 203722, 204383, 208613, 211333, 216374, 218444, 220390, 220747, 224186, 225345,
225820, 228992, 229267, 232192, 232707, 235647, 238122, 238357, 240005, 241128, 242378, 243315, 247438,
248178, 249093, 249252, 249603, 250243, 253050, 256958, 260521, 260836, 264680, 267220, 267316, 271422,
273583, 276437, 276566, 277952, 280373, 282254, 282921, 289212, 292940, 296105, 303576, 303709, 303831,
305449, 307007, 308203, 312292, 314115, 316901, 318768, 322480, 322889, 324446, 326530, 327798, 329729,
332739, 337325, 342100, 342231, 342318, 343368, 344648, 346464, 348790, 352919, 354875, 358767, 362857,
362917, 363752, 364282, 365727, 369109, 369463, 369568, 369631, 372416, 373015, 375987, 377712, 378110,
381800, 382673, 383308, 384860, 385424, 386475, 387271, 391145, 393238, 397112, 397809, 397923, 399417,
399766, 399890, 400471, 400510, 401367.
Тепер можна визначити квартилі та екстремуми:
Мінімальне: 23 975;
1-й квартиль (25%): 37 309
Медіана (50%): 49 033
3-й квартиль (75%): 53 174
Максимум: 62 530
Функцію кумулятивного розподілу можна побудувати, розташувавши значення
заробітної плати у порядку зростання та порахувавши частоту входження кожного
значення. Далі необхідно обчислити частку значень, що не перевищують певне
значення заробітної плати до загальної кількості спостережень. Це дозволить
отримати функцію кумулятивного розподілу.
Щоб знайти 10-й перцентиль, необхідно знайти значення, яке менше за 10% значень
вибірки. Тобто, необхідно взяти 10% від загальної кількості значень:
Отже, 10-й перцентиль буде дорівнювати значенню заробітної плати, яке стоїть на 7-му
місці відсортованої вибірки: 50 602
Аналогічно можна знайти 90-й перцентиль:
Отже, 90-й перцентиль буде дорівнювати значенню заробітної плати, яке стоїть на 63-
му місці відсортованої вибірки: 53 174
2. Тоді відсоток жінок серед службовців буде:
А відсоток чоловіків буде:
Щодо моди, то це значення в вибірці, яке зустрічається найчастіше. Для статистики, мода може свідчити про
те, яке значення є найбільш типовим для даної вибірки. А отже, в нашій таблиці даних найчастіше
зустрічається значення статі – чоловік, тож чоловіча стать є типовою для даної вибірки.
2.1. Розмах - це різниця між найбільшим та найменшим значеннями. Для розмірів річної заробітної плати з
бази даних, які ми використовували в попередніх завданнях, маємо:
Отже розмах з річної заробітної плати становить: 38 555 доларів.
Стандартне відхилення : 10 822,13. Отож на основі отриманих даних побудуємо гістограму.
Отже, ймовірність того, що випадково вибраний працівник є жінкою, становить близько 0.386 або
38.6%
Б)Щоб знайти ймовірність того, що зарплата перевищує 35000 дол., необхідно визначити кількість
працівників з зарплатою більше 35000 дол. і поділити її на загальну кількість працівників у базі.
Нехай кількість працівників з зарплатою більше 35000 дол. дорівнює m, а загальна кількість
працівників у базі дорівнює N. Тоді ймовірність того, що зарплата перевищує 35000 дол., дорівнює
m/N, отже
В) Щоб знайти ймовірність того, що працівник має рівень підготовки В, необхідно визначити
кількість працівників з рівнем підготовки В та загальну кількість працівників у базі і поділити
одне на інше. Нехай кількість працівників з рівнем підготовки В дорівнює k, а загальна кількість
працівників у базі дорівнює N. Тоді ймовірність того, що працівник має рівень підготовки В,
дорівнює k/N, отже
Г) Для знаходження ймовірності того, що зарплата перевищує 35000 дол. і працівник має рівень
підготовки В, потрібно знайти кількість працівників, які задовольняють ці дві умови, і поділити на
загальну кількість працівників, отож
Д) Для знаходження умовної ймовірності того, що зарплата перевищує 35000 дол. за
умови, що працівник має рівень підготовки В, потрібно взяти кількість працівників з
рівнем підготовки В і зарплатою більше 35000 дол. і поділити на загальну кількість
працівників з рівнем підготовки В. З таблиці бачимо, що кількість працівників з
рівнем підготовки В і зарплатою більше 35000 дол. дорівнює 23, а кількість
працівників з рівнем підготовки В дорівнює 24, тому умовна ймовірність дорівнює
0,9583.
Е) одії "зарплата вище 35000 дол." та "рівень підготовки В" не є незалежними. Це
випливає з того, що кількість працівників з різними рівнями підготовки та
зарплатами різна, тобто наявність однієї умови впливає на ймовірність наявності
іншої умови. Наприклад, з таблиці бачимо, що всі працівники з рівнем підготовки А
мають зарплату менше або рівну 35000 доларів, тоді як у працівників з рівнем
підготовки В 50% мають зарплату вище 35000 доларів. Це свідчить про те, що
наявність умови "рівень підготовки В" впливає на ймовірність наявності умови
"зарплата вище 35000 доларів". Таким чином, ці події не є незалежними.
Ж) Для знаходження умовної ймовірності того, що зарплата перевищує 35000 дол. за
умови, що працівник має рівень підготовки С, потрібно взяти кількість працівників з
рівнем підготовки С і зарплатою більше 35000 дол. і поділити на загальну кількість
працівників з рівнем підготовки С. З таблиці бачимо, що кількість працівників з
рівнем підготовки С і зарплатою більше 35000 дол. дорівнює 8, а кількість працівників
з рівнем підготовки С дорівнює 8, тому умовна ймовірність дорівнює 1.
2. А) За умовою, в компанії з 70 працівників 27 є жінками, тому ймовірність того, що
працівник є жінкою, дорівнює
Також з умови відомо, що 10 з 27 жінок мають досвід роботи від 6 років і вище, тому
ймовірність того, що жінка має такий досвід, дорівнює
Б) Отже, ймовірність перетину двох подій (тобто того, що працівник є жінкою і має
досвід роботи від 6 років і вище) дорівнює добутку ймовірностей кожної з цих
подій:
Отже, ймовірність того, що працівник є жінкою і має досвід роботи від 6 років і вище,
становить близько 0.14.
Г) Щоб знайти умовну ймовірність наявності великого досвіду роботи за умови, що
працівник є жінкою, треба розділити ймовірність перетину двох подій (тобто
наявності великого досвіду роботи та того, що працівник є жінкою) на ймовірність
того, що працівник є жінкою:
Для цієї величини, ми також можемо розглянути її як біноміальну частку, оскільки працівники в компанії можуть бути
розбиті на дві категорії: чоловіки та жінки. Якщо ми вважатимемо, що кожен працівник має однакові шанси стати вибраної
якоїсь конкретної ролі (чоловіком або жінкою), то ця величина може мати біноміальний розподіл. Припустимо, що ми
вибираємо працівника компанії випадковим чином і розглядаємо ту подію, що цей працівник є чоловіком. Тоді кількість
успіхів у n спробах буде дорівнювати кількості чоловіків в компанії (43), а ймовірність успіху (вибрати чоловіка) буде рівна:
Отже, біноміальна частка для цієї величини дорівнює, що показує ймовірність того, що випадково обраний працівник
буде чоловіком. Це є біноміальна частка з параметрами n=70 (загальна кількість працівників) та p=0.6143 (ймовірність бути
чоловіком). В цьому випадку, n дорівнює загальній кількості працівників в базі даних.
2.А) Якщо досвід роботи нового співробітника має нормальний розподіл з середнім і
стандартним відхиленням, то його можна описати за допомогою стандартного нормального
розподілу, що має середнє значення 0 і стандартне відхилення 1.
Для знаходження ймовірності того, що досвід роботи нового співробітника буде перевищувати 6
років, спочатку необхідно знайти значення стандартної нормальної випадкової величини (Z-
значення) за формулою:
Тепер з таблиці нормального розподілу знайдемо ймовірності для цих значень стандартизованої
випадкової величини Z:
Таким чином, ймовірність того, що досвід роботи нового співробітника буде становити від 4 до
7 років, дорівнює різниці між цими ймовірностями:
ТЕМА 4. ПОПЕРЕДНЄ ПЛАНУВАННЯ ВИПАДКОВОЇ ВИБІРКИ ДЛЯ
ОЦІНЮВАННЯ БІЗНЕС ПРОЦЕСІВ
РОБОТА З БАЗОЮ ДАНИХ (С. 390) (ТЕОРЕТИЧНА ЧАСТИНА –
ПІДРУЧНИК «ПРАКТИЧЕСКАЯ БИЗНЕС-СТАТИСТИКА», ГЛАВА 8, С.
340-377).
1. Покажіть, що ця база даних створена як основа вибірки. Зокрема, покажіть, як її можна використовувати, щоб
отримати доступ до інформації про окремий службовця.
2. Використовуючи таблицю випадкових чисел, побудуйте випадкову вибірку об'ємом 10 без повернення. В якості
початкової точки в таблиці візьміть рядок 23, стовпчик 7.
а) Перепишіть номера службовців, які потрапили у вашу вибірку.
б) Обчисліть середню заробітну плату для вашої вибірки та інтерпретуйте отримане число.
в) Розрахуйте стандартне відхилення заробітної плати в даній вибірці і інтерпретуйте отримане число.
г) Розрахуйте стандартну похибку заробітної плати для вашої вибірки і інтерпретуйте отримане число. Зокрема, чому
стандартна похибка відрізняється від стандартного відхилення, знайденого в попередньому пункті цієї вправи?
3. Продовжуйте роботу з вибіркою з попереднього вправи.
а) Визначте середнє значення заробітної плати для генеральної сукупності. (Зауваження: у реальному житті зазвичай
немає можливості визначити середнє для генеральної сукупності)
б) Порівняйте середнє значення заробітної плати для генеральної сукупності з вибірковим середнім. Зокрема, на скільки
величин стандартної похибки відрізняються ці два значення?
в) Розрахуйте стандартне відхилення заробітної плати для генеральної сукупності і інтерпретуйте отримане число.
г) Порівняйте стандартне відхилення заробітної плати для генеральної сукупності з вибірковим стандартним
відхиленням.
д) Для вибіркового середнього значення заробітної плати знайдіть стандартне відхилення генеральної сукупності і
інтерпретуйте отримане число. Порівняйте його зі стандартною похибкою, отриманої з даних вибірки.
е) Запишіть отримані числа у формі таблиці зі стовпцями "генеральна сукупність" і "вибірка" і рядками "вибіркове
середнє і середнє генеральної сукупності", "стандартне відхилення для окремих службовців", а також "стандартне
відхилення і стандартна похибка вибіркових середніх для 10 службовців ".
А)Номера службовців, які потрапили у випадкову вибірку
Таблиця 1
Випадкова вибірка, з зазначенням номера службовця
23 62530 M 50 10 В 15
24 27525 Ж 38 3 А 20
25 24395 M 31 5 А 21
26 56884 M 47 10 А 20
27 52111 M 56 5 А 23
28 44183 Ж 38 5 В 30
29 24967 Ж 55 6 А 52
30 35423 Ж 47 4 А 50
31 41188 Ж 35 2 В 55
32 27525 Ж 35 3 А 60
Б) Середня заробітна плтата для нашої вибірки становить: 39 673,01
В) Щодо розрахунку стандартного відхилення, він дає уявлення про те, наскільки
значення вибірки розкинуті навколо середнього значення. Чим більше стандартне
відхилення, тим більший розкид даних відносно середнього значення.
Для розрахунку стандартного відхилення спочатку потрібно знайти відхилення
кожного значення вибірки від середнього значення, піднести їх до квадрату, додати всі
результати та поділити на кількість спостережень (в даному випадку, на 10), а потім
взяти квадратний корінь з отриманого значення:
Отже, стандартне відхилення заробітної плати в даній вибірці дорівнює 13 713.7 грн.
Це значення досить велике, що свідчить про значний розкид даних відносно
середнього значення.
Г) Стандартна похибка (Standard Error) відображає точність оцінки середнього
значення вибірки і відображається як стандартне відхилення розподілу середнього
значення великої кількості вибірок. Формула для розрахунку стандартної похибки
залежить від стандартного відхилення та розміру вибірки:
Стандартна похибка = стандартне відхилення / квадратний корінь з розміру вибірки
У даному випадку, ми маємо 10 значень у вибірці, тому:
Стандартна похибка =
Отже, стандартна похибка заробітної плати для даної вибірки становить 4 344.6 грн.
Стандартна похибка є меншою за стандартне відхилення, оскільки стандартна
похибка відображає точність оцінки середнього значення, тоді як стандартне
відхилення відображає розкид даних відносно середнього значення. Стандартна
похибка дорівнює стандартному відхиленню, розділеному на корінь з розміру вибірки,
тому чим більший розмір вибірки, тим менша стандартна похибка. В даному випадку
стандартна похибка є значно меншою за стандартне відхилення.
3.а)Середнє значення генеральної сукупності = 44957,83
Б) Оцінка стандартної похибки для вибірки з 10 працівників прийнята за
Тепер можна порівняти середні значення заробітної плати для генеральної сукупності та
вибіркове середнє з використанням стандартних похибок.
Для генеральної сукупності: 45 326,72 ± 4553,8 дол.
Для вибіркової: 45 874,8 ± 4553,8 доларів
Г) Для розрахунку стандартного відхилення потрібно мати дані про заробітну плату
кожного працівника в генеральній сукупності. Якщо такі дані відсутні, стандартне
відхилення неможливо обчислити.
Якщо ж дані про заробітну плату кожного працівника в генеральній сукупності є,
стандартне відхилення можна обчислити за допомогою формули:
Таблиця 2
Таблиця значень генеральної та вибіркової сукупності
ЗАВДАННЯ 2 – 15 БАЛІВ (ВИКОНУЄТЬСЯ ГРУПОЮ СТУДЕНТІВ З ДВОХ
ОСІБ)
ТЕМА 1. ПОНЯТТЯ ТА ВИДИ ДАНИХ У БІЗНЕС-СТАТИСТИЦІ
Ситуаційний аналіз «Необхідність контролю виробничих втрат» (теоретична частина – підручник
«Практическая бизнес-статистика», Глава 3, с. 70-100).
«Цей Оуен викидає наші гроші на вітер! – Голосно заявив Біллінгс на нараді. – У мене є докази. Ось
гістограма вартості використання сировини. Чітко видно дві групи, причому Оуен витрачає на
сировину на кілька сотен доларів більше, ніж Парсел».
Ви ведете нараду, і вона проходить більш емоційно, ніж хотілося б. Щоб перевести збори в більш
спокійне русло, ви чемно намагаєтеся пом'якшити обговорення і досконально обдумати рішення.
Ви знаєте, як, втім, і більшість інших, що Оуен має репутацію безтурботного людини. Однак ви ніколи
не ставили цей порок на перше місце, і вам хотілося б відкласти оцінку Оуена якраз тому, що інші
заздрісно підкидають таку пропозицію, й тому, що Оуена поважають за компетентність і працьовитість.
Вам також відомо, що Біллінгс і Парсел – хороші приятелі. У цьому, звичайно, немає нічого поганого,
але все ж краще познайомитися з усією доступною інформацією перед тим, як робити остаточний
висновок.
Після наради ви просите Біллінгса прислати вам електронною поштою копію даних (42 спостереження).
Але він надсилає вам тільки перші дві колонки (витрати на матеріали) (табл. 1.), і вони вам вже
знайомі. У вашому комп'ютері вже є звіт, що включає всі три колонки, наведені нижче. Тепер ви готові
витратити час на підготовку наради, щоб провести її на наступному тижні.
Відпові- Відпові-
Вартість Вартість Вартість Вартість
дальний дальний
сировини, дол. продукції, дол. сировини, дол. продукції, дол.
менеджер менеджер
8,503 8,503 8,500 8,496 8,500 8,503 8,497 8,504 8,503 8,508
8,502 8,501 8,489 8,499 8,492 8,497 8,508 8,502 8,505 8,489
8,505 8,499 8,890 8,505 8,504 8,499 8,499 8,505 8,493 8,494
8,510 8,310 8,804 8,503 8,787 8,502 8,509 8,499 8,493 8,493
8,346 8,499 8,505 8,509 8,499 8,503 8,494 8,511 8,501 8,497
8,501 8,502 8,780 8,494 8,500 8,498 8,500 8,502 8,501 8,491
8,511 8,494 8,374 8,492 8,497 8,150 8,496 8,501 8,489 8,506
8,493 8,498 8,535 8,900 8,433 8,601 8,497 8,501 8,438 8,503
8,508 8,501 8,499 8,504 8,505 8,461 8,497 8,495 8,504 8,501
8,493 8,504 8,897 8,505 8,490 8,492 8,503 8,507 8,497
Отже, очікуваний дохід від продажу 1 бареля нафти становить 20 доларів. Зважаючи на запаси родовища 1 500 000 барелів,
можна очікувати загальну виручку від продажу нафти:
Однак, вартість видобутку складає 30 млн доларів, тому з прибутку в 30 млн доларів необхідно відрахувати витрати на
видобуток, що дорівнюють 30 млн доларів, отже, прибуток від оренди родовища дорівнює 0 доларів, або навіть збитковий.
Проте враховуючи, що заробити можна ЗА ВІДСУТНОСТІ витрат наш дохід складе 30 млн.доларів.
2.Для відповіді на це питання потрібно розрахувати очікувані доходи та витрати на видобуток нафти за три роки та
порівняти їх. Очікувані доходи можна розрахувати, множивши очікувану кількість нафти на очікувану ціну за барель та на
ймовірність того, що ціна буде саме такою. Очікувані витрати складаються з вартості оренди родовища та витрат на його
розробку.
Отже, при врахуванні витрат на видобуток нафти, розробка цього родовища призведе до фінансових втрат у розмірі 18 250 000
дол.
3.Таблиця розрахунку майбутніх чистих надходжень за різних цін на нафту:
Таким чином, середня можлива втрата від оренди нафтового родовища складе -28 360
000 доларів.
5.Пропозиція оренди нафтового родовища є досить ризиковою з великими коливаннями
можливих доходів в майбутньому.
6.Ні, адже це не вигідно.