You are on page 1of 8

Тема 1.

Введення у web-аналітику

Лабораторна робота 1. Аналітичний інструментарій в оцінці


бізнесу

Мета – поглиблення практичних навичок використання


статистичного інструментарію в оцінці будь-якого виду бізнесу.
Завдання:
1. Кожний студент повинен обрати будь-який вид бізнесу та
провести його аналіз за даними Інтернет ресурсів. Розрахунки
провести, використовуючи програмний застосунок MS Excel.
2. Розібрати етапи проведення A/B-теста та розглянути
різноманітні ситуації для розрахунку необхідного обсягу вибірки для
кожної групи, яка тестується, та тривалості тесту, використовуючи
онлайн-калькулятор.
3. Сформувати звіт з лабораторної роботи у вигляді аналітичної
довідки.

Методичні рекомендації
В аналітичній довідці (орієнтовно на 5-6 сторінок) показати
результати проведеного аналізу у вигдяді таблиць та графіків. Навести
висновки за кожним із проведених розрахунків. Надати загальний
висновок на 1 сторінку стосовно стану та перспектив розвитку
обраного для аналізу виду бізнесу.
При виконанні завдання доцільно використати наступні
аналітичні методи: групування, описову статистику, відносні показники,
динамічний аналіз, бенчмаркінг, методи візуалізації, A/B-тестування
тощо.
Розглянемо сутність даних методів більш докладно.
Аналіз даних може мати багато аспектів та підходів,
реалізовуватися за допомогою різних статистичних інструментів,
різноманітних способів візуалізації, але першочергове його завдання –
це стиснення інформації шляхом її групування.
Для проведення групування засобами MS Excel використовують
надбудову Аналіз даних, інструмент аналізу Групування. Так,
наприклад, необхідно згрупувати області країни за кількістю компаній,
що працюють в певному виді діяльності. Вихідні дані та результати
групування показано на рис. 1.

Рис. 1. Групування областей за кількістю компаній певного виду


бізнесу, що працюють в області

Таким чином, згідно до отриманих результатів групування, було


одержано 6 інтервалів (груп). Розподіл областей країни за кількістю
компаній певного виду бізнесу не є рівномірним, так найбільша
кількість областей (10) зосереджена у 2-му інтервалі, тобто там, де
кількість компаній коливається від 11 до 46, тобто 40% усіх компаній
зосереджено в 10 областях країни, а на 15 інших областей припадає
60% компаній. В цілому, 44% областей мають кількість компаній
певного виду бізнесу до 46 одиниць, лише в одній області країни
зосереджено максимальну кількість компаній (152 та більше).
Розповсюдженими аналітичними показниками є показники
описової статистики. На підставі використання функцій MS Excel Мода,
Медіана, Стандартне відхилення, Середнє значення, розрахунку
Коефіцієнта варіації, використання надбудови Аналіз даних,
інструменту аналізу Описова статистика можна отримати наступні
результати, рис. 2.
Рис. 2. Результати розрахунку показників описової статистики

Розглянемо показники описової статистики більш докладно.


Найвідомішою мірою центральної тенденції і найбільш вживаною в
повсякденному побуті є середня величина, або проста середня, або
арифметична середня. Для її обчислення досить скласти разом всі
значення в розподілі, і поділити на кількість спостережень.
Загальні правила для використання середньої величини:
середня величина є «центром тяжіння» розподілу, і кожне
значення дає внесок у визначення середнього значення, коли
поширення значень є симетричними довкола центральної точки;
середнє значення більш стабільне, ніж медіана чи мода. Тому,
коли потрібно знайти найбільш стабільну міру центральної тенденції,
то використовують середню величину.
Переваги середньої:
середня – це найбільш поширена міра центральної тенденції,
оскільки її легко зрозуміти;
середня легко підраховується;
середня враховує всі значення розподілу.
Обмеження середньої:
на значення середньої впливають екстремальні значення
(відомий іронічний жарт про «середню температуру по лікарні»);
інколи середнім є значення, що не присутнє в розподілі.
Медіана – це значення у ряді розподілу (впорядкований набір
значень змінної для різних спостережень, наприклад, від найменшого
до найбільшого значення), до якого розташовано половину всіх
значень, і після якого також знаходиться половина значень. Тобто,
медіана, це значення, що ділить впорядкований ряд навпіл.
Якщо кількість значень непарна, то береться одне зі значень, те,
що стоїть у розподілі рівно по центру. Коли значень парна кількість, то
беруть два центральні значення, і знаходять їхнє середнє.
Медіану використовують у випадках:
коли потрібно знайти точну середню точку на шляху від
найменшого значення до найбільшого;
коли екстремальні значення впливають на середнє, то медіана є
найкращою мірою центральної тенденції;
коли потрібно, щоб певні значення впливали на центральну
тенденцію, але все, що про них відомо – це те, що вони «нижче» або
«вище» медіани.
Переваги медіани:
Її легко вирахувати та зрозуміти;
для підрахунку медіани не потрібні всі значення в розподілі;
екстремальні значення розподілу не впливають на медіану;
її можна визначити і для «відкритих» інтервалів.
Обмеження медіани:
не так жорстко визначається, як середня величина, оскільки її
значення не стільки вираховується, скільки знаходиться (серед
значень в розподілі).
не враховує всі спостереження (значення для всіх спостережень).
з медіаною потім не можна робити алгебраїчні перетворення так,
як із середньою.
потребує впорядкування значень або класів інтервалів у
висхідному чи спадному порядку.
інколи медіаною може бути значення, що не присутнє у самому
розподілі.

Третьою мірою центральної тенденції є мода, тобто значення, що


найчастіше зустрічається в розподілі. Як правило, вона представляє
найбільш типове значення. На моду ніколи не впливають екстремальні
значення в розподілі, а впливають екстремальні частоти значень,
наскільки часто те чи інше значення змінної зустрічається в розподілі.
Мода використовується у випадках:
коли треба швидка і приблизна міра центральної тенденції;
коли потрібна міра центральної тенденції, що має бути типовим
значенням.
Переваги моди:
мода показує найбільш поширене значення в ряді розподілу;
на моду не впливають екстремальні значення, так як на середню;
моду можна визначити для відкритих інтервалів;
допомагає аналізувати якісні дані;
моду можна виявити графічним способом на підставі гістограми.
Обмеження моди:
не включає до визначення/розрахунку всі спостереження
розподілу, а лише концентрацію частот;
подальші алгебраїчні перетворення неможливі, на відміну від
середньої;
інколи важко визначити у випадку багатомодального чи
бімодального розподілу.
Розподіл може мати більше двох популярних значень, але якщо
має більше ніж трьох мод, опис такого розподілу в термінах найбільш
частих значень може втрачати будь-який сенс.

Стандартне відхилення – це індикатор того, наскільки


«розкиданими» відносно середнього є значення певної змінної в
наборі даних, і вимірюється в тих же одиницях виміру, що й змінна. В
нормальному розподілі 68% значень знаходяться в межах одного
стандартного відхилення від середнього (тобто +/- 1 стандартне
відхилення). Розраховується стандартне відхилення як корінь
квадратний від дисперсії.
Стандартне відхилення надає розуміння, наскільки добре,
наприклад, середня величина представляє весь набір даних. Якщо
розкид значень у розподілі великий, то середня не є такою
репрезентативною, ніж якщо розкид даних малий. Тобто, великий
розкид даних означає, що, ймовірно, є великі відмінності між
значеннями.
Для характеристики асиметрії використовують коефіцієнт
асиметрії Пірсона (асиметричність):

x  Mo
As  . (1)
σ

У одновершинних розподілах величина цього показника


змінюється від -1 до +1.
У симетричних розподілах A s = 0. За A s > 0 спостерігається
правостороння асиметрія, за A s < 0 – асиметрія лівостороння.

Для одновершинних розподілів розраховується показник


оцінювання його форми – ексцес. Ексцес є показником
гостровершинності розподілу. Він розраховується для симетричних
розподілів на основі центрального моменту 4-го порядку:

4
Ex  4  3 . (2)

У симетричному, близькому до нормального розподілу – Ex  0 .


Очевидно, за гостровершинного розподілу – E x  0 , за плосковершинного
– Ex  0 .
Таким чином, за результатами розрахунку показників описової
статистики, представлених на рис. 2, можна зробити висновок, що
найбільша кількість компаній знаходиться в Одеській області й складає
187 компаній, а найменший – в Луганській області (11 компаній). Мода
показує, що найбільш розповсюджена кількість компаній серед
областей країни – 21. Медіана свідчить про те, що в половині областей
країни працюють до 59 компаній, а в другій половині – більше цього
значення. Відхилення навколо середнього значення кількості компаній
по країні (65) складає 47, що свідчить про те, що області країни є
неоднорідними за рівнем розповсюдження кількості компаній певного
виду бізнесу (коефіцієнт варіації складає 72,64% , що значно
перевищує критерій однорідності 33%).
При здійсненні аналізу інформації для виявлення структури,
координації, порівняння, інтенсивності, динаміки бізнес-процесів
використовують відносні величини:
1) структури, які характеризують частку (питому вагу) складових
частин сукупності в загальному її обсязі;
2) координації, які характеризують відношення окремих частин
статистичної сукупності між собою;
3) порівняння, які являють собою співвідношення однойменних
абсолютних показників, що характеризують різні об'єкти або території;
4) інтенсивності, що характеризують ступінь поширення
досліджуваного процесу або явища і являють собою відношення
досліджуваного показника до розміру властивого йому середовища;
5) динаміки, які показують інтенсивність зміни явища в динаміці
та розрахову.ться як відношення значення показника у звітному періоді
до значення цього ж показника у базисному (попередньому) періоді.

Окрему увагу заслуговують аналітичні показники динаміки, до


яких, крім відносної величини динаміки або темпу зростання, відносять
абсолютний приріст, темп приросту, абсолютне значення 1% приросту,
середні показники динаміки (середній абсолютний приріст, середній
темп зростання, середній темп приросту). Дані показники інтенсивності
динаміки можуть бути розраховані базисним або ланцюговим
способами в залежності від мети дослідження.

Бенчмаркінг – це метод аналізу та пошуку пошуку стандартного


чи еталонного економічно ефективнішого підприємства-конкурента для
порівняння із власним та переймання його вдалих методів роботи.
Також це постійний та систематичний пошук і впровадження
ефективних практик, що мають привести бізнес-структуру до
досконалішої форми, інструмент для визначення становища компанії у
порівнянні з іншими подібними компаніями, схожими за розмірами
та/або видом чи сферою діяльності.
У центрі уваги бенчмаркінгу стоять запитання, чому інші компанії
є успішнішими. Зміст та мета бенчмаркінгу полягає у виявленні
відмінностей із аналогом, виявлення причин цих відмінностей та пошук
можливостей для вдосконалення об'єктів бенчмаркінгу. Бенчмаркінг
вимагає доступу до певної інформації про конкурентів, без якої він не
може бути ефективним.

При використанні методів візуалізації статистичної інформації


необхідно уникати наступних помилок:
а) вертикальну вісь починається з нуля або навпаки;
б) часова вісь не відображає цілісність періоду;
в) неправильно вибраний тип графіка;
г) недоцільне використання 3D-ефектів;
д) погане або надмірне оформлення графіку;
е) занадто багато категорій розташовано на графіку;
ж) невірне розташування факторної та результативної ознак;
з) несинхронізовані вісі для показників з різними одиницями
вимірювання;
і) відсутність на графіку акценту;
й) мінливість параметрів на графіках;
к) спотворення інформації при використанні категорії «Інші»;
л) некоректне використання усереднених даних;
м) відсутність супроводження зображення текстовими
примітками.

You might also like