You are on page 1of 104

4

НАЦІОНАЛЬНИЙ ТЕХНІЧНИЙ УНІВЕРСИТЕТ УКРАЇНИ


«КИЇВСЬКИЙ ПОЛІТЕХНІЧНИЙ ІНСТИТУТ
імені ІГОРЯ СІКОРСЬКОГО»
Інститут прикладного системного аналізу
Кафедра математичних методів системного аналізу

«На правах рукопису» «До захисту допущено»


УДК 004.942:519.216.3
Завідувач кафедри
__________ Тимощук О.Л.
«___»_____________20__
р.

Магістерська дисертація
на здобуття ступеня магістра
зі спеціальності 122 Компьютерні науки та інформаційні технології
на тему: «Фрактальні моделі економічних процесів»

Виконав (-ла):
студент II курсу, групи КА-65м
Дудка Богдан Романович __________

Керівник:
професор, д.ф.т.н., проф.,
Бідюк П.І. __________

Рецензент:
Завідувач кафедри математичного
аналізу і теорії ймовірностей ,
д.ф.-м..н., проф.,
Кльосов О.І. __________

Засвідчую, що у цій магістерській


дисертації немає запозичень з праць інших
авторів без відповідних посилань.
Студент (-ка) _____________

Київ
5

2018
РЕФЕРАТ

Магістерська дисертація: 89 с., 21 рис., 22 табл., 19 джерел.


В роботі розглядаються питання дослідження нелінійних
нестаціонарних процесів в економіці та фінансах, які представлені
статистичними даними. Детально розглянута задача визначення нелінійності
та нестаціонарності досліджуваного процесу. Також розглянута задача
заповнення пропусків у статистичних даних. Представлена та застосована
методика побудови нелінійних нестаціонарних процесів.
Об’єкт дослідження: статистичні дані стосовно розвитку вибраних
фінансово-економічних процесів.
Предмет дослідження: методика побудови моделей нестаціонарних
процесів, методи дослідження пропусків даних, регресійні моделі,
статистичні характеристики адекватності моделей і оцінок прогнозів.
Методи дослідження: статистичний аналіз даних, методи заповнення
пропусків даних, регресійний аналіз, мережі Байєса, фільтр Калмана.
Мета дослідження: реалізація методики побудови моделей
нестаціонарних процесів.
Розроблена та застосована методика побудови моделей нестаціонарних
процесів. Проведений аналіз впливу пропусків даних та застосування методів
згладжування на статистичні характеристики моделей даних.
РЕГРЕСІЙНИЙ АНАЛІЗ, КОНГРУЕНТНІ МЕТОДИ, ПРОГНОЗУЮЧА
ФУНКЦІЯ, СТАТИСТИЧНИЙ АНАЛІЗ, НОРМАЛЬНИЙ РОЗПОДІЛ,
ЙМОВІРНІСНА МЕРЕЖА БАЙЄСА.
6

ABSTRACT

The theme: Probabilistic and Statistical Models of Nonstationary Processes


in Economy and Finances.
Master thesis: 89 p., 21 fig., 22 tabl., 1 appendixes, 19 ref.
In this work the problem of building non-linear nonstationary processes
models and. Introduced appropriate methodology for building models of non-linear
nonstationary processes. An important task of imputation of missing values in
statistical data was considered. Their influence was analyzed on statistical
characteristics of the data model.
Object of the research: statistical data about developing of chosen macro-
economic processes.
Subject of the research: nonlinear processes models building methodology,
detecting methods of missing values, statistical characteristics of model adequacy
and forecasting evaluations.
The methods of the research are as follows: modeling and forecasting
theory, regression analysis, statistical analysis, methods of imputation of missing
values.
Target of research: implementation of methodology for building models of
non-linear nonstationary processes, analysis of influence of missing values on
model adequacy of dynamical processes.
Developed methodology of the time series models building was used for
building of model of nonlinear processes. Analysis of missing values was
conducted to define their influence on statistical characteristics of model.
REGRESSION ANALYSIS, CONGRUENT METHODS, FORECASTING
FUNCTION, STATISTICAL ANALYSIS, NORMAL DISTRIBUTION,
BAYESIAN NETWORK.
7

ЗМІСТ

ПЕРЕЛІК УМОВНИХ ПОЗНАЧЕНЬ..........................................................8

ВСТУП...........................................................................................................9

РОЗДІЛ 1 ОСОБЛИВОСТІ РОЗВИТКУ СУЧАСНИХ ФІНАНСОВО-


ЕКОНОМІЧНИХ ПРОЦЕСІВ..............................................................................11

1.1 Нелінійні нестаціонарні процеси в економіці та фінансах...........11

1.2 Огляд моделей нелінійних нестаціонарних процесів....................13

1.2.1 Моделі процесів з лінійним трендом.......................................13

1.2.2 Моделі процесів з нелінійним трендом....................................14

1.2.4 Моделі процесів з логістичним трендом..................................15

1.2.5 Моделі процесів з стохастичним трендом...............................15

1.2.6 Інші нелінійні моделі.................................................................17

1.3 Попередня обробка даних................................................................19

1.4 Статистичний аналіз.........................................................................25

1.5 Методи оцінювання параметрів математичних моделей..............28

1.6 Діагностика моделей.........................................................................30

1.7 Тести на лінійність та стаціонарність.............................................31

1.8 Критерії оцінки якості прогнозу......................................................35

Висновки до розділу...............................................................................36

РОЗДІЛ 2 МАТЕМАТИЧНІ МОДЕЛІ НЕЛІНІЙНИХ


НЕСТАЦІОНАРНИХ ПРОЦЕСІВ В ЕКОНОМІЦІ ТА ФІНАНСАХ..............37

2.1 Логістична регресія...........................................................................37


8

2.2 Фільтр Калмана.............................................................................38

2.3 Баєсівські мережі...............................................................................42

2.3.1 Методи оцінювання якості побудови ймовірнісного висновку


.........................................................................................................................45

Висновки до розділу...............................................................................46

РОЗДІЛ 3 ПОБУДОВА МАТЕМАТИЧНИХ МОДЕЛЕЙ ТА


ОЦІНЮВАННЯ ПРОГНОЗІВ ВИБРАНИХ НЕЛІНІЙНИХ
НЕСТАЦІОНАРНИХ ПРОЦЕСІВ.......................................................................47

3.1 Існуючі комп’ютерні системи для обробки даних.........................47

3.2 Вибір інструментальної платформи для виконання


обчислювальних експериментів: EVIEWS, GENIE, MATLAB....................52

3.3 Виконання обчислювальних експериментів...................................54

3.4 Аналіз результатів.............................................................................71

РОЗДІЛ 4 РОЗРОБЛЕННЯ СТАРТАП-ПРОЕКТУ.................................74

4.1 Опис ідеї проекту..............................................................................74

4.2 Технологічний аудит ідеї проекту...................................................75

4.3 Аналіз ринкових можливостей запуску стартап-проекту.............76

4.4 Розроблення ринкової стратегії проекту.........................................82

4.5 Розроблення маркетингової програми стартап-проекту...............84

Висновки до розділу...............................................................................87

ПЕРЕЛІК ПОСИЛАНЬ...............................................................................89

ДОДАТОК А ІЛЮСТРАТИВНІ МАТЕРІАЛИ ДЛЯ ДОПОВІДІ..........91


9

ПЕРЕЛІК УМОВНИХ ПОЗНАЧЕНЬ

2
R – коефіцієнт множинної детермінації;
AIC – Akaike info criterion (інформаціонний критерій Акайке);
DW – Darbin-Wotson (статистика Дарбіна-Уотсона);
MAE (САП) – mean absolute error (середня абсолютна похибка);
MAPE (СААП) – mean absolute percent error (середня абсолютна
похибка у процентах);
RMSE(СеКП) – root mean squared error (стандартне відхилення
залишків, середньоквадратична похибка);
SSE – sum of squared errors (сума квадратів похибок);
U – коефіцієнт Тейла.
АКФ – автокореляційна функція;
АРКС – авторегресія з ковзним середнім;
КС – ковзне середнє;
МНК – метод найменших квадратів;
РМНК – рекурсивний метод найменших квадратів;
ЧАКФ – часткова автокореляційна функція;
10

ВСТУП

Прогнозування на основі моделей, побудованих за


експериментальними (статистичними) даними – один із найбільш
популярних підходів до прогнозування динаміки процесів у соціально-
економічних, фінансових, технічних та інших системах, коротко- та
середньострокового прогнозування об’ємів виробництва та накопичення
продукції на складах, оцінювання альтернативних економічних стратегій,
формування бюджетів підприємств та держави, прогнозування та
менеджменту ризиків довільної природи та розв’язання інших задач.
Статистичне моделювання та прогнозування грунтується на двох
основних типах експериментальних (статистичних) даних: часові ряди та
часові перерізи.
Часовий ряд – це множина рівновіддалених (рідко різновіддалених) в
часі спострежень (вимірів), які характеризують поведінку процесу чи об’єкта
на вибраному часовому інтервалі.
Часовий переріз – це множина спостережень змінних досліджуваної
системи (процесу) на вибраний конкретний момент часу.
Часові ряди та часові перерізи є основою прогнозування та аналізу
поведінки багатьох процесів. Кожний ряд можна описати своєю
математичною моделлю, яка може бути використана для прогнозу конкретної
змінної або побудувати одну багатовимірну модель, яка дозволить
прогнозувати всі змінні одночасно.
Перший розділ присвячено огляду нелінійних нестаціонарних процесів
в економіці та фінансах. Були розглянуті відповідні моделі для опису
нелінійних нестаціонарних процесів, які набули широкого використання.
11

Також були представлені відповідні статистичні тести, що дозволяють


визначити характер досліджуваного процесу.
У другому розділі представлений опис статистичного методу –
логістична регресія. Описані його властивості та методи оцінки параметрів
моделей, що будуються за даним методом. Детально описаний процес
фільтрації з використанням фільтра Калмана, його властивості та метод
побудови, використовуючи перехід до простору станів. Проаналізований
підхід до прогнозування з використанням мережі Байєса. Розглянуті типи
мереж Байєса та процес побудови ймовірнісного висновку для мережі Байєса.
Третій розділ присвячений опису процесу побудови математичних
моделей та оцінюванню прогнозів вибраних нелінійних нестаціонарних
процесів, який складається з вибору інструментальної платформи для
виконання відповідних обчислень, виконання обчислювальних
експериментів та аналізу відповідних результатів.
Четвертий розділ присвячений розробці стартап-проекту.
12

РОЗДІЛ 1
ОСОБЛИВОСТІ РОЗВИТКУ СУЧАСНИХ ФІНАНСОВО-
ЕКОНОМІЧНИХ ПРОЦЕСІВ
1.1 Нелінійні нестаціонарні процеси в економіці та фінансах

На сьогодні більшість процесів в економіці та фінансах є нелінійними


та нестаціонарними. Такі процеси характеризуються значною кількістю
складностей та особливостей, що необхідно враховувати, при моделюванні та
прогнозуванні відповідних процесів. Перш за все слід зазначити, що такі
процеси є нестаціонарними, тобто такими, які містять тренд або змінну
дисперсію. Під трендом будемо розуміти загальну тенденцію при
різнонаправленому русі, яка визначена загальною спрямованістю змін
показників часового ряду. Виділяють два типи тренду: детермінований та
стохастичний. Процеси з трендами та змінною дисперсією особливо
характерні для фінансово-економічних процесів. Наступною проблемою, при
побудові фінансово-економічних процесів є наявність в них нелінійностей.
Нелінійність означає можливість непередбачуваних змін у напрямі розвитку
процесів. Вона може проявлятись як підвищеною реакцію на зміну одних
факторів, так і повною нечутливістю до інших. На рисунку 1.1 та 1.2
зображені приклади нестаціонарних процесів.
13

Рисунок 1.1 - ВВП США


14

Рисунок 1.2 - ВВП України


На рисунку 1.3 зображена діаграма, яка наближено показує сучасну
класифікацію процесів в економіці та фінансах.

Сучасні процеси в економіці та фінансах

Рисунок 1.3 - Сучасні процеси в економіці та фінансах


Лінійні Нелінійні

Стаціонарні
1.2 Огляд моделей нелінійних нестаціонарних Нестаціонарні
процесів
1.2.1Нестаціонарні
Моделі процесів з лінійним трендом
Нелінійні
стосовно параметрів

Нелінійні
стосовно змінних
15

Математична модель процесу з лінійним трендом:

k−1
´ bk+ ε ( k),
y ( k )=a0 + ∑ a i y (k−i)+ (1.1)
i=1

де y ( k )=a0 +bk −¿ лінійний тренд.

Лінійний тренд є найпростішим видом тренду, який наразі


застосовується при моделюванні нестаціонарних процесів. Лінійний тренд
описує рівномірну зміну показника у часі. Коефіцієнт моделі a 0 1.1
характеризує первісний рівень ряду, щодо якого процес починає розвиватися,
відрізок, який відсікає пряма лінія на осі; а b характеризує середню швидкість
зміни рівня ряду і дорівнює тангенсу кута нахилу тренду до часової осі.
Модель лінійної функції у прогнозуванні використовують дуже часто.
Принаймні, виходячи з загальнонаукового принципу "від простого - до
складного", аналізуючи та вивчаючи властивості цієї моделі, розробляють
різні методи оцінювання її коефіцієнтів, а також їх перерахунку при появі
нової інформації або адаптації моделі; виконують прогнози і визначають
довірчі інтервали, а потім на основі отриманих знань і навичок переходять до
вивчення більш складних моделей.

1.2.2 Моделі процесів з нелінійним трендом

У якості нелінійного тренду розглянемо його частковий випадок –


параболічний тренд:

k−1
´ b1 t +b2 t 2 + ε (k ),
y ( k )=a0 + ∑ a i y (k−i)+ (1.2)
i=1
16

де y ( k )=a0 +b1 k +b 2 k 2 – параболічний тренд.


Параболічний тренд відрізняється від лінійного наявністю у своїй
моделі коефіцієнта b 2, який визначає прискорення відповідного процесу.
Використовуючи відповідну модель для моделювання відповідних
нестаціонарних процесі слід враховувати її особливість, а саме: така модель з
плином часу досягне до свого екстремуму і почне рух у протилежний бік.
Зазвичай в моделюванні не використовують тренди більш високих
порядків : кубічний і т.д. Це обумовлено тим, що параболи більш високих
ступенів хоч і можуть добре апроксимувати ряд, але тенденції прогнозують
погано.

1.2.4 Моделі процесів з логістичним трендом

Моделі процесів з логістичним трендом:

k−1
´ −i)+ 1
y ( k )=∑ ai y (k a 0 +a1 k
+ ε (k ), (1.3)
i=1 e +1

1
де y ( k )= a0+ a 1 k
−¿ логістичний тренд.
e +1
Логістична форма тренду підходить для опису такого процесу, при
якому досліджуваний показник проходить повний цикл розвитку,
починаючи, як правило, від нульового рівня, спочатку повільно, але з
прискоренням зростаючи, потім прискорення стає нульовим у середині
циклу, тобто зростання відбувається за лінійним трендом, потім, в
завершальній частині циклу, зростання сповільнюється по гіперболі в міру
наближення до граничного значення показника.
17

1.2.5 Моделі процесів з стохастичним трендом

Детермінований тренд називають також глобальним трендом процесу.


Однак, на сьогодні існує тенденція до вироблення більш загального підходу
до описання тренду, а саме, використання локальних моделей замість
глобальних. При цьому тренд розглядають як стохастичну функцію часу.
Одним із підходів до описання локального тренду є введення залежності
коефіцієнтів моделі від часу:

y ( k )=a ( k ) +d 1 (k )k , (1.4)

де a ( k )−локальна константа ; d 1 ( k )−¿ коефіцієнт, який визначає локальний


нахил тренду. Відповідні результати моделювання показують, що рівень
робастності таких функцій є більш високим ніж рівень робастності
детермінованиих функцій поліноміального типу. Існує альтернативний
підхід до описання локального тренду, який полягає у використанні
рекурсивних рівнянь типу y ( k )=a0 + y (k −1) або в ускладненому варіанті:

y ( k )=a ( k ) + y ( k−1 )+ ε ( k ) , (1.5)

де ε ( k )−¿випадкова змінна, яку для спрощення аналізу можна прийняти


за послідовність білого шуму з відомою дисперсією. Це рівняння
випадкового кроку із змінним в часі перетином a ( k ). Перетин може мати
наступний вигляд a ( k )=a ( k −1 ) +v ( k ) , де v ( k )−¿випадковий збурюючий процес.
Зазначимо, що рівень y ( k ) та швидкість зростання a ( k ) безпосередньо не
вимірюються.
Модель випадкового тренду є однією з найпростіших, яка дозволяє
описати випадковий тренд в деяких випадках. Вона має наступний вигляд:
18

y ( k )= y ( k −1 ) +ε ( k ) , (1.6)

де ε ( k )−¿ білий шум з нульовим математичним сподіванням.


Приростом значення основної змінної в даній моделі є випадкова
величина. Розв’язок данного рівняння має наступний вигляд:

k
y ( k )= y 0+ ∑ ε(i ). (1.7)
i=1

Розв’язок (1.6) є невласним оскільки він містить незважену суму


випадкових величин. Нижче наведені основні статистичні характеристики
отриманого розв’язку:
а) математичне сподівання: E [ y ( k ) ] = y 0 =const ;
б) Умовне математичне сподівання:

Ek [ y ( k +1 )| y ( k ) , y ( k −1 ) , … , ε ( k−1 , .. ) ]=E [ y ( k ) +ε ( k +1 ) ] = y (k ) ;

(1.8)

в) Функція прогнозування на довільне число кроків:

k +s
Ek [ y ( k + s ) ] = y ( k )+ E k [ ∑ ε ( i )= y ( k )] . (1.9)
i=k+1

1.2.6 Інші нелінійні моделі

1. Рівняння для умовної дисперсії квадратів залишків першого


порядку (АРУГ(1)):
19

h2(k) = β0 + β1 ε2(k – 1) + ε1(k), (1.10)

де h2(k) - умовна дисперсія процесу; ε2(k) -  квадрат залишків; ε1(k)


– похибка моделі в момент часу k.
2. Авторегресійна умовно гетероскедастична модель порядку p
(АРУГ(p)):

p
h (k) = β0 + ∑ β i ε2(k – i) + ε1(k).
2
(1.11)
i=1

3. Узагальнена авторегресійна умовно гетероскедастична модель


(УАРУГ(p,q):

p q
h2(k) = β0 + ∑ β iε2(k – i) + ∑ α i h2(k – i) + ε1(k). (1.12)
i=1 i=1

Це рівняння показує, що поточне значення умовної дисперсії є


функцією від константи, деяких значень квадратів залишків з рівняння
умовного середнього та деяких значень попередньої умовної дисперсії.
4. Експоненційна аторегресійна умовно гетероскедастична модель (Е -
УАРУГ(p,q)):
20

(1.13)

В моделях УАРУГ(p,q) умовна дисперсія залежить від розміру


залишків, а не від їх знаків. Наведена модель моделює умовну дисперсію, як
асиметричну функцію значень ε. Це дозволяє додатнім і від’ємним
попереднім значенням ε мати різний вплив на волатильність. Представлення
в логарифмічному вигляді дозволяє включити від’ємні значення залишків, не
отримуючи при цьому від’ємну умовну дисперсію.
5. Авторегресійна мовно-гетероскедастична модель модифікована
(УАРУГ - М) – моделювання премії за ризик:

p q
y(k) = β + γ h(k) + ε1(k), h2(k) = a0 + a1∑ ε 2 (k – i) + ∑ h2(k - i) + ε2(k),
i=1 i=1

(1.13)

в рівнянні умовна середня дисперсія перетворена в середньо


квадратичну так, що вона виражається в тих же одиницях вимірювання, що і
премія за ризик.

1.3 Попередня обробка даних

Процес попередньої обробки статистичних даних складається, з


наступних етапів:
а) нормування та візуальна перевірка даних та їх корегування;
б) корегування даних полягає у заповненні пропусків та зменшенні
викидів, що виходять за основний діапазон значень змінних;
в) бутстреп аналіз з метою збільшення об’ємів вибірок;
21

г) зміна некоректних вимірів інтерпольованими або усередненими


даними;
д) формування перших або різниць вищих порядків , які необхідні
для аналізу відповідних складових процесу, представленого часовим рядом;
е) ортогональні перетворення та цифрова фільтрація даних з метою
вилучення шумових складових.

Нормування даних
Розповсюдженим методом нормування даних є логарифмування з
наступним формуванням додаткових часових рядів з перших чи других
різниць.
Різниці n-го порядку представляють собою наближений дискретний
аналог n-ї похідної. Використання різниць дає можливість будувати моделі
для швидкості та прискорення основної змінної. Часто із значень ряду
віднімають його середнє значення для того щоб отримати можливість
працювати з відхиленнями. Такий підхід застосовують, наприклад, при
побудові моделей у просторі станів з їх подальшим використанням для
оптимальної фільтрації або оптимального керування процесом. Застосування
того чи іншого методу підготовки даних для моделювання визначається в
кожному випадку індивідуально.
Досить гарні результати нормування при оцінюванні множинної
регресії:

y ( k )= β0 + β 1 x 1 ( k ) + β 2 x 2 +...+ β p x p ( k ) +ε (k ), (1.14)

можна досягти завдяки одночасному нормуванню і центруванню даних


наступним чином:
22

x i ( k )− x́ i x i ( k )− x́ i
x iH ( k ) = =
√ Si N
1 /2 , k=1,…,N, i=1,…,p; (1.15)
( ∑ ( xi ( k ) − x́i )2)
k=1

y ( k )− ý y ( k )− ý
y H ( k )= = N
√S y 2 1 /2 , (1.16)
(∑ ( y ( k )− ý ) )
k=1

де x i (k ) – значення i-го стовпчика матриці вимірів (виміри незалежних


змінних);
y (k ) – виміри залежної змінної;
x iH ( k ) , y (k ) H – нормовані значення змінних;
x́ i , ý – вибіркові середні значення незалежних і залежної змінних,

відповідно; N – кількість вимірів; p – кількість незалежних


змінних(регресорів) x i. Якщо ввести позначення для центрованих змінних:

~
x i ( k )=x i ( k )− x́ i ; ~y ( k )= y ( k )− ý , (1.17)

то регресія для центрованих змінних матиме вигляд:

~y ( k )=β ~ ~ ~ (1.18)
1 x 1 ( k ) + β 2 x 2 ( k ) + ... β p x p ( k ) + ε ( k ) .

Якщо підставити (1.3.2) та (1.3.3) в (1.3.5), то рівняння множинної


регресії набуде вигляду:

1 1 1
y H ( k ) S 2y =β 1 S 12 x 1 H ( k ) + β 2 S22 x2 H ( k )+ …

+ β p S 1/p 2 x pH ( k )+ ε ' ( k ) . (1.19)

Тепер поділимо ліву і праву частини на S1y /2:


23

y H ( k )=α 1 x 1 H ( k ) +α 2 x 2 H ( k ) +...+α p x pH ( k ) +ε ' ' (k ), (1.20)

де α 1=β 1 (S 1 /S y )1 /2 , … , α p=β p (S p /S y )1 /2. Отримане рівняння (1.20) – це


рівняння для нормованих вимірів.
Завдяки центруванню та нормуванню покращується ступінь
обумовленості матриці вимірів, який вимірюється відношенням:

λmax
ŋ= | |
λmin
, (1.21)

де λ max , λmin – максимальне і мінімальне власні числа матриці вимірів.


Фільтрація
В аналоговій обробці сигналів під фільтрами розуміють присторої, які
використовуються для виділення бажаних компонентів спектру електричного
сигналу та подавлення небажаних.
В цифровій обробці сигналів під дискретними фільтрами розуміють
програмні чи апаратні засоби для будь-якого оброблення дискретних
сигналів, які мають такі властивості як лінійність та стаціонарність.
Класифікація фільтрів
За формою амплітудно-частотної характеристики розрізняють 4 типи
фільтрів :
а) фільтри низьких частот – це фільтри, які пропускають частоти,
менші за частоту зрізу фільтра f c(рисунок 1.4а);
б) фільтри високих частот – це фільтри, які пропускають частоти,
більші за частоту зрізу фільтра f c(рисунок 1.4б);
в) смугові (смугопропускаючі) фільтри – це фільтри, які пропускають
частоти, що належать діапазону частот від f c1 до f c2 (рисунок 1.4в);
г) режекторні (смугопридушуючі) фільтри – це фільтри, які
пропускають частоти, що не належать діапазону частот від f c1 до f c2 (рисунок
1.4г).
24

Рисунок 1.4 - Ідеальні амплітудно-частотні характеристики фільтрів


різних типів

Основні параметри фільтрів


Частоти зрізу, f c (англ., cutoff frequency) – частота вище чи нижче якої
потужність вихідного сигналу зменшується в два рази у порівнянні з
потужністю в смузі пропускання.
Передавальна функція – це відношення зображень по Лапласу вихідної
величини до вхідної:

L{U вих (t) } am pm +a m−1 pm −1 +...+a 1 p+a 0


K ( p )= =
L {U вх (t )} b n pn +b n−1 pn−1 +...+b1 p +b0
, (1.22)
25

де a i , bi – коефіцієнти диференціального рівняння, яке описує зв’язок


між вхідними та вихідними параметрами системи.

Цифрові фільтри
Основними перевагами цифрових фільтрів над аналоговими є наступні:
а) висока точність: в аналогових фільтрах точність обмежена
допусками на елементи;
б) стабільність, так як відсутній дрейф параметрів в залежності від
умов зовнішнього середовища;
в) гнучкість в налаштуванні та легкість зміни параметрів фільтрів;
г) компактність.

Серед недоліків цифрових фільтрів у порівнянні з аналоговими можна


визначити наступні:
а) обмеження робочого діапазону частот частотою Найквіста;
б) проблеми з роботою в режимі реального часу, так як всі
обрахунки повинні закінчитися за період дискретизації;
в) для високої точності фільтру потрібні АЦП та ЦАП високої
розрядності.
Процес дискретної фільтрації полягає у підсумовуванні деякої кількості
вхідних та попередніх вихідних сигналів:

y ( k )=b0 x ( k ) +b 1 x ( k−1 ) +.. .+b m x ( k−m) −a1 y ( k −1 )−a2 y ¿

−2 ¿−...−an y ( k−n ) , (1.23)

де b i – коефіцієнти вхідних сигналів, а a i – коефіцієнти вихідних


сигналів.
Методи фільтрації часових рядів застосовуються для вирішення
проблем, які з’являються при дослідженні взаємозв’язку між двома або
26

більшою кількістю часовими рядами, за допомогою видалення з них


трендової та сезонної компонент.
До проблем, які дозволяють вирішити методи фільтрації часових рядів,
відносяться :
а) проблема похибок показників сили взаємозв’язку :
1) якщо часові ряди , між якими вивчається взаємозв’язок, містять
циклічну або сезонну компоненту однакової періодичності , то в
результаті значення показників сили взаємозв’язку буде
завищеним;
2) якщо один з часових рядів містить циклічну або тредову
компоненту , або періодичність спільних флуктуацій різна, то в
результаті значення показників сили взаємозв’язку буде
заниженим;
б) проблема “хибної кореляції” :
1) якщо часові ряди, між якими вивчається взаємозв’язок, містять
тренди однакового напрямку , то рівні цих часових рядів будуть
мати додатну кореляцію;
2) якщо часові ряди, між якими вивчається взаємозв’язок, містять
тренди різних напрямків , то рівня цих часових рядів будить мати
від’ємну кореляцію.

1.4 Статистичний аналіз

Для того щоб визначити які регресори необхідно включити в праву


частину рівняння, обчислюють коефіцієнт кореляції між залежною та
відповідною незалежною змінною.
27

Коефіцієнт кореляції, а в загальному випадку кореляційна функція,


дозволяє встановити факт існування зв’язку між змінними. Кореляція може
бути лінійною або нелінійною в залежності від типу функціональної
залежності між змінними.
Кореляційна матриця дає можливість встановити існування зв’язку між
залежною (ендогенною) змінною та незалежними (екзогенними) змінними в
правій частині. Кореляційна матриця R розмірністю (m x n) має наступний
вигляд:

R=[ ], (1.24)

де r x x – коефіцієнт кореляції між незалежними змінними x i та x j.


i j

Коефіцієнт кореляції r x x обчислюється за наступною формулою:


i j

∑ ( xli−x́ l ) ( x ji−x́ j )
i =1
rx x = , l, j=1 ,… ,m , (1.25)
l j n n

√∑ (
i=1
x li − x́l )
2 2
∑ ( x ji− x́ j )
i=1

де x́ j – вибіркове середнє, яке обчислюється наступним чином:

N
1
x́ j= ∑x , (1.26)
N i=1 ji

де N – це число вимірів.
Використовуючи значення коефіцієнтів кореляції, можна прийняти
рішення про включення їх у рівняння регресії, яке представляється у
загальному вигляді як:

y ( k )=a0 +a1 x 1 ( k )+ a2 x 2 ( k ) +a3 x 3 ( k )+ ...+ am−1 xm −1 ( k ) + ε ( k ) . (1.27)


28

Вищевказане рівняння представляє собою лінійну регресію, яка містить


m параметрів (коефіцієнтів), але досить часто необхідно застосовувати
складніші нелінійні моделі. Характерним представником нелінійної стосовно
змінних регресії є поліноміальна регресія порядку m−1, яка має наступний
вигляд:

y ( k )=a0 +a1 x ( k )+ a2 x 2 ( k ) +...+a m−1 x m−1 ( k ) +ε ( k ) . (1.28)

Це рівняння містить лише одну незалежну змінну x (k ), але воно може


бути розширене будь-якими іншими змінними.Для визначення необхідності
введення в рівняння регресії авторегресійної складової необхідно обчислити і
дослідити вибіркову автокореляційну функцію змінної y ( k ) . Рівняння з
авторегресійною складовою має вигляд:

y ( k )=a0 +a1 y ( k−1 ) + a2 y ( k −2 )+ b1 x ( k ) +b 2 z ( k ) +ε ( k ) , (1.28)


де x (k ) та z(k) є незалежними змінними. Порядок авторегресії
визначається за допомогою автокореляційної (АКФ) і частковою (ЧАКФ)
функцій. Кількість значень автокореляційної функції, які відмінні від нуля, і
буде складати оцінку порядку авторегресії.
АКФ та ЧАКФ використовують для визначення попередньої оцінки
порядку авторегресійної частини моделі, тобто скільки затриманих в часі
значень необхідно брати для опису процесу. При цьому необхідно врахувати,
що АКФ дає менш статистично значущу оцінку порядку процесу ніж ЧАКФ,
оскільки враховує вплив проміжних змінних.
Вибіркова АКФ обчислюється наступним чином:

1
∑ [ y ( k )− ý ][ y ( k−s )− ý ] (1.29)
k=s +1
r y ( s )=r y(k) y (k− s)= 2
, s=1,2,3 , … ,
N−1 σ y
29

де σ 2y – вибіркова дисперсія змінної y ( k ) ;


ý−¿середнє значення вибірки даних.

Кількість значень АКФ, відмінних від нуля в статистичному сенсі,


вказує на порядок авторегресійної частини.
На відміну від АКФ, часткова АКФ (ЧАКФ) між значеннями y (k ) та
y ( k−s )виключає вплив величин y ( k−1 ) , … , y (k −s +1).

Коефіцієнти ЧАКФ можна обчислити за допомогою коефіцієнтів АКФ,


використовуючи наступні формули:

r 2−r 21
Ф11 =r ( 1 ) , Ф22= 2
, (1.30)
1−r 1
s−1
r s−∑ Ф s−1 , j r s− j
j=1
Ф ss = s−1
, (1.31)
1−∑ Фs−1 , j r j
j=1

Фk , j =Фk−1 , j−Фk Фk−1 , k− j . , (1.32)

де r s−¿ значення АКФ для s−¿ го лагу.

1.5 Методи оцінювання параметрів математичних моделей

Найбільш поширеними у використанні методами оцінювання


параметрів моделі є наступні:
а) метод максимальної правдоподібності (МПП);
б) метод найменших квадратів (МНК);
в) нелінійний метод найменших квадратів (НМНК) та їх рекурсивні
версії (РМНК, РММП, РМДП);
г) метод допоміжної (інструментальної) змінної (МДП).
Розглянемо для прикладу МНК та МПП.
30

Метод найменших квадратів


Оцінки МНК обчислюють за допомогою наступного виразу:

^ [ X T X ]−1 X T y ,
θ= (1.33)

де θ[ p] – вектор оцінок параметрів вимірності p;


X [N х p] – матриця вимірів;

y [ N ] – вектор вимірів залежної змінної. Елементи матриці вимірів

обчислюються по-своєму для кожної конкретної моделі. Так для моделі:

y ( k )=a0 +a1 x 1 ( k )+ a2 x 2 ( k ) +a3 x 3 ( k )+ ε (k), (1.34)

матриця вимірів має вигляд:

X =[ ]. (1.35)

Метод максимальної правдоподібності


Нехай є вибірка X 1 , … , X n з розподілу Pθ, де θ ∈Θ – невідомі параметри.
Нехай L ( x|θ ) :Θ → R – функція правдоподібності, де x ∈ Rn . Точкова
оцінка:

θ^ МП =θ^ МП ( X 1 ,. . ., X n )=argmax L( X 1 , .. . , X n|θ )


θ ∈Θ , (1.36)

називається оцінкою максимальної правдоподібності параметра θ.


Таким чином оцінка максимальної правдоподібності – це така оцінка, яка
максимізує функцію правдоподібності при фіксованій реалізації вибірки.
Часто замість функції правдоподібності L використовують
логарифмічну функцію правдоподібності l=ln L. Так як функція x → ln x , x >0
31

монотонно зростає на всій області визначення, максимум будь-якої функції


L(θ) є максимумом функції ln L(θ) , і навпаки.

Таким чином:

θ^ МП =argmax l ( X 1 , .. . , X n|θ )
θ ∈Θ .
(1.37)

1.6 Діагностика моделей

На цьому етапі проводиться аналіз якість моделі, а саме виконується


перевірка оцінених кандидатів на адекватність процесу. Діагностика
складається з наступних кроків:
а) візуальний аналіз графіка похибок моделі e ( k )= y ( k ) −^y ( k ) , де ^y ( k ) –
оцінка змінної, отримана за допомогою побудованої моделі. На графіку не
повинно бути значних викидів та довгих інтервалів, на яких похибка приймає
велике значення. У випадку застосування рекурсивних методів оцінювання
найбільші похибки буде містити перехідний процес, коли інформаційна
матриця ще не містить достатньої інформації про процес;
б) похибки моделі не повинні бути взаємозалежними. Для аналізу
наявності кореляції між значеннями похибок доцільно обчислити АКФ та
ЧАКФ для ряду { e (k ) }і за допомогою Q-статистики визначити ступінь
корельованості;
32

в) перевірка значущості оцінок параметрів моделі. Для цього може


бути використана статистика Стьюдента або t-статистика;
г) коефіцієнт множинної детермінації R2:

var ( ^y )
R 2= , (1.38)
var ( y )

де var ( ^y ) – дисперсія залежної змінної, оціненої за допомогою


побудованої моделі; var ( y ) – дисперсія вимірів залежної змінної;
д) сума квадратів похибок для вибраної моделі повинна бути
мінімальною, тобто

N N
∑ e (k )= ∑ [ ^y (k )− y (k )]2→ min
2

k =1 k =1 ^ θ ,
(1.39)

у порівнянні з усіма іншими моделями;


е) для оцінки адекватності моделі також використовують
інформаційний критерій Акайке:

N
AIC=N ln( ∑ e 2 (k ))+2 n .
k=1 (1.40)

1.7 Тести на лінійність та стаціонарність

Наразі існує досить багато методів та критерієв, які дають змогу


визначити лінійність та стаціонарність досліджуваного процесу. У цьому
розділі будуть розглянуть деякі з них.
33

Перевірка процесу на стаціонарність (наявність тренду) за допомогою


тесту Дікі – Фуллера
При визначенні наявності нестаціонарності, пропонується скористатися
тестом Дікі-Фуллера, який полягає у наступному: для визначення
присутності одиничного кореня запропоновано скористатись трьома
наступними рівняннями:

∆ y ( k ) =γy ( k −1 ) +ε ( k ) , (1.41)
∆ y ( k ) =a0 + γy ( k−1 ) + ε ( k ) , (1.42)
∆ y ( k ) =a0 + γy ( k−1 ) + a0 k +ε ( k ) , (1.43)

де k −¿ дискретний час. Наведені рівняння відрізняються наявністю


детермінованих членів a 0 та a 2 k у рівняннях (1.14) та (1.15) відповідно.
Рівняння (1.13) представляє собою модель випадкового кроку, друге включає
зсув у вигляді константи a 0, а третє включає зсув та детермінований лінійний
часовий тренд.
Особливу увагу слід звернути на параметр γ . Якщо γ =0, то
послідовність {{ y (k )}} містить одиничний корінь. Застосування тесту Дікі-
Фуллера передбачає оцінювання одного або більше з наведених вище трьох
рівнянь за допомогою МНК або ММП з метою отримання оцінки параметра γ
та стандартної похибки цієї оцінки.
Наразі існує досить багато методів та критерієв, які дають змогу
визначити наявність гетероскедастичності у досліджуваному процесі. У
цьому розділі будуть розглянуть деякі з них.
Тест Уайта
Відповідний тест базується на побудові допоміжної моделі регресії для
квадратів залишків, які генеруються в результаті застосування звичайного
методу найменших квадратів до часових рядів. Рівняння регресії квадратів
залишків містить в собі константу, а також всі ненадлишкові регресори на
34

множині всіх регресорів, яка включає самі регресори, їхні квадрати та


взаємні добутки.
Якщо висунути гіпотезу про існування гетероскедастичності, то
добуток N R2 буде асимптотично наближуватися до розподілення хі-квадрат
χ 2 (5), де 5 означає число регресорів без константи; R2−¿ коефіцієнт

множинної детермінації. В загальному випадку можна записати, що


N R2 ↔ χ 2 (q), тобто добуток N R2 приблизно має хі-квадрат розподіл при

використанні в регресії q регресорів. Цей тест дає можливість виявити


присутність гетероскедастичності, але не вказує на її форму і, як наслідок, на
тип алгоритму оцінювання параметрів, який необхідно використовувати.
Використання тесту Уайта передбачає використання ЗМНК для оцінювання
параметрів початкової моделі.
Графічний аналіз
Досить наочним та простим методом тестування припущення про
наявність гетероскедастичності є графічний метод. Не завжди дослідник
володіє необхідним для аналізу проблеми емпіричним матеріалом. Крім
того, його висновки щодо наявності або відсутності гетероскедастичності
носять суб'єктивний характер, і в цих умовах на допомогу приходять
графіки.
Тест рангової кореляції Спірмана
Це найпростіший тест, який можна використовувати як до малих, так і
до великих вибірок. Спочатку запишемо коефіцієнт рангової кореляції
Спірмана:

r s=1−6 [ ]
∑ di
i=1
2
n ( n −1 )
,
(1.44)

де d — різниця між рангами, що приписуються двом


характеристикам і-го об'єкта;
35

n — кількість об'єктів, що ранжуються.


Наведений коефіцієнт рангової кореляції може використовуватись для
визначення гетероскедастичності таким чином. Припустимо, y i=β 0 + β 1 x i +ε i .
Етап 1. Побудувати регресію для даних у та х і розрахувати відхилення
ε i .

Етап 2. Нехтуючи знаком ε i , тобто беручи абсолютні значення |ε i| ,


ранжуємо|ε i| та x i  у зростаючому чи спадному порядку і підрахуємо
коефіцієнт рангової кореляції Спірмана.
Етап 3. Перевіряємо значимість отриманого коефіцієнта рангової
кореляції за f-критерієм Ст'юдента.
Для цього побудуємо t-статистику: де n — кількість спостережень та df
= (n - 2) — кількість ступенів вільності. При даних ступенях вільності за
таблицями Ст'юдента знаходимо t . Якщо розраховане значення перевищує
tкр (t > tкр ), це підтверджує гіпотезу про гетероскедастичкість. Якщо t ≤ tкр ,
тоді в регресійній моделі правильним є припущення про гомоскедастичність.
Тест Голдфельфа-Квандта
Цей тест застосовують в тих випадках, коли є одна змінна, що
приводить до гетероскедастичності. Нехай, наприклад, σ^ 2ε позитивно
корельована з i-м регресором x i. Тоді процедура тестування складається з
наступних кроків:
а) упорядкувати (за зростанням чи зменшенням) масив значень регресора
x i;

б) виключити із аналізу c середніх значень змінної;


в) побудувати окремо регресії для перших та останніх ( N −c)/2 значень
при умові, що їх кількості достатньо для оцінювання заданого числа
параметрів моделі;
г) обчислити значення похибок RSS1 і RSS2, де перший індекс відноситься
до регресії, яка оцінювалась за меншими значеннями x i , а другий
відноситься до регресії, яка оцінювалась за більшими значеннями x i.
36

2 RSS
Тоді відношення R= RSS буде мати (за у мови правдивості припущення
1

щодо існування гетероскедастичності) F-розподіл із


[(N −c−2 r) /( N−c−2 r)/2].

При висуванні альтернативної гіпотези F матиме велике значення.


Якщо R< F 0,95, то гіпотеза про існування гетероскедастичності.

1.8 Критерії оцінки якості прогнозу

1. Середньоквадратична похибка (СКП):

S
СКП =
√ 1

S i=1
2
( y ( k +s )− y ( k + s , k )) . (1.45)

2. Середня похибка прогнозу (СП):

S
1
СП = ∑ y ( k + s )− y ( k +s , k ).
S i=1
(1.46)

3. Середня похибка в процентах:

S
1 y ( k + s )− y (k + s , k )
СПП = ∑ × 100 %. (1.47)
S i=1 y ( k+ s)

4. Абсолютна середню похибка в процентах:


37
S
1 | y ( k + s )− y ( k + s , k )|
АСПП = ∑ ×100 %. (1.48)
S i=1 | y (k + s)|

5. Максимальна абсолютна похибка (МАП):

МАП =max {| y ( k +1 )− y ( k +1 , k )|,| y ( k + s ) − y ( k+ s , k )|}. (1.49)

6. Мінімальна абсолютна похибка (МіАП):

МіАП=min {| y ( k +1 )− y ( k +1 , k )|,| y ( k + s )− y ( k + s , k )|}. (1.50)

Висновки до розділу

Розглянуті типи нелінійних нестаціонарних процесів в економіці та


фінансах. Наведені математичні моделі для опису нелінійних нестаціонарних
процесів та їх характеристики. Розглянуті відповідні моделі для опису
нелінійних нестаціонарних процесів, які набули широкого використання.
Представлені відповідні статистичні тести, що дозволяють визначити
характер досліджуваного процесу. Представлені та проаналізовані методи
попереднього аналізу даних та оцінки параметрів математичних моделей.
Наведені основні критерії вибору найкращої моделі за якістю прогнозу.

Постановка задачі
1. Сформулювати методику побудови моделей часових рядів.
2. Виконати загальний огляд деяких методів заповнення пропусків у
статистичних даних та проаналізувати вплив кожної з них на
статистичні характеристики моделей відповідних процесів.
38

3. Вибрати програмний продукт для проведення статистичного та


візуального аналізу даних, побудови відповідних моделей та вибору
найкращих з них за допомогою аналізу основних статистичних
характеристик.
4. Виконати порівняльний аналіз отриманих результатів моделювання і
прогнозування.
5. Виробити рекомендації щодо застосування розглянутих методів
заповнення пропусків у статистичних даних.

РОЗДІЛ 2 МАТЕМАТИЧНІ МОДЕЛІ НЕЛІНІЙНИХ


НЕСТАЦІОНАРНИХ ПРОЦЕСІВ В ЕКОНОМІЦІ ТА ФІНАНСАХ
2.1 Логістична регресія

Логістична регресія – це регресійний метод, який застосовується у


статистиці для побудови математичних моделей у випадку, коли залежна
змінна є категорійною, тобто може набувати скінченну кількість значень.
Розглянемо визначення логістичної регресії для випадку, коли
випадкова величина набуває двох значень.
Розглянемо деяку випадкову величину Y , що може набувати лише двох
значень, які, як правило, позначаються цифрами 0 і 1. Нехай ця величина
залежить від деякої множини пояснювальних змінних x=(1, x 1 ,… , x n)T .
Залежність випадковоъ величини Y , від x 1 , … , x n можна визначити за
допомогою додаткової змінної y ¿, де y ¿ =θT x=θ 0+θ 1 x 1+ ..+ θn x n + ε. Тоді:
39
¿
Y = 0 , y¿ ≤ 0.
{
1 , y >0
(2.1)

При визначенні логістичної моделі стохастичний доданок ε вважається


випадковою величиною з логістичним розподілом ймовірностей. Відповідно
¿ ¿ ¿
для певних конкретних значень змінних x = x1 , … , x n одержується відповідне
значення y ¿ та ймовірність того, що Y =1 наступна:

p ( Y =1 )= p ( y ¿ > 0 )= p ( θT x ¿ + ε >0 )= p ( ε >−θ T x ¿ )=¿

¿ p ( ε ≤θ T x ¿ )= Λ (θT x ¿ ). (2.2)
Передостання рівність випливає з симетричності логістичного
розподілу, Λ позначає логістичну функцію — функцію розподілу
логістичного розподілу:

ex ex
Λ ( x )= = . (2.3)
1+ e x 1+e− x

Таким чином для конкретного значення x ¿ випадкова величина Y i, має


розподіл Бернуллі: Y i B(1 , Λ(θ T xi )).
Логіт-модель задовольняє наступній умові:

p( 1∨X ) p( 1∨X )
ln =ln =b + b x +…+b j x j. (2.4)
1− p(1∨ X ) p(0∨X ) 0 1 1

б.2 Фільтр Калмана

Розглянемо систему нелінійну нестаціонарну систему у наступному


вигляді:
40

ẋ=A ( x , u ) + B1 w

{ z=K ( x , u) ,
y=C ( x ) +v
(2.5)

яка визначена на часовому проміжку [0,s]. x ( t )−¿ функція, що визначає


стан системи у деякий дискретний момент часу t; y ( t ) −¿ вимірюване вихідне
значення системи у деякий дискретний момент часу t. z ( t )−¿ невизначене
вихідне значення системи у деякий дискретний момент часу t. w ( t ) та v ( t )−¿
невизначені вхідне значення системи у деякий дискретний момент часу t.
Будемо вважати, що усі функції, що наведені у системі 2.2.1, обмежені та
мають першу похідну.
Невизначеність у цій системі визначена наступною нерівністю:

s s
Ф ( x ( 0 ) ) +∫ L1 ( w ( t ) , v ( t ) ) dt ≤d +∫ L2 ( z ( t ) ) dt , (2.6)
0 0

d ≥ 0 дійсне число. Ф , L1 та L2−¿ обмежені, додатньо визначені функції

класу C 1, які задовольняють умовам наступної нерівності:

|ϕ ( x )−ϕ(x ' )|≤ β (1+|x|+| x'|)|x−x '|. (2.7)

Розглянемо наступний фільтр стану системи (2.1):

∂ ∇ x V ( A ( x ,u 0 ) +B 1 w)

{ ∂t
V +max w∈ R m

{
−L1 ( w , y 0−C ( x ) ) + L2 ( K ( x ,u 0)) ,
V (.,0 )=Ф
} (2.8)

множина станів фільтру (2.3) може бути описана функцією V (. , s ).


Запишемо рівняння для похідної цієї функції:
41

V̇ =F ( V ,u 0 , y 0 ) , (2.9)

де F ( V . u0 , y 0) має наступний вигляд:

∇ x V ( A ( x , u0 ) + B1 w)
F ( V , u0 , y 0 )=−max
u∈ Rm {
−L1 ( w , y 0−C ( x ) ) + L2 ( K ( x , u0 )) } (2.10)

Нехай (2.1) та (2.2) задовольняють наступним умовам :

u0 ( t ) , y 0 ( t ) , 0 ≤t ≤ s , V̇ =F ( V , u0 , y 0 ) , (2.11)

тоді, множина станів системи (2.1) має наступний вигляд:

χ s={ x ∈ Rn :V ( x , s ) ≤ d } , (2.12)

де V ( x , t ) розв’язок (2.2.3) на множині C ( R n × [ 0 , s ] ) .


V ( x , t ) може бути оцінений наступним чином:

~ '
x ( t ) ) X ( t ) ( x −~x ( t ) )+ ϕ(t ).
V ( x , t ) =0.5∗ ( x−~ (2.13)

Тоді
n '
~
χ s= { x ∈ R : 0.5∗( x−~
x ( s ) ) X ( s ) ( x−~
x ( s ) ) ≤ d−ϕ(s) } . (2.14)

Представлення моделей у просторі станів


Розглянемо процес аторегресії P-го порядку, який буде застосований у
подальшому моделюванні досліджуваного економічного процесу:

y ( k +1 )=a0 +a1 y ( k ) +a2 y ( k−1 ) +..+a p y ( k −p+ 1 )+ ε (k +1), (2.15)


42

де { ε ( k ) }−¿ нормально розподілений процес незалежних величин, тобто


E [ ε ( k ) ]=0, а

2
E [ ε ( k ) ε ( l ) ]= σ ε , k =l .
{ 0,k≠l
(2.16)

Вищевказаний процес (2.1) можна представити у наступному вигляді:

y ( k +1 )−μ=a1 [ y ( k )−μ ] + a2 [ y ( k −1 )−μ ] +…

+a p [ y ( k −p +1 )−μ ] + ε (k +1), (2.17)

де μ−відоме середнє значення процесу .


Даний процес можна записати у формі простору станів наступним
чином:

y ( k +1 )−μ y ( k ) −μ ε ( k +1 )

[ ] [ ][ ] [ ]
y ( k )−μ


y ( k− p+2 )−μ
a1 ⋯ a p
y ( k −1 )−μ = ⋮ ⋱ ⋮
0 ⋯ 0
y ( k −1 )−μ
y ( k −2 )−μ + 0

y ( k− p+1 )−μ

0

0
(2.18)

Тобто, вектор стану має наступний вигляд:

x ( k )=[ y ( k )−μ , y (k −1)−μ , y (k−2)−μ , … , y (k −p+ 1)−μ ]T (2.19)

Рівняння вимірів має наступний вигляд:

y ( k )−μ

[…
]
z ( k )= y ( k ) =μ +[1 0 … 0] y ( k −1 )−μ .

y ( k− p+1 ) −μ
(2.20)
43

В рівнянні вимірів шуми відсутні, тобто R=0, а коваріаційна матриця


збурень стану має вигляд:

σ 2ε ⋯ 0

[ ]
Q= ⋮ ⋱ ⋮ .
0 ⋯ 0
(2.21)

2.3 Баєсівські мережі

Байєсівські мережі – перспективний ймовірнісний інструментарій для


моделювання складних ієрархічних процесів (статичних і динамічних) з
невизначеностями довільного характеру. Мережа будується у вигляді
спрямованого ациклічного графа, який відображає причинні зв’язки між
вузлами (змінними) процесу, що досліджується. Редукція спільного
розподілу ймовірностей у вигляді добутку умовних ймовірностей, які
залежать від малої кількості змінних, дозволяє уникнути “комбінаторних
вибухів” при моделюванні. Мережа базується на відомій формулі Байєса.
Позначимо через Ω вибірковий простір подій. Цей вибірковий простір
містить всі можливі значення випадкової змінної. В граф-теоретичному
контексті “змінна” означає атрибут. Якщо змінна приймає конкретне
значення, то говорять, що має місце конкретна подія. У теорії оцінювання
сигналів, аналізі часових рядів та багатьох інших випадках події називають
спостереженнями.
Нехай є дві події E ∈ Ωта H ∈Ω , що відповідно є спостереженням та
гіпотезою. Формула Байєса використовується для обчислення ймовірності
того, що подія E відбудеться за умови, що відбулась подія H . Тобто для
обчислення P(E | H) - умовної ймовірності E при заданій події H.
44

Умовна ймовірність E ∈ Ω дорівнює відношенню сукупної ймовірності подій


E та H P( E ∩ H ) до ймовірності події H , за умови, що вона не дорівнює нулю:

P( E ∩ H )
P ( E|H )=
P( H )
. (2.22)

Аналогічно для події H:

P( H ∩ E)
P ( H| E )=
P(E)
. (2.23)

Враховуючи усі вищевказані факти та формули, можна записати


правило Байєса наступним чином:

P( E∨H) P( H )
P ( H| E )=
P( E)
. (2.24)

Баєсівська мережа представляє собою пару <G,B>, у якій перша


компонента G – це спрямований нециклічний граф, що відповідає змінним
процесу, що досліджується і записується у вигляді причинно-наслідкової
мережі. Друга компонента пари B – це множина параметрів, що визначають
мережу.
i i
Компонента B містить параметри Θ X ∨ pa( X )=P(X ∨pa ( X )) для кожного
i i

можливого значення x i ∈ X i та pa ( X i ) ∈ Pa ( X i ) , де Pa ( X i ) позначає набір батьків


змінної X i ∈G . Кожна змінна X i ∈G представляється у вигляді вершини. Якщо
розглядають більше одного графа, то для значення батьків змінної X i в графі
G використовуються позначення P aG ( X i).
Повна спільна ймовірність мережі Байєса обчислюється за формулою:

N
PB ( X 1 , … , X N ) =∏ P B (X i ∨Pa( X i)) . (2.25)
i=1
45

Типи байєсівських мереж:


а) дискретні мережі Байєса;
б) динамічні мережі Байєса;
в) неперервні мережі Байєса;
г) неперервні мережі Байєса;
д) гібридні мережі Байєса.

Ймовірнісний висновок у мережі Байєса


Процес обчислення оцінки стану вершини на основі апріорної
ймовірності про стани інших вершин мережі Байєса називають формуванням
ймовірнісного висновку. Саме механізм побудови ймовірнісного висновку
перетворює будь-яку мережу Байєса, яка описує відповідний процес, на
повноцінну складову експертної системи.
Задача побудови ймовірнісного висновку є досить складною з
обчислювальної точки зору та неоднозначною. Обсяг обчислень насамперед
залежить від кількості вершин та дуг мережі, що з’єднують ці вершини між
собою. Неоднозначність задачі полягає в тому, що за різними методами
формування ймовірнісного висновку можуть бути одержані різні результати.
Така ситуація характерна зокрема для великих мереж Байєса, коли необхідно
застосовувати апроксимаційні алгоритми, жертвуючи при цьому точністю
обчислень.
Методи обчислення ймовірнісного висновку в мережах Байєса можна
розділити на дві категорії: алгоритми точного висновку та апроксимаційні
алгоритми.
До алгоритмів точного висновку можна віднести наступні:
а) алгоритми Перла розповсюдження повідомлення для однозв’язних
мереж;
б) кластеризації дерева клік;
в) визначаючого перетину;
г) виключення змінних;
46

д) символьного ймовірнісного висновку;


е) диференціальний підхід.

До апроксимаційних алгоритмів можна віднести наступні:


а) часткового або неповного висновку;
б) варіаційні методи;
в) метод стохастичного вибору;
г) пошукові методи (search-based), які базуються на евристичних
алгоритмах пошуку, які використовують при переході від задачі
обчислення ймовірнісного висновку до оптимізаційної задачі.

2.3.1 Методи оцінювання якості побудови ймовірнісного висновку

Для оцінювання якості роботи методу побудови ймовірнісного


висновку можна скористатися такими величинами: середньоквадратична
похибка, KL-відстань або квадратична відстань Хеллінджера .
Середньоквадратична похибка MSE:

1 ^ ( xi ∨e)2))
MSE= (i) ∑
( ∑ ( P ( x (i)|e )− P
∑ card( A ) X є X ¿ ∀ x є X
i i i . (2.26)
i
X єX¿

KL-відстань D K між значенням ймовірності P ( x (i)|e ) та оцінкою ^P( x i∨e ):

P ( x (i )|e )
D K ( P ( x( i)|e ) , P
^ ( x i|e ) ) = ∑ (P ( x (i )|e )∗log ⁡( )¿).¿ (2.27)
∀xєX
i i ^ (xi ∨e)
P

KL-відстань D K всієї мережі Байєса:


47

1 ^ ( x i|e ) ). (2.28)
Dk ( P , P
^ )= ∑ D K ( P ( x (i)|e ) , P
card( X ¿) X є X ¿
i

Квадратична відстань Хеллінджера D H всієї мережі Байєса:

1 ^ ( x i|e ) ).
DH ( P , ^
P )= ∑ DH ( P ( x (i)|e ) , P (2.29)
card (X ¿) X є X ¿
i

Висновки до розділу

Представлений опис статистичного методу на основі логістичної регресії.


Описані його властивості та методи оцінки параметрів моделей, що будуються за
даним методом.
Детально описаний процес фільтрації з використанням оптимального фільтра
Калмана, його властивості та метод побудови, використовуючи перехід до
простору станів.
Проаналізовано підхід до прогнозування з використанням мережі Байєса.
Розглянуті типи мереж Байєса та процес побудови ймовірнісного висновку на
основі мережі Байєса.
48

РОЗДІЛ 3
ПОБУДОВА МАТЕМАТИЧНИХ МОДЕЛЕЙ ТА ОЦІНЮВАННЯ
ПРОГНОЗІВ ВИБРАНИХ НЕЛІНІЙНИХ НЕСТАЦІОНАРНИХ
ПРОЦЕСІВ
3.1 Існуючі комп’ютерні системи для обробки даних

На сьогодні існує близько 1000 поширених на світовому ринку пакетів,


що вирішують задачі статистичного аналізу даних у середовищі DOS, OS/2
чи Wіndows. Статистичні прикладні програми поділяються на універсальні,
напівспеціалізовані, спеціалізовані пакети й статистичні експертні системи.
Із західних універсальних пакетів найбільш відомі й добре відпрацьовані
комп’ютерні системи SAS, SPSS, STATISTIKA, STATGRAPHICS (STSC) та
ін. Напівспеціалізованими вважають російські пакети STADІ, ОЛІМП,
білоруський пакет РОСТАН та американські пакети ODA, WіnSTAT, Statіt,
UNІSTAT, Multіvarіance 7, JMP, SOLO, STATlab. До спеціалізованих пакетів
з класифікації та зниження розмірності належать російські пакети КЛАС-
МАЙСТЕР, КВАЗАР, PALMODA, Stat-Medіa, STARC. Досить відомими є
спеціалізовані пакети, що вирішують суміжні з класифікацією задачі. Це
американські системи BMDP/W, SіgmaStat, Statіstіx, TURBO Sprіng-Stat-Wіn,
MVSP. Крім того, на ринку програмного забезпечення представлені
статистичні експертні системи, зокрема, СТАТЭКС, Statіstіcal Navіgator Pro.
Розглянемо деякі з цих пакетів.
Система SAS існує і розвивається з 1976 р. Сьогодні — це могутній
комплекс з більш як двадцятьма різними програмними продуктами,
об’єднаними один з одним «засобами доставки інформації» (Іnformatіon
Delіvery System, ІDS, іноді весь пакет позначається як SAS/ІDS). SAS
відрізняє неперевершена потужність щодо набору статистичних алгоритмів.
49

Система надає користувачеві можливість приєднання його оригінальних


алгоритмів. Основними користувачами системи є підприємства ВПК, великі
банки, біржі, торгові фірми, деякі атомні станції, найбільші медичні та
геофізичні центри, великі державні структури.
Під поняттям «ІDS» розробник системи розуміє, що її користувачеві
для 100-відсоткової інформатизації діяльності будь-якої фірми достатньо
поставити на свій комп’ютер ОС і систему SAS — усі інші функції (типу
задач, розв’язуваних на основі Excel, Word, кожної із СУБД тощо) повністю
візьме на себе SAS/ІDS.
SAS має вбудовані мову програмування 4GL і мову роботи з базами
даних SQL; містить ділову, наукову, рекламну графіку, різні шрифти і карти,
багатофункціональний набір статистичних процедур аналізу даних;
забезпечує користувачеві експертну підтримку. Зокрема, система підказує
користувачеві, виконуються чи ні припущення, що лежать в основі певного
методу аналізу даних.
Система SAS дає змогу будувати окремі інтерфейси для зв’язку
SAS/ІDS з найрізноманітнішими CУБД (ADABAS, DB2, ORACLE, SQL/DS
тощо).
Основні вади системи: громіздкість, складність освоєння, високі
вимоги до статистичної кваліфікації користувача, тверді вимоги до апаратної
частини.
Пакет SPSS відомий у науковому і діловому світі з часу реалізації на
великих машинах. В останні роки переорієнтований на платформу Wіndows.
Пакет SPSS вимогливий до технічного забезпечення: процесор має бути
486DX-2 і вище, для його використання рекомендується 16 Мб оперативної
пам’яті, 65—80 Мб дискової пам’яті. Пакет має дуже великий набір
статистичних (їх понад 60) і графічних процедур, а також процедур
створення звітів. Має зручний інтерфейс SPSS. Відрізняється високою
точністю обчислень.
50

Статистичний аналіз з допомогою пакета SPSS доступний як


досвідченим, так і рядовим користувачам. Крім меню і діалогових вікон, у
ньому є мова команд, яку можливо використовувати для створення і запуску
робочих завдань. Знаходячись у діалоговому вікні, можна вставляти команди
у вікно синтаксису, де їх можна зберігати і редагувати. Система підказки
містить короткі статистичні діаграми в доповнення до повної системи
допомоги за графічним користувацьким інтерфейсом.
SPSS має додаткові програмні засоби, які працюють на декількох
платформах і дають змогу розширювати можливості базового модуля. Поряд
з розширенням статистичних процедур базового модуля змінено зміст
модулів Professional Statistics, Advanced Statistics.
Модуль SPSS Professional Statistics містить методи регресійного
аналізу, зокрема зважений, двоетапний метод найменших квадратів, логічну
регресію і нелінійну регресію, а також багатомірне шкалування та аналіз
надійності.
Модуль SPSS Advanced Statistics дає змогу провести аналіз з
допомогою складних статистичних методів, таких як загальне лінійне
моделювання, аналіз компонент дисперсії, логлінійний, а також аналіз
виживання.
Модуль SPSS Таbles є інструментом для створення різноманітних
високоякісних таблиць, включаючи таблиці, вкладені одна в одну й таблиці
для подання багатоваріантних відповідей.
Модуль SPSS Trends виконує будь-які види прогнозування та аналізу
часових рядів з допомогою моделей добору кривих, моделей згладжування і
методів оцінювання авторегресійних функцій.
Модуль SPSS Categories здійснює сумісний аналіз і процедури
оптимального шкалування, в тому числі й аналіз відповідностей.
Модуль SPSS CHAID спрощує і прискорює аналіз дискретних даних,
розробляє прогностичні моделі, відфільтровує зайві фактори і будує
51

нескладні дереподібні діаграми, котрі поділяють вибірку на підгрупи, що


мають схожі характеристики.
Neural Connektion з допомогою потужної нейронної мережі та через
свою надзвичайну гнучкість вносить творчий елемент у функції
прогнозування, класифікації, аналізу часових рядів, а також сегментації
даних.
Mapln fo створює тематичні карти для візуалізації даних і
картографічні файли.
Allclear є повною графічною програмою, яка дає змогу створювати
причинно-наслідкові діаграми, динамічні блок-схеми, мережі, дерева
прийняття рішень, організаційні схеми. Базовий модуль SPSS розроблений
для систем, які працюють на платформах Windows 95 або Windows NT.
Для оброблення статистичної інформації широко використовується
інтегрована система статистичного аналізу й оброблення даних
STATISTIKA. Основними компонентами системи STATISTIKA є: електронні
таблиці для введення вхідних даних, а також спеціальні таблиці виведення
числових результатів аналізу; потужна графічна система для візуалізації
даних і результатів статистичного аналізу; набір спеціалізованих
статистичних модулів, у яких зібрано групи логічно зв’язаних між собою
статистичних процедур; спеціальний інструментарій для підготовки звітів;
убудовані мови програмування SCL (STATISTICA Command Language) і
STATISTICA BASIC, які дають змогу користувачеві розширити стандартні
можливості системи. STATISTICA працює з чотирма різними типами
документів, які відповідають основним структурним компонентам системи :
електронна таблиця, яка призначена для введення вхідних даних і їх
перетворення;
електронна таблиця для виведення числових і текстових результатів аналізу;
графік-документ у спеціальному графічному форматі для візуалізації та
графічного подання числової інформації; звіт-документ у розширеному
текстовому форматі для виведення текстової та графічної інформації.
52

Відповідно до стандартів середовища Windows кожний тип документа


виводиться у своєму власному вікні в робочій області системи STATISTICA.
Пакет STATGRAPHICS реалізує такі статистичні функції: параметричні та
інші непараметричні тести; категоріальний, дисперсійний, однофакторний,
двофакторний, багатофакторний аналіз, коваріаційний аналіз; контроль
якості; регресійний аналіз; аналіз часових рядів, багатомірні методи. Пакет
має широкі графічні можливості. Доступ до графічних процедур
здійснюється в процесі статистичного оброблення даних. Пакет призначений
в основному для тих користувачів, що вже мають певний досвід у статистиці.
Пакет надає широкі можливості взаємодії з електронними таблицями та
СКБД (типу dBASE та її «нащадків»). Обмін з електронними таблицями у
Wіndows-версії виконується через стандартний буфер обміну (Wіndows
clіpboard).
Пакет прикладних програм (далі ППП або система) Eviews
(Econometric Views) призначений для обробки економетричних та інших
даних, представлених у вигляді часових рядів або часових перерізів з метою
попередньої обробки експериментальних даних (нормування,
логарифмування), обчислення параметрів описової статистики, побудови
математичних моделей часових та інших рядів і прогнозування економічних
показників, які описуються часовими рядами. Система розроблена в
Каліфорнійському Університеті Ірвайн (University of California, Irvine) під
керівництвом професора Дж. Джонстона, автора декількох книг з
економетричного аналізу.
За допомогою пакету можна реалізувати такі основні функції:
а) введення в комп’ютер, розширення та корегування значень
часових рядів або інших типів даних, наприклад, групових даних;
б) генерування нового часового ряду за допомогою математичних
виразів будь-якої складності;
в) друкування графіків та діаграм різних видів;
53

г) обчислення коефіцієнтів регресії за допомогою методу


найменших квадратів (МНК), методу максимальної правдоподібності
(ММП), двокрокового МНК та нелінійного МНК;
д) лінійне та нелінійне оцінювання систем рівнянь;
е) одночасне оцінювання параметрів та прогнозування кількох
часових рядів (векторна авторегресія);
ж) оцінювання та прогнозування гетероскедастичних процесів;
з) обчислення описової статистики часових рядів: коефіцієнти
кореляції, коваріації, автокореляції, взаємної кореляції та гістограми;
и) обчислення коефіцієнтів рівнянь авторегресії та ковзного
середнього (АРКС);
к) визначення лагів (величина запізнення);
л) прогнозування на основі регресії;
м) управління базою даних часових рядів;
н) запис та читання файлів даних в стандартному форматах,
включаючи Excel і бази даних.

3.2 Вибір інструментальної платформи для виконання обчислювальних


експериментів: EVIEWS, GENIE, MATLAB

MATLAB – це пакет прикладних програм для числового аналізу, а


також мова програмування, що використовується в даному пакеті. Дана
система створена компанією The MathWorks і є розповсюдженим та зручним
засобом для роботи з математичними матрицями, малювання функцій,
роботи з алгоритмами, створення робочих оболонок (user interfaces) з
програмами в інших мовах програмування.
54

Мова, інструментарій та вбудовані математичні функції дозволяють


досліджувати різні підходи і отримувати рішення швидше, ніж з
використанням електронних таблиць або традиційних мов програмування,
таких як C / C ++ або Java.
MATLAB широко використовується в таких областях, як:
а) обробка сигналів і зв'язок;
б) обробка зображень і відео;
в) системи управління;
г) автоматизація тестування і вимірювань;
д) фінансовий інжиніринг;
е) обчислювальна біологія і т.п.

MATLAB в порівнянні з традиційними мовами програмування (C / C ++,


Java, Pascal, FORTRAN) дозволяє на порядок скоротити час вирішення
типових завдань і значно спрощує розробку нових алгоритмів.
Ядро MATLAB дозволяє максимально просто працювати з матрицями
реальних, комплексних і аналітичних типів даних і зі структурами даних і
таблицями пошуку.
MATLAB містять задану вбудовані функції лінійної алгебри (LAPACK,
BLAS), швидкого перетворення Фур'є (FFTW), функції для роботи з
поліномами, функції базової статистики та чисельного рішення
диференціальних рівнянь; розширені математичні бібліотеки для Intel MKL.
Всі вбудовані функції ядра MATLAB розроблені й оптимізовані
фахівцями і працюють швидше або так само, як їх еквівалент на C / C ++.
Eviews - це статистичний пакет для Windows, який використовується в
основному для економетричного аналізу, орієнтованого на періодичні ряди.
Він розроблений Quantitative Micro Software (QMS), який в даний час є
частиною IHS. Версія 1.0 була випущена в березні 1994 року і замінила
MicroTSP. Програмне забезпечення та мова програмування TSP спочатку був
55

розроблений Робертом Холом у 1965 році. Поточна версія EViews - 10,


випущена в червні 2017 року.
EViews може бути використані для загального статистичного аналізу та
економетричного аналізу, а також оцінки та прогнозування часових рядів.
EViews поєднує в собі технологію електронних таблиць та реляційних
баз даних із традиційними завданнями, виявленими в статистичному
програмному забезпеченні, і використовує графічний інтерфейс Windows. Це
поєднується з мовою програмування, яка відображає обмежену об'єктну
орієнтацію. Enterprise EViews дає змогу отримувати доступ до даних про
часові ряди третьої сторони від декількох провайдерів, включаючи Thomson
Reuters Datastream, FactSet, Moody's Economy.com, Macrobond Financial,
Haver Analytics, і CEIC.

GeNie Modeler - це середовище моделювання середовища, що


впроваджує діаграми впливу та байєсівські мережі, розроблене в Лабораторії
рішень, Пітсбургський університет, і ліцензована з 2015 року на ТОВ
BayesFusion. Він має інтуїтивно зрозумілий графічний інтерфейс, що
включає в себе ієрархічні підмондери, деревоподібне представлення у стилі
Windows, а також повну довідку в Інтернеті, що включає в себе початкові
навчальні посібники для байєсівських мереж, діаграми впливу та основні
аналітичні методи рішення. GeNie Modeler реалізує багатоатрибутові корисні
функції, шуму-OR та шуму-І воріт, значення інформації та аналіз чутливості.
Крім власного формату файлів, GeNie підтримує читання та запис файлів
Hugin, Netica та Ergo, і може бути використаний для перетворення моделей
серед цих програм. GeNIe Modeler поставляється з SMILE Engine (Structural
Modeling, Inference і Learning Engine) бібліотекою інтерфейсу програми-
програвача (API) класів C ++, що дозволяє розробляти об'єктно-орієнтоване
програмне забезпечення на основі методів аналізу рішень. Пакунки для
двигуна SMILE також доступні і дозволяють використовувати його з
середовища Java, .NET або як елемент керування ActiveX. GeNIe Modeler та
56

SMILE Engine доступні для безкоштовних академічних користувачів і


можуть бути завантажені з академічного веб-сайту компанії BayesFusion,
LLC. Пакет включає в себе кілька великих байєсівських мереж та вплив
моделей діаграм, корисних для навчання.
3.3 Виконання обчислювальних експериментів

Було отримано часовий ряд, дані якого пройшли процедуру фільтрації


за допомогою фільтру Калмана.
Далі будемо будувати наступні типи моделей: ARIMA(p,i,q),
ARMA(p,q) та AR(p) та визначемо найкращу модель враховуючи такі
критерії адекватності моделі як: коефіцієнт детермінації, скоригований
коефіцієнт детермінації, сума квадратів залишків. Для виконання обчислень
будемо використовувати статистичний пакет Eviews. Спочатку будемо
описувати досліджуваний процес за допомогою моделі AR(p).
Для визначення порядку моделей побудуємо часткову автокореляційну
функію відповідного часового ряду. На рисунку 3.1 скорочення АС
відповідає АКФ, а РАС – часткова АКФ.

Рисунок 3.1 - АКФ та ЧАКФ відповідного часового ряду


57

Як видно з АКФ, при побудові моделей необхідно починати з моделей


нижчих порядків, які часто мають прийнятну адекватність процесу і
забезпечують високу якість прогнозу. Результати оцінювання моделі
авторегресії першого порядку за допомогою методу найменших квадратів
наведені на рисунку 3.2.
Отримана модель АР(1):

y(k )=c 0 +c 1 y(k−1)+ε( k)= 0, 18+0 ,98 y(k−1)+e(k ) , (3.1)

де e(k) − залишки (похибки) моделі, значення яких можна знайти у


відповідному файлі пакету програм, що застосовується для побудови моделі.
58

Статистичні характеристики моделі:

R2 =0 , 9802; J =СКП =73 , 49988 DW =2 ,2423 .(3.2)


Коефіцієнт детермінації має досить високе значеня (0,9802), сума
квадратів похибок становить (141,99), а статистика Дарбіна-Уотсона (1,931)
наближається до найкращого значення. Таким чином, загалом адекватність
моделі АР(1) досить висока. Характеристики якості (історичного – за
навчальною вибіркою) однокрокового прогнозу:
Рисунок 3.2 - Результати оцінювання моделі АР(1)

СеКП =0 , 5987; САП =0 , 444 ; САПП=2 , 352012; U=0 , 0154 .


(3.3)
59

тобто, середньоквадратична похибка (СеКП), середня абсолютна


похибка (САП), середня абсолютна похибка в процентах (САПП) і
коефіцієнт Тейла, який свідчить про загальну придатність моделі для
прогнозування (ідеальне значення – нуль).
На рисунку 3.3 наведені результати оцінювання авторегресійної моделі
АР(2).

Таким Рисунок 3.3 записати


чином, можна - Результати оцінювання
наступну модель:моделі АР(2)

y (k )=c 0 +c 1 y (k −1)+c 2 y (k −2)+ε(k )=0 , 1566+0 , 8648 y (k −1)+0 , 124 y(k −2) .

(3.3)

Для цієї моделі спостерігається збыльшення коефіцієнта детермінації


від 0,9802 до 0,9804 ; зменшення суми квадратів похибок від 73,4998 до
72,2074 і деяке покращення статистики Дарбіна-Уотсона: 2,0195.
60

Тобто отримані значення характеристик моделі:


2
R =0 , 9804 ; J =СКП =72, 2074 ; DW =2 , 0195.
(3.4)

Характеристики однокрокового прогнозу для даної моделі:

СеКП =2 , 41859; САП =2 ,00487 ; САПП =2, 4801; U=0 , 0636 .


(3.5)

тобто модель загалом є менш придатною для прогнозування у порівнянні з


попередньою моделлю за усіма характеристиками.
Розглянемо модель 3-го порядку AР(3). На рисунку 3.4 наведені результати
оцінювання моделі АР(3).

Рисунок 3.4 - Результати оцінювання моделі АР(3)


61

Статистичні характеристики моделі АР(3):

2
R =0 , 9808 ; J =СКП=69 , 7785 ; DW =1 , 99297 . (3.6)

Порівнюючи моделі АР(2) і АР(3), можна сказати, що коефіцієнт


детермінації збільшився (від 0,9804 до 0,9808); сума квадратів похибок
моделі зменшилась від 72,2074 до 69,7785, а статистика Дарбіна-Уотсона
зменшилась від 2,0195 до 1,9929). Тобто, загалом, рівень адекватності моделі
збільшився.
Характеристики однокрокового прогнозу для АР(3):

СеКП =0 ,58774 ; САП =0 ,44031 ; САПП=2 ,35190; U=0 ,01525 .


(3.7)

Порівнюючи ці характеристики з відповідними характеристиками


моделі АР(1), а саме : СеКП зменшилася на 0,011 , САП зменшилася на
0.004, САПП зменшилася на 0,0001, а коефіцієнт Тейла зменшився на

0,00015, можна зробити висновок, що дана модель краще описує


досліджуваний процес.
Побудуємо модель авторегресії 4-го порядку АР(4). На рисунку 3.5
зображені результати оцінювання моделі АР(4).
62

Рисунок 3.5 - Результати оцінювання моделі АР(4)

Статистичні характеристики моделі АР(4):

2
R =0 , 9822; J =СКП =62 , 8651; DW =2 , 0114.
(3.8)

Характеристики однокрокового прогнозу для АР(4):

СеКП =0, 56634 ; САП =0 ,42461 ; САПП=2, 29586 ; U =0 , 01479.


(3.9)
63

Порівнюючи усі статистичні характеристики вищевказаних моделей


можна зробити висновок, що модель АР(4) найбільш адекватно описує
досліджуваний процес.
Перейдемо до побудови моделей із класу ARMA(p,q). Побудуємо
часткову автокореляційну функцію залишків AR(1). На рисунку 3.6
зображена відповідна часткова автокореляційна функція.

Побудуємо
модель
ARMA(1,1) .
На рисунку
3.7
зображені результати оцінювання моделі ARMA(1,1).

Рисунок 3.6 – АКФ та ЧАКФ залишків відповідного часового ряду


64

Рисунок 3.7 - результати оцінювання моделі ARMA(1,1)

Вибрані статистичні характеристики адекватності цієї моделі:

2
R =0 , 9805 ; J=СКП=72, 1677 ; DW =1 , 9747 . (3.10)

Характеристики якості однокрокового прогнозу:

СеКП =0 , 59332; САП=0 , 44639; САПП =2 ,37148 ; U =0 , 01534 .


(3.11)

Побудована модель ARMA(1,1) є менш точною, порівнюючи


характеристики адекватності та якості однокрокового прогнозу, у порівнянні
з моделями AR(2) та AR(3).
65

Побудуємо модель ARMA(1,3). На рисунку 3.8 зображені результати


оцінювання моделі ARMA(1,3).

Рисунок 3.8 - Результати оцінювання моделі ARMA(1,3)

Вибрані статистичні характеристики адекватності цієї моделі:

R2 =0 , 981387 ; J=СКП=69 ,2111 ; DW =1 ,98103 . (3.10)

Характеристики якості однокрокового прогнозу:

СеКП =0 ,581047; САП =0, 441280 ; САПП=2 , 35530; U=0,015025 .


(3.11)
66

Модель ARMA(1,3) є більш точною, порівнюючи характеристики


прогнозу та адекватності моделі, у порівняння з моделями ARMA(1,1),
AR(3), AR(2) та AR(1), але , у порівнянні з моделю AR(4), має менший
ступінь адекватності. Тобто найкращою за характеристиками прогнозу та
адекватності серед побудованих моделей є модель AR(4). Відповідну модель
будемо використовувати для побудови ймовірнісної оцінки прогнозу за
допомогою мережі Байєса.
Для побудови мережі Байєса спочатку знайдемо відповідний прогноз за
вибраною моделю авторегресії четвертого порядку AR(4). На рисунку 3.9
зображені результати прогнозування з використанням моделі AR(4).

Рисунок 3.9 - Результати прогнозування з використанням моделі AR(4)


67

Відповідно значення прогнозу ми будемо використовувати у якості


залежної змінної у мережі Байєса. Опишемо структуру мережі.
Мережа буде складатися з 6 вершин, які будуть являти собою
відповідні ендогенні та екзогенні змінні, які відповідають структурі вибраної
для побудови прогнозу моделі AR(4). У таблиці 3.1 представлені назви
Таблиця
відповідних 3.1 - мережі
вершин Назви відповідних
Байєса та їх вершин
опис. мережі Байєса та їх опис

Назва вершини Опис


Lag1 Відповідає значенню змінної ar(1)
Lag2 Відповідає значенню змінної ar(2)
Lag4 Відповідає значенню змінної ar(4)
Lag10 Відповідає значенню змінної ar(10)
Curr Відповідає значенню змінної y(k)
Predict Відповідає значенню змінної y(k+1)

Для побудови мережі Байєса треба імпортувати дані, які представляють


значення майбутніх вершин мережі за деякий проміжок часу. На рисунку
3.10 зображені імпортовані дані для побудови мережі Байєса.
Оскільки мережа не може бути побудована на неперервних даних,
вхідні дані треба дискретизувати, тобто розбити на відповідні інтервали за
приналежністю. На рисунку 3.11 зображена дискретизація вхідних даних.

Рисунок 3.10 - Імпортовані дані для побудови мережі Байєса


68

Рисунок 3.11 - Дискретизація вхідних даних

Для дискретизації даних був вибраний ієрархічний метод та


встановлена кількість інтервалів для розбиття, яка дорівнює 40. На рисунку
3.11 можна побачити діаграму, на якій зображено розбиття відповідних
значень змінної у вигляді кольорових секторів. Також представлена таблиця
на якій представлені відповідні інтервали на які були розбиті значення,
відповідна кількість значень та інтервал, якому належать ці значення. Тепер,
після дискретизації вхідних даних, перейдемо до побудови мережі Байєса.
На рисунку 3.12 зображено функціональне вікно для задання
параметрів, які потрібні для побудови мережі.
69

Рисунок 3.12 - Функціональне вікно для задання параметрів для побудови мережі

У
якості вхідних параметрів представлені відповідні змінні, які ми отримали за
вибраної регресійної моделі. Також для навчання та перевірки роботи мережі
вхідна вибірка була розділена на тестову на перевірочну у наступному
співвідношенні – 60/40. Для методу навчання мережі був обраний Наївний
баєсів класифікатор. У якості залежної змінної було обрано зміну Predict, яка
відповідає набору значень прогнозу, які були отримані за допомогою обраної
моделі авторегресії AR(4). На рисунку 3.13 зображена структура
побудованої мережі.
70

Рисунок 3.13 - Структура побудованої мережі

Побудована мережа має 6 вершин на 40 станів на які розбиті усі вхідні


дані внаслідок процедури дискретизації.
Побудована мережа працює наступним чином:
а) на залежних вершинах вибирається відповідний стан;
б) перераховуються відповідній ймовірності;
в) відображаються відповідні ймовірності настання того чи іншого стану
у залежній змінній.

Рисунок 3.14 – Приклад роботи побудованої мережі Байєса


71

Наведемо приклад роботи побудованої мережі.

Нехай значення регресорів(незалежних вершин мережі) наступні:

Таблиця 3.2 - Значення регресорів(незалежних вершин мережі)

Назва вершини Значення


Lag1 22,94
Lag2 23,91
Lag4 21,66
Lag10 25,05
Curr 22,15

Тоді стани цих вершин, які відповідають вищевказаним значенням будуть


наступні:

Таблиця 3.3 – Назви вершин мережі та їх відповідні стани

Назва вершини Стан


Lag1 S29
Lag2 S33
Lag4 S25
Lag10 S38
Curr S28

На рисунку 3.15 зображено стан мережі, який відповідає заданим станам


кожної з її вершин.
72

Рисунок 3.15 - Стан мережі, який відповідає заданим станам кожної з її вершин

На рисунку 3.13 можна побачити, що залежна змінна Pred приймає


значення з інтервалу s28 з ймовірністю 97%. Інтервал s28 містить наступні
значення [22,10773; 22,205]. Для обрахунку прогнозного значення,
враховуючи значення прогнозу за моделю AR(4) та побудованою мережею
Байєса, будемо використовувати наступну формулу:

Forecas ted ¿ + Forecasted ¿


Pre d New = , (3.12)
2

де Forecasted ¿ −¿ відповідне значення прогнозу за мережею Байєса;


Forecasted ¿ −¿ відповідне значення прогнозу за прогнозуючою моделю.
Forecasted ¿ може бути обраховане як середина інтервалу, якому відповідає

найбільша ймовірність, тобто

22,107+ 22,205
Forecasted ¿ = =22,1965. (3.13)
2

Знайдемо значення Pre d New за нашим прикладом:


73

22,107+22,205
Pre d New = =22,1965 (3.14)
2

Порівнюючи значення прогнозу за мережею та за моделлю AR(4) з


істинним значенням, тобто : Forecasted ¿ =22,1965; Forecasted ¿ =22,237 ;
True value=21,93 , можна зробити висновок, що прогноз за мережею Байєса

кращий на 0,04. Тобто мережа, побудована на основі моделі AR(4), дає


покращений результат прогнозу за моделлю.
Знайдемо похибку прогнозу у відсотках з наступною формулою:

| Pred new−True value|


APE= ×100 % (3.15)
True value

Враховуючи значення змінних, які вказані вище, можна знайти чому


дорівнює помилка відповідного прогнозу:

|22,1965−22,15|
APE= ×100 %=0.2 % (3.16)
22,15

Значення помилки досить незначне, що дає прогноз є досить точним


3.4 Аналіз результатів

На рисунку 3.16 зображені усі моделі, які були побудовані в процесі


дослідження та представлені їх характеристики.

Рисунок 3.16 – Характеристики побудованих моделей


74

Серед усіх побудованих моделей була обрана модель авторегресії 4-го


порядку(AR(4)), порівнюючи показники адекватності моделей та якості
прогнозу.
Далі прогноз, який був отриманий за допомогою моделі обраної моделі
AR(4), був використаний для побудови мережі Байєса. Структура мережі
Байєса була обрана подібною до структури обраної моделі авторегресії, тобто
у якості вершин мережі було обрано відповідні регресори моделі.
На рисунку 3.17 зображена структура побудованої мережі Байєса.

Рисунок 3.17 - Структура побудованої мережі Байєса


75

Predict_model Curr Predict_network


16.5

16

15.5

15

14.5

14

13.5
194 195 196 197 198 199 200 201 202 203 204 205 206

Далі на тестових даних були знайдені значення прогнозу за моделю


AR(4), за побудованою мережею Байєса та порівняні з очікуваним
значенням. На рисунку 3.3.3 зображені графіки значень прогнозу за моделю,
мережею Байєса та істинних значень.

Рисунок 3.18 - Графіки значень прогнозу за моделю, мережею Байєса та істинних значень

З вищевказаних графіків можна зробити висновок, що значення


прогнозу, які знайдені за допомогою побудованої моделі авторегресії 4-го
порядку є досить близькими до істинних значень. Також можна побачити, що
використання мережі Байєса сприяє уточненню значень прогнозу. У таблиці
3.4 представлені статистичні характеристики моделі авторегресії та моделі,
яка побудована за допомогою мережі Байєса.

Таблиця 3.4 - Статистичні характеристики моделей авторегресії, мережі Байєса та МГУА

Статистичні RMSE MAPE


характеристики/Назва моделі
Авторегресія AR(4) 5,01044 4,01558
Мережа Байєса 3,06102 2,06820
МГУА 4,21032 3,01559
76

Висновки до розділу

Для моделювання обраного нестаціонарного нелінійного процесу були


побудовані регресійні моделі різних класів, а саме: лінійна регресія та лінійна
регресія з ковзним середнім. Найкращою серед цих моделей виявилася
модель лінійної регресії 4-го порядку, порівнюючи показники адекватності
моделей та якості прогнозу.
На основі вибраної моделі була побудована мережа Байєса. За
допомогою побудованої мережі був обчислений комбінований прогноз. Для
порівняння якості прогнозу був порівняний прогноз, отриманий з
використанням моделі AR(4) та мережі Байєса. На основі отриманих
прогнозів були знайдені наступні характеристики: RMSE (середня
квадратична похибка) та MAPE (середня абсолютна похибка у процентах).
Порівнюючи ці характеристики, можна зробити висновок, що оцінки
прогнозу, які були отримані за допомогою Мережі Байєса є кращими, тобто є
уточненням тих оцінок, які були отримані за допомогою моделі AR(4).

РОЗДІЛ 4
РОЗРОБЛЕННЯ СТАРТАП-ПРОЕКТУ
4.1 Опис ідеї проекту

Табл. 4.1 і 4.2 ми проводимо аналіз змісту ідеї, можливих напрямків


застосування, основних вигод, що може отримати користувач товару, а також
висвітлюємо особливості нашого продукту порівняно з продуктами
конкурентів:
77

Таблиця 4.1 – Опис ідеї стартап-проекту


Зміст ідеї Напрямки застосування Вигоди для користувача
Пропонується розробити 1. Внутрішнє використання Прогнозовані значення
моделі для прогнозування міністерством фінансів показників процесу дають
ключових показників України можливість підкорегувати
економіки країни управлінські рішення на
майбутні періоди
2. Визначення стану Можна визначати не тільки
економіки у часовому теперішній стан економіки,
розрізі а й робити відповідні
прогнози на майбутнє

Таблиця 4.2 – Визначення сильних, слабких та нейтральних


характеристик ідеї проекту
(потенційні) товари/концепції
Техніко- N S
№ конкурентів W
економічні (нейт- (силь
№ Аналітич- Незалежні (слабка
характерис-
Продовження Мій 4.2
таблиці ральна на
п/п ний відділ аудитор- ст-а)
тики ідеї проект ст-а) ст-а)
банку ські фірми
1 Мала
1. собівартість + - - +
проекту
2 Висока
2. якість + + + +
прогнозу
3 Легкість
3. використа- + - - +
ння
4 Спектр
4. запропоно-
- +- + +
ваних
послуг

Таким чином, наш продукт є достатньо конкурентоспроможним, адже


він має достатньо невисоку собівартість, тобто потребуватиме невеликі
кошти для купівлі і утримання, на відміну від утримання цілого відділу
аналітики чи оплати послуг зовнішніх аудиторських компаній, при цьому
наш продукт не поступатиметься фахівцям у якості прогнозу, а
використовувати продукт достатньо легко.
78

4.2 Технологічний аудит ідеї проекту

Визначення технологічної здійсненності ідеї проекту передбачає аналіз


таких складових (табл. 4.3):
а) за якою технологією буде виготовлено товар згідно ідеї проекту;
б) чи існують такі технології, чи їх потрібно розробити/доробити;
в) чи доступні такі технології авторам проекту.

Таблиця 4.3 – Технологічна здійсненність ідеї проекту


№ Ідея Технології її Наявність Доступність
п/п проекту реалізації технологій технологій
1. Побудова Регресійний аналіз Необхідно підібрати Доступна
моделей найкращі параметри
для і необхідну модель
якісного регресійного аналізу
Продовження
прогнозу таблиці 4.3
Обрана технологія реалізації ідеї проекту: регресійний аналіз

4.3 Аналіз ринкових можливостей запуску стартап-проекту

Визначення ринкових можливостей, які можна використати під час


ринкового впровадження проекту, та ринкових загроз, які можуть
перешкодити реалізації проекту, дозволяє спланувати напрями розвитку
проекту із урахуванням стану ринкового середовища, потреб потенційних
клієнтів та пропозицій проектів-конкурентів.
У табл. 4.4 проводиться аналіз попиту: наявність попиту, обсяг,
динаміка розвитку ринку:

Таблиця 4.4 – Попередня характеристика потенційного ринку стартап-


проекту
79


Показники стану ринку (найменування) Характеристика
п/п
1 Кількість головних гравців, од 0
2 Загальний обсяг продаж, грн/ум.од 0
3 Динаміка ринку (якісна оцінка) Стагнує
4 Наявність обмежень для входу (вказати характер Нестабільна економіка
обмежень)
5 Специфічні вимоги до стандартизації та сертифікації Необхідне
врегулювання НБУ
6 Середня норма рентабельності в галузі (або по ринку), 300
%

Виходячи зі стану ринку, є великий сенс заходити на ринок з


продуктом, що дасть можливість банкам прогнозувати вкрай важливі для
діяльності банку показники.
Надалі визначаємо потенційні групи клієнтів, їх характеристики, та
формуємо орієнтовний перелік вимог до товару для кожної групи (табл. 4.5).

Таблиця 4.5 – Характеристика потенційних клієнтів стартап-проекту


Відмінності у
Цільова аудиторія поведінці різних Вимоги
№ Потреба, що
(цільові сегменти потенційних споживачів до
п/п формує ринок
ринку) цільових груп товару
клієнтів
1 Точне Українські Прогноз потрібен Висока якість
прогнозування комерційні банки для можливості прогнозу
економічних прийняття Технічна
процесів, які управлінських підтримка
відбуваються у рішень Невисока
країні НБУ Прогноз потрібен собівартість
для формування
рейтингів банків

Фізичні особи Використання


прогнозу для
прийняття тих чи
інших рішень, які
пов’язані з
економікою
80

Після визначення потенційних груп клієнтів проводимо аналіз


ринкового середовища: у табл. 4.6 подані фактори, що сприяють ринковому
впровадженню проекту, а у табл. 4.7 – фактори, що йому перешкоджають.

Таблиця 4.6 – Фактори загроз


№ Можлива реакція
Фактор Зміст загрози
п/п компанії
1 Важко увійти у ринок Споживачі можуть не Розповсюдження демо-
погодитись купувати версії безкоштовно
продукт
2 Постачальник НБУ НБУ може не надати Запропонувати
вибірки для побудови необхідну плату за
моделі вибірки
3 Нестабільна економіка Ускладнює точність Спроба побудувати
прогнозу модель, чутливу до
викидів
4 Важка процедура Отримання дозволу на Почати реєструвати
реєстрації використання у продукт ще на стадії
фінансових установах його творення

Таблиця 4.7 – Фактори можливостей



Фактор Зміст можливості Можлива реакція компанії
п/п
1 Зацікавленість Банки зацікавлені у Впровадження продукту
споживачів скороченні штату
аналітиків
2 Збільшення кількості Останнім часом велика Впровадження продукту
збанкрутілих банків кількість банків
банкротує, тож
продукт для прогнозу
ліквідності допоможе
уникнути банкроту
клієнту

У табл. 4.8 проведено аналіз пропозиції: загальні риси конкуренції на


ринку:

Таблиця 4.8 – Степеневий аналіз конкуренції на ринку


Особливості конкурентного В чому проявляється дана Вплив на
81

діяльність
підприємства
(можливі дії
середовища характеристика компанії, щоб
бути
конкурентоспром
ожною)
1. Вказати тип конкуренції Монополія
- монополія/олігополія/
монополістична/чиста
2. За рівнем конкурентної Національний/міжнародний Покращення
боротьби якості продукту
- локальний/національний/… Постійне
3. За галузевою ознакою Внутрішньогалузева оновлення,
- міжгалузева/ додаткові
внутрішньогалузева можливості для
4. Конкуренція за видами Товарно-родова клієнта
товарів: Технічна
- товарно-родова підтримка
- товарно-видова цілодобово
- між бажаннями Низька
5. За характером конкурентних Цінова собівартість
переваг продукту
- цінова / нецінова
6. За інтенсивністю Не марочна
- марочна/не марочна

Більш детальний аналіз умов конкуренції в галузі (за моделлю 5 сил М.


Портера) подано у наступній таблиці (табл. 4.9):

Таблиця 4.9 – Аналіз конкуренції в галузі за М. Портером


Прямі
Потенційні Постачаль- Товари-
конкуренти в Клієнти
конкуренти ники замінники
галузі
Аутсорси
Аутсорсингові
Складові -нгові
фірми, що Потреба у
аналізу НБУ та фірми, що
Аналітичний займаються високій
комерційні займають
відділ банку прогнозами; якості
банки України ся
схожі на наш, прогнозу
прогноза-
продукти
ми
Виснов- Є велика Можливість Постачаль-ник Клієнта Зайвий
ки: ймовірність входження на може дуже важко конкурент
того, що банк ринок є, але диктувати свої переконати на ринку
просто не ризик занадто умови і у
відмовиться від великий збільшувати необхідності
свого ціну на нашого
82

аналітичного вибірки продукту


відділу

На основі попередніх таблиць ми визначили, що основним


конкурентом є аналітичний відділ самого комерційного банку, або ж
незалежні аудиторські компанії. Основним їх недоліком є велика вартість
утримання або замовлення послуг відповідно. Це дає нам змогу вийти на
ринок, так як основною перевагою нашого продукту є низька собівартість, з
чого слідує і мала вартість покупки нашого товару у банках.
У табл. 4.10 обґрунтовано перелік факторів конкурентоспроможності,
що базується на аналізі, поданому у попередніх таблицях:

Таблиця 4.10 – Обґрунтування факторів конкурентоспроможності


Обґрунтування (наведення чинників, що роблять
№ Фактор
фактор для порівняння конкурентних проектів
п/п конкурентоспроможності
значущим)
1 Невисока вартість продукту Це має бути впливовим фактором відмовитись від
аналітичного відділу
2 Продовження
Висока таблиці 4.10 Продукт нічим не поступається цілому відділу
якість прогнозу
аналітики
3 Постійна технічна підтримка Швидке позбавлення проблем з боку розробника
4 Легке використання Не потрібно витрачати багато часу для отримання
результату

Нижче (табл. 4.11) проведено аналіз сильних та слабких сторін стартап-


проекту:

Таблиця 4.11 – Порівняльний аналіз сильних та слабких сторін проекту


№ Рейтинг товарів-конкурентів у
Бали порівнянні з нашим проектом
п/ Фактор конкурентоспроможності
1-4
п –3 –2 –1 0 +1 +2 +3
1 Невисока вартість продукту 3 +
2 Висока якість прогнозу 4 +
3 Постійна технічна підтримка 1 +
4 Легке використання 2 +
83

Фінальним етапом ринкового аналізу можливостей впровадження


проекту є складання SWOT-аналізу (матриці аналізу сильних (Strength) та
слабких (Weak) сторін, загроз (Troubles) та можливостей (Opportunities)
(табл. 4.12) на основі виділених ринкових загроз та можливостей, та сильних
і слабких сторін (табл. 4.11).
Перелік ринкових загроз та ринкових можливостей складено на основі
аналізу факторів загроз та факторів можливостей маркетингового
середовища. Ринкові загрози та ринкові можливості є наслідками
(прогнозованими результатами) впливу факторів, і, на відміну від них, ще не
є реалізованими на ринку та мають певну ймовірність здійснення.

Таблиця 4.12 – SWOT-аналіз стартап-проекту


Сильні сторони: Слабкі сторони:
Висока точність обчислень Брак досвіду
Швидкість роботи Відсутність економічної освіти у
Легкість використання розробника
Використання нових алгоритмів Відсутність фінансових ресурсів
Можливість забезпечити
Продовження низьку 4.12
таблиця Обмеженість у часі
собівартість
Можливості: Загрози:
Банки зацікавлені у скороченні штату Споживачі можуть не погодитись купувати
аналітиків продукт
Останнім часом велика кількість банків НБУ може не надати вибірки для побудови
банкротує, тож продукт для прогнозу моделі
ліквідності, рентабельності та об’єму Нестабільна економіка ускладнює точність
депозитів допоможе уникнути банкроту прогнозу
клієнту Важка процедура реєстрації та отримання
ліцензії

На основі SWOT-аналізу розроблено альтернативи ринкової поведінки


(перелік заходів) для виведення стартап-проекту на ринок та орієнтовний
оптимальний час їх ринкової реалізації з огляду на потенційні проекти
конкурентів, що можуть бути виведені на ринок. Визначені альтернативи
проаналізовано з точки зору строків та ймовірності отримання ресурсів (табл.
4.13).
84

Таблиця 4.13 – Альтернативи ринкового впровадження стартап-проекту


Альтернатива
№ (орієнтовний комплекс Ймовірність отримання
Строки реалізації
п/п заходів) ринкової ресурсів
поведінки
1 Орієнтація тільки на Висока 0,5 місяця
іноземні банки (легше
отримати точні прогнози)
2 Орієнтація на одиничних Середня 3 місяці
споживачів – потенційних
клієнтів банку, у вигляді
додатків для
прогнозування надійності
банку
3 Зміна орієнтиру на Середня 2 місяці
установи видачі кредитів

Виходячи з ймовірності отримання ресурсів та строків реалізації, за


умови, що впровадження продукту в комерційні банки України чи НБУ буде
невдалим, ми змінимо орієнтацію на іноземні банки, для яких прогнозовані
моделі побудувати легше, зважаючи на більш стабільну економіку.
4.4 Розроблення ринкової стратегії проекту

Розроблення ринкової стратегії першим кроком передбачає визначення


стратегії охоплення ринку: опис цільових груп потенційних споживачів
(табл. 4.14):

Таблиця 4.14 – Вибір цільових груп потенційних споживачів


Опис
профілю Орієнто-вний
Готовність
цільової попит в Інтенсив-ність
№ споживачів Простота
групи межах конкуренції в
п/п сприйняти входу у сегмент
потенці- цільової групи сегменті
продукт
йних (сегменту)
клієнтів
1 Комерційні Середня. Якщо Високий Прямих Якщо
банки показати, на конкурентів на споживачі
України та скільки це ринку немає. сприймуть
НБУ вигідно, вони продукт, то він
сприймуть легко зайде на
85

продукт. ринок.
2 Іноземні Середня. Якщо Середній Прямих Якщо
банки показати, на конкурентів на зареєструвати
скільки це ринку немає. компанію у
вигідно, вони рідній країні
сприймуть банків, то
продукт. можна просто
зайти на ринок.
3 Потенційні Висока. Якщо Високий Прямих За правильної
клієнти вартість конкурентів на маркетингової
банків додатку буде ринку немає. стратегії вийти
мінімальною, на ринок
користувачі просто.
будуть його
купляти.
4 Фірми Висока Середній Прямих Просто.
швидких (зважаючи конкурентів на
кредитів невелику ринку немає.
кількість
таких
компаній і їх
незначні
розміри)

Для роботи в обраних сегментах ринку необхідно сформувати базову


стратегію розвитку (табл. 4.15):

Таблиця 4.15 – Визначення базової стратегії розвитку


Ключові
Обрана
№ Стратегія конкурентоспроможні Базова стратегія
альтернатива
п/п охоплення ринку позиції відповідно до розвитку
розвитку проекту
обраної альтернативи
1 Просувати свій Переконувати Низька собівартість Стратегія
продукт в керівників продукту спеціалізації
українські і іноземні банків, що (потреби сегменту
банки купити ліцензію Банки, що
на наш продукт спираються на
вигідніше, ніж лідерство по
тримати витратах)
аналітичний
відділ

Наступним кроком став вибір стратегії конкурентної поведінки (табл.


4.16):
86

Таблиця 4.16 – Визначення базової стратегії конкурентної поведінки


Чи буде
компанія Чи буде компанія
Чи є проект шукати нових копіювати основні Стратегія
№ п/п «першопрохідцем споживачів, або характеристики конкурентної
» на ринку? забирати товару поведінки
існуючих у конкурента, і які?
конкурентів?
1 Так, програм Компанія буде Програма буде Стратегія виклику
аналогів не існує, забирати повністю заміняти лідера (атакування
всі банки споживачів: напрям аналітики з лідера найкращим
користуються переконувати прогнозу співвідношен-ням
власними власників банків ліквідності, «ціна-якість»).
аналітичними відмовитись від рентабельності та
відділами. аналітичних об’єму депозитів
відділів на банку.
користь нашого
проету.

На основі вимог споживачів з обраних сегментів до постачальника


(стартап-компанії) та до продукту (табл. 4.5), а також в залежності від
обраної базової стратегії розвитку (табл. 4.15) та стратегії конкурентної
поведінки (табл. 4.16) розроблено стратегію позиціонування (табл. 4.17), що
полягає у формуванні ринкової позиції (комплексу асоціацій), за яким
споживачі мають ідентифікувати торгівельну марку/проект.

Таблиця 4.17 – Визначення стратегії позиціонування


Ключові
Вимоги до Вибір асоціацій, які мають
Базова конкурентоспр-
№ товару сформувати комплексну позицію
страте-гія оможні позиції
п/п цільової власного проекту (три
розвитку власного стартап-
аудиторії ключових)
проекту
1 Висока якість Стратегія Низька собівартість Прогноз, фінансовий стан, банк,
прогнозу спеціалі- продукту низька ціна
Технічна зації
підтримка
Невисока
собівартість
87

Таким чином, шляхом переконання керівників банків, що за низької


вартості є можливість отримувати високу якість прогнозу ключових
показників фінансового стану банку, ми і будемо здобувати собі клієнтів на
покупку нашого продукту.

4.5 Розроблення маркетингової програми стартап-проекту

У табл. 4.18 ми підсумували результати попереднього аналізу


конкурентоспроможності товару, щоб сформувати маркетингову концепцію
товару, який отримає споживач:

Таблиця 4.18 – Визначення ключових переваг концепції потенційного


товару
Ключові переваги перед конкурентами
№ Вигода, яку
Потреба (існуючі або такі, що потрібно
п/п пропонує товар
створити)
1 Висока якість Автоматично З використанням даного продукту
прогнозу прогнозує операційний ризик прямує до нуля
ключові (майже неможливий збій через
показники антропогенний фактор)
фінансового
стану банку з
високою точністю
2 Невелика ціна Низька Низька вартість, порівняно з
собівартість утриманням цілого аналітичного відділу
продукту
3 Легке Зрозумілий Тепер прогнозувати показники може
використання інтерфейс навіть людина без профільної освіти
продукту
4 Легке Технічна Якщо виникають проблемні ситуації, ми
обслуговування підтримка надаємо технічну підтримку
продукту
88

Надалі ми розробили трирівнева маркетингова модель товару:


уточнили ідею продукту, його фізичні складові, особливості процесу його
надання (табл. 4.19).

Таблиця 4.19 – Опис трьох рівнів моделі товару


Рівні товару Сутність та складові
І. Товар за Програмний продукт, який буде давати прогноз ліквідності з
задумом високою точністю.
ІІ. Товар у Властивості/характеристики
реальному 1. Невелика ціна
виконанні 2. Технічне обслуговування
Якість: висока якість прогнозу в умовах нестабільної економіки
Програма, яку можна завантажити з офіційного сайти і необхідно
внести код ліценції, яка купляється на цьому ж сайті.
ІІІ. Товар із До продажу: лише прогнозування ліквідності, рентабельності та
підкріпленням об’єму депозитів
Після продажу: в перспективі додавання функціоналу, щоб
поступово замістити весь аналітичний відділ банку.
За рахунок чого потенційний товар буде захищено від копіювання: патент на
прогнозну модель та ліцензія на використання, затверджена НБУ.

Наступним кроком стало визначення цінових меж, якими необхідно


керуватись при встановленні ціни на потенційний товар (остаточне
визначення ціни відбувається під час фінансово-економічного аналізу
проекту), яке передбачає аналіз ціни на товари-аналоги або товари
субститути, а також аналіз рівня доходів цільової групи споживачів (табл.
4.20). Аналіз проведено експертним методом.

Таблиця 4.20 – Визначення меж встановлення ціни


Верхня та нижня
Рівень цін на Рівень цін на Рівень доходів
№ межі встановлення
товари- товари- цільової групи
п/п ціни на
замінники аналоги споживачів
товар/послугу
1 Регулюються - Більше 1 млрд Приблизно $1000 за
заробітною грн/рік ліцензію в одній
платою установі +
співробітників $100/місяць за
банку (10-15 підписку
тис. грн./міс.,
89

10-20 осіб у
регіональному
відділенні)

Наступним кроком є визначення оптимальної системи збуту, в межах


якого приймається рішення (табл. 4.21):
а) проводити збут власними силами або залучати сторонніх
посередників (власна або залучена система збуту);
б) вибір та обґрунтування оптимальної глибини каналу збуту;
в) вибір та обґрунтування виду посередників.

Таблиця 4.21 – Формування системи збуту


Специфіка закупівельної Функції збуту, які має Оптимальна
№ Глибина каналу
поведінки цільових виконувати система
п/п збуту
клієнтів постачальник товару збуту
1 Купівля ліцензії у кожне Постачальник товару – Канал Офіційний
відділення банку та офіційний сайт, на якому нульового сайт
оформлення підписки можна оплатити рівня
ліцензію і підписку, а
також отримати сам
продукт.

Останньою складової маркетингової програми є розроблення концепції


маркетингових комунікацій, що спирається на попередньо обрану основу для
позиціонування, визначену специфіку поведінки клієнтів (табл. 4.22):

Таблиця 4.22 – Концепція маркетингових комунікацій


Канали
Специфіка
комунікацій, Ключові позиції, Завдання Концепція
№ поведінки
якими обрані для рекламного рекламного
п/п цільових
користуються позиціонування повідомлення звернення
клієнтів
цільові клієнти
1 Необхідно дати Інтернет, Контент- Привернути Надання демо-
зрозуміти e-mail маркетинг увагу, дати версії, велика
потенційному (надання можливість кількість
клієнту, на тимчасової спробувати публікацій у
скільки демо-версії для даний продукт. спеціалізованих
вигідніше ознайомлен-ня), виданнях.
користуватись публікації у
нашим наукових та
продуктом без фінансових
90

втрати якості. журналах,


email-маркетинг
членам ради
директорів
банку.

Висновки до розділу

Провівши комплексний аналіз впровадження стартапу, визначивши


його технологічні особливості, переваги та недоліки, на основі яких було
визначено його конкурентоспроможність, ми можемо зі впевненістю сказати,
що сенс впроваджувати проект такого типу є. Адже програмний продукт, що
базується на побудованій прогнозній моделі таких ключових показників, як
рентабельність, ліквідність банку і об’єм депозитів, є дуже значимим у
банках, але при цьому моє невелику собівартість і високу точність прогнозів,
тим самим має ідеальне співвідношення «ціна-якість».
Шляхом дослідження конкурентів ми визначили, що ринок не
насичений подібного роду послугами, прогнози можуть побудувати або
внутрішні аналітичні відділи, склад якого налічує десятки людей, або
незалежні аудиторські компанії, послуги яких коштують великих грошей.
Підписка на наш продукт є значно дешевшою, що є його основною
перевагою перед переліченими вище конкурентами
91

ПЕРЕЛІК ПОСИЛАНЬ

1. Орлов, А. И. Эконометрика [Текст] / А. И. Орлов. - М. :Экзамен, 1986.


– 413 с.
2. Кобзарь, А. И. Прикладная cтатистика [Текст] / А. И. Кобзарь. - М.
:Физматлит, 2006. - 816с.
3. Орлов, А. И. Прикладная статистика. Учебник [Текст] / А. И. Орлов. –
М.:Экзамен,2010.- 482 с.
4. Методика восстановления данных с пропусками [Електронний
ресурс].- Режим доступу: http://conf.sfu-kras.ru
5. Генератори випадкових чисел [Електронний ресурс]. - Режим доступу:
http://studopedia.org/4-115092.html
6. Бідюк, П. І. Аналіз часових рядів. Навчальний посібник [Текст] / П.І.
Бідюк, В. Д. Романенко, О.Л. Тимощук.-К.:Політехніка,2010. -317 с.
7. Гмурман, В. Е. Теория вероятностей и математическая статистика
[Текст] / В. Е. Гмурман. – М. :Высшая школа,2003. – 480 с.
8. Цифрові та аналогові фільтри [Електронный ресурс].- Режим доступу:
http://kivra.kpi.ua/wp-ontent/uploads/file/discipline/AOTI/AOTI_2_4-5.pdf
9. Литтл, Р. Дж. А Статистический анализ данных с пропусками [Текст] /
Р. Дж. А Литтл, Д. Б. Рубин.- М. :Финансы и статистика, 1991. -167 с.
10.Дрейпер, Н. Р. Прикладной регрессионный анализ [Текст] / Н.Р.
Дрейпер, Г. Смит. - К. :Диалектика, 2003. -610 с.
11. Кокс, Д. Теоретическая статистика [Текст] / Д. Кокс, Д. Хинкли.-М.
:Мир, 1978.- 560 с.
12. Закс, Л. Статистическое оценивание [Текст] / Л. Закс. - М. :Статистика,
1976.- 598 с.
13. Андерсон, Т. Статистический анализ временных рядов [Текст] / Т.
Андерсон. - М. :Мир, 1976.- 755 с.
92

14. Уилкс, С. Математическая статистика [Текст] / C. Уилкс .- М. :Наука,


1967.- 632 с.
15. Chatfield C. Time series forecasting. – London: Chapman & Hall,
2000. – 267 p.
16. Демківський Є.О., Бідюк П.І. Система підтримки прийняття рішень
при прогнозуванні нестаціонарних процесів // Наукові праці
Миколаївського державного гуманітарного університету ім. Петра
Могили, 2008, Вип. 77, с. 137-159.
17. Згуровский М.З., Бидюк П.И., Терентьев А.Н. Методы построения
байесовских сетей на основе оценочных функций // Кибернетика и
системный анализ, 2008, № 2, с. 81-88.
18. Статистика: Підручник/ А.В. Головач, А.М. Єріна, В.О. Козирєв та ін.;
За ред. А.В. Головача, А.М. Єріної, О.В. Козирєва.: – К.:Вища школа,
1993. – 623 с.
19. Box, G. E. P. and Jenkins, G. M. (1976). Time Series Analysis: Forecasting
and Control, Revised Edition, Holden-Day, San Francisco.

20.
93

ДОДАТОК А ІЛЮСТРАТИВНІ МАТЕРІАЛИ ДЛЯ


ДОПОВІДІ
94
95
96
97
98
99
100
101
102
103
104
105
106
107

You might also like