Professional Documents
Culture Documents
МАН 2
МАН 2
РОБОТУ ВИКОНАВ:
Макаренко Максим Олегович
дата народження: 11.04.2006 р.
учень 9 класу
Технічного ліцею міста Києва
Домашня адреса: Київ,
Дарницький бульвар, 10 а
Контактний телефон: +380973701192
Педагогічний керівник:
Рибак Ольга Стефанівна,
Технічний ліцей міста Києва,
вчитель інформатики
вищої кваліфікаційної категорії,
вчитель методист,
роб. телефон 044-221-13-97
Науковий керівник
Дем’яненко Валентина Борисівна,
Кандидат педагогічних наук,
Відділ інформаційно-дидактичного
моделювання, Завідувач відділу,
Національний центр «Мала академія наук
України»
КИЇВ – 2021
Київське територіальне відділення Малої академії наук України
(Київська Мала академія наук)
Анотація
ВСТУП..............................................................................................................................5
ВСТУП
Актуальність: Відомі методи оптимізації навчання штучних нейронних мереж не
забезпечують одночасно високу якість та швидкість тренування. Тому пошук
нових методів оптимізації навчання нейронних мереж є актуальною та
перспективною задачею.
Мета: проаналізувати залежність між параметрами нейронних мереж та їх
оптимізаційними показниками. Змоделювати залежність між параметрами
нейронних мереж та їх оптимізаційними показниками. Розробити алгоритм
автоматизації навчання нейронних мереж.
Об’єкт дослідження: методи навчання нейронних мереж.
Предмет дослідження: оптимізація навчання нейронних мереж.
Для досягнення мети необхідно виконати низку завдань:
1. Узагальнити актуальні наукові напрацювання за темою;
2. Створити програмне забезпечення для збору статистичної інформації про
навчання та роботу нейронних мереж:
зібрати статистичний матеріал про залежність часу навчання від класу
оптимізатора;
зібрати статистичний матеріал про залежність втрат нейронної мережі
від класу оптимізатора та функції втрат;
зібрати статистичний матеріал про залежність часу навчання та втрат
нейронної мережі від розміру навчальної вибірки;
зібрати статистичний матеріал про залежність часу навчання та втрат
нейронної мережі від архітектурних характеристик нейронної мережі.
3. Проаналізувати отримані дані: візуальний аналіз, описовий аналіз,
факторний аналіз, аналіз розподілення, регресійний аналіз;
4. Створити програмне забезпечення для збору статистичної інформації про
навчання та роботу нейронних мереж, створених на основі випадкових
характеристи;
6
5. Проаналізувати отримані дані: візуальний аналіз, описовий аналіз,
факторний аналіз, аналіз розподілення, регресійний аналіз;
6. Змоделювати залежність між характеристиками нейронних мереж та їх
оптимізаційними показниками;
7. Розробити алгоритм автоматизації навчання нейронних мереж.
7
РОЗДІЛ 1
ТЕОРЕТИЧНІ ЗАСАДИ ДОСЛІДЖЕННЯ
1.1.Поняття нейронних мереж
Рис. 1.1
Рис. 1.2
Модель персептрона.
Рис. 1.3
Багатошаровий персептрон
Рис. 1.4
Згорткова нейронна мережа.
Прошарок Опис
Рис. 1.5
Модель LeNet-5
Рис. 1.6
Принцип робот згорткового ядра.
Рис. 1.7
Рекурентна нейронна мережа
Рис. 1.8
Градієнтний спуск
14
1.5.2. Backpropagation
n
v j=φ ( net j )=φ
( ∑ ω kj ⋅v k
k=1
)
Формула (1.1)
Формула (1.2)
Рис. 1.9
Алгоритм Backpropagation
1.5.3. Критерій якості та функція втрат
n
LС (log cosh)¿ ∑ ¿ ¿;
i=1
∑ ( y i ⋅ ^yi )
i=1
CS (cosine similarity) ¿ n n .
√∑ √∑
i=1
2
y ⋅
i
i=1
^y 2
i
Висновки до розділу 1
РОЗДІЛ 2
АНАЛІЗ ОТРИМАНИХ РЕЗУЛЬТАТІВ
Під час дослідження було розроблено ряд алгоритмів для збирання, обробки
та візуалізації статистичних даних про навчання нейронних мереж. В дослідженні
розглядалися повнозвя’зні нейронні мережі прямого поширення (MLP) для
вирішення задач регресії, вид навчання – зі вчителем.
Рис. 2.1
Рис. 2.2
18
Було проаналізовано залежність між класом оптимізатора, функцією втрат,
класом активатора та втратами нейронних мереж (метрика MAPE). Результати
аналізу наведено на рисунках 2.3, 2,4, 2.5. Дані про конфігурацію опрацьованих
нейронних мереж та результати первинного описового аналізу подано в додатку
B.
Рис. 2.3
Рис. 2.4
19
Рис. 2.5
Рис. 2.6
20
Рис. 2.7
21
2.3. Залежність між архітектурними характеристиками, втратами та
часом навчання
Рис. 2.8
Рис. 2.9
22
Рис. 2.10
Рис. 2.11
Рис. 2.12
23
Рис. 2.13
Рис. 2.14
Рис. 2.15
24
Було проведено комбінований візуальний аналіз даних. Результати аналізу
демонструються на рисунках 2.16 - 2.21;
Рис. 2.16
Рис. 2.17
Рис. 2.18
25
Рис. 2.19
Рис. 2.20
Рис. 2.21
26
2.6. Рівневий. Факторний та візуальний аналіз
Рис. 2.22
Рис. 2.23
Рис. 2.24
Рис. 2.25
Рис. 2.26
Рис. 2.27
Рис. 2.28
Висновки до розділу 2
Було проведено ґрунтовний аналіз отриманих під час дослідження даних про
функціонування та навчання нейронних мереж. Отримані висновки було
опрацьовано та узагальнено. На основі проведеного дослідження було виведено
численні рівняння регресії, які детально моделюють залежність між усіма
характеристиками та оптимізаційними показниками нейронних мереж.
30
РОЗДІЛ 3
ОГЛЯД ВИКОРИСТАНИХ РІШЕНЬ
3.1. Використані мови програмування та середовища розробки
Висновки до розділу 3
ВИСНОВКИ
Одним з провідних напрямків досліджень у галузі штучного інтелекту є
машинне навчання, синтез та моделювання штучних нейронних елементів (НЕ) та
нейромереж, розроблення методів їх навчання та оптимізації, вдосконалення
нейромережевих технологій обробки та аналізу даних, створення прикладних
систем на основі нейронних мереж.
Додаток A
}
36
Додаток B
Додаток C
Додаток D
{
"running time": 333.301064491272,
"optimizer": "Adam",
"loss function": "mae",
"activator": "linear",
"sample size": "30 obs, validation split = 0.25, training part = 22 obs",
"epochs num": 100,
"layers num": "1-20",
"neurons num": "1-2000",
"metrics": "mean_absolute_percentage_error (validation sample)"
ftime ( s )=−1.23+1.07 ⋅ nn