Professional Documents
Culture Documents
Кількісні методи в економіці Модуль
Кількісні методи в економіці Модуль
3. Дати характеристику:
1) двом найбільш поширеним задачам машинного навчання із вчителем;
2) чотирьом типам задач, де машинне навчання показує найкращі результати;
3) чотирьом поширеним типам задач машинного навчання без вчителя
4) чотирьом основним проблемам в машинному навчанні
5. Що відбувається, якщо Ваша модель машинного навчання добре працює із навчальними
даними, але погано узагальнюється на нові зразки? Назвіть можливі напрями подолання цієї
проблеми.
1.1.Після того, як розмірність датасету було знижено, чи можна здійснити зворотню операцію
та як саме? Відповідь обгрунтувати.
1.2. В чому полягає принципи динамічного навчання? Що таке зовнішнє навчання?
3. В поцедурах навчання на базі дерев рішень засміттєність (загрязненность- рос.) Джині вузла
буде більшою або меншою, ніж у батьківського вузла? Вона звичайно є меншою/більшою або
завжди така? Відповідь обгрунтувати.
5. 1. Які типи алгоритмів навчання при визначенні прогнозів базуються на визначенні
схожості?
5.2. В чому полягає принципова відмінність методів багатомірних класифікацій від
комбінаційних групувань? Дати характеристику основним групам методів кластерного
аналізу, визначити схожість та розбіжності між ними
3. Що відбувається, коли модель добре працює з навчальними даними, але погано
узагальнюється на нові зразки? Якими є три можливих рішення в цьому випадку?
5. В чому полягає сутність дискримінантного аналізу та його відмінність від інших методів
багатомірної класифікації?
Дисципліна "Кількісні методи в економіці"
Модульна контрольна робота
(Максимальна кількість балів - 5)
Варіант 5
4. В чому сутність перехресної перевірки при використанні машинного навчання? Чому їй
надається перевага перед перевірочним датасетом?
2. Якщо навчено п'ять різних моделей на однакових навчальних даних і всі вони досягають
точності 95%, чи можна скомбінувати ці моделі, щоб одержати кращі результати? Відповідь
обгрунтувати.
3. Чи можна прискорити навчання, розподіливши його по множині серверів для наступних
видів ансамблів:
1) із беггінгом;
2) із бустінгом;
3) із випадковим лісом;
4) із стекінгом
4. Чому для автоматичного перекладу використовуються мережі RNN типу "кодувальник-
декодувальник", а не прості мережі RNN типу "послідовність у послідовність"?
5. Який алгоритм навчання лінійної регресії можна застосувати, якщо є навчальний датасет із
мільйонами ознак?
Дисципліна "Кількісні методи в економіці"
Модульна контрольна робота
(Максимальна кількість балів - 5)
Варіант 7
1. 4. В яких випадках доцільно використовувати наступні функції активації: ELU, ReLU с
утечкой (и разновидности), ReLU, гиперболічного тангенсу, логистичної та багатозмінної?
2. Що саме надає особливо випадковим деревам (Extra-Trees) більшої випадковості порівняно
із звичайними випадковими лісами? В чому доцільність такої додаткової випадковості?
Особливо випадкові дерева порівняно із звичайними випадковими лісами є більш повільними
або більш швидкими? Відповідь обгрунтувати
5. Якщо ознаки у навчальному датасеті мають суттєво різні масштаби, які алгоритми можуть
"постраждати" від цього? Якими є шляхи виходу із проблеми?
4. Якщо розв'язується задача навчання класифікатора, для якої є надто багато непомічених
навчальних зразків, чим можуть допомогти автокодувальники? Якими є мета та механізм
пов'язування ваг в багатошаровому автокодувальнику?
4. В яких випадках доцільно використовувати наступні функції активації: ELU, ReLU с
утечкой (и разновидности), ReLU, гиперболічного тангенсу, логистичної та багатозмінної?
5. Чи ефективною є ідея негайно зупиняти міні-пакетний градієнтний спуск, коли помилка
перевірки зростає?
3. Що означає термін "загальний фактор"? Які переваги одержує дослідник при переході від
аналізу ознак до аналізу загальних факторів? Як визначити достатню кількість факторів для
характеристики досліджуваного явища або процесу?
5. Яку кількість нейронів у вихідному шарі необхідно застосувати для класифікації поштових
повідомлень на спам та не спам? Яку функцію активації необхідно застосувати у вихідному
шарі? Скільки знадобиться нейронів у вихідному шарі та яка функція активації
використовуватимуться для датасету MNIST? А для прогнозування цін на будинки?
Дисципліна "Кількісні методи в економіці"
Модульна контрольна робота
(Максимальна кількість балів - 5)
Варіант 11
1.1. Якою приблизно буде глибина дерева прийняття рішень, яке навчене (без обмежень) на
навчальному наборі з 1 мільйоном спостережень-зразків?
1.2. Пояснити, в чому різниця між параметрами моделі та гіперпараметрами алгоритму
машинного навчання. Навести приклади.