You are on page 1of 6

Дисципліна "Кількісні методи в економіці"

Модульна контрольна робота


(Максимальна кількість балів - 5)
Варіант 1

1. Припустимо, що використовується гребенева регресія та помилка навчання і помилка


перевірки майже однакові та доволі великі. Чи можна стверджувати, що модель має високе
зміщення або високу дисперсію? Чи є доцільним збільшення гіперпараметру регуляризації або
необхідне його зменшення? Відповідь обгрунтувати.

2. Як можна оцінити продуктивність алгоритму зниження розмірностей на власному датасеті?

3. Дати характеристику:
1) двом найбільш поширеним задачам машинного навчання із вчителем;
2) чотирьом типам задач, де машинне навчання показує найкращі результати;
3) чотирьом поширеним типам задач машинного навчання без вчителя
4) чотирьом основним проблемам в машинному навчанні

4. Пояснити сутність породжуючих моделей. Визначити тип породжуючого автокодувальника.


Якими є мета та механізм пов'язування ваг в багатошаровому автокодувальнику?

5. Що відбувається, якщо Ваша модель машинного навчання добре працює із навчальними
даними, але погано узагальнюється на нові зразки? Назвіть можливі напрями подолання цієї
проблеми.

Дисципліна "Кількісні методи в економіці"


Модульна контрольна робота
(Максимальна кількість балів - 5)
Варіант 2

1.1.Після того, як розмірність датасету було знижено, чи можна здійснити зворотню операцію
та як саме? Відповідь обгрунтувати.
1.2. В чому полягає принципи динамічного навчання? Що таке зовнішнє навчання?

2. Якщо ансамбль із градієнтним бустінгом перенавчається навчальним датасетом, то


необхідно збільшити чи зменшити швидкість навчання? Відповідь обгрунтувати.

3. В поцедурах навчання на базі дерев рішень засміттєність (загрязненность- рос.) Джині вузла
буде більшою або меншою, ніж у батьківського вузла? Вона звичайно є меншою/більшою або
завжди така? Відповідь обгрунтувати.

4. Чи є сенс поєднувати у ланцюжок два різних алгоритма зниження розмірностей? Відповідь


обгрунтувати.

5. В чому полягає сутність аналізу відповідностей та багатомірного шкалювання? Для


розв'язання яких дослідницьких задач використовуються ці методи?
Дисципліна "Кількісні методи в економіці"
Модульна контрольна робота
(Максимальна кількість балів - 5)
Варіант 3

1. Якими можуть бути напрями застосування мережі RNN типів:


- "послідовність у послідовність";
- "послідовність у вектор";
- "вектор у послідовність"?
2. Сформулювати основні новації AlexNet порівняно із LeNet-5? Якими є основні новації
GoogLeNet та ResNet?

3. Чому доцільнішим є викориистання класифікатора на основі логістичної регресії замість


класичного персептрону? Яким чином можна було б побудувати персептрон (тобто один шар
лінійних порогових елементів, які навчені із використанням алгоритму навчання
персептронів), щоб він був еквівалентом класифікатора на основі логістичної регресії?

4. Якщо дерево прийняття рішень перенавчається навчальним датасетом, то чи вірною буде


ідея зменшення max _ depth? Відповідь обгрунтувати.

5. 1. Які типи алгоритмів навчання при визначенні прогнозів базуються на визначенні
схожості?
5.2. В чому полягає принципова відмінність методів багатомірних класифікацій від
комбінаційних групувань? Дати характеристику основним групам методів кластерного
аналізу, визначити схожість та розбіжності між ними

Дисципліна "Кількісні методи в економіці"


Модульна контрольна робота
(Максимальна кількість балів - 5)
Варіант 4

1. Для розв'язання яких задач машинного навчання використовуються автокодувальники?


Яким чином реалізовується поширений спосіб візуалізації ознак, що "впізнав":
- найнижчий шар багатошарового автокодувальника;
- більш високі шари?
2. Якщо, наприклад, виконується алгоритм РСА на 1000-мірному датасеті із встановленим
коефіцієнтом поясненої дисперсії у 95%, скільки вимірів матиме результуючий датасет?

3. Що відбувається, коли модель добре працює з навчальними даними, але погано
узагальнюється на нові зразки? Якими є три можливих рішення в цьому випадку?

4.1. Модельний інструментарій проектування предикторних просторів. Методи визначення


змінних (предикторів) для включення в багатофакторну модель взаємозалежності.
4.2. Пояснити, в чому різниця між параметрами моделі та гіперпараметрами алгоритму
машинного навчання. Навести приклади.

5. В чому полягає сутність дискримінантного аналізу та його відмінність від інших методів
багатомірної класифікації?
Дисципліна "Кількісні методи в економіці"
Модульна контрольна робота
(Максимальна кількість балів - 5)
Варіант 5

1.1. Якими є гіперпараметри, що можуть бути підлаштовані у багатошаровому персептроні?


1.2. Якщо багатошаровий персептрон перенавчається навчальними даними, то яким чином
можна було б підлаштувати ці гіперпараметри, щоб спробувати усунути проблему?

2. Пояснити призначення зниження розмірностей в задачах машинного навчання. Якими є


основні недоліки зниження розмірностей?

3. В чому полягає сенс використання валідаційного та тестового датасетів?

4. В чому сутність перехресної перевірки при використанні машинного навчання? Чому їй
надається перевага перед перевірочним датасетом?

5. В яких випадках буде доцільним застосування алгоритмів:


- простого алгоритму РСА;
- інкрементного РСА;
- рандомізованого РСА;
- ядерного РСА

Дисципліна "Кількісні методи в економіці"


Модульна контрольна робота
(Максимальна кількість балів - 5)
Варіант 6

1. Дати характеристику основним типам функцій активації.

2. Якщо навчено п'ять різних моделей на однакових навчальних даних і всі вони досягають
точності 95%, чи можна скомбінувати ці моделі, щоб одержати кращі результати? Відповідь
обгрунтувати.

3. Чи можна прискорити навчання, розподіливши його по множині серверів для наступних
видів ансамблів:

1) із беггінгом;
2) із бустінгом;
3) із випадковим лісом;
4) із стекінгом
4. Чому для автоматичного перекладу використовуються мережі RNN типу "кодувальник-
декодувальник", а не прості мережі RNN типу "послідовність у послідовність"?

5. Який алгоритм навчання лінійної регресії можна застосувати, якщо є навчальний датасет із
мільйонами ознак?
Дисципліна "Кількісні методи в економіці"
Модульна контрольна робота
(Максимальна кількість балів - 5)
Варіант 7

1. 4. В яких випадках доцільно використовувати наступні функції активації: ELU, ReLU с
утечкой (и разновидности), ReLU, гиперболічного тангенсу, логистичної та багатозмінної?

2. Що саме надає особливо випадковим деревам (Extra-Trees) більшої випадковості порівняно
із звичайними випадковими лісами? В чому доцільність такої додаткової випадковості?
Особливо випадкові дерева порівняно із звичайними випадковими лісами є більш повільними
або більш швидкими? Відповідь обгрунтувати

3. Якщо автокодувальник ідеально відтворює входи, чи обов'язково він є хорошим


автокодувальником? Як можна оціити продуктивність автокодувальника? В чому сутність
понижуючого автокодувальника та такого, що підвищує? В чому полягає головний ризик цих
двох типів автокодувальників?

4. Якщо навчання дерева прийняття рішень на навчальному наборі, що містить 1 мільйон


спостережень-зразків, займає одну годину, то скільки приблизно часу необхідно для навчання
іншого дерева прийняття рішень на навчальному наборі, що містить 10 мільйонів зразків?

5. Якщо ознаки у навчальному датасеті мають суттєво різні масштаби, які алгоритми можуть
"постраждати" від цього? Якими є шляхи виходу із проблеми?

Дисципліна "Кількісні методи в економіці"


Модульна контрольна робота
(Максимальна кількість балів - 5)
Варіант 8

1. Як можна було б об'єднати згорткову нейромережу із RNN, щоб класифікувати


відеоролики?

2. За яких міркувань Ви вважаєте необхідним застосовувати:


- гребеневу регресію замість звичайної лінійної регресії (тобто без будь-якої
регуляризації)
- лассо-регресію замість гребеневої регресії
- еластичну мережу замість лассо-регресії
3. Як можна пояснити ситуацію, коли при використанні пакетного градієнтного спуску
фіксується помилка перевірки на кожній епосі та відбувається послідовне зростання помилки?
Як можна виправити таку ситуацію?

4. Якщо розв'язується задача навчання класифікатора, для якої є надто багато непомічених
навчальних зразків, чим можуть допомогти автокодувальники? Якими є мета та механізм
пов'язування ваг в багатошаровому автокодувальнику?

5. Провести порівняльний аналіз підходів, моделей та методів ризикології, теорії прийняття


рішень та Data Science з точки зору 1) проблематики; 2) рівня структурованості проблем, що
розв'язуються; 3) необхідної інформаційної бази; 4) математичних методів; 5) результатів
моделювання способів надання результатів замовнику.
Дисципліна "Кількісні методи в економіці"
Модульна контрольна робота
(Максимальна кількість балів - 5)
Варіант 9

1.1. Пояснити відмінності між класифікаторами із жорстким та м'яким голосуванням.


1.2. Яку форму задачі SVM – пряму чи двоїсту – необхідно використовувати для навчання
моделі на навчальному наборі даних із мільйонами спостережень-зразків та сотнями ознак?

2. Якщо дерево прийняття рішень недонавчається на навчальному датасеті, то чи вірним буде


масштабування вхідних ознак? Відповідь обгрунтувати.

3. Чи можна прискорити навчання ансамблю з беггінгом, якщо розподілити його по множині


серверів? Чим буде відрізнятись ситуація із ансамблями зі вставкою, ансамблем із бустінгом,
випадкових лісів або ансамблів зі стекінгом?

4. В яких випадках доцільно використовувати наступні функції активації: ELU, ReLU с
утечкой (и разновидности), ReLU, гиперболічного тангенсу, логистичної та багатозмінної?

5. Чи ефективною є ідея негайно зупиняти міні-пакетний градієнтний спуск, коли помилка
перевірки зростає?

Дисципліна "Кількісні методи в економіці"


Модульна контрольна робота
(Максимальна кількість балів - 5)
Варіант 10

1. Чому логістична функція активації є ключовим інгредієнтом при навчанні перших


багатошарових персептронів?

2. Якщо ансамбль AdaBoost недонавчається на навчальних даних, то які гіперпараметри


необхідно підлаштувати та як саме?

3.  Що означає термін "загальний фактор"? Які переваги одержує дослідник при переході від
аналізу ознак до аналізу загальних факторів? Як визначити достатню кількість факторів для
характеристики досліджуваного явища або процесу?

4. Припустимо, що використовується поліноміальна регресія, при візуалізації кривих навчання


спостерігається великий проміжок між помилкою навчання та помилкою перевірки. Пояснити,
що відбувається в даній ситуації. Якими є способи подолання проблеми?

5. Яку кількість нейронів у вихідному шарі необхідно застосувати для класифікації поштових
повідомлень на спам та не спам? Яку функцію активації необхідно застосувати у вихідному
шарі? Скільки знадобиться нейронів у вихідному шарі та яка функція активації
використовуватимуться для датасету MNIST? А для прогнозування цін на будинки?
Дисципліна "Кількісні методи в економіці"
Модульна контрольна робота
(Максимальна кількість балів - 5)
Варіант 11

1.1. Якою приблизно буде глибина дерева прийняття рішень, яке навчене (без обмежень) на
навчальному наборі з 1 мільйоном спостережень-зразків?
1.2. Пояснити, в чому різниця між параметрами моделі та гіперпараметрами алгоритму
машинного навчання. Навести приклади.

2. Якщо ансамбль AdaBoost недонавчається на навчальних даних, то які гіперпараметри


необхідно підлаштовувати та яким чином?

3. Якщо автокодувальник ідеально відтворює входи, чи обов'язково він є хорошим


автокодувальником? Як можна оціити продуктивність автокодувальника? В чому сутність
понижуючого автокодувальника та такого, що підвищує? В чому полягає головний ризик цих
двох типів автокодувальників?

4. Припустимо, Ви використвуєте пакетний градієнтний спуск та визначаєте помилку


перевірки на кожній епосі. Якщо Ви побачите, що помилка перевірки послідовно зростає, то
що, скоріш за все відбувається? Як це можна виправити? Чи прийнятною є ідея негайно
зупинити міні-пакетний градієнтний спуск, якщо помилка перевірки зростає?

5. Припустимо, що Ви використовуєте гребеневу регресію та помітили, що помилка навчання


та помилка перевірки майже однакові та доволі високі. Чи можна стверджувати, що модель
страждає від високого зміщення чи високої дисперсії? Чи повинні Ви збільшувати
гіперпараметр регуляризації  чи зменшувати його?

You might also like