Кількісні методи в економіці Модуль

Дисципліна "Кількісні методи в економіці"
Модульна контрольна робота

(Максимальна кількість балів - 5)
Варіант 1
1. Припустимо, що використовується гребенева регресія та помилка навчання і помилка

перевірки майже однакові та доволі великі. Чи можна стверджувати, що модель має високе
зміщення або високу дисперсію? Чи є доцільним збільшення гіперпараметру регуляризації або
необхідне його зменшення? Відповідь обгрунтувати.
2. Як можна оцінити продуктивність алгоритму зниження розмірностей на власному датасеті?
3. Дати характеристику:
1) двом найбільш поширеним задачам машинного навчання із вчителем;
2) чотирьом типам задач, де машинне навчання показує найкращі результати;
3) чотирьом поширеним типам задач машинного навчання без вчителя
4) чотирьом основним проблемам в машинному навчанні
4. Пояснити сутність породжуючих моделей. Визначити тип породжуючого автокодувальника.

Якими є мета та механізм пов'язування ваг в багатошаровому автокодувальнику?
5. Що відбувається, якщо Ваша модель машинного навчання добре працює із навчальними
даними, але погано узагальнюється на нові зразки? Назвіть можливі напрями подолання цієї
проблеми.

Варіант 2
1.1.Після того, як розмірність датасету було знижено, чи можна здійснити зворотню операцію
та як саме? Відповідь обгрунтувати.
1.2. В чому полягає принципи динамічного навчання? Що таке зовнішнє навчання?
2. Якщо ансамбль із градієнтним бустінгом перенавчається навчальним датасетом, то

необхідно збільшити чи зменшити швидкість навчання? Відповідь обгрунтувати.
3. В поцедурах навчання на базі дерев рішень засміттєність (загрязненность- рос.) Джині вузла
буде більшою або меншою, ніж у батьківського вузла? Вона звичайно є меншою/більшою або
завжди така? Відповідь обгрунтувати.
4. Чи є сенс поєднувати у ланцюжок два різних алгоритма зниження розмірностей? Відповідь

обгрунтувати.
5. В чому полягає сутність аналізу відповідностей та багатомірного шкалювання? Для

розв'язання яких дослідницьких задач використовуються ці методи?
Варіант 3
1. Якими можуть бути напрями застосування мережі RNN типів:

- "послідовність у послідовність";
- "послідовність у вектор";
- "вектор у послідовність"?
2. Сформулювати основні новації AlexNet порівняно із LeNet-5? Якими є основні новації
GoogLeNet та ResNet?
3. Чому доцільнішим є викориистання класифікатора на основі логістичної регресії замість

класичного персептрону? Яким чином можна було б побудувати персептрон (тобто один шар
лінійних порогових елементів, які навчені із використанням алгоритму навчання
персептронів), щоб він був еквівалентом класифікатора на основі логістичної регресії?
4. Якщо дерево прийняття рішень перенавчається навчальним датасетом, то чи вірною буде

ідея зменшення max _ depth? Відповідь обгрунтувати.
5. 1. Які типи алгоритмів навчання при визначенні прогнозів базуються на визначенні
схожості?
5.2. В чому полягає принципова відмінність методів багатомірних класифікацій від
комбінаційних групувань? Дати характеристику основним групам методів кластерного
аналізу, визначити схожість та розбіжності між ними

Варіант 4
1. Для розв'язання яких задач машинного навчання використовуються автокодувальники?

Яким чином реалізовується поширений спосіб візуалізації ознак, що "впізнав":
- найнижчий шар багатошарового автокодувальника;
- більш високі шари?
2. Якщо, наприклад, виконується алгоритм РСА на 1000-мірному датасеті із встановленим
коефіцієнтом поясненої дисперсії у 95%, скільки вимірів матиме результуючий датасет?
3. Що відбувається, коли модель добре працює з навчальними даними, але погано
узагальнюється на нові зразки? Якими є три можливих рішення в цьому випадку?
4.1. Модельний інструментарій проектування предикторних просторів. Методи визначення

змінних (предикторів) для включення в багатофакторну модель взаємозалежності.
4.2. Пояснити, в чому різниця між параметрами моделі та гіперпараметрами алгоритму
машинного навчання. Навести приклади.
5. В чому полягає сутність дискримінантного аналізу та його відмінність від інших методів
багатомірної класифікації?
Варіант 5
1.1. Якими є гіперпараметри, що можуть бути підлаштовані у багатошаровому персептроні?

1.2. Якщо багатошаровий персептрон перенавчається навчальними даними, то яким чином
можна було б підлаштувати ці гіперпараметри, щоб спробувати усунути проблему?
2. Пояснити призначення зниження розмірностей в задачах машинного навчання. Якими є

основні недоліки зниження розмірностей?
3. В чому полягає сенс використання валідаційного та тестового датасетів?
4. В чому сутність перехресної перевірки при використанні машинного навчання? Чому їй
надається перевага перед перевірочним датасетом?
5. В яких випадках буде доцільним застосування алгоритмів:

- простого алгоритму РСА;
- інкрементного РСА;
- рандомізованого РСА;
- ядерного РСА

Варіант 6
1. Дати характеристику основним типам функцій активації.
2. Якщо навчено п'ять різних моделей на однакових навчальних даних і всі вони досягають
точності 95%, чи можна скомбінувати ці моделі, щоб одержати кращі результати? Відповідь
обгрунтувати.
3. Чи можна прискорити навчання, розподіливши його по множині серверів для наступних
видів ансамблів:
1) із беггінгом;
2) із бустінгом;
3) із випадковим лісом;
4) із стекінгом
4. Чому для автоматичного перекладу використовуються мережі RNN типу "кодувальник-
декодувальник", а не прості мережі RNN типу "послідовність у послідовність"?
5. Який алгоритм навчання лінійної регресії можна застосувати, якщо є навчальний датасет із
мільйонами ознак?
Варіант 7
1. 4. В яких випадках доцільно використовувати наступні функції активації: ELU, ReLU с
утечкой (и разновидности), ReLU, гиперболічного тангенсу, логистичної та багатозмінної?
2. Що саме надає особливо випадковим деревам (Extra-Trees) більшої випадковості порівняно
із звичайними випадковими лісами? В чому доцільність такої додаткової випадковості?
Особливо випадкові дерева порівняно із звичайними випадковими лісами є більш повільними
або більш швидкими? Відповідь обгрунтувати
3. Якщо автокодувальник ідеально відтворює входи, чи обов'язково він є хорошим

автокодувальником? Як можна оціити продуктивність автокодувальника? В чому сутність
понижуючого автокодувальника та такого, що підвищує? В чому полягає головний ризик цих
двох типів автокодувальників?
4. Якщо навчання дерева прийняття рішень на навчальному наборі, що містить 1 мільйон

спостережень-зразків, займає одну годину, то скільки приблизно часу необхідно для навчання
іншого дерева прийняття рішень на навчальному наборі, що містить 10 мільйонів зразків?
5. Якщо ознаки у навчальному датасеті мають суттєво різні масштаби, які алгоритми можуть
"постраждати" від цього? Якими є шляхи виходу із проблеми?

Варіант 8
1. Як можна було б об'єднати згорткову нейромережу із RNN, щоб класифікувати

відеоролики?
2. За яких міркувань Ви вважаєте необхідним застосовувати:

- гребеневу регресію замість звичайної лінійної регресії (тобто без будь-якої
регуляризації)
- лассо-регресію замість гребеневої регресії
- еластичну мережу замість лассо-регресії
3. Як можна пояснити ситуацію, коли при використанні пакетного градієнтного спуску
фіксується помилка перевірки на кожній епосі та відбувається послідовне зростання помилки?
Як можна виправити таку ситуацію?
4. Якщо розв'язується задача навчання класифікатора, для якої є надто багато непомічених
навчальних зразків, чим можуть допомогти автокодувальники? Якими є мета та механізм
пов'язування ваг в багатошаровому автокодувальнику?
5. Провести порівняльний аналіз підходів, моделей та методів ризикології, теорії прийняття

рішень та Data Science з точки зору 1) проблематики; 2) рівня структурованості проблем, що
розв'язуються; 3) необхідної інформаційної бази; 4) математичних методів; 5) результатів
моделювання способів надання результатів замовнику.
Варіант 9
1.1. Пояснити відмінності між класифікаторами із жорстким та м'яким голосуванням.

1.2. Яку форму задачі SVM – пряму чи двоїсту – необхідно використовувати для навчання
моделі на навчальному наборі даних із мільйонами спостережень-зразків та сотнями ознак?
2. Якщо дерево прийняття рішень недонавчається на навчальному датасеті, то чи вірним буде

масштабування вхідних ознак? Відповідь обгрунтувати.
3. Чи можна прискорити навчання ансамблю з беггінгом, якщо розподілити його по множині

серверів? Чим буде відрізнятись ситуація із ансамблями зі вставкою, ансамблем із бустінгом,
випадкових лісів або ансамблів зі стекінгом?
4. В яких випадках доцільно використовувати наступні функції активації: ELU, ReLU с
утечкой (и разновидности), ReLU, гиперболічного тангенсу, логистичної та багатозмінної?
5. Чи ефективною є ідея негайно зупиняти міні-пакетний градієнтний спуск, коли помилка
перевірки зростає?

Варіант 10
1. Чому логістична функція активації є ключовим інгредієнтом при навчанні перших

багатошарових персептронів?
2. Якщо ансамбль AdaBoost недонавчається на навчальних даних, то які гіперпараметри

необхідно підлаштувати та як саме?
3. Що означає термін "загальний фактор"? Які переваги одержує дослідник при переході від
аналізу ознак до аналізу загальних факторів? Як визначити достатню кількість факторів для
характеристики досліджуваного явища або процесу?
4. Припустимо, що використовується поліноміальна регресія, при візуалізації кривих навчання

спостерігається великий проміжок між помилкою навчання та помилкою перевірки. Пояснити,
що відбувається в даній ситуації. Якими є способи подолання проблеми?
5. Яку кількість нейронів у вихідному шарі необхідно застосувати для класифікації поштових
повідомлень на спам та не спам? Яку функцію активації необхідно застосувати у вихідному
шарі? Скільки знадобиться нейронів у вихідному шарі та яка функція активації
використовуватимуться для датасету MNIST? А для прогнозування цін на будинки?
Варіант 11
1.1. Якою приблизно буде глибина дерева прийняття рішень, яке навчене (без обмежень) на
навчальному наборі з 1 мільйоном спостережень-зразків?
1.2. Пояснити, в чому різниця між параметрами моделі та гіперпараметрами алгоритму
машинного навчання. Навести приклади.
2. Якщо ансамбль AdaBoost недонавчається на навчальних даних, то які гіперпараметри

необхідно підлаштовувати та яким чином?
3. Якщо автокодувальник ідеально відтворює входи, чи обов'язково він є хорошим

автокодувальником? Як можна оціити продуктивність автокодувальника? В чому сутність
понижуючого автокодувальника та такого, що підвищує? В чому полягає головний ризик цих
двох типів автокодувальників?
4. Припустимо, Ви використвуєте пакетний градієнтний спуск та визначаєте помилку

перевірки на кожній епосі. Якщо Ви побачите, що помилка перевірки послідовно зростає, то
що, скоріш за все відбувається? Як це можна виправити? Чи прийнятною є ідея негайно
зупинити міні-пакетний градієнтний спуск, якщо помилка перевірки зростає?
5. Припустимо, що Ви використовуєте гребеневу регресію та помітили, що помилка навчання

та помилка перевірки майже однакові та доволі високі. Чи можна стверджувати, що модель
страждає від високого зміщення чи високої дисперсії? Чи повинні Ви збільшувати
гіперпараметр регуляризації  чи зменшувати його?

Кількісні методи в економіці Модуль

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Кількісні методи в економіці Модуль

Uploaded by

Copyright:

Available Formats

Дисципліна "Кількісні методи в економіці"

Модульна контрольна робота

1. Припустимо, що використовується гребенева регресія та помилка навчання і помилка

2. Як можна оцінити продуктивність алгоритму зниження розмірностей на власному датасеті?

4. Пояснити сутність породжуючих моделей. Визначити тип породжуючого автокодувальника.

Дисципліна "Кількісні методи в економіці"

2. Якщо ансамбль із градієнтним бустінгом перенавчається навчальним датасетом, то

4. Чи є сенс поєднувати у ланцюжок два різних алгоритма зниження розмірностей? Відповідь

5. В чому полягає сутність аналізу відповідностей та багатомірного шкалювання? Для

1. Якими можуть бути напрями застосування мережі RNN типів:

3. Чому доцільнішим є викориистання класифікатора на основі логістичної регресії замість

4. Якщо дерево прийняття рішень перенавчається навчальним датасетом, то чи вірною буде

Дисципліна "Кількісні методи в економіці"

1. Для розв'язання яких задач машинного навчання використовуються автокодувальники?

4.1. Модельний інструментарій проектування предикторних просторів. Методи визначення

1.1. Якими є гіперпараметри, що можуть бути підлаштовані у багатошаровому персептроні?

2. Пояснити призначення зниження розмірностей в задачах машинного навчання. Якими є

3. В чому полягає сенс використання валідаційного та тестового датасетів?

5. В яких випадках буде доцільним застосування алгоритмів:

Дисципліна "Кількісні методи в економіці"

1. Дати характеристику основним типам функцій активації.

3. Якщо автокодувальник ідеально відтворює входи, чи обов'язково він є хорошим

4. Якщо навчання дерева прийняття рішень на навчальному наборі, що містить 1 мільйон

Дисципліна "Кількісні методи в економіці"

1. Як можна було б об'єднати згорткову нейромережу із RNN, щоб класифікувати

2. За яких міркувань Ви вважаєте необхідним застосовувати:

5. Провести порівняльний аналіз підходів, моделей та методів ризикології, теорії прийняття

1.1. Пояснити відмінності між класифікаторами із жорстким та м'яким голосуванням.

2. Якщо дерево прийняття рішень недонавчається на навчальному датасеті, то чи вірним буде

3. Чи можна прискорити навчання ансамблю з беггінгом, якщо розподілити його по множині

Дисципліна "Кількісні методи в економіці"

1. Чому логістична функція активації є ключовим інгредієнтом при навчанні перших

2. Якщо ансамбль AdaBoost недонавчається на навчальних даних, то які гіперпараметри

4. Припустимо, що використовується поліноміальна регресія, при візуалізації кривих навчання

2. Якщо ансамбль AdaBoost недонавчається на навчальних даних, то які гіперпараметри

3. Якщо автокодувальник ідеально відтворює входи, чи обов'язково він є хорошим

4. Припустимо, Ви використвуєте пакетний градієнтний спуск та визначаєте помилку

5. Припустимо, що Ви використовуєте гребеневу регресію та помітили, що помилка навчання

You might also like