You are on page 1of 4

https://proglib.

io/p/ml-projects/

ТЕМИ КУРСОВИХ РОБIТ

1. Прогноз руху цін на фінансовому ринку.


Кількісне інвестування - спрогнозуйте рух ціни протягом 6 місяців,
грунтуючись на фундаментальних показниках в щоквартальних звітах
компаній.
2. Прогнозування часових рядів на фінансовому ринку.
3. Класифікація повідомлень.
Аналіз тексту повідомлень (за ступенем важливості, метою і ін.)
4. Соціальний аналіз мережі співробітників.
Створіть мережу співробітників і за допомогою аналізу повідомлень
знайдіть ключових впливових осіб.
5. Виявлення аномалій в листуванні.
Проаналізуйте вхідні та відправлені повідомлення за часом і
спробуйте виявити аномальну поведінку, яка призвела до суспільного
конфлікту.
6. Прогнозування захворювань.
Профілактична допомога – прогнозування захворювань як на
індивідуальному, так і на загальному рівні.
7. Автоматична класифікація зображень.
Діагностична допомога - автоматична класифікація зображень,
наприклад, скани, рентген…
8. Визначення страхових внесків на основі загальнодоступних
факторів ризику.
9. Аналіз даних соціальних мереж.
10. Створення нейромережі для розпізнавання рукописного тексту.
Пояснення до тем:
Теми 1-3 пов’язанi з фiнансовими ринками.
Джерела даних:
https://www.quandl.com/search - надає безкоштовні (і преміум) фінансові
та економічні дані. Наприклад, ви можете завантажити ціни на кінець дня для
більше 3000 американських компаній або економічні дані з Федерального
резерву.
http://www.usfundamentals.com/download/ - 5000+ американських
компаній за останній 5 років.

Теми 4-5 пов'язані з дослідженням компанії Enron


Скандал Enron https://www.investopedia.com/updates/enron-scandal-
summary/ був найбільшою корпоративною кризою в історії.
У 2000 Enron була однією з найбільших енергетичних компаній в
Америці. Потім, коли компанію викрили в шахрайських махінаціях, вона
збанкрутувала протягом року.
Існують дані e-mail листування колишніх співробітників Enron. Це 500
тисяч електронних листів між 150 колишніми співробітниками, в основному,
старшими керівниками. Це також єдина найбільша публічна база даних
електронних листів, що робить її ще більш цінною.
Фактично, Data Scientist використовують цей набір даних вже багато
років для проектів з машинного навчання.
Джерела даних:
http://deeplearning.net/datasets/ - База даних E-mail
http://citeseerx.ist.psu.edu/viewdoc/download?
doi=10.1.1.296.9477&rep=rep1&type=pdf - Опис бази даних (PDF)

Теми 6-8:
Пов'язані з охороною здоров’я.
У багатьох країнах для того, щоб стати доктором, необхідно витратити
багато років на навчання. Поріг входження в цю сферу досить великий, а
процес становлення лікарем дуже складний.
В результаті останнім часом робляться значні зусилля для полегшення
робочого навантаження лікарів і підвищення загальної ефективності системи
охорони здоров'я за допомогою машинного навчання.
Матерiал:
 Машинне навчання в охороні здоров'я від Microsoft -
https://www.youtube.com/watch?v=XQsHPuXKmO4
Джерела даних:
 Збірник даних, пов'язаних з охороною здоров'я -
https://www.ehdp.com/links/datasets.htm
 Ще один збірник даних, наданий урядом США -
https://www.data.gov/health/
 Health Nutrition and Population Statistics - статистика здоров'я та
населення, надана Світовим банком - https://data.worldbank.org/data-
catalog/health-nutrition-and-population-statistics

Тема 9:
Пов'язана з аналiзом соцiальних медiа.
Матерiал:
 Python: аналіз даних Twitter - https://proglib.io/p/ml-projects/
Джерела даних:
 Twitter API - https://developer.twitter.com/en/docs
 StockTwitsAPI. StockTwits – це як твіттер для трейдерів та інвесторів.
Ви можете використовувати цей набір даних різними способами. -
https://api.stocktwits.com/developers/docs

Тема 10.
MNIST Handwritten Digit Classification Challenge - стандартна точка
входу. З зображеннями працювати набагато складніше, ніж з реляційними
моделями даних. MNIST дані доброзичливі по відношенню до новачків і
мають невеликі розміри, так що з легкістю помістяться на одному
комп'ютері.
Матерiал: http://neuralnetworksanddeeplearning.com/chap1.html -
створення нейромережi на Python з нуля, яка буде розпізнавати письмовий
текст з великою точністю
Джерело даних - http://yann.lecun.com/exdb/mnist/

You might also like