Professional Documents
Culture Documents
ФОРМУЛАЦИЈА ПРОБЛЕМА
У наредном кораку утврђено је који атрибут има највиши степен корелације са излазом.
Извршено је генерисање недостајућих вредности само за тај атрибут, а потом су
поновљени поступци импутације и класификације. Исто је урађено и за атрибут са
најнижим степеном корелације са излазом. Извршено је поређење добијених резултата и
изведени су закључци.
Садржај рада:
1 Увод...........................................................................................................................
2 Класификација и методе класификације................................................................
2.1 Појам класификације........................................................................................
2.2 Методе класификације......................................................................................
2.2.1 Метода носећих вектора.............................................................................
2.2.2 Бајесове мреже.............................................................................................
2.2.3 Неуронске мреже.........................................................................................
3 Недостајуће вредности и појам импутације података..........................................
3.1 Метода импутације нулом................................................................................
3.2 Метода импутације средњом вредношћу........................................................
3.3 кNN метода........................................................................................................
3.4 LASSO метода...................................................................................................
4 Утицај недостајућих вредности на резултате класификације..............................
4.1 Опис проблема...................................................................................................
4.2 Експеримент......................................................................................................
4.3 Анализа резултата.............................................................................................
5 Закључак....................................................................................................................
6 Литература..........................................................Error: Reference source not found
ОПИС ДЕЛА СВЕТА КОЈИ ЋЕ БИТИ ИЗУЧАВАН
У овом истраживању користе се радови који се односе на машинско учење, а пре свега
на методе класификације попут неуронских мрежа, носећих вектора и Бајесовог
класификатора.
У тексту који следи биће наведена прелиминарна литература која ће бити коришћена у
изради овог рада. Списак ће се вероватно проширити, како буде одмицало истраживање.
Прелиминарна референтна литература се састоји од следећих извора:
[1] Altman, E.I. (1968). Financial ratios, discriminant analysis and the prediction of corporate
bankruptcy. The Journal of Finance, 23(4), 589-609.
[2] Čabarkapa S., Kojić N., Radosavljević, B., & Reljin B. (2008). Jedna implementacija SVM u
CBIR sistemu. 16. telekomunikacioni forum (TELFOR 2008), Beograd, Srbija, 613-616.
[3] Enders, C.K. (2010). Applied missing data analysis. New York: Guilford Press.
[4] Garcia-Laencina, P.J., Sancho-Gomez, J.L., Figueiras-Vidal, A.R., & Verleysen, M. (2009).
K nearest neighbours with mutual information for simultaneous classification and missing
data imputation. Neuro Computing, 72, 1483-1493.
[5] Huang, Z., Chen, H., Hsu, C. J., Chen, W. H., & Wu, S. (2004). Credit rating analysis with
support vector machines and neural networks: a market comparative study. Decision Support
Systems, 37(4), 543-558.
[6] Hagan, M.T., Demuth, H. B., & Beale, M. H. (1996). Neural network design. Boston: PWS
Publishing Co.
[7] Haykin, S. (2009). Neural Networks and Learning Machines. (3rd ed.). New Jersey: Pearson.
[8] Koloseni, D. (2015). Differential evolution based classification with pool of distances and
aggregation operators. Doctoral thesis. Lappeenranta University of Technology,
Lappeenranta.
[9] Larose, D.T. (2014). Discovering Knowledge in Data: an Introduction to Data Mining. New
Jersey: John Wiley & Sons.
[10] Little , R.J.A., & Rubin, D.B. (2002). Statistical Analysis with Missing Data, New York:
John Wiley & Sons.
[11] Little, R.J.A., & Schluchter, M.D. (1985). Maximum likelihood estimation for mixed continuous
and categorical data with missing values. Biometrika, 72(3), 497-512.
[12] Lohr, S.L. (2010). Sampling: Design and Analysis. Boston: Brooks/Cole.
[13] Mitchell T. (1997). Machine Learning. Boston: McGraw Hill.
[14] Papakostas, G.A., Hatzimichailidis, A.G., & Kaburlasos, V.G. (2013). Distance and similarity
measures between intuitionistic fuzzy sets: A comparative analysis from a pattern recognition point of
view. Pattern Recognition Letters, 34(14), 1609-1622.
[15] Suykens, J.A., & Vandewalle, J. (1999). Least squares support vector machine classifiers. Neural
Processing Letters, 9(3), 293-300.
[16] Tibshirani, R. (1996). Regression shrinkage and selection via the lasso. Journal of the Royal
Statistical Society. Series B (Methodological), 267-288.
[17] Zhang, H., & Ling, C.X. (2001). Learnability of augmented Naive Bayes in nominal domains.
Proceedings of the 18th International Conference on Machine Learning, San Francisco, USA, 617-
623.
[18] Zurada M. J. (1992). Introduction to Artificial Neural Systems, New York: West Publishing Co.
СВРХА И ЦИЉЕВИ ИСТРАЖИВАЊА
[1] Enders, C.K. (2010). Applied missing data analysis. New York: Guilford Press.
[2] Haykin, S. (2009). Neural Networks and Learning Machines. (3rd ed.). New Jersey:
Pearson.
[3] Lohr, S.L. (2010). Sampling: Design and Analysis. Boston: Brooks/Cole.
[4] Papakostas, G.A., Hatzimichailidis, A.G., & Kaburlasos, V.G. (2013). Distance and similarity
measures between intuitionistic fuzzy sets: A comparative analysis from a pattern recognition
point of view. Pattern Recognition Letters, 34(14), 1609-1622.
[5] Zhang, H., & Ling, C.X. (2001). Learnability of augmented Naive Bayes in nominal
domains. Proceedings of the 18th International Conference on Machine Learning, San
Francisco, USA, 617-623.