You are on page 1of 11

МЕТОД НА

МЕТОД НА
НАЙ-БЛИЗКИТЕ
НАЙ-БЛИЗКИТЕ
СЪСЕДИ
СЪСЕДИ
DATA MINING
 Data Mining е процес на подбор,
изследване и моделиране на
огромни количества данни, водещи
до откриване на предварително
неизвестни закономерности и
взаимовръзки, с цел получаване на
разбираеми и полезни резултати.
 Задачите, които се решават при
извличането на знания от данни,
най-общо могат да бъдат разделени
на две категории: задачи за
описание и обобщение на данни и
задачи за предсказване
(класификация и регресия).
МЕТОДИ ЗА ИЗВЛИЧАНЕ НА ЗНАНИЯ ОТ ДАННИ ЧРЕЗ
ОБУЧЕНИЕ НА КЛАСИФИКАТОРИ

 Дърво на решенията
 Генератор на покриващи правила
 Метод на най – близък съсед
 Невронни мрежи
МЕТОД НА НАЙ-БЛИЗКИТЕ СЪСЕДИ

kNN е популярен алгоритъм за


машинно обучение, който е
предназначен за решаване на задачи,
свързани с класификация на обекти
или регресия.
kNN спада към тези алгоритми, които
са с контролирано обучение.
В случай на класификация, обектът се причислява към най-
често срещания клас на съседите на този елемент.
ПРИЛАГАНЕ НА МЕТОДА
 Определя се броят К на най-
близките обекти, които ще бъдат
използвани при класификацията;
 Намират се най-близките К на брой
съседни обекти до обекта;
 Поставя се обекта в класа, който
най-често се среща сред най-
близките му K на брой съседи.
ПРЕДИМСТВА
 Лесно разбираеми за потребителите
 Дават възможност за работа с
различни типове данни
 Лесно адаптиране на създадените
модели при добавянето на нови
обекти към изследваната
съвкупност от данни
НЕДОСТАТЪЦИ
 Необходимост от големи
изчислителни ресурси
 Необходимо е по-продължително
време за прилагане на метода
 Необходимо е наличие на много
големи обеми от исторически данни
 Трудности при избор на подходящо
число К
КАЧЕСТВО НА МОДЕЛА
 От какво зависи качеството ?
-броят съседи
- метрика за определяне на
разстояние
 Начини за проверка на качеството

-разделяне на извадката на
обучаваща и тестова
ИЗГОТВИЛ:

Атанас Георгиев Перчемлиев


Фак. № 1808797002

You might also like