Welcome to Scribd!

AL and ML Assessment Week 11

Uploaded by

kiruthikavellaichamy2001

0% found this document useful (0 votes)

3 views2 pages

K-means clustering is an unsupervised machine learning algorithm that partitions data into K clusters by minimizing the distance between data points and the assigned cluster center. It works by iteratively assigning each data point to its nearest cluster center and recalculating cluster centers as the mean of points within the cluster until convergence. There are different types of k-means clustering including hard k-means, fuzzy k-means, and k-medoids. It is widely used for applications such as image segmentation, customer segmentation, anomaly detection, and document clustering.

Original Description:

Original Title

AL and ML Assessment week 11

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

3 views2 pages

AL and ML Assessment Week 11

Uploaded by

kiruthikavellaichamy2001

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 2

Search inside document

Assessment 11

Artificial Intelligence and Machine Learning

Question 1:
K-Means Clustering:

Introduction
K-Means clustering is a popular unsupervised machine learning algorithm used for
partitioning a dataset into K distinct, non-overlapping subsets or clusters. The goal is
to group similar data points together and assign them to clusters, making it a useful
technique for exploratory data analysis and pattern discovery.

Basic Idea:
The algorithm works iteratively to assign each data point to one of K clusters based on
features' similarity. The mean (centroid) of the points in each cluster becomes the new
cluster center. This process is repeated until convergence, where the assignment of
data points to clusters stabilizes.

Algorithm Steps:
1. Initialization: Randomly select K data points as initial cluster centroids.
2. Assignment:Assign each data point to the cluster whose centroid is closest (typically
using Euclidean distance).
3. Update: Recalculate the centroids as the mean of the points in each cluster.
4. Repeat Assignment and Update: Repeat steps 2 and 3 until convergence.

Types of K-Means Clustering:

1. Hard/Traditional K-Means:
- Each data point is assigned exclusively to one cluster.
- The assignment of points to clusters is based on the nearest centroid.

2. Fuzzy K-Means:
- Allows data points to belong to multiple clusters with different degrees of
membership.
- Assigns each point a membership value indicating its degree of belonging to each
cluster.

3. K-Medoids:
- Uses the medoid (the most centrally located point in a cluster) instead of the mean
as the cluster center.
- Less sensitive to outliers compared to traditional K-Means.

4. Kernel K-Means:
- Applies the kernel trick to map data into a higher-dimensional space.
- Enables the clustering of non-linearly separable data.

Advantages of K-Means:
- Simplicity and ease of implementation.
- Scalable to large datasets.
- Applicable to a wide range of data types.

Disadvantages of K-Means:
- Sensitive to the initial placement of centroids.
- Assumes spherical clusters of similar sizes.
- May converge to local optima.

Use Cases:
- Image segmentation.
- Customer segmentation in marketing.
- Anomaly detection in cybersecurity.
- Document clustering in natural language processing.

Tips for Practical Use:

- Preprocess data to handle outliers.
- Consider using feature scaling.
- Run the algorithm multiple times with different initializations.
- Choose the number of clusters (K) carefully; use techniques like the elbow method.

K-Means clustering is a versatile algorithm with various extensions, and its

effectiveness depends on the nature of the data and the problem at hand.m

Python: Deeper Insights into Machine Learning
From Everand
Python: Deeper Insights into Machine Learning
John Hearty
No ratings yet
DMDW Qa-5
Document7 pages
DMDW Qa-5
hashitapusapati012
No ratings yet
Assignment No 5 K-Means Clustering
Document2 pages
Assignment No 5 K-Means Clustering
Vaishnavi Gurav
No ratings yet
Unsupervisd Learning Algorithm
Document6 pages
Unsupervisd Learning Algorithm
Shrey Dixit
No ratings yet
Clustering Principles With K-Means
Document5 pages
Clustering Principles With K-Means
International Journal of Innovative Science and Research Technology
No ratings yet
ML Application in Signal Processing and Communication Engineering
Document27 pages
ML Application in Signal Processing and Communication Engineering
aniruddh nain
No ratings yet
K Means Clustering
Document6 pages
K Means Clustering
Alina Corina Bala
No ratings yet
Clustering
Document7 pages
Clustering
marina.villanueva
No ratings yet
Asynchronous Task Cluster Analysis
Document2 pages
Asynchronous Task Cluster Analysis
Linda Amunyela
No ratings yet
KNN VS Kmeans
Document3 pages
KNN VS Kmeans
Soubhagya Kumar Sahoo
No ratings yet
Clustering
Document26 pages
Clustering
ExpoMed ExpoMed
No ratings yet
A Parallel Study On Clustering Algorithms in Data Mining
Document7 pages
A Parallel Study On Clustering Algorithms in Data Mining
Anu Ishwarya
No ratings yet
ML - Machine Learning PDF
Document13 pages
ML - Machine Learning PDF
David Esteban Meneses Rendic
No ratings yet
Clustering
Document104 pages
Clustering
Dev kartik Agarwal
No ratings yet
Partitioning Methods
Document3 pages
Partitioning Methods
Diyar T Alzuhairi
100% (1)
DMW Assignment 2
Document4 pages
DMW Assignment 2
mad world
No ratings yet
06 Cluster Analysis
Document34 pages
06 Cluster Analysis
hawariya abel
No ratings yet
Assignment 5
Document3 pages
Assignment 5
Pujan Patel
No ratings yet
DM Lecture 06
Document32 pages
DM Lecture 06
Sameer Ahmad
No ratings yet
Comparison of Different Clustering Algorithms Using WEKA Tool
Document3 pages
Comparison of Different Clustering Algorithms Using WEKA Tool
IJARTES
No ratings yet
Unsupervised Learning - Clustering Cheatsheet - Codecademy
Document5 pages
Unsupervised Learning - Clustering Cheatsheet - Codecademy
Imane Loukili
No ratings yet
Machine Learning Theory
Document12 pages
Machine Learning Theory
airplaneunderwater
No ratings yet
Unit V - Clustering
Document19 pages
Unit V - Clustering
Raksha Poonacha.B.
No ratings yet
Asynchrous Task K6-7 Chaitra
Document2 pages
Asynchrous Task K6-7 Chaitra
Linda Amunyela
No ratings yet
Machine Learning & Data Mining: Understanding
Document7 pages
Machine Learning & Data Mining: Understanding
Rassellas Rassell
No ratings yet
Unit 4
Document4 pages
Unit 4
adityapawar1865
No ratings yet
Attack Detection by Clustering and Classification Approach: Ms. Priyanka J. Pathak, Asst. Prof. Snehlata S. Dongre
Document4 pages
Attack Detection by Clustering and Classification Approach: Ms. Priyanka J. Pathak, Asst. Prof. Snehlata S. Dongre
Ijarcsee Journal
No ratings yet
Unit-5 Unit-5: Case Studies of Big Data Analytics Using Map-Reduce Programming
Document11 pages
Unit-5 Unit-5: Case Studies of Big Data Analytics Using Map-Reduce Programming
Chitra Madhuri Yashoda
No ratings yet
Clustering: Clustering Is One of The Most Common Exploratory Data Analysis
Document5 pages
Clustering: Clustering Is One of The Most Common Exploratory Data Analysis
Mada
No ratings yet
Entropy: Weighted Mutual Information For Aggregated Kernel Clustering
Document15 pages
Entropy: Weighted Mutual Information For Aggregated Kernel Clustering
SK
No ratings yet
Concepts and Techniques: Data Mining
Document27 pages
Concepts and Techniques: Data Mining
AdamZain788
No ratings yet
Concepts and Techniques: Data Mining
Document43 pages
Concepts and Techniques: Data Mining
Esraa Samir
No ratings yet
Unit 5
Document31 pages
Unit 5
minichel
No ratings yet
Concepts and Techniques: Data Mining
Document50 pages
Concepts and Techniques: Data Mining
Hasibur Rahman Porag
No ratings yet
ML (Interview)
Document20 pages
ML (Interview)
ratnadepp
No ratings yet
Clustering For Big Data Analytics
Document28 pages
Clustering For Big Data Analytics
hakona
No ratings yet
Module 5-1
Document8 pages
Module 5-1
nagraj1312003
No ratings yet
Dynamicclustering
Document6 pages
Dynamicclustering
kasun prabhath
No ratings yet
Presentation: Operating System Concept CS-582
Document13 pages
Presentation: Operating System Concept CS-582
Mujtaba Hassan
No ratings yet
Big Data
Document7 pages
Big Data
Sevendipity Science
No ratings yet
10 Marks Questions
Document19 pages
10 Marks Questions
Anupriya Veerasamy
No ratings yet
Concepts and Techniques: Data Mining
Document101 pages
Concepts and Techniques: Data Mining
Rizky Ramadhan
No ratings yet
Cluster Analysis: Basic Concepts Partitioning Methods Hierarchical Methods Density-Based Methods Grid-Based Methods Evaluation of Clustering
Document53 pages
Cluster Analysis: Basic Concepts Partitioning Methods Hierarchical Methods Density-Based Methods Grid-Based Methods Evaluation of Clustering
Maha Lakshmi
No ratings yet
Document Clustering in Web Search Engine: International Journal of Computer Trends and Technology-volume3Issue2 - 2012
Document4 pages
Document Clustering in Web Search Engine: International Journal of Computer Trends and Technology-volume3Issue2 - 2012
surendiran123
No ratings yet
Ijettcs 2014 04 25 123
Document5 pages
Ijettcs 2014 04 25 123
International Journal of Application or Innovation in Engineering & Management
No ratings yet
K - Mean Clustering
Document12 pages
K - Mean Clustering
Shuvajit Das amit
No ratings yet
DMDW 5th Module
Document28 pages
DMDW 5th Module
Kavya Gowda
No ratings yet
Unit - 4 DM
Document24 pages
Unit - 4 DM
minto
No ratings yet
Clustering in AI
Document16 pages
Clustering in AI
Ram Kushwaha
No ratings yet
4 Clustering
Document9 pages
4 Clustering
Bibek Neupane
No ratings yet
Clustering Techniques in ML: Submitted By: Pooja 16EJICS072
Document26 pages
Clustering Techniques in ML: Submitted By: Pooja 16EJICS072
RITESH JANGID
No ratings yet
CSE3008 Module4
Document32 pages
CSE3008 Module4
Bhavagna Shreya
No ratings yet
Concepts and Techniques: Data Mining
Document101 pages
Concepts and Techniques: Data Mining
Jiyual Musti
No ratings yet
Customer Categorization by Data Analysis Using Clustering Algorithms of Machine Learning
Document4 pages
Customer Categorization by Data Analysis Using Clustering Algorithms of Machine Learning
monajigari vedhanth reddy
No ratings yet
A Comparative Study of K-Means, K-Medoid and Enhanced K-Medoid Algorithms
Document4 pages
A Comparative Study of K-Means, K-Medoid and Enhanced K-Medoid Algorithms
IJAFRC
No ratings yet
10 Clus Basic
Document92 pages
10 Clus Basic
Mike Ku
No ratings yet
s18 Cu6051np Cw1 17031944 Nirakar Sigdel
Document18 pages
s18 Cu6051np Cw1 17031944 Nirakar Sigdel
Santosh Lamichhane
No ratings yet
Unsupervised Learning Modi
Document16 pages
Unsupervised Learning Modi
SatishKakarla
No ratings yet
KMeans Clustering
Document16 pages
KMeans Clustering
Basant Kothari
No ratings yet
Data Mining Clustering
Document76 pages
Data Mining Clustering
Anjali Asha Jacob
No ratings yet
KMeansPP Soda
Document9 pages
KMeansPP Soda
alanpicard2303
No ratings yet
Bogolyubova 2018. Dark Personalities On Facebook
Document9 pages
Bogolyubova 2018. Dark Personalities On Facebook
juless44
No ratings yet
2009 - Clustering Techniques For Financial Diversification
Document6 pages
2009 - Clustering Techniques For Financial Diversification
Franck Dernoncourt
No ratings yet
Cluster Analysis
Document43 pages
Cluster Analysis
Arpan Kumar
No ratings yet
Arabic Words Clustering by Using K-Means Algorithm
Document5 pages
Arabic Words Clustering by Using K-Means Algorithm
Faiez Musa Lahmood Alrufaye
No ratings yet
Top 10 Machine Learning Algorithms
Document12 pages
Top 10 Machine Learning Algorithms
Umang Soni
No ratings yet
A Research Study On Unsupervised Machine Learning Algorithms For Early Fault Detection in Predictive Maintenance
Document7 pages
A Research Study On Unsupervised Machine Learning Algorithms For Early Fault Detection in Predictive Maintenance
Sayan Bhattacharya
No ratings yet
Data Mining Abhas
Document24 pages
Data Mining Abhas
Mohit Chauhan
No ratings yet
DM Lab
Document101 pages
DM Lab
Tamilvanan S
No ratings yet
UNIT5
Document60 pages
UNIT5
Sahana Shetty
No ratings yet
Mastering Python For Data Science - Sample Chapter
Document24 pages
Mastering Python For Data Science - Sample Chapter
Packt Publishing
71% (7)
Applied Data Science Questions
Document15 pages
Applied Data Science Questions
gnanajothi k
No ratings yet
Text Mining Applications and Theory
Document223 pages
Text Mining Applications and Theory
Xiangcao Liu
100% (4)
Comparative Analysis of Advanced Face Recognition Techniques
Document7 pages
Comparative Analysis of Advanced Face Recognition Techniques
ashwani kumar sharma
No ratings yet
CS8091 Big Data Analytics MCQ
Document22 pages
CS8091 Big Data Analytics MCQ
Sowmiya mohan
100% (2)
Lesson 4.1 - Unsupervised Learning Partitioning Methods PDF
Document41 pages
Lesson 4.1 - Unsupervised Learning Partitioning Methods PDF
Tayyaba Faisal
No ratings yet
Unsupervised Learning
Document24 pages
Unsupervised Learning
ayesha bashir
No ratings yet
Applied Soft Computing Journal: Editorial
Document3 pages
Applied Soft Computing Journal: Editorial
Ewerton Duarte
No ratings yet
A Hierarchical Clustering Algorithm Based On K-Means With Constraints
Document4 pages
A Hierarchical Clustering Algorithm Based On K-Means With Constraints
Ankush Jain
No ratings yet
Clustering of Groundwater Wells and Spatial Variation of Groundwater Recharge in Sina Basin, India
Document12 pages
Clustering of Groundwater Wells and Spatial Variation of Groundwater Recharge in Sina Basin, India
Pawan Wable
No ratings yet
Vmls - 103exercises
Document50 pages
Vmls - 103exercises
salnasu
No ratings yet
Summer Training Report: Submitted in Partial Fulfillment For The Second Year Summer Internship of
Document27 pages
Summer Training Report: Submitted in Partial Fulfillment For The Second Year Summer Internship of
supriya mishra
No ratings yet
Video Data Mining: Junghwan Oh
Document5 pages
Video Data Mining: Junghwan Oh
Rashmi Shankar
No ratings yet
3 mmPSO
Document21 pages
3 mmPSO
Goran Wnis
No ratings yet
UCS551 Chapter 7 - Clustering
Document9 pages
UCS551 Chapter 7 - Clustering
Farah Yahaya
No ratings yet
Fuzzy C-Means - Review
Document3 pages
Fuzzy C-Means - Review
batata batata
No ratings yet
PdfScanner 1664335281137
Document52 pages
PdfScanner 1664335281137
Sohel Mulla
No ratings yet
K Means Example
Document10 pages
K Means Example
Daljit Singh
No ratings yet
Crop Report
Document113 pages
Crop Report
Saurabh Kumar
No ratings yet