Clustering

Uploaded by

Vishnu P

0% found this document useful (0 votes)

2 views8 pages

Original Title

clustering (1) (1)

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

2 views8 pages

Clustering

Uploaded by

Vishnu P

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 8

Search inside document

Nikhil Ghag

CLUSTERING Business Analyst

TheGreenBillions Limited
WHY THERE IS NEED FOR
CLUSTERING
• Clustering in an important task in analytics in which the
data (customers or entities) is grouped into finite subsets
such that each subset is homogeneous group of entities.
• Many analytics projects may start first with clustering
after performing descriptive statistics and visualization
on the data, since it assists data scientists to apply
appropriate strategies for different clusters identified
through cluster characteristics
DIFFERENCE BETWEEN
CLUSTERING AND
CLASSIFICATION
• The main difference between clustering algorithms and other classification
techniques such as logistic regression and classification trees is that clustering
algorithms are unsupervised learning algorithms (classes are not known a priori)
whereas logistic regression and classification tree are supervised learning algorithms
(where classes are known a priori in the training data).
• Another important difference between clustering and classification is that clustering
is descriptive analytics whereas classification is usually a predictive analytics
algorithm.
CLASSIFICATION
• Clusters can be classified into the following four categories:
• 1. Non-overlapping clusters: Cluster in which each observation belongs to only one cluster.
• Non-overlapping clusters are more frequently used clustering techniques in practice.
• 2. Overlapping clusters: An observation may belong to more than one cluster.
• 3. Probabilistic clusters: An observation may belong to a cluster according to a probability
distribution.
• 4. Hierarchical clustering: Hierarchical clustering creates subsets of data similar to a tree-
like structure in which the root node corresponds to the complete set of data. Branches are
created from the root node to split the data into heterogeneous subsets (clusters).
DISTANCE AND DISSIMILARITY MEASURES USED IN CLUSTERING

• Euclidean Distance
• Higher distance would imply that observations are dissimilar, whereas higher similarity would indicate that the
observations are similar.
• Euclidean is one of the frequently used distance measures when the variable is either in interval or ratio scale.
CASE
K-MEANS CLUSTERING

• K-means clustering is one of the frequently used clustering algorithms. It is a non-hierarchical

clustering method in which the number of clusters (K) is decided a priori. The observations in the
sample are assigned to one of the clusters (say C1, C2, …, CK).
• The following steps are used in K-means clustering algorithm:
• 1. Choose K observations from the data that are likely to be in different clusters. There are many ways
of choosing these initial K values; easiest approach is to chose observations that are farthest (in one of
the parameters of the data).
• 2. The K observations chosen in step 1 are the centroids of those clusters.
• 3. For remaining observations, find the cluster closest to the centroid. Add the new observation (say
• observation j) to the cluster with closest centroid. Adjust the centroid after adding a new observation to
the cluster. The closest centroid is chosen based on an appropriate distance measure.
• 4. Repeat step 3 till all observations are assigned to a cluster.
K-MEAN ALGORITHM
Height Weight

185 72

130 56

168 60

179 68

182 72

188 77

180 71

180 70

183 84

Cluster Analysis GP Seminar
Document13 pages
Cluster Analysis GP Seminar
Arnab Mukherjee
No ratings yet
DM Lecture 06
Document32 pages
DM Lecture 06
Sameer Ahmad
No ratings yet
Final Clustering
Document21 pages
Final Clustering
NEEL GHADIYA
No ratings yet
Unit 4 - Data Warehousing and Mining
Document51 pages
Unit 4 - Data Warehousing and Mining
Ã S Àdhìkãrí
No ratings yet
Unsupervised Machine Learning
Document10 pages
Unsupervised Machine Learning
Ananya S
No ratings yet
Clustering and Distance Metrics
Document12 pages
Clustering and Distance Metrics
Aarthi E
No ratings yet
Clustering
Document7 pages
Clustering
Rupesh Gaur
No ratings yet
BA2 7 Cluster
Document33 pages
BA2 7 Cluster
034AJINKYA KULKARNI
No ratings yet
Classify Clustering
Document31 pages
Classify Clustering
priyanshidubey2008
No ratings yet
Dmbi Unit-4
Document18 pages
Dmbi Unit-4
Paras Sharma
No ratings yet
Clustering
Document20 pages
Clustering
richard martin
No ratings yet
Cluster Analysis-Unit 4
Document7 pages
Cluster Analysis-Unit 4
20PCT19 THANISHKA S
No ratings yet
Cluster Analysis: Prentice-Hall, Inc
Document33 pages
Cluster Analysis: Prentice-Hall, Inc
ankur_saini_17
No ratings yet
An Introduction To Clustering Methods
Document8 pages
An Introduction To Clustering Methods
magargie
No ratings yet
Data Mining Unit 3 Cluster Analysis: Types of Clusters
Document11 pages
Data Mining Unit 3 Cluster Analysis: Types of Clusters
rohan
No ratings yet
05 - Multivariate - Cluster Analysis - RVSD
Document59 pages
05 - Multivariate - Cluster Analysis - RVSD
322OO22 - Jovanka Angella Mesinay
No ratings yet
ML (Interview)
Document20 pages
ML (Interview)
ratnadepp
No ratings yet
Data Mining UNIT-4 NOTES
Document40 pages
Data Mining UNIT-4 NOTES
Bhure Vedika
No ratings yet
Dat Science: CLASS 11: Clustering and Dimensionality Reduction
Document30 pages
Dat Science: CLASS 11: Clustering and Dimensionality Reduction
ashishamitav123
No ratings yet
Unit - 4 - Modified
Document152 pages
Unit - 4 - Modified
Shashwat Mishra
No ratings yet
ASE - PPT - Unit 2 Discriminant Cluster Analysis
Document27 pages
ASE - PPT - Unit 2 Discriminant Cluster Analysis
sonali gupta
No ratings yet
SPK Clustering
Document35 pages
SPK Clustering
Antonius
No ratings yet
Chapter 8 - Consumer Perception and Preference
Document29 pages
Chapter 8 - Consumer Perception and Preference
Simer Fibers
No ratings yet
Chapter 8 - Clustering
Document42 pages
Chapter 8 - Clustering
FakhrulShahrilEzanie
No ratings yet
WINSEM2023-24 BEEE410L TH VL2023240502246 2024-03-22 Reference-Material-I
Document95 pages
WINSEM2023-24 BEEE410L TH VL2023240502246 2024-03-22 Reference-Material-I
Rahul ganth
No ratings yet
8ad59658 1701235711480
Document36 pages
8ad59658 1701235711480
kashyaputtam7
No ratings yet
Clustering
Document104 pages
Clustering
Dev kartik Agarwal
No ratings yet
Unsupervised Machine Learning Techniques
Document24 pages
Unsupervised Machine Learning Techniques
ABDULHAMID
No ratings yet
w6 Clustering
Document29 pages
w6 Clustering
Srisha Prasad Rath
No ratings yet
5 Algoritma Klastering
Document85 pages
5 Algoritma Klastering
icobes ur
No ratings yet
K Means Clustering
Document6 pages
K Means Clustering
Alina Corina Bala
No ratings yet
M8 Klastering
Document83 pages
M8 Klastering
Teofilus Evan
No ratings yet
Assignment No 5 K-Means Clustering
Document2 pages
Assignment No 5 K-Means Clustering
Vaishnavi Gurav
No ratings yet
Clustering: Clustering Is One of The Most Common Exploratory Data Analysis
Document5 pages
Clustering: Clustering Is One of The Most Common Exploratory Data Analysis
Mada
No ratings yet
Chapter 5
Document43 pages
Chapter 5
Bikila Seketa
No ratings yet
Clustering
Document7 pages
Clustering
marina.villanueva
No ratings yet
01 Introduction Clustering
Document11 pages
01 Introduction Clustering
Kushagra Bhatnagar
No ratings yet
W6 Clustering
Document29 pages
W6 Clustering
5599RAJNISH SINGH
No ratings yet
Review Paper On Clustering and Validation Techniques
Document5 pages
Review Paper On Clustering and Validation Techniques
Sarip Rahmat
No ratings yet
Custer Analysis: Prepared by Navin Ninama
Document20 pages
Custer Analysis: Prepared by Navin Ninama
Nishith Lakhlani
No ratings yet
Lecture9 Clustering For Students
Document39 pages
Lecture9 Clustering For Students
翁江靖
No ratings yet
DMDW Qa-5
Document7 pages
DMDW Qa-5
hashitapusapati012
No ratings yet
Data Mining Unit 5
Document70 pages
Data Mining Unit 5
prameela1635
No ratings yet
Presentation: Operating System Concept CS-582
Document13 pages
Presentation: Operating System Concept CS-582
Mujtaba Hassan
No ratings yet
Cluster Analysis
Document24 pages
Cluster Analysis
Krishna Sharma
No ratings yet
10 Marks Questions
Document19 pages
10 Marks Questions
Anupriya Veerasamy
No ratings yet
Unit 5
Document5 pages
Unit 5
hollowpurple156
No ratings yet
ACFrOgCajrghX8QYes4eQZ0sdYkSYcgCfngE3 G40h28YsPxSNUI5pWUj1kIOR5d1d2nVkHBNqBJQVMMKTJ6lSwm5kuENTMySlduAvwhEcn-N5iutSBNaAaDhkol5Hv3mPmTl0q-ahwmr7GR 2cj
Document95 pages
ACFrOgCajrghX8QYes4eQZ0sdYkSYcgCfngE3 G40h28YsPxSNUI5pWUj1kIOR5d1d2nVkHBNqBJQVMMKTJ6lSwm5kuENTMySlduAvwhEcn-N5iutSBNaAaDhkol5Hv3mPmTl0q-ahwmr7GR 2cj
ethan
No ratings yet
Iv Unit DM
Document26 pages
Iv Unit DM
Vishwanth Bavireddy
No ratings yet
Cluster Analysis: Prof. (DR.) H. J. Jani Mba Programme, Sardar Patel University Vallabh Vidyanagar - 388 120
Document41 pages
Cluster Analysis: Prof. (DR.) H. J. Jani Mba Programme, Sardar Patel University Vallabh Vidyanagar - 388 120
chintan
No ratings yet
Data Mining: Kabith Sivaprasad (BE/1234/2009) Rimjhim (BE/1134/2009) Utkarsh Ahuja (BE/1226/2009)
Document32 pages
Data Mining: Kabith Sivaprasad (BE/1234/2009) Rimjhim (BE/1134/2009) Utkarsh Ahuja (BE/1226/2009)
Rule2
No ratings yet
DMDW R20 Unit 5
Document21 pages
DMDW R20 Unit 5
car sorry
No ratings yet
K-Means Clustering Algorithm
Document13 pages
K-Means Clustering Algorithm
Gaurav Raut
No ratings yet
Clustering Algorithm: An Unsupervised Learning Approach
Document23 pages
Clustering Algorithm: An Unsupervised Learning Approach
SyedDabeerAli
No ratings yet
1.supervised and Unsupervised
Document42 pages
1.supervised and Unsupervised
rajthakre81
No ratings yet
Enhancement of Qualities of Clusters by Eliminating Outlier For Data Mining Application in Education
Document27 pages
Enhancement of Qualities of Clusters by Eliminating Outlier For Data Mining Application in Education
diptipatil20
No ratings yet
Aiml M4 C1
Document101 pages
Aiml M4 C1
Vivek Tg
No ratings yet
Data Minig Unit 4th
Document5 pages
Data Minig Unit 4th
Malik Bilaal
No ratings yet
Hierarchical Clustering in Unsupervised Learning
Document9 pages
Hierarchical Clustering in Unsupervised Learning
Qwert Uiop
No ratings yet
Python Machine Learning for Beginners: Unsupervised Learning, Clustering, and Dimensionality Reduction. Part 1
From Everand
Python Machine Learning for Beginners: Unsupervised Learning, Clustering, and Dimensionality Reduction. Part 1
Tom Lesley
No ratings yet
Major Project Final Report
Document24 pages
Major Project Final Report
Ankit Upadhyay
No ratings yet
Density Based
Document52 pages
Density Based
Nermine Limeme
No ratings yet
ISIM
Document14 pages
ISIM
Fibonnaci Backtrack
No ratings yet
Unionrope - Com Product-Catalog 6x36-IWRC PDF
Document3 pages
Unionrope - Com Product-Catalog 6x36-IWRC PDF
boyzes
No ratings yet
Face ATM
Document62 pages
Face ATM
ALNATRON GROUPS
No ratings yet
Comparative Analysis of Image Classification Algorithms For Face Mask Detection
Document11 pages
Comparative Analysis of Image Classification Algorithms For Face Mask Detection
ikhwancules46
No ratings yet
Lin 2022 - Recent Advances in The Application of Machine Learning Methods
Document7 pages
Lin 2022 - Recent Advances in The Application of Machine Learning Methods
Victor Cortés Antiquera
No ratings yet
Naïve Bayes Classifier: Ke Chen
Document20 pages
Naïve Bayes Classifier: Ke Chen
Eri Zuliarso
No ratings yet
978 3 319 62274 3 PDF
Document374 pages
978 3 319 62274 3 PDF
Ida Alfonsi
No ratings yet
Telemarketing Dataset Analysis: Group 7 Abhishek Jagdale Nilay N Sonal Mittal Swapnil B Swapnil T Vishal Sinha
Document21 pages
Telemarketing Dataset Analysis: Group 7 Abhishek Jagdale Nilay N Sonal Mittal Swapnil B Swapnil T Vishal Sinha
Nilay Nandekar
No ratings yet
Breast Cancer Prediction Using Machine Learning
Document11 pages
Breast Cancer Prediction Using Machine Learning
IJRASETPublications
No ratings yet
Machine Learning Bits
Document28 pages
Machine Learning Bits
vyshnavi
100% (2)
Improved Feature Extraction and Classification - Sentiment Analysis - Trupthi2016
Document6 pages
Improved Feature Extraction and Classification - Sentiment Analysis - Trupthi2016
srinivasmekala
No ratings yet
Minority Report in Fraud Detection: Classification of Skewed Data
Document10 pages
Minority Report in Fraud Detection: Classification of Skewed Data
Jesús Alcalá García
No ratings yet
Digital Image Analyses As An Alternative Tool For Domestic Swine Skin Diseases First Aid Using Naive Bayes Algorithm
Document48 pages
Digital Image Analyses As An Alternative Tool For Domestic Swine Skin Diseases First Aid Using Naive Bayes Algorithm
ginalyn bolina
No ratings yet
Clickbait Open Access-1
Document8 pages
Clickbait Open Access-1
Shubham Daswani
No ratings yet
Informed Machine Learning - A Taxonomy and Survey of Integrating Prior Knowledge Into Learning Systems
Document20 pages
Informed Machine Learning - A Taxonomy and Survey of Integrating Prior Knowledge Into Learning Systems
Lucas Fiordelisi
No ratings yet
Review of Plant Leaf Disease Detection Using Image Processing
Document5 pages
Review of Plant Leaf Disease Detection Using Image Processing
International Journal of Application or Innovation in Engineering & Management
100% (1)
Cancer Prediction in Early Stages
Document3 pages
Cancer Prediction in Early Stages
Bishwajith Podila
No ratings yet
Machine Learning Unit 2 MCQ
Document17 pages
Machine Learning Unit 2 MCQ
Harsh Preet Singh
No ratings yet
Machine Deep Learning For Software Engineering A Systematic Literature Review
Document44 pages
Machine Deep Learning For Software Engineering A Systematic Literature Review
Titus Azevedo
No ratings yet
@DataScience - Ir - 111 Essential Concepts For Data Scientists
Document14 pages
@DataScience - Ir - 111 Essential Concepts For Data Scientists
Safiullah sarmadi
No ratings yet
Hierarchical Clustering in Data Mining - GeeksforGeeks
Document4 pages
Hierarchical Clustering in Data Mining - GeeksforGeeks
MOHAMMAD SHIHABUDEEN
No ratings yet
Cheat Sheet: Building A KNIME Workflow For Beginners: Explore Analyze
Document2 pages
Cheat Sheet: Building A KNIME Workflow For Beginners: Explore Analyze
Kate Pink
100% (1)
LSTM Lecture
Document163 pages
LSTM Lecture
Gunnar Calvert
No ratings yet
DBSCAN
Document18 pages
DBSCAN
nilabjyaghosh
No ratings yet
Manual For Satellite Data Analysis ECognition Developer
Document80 pages
Manual For Satellite Data Analysis ECognition Developer
Emil Tengwar
0% (1)
A Deep Learning Model Based On Concatenation Approach For The Diagnosis of Brain Tumor
Document10 pages
A Deep Learning Model Based On Concatenation Approach For The Diagnosis of Brain Tumor
pavithr
No ratings yet
An Approach Based Iris Flower Species Recognition Using Machine Learning Classifiers
Document7 pages
An Approach Based Iris Flower Species Recognition Using Machine Learning Classifiers
205 216 Lakshmi durga
No ratings yet
Image Classification-AIML Project Presentation
Document18 pages
Image Classification-AIML Project Presentation
ms.simrantaj
No ratings yet