Welcome to Scribd!

Cluster Analysis

Uploaded by

0% found this document useful (0 votes)

34 views15 pages

Cluster analysis is an unsupervised machine learning technique used to group similar objects together. It can be applied in various domains like understanding customer behavior, identifying new product opportunities, selecting test markets, and reducing large datasets. There are two main types of cluster analysis: K-means clustering which partitions data into K number of clusters based on minimizing distance between data points and centroids, and hierarchical clustering which creates nested clusters based on similarity through agglomerative or divisive approaches. The key steps in cluster analysis involve formulating the problem, selecting distance measures and clustering procedures, determining the optimal number of clusters, interpreting and profiling the identified clusters.

Original Description:

cluster analysis ppt

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

34 views15 pages

Cluster Analysis

Uploaded by

Kshitij Tamrakar

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 15

Search inside document

Cluster Analysis

Cluster Analysis
Cluster Analysis
Cluster Analysis
Where is Cluster Analysis Used?
• Understanding Buyer Behaviour:
– Identify homogeneous groups of buyers
• Identify new product opportunities:
– Competitive sets within market can be determined
– Examine current offerings compared to competitors
• Selecting test markets:
– Grouping cities into homogeneous markets
• Reducing data:
– Create sub-groups of data
Cluster Analysis
• Unsupervised learning • Do Sub-populations exist?
• Does not predict anything in – How many?
particular – What are their sizes?
• Not a Classification technique – – Any common properties?
We do not know the classes!! – Can they be split further?

• Can be used for Segmentation • Any outliers?

• Types of Clustering Algorithms
– K-Means Clustering
– Hierarchical Clustering
K-Means Clustering
• Methodology
• Partitioned into K clusters – Establish K number of Centroids
• K needs to be determined – Connect two Centroids and bisect with a
perpendicular line
• Uses concept of ‘Centroid’
– Assign a Centroid to each data point
• Ex: Type of Documents
– Calculate Mean of the distances between
(News/Scientific/Legal)
each point and respective Centroid
– Minimize Total Squared Intra Cluster Distance
(T)
– Relocate the Centroids
– Repeat above steps until the Centroids no
longer relocate
– Pick clustering that yields the lowest
Aggregate Distance i.e., Sum of T for all
clusters. Lowest Variance.
K-Means
Clustering
K-Means Animation:
http://stanford.edu/class/ee103/visualizatio
ns/kmeans/kmeans.html
K-Means Clustering
• Number of Clusters
– Variance is zero when
Number of Clusters =
Number of data points!!
– Variance decreases as
number of Clusters
increase
– However, decrease in
Variance reduces for each
K added
• Use Scree Plot Elbow
value to determine K
Hierarchical Clustering
• Involves creating clusters that have predetermined ordering from top
to bottom Ex: Files and folders in your hard disk
• Tree is also termed as Dendogram
• Types of Hierarchical Clustering
– Divisive Method:
• Assign all observations to a single cluster
• Partition cluster into 2 least similar clusters
• Proceed recursively until there is one cluster for each observation
– Agglomerative Method:
• Assign a cluster to each observation
• Compute distance (similarity) between each cluster
• Join 2 most similar cluster
• Proceed recursively until there is only a single cluster
Hierarchical Clustering Approaches

Agglomerative DIVISIVE
• Works “Bottom up”  Works “Top Down”
• Two most similar clusters  Two least similar clusters
are combined into nodes are split
• Iterated until root cluster
 Iterated until leaf cluster
Agglomerative Hierarchical Clustering

Source: http://infolab.stanford.edu/~ullman/mmds/ch7.pdf
Agglomerative Hierarchical Clustering

Source: http://infolab.stanford.edu/~ullman/mmds/ch7.pdf
Hierarchical Clustering
Clustering Analysis - Steps
• Formulate the problem
• Select a distance measure
• Select a clustering procedure
• Decide on the number of clusters
• Interpret and profile the clusters
• Assess the validity of clustering

Unsupervised Learning Modi
Document16 pages
Unsupervised Learning Modi
SatishKakarla
No ratings yet
Clustering
Document39 pages
Clustering
Sourav Mondal
No ratings yet
Technical Seminar On K-Means Clustering in Data Mining: Darshna Sharma 1HK18IS086 Guide: Prof. Priyanka K
Document22 pages
Technical Seminar On K-Means Clustering in Data Mining: Darshna Sharma 1HK18IS086 Guide: Prof. Priyanka K
Darshna Sharma
No ratings yet
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
Document42 pages
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
Dineshkannan Ravi
No ratings yet
Data Mining CH - 5
Document18 pages
Data Mining CH - 5
Hasset Tiss Abay Genji
No ratings yet
Clustering Algorithms
Document61 pages
Clustering Algorithms
Ayesha Khan
No ratings yet
Clustering
Document80 pages
Clustering
Aatmaj Salunke
No ratings yet
Clustering Algorithm: An Unsupervised Learning Approach
Document23 pages
Clustering Algorithm: An Unsupervised Learning Approach
SyedDabeerAli
No ratings yet
Unit Iv Cluster Analysis What Is Clusteranalysis?
Document24 pages
Unit Iv Cluster Analysis What Is Clusteranalysis?
Hit Man
No ratings yet
06 Cluster Analysis
Document34 pages
06 Cluster Analysis
hawariya abel
No ratings yet
Cluster Analysis Concept & Methods
Document14 pages
Cluster Analysis Concept & Methods
Kshitij Vijayvergia
No ratings yet
Data Mining Unit 3 Cluster Analysis: Types of Clusters
Document11 pages
Data Mining Unit 3 Cluster Analysis: Types of Clusters
rohan
No ratings yet
Unit 4 - Data Warehousing and Mining
Document51 pages
Unit 4 - Data Warehousing and Mining
Ã S Àdhìkãrí
No ratings yet
Chapter 5 Clustering
Document40 pages
Chapter 5 Clustering
Mohamedsultan Awol
No ratings yet
9.54 Class 13: Unsupervised Learning
Document54 pages
9.54 Class 13: Unsupervised Learning
GrantMwakipunda
No ratings yet
Unsupervised Machine Learning Techniques
Document24 pages
Unsupervised Machine Learning Techniques
ABDULHAMID
No ratings yet
Clustering
Document104 pages
Clustering
Dev kartik Agarwal
No ratings yet
Cluster
Document72 pages
Cluster
Shashank Gangadharabhatla
100% (1)
Chapter 8 - Clustering
Document42 pages
Chapter 8 - Clustering
FakhrulShahrilEzanie
No ratings yet
In Marketing, Cluster Analysis Is Used For: Statistical
Document3 pages
In Marketing, Cluster Analysis Is Used For: Statistical
bhartic
No ratings yet
Clustering
Document22 pages
Clustering
StocknEarn
No ratings yet
R PPT 30
Document45 pages
R PPT 30
bernatin T
No ratings yet
W6 Clustering
Document29 pages
W6 Clustering
5599RAJNISH SINGH
No ratings yet
K-Means Clustering
Document18 pages
K-Means Clustering
Israa As
No ratings yet
M8 Klastering
Document83 pages
M8 Klastering
Teofilus Evan
No ratings yet
Chapter 4 PDF
Document89 pages
Chapter 4 PDF
Anirudh Tripathi
No ratings yet
Chapter 5
Document43 pages
Chapter 5
Bikila Seketa
No ratings yet
w6 Clustering
Document29 pages
w6 Clustering
Srisha Prasad Rath
No ratings yet
Presentation: Operating System Concept CS-582
Document13 pages
Presentation: Operating System Concept CS-582
Mujtaba Hassan
No ratings yet
Clustering K-Means
Document28 pages
Clustering K-Means
Faysal Ahammed
No ratings yet
Digi Week 10
Document8 pages
Digi Week 10
Ilion Barboso
No ratings yet
K-Means Clustering Algorithm
Document13 pages
K-Means Clustering Algorithm
Gaurav Raut
No ratings yet
Cluster Analysis
Document24 pages
Cluster Analysis
sakshi sharma
No ratings yet
Data Mining: I Gede Mahendra Darmawiguna
Document25 pages
Data Mining: I Gede Mahendra Darmawiguna
Bitboxk
No ratings yet
Clustering K Means Agnes
Document36 pages
Clustering K Means Agnes
preetam
No ratings yet
DM Mod5
Document49 pages
DM Mod5
Srushti PS
No ratings yet
Unsupervised Learning
Document14 pages
Unsupervised Learning
Umar Khan
No ratings yet
Stat 390 Presentation 2
Document14 pages
Stat 390 Presentation 2
api-340742243
No ratings yet
ACFrOgCajrghX8QYes4eQZ0sdYkSYcgCfngE3 G40h28YsPxSNUI5pWUj1kIOR5d1d2nVkHBNqBJQVMMKTJ6lSwm5kuENTMySlduAvwhEcn-N5iutSBNaAaDhkol5Hv3mPmTl0q-ahwmr7GR 2cj
Document95 pages
ACFrOgCajrghX8QYes4eQZ0sdYkSYcgCfngE3 G40h28YsPxSNUI5pWUj1kIOR5d1d2nVkHBNqBJQVMMKTJ6lSwm5kuENTMySlduAvwhEcn-N5iutSBNaAaDhkol5Hv3mPmTl0q-ahwmr7GR 2cj
ethan
No ratings yet
AML Ch7 KMeans
Document66 pages
AML Ch7 KMeans
the end
No ratings yet
DMW Unit-V
Document47 pages
DMW Unit-V
Ravindra Pawar
No ratings yet
5 Algoritma Klastering
Document85 pages
5 Algoritma Klastering
icobes ur
No ratings yet
Clustering
Document7 pages
Clustering
Rupesh Gaur
No ratings yet
Partitioning Methods
Document3 pages
Partitioning Methods
Diyar T Alzuhairi
100% (1)
IS4242 W8 Similarity, NN and Clusters
Document29 pages
IS4242 W8 Similarity, NN and Clusters
wongdeshun4
No ratings yet
Unsupervised Learning: K-Means Clustering
Document23 pages
Unsupervised Learning: K-Means Clustering
ariw200201
No ratings yet
Cluster Analysis Set 01: Types of Clustering
Document18 pages
Cluster Analysis Set 01: Types of Clustering
Usman Ali
No ratings yet
Sathyabama Institute of Science and Technology SIT1301-Data Mining and Warehousing
Document22 pages
Sathyabama Institute of Science and Technology SIT1301-Data Mining and Warehousing
viktahjm
No ratings yet
Final Clustering
Document21 pages
Final Clustering
NEEL GHADIYA
No ratings yet
8 - Clustering
Document85 pages
8 - Clustering
MH Polash
No ratings yet
DWDM Unit5
Document14 pages
DWDM Unit5
sri charan
No ratings yet
SPK Clustering
Document35 pages
SPK Clustering
Antonius
No ratings yet
19 - Sessionppt - Clusteringalgos
Document36 pages
19 - Sessionppt - Clusteringalgos
Graisy Biswal
No ratings yet
Community Detection and Graph-Based Clustering
Document45 pages
Community Detection and Graph-Based Clustering
amit
No ratings yet
Class19-22 Clustering 17-25oct2019
Document42 pages
Class19-22 Clustering 17-25oct2019
Saili Mishra
No ratings yet
Lecture 6
Document55 pages
Lecture 6
Hassan
No ratings yet
Unit5 - Unsupervised Learning
Document48 pages
Unit5 - Unsupervised Learning
Soumya Mishra
No ratings yet
K Means
Document36 pages
K Means
Saurabh Mishra
No ratings yet
MLCH9
Document45 pages
MLCH9
sam33rdhakal
No ratings yet
K Nearest Neighbor Algorithm: Fundamentals and Applications
From Everand
K Nearest Neighbor Algorithm: Fundamentals and Applications
Fouad Sabry
No ratings yet
Capstone Project SupplyChain DataCo Supplychain FinalReport
Document79 pages
Capstone Project SupplyChain DataCo Supplychain FinalReport
Abhay Poddar
100% (8)
Inferential Statistics
Document1 page
Inferential Statistics
Muhammad Safiullah
No ratings yet
How To Test Hypothesis by T Model PDF
Document5 pages
How To Test Hypothesis by T Model PDF
Riz Fahan
No ratings yet
NCERT Solutions For Class 11 Maths Chapter - 15 Statistics
Document6 pages
NCERT Solutions For Class 11 Maths Chapter - 15 Statistics
Mukund Yadav
No ratings yet
Limitations of Statistics
Document3 pages
Limitations of Statistics
mk6884962
No ratings yet
Chapter 6 Data Description PDF
Document2 pages
Chapter 6 Data Description PDF
SUE YIN
No ratings yet
Lesson 2.3 Standard Normal Curve and Z Scores
Document18 pages
Lesson 2.3 Standard Normal Curve and Z Scores
Klarence Timothy Pineda Bundang
No ratings yet
Chi-Squared Test For Variance in A Normal Population
Document2 pages
Chi-Squared Test For Variance in A Normal Population
Santa Dela Cruz Naluz
No ratings yet
VW10130 MFU Englisch 01 PDF
Document36 pages
VW10130 MFU Englisch 01 PDF
viniciusafonso
100% (1)
Summary of Findings, Conclusions, and Recommendations: Brief Review of The Study
Document11 pages
Summary of Findings, Conclusions, and Recommendations: Brief Review of The Study
Armie Salcedo
No ratings yet
Data Science Interview Guide
Document23 pages
Data Science Interview Guide
Mary Koko
No ratings yet
PROPONENT-Compliance Monitoring Report - New Format-Sample
Document9 pages
PROPONENT-Compliance Monitoring Report - New Format-Sample
Karlo Marco Cleto
71% (14)
Benford PDF 4b97cc5b5b
Document27 pages
Benford PDF 4b97cc5b5b
Marco Julio Del Moral Argumedo
No ratings yet
Data Science Notes
Document95 pages
Data Science Notes
Rachu
No ratings yet
Sumber Daya Finansial Kinerja 1
Document12 pages
Sumber Daya Finansial Kinerja 1
nurvita
No ratings yet
Exponential Distribution
Document19 pages
Exponential Distribution
Arabi Ali A
No ratings yet
Guide To Undergraduate Dissertations in The Social Sciences Methodologies1
Document12 pages
Guide To Undergraduate Dissertations in The Social Sciences Methodologies1
umi muflikhah
No ratings yet
Lecture 5 - Acceptance Sampling Method PDF
Document11 pages
Lecture 5 - Acceptance Sampling Method PDF
Woon How
No ratings yet
Notes Python5
Document37 pages
Notes Python5
Abhinav Maurya
No ratings yet
LESSON 1 Quantitative Research Characteristics and Importance
Document23 pages
LESSON 1 Quantitative Research Characteristics and Importance
Rj Ricenn Jeric Marticio
No ratings yet
Stats Quiz
Document6 pages
Stats Quiz
Mikomi Sylvie
No ratings yet
Percentile and The T-Distribution: Melc Competency Code
Document8 pages
Percentile and The T-Distribution: Melc Competency Code
Ernie Lahaylahay
No ratings yet
Introduction To Reliability Theory (Part 2) : Frank Coolen
Document21 pages
Introduction To Reliability Theory (Part 2) : Frank Coolen
Ruth Sandala
No ratings yet
Megalithic Aids To Navigation 1986 Ed 2011
Document104 pages
Megalithic Aids To Navigation 1986 Ed 2011
david_davidson_47
No ratings yet
Article 2 - Is Quantitative Research Ethical - Tools For Ethically Practicing, Evaluating, and Using Quantitative Research
Document16 pages
Article 2 - Is Quantitative Research Ethical - Tools For Ethically Practicing, Evaluating, and Using Quantitative Research
cenduri cenduri
No ratings yet
Question Psych
Document23 pages
Question Psych
Chucky Vergara
No ratings yet
Ch.2 Measures of Location and Spread
Document1 page
Ch.2 Measures of Location and Spread
Antonio Pérez-Labarta
No ratings yet
Final Project12
Document57 pages
Final Project12
nanduky
No ratings yet
Narrative Review & Meta-Analysis - Lecture
Document46 pages
Narrative Review & Meta-Analysis - Lecture
Hans Natanael
100% (1)
Research Methods
Document245 pages
Research Methods
Kathleen Castillo
100% (1)