Unsupervised clustering techniques for market segmentation

Uploaded by

Ilion Barboso

0% found this document useful (0 votes)

4 views8 pages

Original Title

DIGI WEEK 10 (2)

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

4 views8 pages

Unsupervised clustering techniques for market segmentation

Uploaded by

Ilion Barboso

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 8

Search inside document

Unsupervised models: clustering techniques

Unsupervised learning models

Cluster analysis
Introduction
• Clustering is used in many areas from astronomy to sociology
• Clustering → segments the data
• Famous example
– Mendeleyev's periodic table (Scheikunde)
• Examples in business
– Market segmentation (personas)
– Balanced portfolios in finance
– Industry analysis
• Useful to improve performance of supervised methods
– Model clusters separately instead of heterogeneous dataset

Why?
- Group similar utilities to predict cost impact of deregulation
Distance measures
• Record i: (xi1, xi2, ..., xip)
• Record j: (xj1, xj2, ..., xjp)
• dij: distance metric dissimilarity measure
• Properties for distances
– Non-negative: dij ≥ 0 – Self-proximity: dii = 0
– Symmetry: dij = dji
– Triangle inequality: dij ≤ dik + dkj

Euclidean distance

• Normalization
– Before computing distance
– z-scores = (xi−ˆx) σx
• Unequal weights possible

• Features of this measure

– Highly scale dependent
– Ignores vars relationships
– Sensitive to outliers

Choosing distance measure

• Distance choice plays a role in the analysis – Domain dependent
• Distance measures
– Euclidean → dissimilarity
– Square of Pearson → correlation-based similarity
– Mahalanobis → accounts for correlation between vars
– Manhattan → absolute distance
– Maximum → vars with highest deviation

Distance for categorical variables

• Example: binary variables
• Matching coefficient: (a+d) / p
• Jaquard’s coefficient: d / (b+c+d)
• Gower’s similarity: mixed data
Clustering techniques

Hierarchical clustering
• Arrange groups into a natural hierarchy
• Algorithm for agglomerative
1. Start with n clusters (each record is a cluster)
2. Merge two closest records into a cluster
3. Repeat steps to merge two
clusters/records with smallest
distance
Hierarchical agglomerative clustering
Dendrograms
• Summarizes process of clustering
• x-axis: records
• y-axis: distance
• Cutoff distance: horizontal line

Interpreting
K-Means
• Pre-specified number of clusters
• Minimize measure of dispersion within clusters
– Sum of distances of records to centroid
– Sum of squared Euclidean distances of records to centroid
• Algorithm
1. Start with k initial clusters
2. At every step, each record is reassigned to cluster with the closest
centroid
3. Recompute centroid of clusters that lost/gained records and repeat 2
4. Stop when moving records increases cluster dispersion

Choosing k
• Previous knowledge
• Practical constraints
• Try a few k’s and compare results
– Randomly generated starting points helps with avoiding poor results
• There is an optimum solution, but computationally expensive to solve
Interpreting

Validating clusters
• Meaningful clusters that generate insights
• Interpretability
– Can you assign a label?
• Stability
– Do clusters change a lot with a slight input change?
– Check with data partition
• Number of clusters
– Result must be useful

The Node - Js Developer Roadmap For 2021
Document6 pages
The Node - Js Developer Roadmap For 2021
Gusba Razelion
No ratings yet
Oracle HRMS Tables - Part1 & Part2
Document78 pages
Oracle HRMS Tables - Part1 & Part2
Hamdy Mohamed
100% (2)
5 Algoritma Klastering
Document85 pages
5 Algoritma Klastering
icobes ur
No ratings yet
Data Analysis With Pandas - Introduction To Pandas Cheatsheet - Codecademy PDF
Document3 pages
Data Analysis With Pandas - Introduction To Pandas Cheatsheet - Codecademy PDF
Tawsif Hasan
100% (1)
Clustering K-Means
Document28 pages
Clustering K-Means
Faysal Ahammed
No ratings yet
Supervised Learning 1 PDF
Document162 pages
Supervised Learning 1 PDF
Alexander
No ratings yet
SAP HANA Troubleshooting and Performance Analysis Guide en SPS 04
Document248 pages
SAP HANA Troubleshooting and Performance Analysis Guide en SPS 04
Julio Garcia
No ratings yet
Clustering
Document47 pages
Clustering
سارة شعير
No ratings yet
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
Document51 pages
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
popat vishal
No ratings yet
CLIQUE and PROCLUS
Document13 pages
CLIQUE and PROCLUS
Tanya Sharma
No ratings yet
9.54 Class 13: Unsupervised Learning
Document54 pages
9.54 Class 13: Unsupervised Learning
GrantMwakipunda
No ratings yet
Clustering Algorithm
Document144 pages
Clustering Algorithm
Sohail Ahmad
No ratings yet
ACFrOgCajrghX8QYes4eQZ0sdYkSYcgCfngE3 G40h28YsPxSNUI5pWUj1kIOR5d1d2nVkHBNqBJQVMMKTJ6lSwm5kuENTMySlduAvwhEcn-N5iutSBNaAaDhkol5Hv3mPmTl0q-ahwmr7GR 2cj
Document95 pages
ACFrOgCajrghX8QYes4eQZ0sdYkSYcgCfngE3 G40h28YsPxSNUI5pWUj1kIOR5d1d2nVkHBNqBJQVMMKTJ6lSwm5kuENTMySlduAvwhEcn-N5iutSBNaAaDhkol5Hv3mPmTl0q-ahwmr7GR 2cj
ethan
No ratings yet
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
Document42 pages
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
Dineshkannan Ravi
No ratings yet
Digitization Week 8
Document13 pages
Digitization Week 8
Ilion Barboso
No ratings yet
Unsupervised Learning and Clustering
Document26 pages
Unsupervised Learning and Clustering
Jay Ranjit
No ratings yet
Lect 4
Document34 pages
Lect 4
yoursweetseptember
No ratings yet
PMBD 04 Clustering
Document59 pages
PMBD 04 Clustering
Diana Pernas
No ratings yet
Unsupervised Machine Learning Techniques
Document24 pages
Unsupervised Machine Learning Techniques
ABDULHAMID
No ratings yet
Chapter 4 PDF
Document89 pages
Chapter 4 PDF
Anirudh Tripathi
No ratings yet
ML Unit 3
Document83 pages
ML Unit 3
sanju.25qt
No ratings yet
Unsupervised Learning Modi
Document16 pages
Unsupervised Learning Modi
SatishKakarla
No ratings yet
06 Cluster Analysis
Document34 pages
06 Cluster Analysis
hawariya abel
No ratings yet
Data Mining Clustering Algorithms
Document83 pages
Data Mining Clustering Algorithms
Teofilus Evan
No ratings yet
CURE
Document14 pages
CURE
Punitha viswanathan
No ratings yet
Presentation Malo
Document65 pages
Presentation Malo
r_somnath
No ratings yet
BA2 7 Cluster
Document33 pages
BA2 7 Cluster
034AJINKYA KULKARNI
No ratings yet
Clustering Algorithms
Document61 pages
Clustering Algorithms
Ayesha Khan
No ratings yet
Decision Trees
Document37 pages
Decision Trees
Dennis Angel
No ratings yet
Unit 4
Document65 pages
Unit 4
lghmshari
No ratings yet
Chapter 5 Clustering
Document40 pages
Chapter 5 Clustering
Mohamedsultan Awol
No ratings yet
Introduction to Machine Learning Algorithms
Document37 pages
Introduction to Machine Learning Algorithms
sanketjaiswal
No ratings yet
Clustering Techniques in Data Mining
Document18 pages
Clustering Techniques in Data Mining
Hasset Tiss Abay Genji
No ratings yet
Foundations of Machine Learning: Module 3: Instance Based Learning and Feature Reduction
Document40 pages
Foundations of Machine Learning: Module 3: Instance Based Learning and Feature Reduction
Nishant Tiwari
No ratings yet
16 dm2 Dimred 2022 23
Document49 pages
16 dm2 Dimred 2022 23
nimra
No ratings yet
Data Mining: I Gede Mahendra Darmawiguna
Document25 pages
Data Mining: I Gede Mahendra Darmawiguna
Bitboxk
No ratings yet
Data Mining: Clustering
Document46 pages
Data Mining: Clustering
shwetadhatterwal
No ratings yet
Distance-Based Models and Clustering Algorithms Explained
Document19 pages
Distance-Based Models and Clustering Algorithms Explained
Nidhi
No ratings yet
Chap 5 1 NN Classification
Document22 pages
Chap 5 1 NN Classification
ayman
0% (1)
Cluster Analysis Concept & Methods
Document14 pages
Cluster Analysis Concept & Methods
Kshitij Vijayvergia
No ratings yet
Data Mining Data Transformations: Gergely Lukács
Document51 pages
Data Mining Data Transformations: Gergely Lukács
Blazs
No ratings yet
Cluster Analysis Techniques and Applications
Document152 pages
Cluster Analysis Techniques and Applications
Shashwat Mishra
No ratings yet
Clustering
Document80 pages
Clustering
Aatmaj Salunke
No ratings yet
Medical Image Analysis Classification and Clustering Methods
Document41 pages
Medical Image Analysis Classification and Clustering Methods
Swathika Ramesh
No ratings yet
Custer Analysis: Prepared by Navin Ninama
Document20 pages
Custer Analysis: Prepared by Navin Ninama
Nishith Lakhlani
No ratings yet
CS490D: Introduction To Data Mining: Prof. Chris Clifton
Document109 pages
CS490D: Introduction To Data Mining: Prof. Chris Clifton
Sanjay Nath
No ratings yet
MLCH9
Document45 pages
MLCH9
sam33rdhakal
No ratings yet
Sathyabama Institute of Science and Technology SIT1301-Data Mining and Warehousing
Document22 pages
Sathyabama Institute of Science and Technology SIT1301-Data Mining and Warehousing
viktahjm
No ratings yet
Non Parametric Classification: Pattern Recognition
Document74 pages
Non Parametric Classification: Pattern Recognition
marshadmit
No ratings yet
CLUSTER ANALYSIS
Document15 pages
CLUSTER ANALYSIS
Kshitij Tamrakar
No ratings yet
Segmentation Algorithms: Václav Krajíček
Document51 pages
Segmentation Algorithms: Václav Krajíček
Rachna
No ratings yet
Week 04 Lecture Material
Document52 pages
Week 04 Lecture Material
Meer Hassan
No ratings yet
What Is Cluster Analysis?
Document20 pages
What Is Cluster Analysis?
kqureshi123
No ratings yet
What Is Cluster Analysis?
Document24 pages
What Is Cluster Analysis?
rohit7853
No ratings yet
Pattern Recognition_clustering_classification
Document177 pages
Pattern Recognition_clustering_classification
anilipg07
No ratings yet
Lazy Learners Unit 2
Document26 pages
Lazy Learners Unit 2
Manshi
No ratings yet
w2 - Fundamentals of Learning
Document37 pages
w2 - Fundamentals of Learning
Swastik Sindhani
No ratings yet
Cluster Analysis: Abu Bashar
Document18 pages
Cluster Analysis: Abu Bashar
Abu Bashar
No ratings yet
Spectral: Learning Clustering
Document36 pages
Spectral: Learning Clustering
Dhakshana Murthi
No ratings yet
Data Mining Unit-Iv
Document34 pages
Data Mining Unit-Iv
lokeshappalaneni9
No ratings yet
What is Cluster Analysis
Document9 pages
What is Cluster Analysis
Irum Fatima
No ratings yet
Grouping
Document98 pages
Grouping
Aditya Patel
No ratings yet
Agenda: 1. Introduction To Clustering
Document47 pages
Agenda: 1. Introduction To Clustering
Salih Genel
No ratings yet
Numerical Analysis of Wavelet Methods
From Everand
Numerical Analysis of Wavelet Methods
A. Cohen
No ratings yet
Digitizatie Week 12
Document7 pages
Digitizatie Week 12
Ilion Barboso
No ratings yet
Analyze Time Series Data with Descriptive and Predictive Methods
Document8 pages
Analyze Time Series Data with Descriptive and Predictive Methods
Ilion Barboso
No ratings yet
DIgitization Week 7
Document6 pages
DIgitization Week 7
Ilion Barboso
No ratings yet
Digitization Week 8
Document13 pages
Digitization Week 8
Ilion Barboso
No ratings yet
Management Accounting Hoorcollege Aantekeningen 2021
Document39 pages
Management Accounting Hoorcollege Aantekeningen 2021
Ilion Barboso
No ratings yet
Samenvatting CG Slides-Combined
Document59 pages
Samenvatting CG Slides-Combined
Ilion Barboso
No ratings yet
SV Corporate Governance
Document31 pages
SV Corporate Governance
Ilion Barboso
No ratings yet
TA 4 Data
Document1 page
TA 4 Data
Ilion Barboso
No ratings yet
Week 11 Data Formules
Document1 page
Week 11 Data Formules
Ilion Barboso
No ratings yet
Big Data Visualization and Analytics: Future Research Challenges and Emerging Applications
Document9 pages
Big Data Visualization and Analytics: Future Research Challenges and Emerging Applications
Fatima Noor
No ratings yet
Software Engineering Is A Layered Technology
Document2 pages
Software Engineering Is A Layered Technology
unimourya
No ratings yet
Changing P6 Settings To Import Budget Costs From Excel Into P6
Document11 pages
Changing P6 Settings To Import Budget Costs From Excel Into P6
Ameer Joshi
No ratings yet
Database System: Concepts and Design: December 2003
Document20 pages
Database System: Concepts and Design: December 2003
Adis Adis
No ratings yet
Datawarehouse Architecture Business Analysis Framework
Document7 pages
Datawarehouse Architecture Business Analysis Framework
durai murugan
No ratings yet
Absc Untitled
Document28 pages
Absc Untitled
Rahul Rathore
No ratings yet
Document 140409074526 Phpapp01
Document66 pages
Document 140409074526 Phpapp01
Pallavi Pallu
No ratings yet
Citing and Referencing in Latex - Using Bibtex: 1. Inserting Citations and Generating A Reference List
Document2 pages
Citing and Referencing in Latex - Using Bibtex: 1. Inserting Citations and Generating A Reference List
gndfg
No ratings yet
Test 66
Document223 pages
Test 66
Kshitija Warule
No ratings yet
Documentum System 16.7 Upgrade and Migration Guide
Document141 pages
Documentum System 16.7 Upgrade and Migration Guide
Zinedine Zidane
No ratings yet
P 6 Presentation
Document41 pages
P 6 Presentation
Unais1986
No ratings yet
DM02 - Lab Manual - Advanced
Document35 pages
DM02 - Lab Manual - Advanced
André Corenzan
No ratings yet
Arsitektur Oea Big Data Guide
Document11 pages
Arsitektur Oea Big Data Guide
noviari_sugianto8513
No ratings yet
Database Processing Fundamentals Design and Implementation 13th Edition Kroenke Test Bank
Document21 pages
Database Processing Fundamentals Design and Implementation 13th Edition Kroenke Test Bank
a176696165
No ratings yet
Man - 10 - Value Stream Mapping - 2-2019
Document4 pages
Man - 10 - Value Stream Mapping - 2-2019
Felipe Florián
No ratings yet
Database Hung! What To Do?
Document3 pages
Database Hung! What To Do?
Nainika Kedarisetti
No ratings yet
OOSAD Course Outline
Document3 pages
OOSAD Course Outline
Moti King Moti
No ratings yet
Scriptcase Macros
Document6 pages
Scriptcase Macros
Meliana Wang
No ratings yet
SQL Express 2019 Log - Registry Items
Document1,106 pages
SQL Express 2019 Log - Registry Items
it
No ratings yet
Artificial Intelligence in E Commerce A Bibliometric Study
Document42 pages
Artificial Intelligence in E Commerce A Bibliometric Study
Dan Nemerenco
No ratings yet
PDF Generated At: Sun, 27 May 2012 01:27:47 UTC
Document135 pages
PDF Generated At: Sun, 27 May 2012 01:27:47 UTC
José Daniel Centurión Olguín
No ratings yet
PhreePlot (234 467)
Document234 pages
PhreePlot (234 467)
Jeison Blanco
No ratings yet
1 Introduction To Databases
Document35 pages
1 Introduction To Databases
Bricious Mulimbi
100% (1)
Project Estimation Techniques for Software Development
Document52 pages
Project Estimation Techniques for Software Development
Gelata Girmaye
No ratings yet
Sheet 07
Document3 pages
Sheet 07
eir.gn
No ratings yet
The Graph Whitepaper
Document12 pages
The Graph Whitepaper
Khalil Laamiri
No ratings yet