Welcome to Scribd!

What Is Cluster Analysis?: Unsupervised Learning Supervised Learning

Uploaded by

0% found this document useful (0 votes)

8 views4 pages

Cluster analysis divides data into groups (clusters) where objects within a cluster are similar to each other and dissimilar to objects in other clusters. Unlike classification, cluster analysis is unsupervised learning as it does not rely on predefined labels. The goal of cluster analysis is to group similar objects based only on the information present in the data for descriptive purposes rather than prediction.

Original Description:

Original Title

STAT202-lecture2_project3

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

8 views4 pages

What Is Cluster Analysis?: Unsupervised Learning Supervised Learning

Uploaded by

Bao Gan

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 4

Search inside document

What is Cluster Analysis?

z “Cluster analysis divides data into groups (clusters)

that are meaningful, useful, or both” (page 487)

z It is similar to classification, only now we don’t know

the “answer” (we don’t have the labels)

z For this reason, clustering is often called

unsupervised learning while classification is often called
supervised learning (page 491 – but the book says
“classification” instead of “learning”)

z Note that there also exists semi-supervised learning

which is a combination of both and is a hot
research area right now 9
What is Cluster Analysis?
z Because there is no right answer, your book
characterizes clustering as an exercise in descriptive
statistics rather than prediction

z “Cluster analysis groups data objects based only on

information found in the data that describes the objects
and their similarities” (page 490)

z “The goal is that objects within a group be similar (or

related) to one another and different from (or unrelated
to) the objects in other groups” (page 490)

10
Examples of Clustering (P. 488)

z Information Retrieval: search engine documents =

cluster documents about the same person

z Climate: Clusters = regions of similar climate

z Psychology and Medicine: patterns in spatial or

temporal distribution of a disease

z Business: Segment customers into groups for

marketing activities

11
Two Reasons for Clustering (P. 488)
z Clustering for Understanding
(see examples from previous slide)

z Clustering for Utility

-Summarizing: different algorithms can run faster on

a data set summarized by clustering

-Compression: storing cluster information is more

efficient that storing the entire data -
example: quantization

-Finding Nearest Neighbors 12

Ch4 EY Data Visualization Slides
Document47 pages
Ch4 EY Data Visualization Slides
Yuqing LU
No ratings yet
Chapter-8 (Cluster Analysis Basic Concepts and Algorithms)
Document73 pages
Chapter-8 (Cluster Analysis Basic Concepts and Algorithms)
bcs2021047
No ratings yet
Flat Clustering PDF
Document73 pages
Flat Clustering PDF
ishu garg
No ratings yet
Cluster Analysis
Document2 pages
Cluster Analysis
Athena Chowdhury
No ratings yet
UNIT
Document24 pages
UNIT
Sravani Gunnu
No ratings yet
Data Clustering Seminar
Document34 pages
Data Clustering Seminar
PrateekChadha
No ratings yet
Unit 5 DWM by DR KSR Cluster Analysis
Document72 pages
Unit 5 DWM by DR KSR Cluster Analysis
Ganesh Degala
No ratings yet
Flat Clustering & Hierarchical Clustering in I.R
Document13 pages
Flat Clustering & Hierarchical Clustering in I.R
XY Z
No ratings yet
Conceptual Clustering
Document5 pages
Conceptual Clustering
john949
No ratings yet
Introduction To: Information Retrieval
Document48 pages
Introduction To: Information Retrieval
Tayyaba Faisal
No ratings yet
Lecture12 Clustering
Document48 pages
Lecture12 Clustering
arjun
No ratings yet
Importance of Clustering in Data Mining
Document5 pages
Importance of Clustering in Data Mining
Sattyasai Allapathi
No ratings yet
Mit401 Unit 12-Slm
Document20 pages
Mit401 Unit 12-Slm
Amit Parab
No ratings yet
6 Text Clustering
Document66 pages
6 Text Clustering
Tushar Shah
No ratings yet
Constant Comparison Method: A Kaleidoscope of DataDye Schatz Rosenberg Coleman Constant Comparison Method A Kaleidoscope of Data
Document10 pages
Constant Comparison Method: A Kaleidoscope of DataDye Schatz Rosenberg Coleman Constant Comparison Method A Kaleidoscope of Data
Thodoris Argirakis
No ratings yet
Cluster Analysis: Basic Concepts and Algorithms
Document141 pages
Cluster Analysis: Basic Concepts and Algorithms
Mayank Wadhwani
No ratings yet
Assignment 4
Document40 pages
Assignment 4
Aditya Boss
No ratings yet
Lecture 17 Clustering
Document63 pages
Lecture 17 Clustering
John Mathew
No ratings yet
Chapter8-Basic Cluster Analysis2016
Document143 pages
Chapter8-Basic Cluster Analysis2016
Riskaa Pricilia
No ratings yet
Data Mining Unit 5
Document30 pages
Data Mining Unit 5
Dr. M. Kathiravan Assistant Professor III - CSE
No ratings yet
D, A I C K D: Esign Nalysis AND Nterpretation OF Omparative Aleidoscop OF ATA
Document6 pages
D, A I C K D: Esign Nalysis AND Nterpretation OF Omparative Aleidoscop OF ATA
martin
No ratings yet
Fuzzy Clustering: Presented By: Nikita Gulati Bca-Vi (M)
Document9 pages
Fuzzy Clustering: Presented By: Nikita Gulati Bca-Vi (M)
Nikita Gulati
No ratings yet
Improved K-Means Clustering Algorithm by Getting Initial Cenroids
Document9 pages
Improved K-Means Clustering Algorithm by Getting Initial Cenroids
Oktavian Tegar Pambudi
No ratings yet
Assignment No: 2: Aim: Objective
Document4 pages
Assignment No: 2: Aim: Objective
Pratik B
No ratings yet
Clustering
Document6 pages
Clustering
Syed Hasib1971 Abdullah
No ratings yet
Part Eight PDF
Document124 pages
Part Eight PDF
Nashowan
No ratings yet
YEAH
Document2 pages
YEAH
Ankit Pathak
No ratings yet
Chapter8-Basic Cluster Analysis2018
Document143 pages
Chapter8-Basic Cluster Analysis2018
Zerlynda Fitria Nur Mayanti
No ratings yet
Multiple Clustering Views For Data Analysis
Document4 pages
Multiple Clustering Views For Data Analysis
International Journal of Application or Innovation in Engineering & Management
No ratings yet
Lectures 5 and 6 - Data Anaysis in Management - MBM
Document61 pages
Lectures 5 and 6 - Data Anaysis in Management - MBM
Влада Клочко
No ratings yet
Bs 31267274
Document8 pages
Bs 31267274
IJMER
No ratings yet
DMDW 5th Module
Document28 pages
DMDW 5th Module
Kavya Gowda
No ratings yet
Cluster Analysis
Document1 page
Cluster Analysis
Vert Reyes
No ratings yet
Philosophy of Data. Why. Jonathan Furner
Document17 pages
Philosophy of Data. Why. Jonathan Furner
CHAROLTH Palma H
No ratings yet
DWDM 5
Document12 pages
DWDM 5
divyaneelam175
No ratings yet
G Lavanya Computerscience
Document51 pages
G Lavanya Computerscience
Dhilsanth SL
No ratings yet
Unsupervised Learning
Document17 pages
Unsupervised Learning
Mahnoor Khan
No ratings yet
Data Mining Functionalities
Document4 pages
Data Mining Functionalities
Im' Possible
100% (1)
Data Structure
Document63 pages
Data Structure
macware23
No ratings yet
Clustering
Document9 pages
Clustering
nikhil shinde
No ratings yet
Clustering Examples
Document47 pages
Clustering Examples
dawit gebreyohans
No ratings yet
CS276A Text Retrieval and Mining: (Borrows Slides From Ray Mooney and Soumen Chakrabarti)
Document48 pages
CS276A Text Retrieval and Mining: (Borrows Slides From Ray Mooney and Soumen Chakrabarti)
Kristine Anne Montoya Quirante
No ratings yet
Curse of Dimensionality in Paradoxical High Dimensional Clinical Datasets A Survey
Document3 pages
Curse of Dimensionality in Paradoxical High Dimensional Clinical Datasets A Survey
ijcnes
No ratings yet
6902 An Applied Algorithmic Foundation For Hierarchical Clustering
Document10 pages
6902 An Applied Algorithmic Foundation For Hierarchical Clustering
galaxystar
No ratings yet
Module5 QB 1
Document21 pages
Module5 QB 1
Vaishnavi G . Rao
No ratings yet
ISTE - 612 Knowledge Processing Technologies: Week 12 Text Clustering
Document34 pages
ISTE - 612 Knowledge Processing Technologies: Week 12 Text Clustering
Rohit
No ratings yet
Teori Analisis Data Kualitatif
Document35 pages
Teori Analisis Data Kualitatif
Harun Al Rasyid
No ratings yet
Assignment Cover Sheet: Research Report On Clustering in Data Mining
Document13 pages
Assignment Cover Sheet: Research Report On Clustering in Data Mining
Fazal Mahar
No ratings yet
Bim Pa2 Week6 Ali
Document9 pages
Bim Pa2 Week6 Ali
ash
No ratings yet
L11 Cluster Analysis
Document47 pages
L11 Cluster Analysis
Đức Nguyễn
No ratings yet
An Efficient and Empirical Model of Distributed Clustering
Document5 pages
An Efficient and Empirical Model of Distributed Clustering
seventhsensegroup
No ratings yet
Covid-19-Literature-Clustering: Name: Samrina Siddiqui ROLL NO: DS-104 Ms-Data Science (Weekend)
Document7 pages
Covid-19-Literature-Clustering: Name: Samrina Siddiqui ROLL NO: DS-104 Ms-Data Science (Weekend)
samrina
No ratings yet
Data Structure Theoretical Approach
Document7 pages
Data Structure Theoretical Approach
Muhammad Fahad Naeem
No ratings yet
Unit 5
Document66 pages
Unit 5
Vidyadhar Dandnaik
No ratings yet
Module 5 DMDW
Document26 pages
Module 5 DMDW
Gowtham P B
No ratings yet
Clustering: Dr. Md. Al-Amin Bhuiyan
Document6 pages
Clustering: Dr. Md. Al-Amin Bhuiyan
Raihan Mastafa Khiljee
No ratings yet
Embedded Case Study Methods
Document7 pages
Embedded Case Study Methods
Novita Nur Laili
No ratings yet
Clustering
Document5 pages
Clustering
neha
No ratings yet
Machine Learning For Humans, Part 3 - Unsupervised Learning - by Vishal Maini - Machine Learning For Humans - Medium
Document23 pages
Machine Learning For Humans, Part 3 - Unsupervised Learning - by Vishal Maini - Machine Learning For Humans - Medium
dimo.michev
No ratings yet
Statistical and Neural Classifiers: An Integrated Approach to Design
From Everand
Statistical and Neural Classifiers: An Integrated Approach to Design
Sarunas Raudys
No ratings yet
Nonlinear Regression: Alternatively, Argmin
Document2 pages
Nonlinear Regression: Alternatively, Argmin
Bao Gan
No ratings yet
Statistics 202: Statistical Aspects of Data Mining Professor Rajan Patel
Document4 pages
Statistics 202: Statistical Aspects of Data Mining Professor Rajan Patel
Bao Gan
No ratings yet
Recommended Weekly Habits For Success
Document2 pages
Recommended Weekly Habits For Success
Bao Gan
No ratings yet
Nonlinear Regression Models: We Have Usually Assumed Regression Is of The Form
Document2 pages
Nonlinear Regression Models: We Have Usually Assumed Regression Is of The Form
Bao Gan
No ratings yet
Statistics 202: Data Mining: Based in Part On Slides From Textbook, Slides of Susan Holmes
Document21 pages
Statistics 202: Data Mining: Based in Part On Slides From Textbook, Slides of Susan Holmes
Bao Gan
No ratings yet
STAT202-homework1 Homework2
Document2 pages
STAT202-homework1 Homework2
Bao Gan
No ratings yet
Iteration & Distribution: Want To Choose As Follows Argmin
Document2 pages
Iteration & Distribution: Want To Choose As Follows Argmin
Bao Gan
No ratings yet
What To Do?: in Some Cases, It Is Possible To Linearize To Get The Original Model. Suppose
Document2 pages
What To Do?: in Some Cases, It Is Possible To Linearize To Get The Original Model. Suppose
Bao Gan
No ratings yet
Stat 201 - Project 1 - Spring 2019: Due Friday, February 8, 2019
Document9 pages
Stat 201 - Project 1 - Spring 2019: Due Friday, February 8, 2019
Bao Gan
No ratings yet
Statistics 202: Statistical Aspects of Data Mining Professor Rajan Patel
Document47 pages
Statistics 202: Statistical Aspects of Data Mining Professor Rajan Patel
Bao Gan
No ratings yet
Sections 1 and 6: Li Li Section 2: Naichen
Document4 pages
Sections 1 and 6: Li Li Section 2: Naichen
Bao Gan
No ratings yet
STAT202-homework2 HW21
Document2 pages
STAT202-homework2 HW21
Bao Gan
No ratings yet
Syllabus STA 36-202 - Statistics & Data Science Methods Spring 2018
Document15 pages
Syllabus STA 36-202 - Statistics & Data Science Methods Spring 2018
Bao Gan
No ratings yet
Stat 202: Hypothesis Testing Practice Problems
Document3 pages
Stat 202: Hypothesis Testing Practice Problems
Bao Gan
No ratings yet
Lab Day and Time
Document2 pages
Lab Day and Time
Bao Gan
No ratings yet
Computer Labs: Purpose of Lab
Document2 pages
Computer Labs: Purpose of Lab
Bao Gan
No ratings yet
Data Analysis (DA) Projects: Exam Coverage
Document2 pages
Data Analysis (DA) Projects: Exam Coverage
Bao Gan
No ratings yet
Accomplish: Oral Vocabulary
Document2 pages
Accomplish: Oral Vocabulary
Bao Gan
No ratings yet
Abundant
Document2 pages
Abundant
Bao Gan
No ratings yet
Accompanies
Document2 pages
Accompanies
Bao Gan
No ratings yet
Accident
Document2 pages
Accident
Bao Gan
No ratings yet
Abruptly
Document2 pages
Abruptly
Bao Gan
No ratings yet