Welcome to Scribd!

Machine Learning Unsupervised

Uploaded by

0% found this document useful (0 votes)

2 views13 pages

Unsupervised learning techniques can be used for association and clustering. Association identifies frequent patterns and relationships in data using techniques like apriori algorithm. Clustering groups similar data points together by partitioning them into clusters with high internal similarity. Popular clustering methods include k-means which assigns data points to the closest cluster mean and iteratively updates cluster means until convergence. Both association and clustering are useful for applications like recommendations, fraud detection, and market segmentation.

Original Description:

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

2 views13 pages

Machine Learning Unsupervised

Uploaded by

Abhinandan Ghosh

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 13

Search inside document

Unsupervised Learning

• Association
• Clustering
Association
• Affinity analysis – what goes with what
• Groups of items purchased together (Store layout &
Cross selling)
• If-then clause (One or more with one)
• Antecedent/Consequent –
Disjoint/Non-trivial/Interpretable
(Buyers of an insurance policy will also buy a car with probability of 0.98)
• Application: Recommender systems in e-commerce /
Web mining / Credit card purchase
• Identification of frequent item sets
Apriori algorithm
• Method to extract strong rules in a set of transactions
• Principle: If an item set is frequent, then all its subsets are also
frequent
• Item set {a,b,c} -> List subsets - > how many?
• {a}, {b}, {c}, {a,b}, {b,c} , {c,a}
• Principle is based on the concept of identification of cardinality
Types of association rules

1. Symmetric binary attributes (Male/Female)

2. Continuous attributes
3. Multi-dimensional
4. Sequential
5. Multi-level
Two stage algorithm
• First stage – Generation of frequent item sets
• Scanning of data sets to compute frequency of each object
• Frequency < s(min) – discard
• 1 item set frequency generate followed by 2 item and so on
till k item (cardinality)
• Support < s(min) – discard
• Repeat algorithm iteratively
Problem: Set s(min) = 0.2; How many frequent item sets
found?
• Sample: Iteration 1: relative frequency for frequency 1
item set
Item set Relative frequency Status

{a} 7/10 = 0.7 Frequent

{b} 0.7 Frequent

{c} 0.5 Frequent

{d} 0.3 Frequent

{e} 0.3 Frequent

• Repeat for 2 item set & 3 item set. Do you have 4 item
set?
Cluster Analysis
Cluster Analysis
• Large databases – disadvantage of classification
• Grouping of data into clusters – Objects within the
cluster have high similarity as compared to objects in
other clusters which would be dissimilar
• Partitioning of data into groups with high data similarity
and assigning labels
• Application –
• market research, pattern recognition (outlier), image
processing, classification of documents in web,
detection of credit card fraud, insurance policy holders
with high average claim, land use in earth observation,
monitoring criminal activities in electronic commerce
• Unsupervised learning – learns by observation
• Requirements of clustering –
• Scalability
• Ability to deal with different types of attributes
• Could be of any arbitrary shape
• Handling multi dimensional data
• Should be able to handle noisy data
• Interpretable and usable
Major clustering methods
Partitioning method – used in small to medium db
• Database of n objects & k partitions
• Cluster representation k<=n
• A) each group must contain at least one object
• B) each object must belong to exactly one gp
• Iterative relocation technique
• Good partitioning technique – objects in same cluster
closer & objects in different cluster far apart.
k-means partitioning algorithm – non
categorical attributes
• Input: k- number of clusters & D : dataset containing n
objects
• Output: Set of k clusters
• Steps:
• Choose k arbitrarily and cluster centers (mean)
• Repeat
• Reassign each object to the cluster to which the object is
very similar (mean)
• Update the cluster means
• Until it stops
• Sensitive to outliers

Regression Analysis: Mathematical Methods of Cognitive Science
Document12 pages
Regression Analysis: Mathematical Methods of Cognitive Science
MANVI JAIN
No ratings yet
5 Algoritma Klastering
Document85 pages
5 Algoritma Klastering
icobes ur
No ratings yet
PR 2 Q1 Module 1-3
Document28 pages
PR 2 Q1 Module 1-3
Dionisio Jr. Ocsillos
No ratings yet
Deep Learning with R, Second Edition
From Everand
Deep Learning with R, Second Edition
Francois Chollet
No ratings yet
Top 9 Data Science Algorithms
Document152 pages
Top 9 Data Science Algorithms
Manjunath.R
No ratings yet
Mining Frequent Itemset-Association Analysis
Document59 pages
Mining Frequent Itemset-Association Analysis
Sandeep Dwivedi
No ratings yet
Supervised Learning: Adane Letta Mamuye (PHD)
Document41 pages
Supervised Learning: Adane Letta Mamuye (PHD)
ABDULHAMID
No ratings yet
Supervised and Unsupervised Learning: Ciro Donalek Ay/Bi 199 - April 2011
Document69 pages
Supervised and Unsupervised Learning: Ciro Donalek Ay/Bi 199 - April 2011
Emmanuel Harris
No ratings yet
Bia Unit-3 Part-2
Document43 pages
Bia Unit-3 Part-2
Nishant Gupta
No ratings yet
Clustering Algorithm: A Fundamental Operation in Data Mining
Document44 pages
Clustering Algorithm: A Fundamental Operation in Data Mining
Maelo Borinqueño
No ratings yet
06 Cluster Analysis
Document34 pages
06 Cluster Analysis
hawariya abel
No ratings yet
Chapter 5
Document43 pages
Chapter 5
Bikila Seketa
No ratings yet
M8 Klastering
Document83 pages
M8 Klastering
Teofilus Evan
No ratings yet
Apriori
Document27 pages
Apriori
Sddr
No ratings yet
Data Mining Data Transformations: Gergely Lukács
Document51 pages
Data Mining Data Transformations: Gergely Lukács
Blazs
No ratings yet
On Unit-3
Document30 pages
On Unit-3
Nihar Ranjan Prusty 92
No ratings yet
Apriori
Document27 pages
Apriori
Yogesh Bansal
No ratings yet
Apriori Algorithm
Document28 pages
Apriori Algorithm
DrArun Kumar Choudhary
No ratings yet
DA 4class
Document33 pages
DA 4class
kireet04
No ratings yet
Clustering Algorithm
Document144 pages
Clustering Algorithm
Sohail Ahmad
No ratings yet
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
Document42 pages
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
Dineshkannan Ravi
No ratings yet
What Is Frequent Pattern Analysis?
Document5 pages
What Is Frequent Pattern Analysis?
Âįmân Śhêikh
No ratings yet
Mining Association Rules
Document28 pages
Mining Association Rules
Manav Chhabra
No ratings yet
Data Mining CS4168 Lecture 5 Basics of Classification 1
Document25 pages
Data Mining CS4168 Lecture 5 Basics of Classification 1
alina sheikh
No ratings yet
DuongToGiangSon 517H0162 HW2 Nov-26
Document17 pages
DuongToGiangSon 517H0162 HW2 Nov-26
Son Tran
No ratings yet
Technical Seminar On K-Means Clustering in Data Mining: Darshna Sharma 1HK18IS086 Guide: Prof. Priyanka K
Document22 pages
Technical Seminar On K-Means Clustering in Data Mining: Darshna Sharma 1HK18IS086 Guide: Prof. Priyanka K
Darshna Sharma
No ratings yet
MachineLearning - Algorithms - Tagged
Document35 pages
MachineLearning - Algorithms - Tagged
Anthony Corneau
No ratings yet
Yum Yum D Giga
Document368 pages
Yum Yum D Giga
Siddhant Singhania
No ratings yet
Data Mining: I Gede Mahendra Darmawiguna
Document25 pages
Data Mining: I Gede Mahendra Darmawiguna
Bitboxk
No ratings yet
Partitioning Methods
Document3 pages
Partitioning Methods
Diyar T Alzuhairi
100% (1)
Dmbi Unit-4
Document18 pages
Dmbi Unit-4
Paras Sharma
No ratings yet
UNIT - II - Data Mining Essentials
Document20 pages
UNIT - II - Data Mining Essentials
vani
No ratings yet
IME672 - Lecture 43
Document25 pages
IME672 - Lecture 43
Himanshu Beniwal
No ratings yet
Custer Analysis: Prepared by Navin Ninama
Document20 pages
Custer Analysis: Prepared by Navin Ninama
Nishith Lakhlani
No ratings yet
Preprocessing
Document62 pages
Preprocessing
poi.tamrakar
No ratings yet
Data Mining: Kabith Sivaprasad (BE/1234/2009) Rimjhim (BE/1134/2009) Utkarsh Ahuja (BE/1226/2009)
Document32 pages
Data Mining: Kabith Sivaprasad (BE/1234/2009) Rimjhim (BE/1134/2009) Utkarsh Ahuja (BE/1226/2009)
Rule2
No ratings yet
Unit 5
Document31 pages
Unit 5
minichel
No ratings yet
Data Mining: Practical Machine Learning Tools and Techniques
Document69 pages
Data Mining: Practical Machine Learning Tools and Techniques
elgatoa3
No ratings yet
Pengantar Datamining: Anto Satriyo Nugroho, DR - Eng
Document33 pages
Pengantar Datamining: Anto Satriyo Nugroho, DR - Eng
Rendy Dwi Anugrah Putra
No ratings yet
W6 Clustering
Document29 pages
W6 Clustering
5599RAJNISH SINGH
No ratings yet
Machine Learning Functionalities
Document58 pages
Machine Learning Functionalities
Rashi Agarwal
No ratings yet
Decision Tree
Document18 pages
Decision Tree
Rithvik Dadapuram
No ratings yet
DM - 01 - 02 - Data Mining Functionalities PDF
Document63 pages
DM - 01 - 02 - Data Mining Functionalities PDF
shouryaraj batra
No ratings yet
Machine Learning
Document33 pages
Machine Learning
shobhit
No ratings yet
L2 A Short Preproc
Document42 pages
L2 A Short Preproc
Shame Bope
No ratings yet
Unit 4 - Data Warehousing and Mining
Document51 pages
Unit 4 - Data Warehousing and Mining
Ã S Àdhìkãrí
No ratings yet
Web Document Clustering Using: Fuzzy Equivalence Relations
Document17 pages
Web Document Clustering Using: Fuzzy Equivalence Relations
sangor1
No ratings yet
Object Recognition
Document43 pages
Object Recognition
A J
No ratings yet
Clustering
Document104 pages
Clustering
Dev kartik Agarwal
No ratings yet
Association Rule Mining With R
Document58 pages
Association Rule Mining With R
wirapong chansanam
No ratings yet
Unit Iv Cluster Analysis What Is Clusteranalysis?
Document24 pages
Unit Iv Cluster Analysis What Is Clusteranalysis?
Hit Man
No ratings yet
What Is Data Mining Again?: Unsuspected Relationships Summarize Understandable and Useful Models
Document29 pages
What Is Data Mining Again?: Unsuspected Relationships Summarize Understandable and Useful Models
Joseph Conteh
No ratings yet
Efficient Clustering Approaches For Organizing Document Collection
Document29 pages
Efficient Clustering Approaches For Organizing Document Collection
Sifatullah Siddiqi
No ratings yet
Data Mining CH - 5
Document18 pages
Data Mining CH - 5
Hasset Tiss Abay Genji
No ratings yet
Note 1455181909
Document30 pages
Note 1455181909
Ayman Ayman
No ratings yet
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
Document9 pages
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
Irum Fatima
No ratings yet
CIS664-Knowledge Discovery and Data Mining
Document52 pages
CIS664-Knowledge Discovery and Data Mining
Akbar Kushanoor
No ratings yet
Data Preprocessing Part 3
Document31 pages
Data Preprocessing Part 3
new acc jeet
No ratings yet
Unit 1 - Big Data Technologies
Document89 pages
Unit 1 - Big Data Technologies
prakash N
No ratings yet
Concepts - Decision Trees
Document23 pages
Concepts - Decision Trees
mtemp7489
No ratings yet
CIS664-Knowledge Discovery and Data Mining
Document74 pages
CIS664-Knowledge Discovery and Data Mining
rbvgre
No ratings yet
Knowledge Discovery and Data Mining
Document55 pages
Knowledge Discovery and Data Mining
Rupesh V
No ratings yet
CH10B
Document20 pages
CH10B
Faustine Angela Zipagan
No ratings yet
Impacts of Inadequate Computer Facilities To Digital Literacy Skills of Grade 11 Students of Saint Vincent de Paul Diocesan College
Document43 pages
Impacts of Inadequate Computer Facilities To Digital Literacy Skills of Grade 11 Students of Saint Vincent de Paul Diocesan College
Bianca
No ratings yet
CS Ec Ec116 Bacani - J A 2019 1
Document4 pages
CS Ec Ec116 Bacani - J A 2019 1
Jubert Calamba
No ratings yet
Kuhn - Machine Learning With Class Imbalances
Document103 pages
Kuhn - Machine Learning With Class Imbalances
jc224
No ratings yet
Cluster Analysis
Document2 pages
Cluster Analysis
awanish kumar
No ratings yet
ISCED-f 2013 Detailed Field Descriptions
Document96 pages
ISCED-f 2013 Detailed Field Descriptions
Toni D.
No ratings yet
Sub Committee For Curriculum Development QS &A Specialization
Document3 pages
Sub Committee For Curriculum Development QS &A Specialization
vineet lakra
No ratings yet
Point Estimate
Document2 pages
Point Estimate
mejoy marbida
No ratings yet
Coh 602-Sas Analysis Project
Document10 pages
Coh 602-Sas Analysis Project
api-290742611
100% (1)
Difficulties in Learning Basic Concepts in Probability and Statistics: Implications For Research
Document21 pages
Difficulties in Learning Basic Concepts in Probability and Statistics: Implications For Research
Roy Umaña Carrillo
No ratings yet
Cohen's Conventions For Small, Medium, and Large Effects: Difference Between Two Means
Document2 pages
Cohen's Conventions For Small, Medium, and Large Effects: Difference Between Two Means
Jonathan Delos Santos
No ratings yet
GENMATH and STATPRO - Review Materials
Document50 pages
GENMATH and STATPRO - Review Materials
alyssa
No ratings yet
Short-Term Actuarial Mathematics Exam-October 2018
Document8 pages
Short-Term Actuarial Mathematics Exam-October 2018
Bryan Cheng
No ratings yet
GE401 MMW Midterm Exam
Document13 pages
GE401 MMW Midterm Exam
Bhebz Erin Mae
No ratings yet
Isye6501 Office Hour Fa22 Week07 Thu
Document10 pages
Isye6501 Office Hour Fa22 Week07 Thu
Xuan Kuang
No ratings yet
SIP Chalk Insect Repelllent
Document16 pages
SIP Chalk Insect Repelllent
joseph
No ratings yet
Vinokur
Document9 pages
Vinokur
ehernan00
No ratings yet
Distribution Tables (T, and Chi)
Document2 pages
Distribution Tables (T, and Chi)
Anass B
No ratings yet
Knowledge and Practices Regarding Management of Minor Ailments of Pregnancy Among Antenatal Mothers: A Descriptive Study From Rajasthan
Document8 pages
Knowledge and Practices Regarding Management of Minor Ailments of Pregnancy Among Antenatal Mothers: A Descriptive Study From Rajasthan
Mudasir Ahmad Bhat
No ratings yet
Perceived Usefulness of Online Tutorials
Document26 pages
Perceived Usefulness of Online Tutorials
andrea bacani
No ratings yet
Slide Sampling
Document14 pages
Slide Sampling
نور الفاتحة
No ratings yet
Lecture
Document6 pages
Lecture
Jubillee Magsino
No ratings yet
App Prob2018 2
Document2 pages
App Prob2018 2
claudio
No ratings yet
A Critical Study On Ratio Analysis Between Indian Oil Corporation Ltd. & Hindustan Petroleum Corporation Ltd. - 074334
Document116 pages
A Critical Study On Ratio Analysis Between Indian Oil Corporation Ltd. & Hindustan Petroleum Corporation Ltd. - 074334
Deepjyot Singh Walia
100% (1)
Assessing High School Students' Pro-Environmental Behaviour
Document6 pages
Assessing High School Students' Pro-Environmental Behaviour
Nice Rodriguez Arnejo
No ratings yet
Data Analysis Techniques MBA and EMBA March 22 2017
Document92 pages
Data Analysis Techniques MBA and EMBA March 22 2017
Roshan Rai
No ratings yet
Ejihpe 12 00078
Document13 pages
Ejihpe 12 00078
Shilpa
No ratings yet
1.4 Probability Concepts
Document41 pages
1.4 Probability Concepts
Mario
No ratings yet