Welcome to Scribd!

Lec2 Activities

Uploaded by

0% found this document useful (0 votes)

1 views2 pages

This document provides an overview of activities covered in Lecture 2 of an Introduction to Data Mining course. The activities include: 1. Identifying attribute types (numeric, nominal, binary) in sample data tables. 2. Exercises in text mining involving calculating statistical measures like mean, median, mode from sample age data and drawing boxplots of sample age and body fat data. 3. Computing different distance measures (Euclidean, Manhattan, Minkowski) between sample data tuples and ranking sample data points based on similarity to a query point using different similarity measures (Euclidean, Manhattan, supremum distances and cosine similarity).

Original Description:

Original Title

Lec2-Activities

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

1 views2 pages

Lec2 Activities

Uploaded by

tin nguyen

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 2

Search inside document

Introduction to Data Mining

Lecture 2 – Activities

1. Identify attribute types: Numeric, Nominal, or Binary, in the following data tables.

Outlook Temperature Humidity Windy Play

Sunny Hot High FALSE Yes

Overcast Mild Normal TRUE Yes
Rainy Cool High FALSE No

Outlook Temperature Humidity Windy Play

Sunny 85.0 70.0 FALSE Yes

Overcast 80.0 80.0 TRUE Yes
Rainy 75.0 85.0 FALSE No

2. Exercises in Text [1]: 2.2.a-f, 2.4.a-b, 2.6.a-c, 2.8.a

2.2. Suppose that the data for analysis includes the attribute age. The age values for the data tuples
are (in increasing order) 13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35,
35, 36, 40, 45, 46, 52, 70.
(a) What is the mean of the data? What is the median?
(b) What is the mode of the data? Comment on the data’s modality (i.e., bimodal, trimodal, etc.).
(c) What is the midrange of the data?
(d) Can you find (roughly) the first quartile (Q1) and the third quartile (Q3) of the data?
(e) Give the five-number summary of the data.
(f ) Show a boxplot of the data.

2.4. Suppose a hospital tested the age and body fat data for 18 randomly selected adults with the
following result.

(a) Calculate the mean, median and standard deviation of age and %fat.
(b) Draw the boxplots for age and %fat.

2.6. Given two objects represented by the tuples (22, 1, 42, 10) and (20, 0, 36, 8):
(a) Compute the Euclidean distance between the two objects.
(b) Compute the Manhattan distance between the two objects.
(c) Compute the Minkowski distance between the two objects, using h = 3.

1
Introduction to Data Mining

2.8. It is important to define or select similarity measures in data analysis. However, there is no
commonly accepted subjective similarity measure. Results can vary depending on the similarity
measures used. Nonetheless, seemingly different similarity measures may be equivalent after
some transformation.
Suppose we have the following two-dimensional data set:

(a) Consider the data as two-dimensional data points. Given a new data point, x = (1.4, 1.6) as a
query, rank the database points based on similarity with the query using Euclidean distance,
Manhattan distance, supremum distance, and cosine similarity.

Quiz Review
Document4 pages
Quiz Review
Matthew Chai Student - MillsParkMS
No ratings yet
Practice Exam Questions Statistics 301 Professor Wardrop Chapters 1, 12, 2, and 3
Document22 pages
Practice Exam Questions Statistics 301 Professor Wardrop Chapters 1, 12, 2, and 3
Hariss Luqman
100% (1)
No 2
Document2 pages
No 2
Asyraf Gary
No ratings yet
PCA How To.1
Document13 pages
PCA How To.1
bmwli
No ratings yet
Experimental Research Design Pre True and Quasi
Document27 pages
Experimental Research Design Pre True and Quasi
Ravi pandit
No ratings yet
ToothThe ToothGrowth Data Analysis in R Growth
Document3 pages
ToothThe ToothGrowth Data Analysis in R Growth
dsasas
No ratings yet
Data Mining 2020
Document2 pages
Data Mining 2020
waleed
No ratings yet
Assignment DMBI 2
Document2 pages
Assignment DMBI 2
IMMORTAL'S PLAYZ
No ratings yet
Ii Semester 2004-2005CS C415/is C415 - Data Mining
Document6 pages
Ii Semester 2004-2005CS C415/is C415 - Data Mining
ramanadk
No ratings yet
Government Engineering College Modasa Semester:7 (C.E) Machine Learning (3170724)
Document27 pages
Government Engineering College Modasa Semester:7 (C.E) Machine Learning (3170724)
Bhargav Bharadiya
No ratings yet
Assignment Data Warehose
Document12 pages
Assignment Data Warehose
jrt128azsx
No ratings yet
640005
Document4 pages
640005
Swetang Khatri
No ratings yet
Government Engineering College, Modasa: B.E. - Computer Engineering (Semester - VII) 3170724 - Machine Learning
Document3 pages
Government Engineering College, Modasa: B.E. - Computer Engineering (Semester - VII) 3170724 - Machine Learning
ronak
No ratings yet
Instructions For How To Solve Assignment
Document4 pages
Instructions For How To Solve Assignment
botiwa
No ratings yet
HW3
Document14 pages
HW3
Dunbar Anders
No ratings yet
MATH 027A Laboratory Activity No. 3 ACOSTA
Document12 pages
MATH 027A Laboratory Activity No. 3 ACOSTA
johnpaul gitanes
No ratings yet
Lect-1-Types and Summarizing Data - 2017
Document51 pages
Lect-1-Types and Summarizing Data - 2017
Sara wannas
No ratings yet
Sda HW1
Document1 page
Sda HW1
dreamd0a6v2i3d
No ratings yet
Meteorology 50: (This Lab Is Worth 200 Points)
Document9 pages
Meteorology 50: (This Lab Is Worth 200 Points)
HyperHodgey
No ratings yet
ID3 Lecture4
Document25 pages
ID3 Lecture4
jameelkhalidalanesy
No ratings yet
Getting To Know Your Data: 2.1 Exercises
Document8 pages
Getting To Know Your Data: 2.1 Exercises
bilkeralle
100% (1)
R Assignment 8
Document9 pages
R Assignment 8
Stella Parker
No ratings yet
Data Mining Worksheet One
Document2 pages
Data Mining Worksheet One
Abrham Danail
No ratings yet
Week 5 Worksheet Answers
Document6 pages
Week 5 Worksheet Answers
Jennifer Moore
No ratings yet
Sample Ques
Document8 pages
Sample Ques
MD. MAHABUB RANA SAIKAT
No ratings yet
HW1 Updated Sep9 2014
Document9 pages
HW1 Updated Sep9 2014
tctchs
0% (1)
Adobe Scan 30-May-2023
Document7 pages
Adobe Scan 30-May-2023
Manav Verma
No ratings yet
Learn Lab3
Document12 pages
Learn Lab3
Andika Bayu Aji
No ratings yet
Assignment 2 - Excel Exercise
Document8 pages
Assignment 2 - Excel Exercise
Carter A Kelly
No ratings yet
DM&DW Individual Assignment (50%)
Document4 pages
DM&DW Individual Assignment (50%)
abrham
No ratings yet
Simple Learning Algorithms: Jiming Peng, Advol, Cas, Mcmaster 1
Document41 pages
Simple Learning Algorithms: Jiming Peng, Advol, Cas, Mcmaster 1
a
No ratings yet
Examquestionbank PR
Document4 pages
Examquestionbank PR
winster21aug
No ratings yet
2033 Rao Faisal Maqbool Data Maining 2
Document3 pages
2033 Rao Faisal Maqbool Data Maining 2
Ahmad Aslam Majhiana
No ratings yet
Lecture 04
Document20 pages
Lecture 04
Tev Wallace
No ratings yet
SYLLABUS Statistics 2019
Document17 pages
SYLLABUS Statistics 2019
Rehman Usman
No ratings yet
ML Model Question Paper
Document2 pages
ML Model Question Paper
M. Muntasir Rahman
No ratings yet
C-3 Pap365er
Document4 pages
C-3 Pap365er
MOHAN AGARWALA
No ratings yet
Data Mining Solution
Document7 pages
Data Mining Solution
Fritzie West
No ratings yet
3 - 1 Lab
Document5 pages
3 - 1 Lab
Sourav Sutradhar
No ratings yet
Exam Preview R Scan
Document11 pages
Exam Preview R Scan
Zh Ish
No ratings yet
Final Exam, Data Mining (CEN 871) : Name Surname: Student's ID
Document2 pages
Final Exam, Data Mining (CEN 871) : Name Surname: Student's ID
Dimitrios A. Karras
No ratings yet
Age of The Child Height: Type of Animal Number of Animals in The Zoo
Document2 pages
Age of The Child Height: Type of Animal Number of Animals in The Zoo
Saikat Mondal
No ratings yet
Praktikum Modul 3
Document5 pages
Praktikum Modul 3
Juki Agus Riyanto
No ratings yet
Classification: Decision Trees
Document30 pages
Classification: Decision Trees
Ashish Tiwari
No ratings yet
AI & ML Question Bank
Document4 pages
AI & ML Question Bank
robinscherbatsky230780
No ratings yet
FIRE3700 - 7600 2022 Lecture 5
Document10 pages
FIRE3700 - 7600 2022 Lecture 5
Leticia Ayala
No ratings yet
Big Assignment 2
Document10 pages
Big Assignment 2
melesse bisema
No ratings yet
It-3031 (DMDW) - CS End Nov 2023
Document23 pages
It-3031 (DMDW) - CS End Nov 2023
21051796
No ratings yet
COMP201 SI Worksheet 8 - Suggested Soln
Document4 pages
COMP201 SI Worksheet 8 - Suggested Soln
NB HLONGWANE
No ratings yet
Exam 2004
Document20 pages
Exam 2004
kib6707
No ratings yet
01 R D Supekar Computer Science 11th
Document212 pages
01 R D Supekar Computer Science 11th
palldedhia2007
No ratings yet
Mid Semester Regular-DM
Document3 pages
Mid Semester Regular-DM
RaviShankar
No ratings yet
Rolling The Dice Faster
Document4 pages
Rolling The Dice Faster
dignor.sign3941
No ratings yet
Solutions To The Exercises: Solution
Document105 pages
Solutions To The Exercises: Solution
rizwan ghafoor
No ratings yet
Solutions To The Exercises: Solution
Document105 pages
Solutions To The Exercises: Solution
aanchal singh
No ratings yet
Imp Questions For Ci - Update
Document8 pages
Imp Questions For Ci - Update
rajeshwari64.y
No ratings yet
DM Makeup Key
Document6 pages
DM Makeup Key
amrutha
No ratings yet
Final Exam Dec 2021
Document2 pages
Final Exam Dec 2021
KRISHNA KOTI SAI Pottupalli
No ratings yet
Tutorial Sheet 1
Document4 pages
Tutorial Sheet 1
Devang Singh
No ratings yet
Principles of Digital Electronics
From Everand
Principles of Digital Electronics
Sapana Rane
No ratings yet
Computer Processing of Remotely-Sensed Images: An Introduction
From Everand
Computer Processing of Remotely-Sensed Images: An Introduction
Paul M. Mather
No ratings yet
Pre-Calculus Essentials
From Everand
Pre-Calculus Essentials
Ernest Woodward
No ratings yet
Faktor Faktor Yang Berhubungan Dengan Kepatuhan Penggunaan Alat Pelindung Diri Pada Pekerja Rekanan (Pt. X) Di PT Indonesia Power Up Semarang
Document12 pages
Faktor Faktor Yang Berhubungan Dengan Kepatuhan Penggunaan Alat Pelindung Diri Pada Pekerja Rekanan (Pt. X) Di PT Indonesia Power Up Semarang
Asriadi S.Kep.Ns.
No ratings yet
Chapter10 Econometrics DummyVariableModel
Document8 pages
Chapter10 Econometrics DummyVariableModel
Abdullah Khatib
No ratings yet
Understanding Logistic Regression Analysis
Document7 pages
Understanding Logistic Regression Analysis
Mariela Garau
No ratings yet
ENGR371 Course Outline
Document4 pages
ENGR371 Course Outline
Commissar Coprobo
No ratings yet
Dealing With Data Modified Bio Stat Edexcel
Document21 pages
Dealing With Data Modified Bio Stat Edexcel
Deepan Chakkaravarthi
No ratings yet
The Effect of Democratic Leadership Style On Organizational Productivity by The Mediating Role of Employee Performance in Turkey
Document11 pages
The Effect of Democratic Leadership Style On Organizational Productivity by The Mediating Role of Employee Performance in Turkey
Paper Publications
No ratings yet
2021 03 26 Sample-Data-Sets-For-Linear-Regression1
Document26 pages
2021 03 26 Sample-Data-Sets-For-Linear-Regression1
PatriciaIacob
No ratings yet
Exercises 4: Autocorrelated Processes ARIMA Models
Document45 pages
Exercises 4: Autocorrelated Processes ARIMA Models
Gaurav Venkatesh
No ratings yet
4233 10356 1 SM
Document10 pages
4233 10356 1 SM
Zahirah Tiara Diffa
No ratings yet
Session 3 - Organizing Graphing Data - MZS 2020
Document30 pages
Session 3 - Organizing Graphing Data - MZS 2020
Laura Stephanie
No ratings yet
4th Quarter Exam
Document6 pages
4th Quarter Exam
Jude Tan
No ratings yet
INDU6311 Input Analyser Week5
Document39 pages
INDU6311 Input Analyser Week5
abhishek jain
No ratings yet
MTH601 Final Term Solved Paper
Document21 pages
MTH601 Final Term Solved Paper
Aleena Rajput
No ratings yet
Causal Comparative Research
Document14 pages
Causal Comparative Research
Gideon P. Casas
100% (1)
Example ANOVA
Document3 pages
Example ANOVA
Joyce Vicente
No ratings yet
Decile of Grouped Data
Document9 pages
Decile of Grouped Data
maritope0404
No ratings yet
Investigating The Relationship Between Scores: © 2006 Mcgraw-Hill Higher Education. All Rights Reserved
Document20 pages
Investigating The Relationship Between Scores: © 2006 Mcgraw-Hill Higher Education. All Rights Reserved
Gabrielle Anne San Gabriel
No ratings yet
LAS 5 Statistics and Probability
Document7 pages
LAS 5 Statistics and Probability
chad lowe villarroya
No ratings yet
Exercise Chapter 2: C) by Using Appropriate Calculation, Identify The Shape of Distribution For The Above Data
Document3 pages
Exercise Chapter 2: C) by Using Appropriate Calculation, Identify The Shape of Distribution For The Above Data
Shasha Kim
No ratings yet
Biostat Midterm
Document4 pages
Biostat Midterm
Rogen Paul Geromo
No ratings yet
Primer of Applied Regression Analysis of Variance 3Rd Edition Edition Stanton A Glantz All Chapter
Document67 pages
Primer of Applied Regression Analysis of Variance 3Rd Edition Edition Stanton A Glantz All Chapter
jeanette.rasmussen227
100% (3)
Statistics Quiz 1
Document2 pages
Statistics Quiz 1
Aslıhan Kaya
No ratings yet
Angelie ATON - Activity On Correlation
Document3 pages
Angelie ATON - Activity On Correlation
MARY ANN ATUP
No ratings yet
Cost Behavior
Document5 pages
Cost Behavior
Lea Joaquin
No ratings yet
Random Forest Reference Code
Document19 pages
Random Forest Reference Code
Rajat Shetty
No ratings yet
Final Questions For Last Class
Document5 pages
Final Questions For Last Class
Nitish Kumar
No ratings yet
Stat X115 Syllabus
Document10 pages
Stat X115 Syllabus
glintinshade
No ratings yet
Arima
Document12 pages
Arima
Dr. Priya Iyer K B
No ratings yet