Forming A Group Is Recommended. Groups of Up To 4 Are Allowed.

Uploaded by

Fazal Ur Rehman

0% found this document useful (0 votes)

30 views1 page

Original Title

projectDM.pdf

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

30 views1 page

Forming A Group Is Recommended. Groups of Up To 4 Are Allowed.

Uploaded by

Fazal Ur Rehman

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 1

Search inside document

Data Mining Project Due: March 23, 11:55 PM

(Forming a group is recommended. Groups of up to 4 are allowed.)

This is an exploratory project. You are encouraged to collect interesting data sets for an
application domain that interests you. The more data you collect the better it is for finding
interesting patterns. Your project should consist of the following three phases:

Data Collection (for the domain you like/are interested in)

Data Preprocessing (data cleaning and transformation into a useful form)
Data Mining (using algorithms you have seen so far)

At least one of these phases should be not trivial. For example the data collection and
preprocessing phase could be non-trivial (e.g. the sites you use have some specific APIs that you
need to use and/or the data needs special preprocessing).
Or the data mining process could be non-trivial. E.g. you collect a lot of data and then some
algorithms such as those in Weka, being main memory algorithms, have a hard time to mine your
data. In such a case, you should modify or recode those algorithms, or research available
algorithms that can be more efficient for large amounts of data.

You should submit a report describing your work as well as give a short presentation (5 min)
outlining the main points of your project.

You are expected to write the report in a research paper format. See
http://infolab.stanford.edu/~widom/paper-writing.html
on how a paper can be structured. The length of the report should approximately 10 pages.

Some interesting data/articles references are:

http://www.kaggle.com/c/titanic-gettingStarted
http://www.discoverycorpsinc.com/dancing-with-the-stats/
http://archive.ics.uci.edu/ml/datasets/YouTube+Comedy+Slam+Preference+Data#
http://www.sciencedirect.com/science/article/pii/S1877050916309036
http://archive.ics.uci.edu/ml/datasets/Farm+Ads
http://archive.ics.uci.edu/ml/datasets/YearPredictionMSD
http://labrosa.ee.columbia.edu/millionsong/pages/tasks-demos
http://archive.ics.uci.edu/ml/datasets/URL+Reputation
http://cseweb.ucsd.edu/~voelker/pubs/mal-url-icml09.pdf
http://www.yelp.ca/academic_dataset
https://grouplens.org/datasets/movielens/
http://2013.msrconf.org/challenge.php
http://2015.msrconf.org/challenge.php
http://2017.msrconf.org/#/challenge
https://dnc1994.com/2016/05/rank-10-percent-in-first-kaggle-competition-en/

Also, the practical book:

Programming Collective Intelligence by Toby Segaran
contains a wealth of ideas on how to find data and how to mine them.

113 Canton Fair Buyers Database-Sample 0
Document9 pages
113 Canton Fair Buyers Database-Sample 0
Fazal Ur Rehman
No ratings yet
Splunk and MapReduce
Document8 pages
Splunk and MapReduce
Motok
No ratings yet
Textile-Canton Fair Purchasers List-Sample
Document2 pages
Textile-Canton Fair Purchasers List-Sample
Fazal Ur Rehman
No ratings yet
Data Mining Dissertation Examples
Document4 pages
Data Mining Dissertation Examples
WriteMyPaperForMeFastColumbia
100% (1)
Dissertation On Web Mining
Document4 pages
Dissertation On Web Mining
CustomPaperWritingNewark
100% (1)
Data Mining Issues and KDD Process
Document10 pages
Data Mining Issues and KDD Process
Shubham Gupta
No ratings yet
Data Science Fundamentals - Class1
Document51 pages
Data Science Fundamentals - Class1
Yashwanth Yashu
No ratings yet
FinalProject Description
Document5 pages
FinalProject Description
Bhanu Reddy
No ratings yet
Chapter 2 Preparing To Model
Document49 pages
Chapter 2 Preparing To Model
Shreeji Modh
No ratings yet
Mphil Thesis in Computer Science Data Mining
Document7 pages
Mphil Thesis in Computer Science Data Mining
gcqbyfdj
100% (2)
Data Pipelines for Startups
Document5 pages
Data Pipelines for Startups
Syirin Shahab
No ratings yet
Thesis Proposal On Data Mining
Document5 pages
Thesis Proposal On Data Mining
katyallenrochester
100% (2)
Unit 1 - DSA
Document12 pages
Unit 1 - DSA
Roshanaa R
No ratings yet
DS Notes - Data Structures and Algorithms Fundamentals
Document22 pages
DS Notes - Data Structures and Algorithms Fundamentals
Josh
No ratings yet
Data Analytics Lifecycle
Document51 pages
Data Analytics Lifecycle
Bhagya Patil
No ratings yet
DWH Assignments and Project
Document9 pages
DWH Assignments and Project
zainab3309
No ratings yet
Data Structures
Document12 pages
Data Structures
Josh
No ratings yet
Why Data Structures are Essential for Complex Applications
Document3 pages
Why Data Structures are Essential for Complex Applications
billy
No ratings yet
Data Mining and Database Systems Where Is The Intersection
Document5 pages
Data Mining and Database Systems Where Is The Intersection
jorge051289
No ratings yet
Thesis Data Mining Clustering
Document6 pages
Thesis Data Mining Clustering
krystalellisonsavannah
100% (2)
Dissertation Data Mining
Document4 pages
Dissertation Data Mining
BuyingPapersOnlineUK
100% (1)
Course Project Guideline - New
Document6 pages
Course Project Guideline - New
Caiyi Xu
No ratings yet
Google Research Paper Mapreduce
Document7 pages
Google Research Paper Mapreduce
fvg2005k
100% (1)
ML Interview Questions
Document146 pages
ML Interview Questions
IndraneelGhosh
No ratings yet
A Survey On Data Mining
Document4 pages
A Survey On Data Mining
International Organization of Scientific Research (IOSR)
No ratings yet
Novelwebscrappingapproach
Document15 pages
Novelwebscrappingapproach
Season Maharjan
No ratings yet
The Architecture of Scidb: 1 Introduction and Background
Document18 pages
The Architecture of Scidb: 1 Introduction and Background
Konark
No ratings yet
Final Project Mini Search Engine: CS163 - Data Structures & Algorithms
Document3 pages
Final Project Mini Search Engine: CS163 - Data Structures & Algorithms
Quốc Anh Lê
No ratings yet
Semantic Search Demo Booklet
Document20 pages
Semantic Search Demo Booklet
Stéphane Croisier
No ratings yet
Data Mining and Data Warehouse
Document11 pages
Data Mining and Data Warehouse
api-19799369
No ratings yet
Background: Research and Evolution
Document6 pages
Background: Research and Evolution
ddeevviii3646
No ratings yet
1) Subject-Oriented Data:: Data Warehouse: The Building Blocks EX 1
Document5 pages
1) Subject-Oriented Data:: Data Warehouse: The Building Blocks EX 1
Kainat Baig
0% (1)
Data Warehouse Dissertation Topics
Document7 pages
Data Warehouse Dissertation Topics
BestOnlinePaperWritersBillings
100% (1)
Research Paper On Big Data Hadoop
Document5 pages
Research Paper On Big Data Hadoop
t1tos1z0t1d2
100% (1)
The Content of A Research Paper Primarily Considers
Document8 pages
The Content of A Research Paper Primarily Considers
gz49w5xr
No ratings yet
Lecture 1 - Introduction - Data Structures and Algorithms
Document10 pages
Lecture 1 - Introduction - Data Structures and Algorithms
nordvtech2023
No ratings yet
Research Paper On Pipelining in Computer Architecture
Document5 pages
Research Paper On Pipelining in Computer Architecture
afnhdqfvufitoa
No ratings yet
Module 2 - Data Preprocessing and Visualization
Document15 pages
Module 2 - Data Preprocessing and Visualization
Raiza Ananca
No ratings yet
Big data examples for personalized marketing, inventory ordering & more
Document10 pages
Big data examples for personalized marketing, inventory ordering & more
Kritika Shergel
No ratings yet
Data Mining and Warehousing Lab Syllabus
Document4 pages
Data Mining and Warehousing Lab Syllabus
PhamThi Thiet
No ratings yet
Document Clustering: Alankrit Bhardwaj 18BIT0142 Priyanshu Gupta 18BIT0146 Aditya Raj 18BIT0412
Document33 pages
Document Clustering: Alankrit Bhardwaj 18BIT0142 Priyanshu Gupta 18BIT0146 Aditya Raj 18BIT0412
Aman Kushwaha
No ratings yet
Sample Questions: 1. Which RFC Will Be Used To "Read System Data Remote" From Transaction SMSY?
Document30 pages
Sample Questions: 1. Which RFC Will Be Used To "Read System Data Remote" From Transaction SMSY?
Ajay Saini
No ratings yet
DL Vs DLH Draft v0.1
Document9 pages
DL Vs DLH Draft v0.1
meetnavpk
No ratings yet
Research Paper
Document4 pages
Research Paper
premacute
No ratings yet
CHP 19
Document63 pages
CHP 19
mona yadv
No ratings yet
SAP Certified Technology Associate - System
Document14 pages
SAP Certified Technology Associate - System
Teja Aripirala
No ratings yet
Database Lab Assignment
Document26 pages
Database Lab Assignment
SYED MUHAMMAD USAMA MASOOD
No ratings yet
Janice Noynay Cabardo: BSCS, MIT (Units)
Document15 pages
Janice Noynay Cabardo: BSCS, MIT (Units)
Erwin Son
No ratings yet
Query Optimization
Document24 pages
Query Optimization
Taxi
No ratings yet
Contact Me To Get Fully Solved Smu Assignments/Project/Synopsis/Exam Guide Paper
Document7 pages
Contact Me To Get Fully Solved Smu Assignments/Project/Synopsis/Exam Guide Paper
Mrinal Kalita
No ratings yet
Become A Data Engineer
Document14 pages
Become A Data Engineer
D Work
100% (1)
Process: 1. Data Mining (The Analysis Step of The "Knowledge Discovery in Databases" Process, or KDD)
Document4 pages
Process: 1. Data Mining (The Analysis Step of The "Knowledge Discovery in Databases" Process, or KDD)
Ajit Kumar
No ratings yet
Research Papers Semantic Web Mining
Document4 pages
Research Papers Semantic Web Mining
afedyvlyj
100% (1)
Web Data Scraping
Document5 pages
Web Data Scraping
Munawir Munawir
No ratings yet
BC0058 Assignment
Document8 pages
BC0058 Assignment
Alok Ekka
No ratings yet
Multimedia Big Data in OTT Platforms
Document4 pages
Multimedia Big Data in OTT Platforms
Prakhar Agrawal
No ratings yet
Thesis Topic On Web Mining
Document7 pages
Thesis Topic On Web Mining
amandabradybillings
100% (2)
Spark - A Big Data Processing Platform Based On Memory Computing
Document7 pages
Spark - A Big Data Processing Platform Based On Memory Computing
Supreetha G S
No ratings yet
Question #1topic 1: Hide Solution Discussion
Document74 pages
Question #1topic 1: Hide Solution Discussion
Baji Tulluru
No ratings yet
Christos Chen
Document42 pages
Christos Chen
Manisha Tanwar
No ratings yet
Real-Time Analytics: Techniques to Analyze and Visualize Streaming Data
From Everand
Real-Time Analytics: Techniques to Analyze and Visualize Streaming Data
Byron Ellis
No ratings yet
MySQL 8 Query Performance Tuning: A Systematic Method for Improving Execution Speeds
From Everand
MySQL 8 Query Performance Tuning: A Systematic Method for Improving Execution Speeds
Jesper Wisborg Krogh
No ratings yet
Gamex Email List - FIVER: School Types To Focus On
Document2 pages
Gamex Email List - FIVER: School Types To Focus On
Fazal Ur Rehman
No ratings yet
Gamex Email List - FIVER: School Types To Focus On
Document2 pages
Gamex Email List - FIVER: School Types To Focus On
Fazal Ur Rehman
No ratings yet
Gamex Email List - FIVER: School Types To Focus On
Document2 pages
Gamex Email List - FIVER: School Types To Focus On
Fazal Ur Rehman
No ratings yet
6 60 Roll Nos of Successful Candidates in Written Test (2016)
Document1 page
6 60 Roll Nos of Successful Candidates in Written Test (2016)
Fazal Ur Rehman
No ratings yet
Source Guide To UK Textiles February 2013
Document5 pages
Source Guide To UK Textiles February 2013
Fazal Ur Rehman
No ratings yet
HTSE1407 Exhibitor List
Document3 pages
HTSE1407 Exhibitor List
Fazal Ur Rehman
No ratings yet
Bakht Textiles International Price - Catalog
Document9 pages
Bakht Textiles International Price - Catalog
Fazal Ur Rehman
No ratings yet
Bakht Textiles International Price - Catalog
Document9 pages
Bakht Textiles International Price - Catalog
Fazal Ur Rehman
No ratings yet
Yarn specifications 13-07-15
Document12 pages
Yarn specifications 13-07-15
Fazal Ur Rehman
No ratings yet
21 Karded
Document1 page
21 Karded
Fazal Ur Rehman
No ratings yet