Welcome to Scribd!

Dataset: (Most Famous)

Uploaded by

0% found this document useful (0 votes)

6 views8 pages

The document provides information on several famous datasets commonly used for machine learning including MNIST, CIFAR-10, IMDB, IRIS, diabetes, breast cancer, and over 100 other datasets. It describes the contents, source, and typical use of each dataset.

Original Description:

Original Title

Datasets.pptx

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

6 views8 pages

Dataset: (Most Famous)

Uploaded by

Raja

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 8

Search inside document

Dataset

(most famous)

1
MNST – Hand written digit
▪ The dataset was constructed from a number of scanned document datasets available from
the National Institute of Standards and Technology (NIST). This is where the name for the
dataset comes from, as the Modified NIST or MNIST dataset

▪ Link to original database: http://yann.lecun.com/exdb/mnist/

▪ Link to best results:
http://rodrigob.github.io/are_we_there_yet/build/classification_datasets_results.html

2
CIFAR-10 dataset
▪ CIFAR = Canadian Institute for Advanced Research

▪ The CIFAR-10 dataset consists of 60,000 photos divided into 10 classes (hence the name CIFAR-10)1. Classes include common
objects such as airplanes, automobiles, birds, cats and so on.

▪ The dataset is split in a standard way, where 50,000 images are used for training a model and the remaining 10,000 for
evaluating its performance.

▪ The photos are in colour with red, green and blue channels, but are small measuring 32x32 pixel squares.

▪ State of the art result can be checked here:

http://rodrigob.github.io/are_we_there_yet/build/classification_datasets_results.html

▪ Official website: https://www.cs.toronto.edu/~kriz/cifar.html

3
IMDB dataset
▪ The Large Movie Review Dataset (often referred to as the IMDB dataset) contains 25,000
highly-polar movie reviews (good or bad) for training and the same amount again for
testing. The problem is to determine whether a given moving review has a positive or
negative sentiment.

▪ The data was collected by Stanford researchers and was used in a 2011 paper where a split
of 50-50 of the data was used for training and test2. An accuracy of 88.89% was achieved.

▪ Official website: http://ai.stanford.edu/~amaas/data/sentiment/

4
IRIS dataset
▪ The Iris dataset, a staple of the machine learning community, was introduced by statistician
Robert Fischer in 1936.
▪ Its easy accessibility, small size, clean data, and symmetry of values have made it a popular
choice for testing classification algorithms.
▪ The Iris dataset represents 3 kind of Iris flowers (Setosa, Versicolour and Virginica) with 4
attributes: sepal length, sepal width, petal length and petal width.

5
Diabetes
▪ The Diabetes dataset is a regression dataset of 442 diabetes patient. The prediction
columns include age, sex, BMI (body mass index), BP (blood pressure), and five serum
measurements. The target column is the progression of the disease after 1 year.

6
Breast Cancer dataset
▪ The Wisconsin Breast Cancer dataset, used to predict whether a patient has breast cancer,
has 569 rows and 30 columns.

▪ Some extra info can be obtained here

▪ https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_breast_cancer.ht
ml?highlight=load_breast_cancer

7
100+ dataset to train your AI model

▪ See link below:

▪ https://www.kdnuggets.com/2021/05/awesome-list-datasets.html

Module 1 - Descriptive Statistics
Document31 pages
Module 1 - Descriptive Statistics
Miel Ross Jader
No ratings yet
SAS Clinical Trials
Document25 pages
SAS Clinical Trials
nishu1212
100% (5)
Uv Disinfection Systems Tak Series
Document12 pages
Uv Disinfection Systems Tak Series
Carlos Ramírez
No ratings yet
0906 0909 Lab Accreditation I II (Class Notes) (Vanessa 2022)
Document82 pages
0906 0909 Lab Accreditation I II (Class Notes) (Vanessa 2022)
Vienne Yuen Wing Yan
No ratings yet
Book PHARMACEUTICS 1
Document85 pages
Book PHARMACEUTICS 1
Muhammad sajjad
93% (14)
Model Training: (Anything Done While We Train The Model)
Document194 pages
Model Training: (Anything Done While We Train The Model)
Raja
No ratings yet
Indian Income Tax Return Acknowledgement 2021-22: Assessment Year
Document1 page
Indian Income Tax Return Acknowledgement 2021-22: Assessment Year
Prateek Gupta
No ratings yet
Bernd Klein Python Data Analysis Letter
Document514 pages
Bernd Klein Python Data Analysis Letter
Raja
No ratings yet
Mara-Rezumat Pe Capitole
Document22 pages
Mara-Rezumat Pe Capitole
Vlad17
0% (2)
Designing and Conducting Survey Research: A Comprehensive Guide
From Everand
Designing and Conducting Survey Research: A Comprehensive Guide
Louis M. Rea
Rating: 2 out of 5 stars
2/5 (2)
Purina
Document24 pages
Purina
Dee Dee Yeng
No ratings yet
Machine Learning
Document407 pages
Machine Learning
Raja
No ratings yet
Big Data 101
Document32 pages
Big Data 101
anjanasundaram
No ratings yet
3 2 Good Data Management Practices
Document40 pages
3 2 Good Data Management Practices
sampath yadav
No ratings yet
Phase II Rod Final
Document5 pages
Phase II Rod Final
api-635954562
No ratings yet
Biological Databases
Document28 pages
Biological Databases
Moiz Ahmed Bhatti
No ratings yet
The in Analysis Databases:: Science
Document33 pages
The in Analysis Databases:: Science
greeen.pat6918
No ratings yet
Phase II Research Organization Document 2021
Document4 pages
Phase II Research Organization Document 2021
api-633087057
No ratings yet
Welcome To Nutr 551: Analysis of Nutrition Data: Dr. Iskandar Mcgill School of Human Nutrition January 7, 2019
Document38 pages
Welcome To Nutr 551: Analysis of Nutrition Data: Dr. Iskandar Mcgill School of Human Nutrition January 7, 2019
Nour Musharbash
100% (1)
Final Rod Phase II 2
Document4 pages
Final Rod Phase II 2
api-633057533
No ratings yet
Research Data - Definitions: Support/data-Library/research-Data-Mgmt/data-Mgmt/research-Data-Definition
Document5 pages
Research Data - Definitions: Support/data-Library/research-Data-Mgmt/data-Mgmt/research-Data-Definition
naning
No ratings yet
Data PDF
Document5 pages
Data PDF
Catherine Jumadiao
No ratings yet
Research Data - Definitions: Support/data-Library/research-Data-Mgmt/data-Mgmt/research-Data-Definition
Document5 pages
Research Data - Definitions: Support/data-Library/research-Data-Mgmt/data-Mgmt/research-Data-Definition
sarah sindoro
No ratings yet
Phase II Research Organization Document 2021 1
Document3 pages
Phase II Research Organization Document 2021 1
api-527669043
No ratings yet
Capturing The Problem: Use Case Development and Requirement Analysis
Document72 pages
Capturing The Problem: Use Case Development and Requirement Analysis
Michael
No ratings yet
Final Phase II Rod
Document3 pages
Final Phase II Rod
api-585462575
No ratings yet
Why We Need Data Mining?
Document39 pages
Why We Need Data Mining?
Bhanu Royce
No ratings yet
Clinical Data Manager
Document5 pages
Clinical Data Manager
api-77223683
No ratings yet
Rod II
Document3 pages
Rod II
api-456373408
No ratings yet
Knowledge Base & Knowledge Engineering Process: Knowledge Representation & Reasoning WID2001
Document29 pages
Knowledge Base & Knowledge Engineering Process: Knowledge Representation & Reasoning WID2001
Marina MEL
No ratings yet
Phase II Research Organization Document 2021
Document4 pages
Phase II Research Organization Document 2021
api-692385376
No ratings yet
DWDM Unit 2
Document46 pages
DWDM Unit 2
sri charan
No ratings yet
Phase II Research Organization Document 2021
Document3 pages
Phase II Research Organization Document 2021
api-530935128
No ratings yet
IInd Sem Class1
Document56 pages
IInd Sem Class1
Rajesh Thipparaboina
No ratings yet
An Open-Source Digital Archiving System For Medical and Scientific Research
Document17 pages
An Open-Source Digital Archiving System For Medical and Scientific Research
mfs core
No ratings yet
Test For Upload
Document25 pages
Test For Upload
Harum Khan
No ratings yet
Phase II Research Organization Document
Document4 pages
Phase II Research Organization Document
api-691667702
No ratings yet
Genomic Big Data Management Integration and Mining
Document29 pages
Genomic Big Data Management Integration and Mining
Giuseppe Gallo
No ratings yet
Rod Phase II 2
Document3 pages
Rod Phase II 2
api-567185090
No ratings yet
A Portable Neuroinformatic System in A Neurological Research Environment
Document16 pages
A Portable Neuroinformatic System in A Neurological Research Environment
remenkimi
No ratings yet
Phase II Research Organization Document
Document4 pages
Phase II Research Organization Document
api-710804215
No ratings yet
Phase II Rod Updated Final
Document4 pages
Phase II Rod Updated Final
api-642376263
No ratings yet
Group Assignment
Document3 pages
Group Assignment
Guda Kiflu Kumera
No ratings yet
Introduction Data Management
Document12 pages
Introduction Data Management
Geofrey Basalirwa
No ratings yet
Stats PDF
Document50 pages
Stats PDF
sarwar shams
No ratings yet
Rod Phase II 05-06-2020 Final-6
Document2 pages
Rod Phase II 05-06-2020 Final-6
api-510897511
No ratings yet
An Over View of Tics
Document24 pages
An Over View of Tics
Nivya Sree
No ratings yet
ADChallengeADNIMRI Readme 1
Document1 page
ADChallengeADNIMRI Readme 1
Farhan Angan
No ratings yet
Rod 2
Document2 pages
Rod 2
api-508897697
No ratings yet
Advanced Database Systems Revision
Document213 pages
Advanced Database Systems Revision
Adnankoko Adnan
No ratings yet
Phase II Rod New
Document4 pages
Phase II Rod New
api-632682404
No ratings yet
Phase II Rod
Document4 pages
Phase II Rod
api-543045416
No ratings yet
ST1 4483 8995 Capstone PPT Template
Document10 pages
ST1 4483 8995 Capstone PPT Template
360mostafasaif
No ratings yet
DSP Cat 1
Document107 pages
DSP Cat 1
R B SHARAN
No ratings yet
TP ComparacaoClassificadores
Document3 pages
TP ComparacaoClassificadores
Gonçalo Duarte
No ratings yet
Phase II Rod Final
Document3 pages
Phase II Rod Final
api-528136686
No ratings yet
Phase II Rod
Document3 pages
Phase II Rod
api-632526087
No ratings yet
HCI - Notes-Ch3
Document44 pages
HCI - Notes-Ch3
Júlia Estorach Segarra
100% (1)
Kristen 1scsasc
Document35 pages
Kristen 1scsasc
Gaurav Daroch
No ratings yet
Chapter N1 Introduction To Big Data
Document40 pages
Chapter N1 Introduction To Big Data
Komal
No ratings yet
Readme 100k
Document3 pages
Readme 100k
khalid
No ratings yet
DT 444
Document19 pages
DT 444
htlt215
No ratings yet
1 Statistics Introduction
Document36 pages
1 Statistics Introduction
Sean C.A.E
No ratings yet
Databases Bioinformatics
Document42 pages
Databases Bioinformatics
Sukhdeep Singh
No ratings yet
Module 1 - Descriptive Statistics PDF
Document34 pages
Module 1 - Descriptive Statistics PDF
Hazel Marie Ignacio Peralta
No ratings yet
Unit-3 Bioinformatics
Document15 pages
Unit-3 Bioinformatics
p vmurali
No ratings yet
Phase II Rod Group 6
Document4 pages
Phase II Rod Group 6
api-490791532
No ratings yet
Analyzing the Large Number of Variables in Biomedical and Satellite Imagery
From Everand
Analyzing the Large Number of Variables in Biomedical and Satellite Imagery
Phillip I. Good
No ratings yet
Creating Good Data: A Guide to Dataset Structure and Data Representation
From Everand
Creating Good Data: A Guide to Dataset Structure and Data Representation
Harry J. Foxwell
No ratings yet
2.1 3.2 Filtering With Criteria or and
Document1 page
2.1 3.2 Filtering With Criteria or and
Raja
No ratings yet
5.1 3.5 Filtering With Criteria GT LT
Document1 page
5.1 3.5 Filtering With Criteria GT LT
Raja
No ratings yet
3.1 3.3 Filtering With Criteria or and SOLUTIONS
Document1 page
3.1 3.3 Filtering With Criteria or and SOLUTIONS
Raja
No ratings yet
8.1 3.8 Filtering With Criteria Not
Document1 page
8.1 3.8 Filtering With Criteria Not
Raja
No ratings yet
Lecture 04 - Supervised Learning by Computing Distances (2) - Plain
Document16 pages
Lecture 04 - Supervised Learning by Computing Distances (2) - Plain
Raja
No ratings yet
Lecture 10 - Probabilistic ML (1) - Basics of Probability - Plain
Document12 pages
Lecture 10 - Probabilistic ML (1) - Basics of Probability - Plain
Raja
No ratings yet
Deep Learning
Document189 pages
Deep Learning
Raja
No ratings yet
Lecture 09 - Calculus and Optimization Techniques (3) - Plain
Document15 pages
Lecture 09 - Calculus and Optimization Techniques (3) - Plain
Raja
No ratings yet
Lecture 10 - Optimization Techniques (4) - Plain
Document6 pages
Lecture 10 - Optimization Techniques (4) - Plain
Raja
No ratings yet
6.1 3.6 Filtering With Criteria GT LT - SOLUTIONS
Document1 page
6.1 3.6 Filtering With Criteria GT LT - SOLUTIONS
Raja
No ratings yet
Lecture 11 - Probabilistic ML (2) - Probability Basic Contd - Plain
Document8 pages
Lecture 11 - Probabilistic ML (2) - Probability Basic Contd - Plain
Raja
No ratings yet
Lecture 05 - Cross-Validation and Decision Trees - Plain
Document15 pages
Lecture 05 - Cross-Validation and Decision Trees - Plain
Raja
No ratings yet
Course Logistics and Introduction: CS771: Introduction To Machine Learning Piyush Rai
Document23 pages
Course Logistics and Introduction: CS771: Introduction To Machine Learning Piyush Rai
Raja
No ratings yet
Lecture 02 - Warming-Up and Data and Features - Plain
Document23 pages
Lecture 02 - Warming-Up and Data and Features - Plain
Raja
No ratings yet
General Observation
Document93 pages
General Observation
Raja
No ratings yet
Bernd Klein Python and Machine Learning Letter
Document453 pages
Bernd Klein Python and Machine Learning Letter
Raja
No ratings yet
Lecture 03 - Supervised Learning by Computing Distances - Plain
Document17 pages
Lecture 03 - Supervised Learning by Computing Distances - Plain
Raja
No ratings yet
Cnns Convolution Neural Networks
Document50 pages
Cnns Convolution Neural Networks
Raja
No ratings yet
Explainable
Document49 pages
Explainable
Raja
No ratings yet
Data Science Competition
Document18 pages
Data Science Competition
Raja
No ratings yet
Model Training
Document194 pages
Model Training
Raja
No ratings yet
Adversarial NN
Document24 pages
Adversarial NN
Raja
No ratings yet
A B Testing
Document28 pages
A B Testing
Raja
No ratings yet
Introduction To Git: Takeaways: Syntax
Document2 pages
Introduction To Git: Takeaways: Syntax
Raja
No ratings yet
Types of Tissue - Nervous Tissue
Document3 pages
Types of Tissue - Nervous Tissue
Faye Aquino
No ratings yet
Epekto NG Paninigarilyo Sa Kabataan Thesis
Document5 pages
Epekto NG Paninigarilyo Sa Kabataan Thesis
WriteMyPaperCollegeWichitaFalls
100% (1)
CHAPTER LL
Document11 pages
CHAPTER LL
Deege Bae
No ratings yet
Hirschman 1982 Hedonic Consumption Emerging Concepts Methods and Propositio PDF
Document11 pages
Hirschman 1982 Hedonic Consumption Emerging Concepts Methods and Propositio PDF
Michael Alexandre Ramos Bravo
No ratings yet
Jay Dee Harp - Redacted
Document7 pages
Jay Dee Harp - Redacted
Heavy
No ratings yet
Suicidal Ideation and Behavior in Adults - UpToDate PDF
Document36 pages
Suicidal Ideation and Behavior in Adults - UpToDate PDF
Lemuel Reyes
No ratings yet
Experiment 6 - Linear Conduction PDF
Document13 pages
Experiment 6 - Linear Conduction PDF
amir hamzah
No ratings yet
Input Data Sheet For E-Class Record: Region Division School Name School Id School Year
Document18 pages
Input Data Sheet For E-Class Record: Region Division School Name School Id School Year
Ronie Dacuba
No ratings yet
Times Leader 06-04-2013
Document32 pages
Times Leader 06-04-2013
The Times Leader
No ratings yet
1VDD006144 GB SafeRing - Plus - Air - April 2016
Document74 pages
1VDD006144 GB SafeRing - Plus - Air - April 2016
Gary Fortuin
No ratings yet
"Ergonomic Smart Chair": Carried Out by
Document59 pages
"Ergonomic Smart Chair": Carried Out by
Mohsin Shaikh
No ratings yet
Ztipc 2019
Document86 pages
Ztipc 2019
Journal of Pharmacy & Pharmacognosy Research
No ratings yet
BV Rules PtE Ch3 Sec2 AUT-CCS
Document2 pages
BV Rules PtE Ch3 Sec2 AUT-CCS
Jon Lopez
No ratings yet
Hedging Questions
Document6 pages
Hedging Questions
Ameya Lonkar
No ratings yet
Instructions - Manual KitchenAid 5KSM7990XEER
Document284 pages
Instructions - Manual KitchenAid 5KSM7990XEER
gingis-han
No ratings yet
English Report Essay
Document3 pages
English Report Essay
Ten Fatin
67% (3)
Casa de Moda Dolcegabbana
Document4 pages
Casa de Moda Dolcegabbana
dianaionelav23
No ratings yet
STS - BT Talong Test
Document1 page
STS - BT Talong Test
Chimon Love
No ratings yet
Copper Alloy Guide Eng
Document3 pages
Copper Alloy Guide Eng
Rishi Sharma
No ratings yet
Meritlist - Combined - 2015 29.08.2015 Final PDF
Document233 pages
Meritlist - Combined - 2015 29.08.2015 Final PDF
Anshul Arora
No ratings yet
All Codes
Document279 pages
All Codes
iceyroses
No ratings yet
Decrease in Paco2 With Prone Position Is Predictive of Improved Outcome in Acute Respiratory Distress Syndrome
Document7 pages
Decrease in Paco2 With Prone Position Is Predictive of Improved Outcome in Acute Respiratory Distress Syndrome
darwig
No ratings yet
Cul5a - Lecture - Week 9 - Singaporean Cuisine PDF
Document14 pages
Cul5a - Lecture - Week 9 - Singaporean Cuisine PDF
JJ GR
No ratings yet
Educational Institutes Mysore
Document8 pages
Educational Institutes Mysore
Madhavi Kurra
No ratings yet