Welcome to Scribd!

Iot & Machine Learning: From Data Collection To Model Implementation

Uploaded by

0% found this document useful (0 votes)

12 views29 pages

This document outlines a presentation on IoT and machine learning model development from data collection to deployment. It discusses collecting sensor data using an ESP8266 board and IFTTT, cleaning the data by renaming columns and handling outliers, building models using scikit-learn SVM and KNN algorithms, evaluating models with metrics like confusion matrices and ROC curves, and deploying models with Streamlit or Flask while considering accessibility and upkeep.

Original Description:

Original Title

LaunchLKN-ML

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

12 views29 pages

Iot & Machine Learning: From Data Collection To Model Implementation

Uploaded by

Rokiando Mahabali

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 29

Search inside document

IoT & Machine Learning: From Data Collection to

Model Implementation

Dan Murphy
Tuesday, June 16, 2020
What We’ll Cover

1. Data Collection : Best Practices, Strategies, and What to Look out for

2. Machine Learning Models : Support Vector Machine, k-Nearest

Neighbors, One-Hot Encoding, Metrics, and more!

3. Deploying Your Model : Streamlit vs. Flask, Model Maintainability,

Accessibility and Design

Presentation Overview
1. Part 1 - Data Collection : Motivation for the project, how I collected the
data

2. Part 2 - Data Cleaning : Importing the data, re-structuring it, and

preparing it for machine learning

3. Part 3 - Building your Model(s) : Selecting your model, Sci-kit Learn

implementations, evaluation metrics

4. Part 4 - Deploying your Model : Deployment strategy, upkeep

Part One : Data Collection
Motivation
1. Challenge of learning IoT and working with sensor data

2. Build my first ‘start-to-finish’ Machine Learning project

How I Collected the Data
1. Connect sensors to ESP8266 Board (Random Nerd Tutorials)
How I Collected the Data
1. Connect sensors to ESP8266 Board (Random Nerd Tutorials)

2. Integrate with IFTTT

How I Collected the Data
1. Connect sensors to ESP8266 Board (Random Nerd Tutorials)

2. Integrate with IFTTT

3. Connect board and sensors to outlet / power source

Part Two : Data Cleaning
Data Cleaning
1. Change Column Names to be Representative of the data Stored in
that Column
Data Cleaning
BEFORE AFTER
Data Cleaning
1. Change Column Names to be Representative of the data Stored in
that Column

2. Fix the “Value3” Column

• Should I Remove or Replace

Outliers / Anomalies / ‘Bad’ Data

?
Data Cleaning
1. Change Column Names to be Representative of the data Stored in
that Column

2. Fix the “Value3” Column

• Should I Remove or Replace

Outliers / Anomalies / ‘Bad’ Data

3. Normalization Techniques

• Min-Max vs. Standardization

Data Cleaning
1. Change Column Names to be Representative of the data Stored in
that Column

2. Fix the “Value3” Column

• Should I Remove or Replace

Outliers / Anomalies / ‘Bad’ Data

3. Normalization Techniques

• Min-Max vs. Standardization

4. One-Hot-Encode the “Date” Column

Data Cleaning
Before After
Additional Tips
1. df.columns.str.replace(‘ ‘, ‘_’)
Additional Tips
1. df.columns.str.replace(‘ ‘, ‘_’)

2. list comprehensions
Additional Tips
1. df.columns.str.replace(‘ ‘, ‘_’)

2. list comprehensions

3. Keep a copy of your raw data frame

Part Three : Building your Model(s)
Selecting Your Model
1. Start with your assumptions, build from there

2. Don’t over-complicate things

3. Build up an intuition
Sci-kit Learn
1. Support Vector Machine
Sci-kit Learn
1. Support Vector Machine

2. k-Nearest Neighbors
Evaluation Metrics
1. Confusion Matrix
Evaluation Metrics
1. Confusion Matrix

2. Test Accuracy vs. Algorithm Parameter(s)

Evaluation Metrics
1. Confusion Matrix (TP rate, FP rate)

2. Test Accuracy vs. Algorithm Parameter(s)

3. ROC Curve
Part Four : Deploying Your Model
Deployment Strategy
1. Streamlit vs. Flask

• Streamlit: Limited Control of UI, Great for internal tool-building

• Flask: Template rendering, Routing, Great for consumer-facing products

2. Accessible Design

• Color contrast, alt text, font type and weight

Model Upkeep
• Model Drift
1. Concept Drift : Properties of dependent variable change (target)

2. Data Drift : Properties of independent variable change (feature)

3. Upstream Drift : Operational changes in the data pipeline

• Class Imbalance
Contact Information

E-mail : danielmurphy8@gmail.com

LinkedIn : Profile

Link to Project : Heroku App

Repository : GitHub

DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
César Pérez López
No ratings yet
DATA MINING and MACHINE LEARNING. CLASSIFICATION PREDICTIVE TECHNIQUES: SUPPORT VECTOR MACHINE, LOGISTIC REGRESSION, DISCRIMINANT ANALYSIS and DECISION TREES: Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING. CLASSIFICATION PREDICTIVE TECHNIQUES: SUPPORT VECTOR MACHINE, LOGISTIC REGRESSION, DISCRIMINANT ANALYSIS and DECISION TREES: Examples with MATLAB
César Pérez López
No ratings yet
Building Good Training Sets UNIT 1 PART2
Document46 pages
Building Good Training Sets UNIT 1 PART2
Aditya Sharma
No ratings yet
Bda Unit 1
Document24 pages
Bda Unit 1
balamurugan.170202
No ratings yet
Semi Supervised Learning
Document86 pages
Semi Supervised Learning
chaudharylalit025
No ratings yet
Data Preparation
Document17 pages
Data Preparation
Joyce Choy
No ratings yet
SWE Sheet7 NaguiMostafa 20012069
Document13 pages
SWE Sheet7 NaguiMostafa 20012069
nagui.mostafa
No ratings yet
Chapter 3: Data Mining
Document20 pages
Chapter 3: Data Mining
shreya
No ratings yet
Lab Assignment 1 Title: Data Wrangling I: Problem Statement
Document12 pages
Lab Assignment 1 Title: Data Wrangling I: Problem Statement
Mr. Legendperson
No ratings yet
Data Mining and Warehousing Lab
Document4 pages
Data Mining and Warehousing Lab
PhamThi Thiet
No ratings yet
UNIT-1 1) KDD: KDD (Knowledge Discovery in Database)
Document17 pages
UNIT-1 1) KDD: KDD (Knowledge Discovery in Database)
Abinash Satapathy
No ratings yet
Data Mining
Document135 pages
Data Mining
Dewsun Riseon
No ratings yet
Interview Guide For SAP BO DEVELOPER OR CONSULTANT
Document65 pages
Interview Guide For SAP BO DEVELOPER OR CONSULTANT
crissna
100% (2)
Deep Learning Quantum
Document124 pages
Deep Learning Quantum
dhruvgautam380
No ratings yet
Introduction To Data Science
Document33 pages
Introduction To Data Science
fachriome
No ratings yet
Lecture 1 Practical Analytics - Introduction, Data Sources, Data Modeling, Data Warehouse v3
Document80 pages
Lecture 1 Practical Analytics - Introduction, Data Sources, Data Modeling, Data Warehouse v3
金灿彬
No ratings yet
3-Data Considerations
Document46 pages
3-Data Considerations
max biscene
No ratings yet
DS Unit 1 Essay Answers.
Document18 pages
DS Unit 1 Essay Answers.
Savitha Elluru
No ratings yet
Predictive Modeling Business Report Seetharaman Final Changes PDF
Document28 pages
Predictive Modeling Business Report Seetharaman Final Changes PDF
Ankita Mishra
100% (1)
Anomaly Detection in Social Networks Twitter Bot
Document11 pages
Anomaly Detection in Social Networks Twitter Bot
Mallikarjun patil
No ratings yet
Machine Learning - Project Group 3
Document17 pages
Machine Learning - Project Group 3
Tangirala Ashwini
No ratings yet
Prac 7
Document5 pages
Prac 7
Eklavya Sudan
No ratings yet
Develop A Program To Implement Data Preprocessing Using
Document19 pages
Develop A Program To Implement Data Preprocessing Using
Fucker Jamun
No ratings yet
Lab Manual Computer Science & Engineering
Document29 pages
Lab Manual Computer Science & Engineering
41- Vaibhav Vyas
No ratings yet
Group A Assignment No2 Writeup
Document9 pages
Group A Assignment No2 Writeup
403 Chaudhari Sanika Sagar
No ratings yet
IT and Physics Homework
Document7 pages
IT and Physics Homework
jah jah
No ratings yet
Data Mining Questions and Answers
Document22 pages
Data Mining Questions and Answers
debmatra
No ratings yet
IV-cse DM Viva Questions
Document10 pages
IV-cse DM Viva Questions
Imtiyaz Ali
No ratings yet
Data Science II: Charles C.N. Wang
Document38 pages
Data Science II: Charles C.N. Wang
sar
No ratings yet
Down 3
Document129 pages
Down 3
pavunkumar
No ratings yet
Unit Iii
Document3 pages
Unit Iii
112 Pranav Khot
No ratings yet
MCS 221 New P
Document41 pages
MCS 221 New P
moumitad1432
No ratings yet
Data Mining 2-5
Document4 pages
Data Mining 2-5
nirman kumar
No ratings yet
DBMS PDF
Document95 pages
DBMS PDF
Swapnil Darge
No ratings yet
ETL Testing Concepts
Document4 pages
ETL Testing Concepts
poornananda sai
No ratings yet
Ilovepdf Merged
Document44 pages
Ilovepdf Merged
ranga thukaram
No ratings yet
A1388404476 - 64039 - 23 - 2023 - Machine Learning II
Document10 pages
A1388404476 - 64039 - 23 - 2023 - Machine Learning II
raj241299
No ratings yet
Etl Imp
Document138 pages
Etl Imp
suman duggi
No ratings yet
Data Mining
Document7 pages
Data Mining
Mano
No ratings yet
Be A 65 Ads Exp 3
Document6 pages
Be A 65 Ads Exp 3
Ritika dwivedi
No ratings yet
Machine Learning Section2 Ebook
Document16 pages
Machine Learning Section2 Ebook
camgova
No ratings yet
Data Mining Qns
Document3 pages
Data Mining Qns
Gebreigziabher M. Ab
No ratings yet
Data Structure & Algorithm Analysis
Document4 pages
Data Structure & Algorithm Analysis
Badrul Amin
No ratings yet
Satyabhama Bigdata
Document128 pages
Satyabhama Bigdata
Vijaya Kumar Vadladi
No ratings yet
What Are The Key Aspects of Database Testing?
Document9 pages
What Are The Key Aspects of Database Testing?
neovik82
No ratings yet
Data Mining University Answer
Document10 pages
Data Mining University Answer
oozed12
No ratings yet
Data Mining and Data Warehouse
Document11 pages
Data Mining and Data Warehouse
api-19799369
No ratings yet
Unit 7 ML
Document33 pages
Unit 7 ML
Yuvraj Chauhan
No ratings yet
Data Quality and Preprocessing Concepts ETL
Document64 pages
Data Quality and Preprocessing Concepts ETL
Rahul Panthri
No ratings yet
UNIT I - Introduction - DataScience - New
Document34 pages
UNIT I - Introduction - DataScience - New
Sid S
No ratings yet
QB 10 Marker
Document19 pages
QB 10 Marker
yashpatelykp
No ratings yet
Machine LEarning
Document4 pages
Machine LEarning
Karim
No ratings yet
ML Unit 2
Document41 pages
ML Unit 2
abhijit kate
No ratings yet
7 - Conceptual Data Science
Document22 pages
7 - Conceptual Data Science
Putri Anisa
No ratings yet
BO Interview Questions1
Document47 pages
BO Interview Questions1
petiwala
No ratings yet
Ques 1.give Some Examples of Data Preprocessing Techniques?: Assignment - DWDM Submitted By-Tanya Sikka 1719210284
Document7 pages
Ques 1.give Some Examples of Data Preprocessing Techniques?: Assignment - DWDM Submitted By-Tanya Sikka 1719210284
Sachin Chauhan
No ratings yet
Question Bank DMC
Document28 pages
Question Bank DMC
achal sahare
No ratings yet
Database Week 4
Document12 pages
Database Week 4
farhana uddin
No ratings yet
DWM Lab Manual
Document92 pages
DWM Lab Manual
Hemamalini
No ratings yet
DATA MINING and MACHINE LEARNING. PREDICTIVE TECHNIQUES: ENSEMBLE METHODS, BOOSTING, BAGGING, RANDOM FOREST, DECISION TREES and REGRESSION TREES.: Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING. PREDICTIVE TECHNIQUES: ENSEMBLE METHODS, BOOSTING, BAGGING, RANDOM FOREST, DECISION TREES and REGRESSION TREES.: Examples with MATLAB
César Pérez López
No ratings yet
Communication Theory: Mutiara Budi Azhar, DR., Su., Mmedsc
Document36 pages
Communication Theory: Mutiara Budi Azhar, DR., Su., Mmedsc
iqiqiqiqiq
No ratings yet
Machine Learning Handout
Document2 pages
Machine Learning Handout
Nirmal Singhania
No ratings yet
2 Comparative Performance Study of DBN LSTM CNN and SAE Models For Wind Speed and Direction Forecasting 2
Document5 pages
2 Comparative Performance Study of DBN LSTM CNN and SAE Models For Wind Speed and Direction Forecasting 2
Audace Didavi
No ratings yet
10-601 Machine Learning: Homework 7: Instructions
Document5 pages
10-601 Machine Learning: Homework 7: Instructions
Sasanka Sekhar Sahu
No ratings yet
Emotion Classification For Musical Data Using Deep Learning Techniques
Document8 pages
Emotion Classification For Musical Data Using Deep Learning Techniques
IJRES team
No ratings yet
Job Description:: About Info Edge
Document2 pages
Job Description:: About Info Edge
Koustubh Mane
No ratings yet
Control Principles For Engineered Sysrems 5SMC0
Document41 pages
Control Principles For Engineered Sysrems 5SMC0
Jhon
No ratings yet
Linear and Digital Control Theory (EE326) - Electrical and Electronics Engineering
Document1 page
Linear and Digital Control Theory (EE326) - Electrical and Electronics Engineering
Samudhbhav Prabhu
No ratings yet
Logistic Regression Learning Annotated
Document77 pages
Logistic Regression Learning Annotated
Juan Esteban Mejia Velasquez
No ratings yet
Ann Lab Manual 2
Document7 pages
Ann Lab Manual 2
Manak Jain
No ratings yet
Automatic PTZ Camera Control Based On Deep-Q Network in Video Surveillance System
Document3 pages
Automatic PTZ Camera Control Based On Deep-Q Network in Video Surveillance System
dineth.gd
No ratings yet
Adaptive Resonance Theory Based Neural Networks
Document20 pages
Adaptive Resonance Theory Based Neural Networks
mr.anupambanerjee6651
No ratings yet
SMEW Lab 8A Tahoe
Document5 pages
SMEW Lab 8A Tahoe
Dhruv Patel
No ratings yet
Handbook of Heating, Ventilation and Air Conditioning - Jan F. Kreider
Document10 pages
Handbook of Heating, Ventilation and Air Conditioning - Jan F. Kreider
michell152011152011
No ratings yet
Future of Robotics in India
Document3 pages
Future of Robotics in India
rashmi
No ratings yet
CV Resume NaderJSA En03 PDF
Document3 pages
CV Resume NaderJSA En03 PDF
azitagg
No ratings yet
Introduction of Pragmatics
Document3 pages
Introduction of Pragmatics
Triyanti VeUnosta
No ratings yet
MSE 490 Final Project Paper
Document21 pages
MSE 490 Final Project Paper
KjellSadowski
No ratings yet
A Review Paper On Breast Cancer Detection Using Deep Learning
Document10 pages
A Review Paper On Breast Cancer Detection Using Deep Learning
neeshu kumari
No ratings yet
Sentiment Analysis of Talaash Movie Reviews Using Text Mining Approach
Document9 pages
Sentiment Analysis of Talaash Movie Reviews Using Text Mining Approach
sudhvimal
No ratings yet
AI Jacobs University Green Slides Dec 5
Document238 pages
AI Jacobs University Green Slides Dec 5
Bishesh Tiwaree
No ratings yet
Cybernetic Organism 30092013125043 Cybernetic Organism
Document32 pages
Cybernetic Organism 30092013125043 Cybernetic Organism
Sânthú Stày's
No ratings yet
3-Classification, Clustering and Prediction
Document142 pages
3-Classification, Clustering and Prediction
Barsha Roy
No ratings yet
AI-ML-TE Honors Course 02-02-2021 Final List
Document2 pages
AI-ML-TE Honors Course 02-02-2021 Final List
K S
No ratings yet
PCA Problem Statement With Answer
Document22 pages
PCA Problem Statement With Answer
SBS Movies
No ratings yet
Seminar Presentation
Document25 pages
Seminar Presentation
PaDiNjArAn
No ratings yet
Fake News Detection Based On Word and Document Embedding Using Machine Learning Classifiers
Document11 pages
Fake News Detection Based On Word and Document Embedding Using Machine Learning Classifiers
Farid Ali Mousa
No ratings yet
Review Test Submission - Quiz01 - 202303 - Database ..
Document11 pages
Review Test Submission - Quiz01 - 202303 - Database ..
sreekar kuragayala
No ratings yet
Communication Process With Reference To Advertising
Document11 pages
Communication Process With Reference To Advertising
api-291598576
No ratings yet
PCA Using Python
Document18 pages
PCA Using Python
Ravindra Ambilwade
No ratings yet