Welcome to Scribd!

2nd Code

Uploaded by

0% found this document useful (0 votes)

7 views2 pages

The document describes creating a full pipeline for preprocessing housing data that includes: 1) A numerical pipeline with imputation, adding additional features, and scaling. 2) A categorical pipeline with one-hot encoding. 3) Combining the above pipelines and fitting/transforming the housing data. 4) Creating a linear regression model to predict housing prices and calculating the RMSE and MAE metrics. 5) Defining a function to split data into train and test sets and calling it to split the housing data.

Original Description:

Original Title

2nd code

Copyright

Available Formats

TXT, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

7 views2 pages

2nd Code

Uploaded by

Ali Esam

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 2

Search inside document

36:

### Question: create a full pipeline which includes numerical pipeline that
### includes imputer, attribute added and scalar
### such that extra columns are "rooms_per_household",
### "population_per_household" and "bedrooms_per_room"
### plus one hot encoder as a categorical pipeline
### then casting the resulting values from the full pipepline
### into a dataframe table then show that table

from sklearn.pipeline import Pipeline

from sklearn.preprocessing import StandardScaler, FunctionTransformer
from sklearn.compose import ColumnTransformer

num_pipeline = Pipeline([
('imputer', SimpleImputer(strategy="median")),
('attribs_adder', FunctionTransformer(add_extra_features, validate=False)),
('std_scaler', StandardScaler()),
])

num_attribs = list(housing_num)
cat_attribs = ["ocean_proximity"]

full_pipeline = ColumnTransformer([
("num", num_pipeline, num_attribs),
("cat", OneHotEncoder(), cat_attribs),
])

housing_prepared = full_pipeline.fit_transform(housing)
extra_columns =
["rooms_per_household","population_per_household","bedrooms_per_room"]
columns = list(housing.columns)[:-1]+extra_columns+list(cat_encoder.categories_[0])

housing_pipeline = pd.DataFrame(housing_prepared,
columns=columns,
index=housing.index)
housing_pipeline

37:

### Question: Create a linear regression model for housing_prepared as X

### and housing_labels as Y, then obtain predictions for the
### housing_prepared data
### then get rmse (root mean squared error) and mae (mean
### absolute error) and print them

from sklearn.linear_model import LinearRegression

from sklearn.metrics import mean_squared_error
from sklearn.metrics import mean_absolute_error

lin_reg = LinearRegression()
lin_reg.fit(housing_prepared, housing_labels)
housing_predictions = lin_reg.predict(housing_prepared)

lin_mse = mean_squared_error(housing_labels, housing_predictions)

lin_rmse = np.sqrt(lin_mse)
print("RMSE:", lin_rmse)

lin_mae = mean_absolute_error(housing_labels, housing_predictions)

print("MAE:", lin_mae)

### Question: Create a function called split_train_test to split the

### data using a given test_ratio then call that function
### with data as the housing table and test_ratio=0.2
### then print the length of the training and testing sets

import numpy as np

def split_train_test(data, test_ratio):

shuffled_indices = np.random.permutation(len(data))
test_set_size = int(len(data) * test_ratio)
test_indices = shuffled_indices[:test_set_size]
train_indices = shuffled_indices[test_set_size:]
return data.iloc[train_indices], data.iloc[test_indices]

train_set, test_set = split_train_test(housing, 0.2)

print(len(train_set), "train +", len(test_set), "test")

### Cell 8 ### Included ### Included ###

### Question: split the housing table using test_ratio=0.2
### using function from sklearn package
### then print the length of the training and testing sets

from sklearn.model_selection import train_test_split

train_set, test_set = train_test_split(housing, test_size=0.2, random_state=42)

print(len(train_set), "train +", len(test_set), "test")

Fresco
Document17 pages
Fresco
vinay
100% (2)
100 Python Programming Challenges
Document61 pages
100 Python Programming Challenges
alexmuia
50% (2)
0.1 Guilherme Marthe - Boston House Pricing Challenge
Document15 pages
0.1 Guilherme Marthe - Boston House Pricing Challenge
Guilherme Marthe
100% (1)
Lecture 2: More Data Structures: Outline
Document16 pages
Lecture 2: More Data Structures: Outline
Bakari Hamisi
No ratings yet
Udacity Machine Learning Analysis Supervised Learning
Document504 pages
Udacity Machine Learning Analysis Supervised Learning
yousef shaban
100% (1)
Design A Neural Network For Classifying Movie Reviews
Document5 pages
Design A Neural Network For Classifying Movie Reviews
hxd3945
No ratings yet
Image Classification Handson-Image - Test
Document5 pages
Image Classification Handson-Image - Test
Pushpendra Singh
No ratings yet
DL Lab Manual
Document35 pages
DL Lab Manual
lavanya penumudi
100% (1)
Bilal Ahmad Ai & DSS Assign # 03
Document7 pages
Bilal Ahmad Ai & DSS Assign # 03
Bilal Ahmad
No ratings yet
R Lab Program
Document21 pages
R Lab Program
Sachin Shimogha
No ratings yet
Handwritten Character Recognition With Neural Network
Document12 pages
Handwritten Character Recognition With Neural Network
shreyash sonone
No ratings yet
ML Practical 205160694034
Document33 pages
ML Practical 205160694034
09Samrat Bikram Shah
No ratings yet
Models
Document2 pages
Models
Minh Sơn
No ratings yet
Assignment 3 DS5620
Document11 pages
Assignment 3 DS5620
humaragpt
No ratings yet
Experiment Number - 2.2
Document16 pages
Experiment Number - 2.2
Sourabh Singh
No ratings yet
ML Implementation
Document14 pages
ML Implementation
noussayer mighri
No ratings yet
Trainina A NN Backpropagation
Document6 pages
Trainina A NN Backpropagation
arun_1328
No ratings yet
Phython
Document19 pages
Phython
Karthik
No ratings yet
Python Lab File Example
Document20 pages
Python Lab File Example
50 Mohit Sharma
No ratings yet
Programming Exercise 2 - Writing Recognition With TensorFlow.
Document3 pages
Programming Exercise 2 - Writing Recognition With TensorFlow.
brian ngaruiya
No ratings yet
Back Propogation Training
Document6 pages
Back Propogation Training
arun_1328
No ratings yet
From Import From Import From Import From Import If In: Randomsplit
Document2 pages
From Import From Import From Import From Import If In: Randomsplit
Yubaraj Tamang
No ratings yet
Machine Learning
Document54 pages
Machine Learning
Jacob
No ratings yet
QLSTMvs LSTM
Document7 pages
QLSTMvs LSTM
mohamedaligharbi20
No ratings yet
Python 100 Practice Programs
Document83 pages
Python 100 Practice Programs
rithika
No ratings yet
Image Caption2
Document9 pages
Image Caption2
MANAL BENNOUF
No ratings yet
Machine Learning Practice
Document17 pages
Machine Learning Practice
21f2001191
No ratings yet
ÔN TẬP FINAL NGÔN NGỮ LẬP TRÌNH
Document121 pages
ÔN TẬP FINAL NGÔN NGỮ LẬP TRÌNH
Phạm Thanh Hà
No ratings yet
Python - Module Test - Jupyter Notebook
Document6 pages
Python - Module Test - Jupyter Notebook
Pawan Gosavi
No ratings yet
Assignment 4 Utkarsh
Document7 pages
Assignment 4 Utkarsh
bubunkumar84
No ratings yet
Ds File
Document58 pages
Ds File
tapcom19
No ratings yet
Assignment 2.3.1 Transfer Learning
Document7 pages
Assignment 2.3.1 Transfer Learning
Hockhin Ooi
No ratings yet
Code
Document11 pages
Code
mushahed
No ratings yet
Assignment 1 (102103375 Sunali)
Document13 pages
Assignment 1 (102103375 Sunali)
ssunalibe21
No ratings yet
Assignment 7
Document3 pages
Assignment 7
jitbitan.kgpian
No ratings yet
MLR Example 2predictors
Document5 pages
MLR Example 2predictors
wangshiui2002
No ratings yet
Python Unit 04
Document48 pages
Python Unit 04
Free fire Garena
No ratings yet
NLP Tushar
Document21 pages
NLP Tushar
Yash Amin
No ratings yet
Juan Candy Prima - Decision Tree Classifier
Document3 pages
Juan Candy Prima - Decision Tree Classifier
Juan Candy Prima
No ratings yet
Numbers: # Basic Calculations 1+2 5/6 # Numbers A 123.1 Print (A) B 10 Print (B) A + B C A + B Print (C)
Document80 pages
Numbers: # Basic Calculations 1+2 5/6 # Numbers A 123.1 Print (A) B 10 Print (B) A + B C A + B Print (C)
Ahmad Nazir
No ratings yet
Bharath Chowdry Aat5
Document13 pages
Bharath Chowdry Aat5
PRASAD DIGITAL STUDIO NAGAMANGALA
No ratings yet
Class 10 AI Practiacls 2023-24
Document4 pages
Class 10 AI Practiacls 2023-24
singhmrinalini1305
No ratings yet
Data Analysis in Python-3
Document4 pages
Data Analysis in Python-3
mohan
No ratings yet
Test2 Answerscheme
Document7 pages
Test2 Answerscheme
May Lee
No ratings yet
Lstm-Load-Forecasting:6 - All - Features - Ipynb at Master Dafrie:lstm-Load-Forecasting GitHub
Document5 pages
Lstm-Load-Forecasting:6 - All - Features - Ipynb at Master Dafrie:lstm-Load-Forecasting GitHub
Muhammad Hamdani Azmi
No ratings yet
Apex For Bres 1
Document6 pages
Apex For Bres 1
Bless Co
No ratings yet
#Create Vector of Numeric Values #Display Class of Vector
Document10 pages
#Create Vector of Numeric Values #Display Class of Vector
Anooj Srivastava
No ratings yet
Implementation of Time Series Forecasting
Document12 pages
Implementation of Time Series Forecasting
Soba C
No ratings yet
Python Lab Manual
Document13 pages
Python Lab Manual
Sanjay Dilip
No ratings yet
Different Python Interview Programs
Document10 pages
Different Python Interview Programs
AKSHAY WADITKE
No ratings yet
Name - Jai Ramteke Class - TYBBA (CA) Roll No - 50 Python Assignment 5 Set A
Document8 pages
Name - Jai Ramteke Class - TYBBA (CA) Roll No - 50 Python Assignment 5 Set A
Jai Ramteke
100% (1)
IT Math Functions
Document10 pages
IT Math Functions
Madhu Priya Guthi
No ratings yet
IDS - Unit 3 - 5
Document80 pages
IDS - Unit 3 - 5
Omer Sohail
No ratings yet
R File
Document18 pages
R File
Jyoti Godara
No ratings yet
UNIT-IV Notes Python
Document31 pages
UNIT-IV Notes Python
Durgesh Gaikwad
No ratings yet
Email Spam Classifier
Document22 pages
Email Spam Classifier
phenomenal beast
No ratings yet
Functions PDF
Document26 pages
Functions PDF
Khushi Gupta
100% (1)
Cse425 Assignement - 20101257
Document12 pages
Cse425 Assignement - 20101257
sudipta nandi
No ratings yet
Csassign
Document5 pages
Csassign
Mayank Saharan
No ratings yet
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
3rd Code
Document3 pages
3rd Code
Ali Esam
No ratings yet
Static&Dynamic Report
Document3 pages
Static&Dynamic Report
Ali Esam
No ratings yet
Encryption Methods
Document1 page
Encryption Methods
Ali Esam
No ratings yet
1st Code
Document1 page
1st Code
Ali Esam
No ratings yet
Slot24 25 26 TextProcessing 2021 04
Document58 pages
Slot24 25 26 TextProcessing 2021 04
Công Quân
No ratings yet
Vlsi Testability
Document50 pages
Vlsi Testability
jeevithpaul
No ratings yet
Major Project On: "Age and Gender Detection Master''
Document28 pages
Major Project On: "Age and Gender Detection Master''
Vijay Lakshmi
No ratings yet
Stanford CME241
Document35 pages
Stanford CME241
Mindaugas Zickus
No ratings yet
Objectives: 054414 Process Control System Design
Document11 pages
Objectives: 054414 Process Control System Design
alan campezzi
No ratings yet
241 Testsol 2
Document5 pages
241 Testsol 2
كاظم طارق
No ratings yet
Seismic Load Considered Is As Per SAES-A-112. If Calculated The Value Shall Be 0.02 (See The Calculation Below.)
Document2 pages
Seismic Load Considered Is As Per SAES-A-112. If Calculated The Value Shall Be 0.02 (See The Calculation Below.)
Mohamed Rafik
No ratings yet
Key Management (MANET)
Document31 pages
Key Management (MANET)
Vidya Bagal
No ratings yet
An Improved Prediction System For Football A Match Result - Data Mining
Document9 pages
An Improved Prediction System For Football A Match Result - Data Mining
Cecil Chiu
No ratings yet
Irjet V9i1124
Document5 pages
Irjet V9i1124
BALAJI
No ratings yet
Python Programs
Document6 pages
Python Programs
dsre
No ratings yet
Date Fruit Classification Project
Document11 pages
Date Fruit Classification Project
Mohammad Faraz Farooqi
No ratings yet
Ch3: Frequency Analysis For DT Signals: Questions To Be Answered
Document31 pages
Ch3: Frequency Analysis For DT Signals: Questions To Be Answered
Anonymous T4YHyOFm
No ratings yet
Thermo Notes All
Document216 pages
Thermo Notes All
Manit Grover
No ratings yet
Machine Learning in GIS
Document8 pages
Machine Learning in GIS
Krishnakant Behera
No ratings yet
Untitled
Document469 pages
Untitled
christian wendt
No ratings yet
AWID For IntrusionCISS2019
Document6 pages
AWID For IntrusionCISS2019
Quý Tùng
No ratings yet
Course Title: Quantitative Business Analysis Couse Code: BUS230 Semester: Summer I 2017/2018 Assignment
Document5 pages
Course Title: Quantitative Business Analysis Couse Code: BUS230 Semester: Summer I 2017/2018 Assignment
aboubakr soultan
No ratings yet
BA ZG524 Advanced Statistical Methods
Document7 pages
BA ZG524 Advanced Statistical Methods
Clitt Orise
No ratings yet
MATH 437/ MATH 535: Applied Stochastic Processes/ Advanced Applied Stochastic Processes
Document7 pages
MATH 437/ MATH 535: Applied Stochastic Processes/ Advanced Applied Stochastic Processes
Kashif Khalid
No ratings yet
The 0-1 Knapsack Problem: An Introductory Survey
Document13 pages
The 0-1 Knapsack Problem: An Introductory Survey
Rahma Jabri
No ratings yet
Lab # 6 Control System
Document14 pages
Lab # 6 Control System
Zabeehullahmiakhail
No ratings yet
Image Crptography Synopsis PDF
Document5 pages
Image Crptography Synopsis PDF
ashutosh
No ratings yet
Time Series Econometrics For MSC 20212022
Document268 pages
Time Series Econometrics For MSC 20212022
Tise Tegy
No ratings yet
Capacitated Vehicle Routing Problem With Column Generation and Reinforcement Learning Techniques
Document15 pages
Capacitated Vehicle Routing Problem With Column Generation and Reinforcement Learning Techniques
Fariz Noor
No ratings yet
CS1 Mapping Syllabus PDF
Document9 pages
CS1 Mapping Syllabus PDF
Bakari Hamisi
No ratings yet
MA122 Fall 21 Final Problems
Document8 pages
MA122 Fall 21 Final Problems
Clinton Osawe
No ratings yet
Econometrics II Assignment
Document3 pages
Econometrics II Assignment
Hamral Temam
No ratings yet
Time Series Station, AR, MA
Document30 pages
Time Series Station, AR, MA
Hospital Basis
No ratings yet
SSL and Tls 2
Document22 pages
SSL and Tls 2
Anonymous L3zAMqRlzU
No ratings yet