Welcome to Scribd!

Lab8 3

Uploaded by

0% found this document useful (0 votes)

28 views2 pages

This document provides instructions for a lab exercise on decision trees using Scikit-Learn. Students are asked to: 1) select predictors and split data into training and test sets; 2) create a DecisionTreeRegressor and adjust hyperparameters; 3) view the trained tree; and 4) compute test set RMSE. The goal is to experiment with hyperparameters and their effect on tree structure and accuracy.

Original Description:

Original Title

lab8-3

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

28 views2 pages

Lab8 3

Uploaded by

api-479141525

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 2

Search inside document

#

‐*‐ coding: utf‐8 ‐*‐
"""
Lab: Decision trees, part 3
@author: Brian James
"""
# import graphviz
# With Scikit‐Learn, the quality of your decision tree will depend a lot on
# how you select hyperparameters.  The purpose of this lab is to help you get
# familiar with the hyperparameters of DecisionTreeRegressor.
# The lab is quite open‐ended.  I want you to predict CPU performance using a
# regression tree.  First create a file with this starter code shown on the next
page.
# Next, do the following:
# ● pick some predictors, and create training and test sets
# ● create a DecisionTreeRegressor, and set some of the hyperparameters listed
in lecture:
# ○ min_samples_split, max_depth, min_samples_leaf, max_leaf_nodes,
min_impurity_decrease
# ● train your tree and see what it looks like
# ● compute the RMSE for your model on the test data  ("test RMSE")
# Do this a bunch of times to see how the hyperparameters affect the
# appearance of your tree and your test RMSE.
# Be careful not to create a giant tree.  Trying to plot a giant tree can
# bring your machine to a standstill.
# If you have time, try doing a grid search with cross validation to find the
# best hyperparameter settings.
# (Starter code on next page)
#
import numpy as np
import pandas as pd
from matplotlib import rcParams
from sklearn.tree import DecisionTreeRegressor, export_graphviz
from sklearn.model_selection import train_test_split
import seaborn as sns
import graphviz

# # switch to seaborn default stylistic parameters
sns.set()
# larger plot fonts
sns.set_context('talk')
# change default plot size
rcParams['figure.figsize'] = 10,8

# read the cpu data
df =
pd.read_csv("https://raw.githubusercontent.com/grbruns/cst383/master/machine.csv")
df.index = df['vendor']+' '+df['model']
df.drop(['vendor', 'model'], axis=1, inplace=True)
df['cs'] = np.round(1e3/df['myct'], 2) # clock speed in MHz
# get ready for Scikit‐Learn
predictors = ['mmin', 'chmax'] # choose predictors as you like
target = 'prp'
X = df[predictors].values
y = df[target].values

# test/train split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.30,
random_state=0)

# train the model
reg = DecisionTreeRegressor(max_depth=2)
reg.fit(X_train, y_train)

# view the tree
# conda install python‐graphviz
dot_data = export_graphviz(reg, precision=2,
                     feature_names=predictors,
                     proportion=True,
                     filled=True, rounded=True)
graph = graphviz.Source(dot_data)
graph

# make predictions and compute error
y_predict = reg.predict(X_test)
errors = y_test ‐ y_predict
rmse = np.sqrt((errors**2).mean())
print('rmse: {:0.2f}'.format(rmse))

ThinkScript User Manual PDF
Document21 pages
ThinkScript User Manual PDF
iindicascribd
100% (3)
Assignment 2 PDF
Document25 pages
Assignment 2 PDF
Boni Halder
No ratings yet
ThinkScript User Manual PDF
Document21 pages
ThinkScript User Manual PDF
iindicascribd
100% (2)
Programming Assignment 2 Udp Pinger Ver
Document7 pages
Programming Assignment 2 Udp Pinger Ver
api-479141525
No ratings yet
Relational Database Management Systems (RDBMSS) : 1. Why Test An RDBMS?
Document10 pages
Relational Database Management Systems (RDBMSS) : 1. Why Test An RDBMS?
hide123456789
No ratings yet
DMDW Experiment-9
Document5 pages
DMDW Experiment-9
Anirudh Vennapusa
No ratings yet
Tutorial JAGS PDF
Document24 pages
Tutorial JAGS PDF
AlexNeumann
No ratings yet
GuideToIRTinvarianceUsingMIRT (ANCHOR)
Document10 pages
GuideToIRTinvarianceUsingMIRT (ANCHOR)
Ampeh Sarok
No ratings yet
Jupyter Lab
Document42 pages
Jupyter Lab
Paul Shaaf
No ratings yet
Decision Trees in Sklearn Decision Trees in Sklearn
Document7 pages
Decision Trees in Sklearn Decision Trees in Sklearn
adityaacharya44
No ratings yet
Machine Learning Basics
Document18 pages
Machine Learning Basics
Daniel Cadena
No ratings yet
Lab2.3 Tessent TestKompress Integration Flows EX3
Document28 pages
Lab2.3 Tessent TestKompress Integration Flows EX3
Keyur Mahant
No ratings yet
Data Mining Record
Document34 pages
Data Mining Record
Mohan Chandaluru
No ratings yet
An Example Machine Learning Notebook
Document28 pages
An Example Machine Learning Notebook
Ramakrishnan Harihara Venkatasubramania
No ratings yet
Data Poison Detection Schemes For Distribution Machine Learning
Document22 pages
Data Poison Detection Schemes For Distribution Machine Learning
Telu Tejaswini
No ratings yet
R - Decision Tree
Document4 pages
R - Decision Tree
Ss
No ratings yet
Verification
Document149 pages
Verification
P Brahma Reddy
No ratings yet
Project Bank: - Brought To You by - Ultimate Collection of Projects & Source Codes in All Programming Languages
Document7 pages
Project Bank: - Brought To You by - Ultimate Collection of Projects & Source Codes in All Programming Languages
Ravi Gupta
No ratings yet
Loan
Document3 pages
Loan
Manaswi
No ratings yet
Project 1
Document4 pages
Project 1
aqsa yousaf
No ratings yet
Lab2.2 Tessent TestKompress Integration Flows EX2
Document21 pages
Lab2.2 Tessent TestKompress Integration Flows EX2
Keyur Mahant
No ratings yet
Pganalyze - Best Practices For Optimizing Postgres Query Performance
Document26 pages
Pganalyze - Best Practices For Optimizing Postgres Query Performance
Ramkumar
100% (1)
MEMELink
Document3 pages
MEMELink
ariyan.hossain2208
No ratings yet
Hyperparameter Tuning For Machine Learning Models
Document5 pages
Hyperparameter Tuning For Machine Learning Models
Priya dharshini.G
No ratings yet
Types of Pruning Techniques
Document10 pages
Types of Pruning Techniques
Smriti Piyush
No ratings yet
A Recipe For Training Neural Networks
Document15 pages
A Recipe For Training Neural Networks
Choukha Ram (cRc)
No ratings yet
Pganalyze Best Practices For Optimizing Postgres Query Performance
Document26 pages
Pganalyze Best Practices For Optimizing Postgres Query Performance
Le Tan Phat
No ratings yet
MLA Lab 6:-Implementation of Decision Tree
Document16 pages
MLA Lab 6:-Implementation of Decision Tree
tushar3patil03
No ratings yet
6.034 Design Assignment 2: 1 Data Sets
Document6 pages
6.034 Design Assignment 2: 1 Data Sets
upender_kalwa
No ratings yet
Building Correlation Searches With Splunk Enterprise Security Exercise Guide
Document6 pages
Building Correlation Searches With Splunk Enterprise Security Exercise Guide
shahbaz ahmed
No ratings yet
Tensorflow Neural Network Lab: Notmnist
Document15 pages
Tensorflow Neural Network Lab: Notmnist
Daniel Petrov
No ratings yet
Lab2.1 - Tessent - TestKompress - Integration - Flows - EX1 1
Document33 pages
Lab2.1 - Tessent - TestKompress - Integration - Flows - EX1 1
Keyur Mahant
No ratings yet
Null Pointer Assignment
Document10 pages
Null Pointer Assignment
ibodduhjf
100% (1)
ERPNext On Debian 9
Document15 pages
ERPNext On Debian 9
vecoreda5493
No ratings yet
Data Science Tips and Tricks: 1. Running Jupyter Notebooks On A Shared Linux/Unix Machine
Document6 pages
Data Science Tips and Tricks: 1. Running Jupyter Notebooks On A Shared Linux/Unix Machine
eight8888
No ratings yet
2 Functions
Document49 pages
2 Functions
JM
No ratings yet
SimpleScalar Guide
Document4 pages
SimpleScalar Guide
Saurabh Chaubey
No ratings yet
Lab5 n01530481
Document5 pages
Lab5 n01530481
smeet patel
No ratings yet
CMSC422 Project Presentation
Document17 pages
CMSC422 Project Presentation
anis_abboud
No ratings yet
8 Ejercicio - Optimización y Guardado de Modelos - Training - Microsoft Learn Ingles
Document13 pages
8 Ejercicio - Optimización y Guardado de Modelos - Training - Microsoft Learn Ingles
acxel david castillo casas
No ratings yet
SQL Server Performance Tuning Imp Points
Document8 pages
SQL Server Performance Tuning Imp Points
Firas Boubes
No ratings yet
Master Thesis Algorithm
Document6 pages
Master Thesis Algorithm
jennifergutierrezmilwaukee
100% (2)
Machine Learning Random Forest Algorithm - Javatpoint
Document14 pages
Machine Learning Random Forest Algorithm - Javatpoint
RAMZI Azeddine
No ratings yet
Mangos Bible 2 1 3
Document512 pages
Mangos Bible 2 1 3
kantti
100% (8)
20AI16 - ML Record
Document24 pages
20AI16 - ML Record
Menma
No ratings yet
Train: Dev: Test Sets
Document5 pages
Train: Dev: Test Sets
John
No ratings yet
DataCamp - TensorBoard Tutorial
Document31 pages
DataCamp - TensorBoard Tutorial
Stig Kalmo
No ratings yet
MP2: Design Patterns
Document4 pages
MP2: Design Patterns
Verguisho
No ratings yet
Problem Set 1: Introduction To R - Solutions With R Output: 1 Install Packages
Document24 pages
Problem Set 1: Introduction To R - Solutions With R Output: 1 Install Packages
Darnell Larsen
No ratings yet
1 Data (7 Points) : Img Cv2.imread
Document2 pages
1 Data (7 Points) : Img Cv2.imread
Victor Cano
No ratings yet
4-DatAdvantage Advanced Installation For Microsoft Platforms 8.6 - M365 Patch
Document158 pages
4-DatAdvantage Advanced Installation For Microsoft Platforms 8.6 - M365 Patch
yaritza
No ratings yet
How To Use The Grinder Performance Testing Tool
Document18 pages
How To Use The Grinder Performance Testing Tool
itishajain23
No ratings yet
Handout 3 - Project Overview
Document5 pages
Handout 3 - Project Overview
swasthikamanaram
No ratings yet
Keras For Beginners: Implementing A Recurrent Neural Network
Document13 pages
Keras For Beginners: Implementing A Recurrent Neural Network
Robert DEL POPOLO
No ratings yet
Sat - 149.Pdf - Prediction of Bigmart Sales Using Machine Learning Algorihms
Document11 pages
Sat - 149.Pdf - Prediction of Bigmart Sales Using Machine Learning Algorihms
Vj Kumar
No ratings yet
AI Phash 5
Document14 pages
AI Phash 5
techusama4
No ratings yet
2324 BigData Lab3
Document6 pages
2324 BigData Lab3
Elie Al Howayek
No ratings yet
Basic Imaging and Self-Calibration (T4 + T7) : John Mckean
Document41 pages
Basic Imaging and Self-Calibration (T4 + T7) : John Mckean
arijit manna
No ratings yet
hw1 Problem Set
Document8 pages
hw1 Problem Set
Billy bob
No ratings yet
SQL Server 2017 Query Performance Tuning: Troubleshoot and Optimize Query Performance
From Everand
SQL Server 2017 Query Performance Tuning: Troubleshoot and Optimize Query Performance
Grant Fritchey
No ratings yet
Netcat Power Tools
From Everand
Netcat Power Tools
Jan Kanclirz
Rating: 3 out of 5 stars
3/5 (1)
Capstone Proposal
Document25 pages
Capstone Proposal
api-479141525
No ratings yet
Familiarize Yourself With Your Data
Document5 pages
Familiarize Yourself With Your Data
api-479141525
No ratings yet
Personal Website - HTML
Document2 pages
Personal Website - HTML
api-479141525
No ratings yet
Threadsync
Document2 pages
Threadsync
api-479141525
No ratings yet
Pa4 Final PDF
Document23 pages
Pa4 Final PDF
api-479141525
No ratings yet
Assignment 4
Document15 pages
Assignment 4
api-479141525
No ratings yet
Practice Problems Week 7
Document4 pages
Practice Problems Week 7
api-479141525
No ratings yet
Product Documentation-Brjames
Document8 pages
Product Documentation-Brjames
api-479141525
No ratings yet
CST 334 Research Collaboration Project
Document2 pages
CST 334 Research Collaboration Project
api-479141525
No ratings yet
Researchcollaboration
Document19 pages
Researchcollaboration
api-479141525
No ratings yet
A Study On Distributed Machine Learning Techniques For Large Scale Weather Forecasting
Document22 pages
A Study On Distributed Machine Learning Techniques For Large Scale Weather Forecasting
bracshammo
No ratings yet
Autos K Learn
Document18 pages
Autos K Learn
Mathias Rosas
No ratings yet
Quiz: Reinforcement Learning: Question 1 of 5
Document25 pages
Quiz: Reinforcement Learning: Question 1 of 5
Andreea Calarasu
No ratings yet
Predicting Movie Success Based On Imdb Data
Document5 pages
Predicting Movie Success Based On Imdb Data
Aniket Sanyal
No ratings yet
Improving Deep Neural Networks: Hyperparameter Tuning, Regularization and Optimization (Week 1) Quiz
Document6 pages
Improving Deep Neural Networks: Hyperparameter Tuning, Regularization and Optimization (Week 1) Quiz
Tony Veas
No ratings yet
DP-100 Designing and Implementing A Data Science Solution On Azure Exam 3
Document5 pages
DP-100 Designing and Implementing A Data Science Solution On Azure Exam 3
Steven Doh
No ratings yet
Clonamos El Repositorio para Obtener Los Dataset: From Import
Document23 pages
Clonamos El Repositorio para Obtener Los Dataset: From Import
Juan Chavarria Asparrin
No ratings yet
ML Glossary
Document44 pages
ML Glossary
Lakshya Priyadarshi
No ratings yet
Automatic Detection of Cyberbullying in Social Media Text
Document21 pages
Automatic Detection of Cyberbullying in Social Media Text
Zobayer Ahmed
No ratings yet
Orthogonal Array Tuning
Document12 pages
Orthogonal Array Tuning
Paco Pedroza
No ratings yet
Web Traffic Time Series Forecasting: Kaggle Competition Review Bill Tubbs July 26, 2018
Document39 pages
Web Traffic Time Series Forecasting: Kaggle Competition Review Bill Tubbs July 26, 2018
do minh tien
No ratings yet
Grid Search Random Search Genetic Algorithm A Big
Document11 pages
Grid Search Random Search Genetic Algorithm A Big
Dr. Khan Muhammad
No ratings yet
Sciencedirect Sciencedirect
Document8 pages
Sciencedirect Sciencedirect
Gamalliel Sharon
No ratings yet
30 Days of Interview Preparation
Document415 pages
30 Days of Interview Preparation
heet
100% (1)
Phishing Detection System Through Hybrid
Document16 pages
Phishing Detection System Through Hybrid
Nexgen Technology
No ratings yet
Image Synthesis in Multi-Contrast MRI With Conditional Generative Adversarial Networks
Document14 pages
Image Synthesis in Multi-Contrast MRI With Conditional Generative Adversarial Networks
Guru Velmathi
No ratings yet
d1S8gx40QmGUvIMeNNJhBA - PDF Best Practices For ML Development On Vertex AI
Document48 pages
d1S8gx40QmGUvIMeNNJhBA - PDF Best Practices For ML Development On Vertex AI
afif.yassir12
No ratings yet
Big Transfer (Bit) : General Visual Representation Learning
Document28 pages
Big Transfer (Bit) : General Visual Representation Learning
nvk1211
No ratings yet
17 Ensemble Techniques Problem Statement
Document28 pages
17 Ensemble Techniques Problem Statement
Jadhav A.S
No ratings yet
Resume PDF
Document1 page
Resume PDF
Hello
No ratings yet
Cab Fare Prediction Report by Abhinav Jha
Document41 pages
Cab Fare Prediction Report by Abhinav Jha
VAISHALI KAUL
No ratings yet
Machine Learning For AC OPF
Document4 pages
Machine Learning For AC OPF
alamali88
No ratings yet
Blazing Text Navigating The Dimensional Labyrinth
Document91 pages
Blazing Text Navigating The Dimensional Labyrinth
surendersara
No ratings yet
Le Wagon - Data Science Course Syllabus
Document37 pages
Le Wagon - Data Science Course Syllabus
trdngaccnt16
No ratings yet
Image Preprocessing and Hyperparameter Optimization On Pretrained Model MobileNetV2 in White Blood Cell Image Classification
Document14 pages
Image Preprocessing and Hyperparameter Optimization On Pretrained Model MobileNetV2 in White Blood Cell Image Classification
IAES IJAI
No ratings yet
Cie 2
Document13 pages
Cie 2
tarunbinjadagi18
No ratings yet
New Thesis
Document22 pages
New Thesis
Parvendra Kumar
No ratings yet
Artificial Intelligence Method For Shear Wave Travel Time Prediction
Document18 pages
Artificial Intelligence Method For Shear Wave Travel Time Prediction
lakhanmukhtiar
No ratings yet
Improving Graph Neural Networks With Simple Architecture Design
Document10 pages
Improving Graph Neural Networks With Simple Architecture Design
hilmi bukhori
No ratings yet
Lab 1. Boston House
Document7 pages
Lab 1. Boston House
dimas bayu
No ratings yet