Welcome to Scribd!

Dela Cruz - NB - AT

Uploaded by

0% found this document useful (0 votes)

6 views6 pages

The document describes experiments conducted using Gaussian Naive Bayes and Decision Tree classifiers on a 'play_golf' dataset. Code is provided to split the data into training and test sets with ratios of 80-20, 50-50, and 70-30. For Gaussian NB, accuracy and F1 score increased as the training ratio increased. The 50-50 split provided a more balanced performance. For Decision Tree, accuracy and F1 score were consistent across splits, but a 50-50 split showed a slight difference between the scores. The optimal split depends on dataset characteristics and project goals.

Original Description:

Original Title

Dela Cruz_NB_AT

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

6 views6 pages

Dela Cruz - NB - AT

Uploaded by

JOVINEIL DELA CRUZ

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 6

Search inside document

November, 13, 2023

Dela Cruz, Jovineil V. Dr. Estrada

CS31S2
NB_AT
First Step
I created a python file named IA.py
I ran this block of code to create “play_golf.csv” including its data set

Next I removed the code then pasted this

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

df = pd.read_csv('play_golf.csv') #change this to our play-golf dataset

df.head()
df.info()

sns.countplot(data=df,x='play',hue='outlook')
plt.xticks(rotation=45, ha='right');
pre_df = pd.get_dummies(df,columns=['day', 'outlook', 'temp', 'humidity', 'wind'],drop_first=True)
pre_df.head()
from sklearn.model_selection import train_test_split

X = pre_df.drop('play', axis=1)
y = pre_df['play']

X_train, X_test, y_train, y_test = train_test_split(

X, y, test_size=0.25, random_state=125
)
from sklearn.naive_bayes import GaussianNB

model = GaussianNB()
model.fit(X_train, y_train);

from sklearn.metrics import (

accuracy_score,
confusion_matrix,
ConfusionMatrixDisplay,
f1_score,
classification_report,
)
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_pred, y_test)
f1 = f1_score(y_pred, y_test, average="weighted")
print("Accuracy:", accuracy)
print("F1 Score:", f1)

before I ran this code, I changed test_size to .20 for the 80-20 split

Split 80-20

Next I changed it to .50 for the 50-50 split

Split 50-50
Lastly for the 70-30 split, I set the test_size = .3

Next for the TREE same process just different code

import pandas as pd

df = pd.read_csv('play_golf.csv') #change this to our play-golf dataset

df.head()

df.info()

import seaborn as sns

import matplotlib.pyplot as plt
sns.countplot(data=df,x='play',hue='outlook')
plt.xticks(rotation=45, ha='right');

pre_df = pd.get_dummies(df,columns=['day', 'outlook', 'temp', 'humidity', 'wind'],drop_first=True)

pre_df.head()

from sklearn.model_selection import train_test_split

X = pre_df.drop('play', axis=1)
y = pre_df['play']

X_train, X_test, y_train, y_test = train_test_split(

X, y, test_size=0.3, random_state=125
)

from sklearn.tree import DecisionTreeClassifier

model = DecisionTreeClassifier()

model.fit(X_train, y_train);

from sklearn.metrics import (

accuracy_score,
confusion_matrix,
ConfusionMatrixDisplay,
f1_score,
classification_report,
)

y_pred = model.predict(X_test)

accuracy = accuracy_score(y_pred, y_test)

f1 = f1_score(y_pred, y_test, average="weighted")

print("\n----------------\n")
print("Accuracy:", accuracy)
print("F1 Score:", f1)

80-20
50-50

70-30
Insights

While experimenting on the Gaussian NB with different split such as 80-20, 50-50 and 70-
30, the accuracy and F1 scores varies. I noticed that the higher the training ratio the more accurate
it becomes. While on the other hand, the 50-50 split gave us a more balanced accuracy and f1
score as its ratio is not that significant.
On the other hand, in Decision tree, if the training is higher, the accuracy and f1 scores are
the same while if the split is balanced 50-50 there is a slight difference between the accuracy and
the f1 scores.
But then again the chosen split ratio should still decided based on the different
characteristic of the datasets and the goals of the learning project.

Ai Lab
Document15 pages
Ai Lab
4653Anushika Patel
No ratings yet
16BCB0126 VL2018195002535 Pe003
Document40 pages
16BCB0126 VL2018195002535 Pe003
Mohit
No ratings yet
Assignment 5
Document5 pages
Assignment 5
BHAVIKA MALHOTRA
No ratings yet
Decision Tree
Document3 pages
Decision Tree
saba
No ratings yet
Data Science Assignment Submission
Document12 pages
Data Science Assignment Submission
Sneha
No ratings yet
CODIGO#
Document4 pages
CODIGO#
deger treuri
No ratings yet
DL Ex 13
Document5 pages
DL Ex 13
224464.jee
No ratings yet
Sta Notes
Document44 pages
Sta Notes
Manshal Brohi
No ratings yet
ML Assignment
Document8 pages
ML Assignment
Himalaya Sagar
No ratings yet
Final Project
Document9 pages
Final Project
Guillermo Aguilar
No ratings yet
LAB-4 Report
Document21 pages
LAB-4 Report
jithentar.cs21
No ratings yet
Nadya Faudilla - 1806198471 - Geologi Komputasi 5 Dan 6 - Jupyter Notebook
Document9 pages
Nadya Faudilla - 1806198471 - Geologi Komputasi 5 Dan 6 - Jupyter Notebook
Emir Rakhim
No ratings yet
ML
Document7 pages
ML
21eg105f37
No ratings yet
ANANYAA GUPTA 20BCT0177 ML MTT 24/11/21 Q3 Breast Cancer Dataset
Document4 pages
ANANYAA GUPTA 20BCT0177 ML MTT 24/11/21 Q3 Breast Cancer Dataset
Ananyaa Gupta
No ratings yet
Dadi
Document5 pages
Dadi
Gïø Kavtaradze
No ratings yet
Untitled2.ipynb - Colaboratory
Document2 pages
Untitled2.ipynb - Colaboratory
rvvnbrao
No ratings yet
Cancer Disease Classification
Document6 pages
Cancer Disease Classification
BARATH P
No ratings yet
ID3
Document3 pages
ID3
Kavyashree
No ratings yet
AI Lab9
Document5 pages
AI Lab9
Maryam Khansa
No ratings yet
Machine Vison Homework
Document4 pages
Machine Vison Homework
Teddy Bz
No ratings yet
Aiml Lab Manual 2023
Document17 pages
Aiml Lab Manual 2023
shamilie17
No ratings yet
Wind Power Forecasting
Document11 pages
Wind Power Forecasting
Teto Schedule
No ratings yet
Contoh Code Klastering Alur Hirarkial
Document2 pages
Contoh Code Klastering Alur Hirarkial
aditya Nugroho
No ratings yet
Artificial Intelligence Record
Document26 pages
Artificial Intelligence Record
Harishwaran V.
No ratings yet
P03 A Star Algorithm 35 Anushka Shetty
Document23 pages
P03 A Star Algorithm 35 Anushka Shetty
anohanabrotherhoodcave
No ratings yet
Machine File
Document27 pages
Machine File
Jyoti Godara
No ratings yet
Different Methods of Plotting
Document4 pages
Different Methods of Plotting
brylla montero
No ratings yet
Scoa Codes
Document9 pages
Scoa Codes
kp
No ratings yet
2.3 Aiml Rishit
Document7 pages
2.3 Aiml Rishit
heex.pros
No ratings yet
Case Study - Classifier
Document5 pages
Case Study - Classifier
Stuti Singh
No ratings yet
Import Numpy As NP
Document4 pages
Import Numpy As NP
4AL19CS059 BHAGYASREE
No ratings yet
Variosalgoritmos - Jupyter Notebook
Document9 pages
Variosalgoritmos - Jupyter Notebook
PAULO CESAR CALDERON BERMUDO
100% (1)
Ai Last 5
Document4 pages
Ai Last 5
Bad Boy
No ratings yet
Support Vector Machine
Document3 pages
Support Vector Machine
VIJAY YADAV
No ratings yet
ML Lab Programs
Document23 pages
ML Lab Programs
Roopa 18-19-36
No ratings yet
EE 559 HW2Code PDF
Document7 pages
EE 559 HW2Code PDF
Ali
No ratings yet
Sample Project Final
Document33 pages
Sample Project Final
timepass Creation
No ratings yet
Data Mining
Document20 pages
Data Mining
21800768
No ratings yet
Unit2 ML Programs
Document7 pages
Unit2 ML Programs
diroja5648
No ratings yet
Ai Lab 2021
Document14 pages
Ai Lab 2021
Anjana Rajan
No ratings yet
Decision Tree
Document3 pages
Decision Tree
G Suriyanaraynan
No ratings yet
Sample Project Final
Document33 pages
Sample Project Final
timepass Creation
No ratings yet
Import As: Cal - Pivot Array Array
Document12 pages
Import As: Cal - Pivot Array Array
Sanodariya Kshitij Ashvinchandra (B19ME075)
No ratings yet
ML 2
Document4 pages
ML 2
yefigoh133
No ratings yet
Visualisation All
Document70 pages
Visualisation All
Ahmad Nazir
0% (1)
Hypothesis Testing PDF
Document9 pages
Hypothesis Testing PDF
mdkashif1299
No ratings yet
Code 02
Document1 page
Code 02
sayem khan
No ratings yet
Aiml Lab PGM
Document15 pages
Aiml Lab PGM
Shubham Kumar
No ratings yet
BDA Project Codes
Document20 pages
BDA Project Codes
alysha
No ratings yet
Fuzzy Set
Document21 pages
Fuzzy Set
Mohshin Khan
No ratings yet
20MIS1025 - DecisionTree - Ipynb - Colaboratory
Document4 pages
20MIS1025 - DecisionTree - Ipynb - Colaboratory
Sandip Das
No ratings yet
Exp 9 - 2131
Document7 pages
Exp 9 - 2131
agurunat
No ratings yet
NF Assighment4
Document5 pages
NF Assighment4
Abdul Moaid
No ratings yet
Expt - No.2. RUSHYA
Document3 pages
Expt - No.2. RUSHYA
pareshpawar1902
No ratings yet
Ex No 5
Document1 page
Ex No 5
kpramya19
No ratings yet
Tutorial 6
Document8 pages
Tutorial 6
POEASO
No ratings yet
Rps
Document19 pages
Rps
Anonymous 21Z3G6bn
No ratings yet
EDA Plots Code
Document13 pages
EDA Plots Code
prashant yadav
No ratings yet
Experiment - 4: April 23, 2019
Document2 pages
Experiment - 4: April 23, 2019
Ritika Singh
No ratings yet
Structured Decision Making
From Everand
Structured Decision Making
Andreas Michael Theodorou
No ratings yet
Is Sociology A Good Subject For UGC NET
Document4 pages
Is Sociology A Good Subject For UGC NET
Mantram Study Group
No ratings yet
Tourism Complex - Ian Christopher Rafanan - Draft Chapter 1,2,3
Document19 pages
Tourism Complex - Ian Christopher Rafanan - Draft Chapter 1,2,3
Ian Rafanan
No ratings yet
BLM1007-Effective Coaching (Workbook)
Document5 pages
BLM1007-Effective Coaching (Workbook)
Mishalee Samlasegran
No ratings yet
Next Word Prediction Using Machine Learning Techniques: Cybersecurity November 2022
Document12 pages
Next Word Prediction Using Machine Learning Techniques: Cybersecurity November 2022
Ahmed Indris
No ratings yet
Piaget and Cognitive Development
Document8 pages
Piaget and Cognitive Development
Zain Ul abideen
No ratings yet
Kepemimpinan Pertemuan 7
Document12 pages
Kepemimpinan Pertemuan 7
PUTRA SAMPOERNA
No ratings yet
Industrial Visit Significance (GNANASREE)
Document3 pages
Industrial Visit Significance (GNANASREE)
Rajeev Kumar Gottumukkala
No ratings yet
History of Psychometric Testing Dr. Ritu Sharma
Document11 pages
History of Psychometric Testing Dr. Ritu Sharma
Ananya Narang
No ratings yet
Narrative Report On PAFTE
Document3 pages
Narrative Report On PAFTE
Fai Lanel
No ratings yet
Blended Learning: The Impact of Constructivist Learning Approach in The Learning Process of Nursing Students
Document13 pages
Blended Learning: The Impact of Constructivist Learning Approach in The Learning Process of Nursing Students
Psychology and Education: A Multidisciplinary Journal
No ratings yet
Summary of Grade Sheets SY2021 2022 1st 4th
Document9 pages
Summary of Grade Sheets SY2021 2022 1st 4th
Edwin Dagunot
No ratings yet
Speech Script
Document3 pages
Speech Script
Janesa Maxcen Cabillo
No ratings yet
MEC2202 Assignment 1 (2021) Marking Scheme and Rubric
Document3 pages
MEC2202 Assignment 1 (2021) Marking Scheme and Rubric
Durry Empire
No ratings yet
Humss - Csc12 Iid G 9)
Document3 pages
Humss - Csc12 Iid G 9)
Cristine Joy Pingaron
No ratings yet
Scientific Skills
Document6 pages
Scientific Skills
Rajaletchemy
No ratings yet
Chapter 3 - Foundations of Individual Behavior
Document19 pages
Chapter 3 - Foundations of Individual Behavior
Christian Diaz
No ratings yet
Nishat
Document3 pages
Nishat
Nishat Tasnim
No ratings yet
Multiple Intelligences Test
Document2 pages
Multiple Intelligences Test
jeffherb
No ratings yet
Reporter Balingit, Regine Abalos, Joyce Ababon, Marilyn Bacalian, Monica
Document21 pages
Reporter Balingit, Regine Abalos, Joyce Ababon, Marilyn Bacalian, Monica
Jan Rey Valera
No ratings yet
Cse5243 Intro. To Data Mining: Chapter 1. Introduction
Document56 pages
Cse5243 Intro. To Data Mining: Chapter 1. Introduction
GIOVANE GONÇALVES
No ratings yet
What Is A Case Study
Document5 pages
What Is A Case Study
Zara Somblingo
No ratings yet
303 - Unit 5 Presentation Skills
Document18 pages
303 - Unit 5 Presentation Skills
wako otanga
No ratings yet
Learning Centered Methods
Document20 pages
Learning Centered Methods
Gabi Oliveira
No ratings yet
IB Approved IA Case Studies From IBPsychology
Document8 pages
IB Approved IA Case Studies From IBPsychology
ABDULRAHMAN
No ratings yet
Practical Research
Document142 pages
Practical Research
Val Daryl Anhao
100% (1)
Intasc Standards
Document3 pages
Intasc Standards
api-654046709
No ratings yet
Cambridge International AS Level Candidate Grades June 2019: Cumulative World Totals Grades A - e
Document2 pages
Cambridge International AS Level Candidate Grades June 2019: Cumulative World Totals Grades A - e
Al Hasan
No ratings yet
Module 3 Developmental Theories and Other Relevant Theories
Document16 pages
Module 3 Developmental Theories and Other Relevant Theories
mark batac
No ratings yet
Gallup Quarterly Workplace Insights Jan 24
Document45 pages
Gallup Quarterly Workplace Insights Jan 24
Sushil Raut
No ratings yet
Power and Knowledge: June 2015
Document8 pages
Power and Knowledge: June 2015
ShatiJanzour Ticketing
No ratings yet