Welcome to Scribd!

AI Diabetes Expt 10

Uploaded by

0% found this document useful (0 votes)

5 views2 pages

This document loads and prepares diabetes patient data for machine learning modeling. It cleans the data by imputing missing values, splits it into training and test sets, and evaluates several ensemble models including AdaBoost and Bagging classifiers on their ability to predict diabetes diagnosis. Key steps include data loading and cleaning, feature engineering, model training on the training set, and evaluating model performance on both training and test sets using various metrics like accuracy and confusion matrices.

Original Description:

Original Title

AI_Diabetes_Expt_10.txt

Copyright

Available Formats

TXT, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

5 views2 pages

AI Diabetes Expt 10

Uploaded by

004Prasanna Tayare

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 2

Search inside document

import numpy as np

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

%matplotlib inline
df = pd.read_csv("diabetes.csv")
df.head()
df.info()
***
df.isnull().sum()
***
pd.set_option('display.float_format', '{:.2f}'.format)
df.describe()
df.columns
***
feature_columns = ['Glucose', 'BloodPressure', 'SkinThickness', 'Insulin', 'BMI',
'DiabetesPedigreeFunction', 'Age']
for column in feature_columns:

print("============================================")
print(f"{column} ==> Missing zeros : {len(df.loc[df[column] == 0])}")
***
from sklearn.impute import SimpleImputer
fill_values = SimpleImputer(missing_values=0, strategy="mean", copy=False)
df[feature_columns] = fill_values.fit_transform(df[feature_columns])
plt.figure(figsize=(20, 20))
for i, column in enumerate(df.columns, 1):
plt.subplot(3, 3, i)
df[df["Outcome"] == 0][column].hist(bins=35, color='blue', label='Have Diabetes =
NO', alpha=0.6)
df[df["Outcome"] == 1][column].hist(bins=35, color='red', label='Have Diabetes=
YES', alpha=0.6)
plt.legend()
plt.xlabel(column)
***
from sklearn.model_selection import train_test_split
in_col = ['Pregnancies', 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin',
'BMI', 'DiabetesPedigreeFunction', 'Age']
X = df[in_col]
y = df.Outcome
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,
random_state=42)
from sklearn.metrics import confusion_matrix, accuracy_score, classification_report
def evaluate(model, X_train, X_test, y_train, y_test):
y_test_pred = model.predict(X_test)
y_train_pred = model.predict(X_train)
print("TRAINING RESULTS: \n")
clf_report = pd.DataFrame(classification_report(y_train, y_train_pred,
output_dict=True))
print(f"CONFUSION MATRIX:\n{confusion_matrix(y_train, y_train_pred)}")
print(f"ACCURACY SCORE:\n{accuracy_score(y_train, y_train_pred):.4f}")
print(f"CLASSIFICATION REPORT:\n{clf_report}")
print("TESTING RESULTS: \n")
clf_report = pd.DataFrame(classification_report(y_test, y_test_pred,
output_dict=True))
print(f"CONFUSION MATRIX:\n{confusion_matrix(y_test, y_test_pred)}")
print(f"ACCURACY SCORE:\n{accuracy_score(y_test, y_test_pred):.4f}")
print(f"CLASSIFICATION REPORT:\n{clf_report}")
from sklearn.ensemble import AdaBoostClassifier
ada_boost_clf = AdaBoostClassifier(n_estimators=30)
ada_boost_clf.fit(X_train, y_train)
evaluate(ada_boost_clf, X_train, X_test, y_train, y_test)
***
from sklearn.ensemble import BaggingClassifier
bag_boost_clf = BaggingClassifier(n_estimators=30)
bag_boost_clf.fit(X_train, y_train)
evaluate(bag_boost_clf, X_train, X_test, y_train, y_test)
***
scores ={
'Ensemble tech': {
'AdaBoostTest': accuracy_score(y_test, ada_boost_clf.predict(X_test)),
'BaggingTest' : accuracy_score(y_test, bag_boost_clf.predict(X_test)),
}
}

scores_df = pd.DataFrame(scores)
scores_df.plot(kind='barh', figsize=(15, 8))
***

ML Lab Codes
Document14 pages
ML Lab Codes
Thor
No ratings yet
AI Salary Expt 9
Document1 page
AI Salary Expt 9
004Prasanna Tayare
No ratings yet
Re Pandas PD Glob Scipy - Cluster.hierarchy Matplotlib Shutil Os Pathlib
Document2 pages
Re Pandas PD Glob Scipy - Cluster.hierarchy Matplotlib Shutil Os Pathlib
Marco Longobardi
No ratings yet
Literacy Rate Analysis Coding and Output
Document22 pages
Literacy Rate Analysis Coding and Output
Suchita
No ratings yet
Payroll System
Document9 pages
Payroll System
Sanjay Rajput
No ratings yet
Practicle6 (Code)
Document4 pages
Practicle6 (Code)
Pallavi Gaikwad
No ratings yet
ML 1-10
Document53 pages
ML 1-10
22128008
No ratings yet
PROGRAM
Document8 pages
PROGRAM
Youtube GsG
No ratings yet
ML 7
Document6 pages
ML 7
pratikn1406
No ratings yet
File 1
Document2 pages
File 1
sameeruddin409
No ratings yet
Payroll Management System
Document10 pages
Payroll Management System
snehagupta5805156
No ratings yet
Working Project
Document8 pages
Working Project
Vraj Gaming
No ratings yet
Code
Document6 pages
Code
Keerti Gulati
No ratings yet
Document Py
Document8 pages
Document Py
Udaya sankari sankari
No ratings yet
Import Mysql
Document13 pages
Import Mysql
Prem Gupta
No ratings yet
Practice Question For Python
Document4 pages
Practice Question For Python
itssniperlord14
No ratings yet
Prototype 13
Document1 page
Prototype 13
Yemi Towobola
No ratings yet
Experiment No.:1: Program
Document7 pages
Experiment No.:1: Program
Dhiraj Shah
No ratings yet
U2 - 1 DPP
Document32 pages
U2 - 1 DPP
mgs181101
No ratings yet
Emp Project
Document40 pages
Emp Project
Anureet kaur
No ratings yet
Cardio Screen RF
Document27 pages
Cardio Screen RF
The Mind
100% (1)
Ip Project File
Document46 pages
Ip Project File
jahanvi trivedi
No ratings yet
Project On Payroll System
Document10 pages
Project On Payroll System
Ashwani Puri
No ratings yet
Informatics Practices
Document10 pages
Informatics Practices
Kelvin Koshy
No ratings yet
Pay. Roll
Document11 pages
Pay. Roll
Prashant Roy
No ratings yet
Data Manipulation With Python
Document33 pages
Data Manipulation With Python
Sri Kondabattula
No ratings yet
Database and Table Creation 2
Document18 pages
Database and Table Creation 2
Hitanshu Kapoor
No ratings yet
Kunj Project 1
Document34 pages
Kunj Project 1
kunj123sharma
No ratings yet
MODULE6
Document4 pages
MODULE6
Santhosh Emimaal
No ratings yet
Hotelman
Document8 pages
Hotelman
Swagata Sharma
No ratings yet
Trabajo Bussines
Document19 pages
Trabajo Bussines
Jorge Caceres
No ratings yet
Phase 4
Document5 pages
Phase 4
rajirk2022
No ratings yet
Ip Project
Document8 pages
Ip Project
Nikhil
No ratings yet
Kunj Project 1
Document34 pages
Kunj Project 1
kunj123sharma
No ratings yet
Ip Python Project On School MGMT
Document12 pages
Ip Python Project On School MGMT
innovative studies
No ratings yet
Face Recognition Using Facenet3
Document4 pages
Face Recognition Using Facenet3
Harini Muruganantham
No ratings yet
The Goal of This Part Is To Use Descriptive Statistics and Visualization To Better Understand Your Data
Document3 pages
The Goal of This Part Is To Use Descriptive Statistics and Visualization To Better Understand Your Data
lyna mebarka BENYAKOUB
No ratings yet
LAB FILE-Shelly Sharma
Document47 pages
LAB FILE-Shelly Sharma
Shelly Sharma
No ratings yet
Product
Document3 pages
Product
soumya.satapathy24
No ratings yet
Kshitij Python
Document23 pages
Kshitij Python
Dhruv Shah
No ratings yet
Kunj 3
Document34 pages
Kunj 3
kunj123sharma
No ratings yet
Viksit Ip Project File
Document33 pages
Viksit Ip Project File
viksit427
No ratings yet
Import
Document15 pages
Import
Satyam Yadav
No ratings yet
Untitled 1
Document5 pages
Untitled 1
evryanimation
No ratings yet
程式語言 (二) Lecture 22 - Pandas (3) Pandas 資料運算與繪圖: FC Tien, Dept. of IE&M, Taipei Tech Email: fctien@ntut.edu.tw
Document20 pages
程式語言 (二) Lecture 22 - Pandas (3) Pandas 資料運算與繪圖: FC Tien, Dept. of IE&M, Taipei Tech Email: fctien@ntut.edu.tw
洪東凱
No ratings yet
EmployeeMgmt XII IP ProjectReprot 2022 23
Document16 pages
EmployeeMgmt XII IP ProjectReprot 2022 23
ushavalsa
No ratings yet
Untitled Document
Document19 pages
Untitled Document
s14utkarsh2111019
No ratings yet
Student Management System
Document9 pages
Student Management System
Kingston Op
No ratings yet
Employee Management Project
Document33 pages
Employee Management Project
Aditya
No ratings yet
FakeNewsDetection Student
Document7 pages
FakeNewsDetection Student
nehaila
No ratings yet
20021519-140 APT Midterm Solution PDF
Document7 pages
20021519-140 APT Midterm Solution PDF
Khurram shahzad
No ratings yet
Python I
Document3 pages
Python I
Joko Ade
No ratings yet
Assignement 2 Source Code
Document2 pages
Assignement 2 Source Code
Avik Ghosh
No ratings yet
Python Codes
Document17 pages
Python Codes
Akhil
No ratings yet
Cs Activity
Document29 pages
Cs Activity
hariharan97g
No ratings yet
Datascience 2 PDF
Document24 pages
Datascience 2 PDF
Vijayan .N
No ratings yet
Ip Project by Nitin Rajawat PDF
Document10 pages
Ip Project by Nitin Rajawat PDF
NITIN RAJAWAT
No ratings yet
Python Note 3
Document11 pages
Python Note 3
Coding Knowledge
No ratings yet
Class 12 Informatic Practices Investigatory Project On Paralympic Data Analysis
Document28 pages
Class 12 Informatic Practices Investigatory Project On Paralympic Data Analysis
NITIN MATTU
No ratings yet
C Language Programming Codes
From Everand
C Language Programming Codes
Durgesh
No ratings yet