Welcome to Scribd!

Cancer Disease Classification

Uploaded by

0% found this document useful (0 votes)

13 views6 pages

This document discusses classifying cancer types using machine learning. It loads breast cancer data, splits it into training and test sets, scales the features, and trains logistic regression, decision tree, and random forest models. It evaluates the models on the test set and prints the confusion matrices and test accuracies. Finally, it uses the best model to make predictions on new test data and outputs the results.

Original Description:

Original Title

Cancer_disease_classification

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

13 views6 pages

Cancer Disease Classification

Uploaded by

BARATH P

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 6

Search inside document

FACULTY INITIATIVE – SLOT-3

BARATH P
II YEAR CSE

CANCER DISEASE CLASSIFICATION

Program and Output:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

#load the data

df = pd.read_csv('/content/data.csv')
df['diagnosis'] = df['diagnosis'].replace({'M':1,'B':0})
df.head()

print("Cancer data set dimensions : {}".format(df.shape))

df.isnull().sum()

df.describe()
X = df.iloc[:, 1:31].values
Y = df.iloc[:, 31].values
# Splitting the dataset into the Training set and Test set
from sklearn.model_selection import train_test_split
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = 0.25, random_state = 0)

sns.countplot(x ='diagnosis', data = df)

plt.show()
B, M = df['diagnosis'].value_counts()
print('Number of Benign: ',B)
print('Number of Malignant : ',M)

df.corr()
#Visualize the correlation
f,ax = plt.subplots(figsize=(20, 20))
sns.heatmap(df.corr(), annot = True, fmt= '.2f')
#for data scaling
from sklearn.preprocessing import StandardScaler
#for splitting dataset
from sklearn.model_selection import train_test_split
#for fitting SVM model
from sklearn.svm import SVC
#for displaying evaluation metrics
from sklearn.metrics import classification_report
from sklearn.metrics import confusion_matrix

#Scale the data (Feature Scaling)

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.fit_transform(X_test)

#Create a function for models

def models(X_train, Y_train):

#Logistic Regression
from sklearn.linear_model import LogisticRegression
log = LogisticRegression()
log.fit(X_train, Y_train)

#Decision Tree
from sklearn.tree import DecisionTreeClassifier
tree = DecisionTreeClassifier()
tree.fit(X_train, Y_train)
#Random Forest
from sklearn.ensemble import RandomForestClassifier
forest = RandomForestClassifier()
forest.fit(X_train, Y_train)

#Print the model accuracy of training data

print('[0]Logistic Regression Training Accuracy : ',log.score(X_train, Y_train))
print('[1]Decision Tree Training Accuracy : ',tree.score(X_train, Y_train))
print('[2]Random Forest Training Accuracy : ',forest.score(X_train, Y_train))

return log, tree, forest

#Getting all the models

model = models(X_train, Y_train)

#test model accuracy on test data using confusion matrix

from sklearn.metrics import confusion_matrix
for i in range (len(model)):
print('Model :',model[i])
cm = confusion_matrix(Y_test,model[i].predict(X_test))
TP = cm[0][0]
FP = cm[0][1]
FN = cm[1][0]
TN = cm[1][1]
print(cm)
print('Testing Accuracy =',(TP + TN)/(TP + FP + FN + TN))
print()
#test our trained model on the test data
test_df = pd.read_csv('/content/data.csv')
test = test_df.drop(['id','diagnosis'],axis = 1)
test.head()
y_pred = pd.DataFrame(model[0].predict(test), columns=['diagnosis'])
final_df = pd.DataFrame({'Id': test_df['id'], 'diagnosis': y_pred['diagnosis']})
final_df

Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
Document20 pages
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
Saloni Tuli
No ratings yet
Codes
Document6 pages
Codes
Vamshi Krishna
No ratings yet
Machine
Document45 pages
Machine
Gagan Sharma
100% (1)
Experiment No.:1: Program
Document7 pages
Experiment No.:1: Program
Dhiraj Shah
No ratings yet
ML 1-10
Document53 pages
ML 1-10
22128008
No ratings yet
ML Lab Record
Document15 pages
ML Lab Record
rr3870044
No ratings yet
Big Data Merged
Document7 pages
Big Data Merged
Ingame Id
No ratings yet
ML Lab Programs
Document23 pages
ML Lab Programs
Roopa 18-19-36
No ratings yet
16BCB0126 VL2018195002535 Pe003
Document40 pages
16BCB0126 VL2018195002535 Pe003
Mohit
No ratings yet
Machine Learnin
Document23 pages
Machine Learnin
Manoj Kumar 1183
100% (1)
Appendix PDF
Document5 pages
Appendix PDF
Rama
No ratings yet
20MIS1025 - DecisionTree - Ipynb - Colaboratory
Document4 pages
20MIS1025 - DecisionTree - Ipynb - Colaboratory
Sandip Das
No ratings yet
2020 CS 95.py
Document1 page
2020 CS 95.py
Qazi Maaz
No ratings yet
Machine Learning Hands-On Programs Program 1: Linear Regression - Single Variable Linear Regression
Document22 pages
Machine Learning Hands-On Programs Program 1: Linear Regression - Single Variable Linear Regression
KANTESH kantesh
100% (1)
2 Program
Document4 pages
2 Program
b1974
No ratings yet
FML LabFile 7exps
Document37 pages
FML LabFile 7exps
Kunal Saini
No ratings yet
Sample
Document2 pages
Sample
MAHAKAL (Tushar)
No ratings yet
KRAI Practical
Document14 pages
KRAI Practical
Contact Vishal
No ratings yet
Machine Learning Hands-On
Document18 pages
Machine Learning Hands-On
Vivek JD
100% (1)
2020 CS 64
Document1 page
2020 CS 64
Qazi Maaz
No ratings yet
Practical 9
Document3 pages
Practical 9
Amandeep Singh
No ratings yet
Import As Import As Import As: # Importing The Libraries
Document3 pages
Import As Import As Import As: # Importing The Libraries
19-361 Sai Prathik
No ratings yet
FML File Final
Document36 pages
FML File Final
Kunal Saini
No ratings yet
Support Vector Machine A) Classification
Document3 pages
Support Vector Machine A) Classification
4NM20IS003 ABHISHEK A
No ratings yet
Machinelearning - Alisya Athirah Binti Mohd Huzzainny (Updated)
Document26 pages
Machinelearning - Alisya Athirah Binti Mohd Huzzainny (Updated)
Alisya Athirah
No ratings yet
# Capture The Target Column ("Default") Into Separate Vectors For Training Set and Test Set
Document4 pages
# Capture The Target Column ("Default") Into Separate Vectors For Training Set and Test Set
Rohit Kumar
No ratings yet
Untitled2.ipynb - Colaboratory
Document2 pages
Untitled2.ipynb - Colaboratory
rvvnbrao
No ratings yet
Linearregression 4
Document3 pages
Linearregression 4
api-559045701
No ratings yet
ML
Document2 pages
ML
wovova9230
No ratings yet
Tugas Akhir Big Data
Document10 pages
Tugas Akhir Big Data
Saskya Lidayani
No ratings yet
Is Lab Aman Agarwal PDF
Document8 pages
Is Lab Aman Agarwal PDF
Aman Bansal
No ratings yet
SML - Week 3
Document5 pages
SML - Week 3
szho68
No ratings yet
Coe Projects
Document7 pages
Coe Projects
tApIsH
No ratings yet
KNN Code
Document2 pages
KNN Code
anh.ln
No ratings yet
ML - Practical File
Document15 pages
ML - Practical File
Jatin Mathur
No ratings yet
Code
Document6 pages
Code
Keerti Gulati
No ratings yet
Decision Tree
Document3 pages
Decision Tree
saba
No ratings yet
Mercedes-Benz Greener Manufacturing Ai
Document16 pages
Mercedes-Benz Greener Manufacturing Ai
Puji
0% (1)
Confronto Classificazione
Document2 pages
Confronto Classificazione
Mirko Cicala
No ratings yet
SL Classification For Data Science..
Document4 pages
SL Classification For Data Science..
shivaybhargava33
No ratings yet
Is Lab 7
Document7 pages
Is Lab 7
Aman Bansal
No ratings yet
Is Lab 7
Document7 pages
Is Lab 7
Aman Bansal
No ratings yet
Correction
Document3 pages
Correction
bougmazisoufyane
No ratings yet
Experiment 5
Document6 pages
Experiment 5
Nesamanikandan S
No ratings yet
Binary Multiclass
Document3 pages
Binary Multiclass
Nikhil P
No ratings yet
Experiment No 2 ML
Document3 pages
Experiment No 2 ML
ANIKET THAKUR [UCOE- 4388]
No ratings yet
# Import Necessary Modules
Document2 pages
# Import Necessary Modules
4NM20IS003 ABHISHEK A
No ratings yet
Experiment 8&9
Document3 pages
Experiment 8&9
manisshanivasini72
No ratings yet
K-Nearest Neighbor On Python Ken Ocuma
Document9 pages
K-Nearest Neighbor On Python Ken Ocuma
Aliyha Dionio
100% (2)
Modelling and Simulation Sample Model 5
Document7 pages
Modelling and Simulation Sample Model 5
Uriel Anjelo Macaspac
No ratings yet
EXP 08 (ML) - Shri
Document2 pages
EXP 08 (ML) - Shri
DSE 04. Chetana Bhoir
No ratings yet
Deep Learning Perceptron
Document10 pages
Deep Learning Perceptron
Avinash Kumar
No ratings yet
Machine Learning LAB: Practical-1
Document24 pages
Machine Learning LAB: Practical-1
Tsering Jhakree
100% (1)
DL Lab Manual
Document35 pages
DL Lab Manual
lavanya penumudi
100% (1)
Machine Learning With SQL
Document12 pages
Machine Learning With SQL
prince krish
100% (1)
Model Training
Document1 page
Model Training
sameeruddin409
No ratings yet
5 Random Forest - Jupyter Notebook
Document2 pages
5 Random Forest - Jupyter Notebook
venkatesh m
No ratings yet
7
Document1 page
7
Arjun harish
No ratings yet
Data Analysis W Pandas
Document4 pages
Data Analysis W Pandas
x7jn4sxdn9
No ratings yet