Welcome to Scribd!

ML Activity 3: Participating Students: BETB116 Sandhya Awari BETB120 Harinakshi Kumbhare

Uploaded by

0% found this document useful (0 votes)

8 views2 pages

The document describes an ML activity conducted by two students to classify emails as spam or ham using scikit-learn. They loaded a dataset, split it into training and test sets, extracted features using CountVectorizer, tuned an SVM classifier using GridSearchCV, and achieved a test accuracy of 98.6%

Original Description:

ml gives the information about ensembling algorithm

Original Title

ML Activity 3

Copyright

Available Formats

DOC, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as DOC, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

8 views2 pages

ML Activity 3: Participating Students: BETB116 Sandhya Awari BETB120 Harinakshi Kumbhare

Uploaded by

Tarannum Mulla

Copyright:

Available Formats

Download as DOC, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 2

Search inside document

ML Activity 3

Participating Students:
BETB116 Sandhya Awari
BETB120 Harinakshi Kumbhare

Code:

import pandas as pd

from sklearn.feature_extraction.text import CountVectorizer

from sklearn.naive_bayes import MultinomialNB, GaussianNB
from sklearn import svm

from sklearn.model_selection import GridSearchCV

##Step1: Load Dataset

dataframe = pd.read_csv("spam.csv")

print(dataframe.describe())

##Step2: Split in to Training and Test Data

x = dataframe["EmailText"]

y = dataframe["Label"]

x_train,y_train = x[0:4457],y[0:4457]

x_test,y_test = x[4457:],y[4457:]

##Step3: Extract Features

cv = CountVectorizer()

features = cv.fit_transform(x_train)

##Step4: Build a model

tuned_parameters = {'kernel': ['rbf','linear'], 'gamma': [1e-3, 1e-4],

'C': [1, 10, 100, 1000]}

model = GridSearchCV(svm.SVC(), tuned_parameters)

model.fit(features,y_train)

print(model.best_params_)

#Step5: Test Accuracy

print(model.score(cv.transform(x_test),y_test))

Output:

Label EmailText
count 5572 5572
unique 2 5169
top ham Sorry, I'll call later
freq 4825 30
C:\ProgramData\Anaconda3\lib\site-packages\sklearn\model_selection\_split.p
y:1978: FutureWarning: The default value of cv will change from 3 to 5 in v
ersion 0.22. Specify it explicitly to silence this warning.
warnings.warn(CV_WARNING, FutureWarning)
{'C': 1000, 'gamma': 0.0001, 'kernel': 'rbf'}
0.9865470852017937

Scikit Learn Cheat Sheet
Document9 pages
Scikit Learn Cheat Sheet
burhan ök
No ratings yet
Libsvm
Document124 pages
Libsvm
Seun -nuga Daniel
No ratings yet
CS6461-Object Oriented Programming Lab Manual
Document37 pages
CS6461-Object Oriented Programming Lab Manual
pungarajan
No ratings yet
CS2209 Oops Lab
Document79 pages
CS2209 Oops Lab
tp2006ster
No ratings yet
DEEP LEARNING TECHNIQUES: CLUSTER ANALYSIS and PATTERN RECOGNITION with NEURAL NETWORKS. Examples with MATLAB
From Everand
DEEP LEARNING TECHNIQUES: CLUSTER ANALYSIS and PATTERN RECOGNITION with NEURAL NETWORKS. Examples with MATLAB
César Pérez López
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
Document20 pages
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
Saloni Tuli
No ratings yet
7-2 Ass
Document3 pages
7-2 Ass
Ramya Anusha
No ratings yet
Certificate
Document33 pages
Certificate
Tanmay Mane
No ratings yet
CD 601 Lab Manual
Document61 pages
CD 601 Lab Manual
Satya Prakash Soni
No ratings yet
CRT2 LDA Assignment
Document4 pages
CRT2 LDA Assignment
rasaraman
No ratings yet
DS Manual
Document30 pages
DS Manual
Zoom Communication
No ratings yet
# Import Necessary Modules
Document2 pages
# Import Necessary Modules
4NM20IS003 ABHISHEK A
No ratings yet
Introduction To Python and Computer Programming 1704298503
Document44 pages
Introduction To Python and Computer Programming 1704298503
el.tico.138623
No ratings yet
BDG Tutorial
Document11 pages
BDG Tutorial
yassine
No ratings yet
MLP Sous Keras: A. MLP Pour Une Classification Binaire
Document2 pages
MLP Sous Keras: A. MLP Pour Une Classification Binaire
Soufiane Biggi
No ratings yet
Deep Learning For Credit Risk 1713932406
Document13 pages
Deep Learning For Credit Risk 1713932406
Irshita Khirvat
No ratings yet
Vid 4
Document6 pages
Vid 4
diyalap01
No ratings yet
AIML Record 56
Document28 pages
AIML Record 56
saisatwik bikumandla
No ratings yet
ML Lab6
Document4 pages
ML Lab6
Pankaj Mandloi
No ratings yet
Data Warehouse & Data Mining Lab Assignment-4 Name:Sai Subhikshaa.K.A REG NO:19MID0037 Code
Document6 pages
Data Warehouse & Data Mining Lab Assignment-4 Name:Sai Subhikshaa.K.A REG NO:19MID0037 Code
Vasumathi R 19MID0045
No ratings yet
2324 BigData Lab3
Document6 pages
2324 BigData Lab3
Elie Al Howayek
No ratings yet
Amazon-Fine-Food-Review - K-Means, Agglomerative & DBSCAN Clustering
Document79 pages
Amazon-Fine-Food-Review - K-Means, Agglomerative & DBSCAN Clustering
krishna
No ratings yet
Seminar 10
Document3 pages
Seminar 10
Nishad Ahamed
No ratings yet
Exp 5
Document8 pages
Exp 5
jay
No ratings yet
ML - Practical File
Document15 pages
ML - Practical File
Jatin Mathur
No ratings yet
Assignment 2.3.1 Transfer Learning
Document7 pages
Assignment 2.3.1 Transfer Learning
Hockhin Ooi
No ratings yet
Assignment 2.4.1 Multiclass Classification
Document5 pages
Assignment 2.4.1 Multiclass Classification
Hockhin Ooi
No ratings yet
Machine Learnin
Document23 pages
Machine Learnin
Manoj Kumar 1183
100% (1)
ML 2.4 Prashant
Document3 pages
ML 2.4 Prashant
deadm2996
No ratings yet
Data Mining and Warehousing Concepts Lab: (ITPC - 228)
Document6 pages
Data Mining and Warehousing Concepts Lab: (ITPC - 228)
Angelina Tutu
No ratings yet
Correction
Document3 pages
Correction
bougmazisoufyane
No ratings yet
Maxbox Starter96 CNN Evaluation
Document7 pages
Maxbox Starter96 CNN Evaluation
Max Kleiner
No ratings yet
Email Spam Classifier
Document22 pages
Email Spam Classifier
phenomenal beast
No ratings yet
Lab Week 7
Document3 pages
Lab Week 7
Muhd Fakhrullah
No ratings yet
AI and ML Lab Manual
Document29 pages
AI and ML Lab Manual
Nithya Nair
No ratings yet
Lab 1. Boston House
Document7 pages
Lab 1. Boston House
dimas bayu
No ratings yet
NMJ406 - VGG16 Python Code
Document5 pages
NMJ406 - VGG16 Python Code
NURUL ANIS EMILLIA BINTI NAZRI STUDENT
No ratings yet
Installing Spark On Windows Environment
Document16 pages
Installing Spark On Windows Environment
Dr Mohammed Kamal
No ratings yet
KMeans
Document1 page
KMeans
bouazizchahine7
No ratings yet
Exp 4
Document10 pages
Exp 4
jay
No ratings yet
05 Data Preparation and Regression
Document2 pages
05 Data Preparation and Regression
ahmedemad20452045
No ratings yet
AIML 7 To 11
Document7 pages
AIML 7 To 11
shrihari.9919an
No ratings yet
Untitled
Document2 pages
Untitled
Sheel patel
No ratings yet
Model Evaluation and Selection Cheatsheet 1708023215
Document7 pages
Model Evaluation and Selection Cheatsheet 1708023215
felipe.burneo.posavac
No ratings yet
1
Document1 page
1
adnan.rohan.cse
No ratings yet
Chapter 6 - Advanced Machine Learning PDF
Document37 pages
Chapter 6 - Advanced Machine Learning PDF
Siddharth Upadhyay
No ratings yet
Kabir Khan 1147 - 4
Document4 pages
Kabir Khan 1147 - 4
mohammed.ibrahimdurrani.bscs-2020b
No ratings yet
K - NN Learning-30 April
Document2 pages
K - NN Learning-30 April
animehv5500
No ratings yet
Tutorial 9 - Questions 2023
Document4 pages
Tutorial 9 - Questions 2023
ceewang23
No ratings yet
4.2.2.6 Lab - Evaluating Fit Errors in Linear Regression
Document4 pages
4.2.2.6 Lab - Evaluating Fit Errors in Linear Regression
Nurul Fadillah Jannah
No ratings yet
From Import From Import From Import: Output
Document2 pages
From Import From Import From Import: Output
Dhanunjay p
No ratings yet
Support Vector Machine A) Classification
Document3 pages
Support Vector Machine A) Classification
4NM20IS003 ABHISHEK A
No ratings yet
Face
Document2 pages
Face
ahmadkhalil
No ratings yet
Subject: ML Name: Priyanshu Gandhi Date: 10/4/21 Expt. No.: 9 Roll No.: C008 Title: Clustering Implementation in Python
Document7 pages
Subject: ML Name: Priyanshu Gandhi Date: 10/4/21 Expt. No.: 9 Roll No.: C008 Title: Clustering Implementation in Python
Kartik Katekar
No ratings yet
Week14 N9
Document3 pages
Week14 N9
20131A05N9 SRUTHIK THOKALA
No ratings yet
Lab - 8 - 21130616 - TranThanhVu - Ipynb - Colab
Document4 pages
Lab - 8 - 21130616 - TranThanhVu - Ipynb - Colab
nguyennhutoan722003
No ratings yet
Introduction To Scikit
Document9 pages
Introduction To Scikit
ASHUTOSH TRIVEDI
No ratings yet
Lab - 8 - 21130568 - NguyenNhuToan - Ipynb - Colab
Document4 pages
Lab - 8 - 21130568 - NguyenNhuToan - Ipynb - Colab
nguyennhutoan722003
No ratings yet
1.diagnosis Using ML
Document69 pages
1.diagnosis Using ML
Choral Wealth
No ratings yet
As A Single PDF
Document3 pages
As A Single PDF
auctmetu
No ratings yet