0% found this document useful (0 votes)

56 views4 pages

Email Spam Classification

Uploaded by

tryhackkme123

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

56 views4 pages

Email Spam Classification

Uploaded by

tryhackkme123

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

email-spam-classification

November 6, 2024

[14]: import pandas as pd

[15]: # Read the Dataset

dataframe = pd.read_csv("[Link]")

[40]: # Create a Copy of the Dataset to work upon

df = dataframe
df

[40]: the to ect and for of a you hou in … connevey jay \

0 0 0 1 0 0 0 2 0 0 0 … 0 0
1 8 13 24 6 6 2 102 1 27 18 … 0 0
2 0 0 1 0 0 0 8 0 0 4 … 0 0
3 0 5 22 0 5 1 51 2 10 1 … 0 0
4 7 6 17 1 5 2 57 0 9 3 … 0 0
… … .. … … … .. … … … .. … … …
5167 2 2 2 3 0 0 32 0 0 5 … 0 0
5168 35 27 11 2 6 5 151 4 3 23 … 0 0
5169 0 0 1 1 0 0 11 0 0 1 … 0 0
5170 2 7 1 0 2 1 28 2 0 8 … 0 0
5171 22 24 5 1 6 5 148 8 2 23 … 0 0

valued lay infrastructure military allowing ff dry Prediction

0 0 0 0 0 0 0 0 0
1 0 0 0 0 0 1 0 0
2 0 0 0 0 0 0 0 0
3 0 0 0 0 0 0 0 0
4 0 0 0 0 0 1 0 0
… … … … … … .. … …
5167 0 0 0 0 0 0 0 0
5168 0 0 0 0 0 1 0 0
5169 0 0 0 0 0 0 0 1
5170 0 0 0 0 0 1 0 1
5171 0 0 0 0 0 0 0 0

[5172 rows x 3001 columns]

1
[17]: [Link]()

<class '[Link]'>
RangeIndex: 5172 entries, 0 to 5171
Columns: 3002 entries, Email No. to Prediction
dtypes: int64(3001), object(1)
memory usage: 118.5+ MB

[18]: # Check for Missing Values

[Link]().sum()

[18]: Email No. 0

the 0
to 0
ect 0
and 0
..
military 0
allowing 0
ff 0
dry 0
Prediction 0
Length: 3002, dtype: int64

[19]: # The 'Email No.' Column is Not Needed, so we drop it

[Link](["Email No."], axis = 1, inplace = True)

[20]: # Set the Independents(x) and the Target Variable(y)

x = [Link](["Prediction"],axis =1)
y = df["Prediction"]

[21]: # Split the Data for Training and Testing

from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.
↪2,random_state=1)

[22]: # KNN Classification

# We use Elbow Method/Continous Iteration to Select the Best Value of K

from [Link] import KNeighborsClassifier

[23]: from sklearn import metrics

accuracy_values = []

for i in range(1,11):
model = KNeighborsClassifier(n_neighbors = i)
[Link](x_train,y_train)

2
y_pred = [Link](x_test)
accuracy = metrics.accuracy_score(y_test,y_pred)
accuracy_values.append(accuracy)

[24]: knn = KNeighborsClassifier(n_neighbors = 7)

[25]: [Link](x_train,y_train)
y_pred = [Link](x_test)

[26]: print(metrics.classification_report(y_test,y_pred))

precision recall f1-score support

0 0.93 0.88 0.91 719

1 0.76 0.84 0.80 316

accuracy 0.87 1035

macro avg 0.84 0.86 0.85 1035
weighted avg 0.88 0.87 0.87 1035

[41]: confusion_matrix_knn = metrics.confusion_matrix(y_test,y_pred)

confusion_matrix_knn

[41]: array([[700, 19],

[189, 127]], dtype=int64)

[29]: # Can Find the Metrics Manually as well :

# Recall = TP/TP+FN
# Precision = TP/TP+FP
# F1 Score = (Recall*Precision)/(Recall+Precision)
# Accuracy = TP+TN/TP+FP+FN+TN

[30]: # SVM
from [Link] import SVC

[31]: svm_model = SVC()

[32]: svm_model.fit(x_train,y_train)
y_pred = svm_model.predict(x_test)

[33]: print(metrics.classification_report(y_test,y_pred))

precision recall f1-score support

0 0.79 0.97 0.87 719

1 0.87 0.40 0.55 316

3
accuracy 0.80 1035
macro avg 0.83 0.69 0.71 1035
weighted avg 0.81 0.80 0.77 1035

[42]: confusion_matrix_svm = metrics.confusion_matrix(y_test,y_pred)

confusion_matrix_svm

[42]: array([[700, 19],

[189, 127]], dtype=int64)

[35]: # Can Find the Metrics Manually as well :

# Recall = TP/TP+FN
# Precision = TP/TP+FP
# F1 Score = (Recall*Precision)/(Recall+Precision)
# Accuracy = TP+TN/TP+FP+FN+TN

[ ]:

Email Classification with SVM Analysis
No ratings yet
Email Classification with SVM Analysis
2 pages
ML Practical 2D
No ratings yet
ML Practical 2D
6 pages
Emails ml2 - Jupyter Notebook
No ratings yet
Emails ml2 - Jupyter Notebook
2 pages
P2) Code Email Spam Detection
No ratings yet
P2) Code Email Spam Detection
3 pages
Email Spam Detection with KNN & SVM
No ratings yet
Email Spam Detection with KNN & SVM
6 pages
Email Classification Model Analysis
No ratings yet
Email Classification Model Analysis
3 pages
Email Spam Classification Analysis
No ratings yet
Email Spam Classification Analysis
4 pages
Email Data Analysis and Predictions
No ratings yet
Email Data Analysis and Predictions
9 pages
AI Project2024 2025format
No ratings yet
AI Project2024 2025format
26 pages
Email Spam Detection Guide
No ratings yet
Email Spam Detection Guide
8 pages
Spam Detection: Algorithm Performance Analysis
No ratings yet
Spam Detection: Algorithm Performance Analysis
5 pages
Email Spam Detection Using Machine Learning
No ratings yet
Email Spam Detection Using Machine Learning
2 pages
Machine Learning Based Classification For Spam Detection
No ratings yet
Machine Learning Based Classification For Spam Detection
14 pages
ML Project - Classifying Spam Emails
No ratings yet
ML Project - Classifying Spam Emails
3 pages
Paper Presentation
100% (1)
Paper Presentation
8 pages
Email Spam Detection: Methods & Challenges
No ratings yet
Email Spam Detection: Methods & Challenges
31 pages
Python
No ratings yet
Python
7 pages
Aiproject 2
No ratings yet
Aiproject 2
4 pages
Ai Project
No ratings yet
Ai Project
8 pages
Abstract
No ratings yet
Abstract
2 pages
Machine Learning for Spam Detection
No ratings yet
Machine Learning for Spam Detection
8 pages
Coding For Bulk Email Sender
No ratings yet
Coding For Bulk Email Sender
4 pages
Python Spam Mail Detection Program
No ratings yet
Python Spam Mail Detection Program
2 pages
Personalized Classification of Non-Spam Emails Using Machine Learning Techniques
No ratings yet
Personalized Classification of Non-Spam Emails Using Machine Learning Techniques
7 pages
Egyptian Informatics Journal
No ratings yet
Egyptian Informatics Journal
11 pages
Behavior-Based Spam Mail Detection
No ratings yet
Behavior-Based Spam Mail Detection
5 pages
Spam Email Detection with Python
No ratings yet
Spam Email Detection with Python
5 pages
SMS Spam Filtering Data Analysis
No ratings yet
SMS Spam Filtering Data Analysis
1 page
Spam Email Prediction with ML Algorithms
No ratings yet
Spam Email Prediction with ML Algorithms
9 pages
ML 2
No ratings yet
ML 2
1 page
Spam Detection Using ID3 Decision Trees
No ratings yet
Spam Detection Using ID3 Decision Trees
4 pages
Micro
No ratings yet
Micro
5 pages
ICS Lab 1
No ratings yet
ICS Lab 1
5 pages
Madhavan 2021 IOP Conf. Ser. Mater. Sci. Eng. 1022 012113
No ratings yet
Madhavan 2021 IOP Conf. Ser. Mater. Sci. Eng. 1022 012113
12 pages
E-Mail Spam Detection Using Machine Learning KNN
No ratings yet
E-Mail Spam Detection Using Machine Learning KNN
5 pages
Efficient Spam Detection with BERT
No ratings yet
Efficient Spam Detection with BERT
5 pages
AI Spam Classifier Using ELM & SVM
No ratings yet
AI Spam Classifier Using ELM & SVM
11 pages
Aayush Nihar Spam Mail Filtering
No ratings yet
Aayush Nihar Spam Mail Filtering
18 pages
PPT
0% (1)
PPT
15 pages
Email/SMS Spam Classifier System
No ratings yet
Email/SMS Spam Classifier System
4 pages
Email Spam Classification Using ID3
No ratings yet
Email Spam Classification Using ID3
4 pages
Zoom
No ratings yet
Zoom
20 pages
Python Data Handling and Emailing Lab
No ratings yet
Python Data Handling and Emailing Lab
9 pages
Spam Detection via Logistic Regression & PSO
No ratings yet
Spam Detection via Logistic Regression & PSO
38 pages
Twitter Data Pull
No ratings yet
Twitter Data Pull
10 pages
EmailSpam
No ratings yet
EmailSpam
14 pages
E-Mail Spam Classification Via Machine Learning and Natural Language Processing
No ratings yet
E-Mail Spam Classification Via Machine Learning and Natural Language Processing
7 pages
Question2ml - Ipynb - Colab
No ratings yet
Question2ml - Ipynb - Colab
3 pages
Email Spam Detection Using Naive Bayes
No ratings yet
Email Spam Detection Using Naive Bayes
8 pages
Spam Email Detection Using Python
No ratings yet
Spam Email Detection Using Python
9 pages
Email Spam Classification Model Guide
No ratings yet
Email Spam Classification Model Guide
7 pages
Email Classification with Machine Learning
No ratings yet
Email Classification with Machine Learning
22 pages
Machine Learning for Email Spam Detection
No ratings yet
Machine Learning for Email Spam Detection
8 pages
Aiml Assignment-2
No ratings yet
Aiml Assignment-2
8 pages
Document
No ratings yet
Document
11 pages
IJCSIS Camera Ready Academia
No ratings yet
IJCSIS Camera Ready Academia
4 pages
AI-Evaluating Models Class 10 Notes
No ratings yet
AI-Evaluating Models Class 10 Notes
8 pages
Machine Learning for 5G Congestion Control
No ratings yet
Machine Learning for 5G Congestion Control
13 pages
Machine Learning Applications in Healthcare
No ratings yet
Machine Learning Applications in Healthcare
29 pages
Email Spam Detection Final Presentation-21BSCHH010002
No ratings yet
Email Spam Detection Final Presentation-21BSCHH010002
17 pages
Breast Cancer Detection Using An Ensemble Deep Learning Method
No ratings yet
Breast Cancer Detection Using An Ensemble Deep Learning Method
13 pages
Inception V3 for Breast Cancer Detection
No ratings yet
Inception V3 for Breast Cancer Detection
9 pages
Prediction of Hazardous Asteroids Using Machine Learning
No ratings yet
Prediction of Hazardous Asteroids Using Machine Learning
6 pages
Credit Delinquency Model Plan
No ratings yet
Credit Delinquency Model Plan
2 pages
EY Interview Prep (9th Sep)
No ratings yet
EY Interview Prep (9th Sep)
15 pages
Classification HW
No ratings yet
Classification HW
4 pages
AIML Question Bank
No ratings yet
AIML Question Bank
5 pages
Indian Sign Language Recognition Using SURF, SVM, CNN
No ratings yet
Indian Sign Language Recognition Using SURF, SVM, CNN
14 pages
Internship Doc
No ratings yet
Internship Doc
30 pages
I. Ii. Iii. Iv. I. Ii. Iii. IV
No ratings yet
I. Ii. Iii. Iv. I. Ii. Iii. IV
4 pages
OCI Data Science Exam Answers
No ratings yet
OCI Data Science Exam Answers
10 pages
Palm Tree Disease Classification with CNNs
No ratings yet
Palm Tree Disease Classification with CNNs
8 pages
AI Kidney Stone Detection Study
No ratings yet
AI Kidney Stone Detection Study
24 pages
Data Science Journal
No ratings yet
Data Science Journal
40 pages
Ibm 24
No ratings yet
Ibm 24
14 pages
EEG-Based Work Fatigue Detection Study
No ratings yet
EEG-Based Work Fatigue Detection Study
9 pages
Hepatitis
No ratings yet
Hepatitis
42 pages
Research Paper 80
No ratings yet
Research Paper 80
5 pages
ML 5marks
No ratings yet
ML 5marks
31 pages
Food Classification with Keras & TensorFlow
No ratings yet
Food Classification with Keras & TensorFlow
21 pages
Natalia Struharova Research Project
No ratings yet
Natalia Struharova Research Project
10 pages
Multi-Stakeholder Music Recommendation System
No ratings yet
Multi-Stakeholder Music Recommendation System
39 pages
Machine Learning for Heart Disease Diagnosis
No ratings yet
Machine Learning for Heart Disease Diagnosis
27 pages
Real-time Sign Language Recognition System
No ratings yet
Real-time Sign Language Recognition System
9 pages
Mini Project Phishing Website Detection Using ML
No ratings yet
Mini Project Phishing Website Detection Using ML
45 pages
Bon Sang Koo
No ratings yet
Bon Sang Koo
10 pages

Email Spam Classification

Uploaded by

Email Spam Classification

Uploaded by

email-spam-classification

[14]: import pandas as pd

[15]: # Read the Dataset

[40]: # Create a Copy of the Dataset to work upon

[40]: the to ect and for of a you hou in … connevey jay \

valued lay infrastructure military allowing ff dry Prediction

[5172 rows x 3001 columns]

[18]: # Check for Missing Values

[18]: Email No. 0

[19]: # The 'Email No.' Column is Not Needed, so we drop it

[20]: # Set the Independents(x) and the Target Variable(y)

[21]: # Split the Data for Training and Testing

[22]: # KNN Classification

from [Link] import KNeighborsClassifier

[23]: from sklearn import metrics

[24]: knn = KNeighborsClassifier(n_neighbors = 7)

precision recall f1-score support

0 0.93 0.88 0.91 719

accuracy 0.87 1035

[41]: confusion_matrix_knn = metrics.confusion_matrix(y_test,y_pred)

[41]: array([[700, 19],

[29]: # Can Find the Metrics Manually as well :

[31]: svm_model = SVC()

precision recall f1-score support

0 0.79 0.97 0.87 719

[42]: confusion_matrix_svm = metrics.confusion_matrix(y_test,y_pred)

[42]: array([[700, 19],

[35]: # Can Find the Metrics Manually as well :

You might also like