Welcome to Scribd!

Naive Bayes Classification For TEXT Classification

Uploaded by

0% found this document useful (0 votes)

57 views2 pages

This document discusses using naive Bayes classification for text classification. It loads training and test newsgroup data with categories like atheism and religion. It uses CountVectorizer to count word frequencies and TfidfTransformer to calculate inverse document frequencies. It trains a MultinomialNB classifier on the tf-idf transformed training data. It tests the classifier on new documents and evaluates its accuracy on the test data using metrics like accuracy score and confusion matrix.

Original Description:

Using Python

Original Title

Naive Bayes Classification for TEXT Classification

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

57 views2 pages

Naive Bayes Classification For TEXT Classification

Uploaded by

ochin

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 2

Search inside document

Naive Bayes classification for TEXT Classification

import pandas as pd
import matplotlib.pyplot as plt
import sklearn
from sklearn.linear_model import LogisticRegression
import numpy as np
import seaborn as sns
#% matplotlib inline
import math
import sklearn.datasets as skd
from sklearn.utils import Bunch

categories= ['alt.atheism', 'soc.religion.christian','comp.graphics', 'sci.med']

news_train=
skd.load_files('C:\\Users\\OCHIN\\Desktop\\Fetch20newsgroup\\train',categories=cate
gories, encoding='ISO-8859-1') # type: Bunch
news_test=
skd.load_files('C:\\Users\\OCHIN\\Desktop\\Fetch20newsgroup\\train',categories=cate
gories, encoding='ISO-8859-1')
print(news_train.keys())
print()
print(news_train['target_names'])
#print(news_train['alt.atheism'])
from sklearn.feature_extraction.text import CountVectorizer, TfidfTransformer

count_vect= CountVectorizer()
X_train_tf=count_vect.fit_transform(news_train.data)
print('\n',X_train_tf.shape) # rows, column info # Term freq tells how often a
given word appears (word the might be imp)
# inverse document frequency tells about the words appears a lot across documents
(some valuable word is imp for classification rather than 'the' word
from sklearn.feature_extraction.text import TfidfTransformer
tfidf_transformer= TfidfTransformer() # type: TfidfTransformer
X_train_tfidf =tfidf_transformer.fit_transform(X_train_tf) # X_train_tf is the
total freq counts in rows & columns form
print(X_train_tfidf.shape)
#print(X_train_tfidf)

from sklearn.naive_bayes import MultinomialNB

clf=MultinomialNB().fit(X_train_tfidf, news_train.target)

docs_new=['God is everywhere', 'OpenGL on the GPU is fast']

X_new_counts=count_vect.transform(docs_new)
X_new_tfidf=tfidf_transformer.transform(X_new_counts)

predicted=clf.predict(X_new_tfidf)

for x in predicted:
print(x)

X_test_tf=count_vect.transform(news_test.data)
X_test_tfidf= tfidf_transformer.transform(X_test_tf)
predicted= clf.predict(X_test_tfidf)

from sklearn import metrics

from sklearn.metrics import accuracy_score
from sklearn.metrics import confusion_matrix
print("Accuracy : ", accuracy_score(news_test.target,predicted))
#print(metrics.classification_report(news_test.target,predicted,target_names=news_t
est.target_names))
print("Confusion Matrix")
print(metrics.confusion_matrix(news_test.target,predicted))
# for multiclass the cnf metrix ill be no of classes * no of class matrix (4*4) if
4 classes
# so for 1st class it ud be
#416 0
#0 64
# 1st row is alt.atheism, 2nd row computer graphics, 3rd is sci.med media, 4th is
religion
# 1st column is alt.atheism, 2nd column computer graphics, 3rd is sci.med media,
4th is religion

Machine Learning Algorithms PDF
Document148 pages
Machine Learning Algorithms PDF
jeff omanga
No ratings yet
Home School Sample Transcript
Document1 page
Home School Sample Transcript
Home School College Counselor
100% (2)
Pattern Recognition Lab
Document24 pages
Pattern Recognition Lab
Prashant Kumar
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
Document20 pages
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
Saloni Tuli
No ratings yet
60 ChatGPT Prompts For Data Science 2023
Document67 pages
60 ChatGPT Prompts For Data Science 2023
T L
100% (2)
Example - 1
Document5 pages
Example - 1
Ishani Mehta
No ratings yet
IP Practical PRGM
Document41 pages
IP Practical PRGM
Jeya Ishwarya
No ratings yet
Codes
Document37 pages
Codes
Tame PcAddict
No ratings yet
Support Vector Machine A) Classification
Document3 pages
Support Vector Machine A) Classification
4NM20IS003 ABHISHEK A
No ratings yet
Principal Component Analysis For Data Science
Document4 pages
Principal Component Analysis For Data Science
shivaybhargava33
No ratings yet
Machine Learning Hands-On Programs Program 1: Linear Regression - Single Variable Linear Regression
Document22 pages
Machine Learning Hands-On Programs Program 1: Linear Regression - Single Variable Linear Regression
KANTESH kantesh
100% (1)
CS5242 Assignment 2
Document12 pages
CS5242 Assignment 2
Ajith Shenoy
No ratings yet
Data Lab
Document13 pages
Data Lab
Sarthak Kar
No ratings yet
Correction
Document3 pages
Correction
bougmazisoufyane
No ratings yet
CD 601 Lab Manual
Document61 pages
CD 601 Lab Manual
Satya Prakash Soni
No ratings yet
SVM (Using Python)
Document1 page
SVM (Using Python)
ochin
No ratings yet
Amazon-Fine-Food-Review - K-Means, Agglomerative & DBSCAN Clustering
Document79 pages
Amazon-Fine-Food-Review - K-Means, Agglomerative & DBSCAN Clustering
krishna
No ratings yet
Face Recognition Using Facenet3
Document4 pages
Face Recognition Using Facenet3
Harini Muruganantham
No ratings yet
Final Class 12 Commerce Practical File
Document19 pages
Final Class 12 Commerce Practical File
Snehil Chundawat
No ratings yet
Code AI
Document2 pages
Code AI
Lép Đây Chạy Đi
No ratings yet
Creation of Series Using List, Dictionary & Ndarray
Document65 pages
Creation of Series Using List, Dictionary & Ndarray
rizwana fathima
No ratings yet
19f0217 8B Assignment04
Document12 pages
19f0217 8B Assignment04
Shahid Imran
100% (1)
Capstone Project Report (Digit-Recognition Using CNN)
Document11 pages
Capstone Project Report (Digit-Recognition Using CNN)
seenu
No ratings yet
ML - LAB - FILE Pankaj
Document13 pages
ML - LAB - FILE Pankaj
khatmalmain
No ratings yet
ML Record
Document18 pages
ML Record
harshitsr1234
No ratings yet
Sample
Document2 pages
Sample
MAHAKAL (Tushar)
No ratings yet
7
Document1 page
7
Arjun harish
No ratings yet
KNN Code
Document2 pages
KNN Code
anh.ln
No ratings yet
LINEAR REGRESSION (Using Python)
Document1 page
LINEAR REGRESSION (Using Python)
ochin
No ratings yet
Linear Regression
Document1 page
Linear Regression
ochin
No ratings yet
IP Assgn 3
Document12 pages
IP Assgn 3
Siérra Green
No ratings yet
Ds File
Document58 pages
Ds File
tapcom19
No ratings yet
Tiktok Review Finale
Document27 pages
Tiktok Review Finale
ANIS NABIHAH BINTI MOHD JAIS
No ratings yet
Pattern
Document1 page
Pattern
ahmadkhalil
No ratings yet
AI Manual
Document69 pages
AI Manual
Dev Sejvani
No ratings yet
Finance
Document1 page
Finance
ahmadkhalil
No ratings yet
Raw Nitex
Document5 pages
Raw Nitex
neel neelanti
No ratings yet
7-Iris Species Classification and Naïve Bayes-NLP-SP22
Document3 pages
7-Iris Species Classification and Naïve Bayes-NLP-SP22
Crypto Genius
No ratings yet
Vid 4
Document6 pages
Vid 4
diyalap01
No ratings yet
ML - LAB - FILE Amrit
Document13 pages
ML - LAB - FILE Amrit
khatmalmain
No ratings yet
Suryadatta National School Class 12 CBSE Informatics Practices Practicals List
Document19 pages
Suryadatta National School Class 12 CBSE Informatics Practices Practicals List
Om Jagdeesh
No ratings yet
Pandasmatplotlib Practical File
Document15 pages
Pandasmatplotlib Practical File
godayushshrivastava
No ratings yet
ML Practical 205160694034
Document33 pages
ML Practical 205160694034
09Samrat Bikram Shah
No ratings yet
SVR .Ipynb
Document7 pages
SVR .Ipynb
Olzhas Bolatbaev
No ratings yet
Is Lab Ashis Tiwari PDF
Document8 pages
Is Lab Ashis Tiwari PDF
Aman Bansal
No ratings yet
Practical File Python
Document25 pages
Practical File Python
kaizenpro01
No ratings yet
Machine Learning Pract
Document7 pages
Machine Learning Pract
Sunil Shedge
No ratings yet
Código K-Means en Spyder
Document3 pages
Código K-Means en Spyder
Manuel Calva Z
No ratings yet
Wine - Data2.py: Import As Import As Def
Document2 pages
Wine - Data2.py: Import As Import As Def
Daniela Kotaran Plejić
No ratings yet
Alm Co-3 PDF
Document16 pages
Alm Co-3 PDF
Thota Deep
No ratings yet
Assignment 4
Document216 pages
Assignment 4
Shailendra chaudhary
No ratings yet
Aishwarya MiniProjectReport - SC
Document6 pages
Aishwarya MiniProjectReport - SC
Atharva Nitin Chandwadkar
No ratings yet
CV Assignment 2 Group02
Document12 pages
CV Assignment 2 Group02
Manash Barman
No ratings yet
Lab 8 - Text Visualization
Document2 pages
Lab 8 - Text Visualization
Nalesh Anansha
No ratings yet
Supervidsed Algorithm
Document19 pages
Supervidsed Algorithm
Mittu Rajareddy
No ratings yet
Tidaim 2
Document2 pages
Tidaim 2
neagaiuliancostin
No ratings yet
Panda
Document33 pages
Panda
kr
No ratings yet
CSE 3024: Web Mining: Lab Assessment - 3
Document13 pages
CSE 3024: Web Mining: Lab Assessment - 3
Nikitha Reddy
No ratings yet
Import As Import As Import As: # Importing The Libraries
Document3 pages
Import As Import As Import As: # Importing The Libraries
19-361 Sai Prathik
No ratings yet
Pyqt6 101: A Beginner’s Guide to PyQt6
From Everand
Pyqt6 101: A Beginner’s Guide to PyQt6
Edward Chang
No ratings yet
Fresher PyQt5: A Beginner’s Guide to PyQt5
From Everand
Fresher PyQt5: A Beginner’s Guide to PyQt5
Edward Chang
No ratings yet
SVM (Using Python)
Document1 page
SVM (Using Python)
ochin
No ratings yet
Linear Regression
Document1 page
Linear Regression
ochin
No ratings yet
LINEAR REGRESSION (Using Python)
Document1 page
LINEAR REGRESSION (Using Python)
ochin
No ratings yet
LOGISTIC REGRESSION (Using Python)
Document1 page
LOGISTIC REGRESSION (Using Python)
ochin
No ratings yet
Tool Room Project Report
Document49 pages
Tool Room Project Report
lokeshkrkushwaha
67% (3)
Solar System Coloring Book: Edition 1
Document32 pages
Solar System Coloring Book: Edition 1
muhammad usman
No ratings yet
LG LP156WH4-TLA1 Schematics
Document32 pages
LG LP156WH4-TLA1 Schematics
magno
No ratings yet
Design of A Hydraulic RAM Pump
Document26 pages
Design of A Hydraulic RAM Pump
Theodore Gonzalo
No ratings yet
The Study of Mathematics Elements of Tri
Document395 pages
The Study of Mathematics Elements of Tri
stavroshois
No ratings yet
Adhikari 2018
Document7 pages
Adhikari 2018
Leylanie Jasso
No ratings yet
Nouveau Document Texte
Document9 pages
Nouveau Document Texte
test test
No ratings yet
Learning Bitcoin - Sample Chapter
Document31 pages
Learning Bitcoin - Sample Chapter
Packt Publishing
No ratings yet
Adv Chem Lab Report - 3
Document3 pages
Adv Chem Lab Report - 3
Braden Shugarman
No ratings yet
DC Machine
Document30 pages
DC Machine
Azza Faiad
No ratings yet
Apparel Iii To Viii PDF
Document53 pages
Apparel Iii To Viii PDF
Raja Prabhu
100% (1)
Beeja Sphuta
Document5 pages
Beeja Sphuta
S K Mishra
No ratings yet
E 2297 - 04 - Rtiyotc
Document5 pages
E 2297 - 04 - Rtiyotc
lywu2000
No ratings yet
18e Key Question Answers CH 7
Document2 pages
18e Key Question Answers CH 7
AbdullahMughal
No ratings yet
Basic Marine Engineering by J K Dhar PDF
Document2 pages
Basic Marine Engineering by J K Dhar PDF
vejay
No ratings yet
Analysis Shows Magnitude of Z-Factor Error - Oil & Gas Journal
Document8 pages
Analysis Shows Magnitude of Z-Factor Error - Oil & Gas Journal
Ldtc Zerrot
No ratings yet
NFRCS Therm 5.2-July 06version
Document302 pages
NFRCS Therm 5.2-July 06version
Bojan Bjelajac
100% (1)
A Practical Guide For Successful Revisions and Engagements With R
Document12 pages
A Practical Guide For Successful Revisions and Engagements With R
bamideleoresajo
No ratings yet
Application of Machine Learning
Document11 pages
Application of Machine Learning
sneha salunke
No ratings yet
Department of Distance Education Punjabi University, Patiala M.A. (Economics) Part-I (Annual) FOR 2013-2014 EXAMINATIONS Scheme of Studies
Document12 pages
Department of Distance Education Punjabi University, Patiala M.A. (Economics) Part-I (Annual) FOR 2013-2014 EXAMINATIONS Scheme of Studies
Sandeep Singh
No ratings yet
P1
Document1 page
P1
vaibhav_sparsh
No ratings yet
A 581 - A581M - 95b R00 - QTU4MS9BNTGXTQ
Document3 pages
A 581 - A581M - 95b R00 - QTU4MS9BNTGXTQ
Deepak J
No ratings yet
The Effect of Vitamin D On Insulin Resistance in Patients With Type 2 Diabetes
Document5 pages
The Effect of Vitamin D On Insulin Resistance in Patients With Type 2 Diabetes
rike chesaa
No ratings yet
OLTP Vs OLAP
Document2 pages
OLTP Vs OLAP
Anees Khan
0% (1)
Vip by Aine Ai: (Virtual Internship Program)
Document8 pages
Vip by Aine Ai: (Virtual Internship Program)
Gg
No ratings yet
Eth-32190-02 (Bjerrum) PDF
Document118 pages
Eth-32190-02 (Bjerrum) PDF
Nathan Vincent
No ratings yet
1.-Pastel de Zanahoria Ingredientes
Document36 pages
1.-Pastel de Zanahoria Ingredientes
Wayra Bioentendimientos
No ratings yet
WPS D1.6 Annex m1 PDF
Document1 page
WPS D1.6 Annex m1 PDF
bollascribd
No ratings yet
UMI Error Messages Solaris
Document106 pages
UMI Error Messages Solaris
raghu405
No ratings yet