Welcome to Scribd!

Codes

Uploaded by

0% found this document useful (0 votes)

11 views2 pages

The document discusses various natural language processing techniques including sentence tokenization, word tokenization, stemming, lemmatization, stop word removal, part-of-speech (POS) tagging, reading corpora using WordNet, and regular expression removal. Code examples are provided for each technique to demonstrate how it can be implemented using the NLTK library in Python.

Original Description:

codes

Original Title

codes

Copyright

Available Formats

TXT, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

11 views2 pages

Codes

Uploaded by

M Fahad Imtiaz

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 2

Search inside document

Tokenization

Sentence tokenization:

import nltk
from nltk.tokenize import sent_tokenize
s = '''Good muffins cost $3.88 in New York. Please buy me two of them. contact me
at alpha.berry@gmail.com.'''
sent_tokenize(s)

Word tokenization:

import ntk
from nltk.tokenize import word_tokenize
s = ‘’’Good muffins cost $3.88 in New York. Please buy me two of them. contact me
at alpha.berry@gmail.com.’’’
print(word_tokenize(s))

Stemming
import nltk
from nltk.stem import PorterStemmer

ps = PorterStemmer()

words = ["program", "programs", "programmer", "programming", "programmers"]

for w in words:
print(w, " : ", ps.stem(w))

Lemmatization:
import nltk
from nltk.stem import WordNetLemmatizer

lemmatizer = WordNetLemmatizer()
words = ["running", "jumps", "better"]

lemmatized_words = [lemmatizer.lemmatize(word) for word in words]

print(lemmatized_words)

Stop Word Removal:

from nltk.corpus import stopwords

from nltk.tokenize import word_tokenize

text = "How to remove stop words with NLTK library in Python"

tokens = word_tokenize(text.lower())

english_stopwords = stopwords.words('english')
stopwords = [t for t in tokens if t not in english_stopwords]

print(stopwords)

POS Tagging:
import nltk
from nltk.tokenize import word_tokenize
from nltk import pos_tag

sentence = "POS tagging helps identify the parts of speech in a sentence."

words = word_tokenize(sentence)

pos_tags = pos_tag(words)

print(pos_tags)

Reading Corpus using Wordnet:

import nltk
from nltk.corpus import wordnet
syn = wordnet.synsets('hello')[0]

print ("\nSynset meaning : ", syn.definition())

Regular Expression Removal:

import re
text = "Remove numbers like 123 and special characters (!@#$) from this text."

pattern = r'[0-9!@#$]+'

cleaned_text = re.sub(pattern, '', text)

print(cleaned_text)

Unix Program
Document49 pages
Unix Program
Vipra Dubey
100% (1)
Gd Script
From Everand
Gd Script
Marijo Trkulja
No ratings yet
PR 7
Document2 pages
PR 7
saurabhbborate0621
No ratings yet
Exp 3 - To Perform Lemmatization and Stemming On Word or Sentence
Document1 page
Exp 3 - To Perform Lemmatization and Stemming On Word or Sentence
Kartik Chouhan
No ratings yet
Natural Language Processing
Document22 pages
Natural Language Processing
sandeepssn47
No ratings yet
ASTW RA03 PracticalManual
Document18 pages
ASTW RA03 PracticalManual
Diksha Nasa
No ratings yet
NLP Lab Manual
Document6 pages
NLP Lab Manual
Zeha 1
No ratings yet
Natural Language Processing
Document17 pages
Natural Language Processing
coding ak
No ratings yet
NLP Lab1
Document6 pages
NLP Lab1
karthikeyacharan78
No ratings yet
D22CS097 P6
Document3 pages
D22CS097 P6
Rushabh Goswami
No ratings yet
NLP - Cheatsheet
Document10 pages
NLP - Cheatsheet
ADITYA MANWATKAR
No ratings yet
Term 3 Record Programs With Output 2023 2024
Document8 pages
Term 3 Record Programs With Output 2023 2024
Latha Srinivasan
No ratings yet
New Text Document
Document4 pages
New Text Document
baluchandrashekar2008
No ratings yet
01 131182 007 8538864252 23062021 111033pm
Document3 pages
01 131182 007 8538864252 23062021 111033pm
Fahad Rana
No ratings yet
Import Tkinter As TK
Document11 pages
Import Tkinter As TK
UIoi
No ratings yet
#Loading NLTK: Import
Document5 pages
#Loading NLTK: Import
avinash
No ratings yet
02 Unix
Document29 pages
02 Unix
dilipomi
No ratings yet
Weather App in Python 2.0
Document6 pages
Weather App in Python 2.0
Dharmesh Vaish
No ratings yet
Soundarya 256 NLP Practs
Document14 pages
Soundarya 256 NLP Practs
Kajal Yadav
No ratings yet
5sep 2022 Print Typeof Etc - Jupyter Notebook
Document4 pages
5sep 2022 Print Typeof Etc - Jupyter Notebook
THOMAS SHONEY PUTHUSSERI 2240233
No ratings yet
QR
Document2 pages
QR
Lord Jupiter
No ratings yet
Section 6 - Jupyter Notebook
Document11 pages
Section 6 - Jupyter Notebook
Mohamed Aymen
No ratings yet
Project 5 Stemming
Document1 page
Project 5 Stemming
Shiv M
No ratings yet
CC103 Project
Document2 pages
CC103 Project
Jean Rona
No ratings yet
Assignment No 3
Document5 pages
Assignment No 3
Akshata Chopade
No ratings yet
Aped For Fake News
Document6 pages
Aped For Fake News
Bless Co
No ratings yet
CS Project
Document22 pages
CS Project
Daksh Gudwani
No ratings yet
Nov 3
Document5 pages
Nov 3
Akshay Mahajan
No ratings yet
Assignment 7
Document2 pages
Assignment 7
Ashwini Patil
No ratings yet
Assign7.Ipynb - Colab
Document3 pages
Assign7.Ipynb - Colab
atharvapudale0608
No ratings yet
# NLTK Program
Document1 page
# NLTK Program
sd8837
No ratings yet
Programm in
Document2 pages
Programm in
Alberto Jr. Aguirre
No ratings yet
NLP Manual
Document21 pages
NLP Manual
1nt21ai012.vynavi
No ratings yet
Ordereddict in Python: Ordereddict Preserves The Order
Document3 pages
Ordereddict in Python: Ordereddict Preserves The Order
Shubham Rawat
No ratings yet
NLP - Practical List
Document14 pages
NLP - Practical List
Yash Amin
No ratings yet
Chapter4 Maintainability
Document43 pages
Chapter4 Maintainability
Komi David ABOTSITSE
No ratings yet
Contentt
Document19 pages
Contentt
Lakshya Verma
No ratings yet
Ollama
Document3 pages
Ollama
Lijith
No ratings yet
6 - Text Vectorization-CSC688-SP22
Document5 pages
6 - Text Vectorization-CSC688-SP22
Crypto Genius
No ratings yet
Python Fers
Document1 page
Python Fers
Sam Ram
No ratings yet
Updates & FAQ
Document3 pages
Updates & FAQ
dropped95si
No ratings yet
Artificial Intelligencre
Document38 pages
Artificial Intelligencre
Ajit Kumar
No ratings yet
PIC10 Afinal W09
Document11 pages
PIC10 Afinal W09
Will Ma
No ratings yet
NLP Tushar
Document21 pages
NLP Tushar
Yash Amin
No ratings yet
Python Coding Interview Questions - 3
Document3 pages
Python Coding Interview Questions - 3
ekta sharma
No ratings yet
Wa0010
Document180 pages
Wa0010
Zee Shinsuke
No ratings yet
Wa0010
Document180 pages
Wa0010
Zee Shinsuke
No ratings yet
Solution Python Programming Practical List
Document36 pages
Solution Python Programming Practical List
Rehan Pathan
No ratings yet
DMV Scraper
Document3 pages
DMV Scraper
himanshu1491
No ratings yet
Sentiment Analysis With ML
Document16 pages
Sentiment Analysis With ML
Sahabaj Alam
No ratings yet
Computer Programming-I (Cs 1301) Tutorial - #02
Document6 pages
Computer Programming-I (Cs 1301) Tutorial - #02
Samia Elsayed
No ratings yet
Unstructured Data Classification Handson
Document4 pages
Unstructured Data Classification Handson
mohamed yasin
No ratings yet
Python All
Document43 pages
Python All
live long
No ratings yet
Experiment 5 Programs
Document12 pages
Experiment 5 Programs
sangram.co10723
No ratings yet
R Lab Assignment
Document17 pages
R Lab Assignment
tapstaps902
No ratings yet
GUI Notes
Document27 pages
GUI Notes
Satvik Gupta
No ratings yet
Programming Questions
Document7 pages
Programming Questions
RALPH LAURENCE VISAYA
No ratings yet
Spoken Language Processing in Python Chapter4
Document46 pages
Spoken Language Processing in Python Chapter4
Fgpeqw
No ratings yet
Simple Chatbot: Code
Document3 pages
Simple Chatbot: Code
DENISH ASODARIYA
No ratings yet
Python An Introduction
From Everand
Python An Introduction
Renier Engelbrecht
No ratings yet