Welcome to Scribd!

Nlppython

Uploaded by

0% found this document useful (0 votes)

88 views1 page

This code takes a text URL as input, downloads the text from the URL, tokenizes it into lowercase words, counts the number of total words, unique words, and calculates word coverage. It returns these values and prints them. It first checks if NLTK data is available locally and if not, extracts the NLTK zip file for processing.

Original Description:

Original Title

nlppython

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

88 views1 page

Nlppython

Uploaded by

Arijit Dutta

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 1

Search inside document

from urllib import request

def processRawText(textURL):
# Write your code here
textcontent=request.urlopen(textURL).read()
tokenizedlcwords=[nltk.word_tokenize(word.lower() for word
in set(textcontent))]
noofwords=len(tokenizedlcwords)
noofunwords=len(set(tokenizedlcwords))
wordcov=int(noofwords/noofunwords)
return noofwords,noofunwords,wordcov

if __name__ == '__main__':
textURL = input()

if not os.path.exists(os.getcwd() + "/nltk_data"):

with zipfile.ZipFile("nltk_data.zip", 'r') as zip_ref:
zip_ref.extractall(os.getcwd())

noofwords, noofunqwords, wordcov, maxfreq = processRawText(textURL)

print(noofwords)
print(noofunqwords)
print(wordcov)
print(maxfreq)

Fresco Code Python Application Programming
Document7 pages
Fresco Code Python Application Programming
Ray
90% (20)
MDT4.0 - You Know, I Wumbo, You Wumbo, He She Me Wumbo, Wumbo, Wumboing, We'll Have Thee Wumbo, Wumborama, Wumbology, The Study of Wumbo
Document43 pages
MDT4.0 - You Know, I Wumbo, You Wumbo, He She Me Wumbo, Wumbo, Wumboing, We'll Have Thee Wumbo, Wumborama, Wumbology, The Study of Wumbo
Vido Bae
No ratings yet
Aped For Fake News
Document6 pages
Aped For Fake News
Bless Co
No ratings yet
ASTW RA03 PracticalManual
Document18 pages
ASTW RA03 PracticalManual
Diksha Nasa
No ratings yet
Source Code Python Jemmy
Document7 pages
Source Code Python Jemmy
Fadilah Riczky
No ratings yet
NLP - Practical List
Document14 pages
NLP - Practical List
Yash Amin
No ratings yet
Natural Language Processing
Document17 pages
Natural Language Processing
coding ak
No ratings yet
Sahil Malhotra 16 BCE 0113 Web Mining L51+L52: 1. Universal Crawling 1.1. CODE
Document11 pages
Sahil Malhotra 16 BCE 0113 Web Mining L51+L52: 1. Universal Crawling 1.1. CODE
sahil
No ratings yet
# Can Have Socket, Select, Os, Sys
Document5 pages
# Can Have Socket, Select, Os, Sys
ItzFakeAccount
No ratings yet
Instalador Odoo
Document14 pages
Instalador Odoo
Antonio May
No ratings yet
Main
Document5 pages
Main
klausrunkelmann
No ratings yet
Sample Code
Document9 pages
Sample Code
Angad Singh
No ratings yet
Assignment 7
Document2 pages
Assignment 7
Ashwini Patil
No ratings yet
Lab Digital Assignment 6 Data Visualization: Name: Samar Abbas Naqvi Registration Number: 19BCE0456
Document11 pages
Lab Digital Assignment 6 Data Visualization: Name: Samar Abbas Naqvi Registration Number: 19BCE0456
SAMAR ABBAS NAQVI 19BCE0456
No ratings yet
Reading Merged Dataset Reading Merged Dataset: 'Import Successfull'
Document7 pages
Reading Merged Dataset Reading Merged Dataset: 'Import Successfull'
Cookies Keeping
No ratings yet
R语言基础入门指令 (tips)
Document14 pages
R语言基础入门指令 (tips)
s2000152
No ratings yet
Program
Document11 pages
Program
Gayathri Ammu
No ratings yet
Python Review Code
Document26 pages
Python Review Code
Yanet Sivipaucar Romero
No ratings yet
6 - Text Vectorization-CSC688-SP22
Document5 pages
6 - Text Vectorization-CSC688-SP22
Crypto Genius
No ratings yet
Atacco Dos - Py
Document2 pages
Atacco Dos - Py
redeigoblinwgf
No ratings yet
Asss 7
Document4 pages
Asss 7
Ashwini Patil
No ratings yet
Datastage Routines
Document64 pages
Datastage Routines
Bhaskar Reddy
No ratings yet
Datastage Routines
Document64 pages
Datastage Routines
Kotireddy Ambati
No ratings yet
Inventory Script My - Vbs
Document11 pages
Inventory Script My - Vbs
Mitesh
No ratings yet
Functions in Python
Document19 pages
Functions in Python
sonali karki
No ratings yet
18bce0457 VL2020210104959 Ast01
Document18 pages
18bce0457 VL2020210104959 Ast01
Nikitha Reddy
No ratings yet
Password Generator
Document2 pages
Password Generator
Anshika Suryavanshi
No ratings yet
MQTT
Document7 pages
MQTT
angelo68000
No ratings yet
Point Query & Tiles Over Kerla: Manish Modani: Ts Timeslice Fts Forecasted Time Slice
Document8 pages
Point Query & Tiles Over Kerla: Manish Modani: Ts Timeslice Fts Forecasted Time Slice
user0x
No ratings yet
Vps Colab Mining
Document6 pages
Vps Colab Mining
anak bawang
No ratings yet
I Golang Act5
Document9 pages
I Golang Act5
indah Gamers
No ratings yet
Pastenbin
Document10 pages
Pastenbin
Blackhat Destroyer
No ratings yet
Decision Tree Algorithm in Spark SQL
Document6 pages
Decision Tree Algorithm in Spark SQL
JP Vijaykumar
No ratings yet
Mobile App
Document6 pages
Mobile App
Gokul Raj S
No ratings yet
Nerating Passwords
Document3 pages
Nerating Passwords
atozdhiyanes
No ratings yet
HUAWEI - 03 Python Advanced
Document22 pages
HUAWEI - 03 Python Advanced
Pierpaolo Vergati
No ratings yet
CSCI468: Compilers Portfolio Spring 2016: Drew Antonich & Anthony Schwartz
Document36 pages
CSCI468: Compilers Portfolio Spring 2016: Drew Antonich & Anthony Schwartz
Avi W
No ratings yet
Backupcode - Rasa
Document3 pages
Backupcode - Rasa
Akshay Sripad
No ratings yet
Praktikum 2 PI Genap2023
Document4 pages
Praktikum 2 PI Genap2023
Irgy Suwito Suryanto
No ratings yet
Javascript
Document13 pages
Javascript
api-302055075
No ratings yet
Lab Manual CS301
Document36 pages
Lab Manual CS301
Khan Bahi
No ratings yet
Main
Document3 pages
Main
bradockarnold
No ratings yet
Nekobin
Document2 pages
Nekobin
Forwarding
No ratings yet
Python Code Examples
Document30 pages
Python Code Examples
Asaf Katz
No ratings yet
Diary Topic
Document5 pages
Diary Topic
Rifki Edo
No ratings yet
Monster
Document4 pages
Monster
raukg73
No ratings yet
PRACTICAL FILE CS Armaan Jaiswal
Document26 pages
PRACTICAL FILE CS Armaan Jaiswal
nik
No ratings yet
Python Cprofile
Document5 pages
Python Cprofile
khonello
No ratings yet
Code
Document28 pages
Code
Shubham
No ratings yet
Practical File CS Nihal Saini
Document28 pages
Practical File CS Nihal Saini
nik
No ratings yet
Pyspark Commands
Document12 pages
Pyspark Commands
Rambabu Giduturi
No ratings yet
Code Source Main WTS 17-09-13
Document11 pages
Code Source Main WTS 17-09-13
Loudlee
No ratings yet
Assignment No 7 NS
Document5 pages
Assignment No 7 NS
Archana Kanwade
No ratings yet
8.menu Driven For Transversal Tree
Document9 pages
8.menu Driven For Transversal Tree
Shruti Ninawe
No ratings yet
Ds Job
Document5 pages
Ds Job
wilsonc2020
100% (1)
INS Journal Vikas
Document54 pages
INS Journal Vikas
haashboi5
No ratings yet
Fake Roblox Limited Sniper Cookie Logger Op
Document4 pages
Fake Roblox Limited Sniper Cookie Logger Op
Fantero Montero
No ratings yet
Fresco Code Python Application Programming
Document7 pages
Fresco Code Python Application Programming
TECHer YT
No ratings yet
LINE CTF 2021 Write Up - The Duck
Document55 pages
LINE CTF 2021 Write Up - The Duck
Jaiyank Saxena
No ratings yet
EmpID - EmpName - Assessment - AcctName - TillDate-Arijit Dutta.
Document14 pages
EmpID - EmpName - Assessment - AcctName - TillDate-Arijit Dutta.
Arijit Dutta
No ratings yet
IOO Nominations - Oracle Certifications and Learning Subscriptions - Seg-B - Consolidated On 25OCT21
Document12 pages
IOO Nominations - Oracle Certifications and Learning Subscriptions - Seg-B - Consolidated On 25OCT21
Arijit Dutta
No ratings yet
Work Report On Hourly Basis.
Document2 pages
Work Report On Hourly Basis.
Arijit Dutta
No ratings yet
Work in Process
Document1 page
Work in Process
Arijit Dutta
No ratings yet