Welcome to Scribd!

Clarifying Blurred Text in Extracted PDF Pages

Uploaded by

roshini.d2022

0% found this document useful (0 votes)

4 views7 pages

This document discusses a project to clarify blurred text extracted from PDF pages using data science techniques. The methodology uses optical character recognition to extract text, followed by image processing techniques like sharpening filters and deblurring algorithms. The process is iterative, aiming to optimize enhancement methods. Vectorization and manual correction are also explored. The goal is to address the challenge of clarifying blurred text within document images.

Original Description:

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

4 views7 pages

Clarifying Blurred Text in Extracted PDF Pages

Uploaded by

roshini.d2022

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 7

Search inside document

Clarifying

Blurred Text
in Extracted
PDF Pages
ROSHINI D
22MDT1065
IOPEX TECHNOLOGIES
To significantly improve operations efficiency, and reduce the cost of operations for our customers.

To build a global corporation renowned for its relentless focus on optimization, distinguished by
its repertoire of inventive processes, enterprising staff, and cutting edge tools.
OVERVIEW
• This project focuses on the application of data science techniques to enhance the clarity
of blurred text extracted from PDF pages.
• The methodology involves Optical Character Recognition (OCR) for text extraction,
followed by image processing techniques such as sharpening filters, contrast adjustments,
and potential deblurring algorithms.
• The process is iterative, with a focus on optimizing the enhancement methods to achieve
the best results.
• Additionally, vectorization and manual correction are explored as strategies to improve
the legibility of the text.
• The project showcases the intersection of computer vision, data manipulation, and
algorithmic approaches in addressing the challenge of clarifying blurred text within
document images.
CONCEPT
The concept of clarifying blurred text in extracted PDF pages revolves around using a
combination of technological processes and tools to improve the legibility of text that may have
been distorted or unclear due to blurring in PDF documents. The methodology typically involves
the use of Optical Character Recognition (OCR) to extract text, followed by various image
enhancement techniques, such as sharpening filters and deblurring algorithms. Manual
correction, iterative optimization, and validation processes are often incorporated to refine and
ensure the accuracy of the enhanced text. The overarching goal is to overcome the challenges
posed by blurred text and produce a clearer and more readable representation of the original
content within PDF files.
METHODOLOGY
The methodology for enhancing blurred text in extracted PDF pages employs Optical
Character Recognition (OCR) software for text extraction. Image processing techniques, such
as sharpening filters and deblurring algorithms, enhance text quality. Zooming and inspection
identify blurred areas, while vectorization ensures resolution independence. Manual correction
supplements automated methods. An iterative process adjusts parameters for optimization,
followed by a quality check and documentation. Optimization strategies explore additional
enhancements, and validation ensures accuracy. The methodology integrates OCR, image
processing, and iterative optimization for adaptable and optimal text enhancement while
preserving content integrity.

• Data Manipulation and Analysis: Pandas

• Image Enhancement Techniques: PIL
• Iterative Process and Optimization: scikit – image, Scipy
• Documentation and reporting: matplotlib
THANK
YOU

Raj Synopsis12
Document5 pages
Raj Synopsis12
shuklavikas2392002
No ratings yet
Control Diffusion
Document20 pages
Control Diffusion
a.andreas
No ratings yet
Amit Bisht Resume
Document2 pages
Amit Bisht Resume
api-439189971
No ratings yet
Ayush Resume Publish
Document2 pages
Ayush Resume Publish
Ayush Singh
No ratings yet
5.0 Best Practices For OCR
Document4 pages
5.0 Best Practices For OCR
Sim Simma
No ratings yet
Senior Architect 9443373799 / 7358773175: Profile
Document3 pages
Senior Architect 9443373799 / 7358773175: Profile
Shantha Gopaal
No ratings yet
ML Report
Document5 pages
ML Report
basit ali
No ratings yet
Research On Document Digitization Processing Techn
Document6 pages
Research On Document Digitization Processing Techn
Lương Đặng Nam Khánh
No ratings yet
Research Papers On Image Enhancement Techniques
Document6 pages
Research Papers On Image Enhancement Techniques
gahezopizez2
No ratings yet
Nikhilesh Ray - QM - Resume - 2024 - Project
Document10 pages
Nikhilesh Ray - QM - Resume - 2024 - Project
nikhileshray9746
No ratings yet
All Project Abstract Comp 2017-18
Document15 pages
All Project Abstract Comp 2017-18
Keval
No ratings yet
Ocr Thesis PDF
Document6 pages
Ocr Thesis PDF
lisakennedyfargo
100% (2)
Product Owner Profile
Document2 pages
Product Owner Profile
Rahul Chinta
No ratings yet
Assignment 2 MLDS Lab
Document3 pages
Assignment 2 MLDS Lab
Amruta More
No ratings yet
Bluedog White Paper - Workflow Optimization
Document2 pages
Bluedog White Paper - Workflow Optimization
Tom Termini
No ratings yet
BPR - Zakir
Document11 pages
BPR - Zakir
Imran Shaikh
No ratings yet
Performance Comparison of Ocr Tools: Cite This Paper
Document13 pages
Performance Comparison of Ocr Tools: Cite This Paper
Akai Shuichi
No ratings yet
TS Project - Submission
Document21 pages
TS Project - Submission
B.C.H. Reddy
No ratings yet
Alphawebsite 1
Document28 pages
Alphawebsite 1
Shivraj Kalshetti
No ratings yet
Zameer Usman - AI Resume
Document4 pages
Zameer Usman - AI Resume
45.Nagare Anurag
No ratings yet
Source 'N Rise Company Profile
Document8 pages
Source 'N Rise Company Profile
moody2x5174
No ratings yet
Development of A Tool For Quick Result Analysis
Document5 pages
Development of A Tool For Quick Result Analysis
International Journal of Innovative Science and Research Technology
No ratings yet
Wepik Revolutionizing Communication Ai Powered Chat With Pdfs 20240226052648nh3C
Document11 pages
Wepik Revolutionizing Communication Ai Powered Chat With Pdfs 20240226052648nh3C
balsehra445
No ratings yet
M Sivaram Prasad Dasari: Academic Credentials B.Tech (ECE) From JNT University, 2010 Passed Out
Document4 pages
M Sivaram Prasad Dasari: Academic Credentials B.Tech (ECE) From JNT University, 2010 Passed Out
Santhosh Malla
No ratings yet
Ai Base Paper
Document9 pages
Ai Base Paper
BALAJI
No ratings yet
Zen Data Service
Document5 pages
Zen Data Service
cyazhni5412
No ratings yet
DQM Successfulmigration
Document3 pages
DQM Successfulmigration
Abdelfettah Gasmi
No ratings yet
Sumathi - Emerging Technologies - Assesment A4
Document6 pages
Sumathi - Emerging Technologies - Assesment A4
G.Prabhaharan Gowtham
No ratings yet
Purple Futuristic Technology Presentation
Document19 pages
Purple Futuristic Technology Presentation
gopika1official
No ratings yet
Anjali's Resume
Document1 page
Anjali's Resume
Anjali Nayak
No ratings yet
MFRP VIVA Template Updated
Document22 pages
MFRP VIVA Template Updated
Chamila
No ratings yet
Data Science: Certificate Programme in
Document11 pages
Data Science: Certificate Programme in
Martin Louis
No ratings yet
Chat With File
Document11 pages
Chat With File
balsehra445
No ratings yet
Bayt CV - Mani PDF
Document3 pages
Bayt CV - Mani PDF
nmanikandan
No ratings yet
Bayt CV PDF
Document3 pages
Bayt CV PDF
nmanikandan
No ratings yet
Resume Parser Progress
Document11 pages
Resume Parser Progress
Louis Odhiambo
No ratings yet
Rishabh Mathur Resume
Document2 pages
Rishabh Mathur Resume
Satish Tiwari
No ratings yet
Erp Mar2005
Document4 pages
Erp Mar2005
jgdtushargarg4773
No ratings yet
Report CMWP Model
Document51 pages
Report CMWP Model
hashimhashi774
No ratings yet
Vedaant Rajoo Resume
Document2 pages
Vedaant Rajoo Resume
VeDaant Raju
No ratings yet
An Effect of Particle Swarm Optimization On SDLC: Shrishti Tamrakar (M.Tech Scholar), Anubhav Sharma (Asst - Prof.)
Document7 pages
An Effect of Particle Swarm Optimization On SDLC: Shrishti Tamrakar (M.Tech Scholar), Anubhav Sharma (Asst - Prof.)
kamleshwari verma
No ratings yet
Dbap Project Plan
Document20 pages
Dbap Project Plan
api-315989847
No ratings yet
Intro 2 Doc A
Document59 pages
Intro 2 Doc A
Imam Hasan
No ratings yet
Adarsh Kumar Singh ( (1NH21MC004) )
Document28 pages
Adarsh Kumar Singh ( (1NH21MC004) )
Shivaiah G E
No ratings yet
212al116-Str-06 11 2023
Document3 pages
212al116-Str-06 11 2023
Harish S
No ratings yet
Ijaerv13n6 99
Document8 pages
Ijaerv13n6 99
mrajislm5374
No ratings yet
BarkhaChhabria Resume
Document2 pages
BarkhaChhabria Resume
Chris Shimla
No ratings yet
TOR For Database and Data Analytics Specialist
Document2 pages
TOR For Database and Data Analytics Specialist
RDavid Barja
No ratings yet
Make More Efficient Use of Data Management and Analytics Capabilities
Document2 pages
Make More Efficient Use of Data Management and Analytics Capabilities
jakpyke
No ratings yet
Capstone Project Planning
Document7 pages
Capstone Project Planning
Shivraj Kalshetti
No ratings yet
New Project Manager - Program Manager - Updated
Document4 pages
New Project Manager - Program Manager - Updated
Saurabh Jain
No ratings yet
Optical Character Recognition: Made By: Dhairya Goel-02814803115 Madhwan Sharma-60214803115
Document15 pages
Optical Character Recognition: Made By: Dhairya Goel-02814803115 Madhwan Sharma-60214803115
madhwan sharma
No ratings yet
Brochure HRTech v2
Document8 pages
Brochure HRTech v2
S M SHEKAR AND CO
No ratings yet
Ocr As Ict Coursework Help
Document5 pages
Ocr As Ict Coursework Help
afjyadcjesbdwl
100% (2)
Handwritten Text Recognition: Software Requirements Specification
Document10 pages
Handwritten Text Recognition: Software Requirements Specification
Gaurav Bhadane
No ratings yet
Automate The Scanning and Processing: of Your Documents and Data
Document6 pages
Automate The Scanning and Processing: of Your Documents and Data
Vidya Sagar Tammina
No ratings yet
Optical Character Recognition Project Report
Document71 pages
Optical Character Recognition Project Report
Anonymous vTrbyfBi3n
No ratings yet
Data Science Portfolio
Document17 pages
Data Science Portfolio
Preetisha Bora
No ratings yet
1, Data-Science-Basic
Document12 pages
1, Data-Science-Basic
Jordan
No ratings yet
Touchpad Information Technology Class 10
From Everand
Touchpad Information Technology Class 10
Sanjay Jain
Rating: 5 out of 5 stars
5/5 (1)
Regression Trees
Document11 pages
Regression Trees
Preeti
No ratings yet
Mds Past Year
Document8 pages
Mds Past Year
Koo Lear
No ratings yet
Stability of Non-Linear Dynamical System
Document9 pages
Stability of Non-Linear Dynamical System
IJAR JOURNAL
No ratings yet
STD XI - Eco - Organisation of Data - Notes
Document3 pages
STD XI - Eco - Organisation of Data - Notes
lakshya mathur
No ratings yet
FINAL
Document11 pages
FINAL
mehakrizwan59
No ratings yet
Course Outline MAT 125.9 Summer2023
Document6 pages
Course Outline MAT 125.9 Summer2023
Rubayet fahim
No ratings yet
Definition Transportation Model
Document20 pages
Definition Transportation Model
Nusrat Jahan Moon
No ratings yet
Chapt 2 PDF
Document39 pages
Chapt 2 PDF
Nazifa Nawer
No ratings yet
PMO
Document2 pages
PMO
dil17
No ratings yet
By: Parul Chauhan Assistant Prof
Document64 pages
By: Parul Chauhan Assistant Prof
salman khan
No ratings yet
Applied Soft Computing: Ali Akbar Abdoos, Peyman Khorshidian Mianaei, Mostafa Rayatpanah Ghadikolaei
Document10 pages
Applied Soft Computing: Ali Akbar Abdoos, Peyman Khorshidian Mianaei, Mostafa Rayatpanah Ghadikolaei
hanoi6
No ratings yet
Methods of Substitution & Appln
Document5 pages
Methods of Substitution & Appln
Boobalan R
No ratings yet
Isolating Variables With Algebra
Document3 pages
Isolating Variables With Algebra
kakyeongkim02
No ratings yet
Lec Notes 7 Root Locus Design
Document30 pages
Lec Notes 7 Root Locus Design
Ferhat Tekoğlu
No ratings yet
ML Unit 1
Document13 pages
ML Unit 1
2306603
No ratings yet
Nonlinear Modulational Instability in Dispersive Pdes
Document54 pages
Nonlinear Modulational Instability in Dispersive Pdes
Antonio Milos Radakovic
No ratings yet
Useful Sites
Document2 pages
Useful Sites
Rezen Rana Bhat
No ratings yet
Assignment 2 Sol
Document3 pages
Assignment 2 Sol
ching chau
No ratings yet
Ullmann's Chemical Engineering and Plant Design - Vol. 1 Mathematics and Physics in Chem. Eng. - Fundamentals - Vol. 2 Plant and Process Design - Wiley-VCH PDF
Document1,423 pages
Ullmann's Chemical Engineering and Plant Design - Vol. 1 Mathematics and Physics in Chem. Eng. - Fundamentals - Vol. 2 Plant and Process Design - Wiley-VCH PDF
Omer
100% (1)
Portfolio Optimisation For Two Investors
Document9 pages
Portfolio Optimisation For Two Investors
International Journal of Innovative Science and Research Technology
No ratings yet
Water: Development of A Deep Learning-Based Prediction Model For Water Consumption at The Household Level
Document17 pages
Water: Development of A Deep Learning-Based Prediction Model For Water Consumption at The Household Level
alemneh mihretie
No ratings yet
Datanest - Data Science Interview
Document19 pages
Datanest - Data Science Interview
Juan Guillermo Ferrer Velando
No ratings yet
Time-Series and Forecasting
Document16 pages
Time-Series and Forecasting
Prashant Brahmane
No ratings yet
Cloud Intrusion Detection Method Based On Stacked Contractive Auto-Encoder and Support Vector Machine
Document13 pages
Cloud Intrusion Detection Method Based On Stacked Contractive Auto-Encoder and Support Vector Machine
Bhuvana Senthilkumar
No ratings yet
Regression
Document8 pages
Regression
tanyagoswami11
No ratings yet
A Survey On Wood Recognition Using Machine Vision
Document6 pages
A Survey On Wood Recognition Using Machine Vision
SEP-Publisher
No ratings yet
Digital Communication - Quantization - Tutorialspoint PDF
Document5 pages
Digital Communication - Quantization - Tutorialspoint PDF
Niharika Korukonda
No ratings yet
Face Recognition
Document8 pages
Face Recognition
Dwi Rochma
No ratings yet
2019 - Structural Analysis of Attributes For Vehicle Re-Identification and Retrieval
Document12 pages
2019 - Structural Analysis of Attributes For Vehicle Re-Identification and Retrieval
Minh Hải Ngô
No ratings yet