Welcome to Scribd!

Combine Tessdata 1

Uploaded by

0% found this document useful (0 votes)

12 views1 page

The combine_tessdata program combines, extracts, overwrites, lists, and compacts components of Tesseract data files. It can combine individual component files into a single traineddata file, extract specific components from a traineddata file, overwrite components in an existing traineddata file, and unpack all components of a traineddata file to a specified path. The most common uses are to combine component files during Tesseract training, extract a component for modification and then overwrite it, and unpack existing traineddata files for inspection or modification of components.

Original Description:

Original Title

COMBINE_TESSDATA_1

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

12 views1 page

Combine Tessdata 1

Uploaded by

Chaos Diver

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 1

Search inside document

14.04.

2023, 15:40 COMBINE_TESSDATA(1)

COMBINE_TESSDATA(1)

NAME
combine_tessdata - combine/extract/overwrite/list/compact Tesseract data

SYNOPSIS
combine_tessdata [OPTION] FILE…

DESCRIPTION
combine_tessdata(1) is the main program to combine/extract/overwrite/list/compact
tessdata components in [lang].traineddata files.
To combine all the individual tessdata components (unicharset, DAWGs, classifier
templates, ambiguities, language configs) located at, say, /home/$USER/temp/eng.* run:

combine_tessdata /home/$USER/temp/eng.

The result will be a combined tessdata file /home/$USER/temp/eng.traineddata

Specify option -e if you would like to extract individual components from a combined
traineddata file. For example, to extract language config file and the unicharset from
tessdata/eng.traineddata run:

combine_tessdata -e tessdata/eng.traineddata \
/home/$USER/temp/eng.config /home/$USER/temp/eng.unicharset

The desired config file and unicharset will be written to /home/$USER/temp/eng.config

/home/$USER/temp/eng.unicharset
Specify option -o to overwrite individual components of the given [lang].traineddata file.
For example, to overwrite language config and unichar ambiguities files in
tessdata/eng.traineddata use:

combine_tessdata -o tessdata/eng.traineddata \
/home/$USER/temp/eng.config /home/$USER/temp/eng.unicharambigs

As a result, tessdata/eng.traineddata will contain the new language config and unichar
ambigs, plus all the original DAWGs, classifier templates, etc.
Note: the file names of the files to extract to and to overwrite from should have the
appropriate file suffixes (extensions) indicating their tessdata component type (.unicharset
for the unicharset, .unicharambigs for unichar ambigs, etc). See k*FileSuffix variable in
ccutil/tessdatamanager.h.
Specify option -u to unpack all the components to the specified path:

combine_tessdata -u tessdata/eng.traineddata /home/$USER/temp/eng.

file:///E:/self_projects/programming/libraries/Tesseract-OCR/combine_tessdata.1.html 1/4

Bash Command Line Pro Tips
From Everand
Bash Command Line Pro Tips
Jason Cannon
Rating: 4.5 out of 5 stars
4.5/5 (8)
Linux Commands By Example
From Everand
Linux Commands By Example
Khaled Jamal
Rating: 4.5 out of 5 stars
4.5/5 (3)
Windows Command Prompt A-N
From Everand
Windows Command Prompt A-N
Prometheus MMS
Rating: 5 out of 5 stars
5/5 (2)
A Naming Convention Example
Document22 pages
A Naming Convention Example
akkapeddi84
No ratings yet
Backup Plan Procedure
Document6 pages
Backup Plan Procedure
Waleed Abdu Rahiman
No ratings yet
Lu2 TAFJ Tools PDF
Document7 pages
Lu2 TAFJ Tools PDF
Gnana Sambandam
No ratings yet
Issues Datastage
Document4 pages
Issues Datastage
rkpolu
No ratings yet
META Automation Users Guide
Document245 pages
META Automation Users Guide
June Tolp
No ratings yet
Deleting Files by Age
Document6 pages
Deleting Files by Age
mferui
No ratings yet
About Systemd
Document3 pages
About Systemd
Cristea Virginia
No ratings yet
LaTeX Creating Packages
Document4 pages
LaTeX Creating Packages
Anonymous 9J3r76iRdz
No ratings yet
Dir Command
Document6 pages
Dir Command
zyyriyahcarisadancil05
No ratings yet
Assignment3 Complexproblems
Document9 pages
Assignment3 Complexproblems
Sana Sachdeva
No ratings yet
Kiosk Admin Tool User Manual
Document35 pages
Kiosk Admin Tool User Manual
Jay Incognitus
No ratings yet
Name Synopsis: /begin (Filecontents ) /end (Filecontents )
Document2 pages
Name Synopsis: /begin (Filecontents ) /end (Filecontents )
rere
No ratings yet
Xband Man
Document30 pages
Xband Man
Younes Akabli
No ratings yet
Accessing Linux File Systems
Document8 pages
Accessing Linux File Systems
pmmanick
No ratings yet
Stata Tutorial
Document63 pages
Stata Tutorial
André Medeiros Sztutman
No ratings yet
User Defined Configuration Modification
Document3 pages
User Defined Configuration Modification
VicoMonarrez
No ratings yet
Dos Commands
Document30 pages
Dos Commands
AKASH KAUSHAL
No ratings yet
Unix Basics For Testers
Document16 pages
Unix Basics For Testers
Sherelyn Galos
No ratings yet
Unix Basics CMD
Document8 pages
Unix Basics CMD
VISHAL PATIL
No ratings yet
Sapthesis
Document14 pages
Sapthesis
Iolanda Navone
No ratings yet
IRST Language Modeling Toolkit User Manual
Document28 pages
IRST Language Modeling Toolkit User Manual
LeoThomas
No ratings yet
How To Package Your L TEX Package
Document36 pages
How To Package Your L TEX Package
JDH
No ratings yet
Linux Configuration Files
Document4 pages
Linux Configuration Files
Raj Rajesh
No ratings yet
Shell Style Guide
Document13 pages
Shell Style Guide
nsitdce
No ratings yet
UNIX Command
Document33 pages
UNIX Command
paino81
No ratings yet
L1 MSDOS Commands
Document3 pages
L1 MSDOS Commands
Venu Gopaal
No ratings yet
Disk Operating System
Document10 pages
Disk Operating System
Bhabuk Ghimire
No ratings yet
Get Control of Your Input: Refer To Multiple Data Files Efficiently
Document6 pages
Get Control of Your Input: Refer To Multiple Data Files Efficiently
oops sorry
No ratings yet
Unix Commands: Path Variable
Document8 pages
Unix Commands: Path Variable
Anonymous pvdQKoDwC
No ratings yet
BCA - DOS Commands
Document15 pages
BCA - DOS Commands
Raj singh
No ratings yet
Linux Configuration Files
Document5 pages
Linux Configuration Files
Sanoj
No ratings yet
FastCopy v. 3.30-Characteristics
Document18 pages
FastCopy v. 3.30-Characteristics
Salvatore Bonaffino
No ratings yet
Dir 2 HTML
Document5 pages
Dir 2 HTML
yusufzk
No ratings yet
Function Spark
Document9 pages
Function Spark
bhargavi
No ratings yet
Name Synopsis: /requirepackage (Snapshot) % Needed by Bundledoc /documentclass (11Pt) (Article)
Document5 pages
Name Synopsis: /requirepackage (Snapshot) % Needed by Bundledoc /documentclass (11Pt) (Article)
rere
No ratings yet
Tex/L Tex, Mathml, Tex4Ht: Essential Tools For Creating Accessible Documents
Document65 pages
Tex/L Tex, Mathml, Tex4Ht: Essential Tools For Creating Accessible Documents
Anonymous 0k1LVhtQk
No ratings yet
Dumplog Utility Tool
Document3 pages
Dumplog Utility Tool
alikhurshid
No ratings yet
Enigma2 Telne
Document7 pages
Enigma2 Telne
iakiak
No ratings yet
Adminguide 2
Document8,184 pages
Adminguide 2
phạm minh hùng
No ratings yet
Slide 02 2 File and Directory Commands
Document35 pages
Slide 02 2 File and Directory Commands
girmayou
No ratings yet
TeXstudio - User Manual
Document29 pages
TeXstudio - User Manual
Mariella Mateo
No ratings yet
Catalog Files Tekla User Assistance
Document1 page
Catalog Files Tekla User Assistance
Mưa Vô Hình
No ratings yet
Environments and Profile Files
Document2 pages
Environments and Profile Files
Emanuel Jimenez
No ratings yet
Orchadmin Commands
Document2 pages
Orchadmin Commands
Vasu Srinivas
No ratings yet
Essential DOS Commands
Document6 pages
Essential DOS Commands
api-3858983
No ratings yet
Istal Ferret With Linux 32
Document9 pages
Istal Ferret With Linux 32
Noper Tulak
No ratings yet
Em
Document10 pages
Em
bharath
100% (1)
Lecture 69 RPM Build
Document4 pages
Lecture 69 RPM Build
Mohammed Babar Ahmed
No ratings yet
COMP5213 Tutorial01 Week02 Unix
Document25 pages
COMP5213 Tutorial01 Week02 Unix
Muthu Raman Chinnadurai
No ratings yet
46 Midnight Commander
Document3 pages
46 Midnight Commander
alexxx
No ratings yet
Recipe
Document3 pages
Recipe
abdoahmad426.rr
No ratings yet
Unix Commands
Document5 pages
Unix Commands
Nasreen Fathima
No ratings yet
Java - Packages: Creating A Package
Document4 pages
Java - Packages: Creating A Package
Chalew Zeynu
No ratings yet
Master of Business Administration SESSION - 2021 - 2023 Computer Appication in Management
Document8 pages
Master of Business Administration SESSION - 2021 - 2023 Computer Appication in Management
Manoj Rampurya
No ratings yet
In This Document: Purpose Scope Details References
Document7 pages
In This Document: Purpose Scope Details References
gmasay
No ratings yet
Amstinst
Document5 pages
Amstinst
miskoscribd
No ratings yet
Marking Up Differences Between Latex Files With Latexdiff: Preamble
Document31 pages
Marking Up Differences Between Latex Files With Latexdiff: Preamble
OSCAR ALEXIS QUINTERO L�PEZ
No ratings yet