You are on page 1of 6

Домашна работа,

изготвена от Ебру Исмаилова


спец. „Приложна лингвистика. Английски и корейски с ИТ“ , фак. номер 2002012735

Най-добрият OCR софтуер за архивиране на документи

УВОД

Какво е OCR?
Оптичното разпознаване на символи е технология за конвертиране на печатен текст в
текстов файл.
Тя е широко използвана за въвеждане на печатни данни от хартия или файл,
включително от лични документи, фактури, банкови извлечения, компютърни
разпечатки, визитки, поща.

Това е често срещан метод на запис на печатни текстове, за да може текстът да


бъде редактиран с текстов редактор, да се търси в него, да се съхранява по-компактно,
да се показва онлайн, както и да се използва в компютърни програми като
автоматизиран превод, конвертиране на текст към говор.

Най-добрият OCR софтуер позволява сканиране и архивиране на хартиени документи в


PDF файлове с лекота. Съвременният софтуер в днешно време е много по-способен да
работи бързо, безпроблемно и точно. Това е толкова важно, когато всъщност се
опитваме да търсим в сканирани документи, които са лошо форматирани.
ЕТО 7 ОТ НАЙ-ДОБРИТЕ ПЛАТЕНИ И БЕЗПЛАТНИ OCR ПРОГРАМИ

1.Readiris 17 (платено)

Това е най-новата версия на този високопроизводителен


OCR софтуер. Той идва с нов интерфейс, нов двигател за
разпознаване и по-бързо управление на документи. Лесно може да
се конвертира в много различни формати, включително и в аудио
файловете, благодарение на вербалното му разпознаване.

След като обработката приключи, програмата определя текстовите раздели или


зони и позволява извличане на текстове от определена зона или от целия файл. Също
така, Readiris има рядка функция за спестяване на облак, която позволява на
потребителите да запазват извлечения текст в различни услуги за съхранение в облак,
като Google Drive, OneDrive, Dropbox и други.

Той също така има многобройни функции за редактиране и обработка на текст,


което позволява на потребителите дори да сканират баркодове. Абонаментът започва от
$ 99 и има 10-дневен безплатен пробен период.

2.ABBYY FineReader 14 (платено)

Тази програма е най-мощният OCR софтуер на пазара и е


най-добрият инструмент за всеки, който се нуждае от бързо и
точно разпознаване на текст. Справя се отлично с голям обем и се
предлага с усъвършенствани инструменти за корекция за
трудните задачи.

Притежава инструмент за проверка - лесно коригира съмнителните части, като


прави сравнение между текстовете на OCR и оригинала.

ABBYY извлича най-точните текстове от изображенията, намерени в интернет.


В допълнение към това, той може да конвертира сканиран документ в HTML или във
формат ePub, използван от електронните четци. Платената версия започва от $ 199 и
има 30 дни безплатен пробен период.
3.Microsoft OneNote (безплатно)

Софтуерът може да се използва и като OCR въпреки


функционалността му като носител на бележки. Има опция,
наречена "Копиране на текст от картина", която позволява да се
извлича текст от изображения.

Неговата простота е това, което я прави уникална и предпочитана сред много


потребители; просто се вмъква картината в OneNote, след това се кликва с десния бутон
върху картината и се избира „Копиране на текст от картина“ и OneNote ще свърши
останалото. Той записва текстовете в клипборда, след което може да се постави текста
в Microsoft Word или друга програма по избор.

Недостатъкът на програмата е, че не поддържа таблици и колони.

4.Simple OCR/ Опростен OCR (безплатно)

Това е удобен инструмент, който може да се използва за


конвертиране на така наречените твърди копия в текстови файлове.

При наличието на много ръкописни документи, има шанс да


се конвертират в редактируеми текстови файлове. Въпреки това ръкописното
извличане има ограничения и се предлага само като 14-дневен безплатен пробен
период. Печатът е безплатен и няма ограничения.

Има вградена проверка на правописа, която може да се използва, за контрол на


несъответствия в конвертирания текст. Има и настройка на софтуера за директно
четене от скенер.

Точно както Microsoft OneNote, Simple OCR не поддържа таблици и колони.


5.Free/ Безплатен OCR

Този свободен OCR софтуер използва Tesseract


Engine, който е създаден от HP и вече се поддържа от
Google.

Tesseract е много мощно средство и се казва, че


е един от най-точните OCR софтуери в света днес.
Важно е да се отбележи,че обработва PDF формати
много добре и има поддръжка за TWAIN устройства като цифрови фотоапарати и
скенери за изображения.

В допълнение, той поддържа почти всички известни файлове с изображения и


многостранични TIFF файлове. Също, софтуерът предлага опцията за извличане на
текст от картини и го прави с много висока степен на точност.

За съжаление ,както и другите Free OCR софтуер и Free OCR - не поддържа


изходни таблици и колони.

6. Безплатен OCR за Boxoft (безплатно)

Това е друг удобен инструмент, който може да се използва


за извличане на текст от всички видове изображения. Безплатна
програма е лесна за използване и е в състояние да анализира
многоколонния текст с висока степен на точност.

Поддържа множество езици, включително английски,


испански, италиански, холандски, немски, френски, португалски, баски и много други.
Също така, позволява сканиране на хартиени документи и конвертиране в текстове за
редактиране в рамките на много кратко време.

Въпреки че съществуват опасения, че този OCR не се отличава с извличане на


текст от ръкописни бележки, той се справя изключително добре с печатни копия.
7. ABBYY FineReader онлайн (безплатно)

FineReader онлайн поддържа много входни файлови


формати като PDF, JPEG, JPG, PNG, DCX, PCX, TIFF, TIF и BMP, а
поддържаните изходни файлове включват PDF, Word, Excel, e-Pub
и Powerpoint.

Безплатната версия позволява конвертиране до 10 страници на месец и не


изисква първоначална регистрация, която също е безплатна. Въпреки това, един
редовен потребител, който конвертира тежки файлове с повече страници на месец, е
длъжен да се абонира за платената версия.

Заключение

Резултатът от използването на OCR софтуер е по-лесна стратегия за управление


на документи и възможност за използване и на облачно съхранение или
специализирани доставчици на хранилище за облачни документи, за да се архивира
важна документация по по-достъпен и лесно извличащ се начин.

Използвани източници: https://bg.node-tricks.com/8-best-ocr-software

You might also like