You are on page 1of 17

НАЦІОНАЛЬНА АКАДЕМІЯ СЛУЖБИ БЕЗПЕКИ УКРАЇНИ

НАВЧАЛЬНО-НАУКОВИЙ ІНСТИТУТ ІНФОРМАЦІЙНОЇ БЕЗПЕКИ


ТА СТРАТЕГІЧНИХ КОМУНІКАЦІЙ
Центр кібербезпеки
Кафедра технічного захисту інформації

ЗАТВЕРДЖУЮ
Завідувач кафедри ТЗІ
центру кібербезпеки ННІ ІБСК
НА СБ України
кандидат фізико-математичних наук
Олена КОБУС
«____» _________________ 2023 р.

ПЛАН ТА МЕТОДИЧНІ ВКАЗИВКИ


ПРОВЕДЕННЯ ПРАКТИЧНОГО ЗАНЯТТЯ
з навчальної Інформаційні технології
дисципліни
тема № 4 Технології автоматизації оброблення документів
заняття № 09 Сканування зображень і розпізнавання документів
цільова категорія для потоків підготовки
256.04 Національна безпека (кіберзахист, забезпечення
державної безпеки в інформаційній сфері)
256.05 Національна безпека (забезпечення національної
безпеки в інформаційній сфері та кіберпросторі)
бакалавр
денна, 4 роки
навчальний час 2 год
текст підготував доцент СК-31 кандидат технічних наук, доцент Козюра В.Д.

ухвалено на засіданні кафедри від «___» _______ 2023 р., протокол № ______

КИЇВ – 2023
ЗМІСТ ТА СТРУКТУРА ПРОВЕДЕННЯ ЗАНЯТТЯ
І. Мета практичного заняття

Вивчення основних принципів сканування даних. Освоєння прийомів роботи із


програмою ABBYY FineReader.

ІІ. Міжпредметні та міждисциплінарні зв’язки

Забезпечуючі дисципліни: Забезпечувані дисципліни:


 Інформатика в рамках шкільного курсу  Вища математика
 Фізика в рамках шкільного курсу  Алгоритмізація та основи
 Англійська мова в рамках шкільного програмування
курсу  Теорія ймовірностей та математична
статистика
 Фізичні основи захисту інформації
 Теорія інформації та кодування
 Технології програмування
 Операційні системи і віртуалізація
 Web – програмуванн
 Програмні засоби захисту
інформації
 Безпека інформації в інформаційно-
комунікаційних системах
 Кіберзахист інформаційних ресурсів
 Комплексні системи захисту
інформації

IІІ. Навчально-методичне забезпечення заняття


– комп’ютерні класи;
– електронна версія лабораторного заняття;
– навчальні підручники та посібники.

IV. План практичного заняття


Вступ 5 хв.
1. Підготовка сканера до роботи. Налаштування програми FineReader 20 хв.
2. Швидкий старт 20 хв.
3. Ручна сегментація зображень 20 хв.
4. Перетворення зображень в текстовий документ 20 хв.
Висновки 5 хв.

V. Рекомендована література

1. Баженов В.А. Інформатика. Комп’ютерна техніка. Комп’ютерні технології:


підручник / В.А.Баженов, П.С.Венгерський, В.С.Гарвона, В.М.Горлач. – 4-тє вид. – К. :
Каравела, 2012. – 496 с.
2. Блавацька Н.М. Інформатика. Практичні та лабораторні роботи. В 7 частинах / Н.М.
Блавацька, В.Д. Козюра , І.В. Коркач , Н.Г. Юрх, під ред. В.Д. Козюри. – К.: Вид-во НА СБ
України, 2013. – Частина 4. Програмні засоби автоматизації обробки документів. – 101 с.
3. Козюра В.Д. Інформатика та комп’ютерна техніка: Ч. ІІ Спеціальна інформатика:
курс лекцій / В.Д.Козюра. – Киів: Нац. акад. СБУ, 2019. – Т.1. – 288 с.
2
Перетворення друкованої продукції в електронні документи здійснюється за
допомогою сканерів і програм оптичного розпізнавання.
Зміст роботи:
1. Підготовка сканера до роботи. Налаштування програми FineReader.
2. Швидкий старт.
3. Ручна сегментація зображень.
4. Перетворення зображень у текстовий документ.
Мета практичної роботи:
 вивчення основних принципів сканування даних;
 освоєння прийомів роботи із програмою ABBYY FineReader.
Вимоги до звіту:
Звіт повинен містити назву практичного заняття, мету роботи, назви завдань, що
відпрацьовуються, результати виконання кожного пункту завдання, висновки. Файли
виконаних завдань, збережіть в особистій папці на жорсткому диску.

1. Підготовка сканера до роботи. Налаштування програми


FineReader
Планшетний сканер являє собою пристрій, що призначений для перетворення
візуального образу паперового документа в графічний файл, який зберігає растрове
зображення вихідного документа. Він передається в комп'ютер для наступної обробки
(розпізнавання, редагування тощо).
Для роботи зі сканером необхідно виконати наступні операції:
 підключити сканер до системного блоку комп'ютера – для цього USB-кабель сканера
вставити в USB-порт системного блоку;
 встановити необхідний драйвер;
 налаштувати сканер (методика налаштування залежить від конкретної моделі
сканера, з якої можна ознайомитися в технічній інструкції з експлуатації).
ЗАВДАННЯ № 1. Вивчення інтерфейсу і налаштування програми FineReader
1. Запустіть програму FineReader.
2. Вивчити призначення основних елементів інтерфейсу програми FineReader і
настроїти інтерфейс під роботу.
3. Налаштуйте параметри сканування.
ТЕХНОЛОГІЯ РОБОТИ

1. Для запуску програми FineReader виконайте команди  

 .

Для швидкого запуску програми розмістите її ярлик на робочому столі.


2. Під час запуску програми ABBYY FineReader відкривається головне вікно
програми, а також діалог (рис. 1), призначений для виконання вбудованих
завдань і завдань користувача одним натисненням кнопки.

3
1. Виберіть закладку з 2. Виберіть мови 3. Виберіть колірний
потрібним завданням розпізнування режим

5. Натисніть кнопку 4. Виберіть


потрібного завдання налаштування
завдання

Рис. 1. Діалогове вікно Завдання і послідовність дій в нім


Призначення елементів вікна Завдання:
 закладки (у вигляді посилань):
 Основні – містить найбільш часто використовувані вбудовані завдання
програми ABBYY FineReader;
 Microsoft Word – завдання конвертації в документ Microsoft Word;
 Microsoft Excel – завдання конвертації в електронні таблиці Microsoft Excel;
 Adobe PDF – завдання конвертації в PDF-документ;
 Інші – завдання конвертації в інші формати;
 Мої завдання – можна створити свої, призначені для користувача завдання.
 кнопки, що визначають конкретне завдання у рамках вибраної закладки;
 випадний список Мова документа, у якому вибирається мова або група мов для
розпізнавання;
 випадний список Кольоровий для вибору колірного режиму:
 Кольоровий – колірне оформлення документу не зміниться;
 Чорно-білий – сторінки документу будуть чорно-білими, що дозволить
зменшити розмір документу FineReader (в цьому режимі вимагається менше
часу на обробку документу).
 панель Параметри збереження – дозволяє задати додаткові параметри для завдань
конвертації в документ Microsoft Word, Microsoft Excel або PDF;
 посилання Довідка – открывает справку на разделе Швидкий старт.

4
3. Відкрийте цю довідку, випишіть в зошит основні етапи сканування і розпізнавання
документів, після чого відключите прапорець і натисніть кнопку
.
4. У головному вікні програми відображається поточний відкритий документ
FineReader (рис. 2).
Головна панель
Вікно Сторінки Меню Панель швидкого доступу інструментів

Вікно Зображення Вікно Текст

Рядок стану Вікно Великий


план

Рис. 2. Головне вікно програми ABBYY FineReader


 У вікні Сторінки відображаються сторінки, що входять у документ FineReader.
Можливі два режими відображення сторінок: піктограми або таблиця зі стовпцями
відомостей про сторінки документа. Режим можна змінювати з контекстного меню цього
вікна, з меню Вигляд, з діалогу Налаштування (меню Сервіс  Налаштування…).
 У вікні Зображення відображається зображення поточної сторінки. Це вікно
дозволяє редагувати зони на зображенні, зображення сторінок, властивості тексту.
 У вікні Текст відображається розпізнаний текст. У ньому можна перевіряти
орфографію, форматувати й редагувати текст, отриманий у результаті розпізнавання.
 У вікні Крупний план відображається збільшене зображення рядка, що редагується,
або ділянки зображення, яка обробляється. Якщо у вікні Зображення ви бачите загальний
вигляд сторінки, то у вікні Крупний план зручно переглянути зображення докладніше,
скоригувати тип і положення зон або порівняти невпевнено розпізнаний символ із його
збільшеним зображенням. Масштаб зображення у вікні Крупний план регулюється за
допомогою панелі , розміщеної у нижній частині цього вікна.
5
5. Клавіші переключення між вікнами:
 для переключення між вікнами натисніть Ctrl+Tab;
 щоб активувати вікно Сторінки, натисніть Alt+1;
 щоб активувати вікно Зображення, натисніть Alt+2;
 щоб активувати вікно Текст, натисніть Alt+3.
6. У головному вікні програми ABBYY FineReader є декілька панелей інструментів.
Кнопки на панелях – зручний засіб доступу до команд програми.
 Головна – головна панель інструментів, що містить фіксований набір кнопок, які
дозволяють виконати всі основні дії: відкрити документ, відсканувати сторінку, відкрити
зображення, розпізнати сторінки, зберегти результати тощо.

 Швидкий доступ – панель швидкого доступу, вміст якої ви можете налаштувати,


додавши на неї кнопки для виконання майже будь-якої команди головного меню. Стандартно
ця панель не відображається в головному вікні. Щоб її відобразити, виберіть пункт
Швидкий доступ в меню Вигляд  Панелі інструментів або в контекстному меню
головної панелі інструментів.

 Панелі інструментів вікон Сторінки, Зображення, Текст знаходяться в лівій та


верхній частинах цих вікон.

 Панель попереджень – панель, на якій відображаються попередження і


повідомлення про помилки, які виникають у процесі роботи програми.

Помилки та попередження відображаються для сторінки, виділеної у вікні Сторінки.


Ви можете прогортати повідомлення за допомогою кнопок / .
7. Використовуючи команди меню , налаштуйте інтерфейс програми:
  , ;
  ;
  , ,

  ;
6
 .
8. Можна тимчасово приховати вікна, які не використовуються. Щоб
приховати/відобразити вікна, скористайтеся гарячими клавішами:
 F5 – для вікна Сторінки;
 F6 – для вікна Зображення;
 F7 – для вікон Зображення і Текст;
 F8 – для вікна Текст;
 Ctrl+F5 – для вікна Крупний план.
9. Можна змінювати розмір вікон, переміщуючи мишею розділювачі вікон.
10. Щоб відкрити/приховати панель Властивості у вікні Зображення або Текст,
скористайтеся пунктом у контекстному меню вікна, або в нижній частині
вікна натисніть кнопку / відповідно.
11. Перейдіть в меню Сервіс і виберіть пункт або натисніть
клавіші Ctrl+Shift+O. Відкриється діалог Налаштування, за допомогою якого регулюються
параметри відкривання, сканування, розпізнавання, збереження документів у різні формати,
вигляд вікон програми, вибирається мова й тип друку вхідного документа, мова інтерфейсу
програми тощо.
Діалог має 6 закладок, на кожній із яких містяться налаштування, які стосуються тієї чи
іншої частини функціональності програми. Последовательно установите на этих вкладках
параметры, указанные на рис. 3 – 8.

Рис. 3. Закладка Документ


діалогу Налаштування

Рис. 4. Закладка Сканувати/


Відкрити діалогу
Налаштування

7
Рис. 5. Закладка Розпізнати
діалогу Налаштування

Рис. 6. Закладка Зберегти


діалогу Налаштування

Рис. 7. Закладка Вигляд діалогу


Налаштування

8
Рис. 8. Закладка Додаткові
діалогу Налаштування

12. Після установки усіх вказаних параметрів, натисніть кнопку .


Щоб зміни мови інтерфейсу програми набули чинності, закрийте програму ABBYY
FineReader клацанням миші на значку в правому верхньому кутку вікна або виконаєте
команду меню Файл  Вихід. Після цього знову запустите програму.
Сформулюйте короткі висновки про виконану роботу і запишіть їх у файл Звіт ПЗ-09\
Завдання1.docх.

2. Швидкий старт
Процес обробки документів за допомогою ABBYY FineReader складається з чотирьох
етапів:
1) отримання зображення;
2) розпізнавання документу;
3) перевірка і редагування отриманого тексту;
4) збереження результатів розпізнавання.
Частенько цей процес складається з однієї і тієї ж послідовності дій, наприклад,
сканування, розпізнавання і збереження розпізнаного тексту в певному форматі. Для
виконання найбільш поширених завдань в програмі передбачені вбудовані завдання, що
дозволяють отримати розпізнаний текст одним натисненням кнопки.
Запуск вбудованих завдань здійснюється з вікна Завдання (див. рис. 1), яке за
умовчанням відкривається при старті додатка. Якщо вікно Завдання закрито, натисніть на

головної панелі інструментів програми кнопку .


ЗАВДАННЯ № 2. Швидке введення і розпізнавання документу
1. За допомогою інструментів вбудованих завдань відкрийте заздалегідь відскановане
зображення й проведіть його розпізнавання.
ТЕХНОЛОГІЯ РОБОТИ

1. На головної панелі інструментів натисніть кнопку .


9
2. В окне :
 у випадному списку Мова документа виберіть мову ;
 у випадному списку Кольоровий виберіть режим ;
 виберіть закладку ;

 клацніть мишею на завданні .


3. Відкриється діалог (рис. 9), в якому знайдіть файли D1.tif, D2.tif,

D3.tif (папка Файли ПЗ-09), виділите їх і натисніть кнопку .

Рис. 9. Діалог Відкрити зображення


4. Почнеться процес обробки відсканованих зображень, який закінчиться передачею
розпізнаних сторінок в документ MS Word. Переконаєтеся в тому, що отримані задовільні
результати розпізнавання, при цьому збережені практично усі параметри тексту, присутні на
оригіналі.
5. Результати розпізнавання збережить в особистій папці Звіт ПЗ-09\Завдання2.docх.

3. Ручна сегментація зображень


Розглянутий спосіб введення документів можна застосовувати, по-перше, при високій
якості сканування, по-друге, при високій якості паперового оригіналу, і, по-третє, коли
необхідно ввести всі елементи зображення (текст, картинки, таблиці тощо). Як правило, ці
умови не виконуються і тому частійше виконується ручне виділення елементів
розпізнавання, що має назву сегментація.
Сегментація – це процес виділення в зображенні відскановоної сторінки блоків
певного типу: текстових, табличних, графічних (малюнків), штрих-кодів і нерозпізнаних.
Подальшому розпізнаванню піддаються тільки блоки тексту та таблиці. Природний порядок
розпізнавання – по рядках, розташованим на сторінці зверху вниз і наступних від лівого
краю аркуша до правого. Якщо сторінка, що сканується, містить колонки, ілюстрації,
підписи рисунків та таблиці, то порядок розпізнавання вимагає корекції.
10
Зміст сторінки розбивається на блоки, усередині кожного з яких розпізнавання
здійснюється в природному порядку.
ЗАВДАННЯ № 3. Ручна сегментація сторінок
1. Виділить в зображеннях текстові блоки, рисунки та таблиці.
ТЕХНОЛОГІЯ РОБОТИ
1. Перейдіть в меню Сервіс і виберіть пункт або натисніть клавіші
Ctrl+Shift+O. У діалозі Налаштування відкрийте закладку і встановите
параметри, приведені на рис. 10. Після цього натисніть кнопку .

Рис. 10. Закладка Сканувати/Відкрити діалогу Налаштування

2. Натисніть кнопку і в діалозі , що відкрився, (див. рис. 9)


знайдіть файли 1.bmp, 2.bmp, 3.bmp (папка Файли ПЗ-09); виділите їх і натисніть кнопку

У вікні Сторінки з'являться піктограми завантажених сторінок, а у вікні


Зображення відобразиться зображення першої сторінки.
3. Якщо відскановане зображення «лежить на боці», перевернено «нагору ногами», має
дзеркальне відбиття і т.п., то треба його розгорнути в нормальне положення,
використовуючи команди меню   і тому подібне)
(рис. 11).

Рис. 11. Меню Повернути


4. Зображення сторінки може бути відредаговане. Для цього виконаєте команди меню
 . Відкриється вікно (рис. 12), в
якому можна внести різні виправлення до зображення з метою наступного поліпшення
результатів розпізнавання. Після внесення виправлень натисніть кнопку
.

11
Рис. 12. Вікно редактора зображень

5. Виділить на завантажених сторінках текстові блоки. Для цього:


 натисніть кнопку Виділити зону Текст на панелі вікна ;
 підведіть вказівник миші до верхнього лівого кута блоку, що виділяється, натисніть
ліву кнопку миші і, не відпускаючи її, переместіть вказівник у протилежний кут;
виділений блок буде обведений зеленою рамкою (рис. 13).
6. Аналогічно виділить рисунки і таблиці (для виділення малюнку потрібно натиснути
кнопку Виділити зону Зображення , а для виділення таблиці – кнопку Виділити зону
Таблиця ). Виділені картинки окреслюються червоною рамкою, а таблиці – синьою (див.
рис. 13).

12
Зона типу Зображення

Зона типу Текст

Зона типу Таблиця

Якщо клацнути на активній зоні


правою кнопкою миші, то з'являється
контекстне меню, в якому можна
вручну вибрати тип зони

Рис. 13. Результат відсканованої сторінки


7. Різні типи блоків обробляються програмою по-різному. Щоб змінити тип блоку,
наведіть вказівник миші на цей блок, клацніть правою кнопкою миші і призначте новий тип
за допомогою команди Змінити тип зони в контекстному меню.
8. Найбільшу складність для сегментації становлять непрямокутні багаторядкові
таблиці без роздільників. Тому їх найкраще сегментувати вручну таким чином:
 виділить у вікні таблицю і клацніть на ній правою кнопкою миші;
 у контекстному меню виберіть команду ;
 якщо в таблиці не вистачає вертикальних або горизонтальних ліній-роздільників, або
з'явилися зайві роздільники комірок, то скористайтеся кнопками панелі Швідкий
доступ:
- Додати вертикальну лінію;
- Додати горизонтальну лінію;
- Видалити лінію.
9. Можна об'єднувати або розділяти елементи таблиці, використовуючи кнопками
панелі Швідкий доступ:
- Об’єднати рядки таблиці;
- Об’єднати клітинки;
- Розбити клітинки.
10. У ручному режимі здійсніть сегментацію завантажених сторінок 1.bmp, 2.bmp,
3.bmp.

13
11. Збережете результати роботи, виконавши команди 
. У діалозі , що відкрився, знайдіть папку
Звіт ПЗ-09, в полі введіть Завдання3 і натисніть кнопку .

4. Перетворення зображень в текстовий документ


Розпізнавання полягає в перетворенні відсканованого зображення, в якому на етапі
сегментації виділені текстові і табличні блоки, в текст. Процес розпізнавання повністю
автоматизований, проте перед його початком потрібно виконати ряд підготовчих операцій.
ЗАВДАННЯ № 4. Розпізнавання виділених фрагментів
1. Розпізнайте раніше виділені об'єкти, перевірте орфографію і збережіть результати у
вигляді текстового файлу.
ТЕХНОЛОГІЯ РОБОТИ
1. У випадному списку панелі Головна виберіть необхідну мову, на якій
представлений вихідний документ. Якщо в документі використовуються декілька мов, то
виберіть усі необхідні мови, використовуючи пункт Інши мови … цього списку (для цього
завдання виберіть мови ).
2. Після того, як виконані попередні дії, перейдіть до розпізнавання, для чого клацніть

на кнопці . Коли розпізнавання сторінок завершується, отриманий документ


відображається у вікні Текст. Завершальні етапи роботи дозволяють відредагувати
отриманий текст за допомогою кнопок цього вікна. Процес редагування багато в чому
нагадує роботу з текстовим процесором MS Word.
3. Проведіть перевірку орфографії з урахуванням можливих помилок у вихідному
документі і невпевнено розпізнаних символів. Для цього клацніть на кнопці .
4. У діалозі Перевірка, що з'явилося, відобразиться помилка, а у вікні Текст
помилкове слово буде виділено.
Натисканням кнопок у вікні Перевірка можна виконати наступні дії:
 – залишити слово як є;
 – залишити усі такі слова в тексті як є;
 і – вибрати в запропонованому списку варіант заміни і
замінить поточне слово і усі такі слова в тексті;
 – додавання слова в словник.
Після закінчення перевірки натисніть кнопку .

14
Рис. 14. Діалог Перевірка

5. У випадному підміню встановите параметри, як вказано на


рис. 15 і виберіть режим .

Рис. 15. Підміню Оформлення документа

6. Клацніть на стрілці кнопки і у випадному підміню виберіть команду


(рис. 16). Вказане підміню дозволяє або відразу зберегти результат
розпізнавання як документ в різних форматах (Word, Excel, PDF, Electronic Publication),
або передати результат у відповідний додаток з розкриттям його вікна.

15
Рис. 15. Підміню кнопки Передати
7. Результати розпізнавання, передані в MS Word, збережете в папці Звіт ПЗ-09\
Завдання4.docх.
8. Закрийте програму FineReader командами  .

Висновки
1. Підготовка програми FineReader до роботи полягає в налаштуванні інтерфейсу її
головного вікна, а також параметрів різних процесів обробки документу (сканування,
сегментації, розпізнавання, перевірки помилок і експортування).
2. При високоякісному скануванні вихідного паперового документу доцільно
використати заздалегідь підготовлені завдання, що дозволяє в автоматичному режимі
здійснити усі етапи перетворення документу.
3. При обробці документів невисокої якості краще використовувати ручний режим
виділення об'єктів розпізнавання.

Контрольні питання
1. Призначення програми FineReader і її можливості. Які вимоги до апаратно-
програмного забезпечення комп'ютера вона пред'являє?
2. Як запустити на виконання програму FineReader для розпізнавання текстів?
Визначите призначення основних елементів головного вікна програми.
3. У якій послідовності здійснюється розпізнавання документу? Поясніть призначення
основних етапів розпізнавання.
4. Налаштування параметрів сканування в програмі FineReader.
5. Порядок швидкої обробки документу в програмі FineReader.
6. Як здійснюється ручне виділення елементів розпізнавання? У чому полягає
особливість виділення таблиць?
7. Налаштування режимів розпізнавання, перевірки і збереження.

16
Завдання на самостійну роботу
1. Вивчіть матеріал лабораторного заняття.
2. Виконати усі завдання і відповісти на контрольні питання. Результати оформите у
вигляді звіту. Форма звіту наведена у файлі Форма звіту з ПЗ (ЛЗ).doc. Файл звіту під
іменем Звіт ПЗ-09–Прізвище–Логін.docх збережете у своїй папці Документи.

17

You might also like