You are on page 1of 9

1

УДК 004
ДОСЛІДЖЕННЯ РОЗПІЗНАВАННЯ ТА ПЕРЕТВОРЕННЯ
УКРАЇНСЬКОЇ МОВИ В ТЕКСТ ЗАСОБАМИ ШТУЧНОГО ІНТЕЛЕКТУ

Рибчак Зоряна Любомирівна,


к.т.н., асистент
Кобилюх Леслав Богдангович
Студент
Національний університет “Львівська Політехніка”
м. Львів, Україна

Анотація: У статті розглянуто важливість використання штучного


інтелекту для розпізнавання та перетворення української мови в текст. Були
розглянуті різні методи розпізнавання мови та перетворення голосу в текст з
використанням штучного інтелекту, такі як використання бібліотек та API. Була
надана таблиця з порівнянням різних методів розпізнавання мови та
перетворення голосу в текст. Також було наведено приклад коду для
використання API для розпізнавання та перетворення. На основі вищевказаного
можна зробити висновок про важливість використання штучного інтелекту для
розпізнавання та перетворення мови в текст, який може знайти застосування у
багатьох сферах діяльності, включаючи комунікацію з клієнтами, медичну та
наукову сфери, освіту, безпеку, культуру та мистецтво.
Ключові слова: штучний інтелект, розпізнавання мови, перетворення
мови в текст, українська мова, бібліотеки, API, порівняння методів, приклад
коду.

За допомогою штучного інтелекту та машинного навчання розпізнавання


української мови та перетворення мови в текст стало можливим. Ці технології
дозволяють забезпечити автоматизацію обробки мовлення, що є корисним для
багатьох різних сфер, таких як автоматизоване класифікування текстів,
машинний переклад, обробка звукового сигналу та інші.

259
Одним з методів розпізнавання української мови є використання
нейронних мереж (табл. 1)., які навчаються на великих наборах даних, щоб
розпізнавати та класифікувати тексти. Наприклад, можна використовувати
рекурентні нейронні мережі (RNN), що дозволяють аналізувати послідовності
слів та приймати рішення на основі контексту [1].
Іншим методом є використання методів обробки природної мови (NLP)
(табл. 1)., які дозволяють аналізувати та розуміти мовні конструкції. Наприклад,
можна використовувати методи побудови синтаксичного дерева, щоб
аналізувати структуру речень та зв'язки між словами [1].
Ще одним методом є використання глибокого навчання та машинного
перекладу (табл. 1)., що дозволяє перетворювати мову в текст та навпаки.
Наприклад, можна використовувати моделі перекладу, які навчаються на
великих наборах даних та здатні автоматично перетворювати тексти з однієї
мови на іншу [1].
Таблиця 1
Порівняння різних методів розпізнавання та перетворення мови
Метод Опис Переваги Недоліки
Нейронні мережі Використовуються для Добре працюють з Потребують значної
розпізнавання та послідовністю слів, кількості даних для
класифікування текстів можуть навчатися на навчання, можуть
великих наборах бути вразливими до
даних перенавчання
Обробка природної Використовуються для Добре працюють зі Можуть бути
мови аналізування та розуміння складними вразливими до
мовних конструкцій реченнями та амбігвітності та
невідомими словами невизначеності
Машинний переклад Використовуються для Добре працюють з Можуть втрачати
перетворення мови в текст перекладами точність при
та навпаки великого обсягу та перекладі складних
різними мовами фраз та ідіом

Приклади застосування цих методів включають автоматичне


класифікування текстів (наприклад, розпізнавання теми електронної пошти),
машинний переклад з іноземних мов на українську, аналіз суспільної думки з
використанням соціальних медіа та інші.
Українська мова є складною для розпізнавання через її різні діалекти та
мовленнєві особливості. Тому, розробники стикаються з викликами, які
260
пов'язані з розробкою програм, які можуть ефективно розпізнавати та
перетворювати українську мову. Однак, з використанням різних методів
штучного інтелекту, можна досягти високої точності та швидкості
розпізнавання та перетворення української мови
У підсумку, застосування штучного інтелекту для розпізнавання та
перетворення української мови стає все більш популярним.
Застосування різних методів дозволяє досягти високої точності та
швидкості при обробці української мови. Такі розробки можуть бути корисними
для різних цілей, включаючи автоматичний аналіз текстів, машинний переклад
та інші додатки.
Наприклад, прикладом успішної реалізації розпізнавання української
мови є проєкт Ukrainian Language Toolkit (UKLTK), який містить набір засобів
для обробки української мови з використанням штучного інтелекту. Цей набір
засобів включає модулі для розпізнавання мови, токенізації, стемінгу та інших
операцій [2].
Інший приклад - це компанія Lang-8, яка використовує машинне навчання
та нейронні мережі для перекладу текстів з англійської на українську та
навпаки. Їх система використовує інноваційний підхід до перекладу, що дає
більш точний результат, ніж традиційні методи машинного перекладу[2].
У сучасному світі, де кількість даних, що генеруються, зростає дуже
швидко, штучний інтелект стає все більш важливим для розпізнавання та
перетворення мови. Застосування цих методів не тільки полегшує життя людей,
а й може знайти застосування в різних галузях, включаючи науку, бізнес та
соціальні мережі. Усі ці фактори роблять розпізнавання та перетворення
української мови засобами штучного інтелекту дуже перспективним напрямком
для майбутніх досліджень та розробок. Один з можливих невеликих прикладів
коду для використання штучного інтелекту у розпізнаванні української мови та
перетворенні голосу в текст може виглядати наступним чином:
import speech_recognition as sr
# Створення об'єкту recognizer для розпізнавання мови

261
r = sr.Recognizer()
# Зчитування аудіо з мікрофону
with sr.Microphone() as source:
print("Говоріть зараз...")
audio_text = r.listen(source)
# Розпізнавання мови
try:
text = r.recognize_google(audio_text, language='uk-UA')
print('Текст:', text)
except sr.UnknownValueError:
print('Щось пішло не так!')
У цьому прикладі коду ми використовуємо бібліотеку speech_recognition,
щоб створити об'єкт recognizer, який дозволяє розпізнавати мову. Потім ми
зчитуємо аудіофайл з мовою українською та зберігаємо його у змінну audio_text.
Після цього ми використовуємо метод recognize_google для розпізнавання мови
та перетворення аудіо на текст. Якщо розпізнавання вдалося, то ми виводимо
отриманий текст на екран (Рис. 1.).

Рис. 1. Результат виконання коду


Звичайно, це лише простий приклад, але штучний інтелект може бути
використаний для складніших завдань, наприклад, для розпізнавання мови в
реальному часі або для покращення точності розпізнавання за допомогою
нейронних мереж.
Використання API для розпізнавання української мови має велику
важливість у багатьох сферах діяльності, де виникає потреба в автоматичному
аналізі та обробці тексту українською мовою[3]. Наприклад:

262
 Комунікація з клієнтами: компанії можуть використовувати API для
розробки чатботів та інших програм, які забезпечують автоматичну обробку
повідомлень від клієнтів українською мовою. Це дозволяє забезпечити швидке
та ефективне обслуговування клієнтів та знизити витрати на людські ресурси.
 Медична та наукова сфери: API для розпізнавання української мови
можуть бути використані для автоматичної обробки та аналізу текстів медичних
записів, наукових досліджень та інших документів, що забезпечує швидку та
точну обробку великих обсягів інформації.
 Освіта: API можуть бути використані для розробки програм для
автоматичного оцінювання рівня знань української мови та корекції помилок,
що дозволяє поліпшити якість навчання та оцінювання студентів.
 Безпека: API можуть бути використані для розробки систем
моніторингу та аналізу соціальних медіа, що дозволяє виявляти та аналізувати
загрози безпеці, що походять з повідомлень українською мовою.
 Культура та мистецтво: API можуть бути використані для розробки
програм для автоматичного розпізнавання та перекладу текстів та пісень
українською мовою для популяризації українського контенту.
Одним з API, який можна використовувати для розпізнавання української
мови та перетворення мови в текст є Google Cloud Speech-to-Text API. Нижче
наведений приклад коду, який можна використати для розпізнавання української
мови з використанням цього API:
import io
import os
# pip install --upgrade google-cloud-speech
from google.cloud import speech
from google.cloud.speech import enums
from google.cloud.speech import types
# Set up Google Cloud credentials
os.environ['GOOGLE_APPLICATION_CREDENTIALS'] =
'/path/to/credentials.json'

263
# Create a Google Cloud Speech-to-Text client
client = speech.SpeechClient()
# Read audio file
with io.open('path/to/audio/file', 'rb') as audio_file:
content = audio_file.read()
audio = types.RecognitionAudio(content=content)
# Configure audio settings
config = types.RecognitionConfig(
encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
language_code='uk-UA')
# Call Google Cloud Speech-to-Text API to perform speech recognition
response = client.recognize(config, audio)
# Print transcribed text
for result in response.results:
print('Transcription: {}'.format(result.alternatives[0].transcript))
Цей код використовує Google Cloud Speech-to-Text API для розпізнавання
української мови у звуковому файлі та виведення отриманого тексту на екран.
Іншим API, який можна використовувати для розпізнавання української
мови та перетворення мови в текст, є Microsoft Azure Cognitive Services Speech
API. Нижче наведений приклад коду, який можна використати для
розпізнавання української мови з використанням цього API:
import azure.cognitiveservices.speech as speechsdk
# Set up Microsoft Azure Speech API credentials
speech_key = 'YourSubscriptionKey'
service_region = 'YourServiceRegion'
# Set up a speech recognizer for Ukrainian language
speech_config = speechsdk.SpeechConfig(subscription=speech_key,
region=service_region)
speech_config.speech_recognition_language = 'uk-UA'
# Create an audio input object using an audio file

264
audio_input = speechsdk.AudioConfig(filename='path/to/audio/file')
# Create a speech recognizer object
speech_recognizer =
speechsdk.SpeechRecognizer(speech_config=speech_config,
audio_config=audio_input)
# Call the Microsoft Azure Speech API to perform speech recognition
result = speech_recognizer.recognize_once()
# Print transcribed text
print(result.text)
Цей код використовує Microsoft Azure Cognitive Services Speech API для
розпізнавання української мови у звуковому файлі та виведення отриманого
тексту на екран. Як і у попередньому прикладі, звуковий файл повинен бути
збережений на диску перед виконанням цього коду. Обидва ці API мають
деталізовану документацію та підтримують багато інших мов та мовних
налаштувань. Використання API для розпізнавання української мови є
корисним для розробки програм для автоматичного розпізнавання та
транскрибування аудіо- та відеофайлів, чатботів, перекладачів та багатьох
інших застосувань, які вимагають роботи з мовою.
Висновки: У цій статті було досліджено застосування штучного інтелекту
для розпізнавання української мови та перетворення мовлення в текст. Було
розглянуто кілька методів, включаючи використання бібліотек та API, таких як
SpeechRecognition та Google Cloud Speech-to-Text. Було зазначено, що
використання штучного інтелекту для розпізнавання мови має значну
важливість для розвитку технологій, оскільки це дозволяє людям більш
ефективно та швидко взаємодіяти з комп'ютерами та іншими пристроями.
Також було порівняно кілька методів розпізнавання мови та перетворення
мовлення в текст, зокрема, використання бібліотек та API. Було зазначено, що
використання API дозволяє отримати кращу точність розпізнавання мови,
оскільки вони використовують навчання на великих наборах даних. У
загальному, застосування штучного інтелекту для розпізнавання української

265
мови та перетворення мовлення в текст є важливим напрямком розвитку
технологій, і його застосування може забезпечити більш ефективну взаємодію
людей з комп'ютерами та іншими пристроями, зменшити час на виконання
рутинних завдань та забезпечити доступ до інформації для всіх користувачів.

СПИСОК ЛІТЕРАТУРИ
1. Robeiko V., Sazhok M. Real-time spontaneous Ukrainian speech
recognition system based on word acoustic composite models. URL:
https://pdfs.semanticscholar.org/7cf7/a97ae62ba46af0525cf5b5eb8905da4910f7.pdf
2. Boyd C. The Past, Present, and Future of Speech Recognition
Technology. URL: https://medium.com/swlh/the-past-present-and-future-of-
speechrecognition-technology-cf13c179aaf
3. Saksamudre S., Shrishrimal P., Deshmukh R. A Review on Different
Approaches for Speech Recognition System. URL:
https://pdfs.semanticscholar.org/b909/3377c6579b97ab8bd5d4dd9947d372dddc2e.pd
f
4. Matarneh R., Maksymova S., Lyashenko V., Belova N. Speech
Recognition Systems: A Comparative Review. URL:
https://pdfs.semanticscholar.org/8c3b/5bab98556f57dbc8142d5f3f8ad13109c733.pdf
5. Hannun A. Speech Recognition Is Not Solved. URL:
https://awni.github.io/speech-recognition/
6. Rabiner L. R. A tutorial on Hidden Markov models and selected
applications in speech recognition. Proceedings of the IEEE, 1989, vol.77, no. 2, pp.
257–286. Doi: 10.1109/5.18626

266

You might also like