You are on page 1of 22

КОМП”ЮТЕРНА ЛІНГВІСТИКА

ПРИКЛАДНА ЛІНГВІСТИКА =
КОМП”ЮТЕРНА ЛІНГВІСТИКА
Вузьке трактування терміна Широке трактування терміна
•В СРСР термін прикладна лінгвістика став •Ототожнення цих дисциплін не цілком
широко вживатися в 50-і рр. в зв'язку з вдале, оскільки кожна з них має свій
розробкою комп'ютерних технологій і предмет і методи роботи в рамках
появою систем автоматичної обробки прикладної лінгвістики як більш широкого
інформації. Саме тому в російськомовній напрямку.
літературі замість терміна прикладна • В. А. Звегинцев, «під прикладною
лінгвістика в тому ж значенні часто лінгвістикою найчастіше розуміють всі види
використовуються терміни «комп'ютерна автоматичної обробки мовної інформації
лінгвістика», «обчислювальна лінгвістика», (Language-data Processing) - машинне
«автоматична лінгвістика», «інженерна розпізнавання усного мовлення, машинний
лінгвістика»; переклад, автоматичну класифікацію
•У західній лінгвістиці термін прикладна технічних та інших документів, автоматичне
лінгвістика (applied linguistics, angewandte анотування текстів, автоматичне кодування
Linguistik) зв'язується насамперед з та ін. і дійсно, автоматична обробка мовної
викладанням іноземних мов, включаючи інформації становить у наш час основну
методику викладання, особливості опису дослідницьку проблематику прикладної
граматики для навчальних цілей, лінгвістики (...). Але все ж було б
викладання мови як рідної та іноземної. неправильно замикати прикладну
лінгвістику в межах цієї проблематики»
[Звегинцев 1968, с. 24].
ФУНКЦІОНАЛЬНА КОНЦЕПЦІЯ ПРИКЛАДНОЇ
(комп”ютерної) ЛІНГВІСТИКИ
• Найбільш вдалим вважається визначення прикладної лінгвістики і
переліку розв'язуваних нею завдань, зроблене Олександром
Євгеновичем Кібріком.
• На думку автора, «прикладна лінгвістика - розділ мовознавства, в
якому розробляються методи вирішення практичних завдань,
пов'язаних з оптимізацією використання мови як найважливішого
засобу людської комунікації».
• Велика кількість завдань, що вирішуються прикладною лінгвістикою,
виділяються з опорою на ті функції мови, які оптимізуються
завданнями прикладної лінгвістики.
• Чотири функції:
• 1) оптимізація способів фіксації і зберігання мовної інформації;
• 2) оптимізація способів передачі інформації;
• 3) оптимізація інтелектуальних здібностей людини, пов'язаних з
використанням мови;
• 4) оптимізація використання мови як засобу масової комунікації.
Термін “комп’ютерна лінгвістика” у
трактуванні лінгвістів
Городецкий Б.Ю. Компьютерная лингвистика:
моделирование языкового Баранов А.Н. Введение в прикладную
общения лингвистику. – М., 2001. - С.13.
“Термін “комп’ютерна “Під терміном “комп’ютерна
лінгвістика (computational
лінгвістика” задає загальну linguistics) звичайно розуміють
орієнтацію на використання широку царину використання
комп’ютерів для комп’ютерних інструментів –
програм, комп’ютерних
розв’язання різноманітних технологій організації та
наукових та практичних оброблення даних – для
моделювання функціонування
завдань, пов'язаних з мови в тих чи інших умовах,
мовою, аж ніяк не ситуаціях, проблемних галузях,
обмежуючи способи а також сферу застосування
комп’ютерних моделей мови
розв’язання цих завдань” не лише в лінгвістиці, а й у
суміжних з нею дисциплінах”
Об’єкт дослідження КЛ становить
Об’єкт мова в усіх трьох способах свого
дослідження КЛ існування:
Об’єктом • мовна система – сукупність
певних одиниць з властивими
розв’язання їм формальними, змістовими та
конкретних завдань у функціональними
межах КЛ властивостями;
може бути кожен зі • мовлення – різноманітні
складників відомої продукти реалізації мовної
системи в певних умовах та
тріади Ф.де Сосюра : ситуаціях комунікації;
– langue “мова” • мовна діяльність – процес
– parole “мовлення” використання мовної системи
– langage “мовна й створення продуктів такого
діяльність” застосування мови в тих чи інших
умовах комунікації.
Передумовою будь-якого
Предмет комп’ютерного моделювання є
дослідження КЛ формалізація мовного
Предмет дослідження КЛ –
матеріалу, тобто пошук
ознаки будови, змісту та засобів формального,
функціонування одиниць унаочненого, приступного
мовної системи, продуктів сприйняттю комп’ютера
мовлення та мовної представлення
діяльності – звукових або
письмових текстів, які могли
досліджуваного мовного
б служити для їхнього об’єкта – одиниці мови або
моделювання й процесу з її участю. Такими
використання в процесах формальними ознаками
комп’ютерного будови мовних об’єктів
опрацювання можуть служити кількісні,
мовної інформації сполучувальні (комбінаторні) й
позиційні характеристики їхніх
складників.
Аспект, в якому КЛ вивчає мову, і застосовуваний нею
інструмент такого вивчення – комп’ютер – і вирізняють її
з-поміж інших лінгвістичних дисциплін, формують
особливий погляд на мову як об’єкт дослідження. Від
традиційної, некомп’ютерної, лінгвістики КЛ відрізняє
особливий спосіб вивчення об’єкта за допомогою
комп’ютера. Він зумовлює необхідність розроблення
методів та прийомів аналізу й синтезу мовних фактів,
відмінних від традиційних.
Врахування комплексного характеру предмета дослідження
КЛ, специфіки використання в її дослідженнях
особливого технічного засобу дає підстави
сформулювати таке її визначення:
Комп’ютерна лінгвістика – самостійна лінгвістична
дисципліна, яка розв’язує теоретичні й прикладні
завдання мовознавства за допомогою комп’ютера
Застосування нового дослідницького
ХАРАКТЕР КЛ ЯК інструмента – комп’ютера – дає змогу
ЛІНГВІСТИЧНОЇ на якісно новій фактичній основі, за
ДИСЦИПЛІНИ допомогою нових дослідницьких
Комп’ютерна лінгвістика є методів та прийомів аналізу й синтезу
мовних фактів розв’язувати
водночас дисципліною теоретичні завдання сучасного
•теоретичною, мовознавства, одержувати відомості
•фундаментальною про будову та функціонування мовних
об’єктів, які уможливлюють зміни в
• практичною, прикладною. самій парадигмі знання про мову,
оскільки дозволяють не лише по-
іншому розв’язувати старі, а й ставити
нові лінгвістичні завдання.
Використання спеціального технічного
засобу і підпорядкованих йому
прийомів та процедур моделювання
мовних об’єктів ставить КЛ в ряд
інших прикладних лінгвістичних
дисциплін
СТРУКТУРНА ТА МАТЕМАТИЧНА
ЛІНГВІСТИКА – ТЕОРЕТИЧНА БАЗА КЛ
У певному сенсі КЛ можна вважати
спадкоємицею саме тих галузей лінгвістики,
які у своїх дослідженнях оперували
формально-логічними та математичними
методами, а також тих напрацювань у
моделюванні й аналізі мовних об’єктів та
мовленнєвих процесів, які накопичили
структурна та математична лінгвістика.
Термін “комп’ютерна лінгвістика” у
загальнонауковому трактуванні
Комп'ютерна лінгвістика (КЛ) – міждисциплінарна
галузь, яка виникла на стику таких наук, як:
• лінгвістика,
• математика,
• інформатика (Computer Science),
• штучний інтелект (Artificial Intelligence).
У своєму розвитку вона до сих пір вбирає і застосовує
(за необхідності адаптуючи) розроблені в цих
науках методи та інструменти.
• Інформа́тика —
теоретична та прикладна (технічна,
технологічна) дисципліна, що вивчає
ІНФОРМАТИКА структуру і загальні
властивості інформації, а також
Інформація – це сукупність методи і (технічні) засоби її створення,
символів, або образів, що перетворення, зберігання, передачі та
несуть змістове використання в різних галузях
людської діяльності.
навантаження.
• Основне теоретичне завдання
Оскільки інформація у інформатики полягає у визначенні
мовній формі, тобто загальних закономірностей,
оформлена засобами як відповідно до яких
створюється інформація, відбувається
природних, так і штучних її перетворення, передавання та
мов, посідає в сучасних використання у різних сферах
інформаційних потоках діяльності людини.
чільне місце, лінгвістика • Прикладні завдання інформатики
активно залучена до полягають у розробці
найефективніших методів і засобів
створення засобів її здійснення інформаційних процесів,
опрацювання, передусім – зокрема передачі інформації
за допомогою комп'ютера. комп”ютерними засобами
Типи інформації в
лінгвосеміотичній теорії
А.О.Білецького
ОЗНАКИ МОВНОЇ
ІНФОРМАЦІЇ:
•антропогенна (створена
людиною)
•кодована (закріплена у
спеціальній формі)
•екстраситуаційна
(незалежна від конкретної
ситуації спілкування ????)
•вербальна (представлена у
словесній формі)
•логічна,
•естетична,
•побутова,
•спеціальна
Функції мови як спеціалізованої системи
обміну інформацією за А.О.Білецьким
1. Трансформаційна (від лат. transformo “перетворюю, змінюю форму”) –
перетворення інформації;
2. Консервативна (від лат. cōnservo “зберігаю”) – зберігання інформації;
3. Транслятивна (від лат. trānslātio ”перенос, переміщення”) – передавання
інформації;
4. Дименсійна (від лат. dīmēnsio “вимірювання, розмір”) – вимірювання
інформації;
5. Утилітарна (від лат. ūtilitās “користь, придатність”) – використання
інформації;
6. Естетична (від грецьк. αỉσθητικός ”чуттєво сприйманий”) – вибір для
оформлення та передавання інформації засобів, оптимальних для її
сприйняття;
7. Метасемантична (від грецьк. μετα ”зверх, понад” та σημαντικός
”означальний”) – відображення в оформленні інформації додаткового
змісту, який впливає на відчуття людини, стимулює в неї певні реакції на
інформацію (пор., наприклад, різні способи оформлення прохання: наказ,
уклінне прохання, дружнє спонукання до дії, нейтральний заклик, побажання
тощо).
Завдання комп’ютерної лінгвістики у проекції на інші лінгвістичні дисципліни
Завдання (прикладні задачі) комп’ютерної лінгвістики
у проекції на нелінгвістичні дисципліни
• Науковий напрям, в рамках якого
ШТУЧНИЙ ставляться і вирішуються завдання
апаратного або програмного
ІНТЕЛЕКТ моделювання тих видів людської
діяльності, які традиційно вважаються
Найтісніше комп'ютерна інтелектуальними
лінгвістика пов'язана із • Властивість інтелектуальних систем
галуззю штучного інтелекту , в виконувати функції (творчі), які
якій розробляються програмні традиційно вважаються прерогативою
моделі окремих людини. Структура інтелектуальної
інтелектуальних функцій. системи включає три основні блоки - базу
Оскільки володіння мовою знань, вирішувач та інтелектуальний
належить до інтелектуальних
інтерфейс, що дозволяє вести спілкування
з ЕОМ без спеціальних програм для
функцій, перетин цих наук введення даних
очевидний, але ШІ не
• Наука «Штучний інтелект» входить в
поглинає всю КЛ, оскільки комплекс комп'ютерних наук, а
вона має свою теоретичну створювані на її основі технології до
базу і методологію. Загальним інформаційних технологій. Завданням цієї
для цих наук є комп'ютерне науки є відтворення за допомогою
моделювання як основний обчислювальних систем та інших штучних
метод і кінцева мета. пристроїв розумних міркувань і дій
Для чого людству ШІ?
Людський мозок надзвичайно швидко обробляє
інформацію, але сьогодні людських здібностей
недостатньо, адже суспільство переповнене інформацією:
● доводиться мати справу з величезними обсягами даних
● дані надходять з багатьох джерел одночасно
● дані не структуровані й надходять хаотично
● дані постійно змінюються, а отже, і знання на основі
цих даних повинні постійно оновлюватися
● обробка даних і реакція на них повинні відбуватися в
реальному часі та з високою точністю
Людина не може справитися з усіма цими факторами, але
ми можемо створити системи, які зможуть, – системи ШІ.
Загальні сфери застосування ШІ
● комп’ютерний зір (візуальне
розпізнавання предметів, істот, символів)
● обробка природної мови
● розпізнавання мовлення
● експертні системи (визначення медичного
діагнозу, передбачення результатів
маркетингової кампанії)
● робототехніка
NLP - Natural • Автоматичне оброблення
Language природної мови (Natural
Processing Language Processing, NLP) -
ОСНОВНІ ЗАВДАННЯ:
загальний напрям штучного
•розпізнавання усного мовлення інтелекту і математичної
•синтез усного мовлення лінгвістики, який вивчає
•аналіз тексту проблеми комп'ютерного
•вилучення інформації аналізу і синтезу природних
•інформаційний пошук мов. Стосовно штучного
•аналіз висловлювань інтелекту аналіз означає
•аналіз тональності тексту розуміння мови, а синтез -
•діалогові системи генерацію грамотного тексту.
•генерування тексту Вирішення цих проблем буде
•машинний переклад означати створення більш
•автоматичне реферування та зручної форми взаємодії
анотування комп'ютера і людини.
Карен Спарк
Джонс Відома британська вчена, яка займалася
інтеграцією інформатики та NLP в основні
блок-схеми штучного інтелекту. Її
найбільш важливим внеском є створення
концепції обліку ваги слів зворотної
частоти документа (IDF), яку вона
описала в статті в 1972 році. На
сьогоднішній день IDF використовується в
багатьох пошукових системах, зазвичай, у
складі схеми TF-IDF.

Карен Спарк Джонс визначає 4 етапи


розвитку АОПМ
• 1) кінець 1940-х - кінець 1960-х. Робота була сфокусована на
Історіямашинному
розвитку перекладі.
АОПМ Теоретична основа – роботи Н.Хомського у
галузі формалізації структури природної мови. Першим
прикладом машинного перекладу, який був представлений на
Джорджтаунському експерименті (1954 р.) був англо-російський
елементарний автоматичний переклад.
• 2) кінець 1960-х — кінець 1970-х. Робота у сфері розуміння
тексту. Першою програмою розуміння природної мови була
експертна система розроблена Террі Виноградом
в Масачусетському технологічному інституті у 1972 році. Ця
програма розуміла велику кількість англомовних слів та могла
робити певні висновки.
• 3) кінець 1970-х — кінець 1980-х. Застосування штучного інтелекту
• Террі Аллен в обробці природної мови вимагало розроблення комп̓ютерної
Виноград граматики.
американський • 4) 1990-ті. Одне з провідних місць в АОПМ займав статистичний
дослідник штучного підхід, який дозволяв тепер не просто аналізувати дані, але й
інтелекту, професор справді застосовувати цей метод для оброблення природної
комп'ютерних мови.
наук Стенфордськог • 5) 2000-ні. NLP працює завдяки глибинному навчанню (Deep
о університету, Learning) – галузі машинного навчання
член Асоціації з
обчислювальної
техніки(2009)
Завдання
• Завдання та особливий статус комп’ютерної лінгвістики у
сучасному прикладному мовознавстві.
• Кореляція термінів "прикладна лінгвістика" ↔
"комп'ютерна лінгвістика" у вітчизняному мовознавстві.
• Функціональна концепція прикладної (комп'ютерної)
лінгвістики.
• Інформація, види і представлення інформації в
інформатиці. Отримання, збереження, оброблення і • Карпіловська Є.А.
передача інформації.
• Основні завдання сучасної комп’ютерної лінгвістики
Вступ до прикладної
мовознавстві та за його межами. лінгвістики:
• Об’єкт та предмет дослідження в комп’ютерній лінгвістиці комп’ютерна
• Взаємозв'язок комп'ютерної лінгвістики з інформатикою. лінгвістика:
Типи інформації в лінгвосеміотичній теорії
А.О.Білецького. Функції мови як спеціалізованої системи Підручник.—
передачі інформації за А.О.Білецьким Донецьк: ТОВ «Юго-
• Поняття штучного інтелекту, зв’язок комп’ютерної
лінгвістики зі штучним інтелектом.
Восток, Лтд», 2006.—
• Natural Language Processing (NLP) і комп’ютерна С. 7 – 20.
лінгвістика: сучасні системи автоматичного аналізу тексту.

You might also like