Professional Documents
Culture Documents
ChatGPT 1
ChatGPT 1
Щоб краще зрозуміти роботу ChatGPT, варто розпочати розмову з того, як узагалі з’явився
такий інструмент. У цьому модулі ми поговоримо про великі мовні моделі. Розглянемо
напрямки їх застосування для завдань обробки природної мови. Пройдемо шляхом
розвитку від word2vec до сучасних архітектур трансформерів, на базі яких створені моделі
сімейства GPT.
Хоча розмічених даних накопичилося вже досить багато, даних без міток усе ж набагато
більше. Це зображення без підписів, аудіозаписи без коментарів, тексти без анотацій.
Завдання машини при навчанні без учителя – знайти зв'язок між окремими даними,
виявити закономірності, підібрати шаблони, упорядкувати дані або описати їх структуру,
виконати класифікацію даних.
Як людина, яка може здогадатися, яке слово чи фразу потрібно сказати наступною, так і
велика мовна модель може прогнозувати наступні слова, таким чином створюючи
зв’язний та логічний текст.
Попри те, що сфера обробки природної мови існує вже не одне десятиліття, справжній її
розвиток розпочався з алгоритму word2vec. Вперше запропонований 2013 року, word2vec
може перетворювати кожне слово у вхідному наборі даних на числовий вектор.
Якщо від значення слова «король» відняти значення слова «чоловік» та додати значення
слова «жінка», то вийде значення слова «королева».
Наступним кроком розвитку сфери NLP стала нейромережа LSTM (від англ. – long
short–term memory), що перекладається як довга короткочасна пам'ять. Як випливає з
назви, ця нейромережа представила так звані «одиниці пам’яті», призначені для
вивчення довготривалих залежностей.
Серед відомих великих мовних моделей періоду 2017–2020 років можемо виділити BERT
від Google, RoBERTa від Meta, MegatrobLM від NVIDIA, T-NLG від Microsoft та моделі GPT-1,
GPT-2 від OpenAI. Найкраща модель того часу – T-NLG від Microsoft – мала «всього» 17
мільярдів параметрів. Для порівняння – GPT-3 від OpenAI складається з175 млрд
параметрів.
Таким чином усього за неповних 10 років великі мовні моделі пройшли значний шлях
розвитку.
Cаме OpenAI зробила справжній прорив, створивши сімейство моделей GPT, про які ми
поговоримо далі.