Professional Documents
Culture Documents
Polisciuc Daniil IA-214 Lab5
Polisciuc Daniil IA-214 Lab5
A controlat:______________(asist.univ. R.Branişte )
Chişinău 2023
Оглавление
Введение...........................................................................................................................................3
1.Цель работы:.................................................................................................................................3
2.Задание..........................................................................................................................................3
Решение............................................................................................................................................4
3.Код.................................................................................................................................................4
4.Выполнение...................................................................................................................................5
Вывод.................................................................................................................................................6
Библиография................................................................................................................................7
2
Лабораторная работа
Введение
1.Цель работы:
Изучение способа разработки приложения (при желании с использованием языка
программирования), позволяющее извлекать определенные части речи из произвольного
текста.
2.Задание
Разработать приложение (при желании с использованием языка программирования),
позволяющее извлекать определенные части речи из произвольного текста. Будут выбраны 2
части речи.
3
Решение
3.Код
Код был написан на языке программирования Python для реализации в онлайн компиляторе
pythonanywhere (https://www.pythonanywhere.com ). Для разработки приложения, которое
извлекает определенные части речи из текста, мы будем использовать библиотеку Natural
Language Toolkit (NLTK) на языке Python. Для извлечения частей речи из текста мы будем
использовать функцию pos_tag из модуля nltk. Она принимает на вход список токенов (слов)
и возвращает список кортежей, каждый из которых содержит слово и его часть речи.
Функция def extract_parts_of_speech(text) принимает на вход текст, разбивает его на
предложения с помощью sent_tokenize, а затем на слова с помощью word_tokenize. Затем для
каждого слова определяется его часть речи с помощью pos_tag. Если это существительное,
оно добавляется в список nouns, если глагол, то в список verbs.
Функция возвращает словарь с двумя ключами: nouns и verbs, каждый из которых содержит
список извлеченных существительных и глаголов соответственно.
Код:
import nltk
# Загрузка необходимых данных из nltk
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger')
4
if tag.startswith('NN'): # если слово является существительным
nouns.append(word) # добавляем его в список существительных
elif tag.startswith('VB'): # если слово является глаголом
verbs.append(word) # добавляем его в список глаголов
# возвращаем словарь с найденными существительными и глаголами
return {'nouns': nouns, 'verbs': verbs}
4.Выполнение
5
Вывод
6
Библиография
1. Хабр, Книга «Обработка естественного языка. Python и spaCy на практике»,
https://habr.com/ru/company/piter/blog/556140/ , доступно [28.03.2023]
2. hse.ru, Книга «Обработка естественного языка. Python и spaCy на практике»,
https://www.hse.ru/data/2017/07/22/1173852775/NLPandDA_4print.pdf , доступно [28.03.2023]