Professional Documents
Culture Documents
Článek KL
Článek KL
Cíl studie:
- Sestavit seznam akademických slov a frází pro češtinu
- Vytvoření aplikace Akalex (www. korpus.cz/akalex, Kov kov — Kov k, 2021) pro výzkum
akademické slovní zásoby pomocí SYN2015
Hypotézy, problémy:
- Otázka, zda pro práci s n-gramy používat lemmata (= základní slovníkové tvary), nebo konkrétní
slovní tvary a zda brát v úvahu interpunkci
Metodologie:
- vytvořit vhodné subkorpusy z aktuálního korpusu SYN2015
Korpus SYN2015:
- Synchronní reprezentativní korpus současné psané češtiny
- Poměr frekvencí
- Distribuce
- Disperze
- Nejčastější tvar
í
fi
ů
á
ř
í
é
á
č
á
ř
í
- POS
Problémy:
- Nastavení prahových hodnot
- de nována jako, označuje jako, charakterizovat jako, chápat jako, jeví jako, je tudíž, vyplývá že,
ukazuje že
Závěr:
- vznik aplikace Akalex určené k výzkumům slovní zásoby typické pro akademické texty
- Položky v seznamu obsahují množství informací sloužící ke třídění - například podle slovního
druhu lze vyhledávat kolokace konkrétního slova
Úkol do budoucna:
- provést rozsáhlejší výzkum n-gramů typických pro akademické texty a zaměřit se na jednotky,
které se vyskytují i v nižším počtu oborů
fi