Professional Documents
Culture Documents
#한국어 학습자 말뭉치 아카데미- 활용의 기초 과정- - 20230915 (배포용)
#한국어 학습자 말뭉치 아카데미- 활용의 기초 과정- - 20230915 (배포용)
- 활용의 기초 과정 –
(모두의 말뭉치/한국어학습자말뭉치)
계명대학교
최정도
1. 한국어 말뭉치 활용의 개요
말뭉치의 구조(생김새) 확인
- 텍스트 에디터 사용 방법
검색기 활용 방법
2023-09-15 KMU 2
2. 모두의 말뭉치의 개요
2.1. 말뭉치 신청: 모두의 말뭉치(https://corpus.korean.go.kr/)
2023-09-15 KMU 3
3. 모두의 말뭉치의 생김새
3.1. 모두의 말뭉치(샘플)
원시 말뭉치
형태 분석
말뭉치
2023-09-15 KMU 4
3. 모두의 말뭉치의 생김새
3.2. 원시 말뭉치2
2023-09-15 KMU 5
3. 모두의 말뭉치의 생김새
3.3. 형태 분석 말뭉치1
#주의#
- 형태 분석 말뭉치에서는 ‘form’을
2군데에서 사용하고 있음.
2023-09-15 KMU 6
3. 모두의 말뭉치의 생김새
3.3. 형태 분석 말뭉치2
#주의#
- 형태 분석 말뭉치에서는 ‘form’을
2군데에서 사용하고 있음.
- 필요한 것은 이 부분의 ‘form’
2023-09-15 KMU 7
4. 모두의 말뭉치의 활용
4.1. 준비물
§ 준비물
§ 모두의 말뭉치 샘플(원시, 형태 분석)
§ 형태소 분석기(UTagger 2011)
§ (http://klplab.ulsan.ac.kr/)
§ 텍스트에디터: 에디트플러스(시험 버전; trial version, 30일)
§ 검색기: AntConc(Windows 3.5.9 또는 4.2.2)
§ (https://www.laurenceanthony.net/software/antconc/)
§ 연습 방법
§ 프로그래밍을 하지 않는 방법으로!!
§ 원시 말뭉치 다루기(가공)
§ 형태 분석 말뭉치 다루기(가공)
2023-09-15 KMU 8
4. 모두의 말뭉치의 활용
4.1. 준비물 2 – 유태거(Utagger; http://klplab.ulsan.ac.kr/)
2023-09-15 KMU 9
4. 모두의 말뭉치의 활용
4.1. 준비물 3 – AntConc (https://www.laurenceanthony.net/software/antconc/)
2023-09-15 KMU 10
4. 모두의 말뭉치의 활용
4.2. 원시 말뭉치 다루기(가공)
§ 기본 설정
§ 표식 관련
§ 편집: Edit 편집 > 클립보드: Edit > Clipboard
§ 지우기: 검색 > 표식: 모든 표식 해제 지우기: Search > Markers > Clear All Markers
2023-09-15 KMU 11
4. 모두의 말뭉치의 활용
4.2. 원시 말뭉치 다루기(가공)
§ 원시 말뭉치(모두의 말뭉치)의 가공 전략
§ 문장 라인만 추출하기
§ 문장 라인을 모두 추출하여 가공하기(손질하기)
§ 형태 분석 하기
2023-09-15 KMU 12
4. 모두의 말뭉치의 활용
4.2. 원시 말뭉치 다루기(가공)
2023-09-15 KMU 13
4. 모두의 말뭉치의 활용
4.2. 원시 말뭉치 다루기(가공)
§ 원시 말뭉치의 가공 1(‘에디트플러스’)
§ ‘검색(S) > 여러 파일 찾기’ (※ 파일이 1개라면 ‘찾기’ 활용)
§ 옵션 선택
§ ‘찾을 말(I)’: ‘ "form": "’ (왼쪽 공백 20개)
§ 또는 ‘ "original_form": "’ (왼쪽 공백 20개)
§ ‘폴더(O)’: 원시 말뭉치가 들어 있는 폴더 선택
§ ‘파일 종류’: ‘*.json’
§ ‘하위 폴더 포함(S)’ 체크: 현재는 안 해도 되지만, 습관적으로 체크
§ ‘결과 표시’: ‘출력 창에 표시’
§ ‘찾기(F)’ 클릭
§ 창 하단에서 검색 과정 확인. 말뭉치 양에 따라 시간이 조금 걸림.
§ 화면 아래 부분에 ‘출력 완료’가 보이면 검색 끝
2023-09-15 KMU 14
4. 모두의 말뭉치의 활용
4.2. 원시 말뭉치 다루기(가공)
§ 원시 말뭉치의 가공 2(‘에디트플러스’)
§ 하단의 화면 어느 곳에서 마우스 ‘우클릭’
§ ‘전체 복사(A)’ 클릭
§ 빈 문서(새 문서) 생성
§ 에디터 화면 왼쪽 상단의 하얀색 아이콘 클릭
§ ‘파일(F)’ > ‘새 파일(N)’
§ ‘ + ’
§ 첫 줄 삭제(‘ + ’), 마지막 두 줄(‘ + ’) 삭제
§ 패턴 찾아서 정규 표현식(정규식, regular expression)으로 정
리하기
2023-09-15 KMU 15
4. 모두의 말뭉치의 활용
4.2. 원시 말뭉치 다루기(가공)
§ 원시 말뭉치의 가공 3(‘에디트플러스’)
§ 검색 결과에서 공백과 왼쪽 경로 모두 지우기
2023-09-15 KMU 16
4. 모두의 말뭉치의 활용
4.2. 원시 말뭉치 다루기(가공)
§ 원시 말뭉치의 가공 4(‘에디트플러스’)
§ ‘정규 표현식’: 아주 간단한 것만 익히고자 함. (\, ₩: )
§ 원시 말뭉치의 가공 5(‘에디트플러스’)
§ ‘정규 표현식’: 아주 간단한 것만 익히고자 함.
§ 메타 문자: 키보드 각 키가 의미할 수 없는 것을 표현
§ 원시 말뭉치의 가공 7(‘에디트플러스’)
§ 왼쪽 부분을 지우기 위해서: 여러 가지 방법 사용 가능(이 방법 사용)
§ (2) ‘"form": "’을 찾아서 왼쪽을 모두 지우는 방법 등
§ ‘"form": "’ 이용
§ 정규식: ‘.+"form": "’
• 의미: ‘"form": "’의 왼쪽에 있는 문자(글자)가 1개 이상인 것
§ ‘검색(S)’ > ‘바꾸기(E)’: ‘ + ’
§ ‘찾을 말(I)’: ‘.+"form": "’ 입력
§ ‘바꿀 말(P)’: 아무 것도 입력하지 않음(‘삭제’한다는 의미)
§ ‘정규식(X)’ 반드시 체크(∨)
2023-09-15 KMU 19
4. 모두의 말뭉치의 활용
4.2. 원시 말뭉치 다루기(가공)
§ 원시 말뭉치의 가공 8(‘에디트플러스’)
§ 오른쪽 끝에 있는 말뭉치 기호 ‘",’ 삭제하기(단순 찾아 바꾸기)
§ ‘검색(S)’ > ‘바꾸기(E)’: ‘ + ’
§ ‘찾을 말(I)’: ‘",’ 입력
§ ‘바꿀 말(P)’: 아무 것도 입력하지 않음(‘삭제’한다는 의미)
§ ‘정규식(X)’ 반드시 체크(∨) 풀기
2023-09-15 KMU 20
4. 모두의 말뭉치의 활용
4.2. 원시 말뭉치 다루기(가공)
2023-09-15 KMU 21
4. 모두의 말뭉치의 활용
4.3. 형태 분석 말뭉치 다루기(가공)
#주의#
- 형태 분석 말뭉치에서는
‘form’을 2군데에서 사용하
고 있음.
2023-09-15 KMU 22
4. 모두의 말뭉치의 활용
4.3. 형태 분석 말뭉치 다루기(가공)
#주의#
- ‘form’과 ‘label’의 정보를 함께,
동시에(순차적으로) 추출해야 함.
- 파일이 1개일 때와 여러 개일 때의
추출 방법을 달리해야 함.
* 파일이 여러 개일 때: 파일 합치기
2023-09-15 KMU 23
4. 모두의 말뭉치의 활용
4.3. 형태 분석 말뭉치 다루기(가공)
§ 형태 분석 말뭉치의 가공 5(‘에디트플러스’)
§ ‘정규 표현식’: 아주 간단한 것만 익히고자 함.
§ 다음: 고차원 기능(역참조 기능)
§ (현재의 상태)
"form": "부분",(엔터)
"label": "NNG",
(왼쪽 공백 28개)
2023-09-15 KMU 24
4. 모두의 말뭉치의 활용
4.3. 형태 분석 말뭉치 다루기(가공)
§ 형태 분석 말뭉치의 가공 6(‘에디트플러스’)
§ ‘정규 표현식’: 아주 간단한 것만 익히고자 함.
§ 다음: 고차원 기능(역참조 기능)
§ (현재의 상태)
"form": "부분",(엔터)
"label": "NNG", (왼쪽 공백 28개)
☞ 내용이 바뀌는 부분: 2군데(1+1)
☞ 고정된 부분 찾기
§ ‘틀’과 같이 바뀌지 않는 부분과 내용이 계속 바뀌는 부분을 구분
"form": "부분",(엔터) "label": "NNG",
1 2
§ …………………………………부분………………………………NNG",
§ …………………………………부분…(엔터)………………………NNG",
§ ………………………"form": "부분",(엔터)……………"label": "NNG",
§ ( )’ 안에 있는 것은 이후에 다시 활용하는 부분
§ .+"from": "(.+)",\n.+"label": "(.+)", ← 추천(실제로 활용하는 부분은 2부분)
§ (.+)"from": "(.+)",\n(.+)"label": "(.+)",
2023-09-15 KMU 25
4. 모두의 말뭉치의 활용
4.3. 형태 분석 말뭉치 다루기(가공)
§ 형태 분석 말뭉치의 가공 7(‘에디트플러스’)
§ ‘정규 표현식’: 아주 간단한 것만 익히고자 함.
§ 다음: 고차원 기능(역참조 기능)
§ (현재의 상태)
"form": "부분",(엔터)
"label": "NNG", (왼쪽 공백 28개)
☞ ‘( )’ 안에 있는 것은 이후에 다시 활용하는 부분
§ ⓐ .+"from": "(.+)",\n.+"label": "(.+)", ← 추천(실제로 활용하는 부분은 2부분)
§ ⓑ (.+)"from": "(.+)",\n(.+)"label": "(.+)",
§ 괄호 부분을 다시 참조(사용)하는 방법: 순서대로 ‘\1, \2, \3, \4’ 방법으로 표현하여 사용
§ 복원해야 하는 부분: (순차적으로 괄호의 순서를 고려)
§ ⓐ ‘\1, \2’ ⓑ ‘\2, \4’
§ ‘검색(S)’ > ‘바꾸기(E)’: ‘ + ’
2023-09-15 KMU 26
4. 모두의 말뭉치의 활용
4.3. 형태 분석 말뭉치 다루기(가공)
§ 형태 분석 말뭉치의 가공 8(‘에디트플러스’)
§ ‘정규 표현식’: 아주 간단한 것만 익히고자 함.
§ 다음: 고차원 기능(역참조 기능)
2023-09-15 KMU 27
5. 한국어 학습자 말뭉치 활용의 개요
5.1. 학습자 말뭉치와 학습자 말뭉치 나눔터
2023-09-15 KMU 28
5. 한국어 학습자 말뭉치 활용의 개요
5.2. 말뭉치 신청: 한국어 학습자 말뭉치 나눔터(https://kcorpus.korean.go.kr/)
2023-09-15 KMU 29
5. 한국어 학습자 말뭉치 활용의 개요
5.4. 학습자 말뭉치 아카데미의 목표
2023-09-15 KMU 31
6. 한국어 학습자 말뭉치의 생김새
6.2. 형태 분석 말뭉치 2(2021년 말뭉치)
2023-09-15 KMU 32
6. 한국어 학습자 말뭉치의 생김새
6.2. 형태 분석 말뭉치 3(2021년 말뭉치)
2023-09-15 KMU 33
6. 한국어 학습자 말뭉치의 생김새
6.3. 오류 분석 말뭉치 1(2021년 말뭉치)
2023-09-15 KMU 34
6. 한국어 학습자 말뭉치의 생김새
2.3. 오류 분석 말뭉치 2(2021년 말뭉치)
2023-09-15 KMU 35
6. 한국어 학습자 말뭉치의 생김새
6.3. 오류 분석 말뭉치 3(2021년 말뭉치)
2023-09-15 KMU 36
7. 한국어 학습자 말뭉치의 활용
7.1. 준비물 1
§ 준비물
§ 모두의 말뭉치 샘플(원시, 형태 분석)
§ 형태소 분석기(UTagger 2011)
§ (http://klplab.ulsan.ac.kr/)
§ 텍스트에디터: 에디트플러스(시험 버전; trial version, 30일)
§ 검색기: AntConc(Windows 3.5.9 또는 4.2.2)
§ (https://www.laurenceanthony.net/software/antconc/)
§ 연습 방법
§ 프로그래밍을 하지 않는 방법으로!!
§ 원시 말뭉치 다루기
§ 형태 분석 말뭉치 다루기
§ 오류 분석 말뭉치 다루기(시간이 주어질 경우)
§ 연구 사례 따라하기(접사 연구)
2023-09-15 KMU 37
7. 한국어 학습자 말뭉치의 활용
7.1. 준비물 2 – 유태거(Utagger; http://klplab.ulsan.ac.kr/)
2023-09-15 KMU 38
7. 한국어 학습자 말뭉치의 가공 및 활용
7.1. 준비물 3 – AntConc (https://www.laurenceanthony.net/software/antconc/)
2023-09-15 KMU 39
7. 한국어 학습자 말뭉치의 활용
7.2. 원시 말뭉치 다루기 2
§ 원시 말뭉치의 활용
§ (고정된) 형태 중심의 검색:
§ 간단한 검색 결과, 빈도 확인
§ 분포 확인 가능: 수작업
§ (어절 단위의) 빈도 산출
§ (실습) AntConc
§ 세팅: 원시 말뭉치 검색 및 빈도 산출 시에는 ‘코딩’에만 유의
§ 형태(소) 분석용: 자신이 직접 형태 분석 진행
§ 공개 자료를 자신이 구성(디자인)하여 연구 진행
§ 공개된 모든 말뭉치를 다룰 필요가 없을 경우
§ 자신이 구축한 자료를 활용하여 연구 진행
§ 한국어 교재, TOPIK 기출 문제, 학습자 쓰기 자료 등
2023-09-15 KMU 40
7. 한국어 학습자 말뭉치의 가공 및 활용
7.2. 원시 말뭉치 다루기 3 - AntConc의 설정1
- 자료가 유티코드(UTF)일 경우
에는 ‘Standard Encodings’ 또
는 ‘Unicode Encodings’에서 선
택
2023-09-15 KMU 41
7. 한국어 학습자 말뭉치의 가공 및 활용
7.2. 원시 말뭉치 다루기 4 - AntConc의 설정2
- 자료가 유티코드(UTF)일 경우
에는 ‘Standard Encodings’ 또
는 ‘Unicode Encodings’에서 선
택
2023-09-15 KMU 42
7. 한국어 학습자 말뭉치의 가공 및 활용
7.2. 원시 말뭉치 다루기 4 - AntConc의 설정3
2023-09-15 KMU 43
7. 한국어 학습자 말뭉치의 활용
7.2. 원시 말뭉치 다루기 5 – AntConc 검색 1
§ 검색: ‘Concordance’ 탭
§ ‘빈칸’에 검색어(keyword) 입력 > ‘Start’ 클릭 > 검색 결과 확인
§ ‘Concordance’ 확인
§ 빈도: ‘Word List’ 탭
§ ‘Search Term’: ‘Words’ 체크
§ ‘Start’ 클릭 > 빈도 결과 확인
§ 연어: ‘Collocates’ 탭
§ ‘Search Term’: ‘Words’ 체크
§ ‘빈칸’에 중심어 입력 > 좌우 범위 설정(4L-4R) > ‘Start’ 클릭
§ N-그램: ‘Cluster/N-Grams’ 탭
§ ‘Search Term’: ‘N-Grams’ 체크
§ ‘Cluster Size’ 설정(보통 2 or 3) > ‘Start’ 클릭
2023-09-15 KMU 44
7. 한국어 학습자 말뭉치의 활용
7.3. 형태 분석 말뭉치 다루기 1
§ 형태 분석 말뭉치
§ 구조 확인
(sample_30518.xml)
2023-09-15 KMU 45
7. 한국어 학습자 말뭉치의 활용
7.3. 형태 분석 말뭉치 다루기 3
§ 형태 분석 말뭉치의 가공 1(‘에디트플러스’)
§ ‘검색(S) > 여러 파일 찾기’
§ 옵션 선택
§ ‘찾을 말(I)’: ‘<morph from=’ 또는 ‘</morph>’
§ ‘폴더(O)’: 형태 분석 말뭉치가 들어 있는 폴더 선택
§ ‘파일 종류’: ‘*.xml’
§ ‘하위 폴더 포함(S)’ 체크: 현재는 안 해도 되지만, 습관적으로 체크
§ ‘결과 표시’: ‘출력 창에 표시’ (실습 이후로 다른 옵션도 연습)
§ ‘찾기(F)’ 클릭
§ 창 하단에서 검색 과정 확인. 말뭉치 양에 따라 시간이 조금 걸림.
§ 화면 아래 부분에 ‘출력 완료’가 보이면 검색 끝
2023-09-15 KMU 46
7. 한국어 학습자 말뭉치의 활용
7.3. 형태 분석 말뭉치 다루기 4
§ 형태 분석 말뭉치의 가공 2(‘에디트플러스’)
§ 하단의 화면 어느 곳에서 마우스 ‘우클릭’
§ ‘전체 복사(A)’ 클릭
§ 빈 문서(새 문서) 생성
§ 에디터 화면 왼쪽 상단의 하얀색 아이콘 클릭
§ ‘파일(F)’ > ‘새 파일(N)’
§ ‘ + ’
§ 첫 줄 삭제(‘ + ’), 마지막 두 줄(‘ + ’) 삭제
§ 패턴 찾아서 정규 표현식(정규식, regular expression)으로 정
리하기
2023-09-15 KMU 47
7. 한국어 학습자 말뭉치의 활용
7.3. 형태 분석 말뭉치 다루기 5
§ 형태 분석 말뭉치의 가공 3(‘에디트플러스’)
§ (주의) 현재 자료는 편의상 베트남 학습자의 자료만 모아 놓은 것
§ (팁) 만약 학습자의 정보(국가, L1, 수준 등등 ← 폴더 제목)를 남
겨서 확인하고 싶다면, 말뭉치를 폴더 전체로 모아 놓아야 함.
§ 폴더 상태로 모아 놓은 말뭉치를 대상으로 ‘여러 파일 찾기’ 실행
2023-09-15 KMU 48
7. 한국어 학습자 말뭉치의 활용
7.3. 형태 분석 말뭉치 다루기 10
§ 형태 분석 말뭉치의 가공 8(‘에디트플러스’)
§ ‘정규 표현식’: 아주 간단한 것만 익히고자 함.
§ 다시 말뭉치로
2023-09-15 KMU 49
7. 한국어 학습자 말뭉치의 활용
7.3. 형태 분석 말뭉치 다루기 12
§ 형태 분석 말뭉치의 가공 10(‘에디트플러스’)
§ ‘정규 표현식’: 아주 간단한 것만 익히고자 함.
§ 다음: 고차원 기능(역참조 기능)
2023-09-15 KMU 50
7. 한국어 학습자 말뭉치의 활용
7.3. 형태 분석 말뭉치 다루기 13
§ 형태 분석 말뭉치의 가공 11(‘에디트플러스’)
§ ‘정규 표현식’: 아주 간단한 것만 익히고자 함.
§ 다음: 고차원 기능(역참조 기능)
☞ ‘( )’ 안에 있는 것은 이후에 다시 활용하는 부분
§ ⓐ <morph from=(.+)pos="(.+)" subsequence="(.+)">(.+)</morph>
§ ⓑ (.+)pos="(.+)" subsequence="(.+)">(.+)</morph> ← 추천
2023-09-15 KMU 51
7. 한국어 학습자 말뭉치의 활용
7.3. 형태 분석 말뭉치 다루기 15
§ 형태 분석 말뭉치의 가공 13(‘에디트플러스’)
§ ‘정규 표현식’: 아주 간단한 것만 익히고자 함.
§ 다음: 고차원 기능(역참조 기능)
§ 형태 분석 말뭉치의 가공 14(‘에디트플러스’)
§ ‘정규 표현식’: 아주 간단한 것만 익히고자 함.
§ 다음: 후처리
§ 구축 말뭉치의 특성상 지워야 할 몇 가지가 남아 있을 가능성
§ 형태 분석 말뭉치의 활용(‘AntConc’)
§ 가공한 파일을 AntConc에서 활용하여 ‘검색’, ‘빈도 산출'
§ 검색 가능
§ 빈도 산출
§ 연어 추출
§ N-그램 추출
2023-09-15 KMU 54
7. 한국어 학습자 말뭉치의 활용
7.4. 오류 분석 말뭉치 다루기 1
§ 오류 분석 말뭉치
§ 구조 확인
§ 실제 오류 분석 말뭉치는 ‘학습자 말뭉치 나눔터’ 활용 추천
2023-09-15 KMU 55
7. 한국어 학습자 말뭉치의 활용
7.5. 형태 분석 후 자료 활용 1
§ KIWI(https://github.com/bab2min/Kiwi), ‘Releases’ 버전
§ https://github.com/bab2min/Kiwi
2023-09-15 KMU 57
7. 한국어 학습자 말뭉치의 활용
7.5. 형태 분석 후 자료 활용 2 (kiwi)
§ KIWI(https://github.com/bab2min/Kiwi), ‘Releases’ 버전
2023-09-15 KMU 58
7. 한국어 학습자 말뭉치의 활용
7.5. 형태 분석 후 자료 활용 2 (kiwi)
§ KIWI(https://github.com/bab2min/Kiwi), ‘Releases’ 버전
2023-09-15 KMU 59
7. 한국어 학습자 말뭉치의 활용
7.5. 형태 분석 후 자료 활용 2 (kiwi)
§ KIWI(https://github.com/bab2min/Kiwi), ‘Releases’ 버전
2023-09-15 KMU 60
7. 한국어 학습자 말뭉치의 활용
7.5. 형태 분석 후 자료 활용 3-1 (UTagger)
2023-09-15 KMU 61
7. 한국어 학습자 말뭉치의 활용
7.5. 형태 분석 후 자료 활용 3-2 (UTagger)
- ‘UI 보이기’ 클릭
- 옵션 설정
- 파일 분석
2023-09-15 KMU 62
7. 한국어 학습자 말뭉치의 활용
7.5. 형태 분석 후 자료 활용 4 (UTagger)
- 유태거 세팅
2023-09-15 KMU 63
7. 한국어 학습자 말뭉치의 활용
7.5. 형태 분석 후 자료 활용 5 (UTagger)
- 유태거 세팅 방법
- 파일 형태: ‘원시 말뭉치’ 선택
- 서술형 명사 용언 분석:
· 통합:
공부하(다) → 공부하/VV
· 분리: ← 이번에는 이거 사용
공부하(다) → 공부/NNG+하/XSV
- 출력 형식
· 울산대: 한 문장을 한 줄로 ← 이번에는
· 한줄에 한어절:
한 어절을 한 줄로(세종 형식)
- 의미 매핑 정보 출력:
동형어 번호 출력 여부 선택 ← 이번 안 함
2023-09-15 KMU 64
7. 한국어 학습자 말뭉치의 활용
7.5. 형태 분석 후 자료 활용 6 (UTagger)
§ 결과 → 확장자가 ‘.tag’인 파일 생성
§ ⇒ 더블클릭하면 안 열림. 텍스트 에디터로 연결해야 함.
2023-09-15 KMU 65
7. 한국어 학습자 말뭉치의 활용
7.5. 형태 분석 후 자료 활용 7 (UTagger)
- 자료가 유티코드(UTF)일 경우
에는 ‘Standard Encodings’에서
선택
2023-09-15 KMU 67
7. 한국어 학습자 말뭉치의 가공 및 활용
7.5. 형태 분석 후 자료 활용 9 - AntConc의 설정 2
2023-09-15 KMU 68
7. 한국어 학습자 말뭉치의 가공 및 활용
7.5. 형태 분석 후 자료 활용 10 - AntConc의 설정 3
동형어 번호를 함께 보기 위해
서는 ‘Number Token
Classes’에서 ‘Number’도 체
크해 주어야 함.
2023-09-15 KMU 69
7. 한국어 학습자 말뭉치의 가공 및 활용
7.5. 형태 분석 후 자료 활용 11 - AntConc의 설정 4
- 이용하고자 하는 말뭉치
로딩
- 이후, 검색(Concodance)
이나 검색어를 입력하고
‘Start’를 클릭
- 빈도(Word List)에서
‘Start’를 클릭
2023-09-15 KMU 70
7. 한국어 학습자 말뭉치의 활용
7.5. 형태 분석 후 자료 활용 12
§ 검색 가능
§ 빈도 산출
§ 연어 추출
§ N-그램 추출
2023-09-15 KMU 71
7. 한국어 학습자 말뭉치의 활용
7.5. 형태 분석 후 자료 활용 12
§ 검색 가능
§ 빈도 산출
§ 연어 추출
§ N-그램 추출
§ Keyword List
2023-09-15 KMU 72
7. 한국어 학습자 말뭉치의 활용
7.5. 형태 분석 후 자료 활용 13
§ Keyword List(옵션)
§ ‘Tool Preferences’
§ ‘Keyword List’
§ ‘Reference Corpus’
§ 참조 말뭉치 선택
§ 파일 혹은 폴더 선택
§ 선택 후 ‘Load’
§ ‘Apply’ 클릭
2023-09-15 KMU 73
7. 한국어 학습자 말뭉치의 활용
7.5. 형태 분석 후 자료 활용 14
2023-09-15 KMU 74