You are on page 1of 13

자연어처리 프로젝트

Based on BERT

이인구
목차
Bash 실전으로 배우기
1.

1. 미디어젠
example 1 및 NAMZ 연구소 소개
1.

2. 자연어처리
example 2
2.
프로젝트 소개
Text Classification ( 텍스트 분류 )
Token Classification ( 토큰 분류 )
3. 프로젝트 목적
4. 프로젝트 계획
5. 프로젝트 예시
미디어젠 소개
Bash 실전으로 배우기
1.

1. example 1

2. example 2

http://www.mediazen.
미디어젠 남즈 연구소 소개
Bash 실전으로 배우기
1.

1. example 1

2. example 2
음성합

AI 자연어처

음성인

자연어처리 프로젝트
Bash 실전으로 배우기
1.

1. Text Classification ( 텍스트 분류 )


1. example 1
텍스트 분류 예시
2. example 2
1. 의도 분류
아이유 노래 틀어줘 -> ' 가수 이름으로 노래 틀기 '
2. 텍스트 분류
뉴스 텍스트 입력 -> 텍스트의 분류를 예측
3. 텍스트 점수 평가
학생 수필 작성 -> 수필 점수 예측
자연어처리 프로젝트
Bash 실전으로 배우기
1.

2. Token Classification
example
1. 1 ( 토큰 분류 )

example 2
2.
토큰 분류 예시
slot tagging
pos tagging
프로젝트의 목적
Bash 실전으로 배우기
1.

1. 자연어처리
example 1
1.
개념 이해

2. example 2

https://connect.ebsco.com/s/article/Poetry-Short-Story-Reference-Center-Lesson-Plan-Word-Clouds?language=en_US
프로젝트의 목적
Bash 실전으로 배우기
1.

1. 데이터
example 1정제 훈련
1.

2.
regular
example 2
expression 사용
올바른 정제 여부 판단
프로젝트의 목적
Bash 실전으로 배우기
1.

1. 자연어처리를
1.example 1 위한 인공신경망 알고리즘 훈련

2. example 2

BERT- Pre-training of Deep Bidirectional Transformers for Language Understanding(Jacob Devlin et al., 2019)
프로젝트 계획
Bash 실전으로 배우기
1.

1. example 1

2. example 2
주차 월 화 수 목 금
1 10/18 10/19 10/20 10/21 10/22
주차
1. 커리큘럼 안내 ,
2. 버트 소개 (simplified), 1. 기획안
사전학습 - 미세조정 개괄 ,
1 차 사례 공유 피드백 2.
과제 : 기획안 작성
파인튜닝
이론 설명 및
수업 시간 : 2 시 ~3 시 데이터 형태
이해 과제 :
기획안 수정
및 구체화
파인튜닝
데이터 구상
수업 시간 :
2 시 ~3 시
2 10/25 10/26 10/27 10/28 10/29
주차
1. 텍스트 1. 데이터 1. 데이터
분류 모델 수집 피드백 , 수집 피드백 ,
구축에 2. 파인튜닝 2. 파인튜닝
필요한 코딩 코드 부분 코드 부분
강의 과제 : 채우기 코딩 채우기 코딩
파인튜닝 실습 과제 : 실습 과제 :
데이터 제작 파인튜닝 파인튜닝
수업 시간 : 코드 작성 코드 작성 2
* 금요일만 미디어젠 연구소에서 ' 오프라인 ' 수업 / 나머지는 ' 온라인
2 시 ~3 시 수업상황에
(Zoom)' 수업입니다 .* 수업 시간은 시간 따라: 유동적으로 바뀔 수 수업 시간 :
있습니다 . 2 시 ~3 시 2 시 ~3 시
주차 월 화 수 목 금
1 10/18 10/19 10/20 10/21 10/22
주차
1. 커리큘럼 안내 ,
2. 버트 소개 (simplified), 1. 기획안
사전학습 - 미세조정 개괄 ,
1 차 사례 공유 피드백 2.
과제 : 기획안 작성
파인튜닝
수업 시간 : 2 시 ~3 시 이론 설명 및
데이터 형태
이해 과제 :
기획안 수정
및 구체화
파인튜닝
데이터 구상
수업 시간 :
2 시 ~3 시
2 10/25 10/26 10/27 10/28 10/29
주차
1. 토큰 분류 모델 구축에
필요한 코딩 강의 1. 데이터 1. 데이터
과제 : 파인튜닝 데이터
제작수업 시간 : 2 시 ~3 시 수집 피드백 , 수집 피드백 ,
2. 파인튜닝 2. 파인튜닝
코드 부분 코드 부분
채우기 코딩 채우기 코딩
실습 과제 : 실습 과제 :
파인튜닝 파인튜닝
코드 작성
* 금요일만 미디어젠 연구소에서 ' 오프라인 ' 수업 / 나머지는 ' 온라인
코드 작성 2
수업상황에
(Zoom)' 수업입니다 .* 수업 시간은 시간 따라: 유동적으로 바뀔 수 수업 시간 :
있습니다 . 2 시 ~3 시 2 시 ~3 시
프로젝트 예시
Bash 실전으로 배우기
1.

1. example 1

2. example 2
https://drive.google.com/drive/folders/
1_fXWHLPvmZ7252wgG8k4IW4hiMjQer3T

You might also like