Professional Documents
Culture Documents
인공지능 프로젝트 계획 발표 3301 권순성 3309 이상민
인공지능 프로젝트 계획 발표 3301 권순성 3309 이상민
필요한 짤의 상황을 입력
ex) 집에 있을래 , 반갑습니다
인공지능
데이터 수집
웹 크롤링을 통해 사람들이 주로 사용하는 짤을 수집
텍스트 유사도
임베딩
전처리 구하기
자연어 처리
텍스트 전처리 : 용도에 맞게 텍스트를 사전에 처리하는 작업
예 ) 구두점 단순 제외 , 단어 기준 토큰화
다양한 토큰화 도구 존재
자연어 처리
정제 : 코퍼스로부터 노이즈 데이터를 제거하는 과정
정규화의 예 : USA=US, 여자 = 여성 , 남자 = 남성
자연어 처리
임베딩 : 자연어를 컴퓨터가 이해할 수 있도록 벡터로 표현하는 방법
프로젝트에서는 BERT 라는 모델 사용 계획