You are on page 1of 14

2023

여름방학 마무리
2023. 08. 28. 한민주
contents

8 월 요약 연구 Follow User study 가을학기

8 월 한달 간 Mental h 9 월 1 일 발표 예 가을학기
ealth& 정 계 획 및 다짐
어떻게 지 Causal In 구성 논의
냈 는지 ference
(w. 여경언니 )

2
8 월 – 논문 리딩
• Discovering shifts to suicidal ideation from mental health content in social media
: Reddit 텍스트 데이터를 로지스틱 회귀모형에 적합하여 mental health 내용에서 자살 생각으로 변화를 겪는
사용자를 판별

• Estimating causal effects of tone in online debates


: 온라인 논쟁에서 응답의 톤에 따라 언어스타일과 감정이 어떻게 달라지는지 연구 , 교란변수를 모델에 표현하여
편향을 줄임 *

• Producer Conflict Management Approaches in Online Peer Production Communities – Case Study
of OpenStreetMap
: 온라인에서 동료들의 갈등을 관리하는 데 어떤 방법이 유용한지 로지스틱 회귀모형으로 분석

• Eyeing individuality: personal trait classification through short-time gaze duration


: 여경 , 준렬 선배의 시선인증 draft 를 읽어보았다 .
3
8 월 – NLP 공부 여경언니 추천
-> 다른 책으로 변경

진도율 30% 진도율 33%

- 언어 모델 평가 방법 : PPL, 분기계수 - 벡터의 유사도


- 단어표현 : BoW , TF-IDF - Tokenizing & preprocessing
- 조건부 확률 & N-gram - Modeling: Regression

4
8 월 – 알고리즘별 문제풀기

하루 3 문제

- Greedy
- Simulation
- 최단거리

- DFS/BFS ( 오늘 )

5
8월–그외
• 신입생 Axel Summer Camp 드디어 종료 ..
코세라
- Mathematics for Machine Learning: Multivariate Calculus 영어 강의
- Mathematics for Machine Learning: PCA
- Hands-on Deep Learning Institute 강의
- ETRI-GIST 워크샵

• 정하 , 준두선배 official movie data filtering


• 체력 관리 : 제 2 학생회관 요가
• 연구 idea 고민 ..? (sensible 대화 학습 ?, Turing test?, Try on shoes..?)

6
연구 Follow – Mental health
• 연구미팅 (w. 여경언니 )_0814
- Detection 자체보다 Detection 의 ‘ cause’ 를 keyword/index 로 설명하는 것이 목표
- 기존 연구에 대한 결과를 해석할 수 있도록 hint 를 주자 !
- Datasets: 웰니스 대화 스크립트 , GoEmotions, SHMD +LIWC dictionary
- Models: NER + sentiment + 증상인식 모델  Fusion model 느낌

• 나의 역할
- 최대한 Casual Inference 해석에 도움 주기
- 가설 idea 및 try 돕기
- 분석 design 도움 ? -> selection bias 등 고려 ..

7
• Follow 준비
- Casual Inference & Mental
health 관련 논문 review
- NLP 공부 (BERT, Electra, Chat
GPT 이해 )
> 텐서플로 2 와 머신러닝으로
시작하는 자연어처리

8
User study 발표 준비
- Statistics Concept 별 user study 논문
- 논문 전체 리뷰 X , 사용 모델과 Result 를 다루고 거기서 곁가지 concept 들을 뻗어 나갈 예정
- 발표 시간 ( 약 40 분 ..?)

< heuristic contents > < brunch concept >


Concept0. Statistics 개요 _ 2 분 1. EDA 와 boxplot
Concept1. Logistic Regression _ 15 분 2. 가설검정과 p-value
3. 신뢰구간의 이해
Concept2. 분산분석과 Post-Hoc _ 15 분
Concept3. 자주 묻는 질문 ( 표본 수가 너무 적을 때 .. 등 )_3 분
 총 40 분

9
논문 1. [CHI’23] Producer Conflict Management Approaches in Online Peer Production
Communities – Case Study of OpenStreetMap

- 온라인 토론에서 producer 의 갈등 관리 행동 분석


- 분석 모델 : Logistic regression -> 모델 선택을 위한 EDA 의 중요성
- 독립변수 : 갈등처리 스타일 , 대화 기능
- 종속변수 : 갈등관리의 효율성
- Result 붙여넣기 후 , 해석 ( 특히 , 로그 오즈비 해석 )
- 가정 만족 ( 선형성 , 다중 공선성 , 독립성 등분산성 )
- * 수치형 독립변수가 가정을 만족하지 않아서 이진변수로 변환 -> 모델의 설명력이 떨어짐
-> 모델의 가정을 충족시키기 위한 변수변환 소개

10
논문 2. 미정
분산분석 -> ANOVA 해석
- [CHI’22] Effects of Speaking Rate on Speech and Silent Speech

상관분석
- [CHI’23] Cultural Differences in Friendship Network Behaviors: A Snapchat Case Study

11
그 외 concept 들

그 외 concept 들
- Regression
- questionnaire analysis
- 베이지안 통계
- 상관분석
- 추정량의 성질 ( 불편성 , 일치성 , 효율성 )
- 검정법 모식도
- 비모수적 방법
- 데이터의 분포와 표본분포
- 각종 모델들 ( 머신러닝 쪽 ), 표본추출법

12
가을학기 계획 & 다짐

수업 _10 학점
- 지능형 에이전트 / 인공지능 경험랩
- 고급 딥러닝 / 과학기술과 경제

개강 다짐
Causal Inference Follow
- Mental health 논문 리뷰
- Causual Inference&Statistics skill
시작하면서 채우기 ,
- NLP 공부
부족해도 들이밀기

개인 목표
- 연구 고민 / 알고리즘 문제
- 과제 청음 / 체력관리

13
감사합니다

You might also like