Week 14

Uploaded by

Z ero

0% found this document useful (0 votes)

6 views6 pages

Original Title

데이터기반 분류 예측 문제

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

6 views6 pages

Week 14

Uploaded by

Z ero

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 6

Search inside document

Week 14

데이터기반 분류 예측

데이터분석기초
데이터 소개 & 주의사항
• Red Wine Quality Dataset
• 각 와인 별 주요 특징들을 종합하여, ‘quality’가 매겨집니다.
• Output variable: Quality
• Input Variable: Fixed acidity, volatile acidity, citric acid, residual sugar, chlorides, free sulfur dioxide, total
sulfur dioxide, density, pH, sulphates, alcohol

• Dataset 출처 및 주의사항
• 출처: Red Wine Quality | Kaggle
• 구름에서 제공해 드리는 데이터셋을 활용하세요.
• 학습 시 주의사항
• 학습 시 warning이 발생한다면 max_iter 값의 문제일 수 있습니다.
• 조교의 경우 1000으로 했을 때 문제가 되지 않았으니, 진행에 참고하세요.
• 정답 우회 시
• 문제를 올바르게 풀지 않고 출력만 조작하거나, dataset 분배를 임의로 조작하지 마세요.
• 제출 코드에 해당 내용이 발견될 경우 불이익이 발생할 수 있습니다.
데이터 소개

residual Quality
항목 fixed acidity volatile acidity citric acid chlorides
sugar (Output)

해설 고정 산도 휘발 산도 구연산 잔여당 염화물 와인 등급

값 4.6~15.9 0.12 ~ 1.58 0~1 0.9 ~ 15.5 0.01 ~ 0.61 3~8

free sulfur total sulfur

항목 density pH sulphates
dioxide dioxide

해설 이산화황 이산화황 밀도 pH 황산염

값 1~72 6~289 0.99~1 2.74~4.01 0.33~2

데이터분석기초
1 Quality Class Quantization
• 여러분은 와인이 추천할만한 와인인지, 아닌지를 판정하는 모델을 만들고자
합니다.
• 아래의 조건에 따라 quality 열의 값을 대체하세요.
• Quality가 3~5인 경우: ‘0’으로 변경
• Quality가 6~8인 경우: ‘1로 변경
• 변경 불가능한 하단 코드에서 0, 1로 분류된 와인 수를 출력하는 것을 통해 채점합니다.
Quality Quality

7 1

3 0

4 0

8 1

6 1 데이터분석기초
2 Binary Classification 모델 학습
• 학습 규칙
• 전체 데이터 중 [0:300] 데이터는 testset으로 활용됩니다.
• 전체 데이터 중 [300: ] 데이터를 trainset으로 활용됩니다.
• 코드 상단부에 잠금 형태로 지정해 두었기에, 세트 자체는 변하지 않도록 주의하세요.
• Quality를 제외한 10개의 독립 변수를 사용하는 분류 모델을 설계하세요.
• 주어진 데이터는 0, 1의 분류가 포함되고, 원래의 3~8 범위의 quality는 빠져 있습니다.

• 모델 목표
• 학습 세트에 대한 정답률 0.7 이상
• 테스트 세트에 대한 정답률 0.7 이상
• Classification 성공률이 달성될 경우 정답으로 간주됩니다.
• 둘 모두에 달성할 경우 “True”가 총 2회 출력됩니다.
데이터분석기초
3 Binary Classification 모델 학습
• 데이터 탐색
• 데이터 탐색을 통해 모델의 성능을 높이는 것이 여러분의 목표입니다.
• 상관계수 및 시각화를 통한 데이터 탐색을 거쳐, 모델에 활용할 독립 변수를 자유롭게
선정하세요.
• Hint: 이상치 제거의 경우 total/free sulfur dioxide를 살펴보세요.

• 학습 규칙
• 학습 규칙은 2번 문제와 동일합니다.
• 독립변수 수는 데이터 탐색을 통해 자유롭게 활용하세요.

• 모델 목표
• 학습 세트에 대한 정답률 0.735 이상
• 테스트 세트에 대한 정답률 0.715 이상
• Classification 성공률이 달성될 경우 정답으로 간주됩니다.
• 둘 모두에 달성할 경우 “True”가 총 2회 출력됩니다.

5주차 결과 보고서
Document4 pages
5주차 결과 보고서
Emily Oh
No ratings yet
2조 발표 최종
Document18 pages
2조 발표 최종
윤종인
No ratings yet
Agilent Vial
Document8 pages
Agilent Vial
hanakist
No ratings yet
SOP23-0111F WWW
Document2 pages
SOP23-0111F WWW
minhasdanial31
No ratings yet
항산화력
Document25 pages
항산화력
하은
No ratings yet
Translate Mori French Vanilla Latte
Document3 pages
Translate Mori French Vanilla Latte
Alvin Y. Fredrick
No ratings yet
SOP23-0105F WWW
Document2 pages
SOP23-0105F WWW
minhasdanial31
No ratings yet
A-11-2018 은에 대한 작업환경측정·분석 기술지침
Document12 pages
A-11-2018 은에 대한 작업환경측정·분석 기술지침
박철희
No ratings yet
1. 어는점 내림에 의한 분자량 측정
Document11 pages
1. 어는점 내림에 의한 분자량 측정
붉곰
No ratings yet
화학분석기사
Document5 pages
화학분석기사
박준하
No ratings yet
241-482 Pag
Document242 pages
241-482 Pag
Walter Palacios Chanduvi
No ratings yet
Translate MORI Couque D'asse Latte
Document3 pages
Translate MORI Couque D'asse Latte
Alvin Y. Fredrick
No ratings yet
. 고객과 품질 Ⅳ. Data 의 가공 방법
Document90 pages
. 고객과 품질 Ⅳ. Data 의 가공 방법
sexyqueenswimming
No ratings yet
CI-600 Relay I Manual (KOR)
Document24 pages
CI-600 Relay I Manual (KOR)
최호철
No ratings yet
산 염기 프탈산수소칼륨 (Khc H O, Khp) 탄산나트륨 (Na Co) 황산히드라진 (N H ∙H So) 탄산수소나트륨 (Nahco) 벤조산 (C H Cooh) 옥살산나트륨 (Na C O4) 요오드산수소칼륨 (Kh (Io) )
Document7 pages
산 염기 프탈산수소칼륨 (Khc H O, Khp) 탄산나트륨 (Na Co) 황산히드라진 (N H ∙H So) 탄산수소나트륨 (Nahco) 벤조산 (C H Cooh) 옥살산나트륨 (Na C O4) 요오드산수소칼륨 (Kh (Io) )
코발
No ratings yet
사과탐 자료 검토 결과 (2024 수능)
Document6 pages
사과탐 자료 검토 결과 (2024 수능)
idyllist37
No ratings yet
2023 자연아카데미 최종발표 서상진,김주원,홍석호,허영선 - 20231127 - 143331 - 0000
Document3 pages
2023 자연아카데미 최종발표 서상진,김주원,홍석호,허영선 - 20231127 - 143331 - 0000
서성학
No ratings yet
5100 Series Icp-oes 한글매뉴얼
Document45 pages
5100 Series Icp-oes 한글매뉴얼
Huỳnh Văn Thương
No ratings yet
Bradford
Document8 pages
Bradford
진촌
No ratings yet
A-10-2018 알루미늄에 대한 작업환경측정·분석 기술지침
Document13 pages
A-10-2018 알루미늄에 대한 작업환경측정·분석 기술지침
박철희
No ratings yet
2023무인모빌리티부문
Document59 pages
2023무인모빌리티부문
한석희
No ratings yet
OM 4 품질경영
Document29 pages
OM 4 품질경영
J
No ratings yet
2008 1 Isoservice
Document20 pages
2008 1 Isoservice
becom33
No ratings yet
USAD
Document23 pages
USAD
Pro Beck
No ratings yet
Postlab 7
Document12 pages
Postlab 7
이동현
No ratings yet
2013년도 RSP 브로슈어
Document22 pages
2013년도 RSP 브로슈어
RSPcorperation
No ratings yet
분석화학 Ch5 정리
Document6 pages
분석화학 Ch5 정리
sumin22
No ratings yet
A-185-2020 질산에 대한 작업환경측정·분석 기술지침
Document12 pages
A-185-2020 질산에 대한 작업환경측정·분석 기술지침
ᄋᄋ
No ratings yet
A-5-2019 망간에 대한 작업환경측정·분석 기술지침
Document12 pages
A-5-2019 망간에 대한 작업환경측정·분석 기술지침
박철희
No ratings yet
A-2-2019 납에 대한 작업환경측정·분석 기술지침
Document12 pages
A-2-2019 납에 대한 작업환경측정·분석 기술지침
박철희
No ratings yet
THL260 Leeb Hardness Tester 한글메뉴얼 PDF
Document43 pages
THL260 Leeb Hardness Tester 한글메뉴얼 PDF
윤병택
No ratings yet
연구소 인사평가-2023 Dec20
Document78 pages
연구소 인사평가-2023 Dec20
Kalyani M
No ratings yet
3주차 일반생물학 및 실험
Document2 pages
3주차 일반생물학 및 실험
이호준
No ratings yet
기기분석실험 결과보고서
Document6 pages
기기분석실험 결과보고서
hejean1211
No ratings yet
제설제 인증기준
Document5 pages
제설제 인증기준
한승엽
No ratings yet
산, 염기 적정
Document8 pages
산, 염기 적정
O C
No ratings yet
온도계의 종류와 교정방법 (하)
Document14 pages
온도계의 종류와 교정방법 (하)
김동하
No ratings yet
2023 자연아카데미 최종발표 서상진,김주원,홍석호,허영선 - 20231127 - 151217 - 0000
Document3 pages
2023 자연아카데미 최종발표 서상진,김주원,홍석호,허영선 - 20231127 - 151217 - 0000
서성학
No ratings yet