신용카드 연체 가능성

Uploaded by

5jm9wf7rr5

0% found this document useful (0 votes)

4 views13 pages

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

4 views13 pages

신용카드 연체 가능성

Uploaded by

5jm9wf7rr5

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 13

Search inside document

신용카드 연체 가능성

예측 인공지능 제작

우신영조 - 우신영 , 이진우

목차
• 탐구목적
• 탐구과정
• 코드제작
• 탐구결과
• 개선방안
탐구 목적

• 신용 카드 연체가능성이 존재하는 사용자를 탐지하는 인공지능 제작

- 금융 리스크 관리 강화
: 신용 위험이 높은 사용자를 식별함을 통해서 대출 결정 , 이자율 설정 , 정보에 기반한 결정을 내리기
위함 .
- 건전한 금융 환경 조성
: 신용 문제를 조기에 감지함으로써 사용자가 자신의 금융 상태를 더 잘 관리하고 신용 점수를
유지하거나 향상시킬 수 있는 기회를 갖게 된다 .
탐구 과정

• XGBoost (eXtreme Gradient Boosting)

- 데이터를 처리하며 분류에 특화될 때 사용하기에 유용해서 XGBoost 알고리즘을 사용하였다 .
• 학습 진행 방식
- 과적합 방지
: XGBoost 를 활용하면 규제 매개변수인 라쏘와 릿지를 조정함으로써 모델이 훈련 데이터에 맞춰져
일반화 능력이 떨어짐을 방지할 수 있다 .
- 예측 및 해석
: XGBoost 모델이 신용 불량자일 확률을 예측하고 모델이 어떤 특성을 기반으로 예측을 내렸는지
해석하기 위한 특성 중요도 분석할 수 있음 .
코드 제작
코드 제작
코드 제작
코드 제작
코드 해석

• 데이터 준비 및 시드 설정
: seed_everything 함수는 재현 가능 결과를 위해서 랜덤 시드를 설정하고 훈련 데이터와
테스트 데이터를 불러온다 .
• 데이터 확인
: train.head(3) 과 test.head(3) 을 통해 데이터의 첫 3 개 행을 확인한다 .
• 오버샘플링 결과 시각화
: Target 열은 예측된 확률 중 연체될 확률을 나타낸다 .
• 모델 학습 및 예측 및 결과 확인
: XGBoost 분류기를 학습하고 테스트 데이터에 대해 예측 확률을 구한다 .
코드 해석

• 신용 불량자 에측 과정
1. 랜덤시드 설정 및 데이터 불러오기
: 사용할 시드 설정 후 테스트 데이터를 CSV 파일에서 불러옴
2. 데이터 시각화
: 타겟 변수인 TARGET 을 사용하여서 분포를 히스토그램에 표시해준다 .
3. 데이터 전처리
: 학습 데이터와 테스트 데이터를 나누고 예측 변수와 특성 변수를 나누어 저장한 후 Label
Encoding 수행을 통해서 범주형 변수를 숫자로 변환하여 모델학습을 한다 .
코드 해석

4. 불균형한 클래스 처리
: 불균형한 클래스를 처리함으로써 TARGET 클래스의 불균형을 보완하고 모델의 성능을
향상시킨다 .
5. XGBoost 모델학습
: XGBoost 분류 모델 정의한 후에 오버샘플링된 학습 데이터를 사용해 모델을 학습함
6. 테스트 데이터 예측
: XGBoost 모델을 사용해 테스트 데이터에 대한 예측 확률을 생성함
탐구 결과

• 테스트 파일을 통해서 실행시킨 결과

- baseline_submission.to_csv('baseline_submission.csv', index=False) 코드의 이
부분을 통해서 확률로 나온 결과를 확인할 수 있다 .
- 특정 Test_02440 , Test_02587 에서 각각 0.664982, 0.67286 이 나옴을 확인할 수 있다 .
- public score 로 다음과 같은 점수가 측정됨을 확인할 수 있었다 .
개선 방안

• 하이퍼 파라미터 튜닝
- 각 데이터 세트와 모델에 하이퍼파라미터 세트가 필요하게 되는데 이를 결정하기 위해
하이퍼파라미터 세트를 선택 후 모델을 통해 실행해야한다 .
- 성능 향상
: 예측 정확도 , 정밀도 , 재현율과 같은 성능 지표를 개선하는 것을 의미하며 학습 데이터에
잘 적응하고 일반화 능력의 향상
- 과적합 방지
: 적절한 하이퍼파라미터 설정은 과적합을 방지하는데 효과적으로 작용될 수 있다 .

무작위 표본 합의: 컴퓨터 비전의 강력한 추정
From Everand
무작위 표본 합의: 컴퓨터 비전의 강력한 추정
Fouad Sabry
No ratings yet
객체 감지: 발전, 응용, 알고리즘
From Everand
객체 감지: 발전, 응용, 알고리즘
Fouad Sabry
No ratings yet
Team Analysts Mom-Sitter
Document10 pages
Team Analysts Mom-Sitter
Yeon-seong Jo
No ratings yet
4장 데이터분석개요 2023
Document29 pages
4장 데이터분석개요 2023
김가온
No ratings yet
Predicting Future Problem Gamblers Using Machine Learning Algorithms
Document25 pages
Predicting Future Problem Gamblers Using Machine Learning Algorithms
janicejello
No ratings yet
빅분기 - 필기 - 요약 챕터 3
Document13 pages
빅분기 - 필기 - 요약 챕터 3
kiyoru247
No ratings yet
PASW Stat 18 매뉴얼
Document19 pages
PASW Stat 18 매뉴얼
慧命
No ratings yet
2023 Adsp로 학습한경우 사용자료
Document118 pages
2023 Adsp로 학습한경우 사용자료
jungjh3711
No ratings yet
A Performance Analysis by Adjusting Learning Methods in Stock Price Prediction Model Using LSTM
Document8 pages
A Performance Analysis by Adjusting Learning Methods in Stock Price Prediction Model Using LSTM
Haram Kim
No ratings yet
데이터분석개요
Document56 pages
데이터분석개요
dongkyun ryu
No ratings yet
머신러닝의 알고리즘
Document3 pages
머신러닝의 알고리즘
한율
No ratings yet
1
Document32 pages
1
Youngsue Han
No ratings yet
(Algorithm Trading and quantitative method) Final Project by 20164548 차성재
Document14 pages
(Algorithm Trading and quantitative method) Final Project by 20164548 차성재
차성재
No ratings yet
8장 - 컴퓨터 비전 - 2023 "
Document55 pages
8장 - 컴퓨터 비전 - 2023 "
김가온
No ratings yet
머신러닝의이해
Document37 pages
머신러닝의이해
dongkyun ryu
No ratings yet
패턴인식 개론
Document32 pages
패턴인식 개론
gimotti0201
No ratings yet
데이터레이크 구축하기 Part 2
Document12 pages
데이터레이크 구축하기 Part 2
박호규
No ratings yet
01 Dynamic Factor Model and Deep Learning Algorithm For GDP Nowcasting
Document37 pages
01 Dynamic Factor Model and Deep Learning Algorithm For GDP Nowcasting
LEE
No ratings yet
Computer Application Ability (In Korean)
Document411 pages
Computer Application Ability (In Korean)
wollyclouds
No ratings yet
Untitled
Document86 pages
Untitled
김진호
No ratings yet
Ì Ì Ì Ì DSë Ë 23í Ê Ì Ì Ë Ê °ì Ì
Document98 pages
Ì Ì Ì Ì DSë Ë 23í Ê Ì Ì Ë Ê °ì Ì
felix6606
No ratings yet
동영상의 객체 기반 이종정보를 활용한 관광 이벤트 분류
Document3 pages
동영상의 객체 기반 이종정보를 활용한 관광 이벤트 분류
송우석
No ratings yet
빅분기 - 필기 - 요약 챕터 1
Document3 pages
빅분기 - 필기 - 요약 챕터 1
kiyoru247
No ratings yet
임금정보브리프 (임금체계개편사례) 2021년 제 60호
Document6 pages
임금정보브리프 (임금체계개편사례) 2021년 제 60호
카스테라
No ratings yet
(첨부) 2022년도 중소기업 제조데이터공동활용플랫폼 기술개발사업 품목서
Document13 pages
(첨부) 2022년도 중소기업 제조데이터공동활용플랫폼 기술개발사업 품목서
김태성
No ratings yet
GenAI 최종
Document20 pages
GenAI 최종
이석원
No ratings yet
머신러닝특론 (이관용) 2023
Document2 pages
머신러닝특론 (이관용) 2023
John Kim
No ratings yet
08 +전자제품+유통전략수립
Document108 pages
08 +전자제품+유통전략수립
서종환
No ratings yet
13주차 딥러닝 이미지캡션
Document26 pages
13주차 딥러닝 이미지캡션
전희선
No ratings yet
마케팅 관리론 기초 개론 3
Document23 pages
마케팅 관리론 기초 개론 3
wnrlfla970
No ratings yet
14일차 - 공공데이터 품질진단 및 개선 실습
Document75 pages
14일차 - 공공데이터 품질진단 및 개선 실습
이지원
No ratings yet
빅분기 - 필기 - 요약 챕터 4
Document9 pages
빅분기 - 필기 - 요약 챕터 4
kiyoru247
No ratings yet
Untitled
Document25 pages
Untitled
김은영
No ratings yet
Team3 Fault Localization
Document4 pages
Team3 Fault Localization
윤성주
No ratings yet
마케팅 관리론 기초 개론 2
Document12 pages
마케팅 관리론 기초 개론 2
wnrlfla970
No ratings yet
(강의교안) +02 데이터+분석+기초
Document19 pages
(강의교안) +02 데이터+분석+기초
jungjh3711
No ratings yet
VisualSLAM의 Frontend 성능 개선에 관한 연구
Document18 pages
VisualSLAM의 Frontend 성능 개선에 관한 연구
kangminjae071205
No ratings yet
Module Statistics19
Document34 pages
Module Statistics19
Meonghun Lee
No ratings yet
. 고객과 품질 Ⅳ. Data 의 가공 방법
Document90 pages
. 고객과 품질 Ⅳ. Data 의 가공 방법
sexyqueenswimming
No ratings yet
상속 7장
Document72 pages
상속 7장
박경민
No ratings yet
석사학위논문 디펜스
Document36 pages
석사학위논문 디펜스
jinhyuk
No ratings yet
ch.2 분석변수처리 요점정리
Document3 pages
ch.2 분석변수처리 요점정리
Luka DoBrain
No ratings yet
93112v00 KR Machine Learning Section2 Ebook
Document16 pages
93112v00 KR Machine Learning Section2 Ebook
youngju_rhee
No ratings yet
SQLD 기출문제 모음 (21, 24, 25, 26, 30)
Document42 pages
SQLD 기출문제 모음 (21, 24, 25, 26, 30)
soplay1995
No ratings yet
선형회귀모델
Document37 pages
선형회귀모델
이수연
No ratings yet
WMT Guide Ps Quality
Document27 pages
WMT Guide Ps Quality
Luka DoBrain
No ratings yet
DigiEco BigData의실제활용사례및전망
Document4 pages
DigiEco BigData의실제활용사례및전망
김형진
No ratings yet
빅분기 - 필기 - 요약 챕터 2
Document10 pages
빅분기 - 필기 - 요약 챕터 2
kiyoru247
No ratings yet
(240215) 개인미팅10
Document15 pages
(240215) 개인미팅10
hminju333
No ratings yet
Untitled
Document8 pages
Untitled
Esugen Tamir
No ratings yet
임금정보브리프 (임금체계개편사례) 2020년 제56호
Document6 pages
임금정보브리프 (임금체계개편사례) 2020년 제56호
카스테라
No ratings yet
QA이론문서
Document46 pages
QA이론문서
Geonyeong Ju
100% (3)
PDF 56340 23833
Document1 page
PDF 56340 23833
tammontegc
No ratings yet
USAD
Document23 pages
USAD
Pro Beck
No ratings yet
통합시스템 보안성 평가체계 및 방법연구
Document469 pages
통합시스템 보안성 평가체계 및 방법연구
김근식
No ratings yet
Kali-KM - Security Study - - Windows Event Log (1) - 이벤트 로그의 개념 PDF
Document13 pages
Kali-KM - Security Study - - Windows Event Log (1) - 이벤트 로그의 개념 PDF
stormstone
No ratings yet
(240201) 개인미팅8
Document27 pages
(240201) 개인미팅8
hminju333
No ratings yet
6조
Document2 pages
6조
Mohd Ennab
No ratings yet
ch01 22
Document67 pages
ch01 22
유승민
No ratings yet
자동 타겟 인식: 표적 인식을 위한 컴퓨터 비전 기술의 발전
From Everand
자동 타겟 인식: 표적 인식을 위한 컴퓨터 비전 기술의 발전
Fouad Sabry
No ratings yet