Welcome to Scribd!

SunriseTeam

Uploaded by

0% found this document useful (0 votes)

9 views14 pages

The document summarizes a team's final project on credit card fraud detection. It introduces the team members and provides an overview of the contents which include background on rising credit card fraud, the dataset used containing 550,000 credit card transactions, key features of the data, observations from exploratory analysis, the analysis steps taken including preprocessing, EDA, and modeling, and conclusions. Modeling was done using logistic regression and XGBoost, with XGBoost achieving the best accuracy of 97% for fraud classification.

Original Description:

Original Title

PPT_SunriseTeam

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

9 views14 pages

SunriseTeam

Uploaded by

Silvia Maulina

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 14

Search inside document

FINAL

PROJECT
“CREDIT CARD FRAUD DETECTION”
By Sunrise Team
Data Science Bootcamp Batch 30
MEET THE TEAM

RENNY FAZRIN NISA YASMIN QURROTA SILVIA MAULINA TSANIA PUTRI

AINI KHUSNUR ROFIAH
TABLE OF
CONTENTS
1) Background

2) Dataset Story

3) Key Features

4) Observations

5) Analysis Steps

6) Conclusion
BACKGROUND
Credit card fraud is one of the most common types of identity fraud.

Its prevalence rose significantly during the coronavirus pandemic, with

fraudulent credit card applications up 17 percent in the first month of the

pandemic alone.

This has been sustained since, with the National Fraud Hunter Prevention

Service revealing that UK credit card fraud reached a five-year high in the last

three months of 2021

With this in mind, how can financial organizations protect

themselves and their customers from credit card fraud and

minimize its impact on financial institutions worldwide?

DATASET
STORY
 This dataset contains credit card transactions made by European
cardholders in the year 2023.
 It comprises over 550,000 records, and the data has been anonymized to
protect the cardholders' identities.
 The primary objective of this dataset is to facilitate the development of
fraud detection algorithms and models to identify potentially fraudulent
transactions.
Key Features

 id: Unique identifier for each transaction

 V1-V28: Anonymized features representing Observations
various transaction attributes (e.g., time,
 We have 568630 Rows of observations
location, etc.)
having 30 columns.
 Amount: The transaction amount
 'Class' is our Output feature indicating
 Class: Binary label indicating whether the
whether the transaction is fraudulent (1) or
transaction is fraudulent (1) or not (0)
not (0).
ANALYSIS STEPS

1 2 3
Data Preprocessing Ex p lo ra t o ry D a t a Mo de lling
A n a ly s is ( ED A)

• Detecting Missing Values 1. Heatmap 1. Logistic Regression

• Check Duplicates 2. Skewness 2. XGBoost
3. The Distribution of 'amount
feature’
4. Data Preparation
EDA

1
Heatmap * Few features have high co-relation among different features.
* V17 and V18 are highly co-related.
* V16 and V17 are highly co-related.
* V14 has a negative correlation with V4.
* V12 is also negatively correlated with V11.
* V11 is ngetively co-related with V10 and positvely with V4.
* V3 is positevely co-related with V10 and V12.
* V9 and V10 are also positively co-related.
EDA V1
V2
V3
-0.08
-1.40
0.01
V4 -0.04
V5 1.51
V6 -0.20
V7 19.03

2
V8 0.30
V9 0.17
V10 0.74
V11 -0.02
V12 0.07
V13 0.01
V14 0.21
V15 0.01
V16 0.27
V17 0.37

Skewness V18 0.13

V19 -0.01
V20 -1.56
V21 -0.11
V22 0.32
V23 -0.10
V24 0.07
V25 0.02
V26 -0.02  Columns with positive skewness (V7, V20, V27, and 28)
V27 2.76  Columns with negative skewness (V2, V5, V21, and V23)
V28 1.72  Columns with skewness close to zero (Amount and Class)
Amount 0.00
Class 0.00
dtype: float64
EDA

3
The Distribution of
'amount feature'
MODELLING

1
Logistic
Regression
MODELLING

4
XGBoost
Conclusion
 Kinerja model terbaik didapatkan pada metode XGBoost dengan akurasi 0,97 yang
artinya sebesar 97% model dapat mengklasifikasikan true positive dan true negative
dengan benar
 Pengembangan model yang efektif untuk deteksi penipuan adalah penting. Model
harus memiliki kemampuan untuk mengenali pola-pola yang mencurigakan dalam
transaksi kartu kredit.
 Karena pola penipuan dapat berubah seiring waktu, model mungkin perlu disesuaikan
secara berkala untuk tetap efektif dalam mendeteksi penipuan yang baru muncul.
 Memahami fitur-fitur yang paling berpengaruh dalam deteksi penipuan adalah
penting. Beberapa fitur mungkin memiliki keterkaitan yang tinggi dengan
kemungkinan penipuan.
 Pentingnya deteksi dini penipuan kartu kredit. Semakin cepat penipuan terdeteksi,
semakin kecil kerugian yang mungkin terjadi.
THANK YOU

The Ultimate Start-Up Guide - Marketing Lessons, War Stories, and Hard-Won Advice From Leading Venture Capitalists and Angel Investors (PDFDrive)
Document211 pages
The Ultimate Start-Up Guide - Marketing Lessons, War Stories, and Hard-Won Advice From Leading Venture Capitalists and Angel Investors (PDFDrive)
mnjaga
No ratings yet
Visual Statistics: Seeing Data with Dynamic Interactive Graphics
From Everand
Visual Statistics: Seeing Data with Dynamic Interactive Graphics
Forrest W. Young
No ratings yet
VHDL-Lab2 Vivado
Document7 pages
VHDL-Lab2 Vivado
Innerlife
No ratings yet
The Mathematics of Derivatives: Tools for Designing Numerical Algorithms
From Everand
The Mathematics of Derivatives: Tools for Designing Numerical Algorithms
Robert L. Navin
Rating: 3 out of 5 stars
3/5 (1)
WIRED
Document28 pages
WIRED
Sindhu Thomas
0% (1)
Xcode Workspace
Document124 pages
Xcode Workspace
simpreets
No ratings yet
Comunicación: Desarrollado Por Hyundai Motor Company. Todos Los Derechos Reservados
Document25 pages
Comunicación: Desarrollado Por Hyundai Motor Company. Todos Los Derechos Reservados
carlos serna
No ratings yet
Quantitative Finance: Its Development, Mathematical Foundations, and Current Scope
From Everand
Quantitative Finance: Its Development, Mathematical Foundations, and Current Scope
T. Wake Epps
No ratings yet
MarboréAMM
Document235 pages
MarboréAMM
Raf De Maertelaere
No ratings yet
Gurgaon Chamber of Commerce & Industry (GCCI)
Document49 pages
Gurgaon Chamber of Commerce & Industry (GCCI)
amandeep
No ratings yet
Alma Lasers Accent Prime Service Manual
Document164 pages
Alma Lasers Accent Prime Service Manual
cankutayhotmail.com
100% (1)
What Is Multiple Regression Analysis?
Document27 pages
What Is Multiple Regression Analysis?
Faheemudheen K
No ratings yet
Finallll
Document5 pages
Finallll
Yasmeen Yasser
No ratings yet
Online Fraud Detection
Document22 pages
Online Fraud Detection
farahzayani82
No ratings yet
IT12 DigD CS21 DigD - Module 8
Document6 pages
IT12 DigD CS21 DigD - Module 8
Venice Eve Pelima
No ratings yet
Digital Logic Design Notes
Document52 pages
Digital Logic Design Notes
Awet Abraha
100% (2)
Lecture 15 - Metabolite Data Analysis March 18 Taken
Document56 pages
Lecture 15 - Metabolite Data Analysis March 18 Taken
Eelynn Tan
No ratings yet
Statistics For The Lazy Machine Learner in All of Us
Document23 pages
Statistics For The Lazy Machine Learner in All of Us
Clément Moutard
No ratings yet
CS2202 Digital Principles and System Design Ms.R.HARINI/Lect/ECE
Document12 pages
CS2202 Digital Principles and System Design Ms.R.HARINI/Lect/ECE
sam_paul
No ratings yet
Error Detection
Document29 pages
Error Detection
krishbathija
No ratings yet
B3-201-2018 - Developing and Using Justifiable Asset Health Indices For Tactical and Strategic Risk Management
Document10 pages
B3-201-2018 - Developing and Using Justifiable Asset Health Indices For Tactical and Strategic Risk Management
NamLe
No ratings yet
Lab2 - Numbering Systems
Document8 pages
Lab2 - Numbering Systems
wert1a2
No ratings yet
Multivariate Analysis
Document7 pages
Multivariate Analysis
Arundhati Dutta
No ratings yet
2nd Presentation
Document24 pages
2nd Presentation
Salman Waheed
No ratings yet
Lecture 2 Part 1
Document42 pages
Lecture 2 Part 1
blanksheet114
No ratings yet
How To Build An Attrition Analysis Model
Document10 pages
How To Build An Attrition Analysis Model
msrron
100% (4)
Evaluate and Quantify The Drift of A Measuring Instrument
Document13 pages
Evaluate and Quantify The Drift of A Measuring Instrument
Ndra Pompomorin
No ratings yet
Digital Science Notes
Document127 pages
Digital Science Notes
Parvin Badoni
No ratings yet
Beyond The Doomsday Economics of "Proof-Ofwork" in Cryptocurrencies
Document31 pages
Beyond The Doomsday Economics of "Proof-Ofwork" in Cryptocurrencies
Camilo Andrés Acosta Franco
No ratings yet
Dimensionality Reduction: MAN-522: Computer Vision
Document97 pages
Dimensionality Reduction: MAN-522: Computer Vision
ميامي حميد خليف
No ratings yet
Digital System Design: Implementation of Combinational Circuits
Document14 pages
Digital System Design: Implementation of Combinational Circuits
AL RIZWAN
No ratings yet
Session 01 Introduction
Document16 pages
Session 01 Introduction
mohammedsaniyaamrin
No ratings yet
Laboratory Exercise 7
Document4 pages
Laboratory Exercise 7
BriNyan
No ratings yet
Assignment Ya Mvuma
Document5 pages
Assignment Ya Mvuma
Alango Jr Tz
No ratings yet
Data Mining
Document30 pages
Data Mining
Tinashe Kota
No ratings yet
Top Vulnerable Applications - 2010
Document5 pages
Top Vulnerable Applications - 2010
GuillaumeB
No ratings yet
Course of Digital Techniques Lectures2 017 - PDF - 1
Document51 pages
Course of Digital Techniques Lectures2 017 - PDF - 1
juber mulla
No ratings yet
REP DogeZilla Coin 2021 11 30
Document28 pages
REP DogeZilla Coin 2021 11 30
John Nes
No ratings yet
Av-31n-01 (Plan-02)
Document82 pages
Av-31n-01 (Plan-02)
muhammad javaid
No ratings yet
DAFM CIA-1 by Anand Krishnan G 2227210
Document9 pages
DAFM CIA-1 by Anand Krishnan G 2227210
Prasath Nagendra
No ratings yet
QTQ Excel Example 1
Document16 pages
QTQ Excel Example 1
louisdeloki
No ratings yet
Session-Correlation and Regression
Document24 pages
Session-Correlation and Regression
Dhivya Sivanantham
No ratings yet
Bolted Joint 070506
Document146 pages
Bolted Joint 070506
vijay10484
No ratings yet
Unit - 1 Number Systems & Boolean Algebra: Introduction About Digital System
Document111 pages
Unit - 1 Number Systems & Boolean Algebra: Introduction About Digital System
RCEE-2020 ONLINE FDP
No ratings yet
Unit I - Number Systems: Numbering System
Document97 pages
Unit I - Number Systems: Numbering System
padma princess
No ratings yet
EGeng
Document48 pages
EGeng
Ajmal Muhammad
No ratings yet
Binary, Parity, Error Detecting Codes
Document33 pages
Binary, Parity, Error Detecting Codes
20R25A0420 KONDAMUDI VAMSI ANURAG
100% (1)
Calculate Pre-Defined Weld Pattern: Commands
Document6 pages
Calculate Pre-Defined Weld Pattern: Commands
Nicolás Morgado Carrasco
No ratings yet
Darcet 2023 Vision Transformers Need Registers
Document16 pages
Darcet 2023 Vision Transformers Need Registers
cuong.huy.ptr.3
No ratings yet
Risk Analysis, Real Options, and Capital Budgeting
Document40 pages
Risk Analysis, Real Options, and Capital Budgeting
ANKIT AGARWAL
No ratings yet
Tutorial 5
Document23 pages
Tutorial 5
奇異小孩
No ratings yet
Digital Signal Processing Fundamentals
Document40 pages
Digital Signal Processing Fundamentals
nandini
No ratings yet
Theory and Viva - Voca
Document26 pages
Theory and Viva - Voca
Dipthi N
No ratings yet
Income Qualification Project3
Document40 pages
Income Qualification Project3
Nikhil
No ratings yet
Cikuit: Asynchronous Design
Document14 pages
Cikuit: Asynchronous Design
cuick
No ratings yet
Final 2015 W
Document4 pages
Final 2015 W
Việt Nguyễn
No ratings yet
Assurance & Security Task Testimony
Document11 pages
Assurance & Security Task Testimony
fayza qureshi
No ratings yet
A Privacy-Preserving Central Bank Ledger For Central Bank Digital Currency
Document37 pages
A Privacy-Preserving Central Bank Ledger For Central Bank Digital Currency
aldar
No ratings yet
Unit 4 FM
Document47 pages
Unit 4 FM
Alexis Parris
No ratings yet
Demp Session - 2 VP
Document65 pages
Demp Session - 2 VP
RAHUL KUMAR R
No ratings yet
Sapient Problem Statement
Document3 pages
Sapient Problem Statement
somil dua
No ratings yet
HPC Mini Project
Document12 pages
HPC Mini Project
shaikhsumerjaheermiya1234
No ratings yet
Ch06 OBE-Error Detection
Document30 pages
Ch06 OBE-Error Detection
NooraFukuzawa Nor
No ratings yet
Chapter 2
Document38 pages
Chapter 2
Inshal Khan
No ratings yet
Session - 06 - Encoder Decoder
Document16 pages
Session - 06 - Encoder Decoder
Arnold
No ratings yet
Boarding Pass: Travelling With Check-In Bags? Travelling With Cabin (Carry On) Baggage Only? Airport Reporting Timings
Document1 page
Boarding Pass: Travelling With Check-In Bags? Travelling With Cabin (Carry On) Baggage Only? Airport Reporting Timings
Mahesh Gajjelli
No ratings yet
Load Cart
Document4 pages
Load Cart
Akhmad Syar
No ratings yet
Document
Document3 pages
Document
John Paul Jarlego
No ratings yet
J.P. INSTRUMENTS EDM-730 ENGINE MONITORING SYSTEM - Aircraft Spruce (2017)
Document3 pages
J.P. INSTRUMENTS EDM-730 ENGINE MONITORING SYSTEM - Aircraft Spruce (2017)
Петр
No ratings yet
DRV10983 12-To 24-V, Three-Phase, Sensorless BLDC Motor Driver
Document61 pages
DRV10983 12-To 24-V, Three-Phase, Sensorless BLDC Motor Driver
Yogesh R Suryawanshi
No ratings yet
Web Development Report
Document26 pages
Web Development Report
scam567321
No ratings yet
Bu - Mechanical Regulations
Document4 pages
Bu - Mechanical Regulations
ONA, Melizza Anne C.
No ratings yet
Image, Impact and Making An Impression - Unit 7
Document12 pages
Image, Impact and Making An Impression - Unit 7
Sai Amrutha
No ratings yet
Jerome Wolken
Document2 pages
Jerome Wolken
jeromehwolken
No ratings yet
Solutions Assignment 7
Document7 pages
Solutions Assignment 7
Sammei Danniyel
No ratings yet
" Music Player Using Python": Project Report On
Document38 pages
" Music Player Using Python": Project Report On
Freelancer Work
No ratings yet
Efi Energy Wholesale Catalog Wholesale - Catalog
Document60 pages
Efi Energy Wholesale Catalog Wholesale - Catalog
larcone
No ratings yet
New Media Characteristics
Document14 pages
New Media Characteristics
Ritika Mahajan
No ratings yet
W1-L1 Ntroduction Power Electronics
Document46 pages
W1-L1 Ntroduction Power Electronics
xDavidx :V
No ratings yet
Dynamic Position Move
Document17 pages
Dynamic Position Move
Roberto Montoya
No ratings yet
285 Relee Tip URF Pentru Comutatoare
Document8 pages
285 Relee Tip URF Pentru Comutatoare
hagg
No ratings yet
Skybox Partner Training - Personas
Document9 pages
Skybox Partner Training - Personas
Prashant Biswas
No ratings yet
BC9180-STAR: Base Station/Charger
Document28 pages
BC9180-STAR: Base Station/Charger
el.ambiguo
No ratings yet
IMSL FortranFC
Document77 pages
IMSL FortranFC
David Zorrilla Cuenca
No ratings yet
Dynamic Pricing Software
Document12 pages
Dynamic Pricing Software
muhammad
No ratings yet
Making Type 1 Fonts For Vietnamese
Document6 pages
Making Type 1 Fonts For Vietnamese
MihaiLeonte
No ratings yet
Topic 5. Composition
Document12 pages
Topic 5. Composition
Fee21
No ratings yet
Training Report
Document10 pages
Training Report
Apoorv
No ratings yet
Unit-3: 1. Static Channel Allocation in Lans and Mans
Document30 pages
Unit-3: 1. Static Channel Allocation in Lans and Mans
09 rajesh Dodda
No ratings yet
Holiday Homework of Science Class 6
Document5 pages
Holiday Homework of Science Class 6
cfp4gtpa
100% (2)