You are on page 1of 59

Membangun Aplikasi Machine 

Learning dengan
Python: Memprediksi Penyakit Diabetes

Dataset: Data Pasien Suku Pima Indian di Arizona, AS


Sumber Data: University of California Irvine (Diabetes Patient Records)

Dr. Fal Sadikin
AGENDA
INTRODUCTION TO MACHINE LEARNING
(TRADITIONAL CONTROL LOGIC (RULE‐BASED APPROACH )VS MACHINE LEARNING)
TYPE OF MACHINE LEARNING
SUPERVISED MACHINE LEARNING

Dataset of Housing and Price
UNSUPERVISED MACHINE LEARNING

Dataset of Mixing Voice
BIG PICTURE OF MACHINE LEARNING
MACHINE LEARNING WORKFLOW
MACHINE LEARNING WORKFLOW

• Memprediksi Kemungkinan Diabetes


• Cakupan dan Sumber Data
• Pima Indian Diabetes Data
• UCI Machine Learning Repository
• Mengenali dan memahami Fitur fitur data, memahami fitur fitur penting
• Target akurasi
• Misal: 70% Accuracy
MACHINE LEARNING WORKFLOW

• 60‐80% of a ML project is spent getting, cleaning, and organizing data
MACHINE LEARNING WORKFLOW
CHOOSING MACHINE LEARNING ALGORITHMS

http://aka.ms/MLCheatSheet
MACHINE LEARNING WORKFLOW

Training: Menggunakan specific data untuk mengajarkan


machine learning (algorithm) untuk membuat specific 
prediction model
TRAINING OVERVIEW
TRAINING/TEST SPLITTING PROBLEM
CROSS VALIDATION
Akurasi
Over‐fitting Problem
SUPERVISED MACHINE LEARNING

Dataset of Housing and Price
MACHINE LEARNING WORKFLOW

• Options for Improving Performance:
 Adjust training settings
 Retrain with better dataset
 Select a better algorithm
 Rethink the problem

You might also like