Professional Documents
Culture Documents
Business Understanding - Data Understanding
Business Understanding - Data Understanding
Seedscientific (2020)
& statista (2019)
We are drowning in but starving for
•
•
•
•
•
Index school sex age address famsize Mjob Fjob guardian traveltime studytime failures freetime goout health absences Nilai1 Nilai2 Nilai3 Fail
4
•
•
• •
• •
• •
EFISIENSI : MAKIN CEPAT MAKIN MURAH
Pelopor Data Science
William S. Cleveland
More Traditional
approach
•
•
•
•
•
•
•
•
•
•
•
•
•
•
,
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
• →
•
→
•
→
• →
Business Problem: Tujuan :
Selama ini pembangunan daerah diusulkan
dari kostituen politis sehingga dirasakan Membuat pengujian terhadap profil
pembangunan daerah dilakukan dirasakan pemerintah daerah untuk
tidak merata selama ini. menentukan prioritas pembangunan
pada tahun anggaran 2022
Himpunan data : kriteria data yang diperoleh
dari data BPS per Januari 2021, yaitu data Laju
Pertumbuhan Ekonomi, Indeks Pembangunan
Manusia, Gini Rasio, Tingkat Penganguran
Terbuka, dan Tingkat Kemiskinan.
Contoh Business Problem (2)
Bauran energi mix nasional Selama tahun 2007 – 2017, di
Indonesia masih didominasi Indonesia permintaan energi
energi fosil yaitu Batubara biomass, gas, LPG, dan listrik
Gas dan BBM mempunyai kecenderungan
meningkat
1 2
produksi minyak telah turun drastis
dalam dua dekade terakhir dari puncak
1.624 ribu barel per hari pada 1995
Pembangunan sumber energi yang cukup, Latar 3 menjadi 804 ribu barel minyak per hari
aman, andal dan akrab lingkungan adalah 6 pada 2017. Akibat penurunan produksi
prioritas utama kebijakan energi di Indonesia. Belakang ini dan peningkatan konsumsi dalam
Disamping itu diperlukan juga perencanaan dan negeri yang pesat, Indonesia kini resmi
pengadaan energi yang baik pada setiap menjadi net-importir oil.
wilayah di Indonesia. Oleh karenanya
diperlukan Peramalan Permintaan terkait energi
5 4
• Dalam penggunaan
sehari-hari, data berarti suatu pernyataan yang diterima secara apa
adanya. Data juga merupakan sebuah hasil dari pengukuran atau
pengamatan suatu variabel yang bentuknya dapat berupa kata-kata,
angka maupun citra.
•
•
Date/Time
Tipe Data Deskripsi Contoh Operasi
Ratio • Data yang diperoleh dengan cara pengukuran, • Umur Geometric mean,
(Mutlak) dimana jarak dua titik pada skala sudah • Berat badan harmonic mean,
diketahui • Tinggi badan percent variation
• Mempunyai titik nol yang absolut • Jumlah uang
(*, /)
Interval • Data yang diperoleh dengan cara pengukuran, • Suhu 0°c-100°c, mean, standard
(Jarak) dimana jarak dua titik pada skala sudah • Umur 20-30 tahun deviation, Pearson's
diketahui correlation, t and F
• Tidak mempunyai titik nol yang absolut tests
(+, - )
Ordinal • Data yang diperoleh dengan cara kategorisasi Tingkat kepuasan median,
(Peringkat) atau klasifikasi pelanggan (puas, percentiles, rank
• Tetapi diantara data tersebut terdapat hubungan sedang, tidak puas) correlation, run
atau berurutan tests, sign tests
(<, >)
Nominal • Data yang diperoleh dengan cara kategorisasi • Kode pos mode, entropy,
(Label) atau klasifikasi • Jenis kelamin contingency
• Menunjukkan beberapa object yang berbeda • Nomer id correlation, X2
(=, ) karyawan test
• Nama kota
•
•
•
•
•
•
•
Guide to Data Quality Management: Metrics, Process and Best Practices (scnsoft.com)