You are on page 1of 65

1991 2010 2013 2018 2019 2020 2025

First World Wide 90% data created IN A MINUTE 168 ZB created


Web Page in 2011-2012 188M emails
4,5M videos
2 ZB data created 500hours video uploaded’
347K users scrolling
Instagram
33 ZB data 47 ZB data
created created

Seedscientific (2020)
& statista (2019)
We are drowning in but starving for

John Naisbitt, Megatrends, 1988





Index school sex age address famsize Mjob Fjob guardian traveltime studytime failures freetime goout health absences Nilai1 Nilai2 Nilai3 Fail

0 GP M 18 U GT3 other services father 1 2 1 5 4 2 0 35 35 0 1


1 GP F 19 R GT3 other other other 1 3 1 1 2 3 40 65 55 55 0
2 GP F 18 U GT3 other services father 1 4 0 5 5 2 4 75 70 70 0
3 GP M 16 U GT3 other other father 2 4 0 3 2 5 0 65 75 75 0
4 GP F 17 R LE3 services services mother 1 3 0 3 2 3 3 55 55 55 0
5 GP F 18 U LE3 other other mother 2 2 0 4 3 3 2 55 55 55 0
6 GP F 17 U GT3 other other mother 1 2 0 4 4 1 4 45 45 50 0
7 GP M 16 U LE3 other other mother 2 2 0 4 2 5 18 45 35 30 1
8 MS M 18 R GT3 other other father 2 1 1 4 3 3 14 30 25 25 1
9 MS M 18 U GT3 teacher teacher father 1 2 0 2 4 2 4 75 70 70 0
10 GP F 17 U LE3 other other mother 2 2 0 4 4 1 2 70 75 75 0
11 MS M 18 R LE3 services other mother 3 1 0 4 1 5 0 55 60 50 0
12 GP F 15 U GT3 health services father 1 2 3 3 2 3 0 30 35 0 1
13 GP F 18 R GT3 other services mother 2 2 0 1 1 5 75 50 45 45 1
14 GP F 18 U LE3 other other other 1 2 0 3 3 2 0 40 40 0 1
15 GP M 15 U LE3 services other mother 1 2 0 2 2 1 0 80 90 95 0
16 MS M 20 U LE3 services services other 1 2 2 5 4 4 11 45 45 45 1
17 GP F 16 U GT3 teacher services mother 1 3 0 3 2 5 0 65 65 70 0
18 GP F 17 R GT3 at_home services father 1 3 0 3 4 5 0 55 55 50 0
19 GP F 16 U LE3 other other mother 2 2 0 4 5 4 4 50 55 45 1
20 GP M 17 U LE3 services other mother 2 1 0 5 4 5 30 40 40 40 1
1

4

• •

• •

• •
EFISIENSI : MAKIN CEPAT MAKIN MURAH
Pelopor Data Science
William S. Cleveland
More Traditional
approach













,














• →



• →
Business Problem: Tujuan :
Selama ini pembangunan daerah diusulkan
dari kostituen politis sehingga dirasakan Membuat pengujian terhadap profil
pembangunan daerah dilakukan dirasakan pemerintah daerah untuk
tidak merata selama ini. menentukan prioritas pembangunan
pada tahun anggaran 2022
Himpunan data : kriteria data yang diperoleh
dari data BPS per Januari 2021, yaitu data Laju
Pertumbuhan Ekonomi, Indeks Pembangunan
Manusia, Gini Rasio, Tingkat Penganguran
Terbuka, dan Tingkat Kemiskinan.
Contoh Business Problem (2)
Bauran energi mix nasional Selama tahun 2007 – 2017, di
Indonesia masih didominasi Indonesia permintaan energi
energi fosil yaitu Batubara biomass, gas, LPG, dan listrik
Gas dan BBM mempunyai kecenderungan
meningkat

1 2
produksi minyak telah turun drastis
dalam dua dekade terakhir dari puncak
1.624 ribu barel per hari pada 1995
Pembangunan sumber energi yang cukup, Latar 3 menjadi 804 ribu barel minyak per hari
aman, andal dan akrab lingkungan adalah 6 pada 2017. Akibat penurunan produksi
prioritas utama kebijakan energi di Indonesia. Belakang ini dan peningkatan konsumsi dalam
Disamping itu diperlukan juga perencanaan dan negeri yang pesat, Indonesia kini resmi
pengadaan energi yang baik pada setiap menjadi net-importir oil.
wilayah di Indonesia. Oleh karenanya
diperlukan Peramalan Permintaan terkait energi
5 4

Peramalan permintaan energi adalah salah satu Negara-negara berkembang saat


alat kebijakan yang digunakan oleh pembuat
ini meningkat dengan pesat
keputusan di seluruh dunia. Menaksir terlalu
tinggi permintaan energi dapat menyebabkan dalam permintaan energi
redundansi sumber daya, sedangkan menaksir komersial dunia sejalan dengan
terlalu rendah akan kebutuhan energi dapat pertumbuhan ekonomi
menyebabkan krisis energi yang serius
Contoh Business Problem (2)

Rumusan Masalah Tujuan Analisis


1. Berapa prediksi besarnya permintaan 1. Meramalkan permintaan energi di Indonesia Regresi Linear
energi di Indonesia dari tahun 2020 sampai tahun 2029
sampai tahun 2029 ?
Contoh Business Problem (3)

• Dalam penggunaan
sehari-hari, data berarti suatu pernyataan yang diterima secara apa
adanya. Data juga merupakan sebuah hasil dari pengukuran atau
pengamatan suatu variabel yang bentuknya dapat berupa kata-kata,
angka maupun citra.


Date/Time
Tipe Data Deskripsi Contoh Operasi
Ratio • Data yang diperoleh dengan cara pengukuran, • Umur Geometric mean,
(Mutlak) dimana jarak dua titik pada skala sudah • Berat badan harmonic mean,
diketahui • Tinggi badan percent variation
• Mempunyai titik nol yang absolut • Jumlah uang
(*, /)
Interval • Data yang diperoleh dengan cara pengukuran, • Suhu 0°c-100°c, mean, standard
(Jarak) dimana jarak dua titik pada skala sudah • Umur 20-30 tahun deviation, Pearson's
diketahui correlation, t and F
• Tidak mempunyai titik nol yang absolut tests
(+, - )
Ordinal • Data yang diperoleh dengan cara kategorisasi Tingkat kepuasan median,
(Peringkat) atau klasifikasi pelanggan (puas, percentiles, rank
• Tetapi diantara data tersebut terdapat hubungan sedang, tidak puas) correlation, run
atau berurutan tests, sign tests
(<, >)
Nominal • Data yang diperoleh dengan cara kategorisasi • Kode pos mode, entropy,
(Label) atau klasifikasi • Jenis kelamin contingency
• Menunjukkan beberapa object yang berbeda • Nomer id correlation, X2
(=, ) karyawan test
• Nama kota






Guide to Data Quality Management: Metrics, Process and Best Practices (scnsoft.com)

You might also like