You are on page 1of 11

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/311650067

BIG DATA ANALISIS: SEBUAH PELUANG DAN TANTANGAN LULUSAN


INFORMATIKA DALAM MENGHADAPI PASAR GLOBAR DI INDONESIA TIMUR

Conference Paper · December 2016

CITATIONS READS

0 1,196

1 author:

Haviluddin Haviluddin
Universitas Mulawarman
62 PUBLICATIONS   152 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Data mapping process to handle semantic data problem on student grading system View project

IT Government View project

All content following this page was uploaded by Haviluddin Haviluddin on 25 March 2017.

The user has requested enhancement of the downloaded file.


Proceedings Seminar Nasional Riset Ilmu Komputer (SNRIK 2016) Universitas Muslim Indonesia Vol. 1, Desember 2016
Makassar – 14 Desember 2016 ISSN : 2443-048X

PROCEEDINGS SNRIK 2016


(Seminar Nasional Riset Ilmu Komputer)
Volume 1- Desember 2016

ISSN : 2443-048X

PENERBIT

Fakultas Ilmu Komputer Universitas Muslim Indonesia

Alamat Editor :
Fakultas Ilmu Komputer Universitas Muslim Indonesia Makassar - Indonesia 90234
Telp . +6281355001102, e-mail : snrik@umi.ac.id

i
Proceedings Seminar Nasional Riset Ilmu Komputer (SNRIK 2016) Universitas Muslim Indonesia Vol. 1, Desember 2016
Makassar – 14 Desember 2016 ISSN : 2443-048X

PROCEEDINGS SNRIK, Volume 1-2016


Editor : Poetri Lestari Lokapitasari Belluano, S.Kom., M.T.
Desain Sampul : Ilham

Hak cipta © 2016 oleh Fakultas Ilmu Komputer Universitas Muslim Indonesia Makassar. Dilarang
memperbanyak atau memindahkan sebagian atau seluruh ini proceedings ini dalam bentuk apapun,
baik secara elektronis maupun mekanis, termasuk menggandakan, merekam atau dengan sistem
penyimpanan lainnya tanpa izin tertulis dari penerbit.

ISSN : 2443-048X

ii
Proceedings Seminar Nasional Riset Ilmu Komputer (SNRIK 2016) Universitas Muslim Indonesia Vol. 1, Desember 2016
Makassar – 14 Desember 2016 ISSN : 2443-048X

DEWAN REDAKSI
Penanggung Jawab :
Yulita Salim, S.Kom., M.T.

Ketua Dewan Editor :


Poetri Lestari Lokapitasari Belluano, S.Kom., M.T.

Editor Pelaksana :
Siska Anraeni, S.Kom., M.T.
Farniwati Fattah., S.T., M.T.

Reviewer :
DR. Haviluddin,S.Kom.,M.Kom (Universitas Mulawarman)
Drs. Muslim, M.T., Ph.D (Universitas Muslim Indonesia)
DR. Ingrid Nurtanio, M.T. (Universitas Hasanuddin)
DR. Intan Areni, S.T.,M.T. (Universitas Hasanuddin)
Dolly Indra, S.Kom., M.M.SI. (Universitas Muslim Indonesia)

PENERBIT :

Fakultas Ilmu Komputer Universitas Muslim Indonesia


Jl. Urip Sumoharjo KM 5 Makassar, Sulawesi Selatan
Telp . +6281355001102, e-mail : snrik@umi.ac.id

iii
Proceedings Seminar Nasional Riset Ilmu Komputer (SNRIK 2016) Universitas Muslim Indonesia Vol. 1, Desember 2016
Makassar – 14 Desember 2016 ISSN : 2443-048X

BIG DATA ANALISIS: SEBUAH PELUANG DAN TANTANGAN LULUSAN


INFORMATIKA DALAM MENGHADAPI PASAR GLOBAR DI INDONESIA
TIMUR
Haviluddin, S.Kom., M.Kom., Ph.D.
Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Mulawarman
haviluddin@unmul.ac.id; haviluddin@gmail.com

Abstrak - Makalah ini membahas munculnya machine learning untuk analisis big data. Pertama, machine learning dan
beberapa istilah yang terkait didefinisikan dan dijelaskan secara rinci dan hal ini termasuk artificial intelligence, data mining,
data science, data analytics dan knowledge discovery, statistik dan business intelligence. Definisi ini akan menunjukkan
bagaimana hal ini saling terkait satu sama lain. Kemudian, definisi big data diuraikan berdasarkan tiga hal: Volume, Velocity
dan Variety. Menerapkan strategi data besar yang baik sangat penting untuk menjamin keberhasilan penerapan machine
learning untuk belajar big data. Sebagai hasilnya, tren di big data juga digambarkan dan didefinisikan berdasarkan lanskap
data besar; Infrastruktur, Analytics, Aplikasi, Cross-Infrastruktur/Analytics, Open Sources, Data Source, dan API, Inkubator
dan Sekolah. Makalah ini juga membahas beberapa fasilitas open source yang tersedia untuk publik dalam rangka untuk
memastikan bahwa skala besar aplikasi machine learning dapat terwujud. Akhirnya, dalam kesimpulan, tren besar selama
beberapa bulan terakhir dalam analisis big data telah meningkatnya fokus pada kecerdasan buatan untuk membantu
menganalisis sejumlah besar data dan berasal wawasan prediktif. Artificial intelligence/machine learning sekarang
mempercepat kecenderungan munculnya lapisan aplikasi dari big data. Kombinasi big data dan artificial intelligence akan
mendorong inovasi yang luar biasa hampir di setiap industri. Dari perspektif itu, kesempatan big data mungkin bahkan lebih
besar dari apa yang orang-orang pikirkan.

Kata Kunci – Big Data, AI, Data Mining, Data Analytics, Data Science, Knowledge Discovery, Business Intelligence

I. PENDAHULUAN memungkinkan komputer untuk melakukan tugas


yang cerdas menyerupai kerja manusia, seperti
Saat ini, ilmu kecerdasan buatan menjadi
menyelesaikan tugas-tugas prediksi, deteksi,
lebih terlihat dalam industri perangkat lunak. Hal ini
klasifikasi dan klasterisasi. Ini adalah ilmu yang
disebabkan banyaknya permintaan untuk analisis data
melibatkan pengembangan algoritma belajar mandiri.
yang didorong oleh pertumbuhan data itu sendiri, baik
Mesin melakukan hal ini dengan tugas berat analisis
data yang bersifat terstruktur dan tidak terstruktur.
statistik banyak dan banyak data.
Dapat dikatakan bahwa penelitian tentang kecerdasan
buatan dimulai sejak adanya komputer itu sendiri. Beberapa istilah yang terlibat dalam
Banyak penelitian saat ini menyangkut subfield itu menggambarkan atau terkait dengan mesin pintar
disebut "deep learning", di mana ia merupakan meliputi kecerdasan buatan/artificial intelligence
penyempurnaan modern "mesin belajar", di mana (AI), data mining, data science, analisis data dan
komputer belajar tentang cara mengajar diri sendiri knowledge discovery, statistik dan Business
tugas dengan pengolahan dan belajar terhadap data Intelligence, dalam Gambar 1.
besar yang mencakup terstruktur dan tidak terstruktur.
Dalam rangka untuk memahami mesin pintar
Oleh karena itu, berbagai macam algoritma (machine learning) dan bagaimana istilah ini saling
kecerdasan buatan banyak ditawarkan dalam analisa berhubungan dengan istilah lain, setiap istilah yang
data besar. Tujuannya adalah untuk menjembatani terlibat akan ditentukan dan hubungan antara dua
kesenjangan tugas yang sulit bagi manusia tetapi istilah juga didefinisikan. Pertama, bidang studi yang
mereka mudah untuk komputer. tertarik dalam pengembangan algoritma komputer
untuk mengubah data ke dalam tindakan cerdas
Mesin pintar (Machine Learning) adalah cara
dikenal sebagai machine learning. Machine learning
memanfaatkan komputer untuk mengetahui hal-hal
juga menggunakan statistik (kebanyakan statistik
yang rumit ketika memproduksi diri mereka sendiri
inferensial) untuk mengembangkan algoritma belajar
aturan programmer. Dengan kata lain, mesin pintar
mandiri (self-learning algorithms). Sementara,
mengacu pada metodologi yang digunakan dan

1
Proceedings Seminar Nasional Riset Ilmu Komputer (SNRIK 2016) Universitas Muslim Indonesia Vol. 1, Desember 2016
Makassar – 14 Desember 2016 ISSN : 2443-048X

statistics didefinisikan sebagai studi tentang membutuhkan bangunan atau topologi dan
bagaimana untuk mengumpulkan, mengatur, mengevaluasi model desain mana yang dimaksudkan
menganalisis, dan menginterpretasikan informasi untuk membantu perubahan panduan dalam keputusan
numerik dari data. Di sisi lain, data mining adalah bisnis. Di sisi lain, dalam profesi data analytics, analis
praktek menerapkan algoritma (sebagian besar data yang biasanya melakukan peran migrasi data dan
algoritma machine learning) dengan data yang visualisasi yang fokus pada menggambarkan masa
tersedia dari domain untuk memecahkan masalah lalu. Gambar 2 mengilustrasikan hubungan yang ada
domain terkait. antara istilah yang terlibat dalam menggambarkan
machine learning.

Gambar 2. Ilustrasi hubungan dalam machine learning

II. BIG DATA


Gambar 1 Isitilah terkait machine learning
Big data atau data besar adalah istilah yang
berkembang yang menggambarkan volume secara
Data Mining adalah bagian dari proses terstruktur, semistructured dan tidak terstruktur
penemuan pengetahuan (knowledge discovery kumpulan data yang memiliki potensi untuk
process), dimana penemuan pengetahuan ditambang/diolah menjadi informasi. Big data sering
didefinisikan sebagai ilmu untuk menemukan pola dikaitkan dengan 3Vs: kapasitas data extreme
dalam set data. Kecerdasan buatan (artificial (volume), jenis/tipe data (variety), dan kecepatan
intelligence) adalah kecerdasan yang ditunjukkan oleh proses data (velocity).
mesin. Dengan kata lain, kecerdasan buatan adalah
Dimana, volume berkaitan dengan semua
ilmu untuk mengembangkan sistem atau perangkat
data berasal dari berbagai sumber, seperti catatan
lunak dalam meniru perilaku manusia seperti
penjualan, catatan hasil eksperimen, catatan real-time
merespon. Dengan demikian, machine learning dapat
sensors IoT dan lain-lain. Data-data tersebut dilakukan
dianggap sebagai bagian dari kecerdasan buatan.
preprocessed sebelum dilakukan analisa. Data
Ketika menganalisis data dalam bisnis, business
mungkin juga ada di berbagai jenis file, termasuk data
intelligence didefinisikan sebagai proses teknologi
terstruktur, seperti SQL - toko database; data tidak
untuk menganalisis data dan menyajikan informasi
terstruktur, seperti file dokumen; atau streaming data
kemudian ditindaklanjuti untuk membantu eksekutif
dari sensor.
perusahaan, manajer bisnis dan pengguna akhir
lainnya dalam membuat keputusan bisnis yang lebih Selanjutnya, variety, data yang besar
baik. Dalam profesi data science, seorang ilmuwan mungkin melibatkan beberapa, sumber data simultan,
data sering terlibat dalam pembersihan dan manipulasi yang tidak mungkin jika diintegrasikan. Misalnya,
data untuk mendukung pemodelan mereka serta proyek analisis data yang besar mungkin mencoba

2
Proceedings Seminar Nasional Riset Ilmu Komputer (SNRIK 2016) Universitas Muslim Indonesia Vol. 1, Desember 2016
Makassar – 14 Desember 2016 ISSN : 2443-048X

untuk mengukur keberhasilan suatu produk dan dalam rangka untuk memastikan bahwa semua
penjualan masa depan dengan menghubungkan masa departemen yang terlibat dalam mengadopsi teknologi
lalu data penjualan, kembali data dan ulasan data big data tersebut. Dengan kata lain, itu membutuhkan
pembeli online untuk produk tersebut. interaksi teknologi, orang dan proses. Anda mungkin
perlu untuk memperoleh, menyimpan dan
Akhirnya, velocity mengacu pada kecepatan
membersihkan data, query, menganalisa dan
data yang besar harus dianalisa. Setiap proyek analisis
memvisualisasikan data. Beberapa dari proses ini
data besar akan menelan, menghubungkan dan
dapat dilakukan dengan mengerahkan algoritma tetapi
menganalisis sumber data, dan kemudian membuat
beberapa membutuhkan intervensi manusia.
jawaban atau hasil didasarkan pada permintaan
Semuanya harus terintegrasi mulus. Pada akhirnya,
menyeluruh. Ini berarti analis manusia harus memiliki
untuk semua konsep big data ini untuk bekerja,
pemahaman yang rinci dari data yang tersedia dan
seluruh organisasi termasuk semua tingkat manajemen
memiliki beberapa sense atas apa jawaban yang
perlu berkomitmen untuk membangun budaya
mereka cari. Velocity juga bermakna, analisis data
berbasis data berfokus pada konsep big data.
besar berekspansi ke bidang-bidang seperti machine
Menerapkan strategi big data yang baik
learning dan artificial intelligence, di mana proses
sangat penting untuk menjamin keberhasilan
analisis meniru persepsi dengan mencari dan
penerapan machine learning untuk mempelajari big
menggunakan pola dalam data yang dikumpulkan.
data. Sebagai hasilnya, tren di big data juga
Gambar 3 menunjukkan big data area.
digambarkan dan didefinisikan berdasarkan lanskap
data besar; Infrastruktur, Analytics, Aplikasi, Cross-
Infrastruktur/Analytics, Open Source, sumber data dan
API, Inkubator, dan sekolah. Gambar 4
mengilustrasikan lanskap big data yang dapat
diintegrasikan untuk mengadopsi teknologi big data.

Gambar 3. Big Data area

III. TREND PADA BIG DATA


Konsep big data diperkenalkan kembali pada
tahun 2006 ketika Hadoop diciptakan. Namun, minat
dalam konsep "Big Data" mencapai puncak antara
Gambar 4. lanskap big data
tahun 2011 dan 2014. Pada 2015, orang-orang mulai
melihat artificial intelligence dan machine learning. IV. OPEN SOURCE MACHINE LEARNING
Saat ini, konsep big data mungkin menjadi topik panas Dapat dikatakan, artificial intelligence dan
namun tidak banyak peneliti bisa melihat hal-hal yang machine learning lulus dari fiksi ilmiah dan menjelma
berjalan di belakang konsep big data. menjadi realitas. Diperkirakan bahwa sekitar setengah
Dalam rangka untuk mengadopsi teknologi dari perusahaan besar saat ini bereksperimen dengan
big data, memerlukan proses, anggaran, manajemen proyek AI. Beberapa vendor, termasuk Facebook,
proyek, pilot, penyebaran departemen, audit Google, IBM, Intel dan Microsoft, telah
keamanan penuh, dan lain-lain. Semua ini diperlukan menyumbangkan proyek pembangunan machine

3
Proceedings Seminar Nasional Riset Ilmu Komputer (SNRIK 2016) Universitas Muslim Indonesia Vol. 1, Desember 2016
Makassar – 14 Desember 2016 ISSN : 2443-048X

learning ke open source. Misalnya, komunitas open dengan penekanan khusus pada deep learning dan
source sekarang mungkin dapat menggunakan dan convolutional nets. Torch banyak digunakan di
menguji beberapa proyek pembangunan machine sejumlah laboratorium akademik seperti di
learning ini yang meliputi SystemML, TensorFlow, Google/DeepMind, Twitter, NVIDIA, AMD, Intel,
GitHub, Trusted Analytics Platform (TAP) dan FAIR. dan banyak perusahaan lainnya. Facebook AI
SystemML dirilis oleh IBM, adalah fleksibel, Research (FAIR) juga akan merilis desain server
scalable model sistem machine learning. Karakteristik hardware yang telah dioptimalkan dari machine
yang membedakan SystemML adalah: Algoritma learnig ke open source. Facebook telah mengajukan
customizability melalui Bahasa pemrograman seperti bahan desain sistem berbasis GPU ke Open Compute
R dan Python, multiple execution modes, termasuk Project (OCP).
Spark MLContext, Spark Batch, Hadoop Batch,
Standalone, dan JMLC. Algoritma ini dianggap V. KESIMPULAN
sebagai optimasi otomatis berdasarkan data dan Tren besar selama beberapa bulan terakhir
karakteristik cluster untuk menjamin efisiensi dan dalam analisa big data telah meningkatnya fokus pada
skalabilitas. artificial intelligence untuk membantu menganalisis
TensorFlow adalah sistem machine learning sejumlah besar data dan berasal dari berbagai macam
terbaru dari Google dan bersifat open source. tipe data (predictive). Hubungan antara artificial
TensorFlow telah memungkinkan Googlers untuk intelligence dan big data adalah begitu dekat sehingga
membangun neural network semakin besar dan beberapa ahli industri sekarang berpikir bahwa
pelatihan untuk ribuan core dalam pusat data mereka. artificial intelligence tidak dapat dipisahkan dengan
Microsoft juga mengumumkan rilis yaitu big data. Pada gilirannya, artificial intelligence
Distributed Machine Learning Toolkit untuk sekarang membantu big data memenuhi janjinya.
komunitas pengembang, yang tersedia di GitHub. Dalam banyak hal, kita masih di babak awal
Toolkit, tersedia sekarang di GitHub, dirancang untuk dari fenomena big data. Beberapa tahun belakangan
didistribusikan machine learning menggunakan ini, membangun infrastruktur untuk menyimpan dan
beberapa komputer secara paralel untuk memecahkan proses data dalam jumlah besar. Artificial
masalah yang kompleks. Ini berisi parameter server- intelligence/machine learning sekarang mempercepat
based programing framework, yang membuat tugas kecenderungan munculnya lapisan aplikasi dari big
machine learning dalam menganalisa big data yang data. Kombinasi big data dan artificial intelligence
sangat terukur, efisien dan fleksibel. Ini juga berisi dua akan mendorong inovasi yang luar biasa hampir di
algoritma pembelajaran mesin didistribusikan, yang setiap industri. Dari perspektif itu, kesempatan big
dapat digunakan untuk melatih model topik tercepat data mungkin bahkan lebih besar dari apa yang orang-
dan terbesar bahkan model superbesar di dunia. orang pikirkan.
Intel juga membuat open source yang Big data terus tumbuh dan berkembang,
dinamakan Trusted Analytics Platform, lebih dikenal namun, istilah itu sendiri mungkin akan hilang, atau
sebagai TAP. TAP adalah perangkat lunak open bahkan tak seorang pun akan menggunakannya lagi.
source, dioptimalkan untuk kinerja dan keamanan, Ini adalah nasib ironis teknologi memungkinkan
yang mempercepat penciptaan kolaborasi cloud-native sukses yang mereka menjadi luas, maka di mana-
yang diakibatkan oleh analisis big data. TAP mana, dan akhirnya tak terlihat.
memudahkan pengembang dan para data scientist di
perusahaan, penyedia layanan cloud, dan system
integrator dengan menyediakan layanan bersama,
REFERENSI
lingkungan yang fleksibel untuk analisis lanjutan di [1] Definition Big Data, Retrieved 15 October 2016, from
area public and private clouds. http://searchcloudcomputing.techtarget.com/definition/big-
Facebook AI Research (FAIR), dirilis ke data-Big-Data.
[2] Matt Turck, Is Big Data Still a Thing? (The 2016 Big Data
open source merupakan modul deep-learning untuk
Landscape), Retrieved 15 October 2016, from
lingkungan pengembangan open source Torch untuk http://mattturck.com/2016/02/01/big-data-landscape/
numerik, machine learning, dan computer vision,

4
Proceedings Seminar Nasional Riset Ilmu Komputer (SNRIK 2016) Universitas Muslim Indonesia Vol. 1, Desember 2016
Makassar – 14 Desember 2016 ISSN : 2443-048X

[3] AI, Machine Learning Rising In The Enterprise, Retrieved 15


October 2016, from http://www.informationweek.com/big-
data/big-data-analytics/ai-machine-learning-rising-in-the-
enterprise/d/d-id/1323929
[4] Dean, Jared. Big Data, Data Mining, and Machine Learning:
Value Creation for Business Leaders and Practitioners. John
Wiley & Sons, Inc., Hoboken, New Jersey., 2014.
[5] Fayyad, Usama, Gregory Piatetsky-Shapiro, and Padhraic
Smyth. "From Data Mining to Knowledge Discovery in
Databases." AI MAGAZINE, 1996, 37-54.
[6] Buchanan, Bruce G. "A (Very) Brief History of Artificial
Intelligence." American Association for Artificial
Intelligence, 2005.
[7] Marzban, Caren. "Basic Statistics and Basic Ai: Neural
Networks." In Artificial Intelligence Methods in the
Environmental Sciences. Berlin Heidelberg: © Springer-
Verlag Berlin Heidelberg 2009, 2009.
[8] Bakhshi, Taimur, and Bogdan Ghita. "On Internet Traffic
Classification: A Two-Phased Machine Learning Approach."
Journal of Computer Networks and Communications 2016
(2016): 1-21.
[9] Larose, Daniel T. Data Mining Methods and Models.
Canada: © 2006 by John Wiley & Sons, Inc. All rights
reserved, 2006.
[10] Russell, Stuart J., and Peter Norvig. Artificial Intelligence a
Modern Approach Second Edition. © 2003, 1995 by Pearson
Education, Inc. Upper Saddle River, New Jersey 07458,
2003.
[11] What is Data Science? http://datascience.nyu.edu/what-is-
data-science/
[12] What is Data Science?
https://datascience.berkeley.edu/about/what-is-data-science/

5
View publication stats

You might also like