Professional Documents
Culture Documents
net/publication/311650067
CITATIONS READS
0 1,196
1 author:
Haviluddin Haviluddin
Universitas Mulawarman
62 PUBLICATIONS 152 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
Data mapping process to handle semantic data problem on student grading system View project
All content following this page was uploaded by Haviluddin Haviluddin on 25 March 2017.
ISSN : 2443-048X
PENERBIT
Alamat Editor :
Fakultas Ilmu Komputer Universitas Muslim Indonesia Makassar - Indonesia 90234
Telp . +6281355001102, e-mail : snrik@umi.ac.id
i
Proceedings Seminar Nasional Riset Ilmu Komputer (SNRIK 2016) Universitas Muslim Indonesia Vol. 1, Desember 2016
Makassar – 14 Desember 2016 ISSN : 2443-048X
Hak cipta © 2016 oleh Fakultas Ilmu Komputer Universitas Muslim Indonesia Makassar. Dilarang
memperbanyak atau memindahkan sebagian atau seluruh ini proceedings ini dalam bentuk apapun,
baik secara elektronis maupun mekanis, termasuk menggandakan, merekam atau dengan sistem
penyimpanan lainnya tanpa izin tertulis dari penerbit.
ISSN : 2443-048X
ii
Proceedings Seminar Nasional Riset Ilmu Komputer (SNRIK 2016) Universitas Muslim Indonesia Vol. 1, Desember 2016
Makassar – 14 Desember 2016 ISSN : 2443-048X
DEWAN REDAKSI
Penanggung Jawab :
Yulita Salim, S.Kom., M.T.
Editor Pelaksana :
Siska Anraeni, S.Kom., M.T.
Farniwati Fattah., S.T., M.T.
Reviewer :
DR. Haviluddin,S.Kom.,M.Kom (Universitas Mulawarman)
Drs. Muslim, M.T., Ph.D (Universitas Muslim Indonesia)
DR. Ingrid Nurtanio, M.T. (Universitas Hasanuddin)
DR. Intan Areni, S.T.,M.T. (Universitas Hasanuddin)
Dolly Indra, S.Kom., M.M.SI. (Universitas Muslim Indonesia)
PENERBIT :
iii
Proceedings Seminar Nasional Riset Ilmu Komputer (SNRIK 2016) Universitas Muslim Indonesia Vol. 1, Desember 2016
Makassar – 14 Desember 2016 ISSN : 2443-048X
Abstrak - Makalah ini membahas munculnya machine learning untuk analisis big data. Pertama, machine learning dan
beberapa istilah yang terkait didefinisikan dan dijelaskan secara rinci dan hal ini termasuk artificial intelligence, data mining,
data science, data analytics dan knowledge discovery, statistik dan business intelligence. Definisi ini akan menunjukkan
bagaimana hal ini saling terkait satu sama lain. Kemudian, definisi big data diuraikan berdasarkan tiga hal: Volume, Velocity
dan Variety. Menerapkan strategi data besar yang baik sangat penting untuk menjamin keberhasilan penerapan machine
learning untuk belajar big data. Sebagai hasilnya, tren di big data juga digambarkan dan didefinisikan berdasarkan lanskap
data besar; Infrastruktur, Analytics, Aplikasi, Cross-Infrastruktur/Analytics, Open Sources, Data Source, dan API, Inkubator
dan Sekolah. Makalah ini juga membahas beberapa fasilitas open source yang tersedia untuk publik dalam rangka untuk
memastikan bahwa skala besar aplikasi machine learning dapat terwujud. Akhirnya, dalam kesimpulan, tren besar selama
beberapa bulan terakhir dalam analisis big data telah meningkatnya fokus pada kecerdasan buatan untuk membantu
menganalisis sejumlah besar data dan berasal wawasan prediktif. Artificial intelligence/machine learning sekarang
mempercepat kecenderungan munculnya lapisan aplikasi dari big data. Kombinasi big data dan artificial intelligence akan
mendorong inovasi yang luar biasa hampir di setiap industri. Dari perspektif itu, kesempatan big data mungkin bahkan lebih
besar dari apa yang orang-orang pikirkan.
Kata Kunci – Big Data, AI, Data Mining, Data Analytics, Data Science, Knowledge Discovery, Business Intelligence
1
Proceedings Seminar Nasional Riset Ilmu Komputer (SNRIK 2016) Universitas Muslim Indonesia Vol. 1, Desember 2016
Makassar – 14 Desember 2016 ISSN : 2443-048X
statistics didefinisikan sebagai studi tentang membutuhkan bangunan atau topologi dan
bagaimana untuk mengumpulkan, mengatur, mengevaluasi model desain mana yang dimaksudkan
menganalisis, dan menginterpretasikan informasi untuk membantu perubahan panduan dalam keputusan
numerik dari data. Di sisi lain, data mining adalah bisnis. Di sisi lain, dalam profesi data analytics, analis
praktek menerapkan algoritma (sebagian besar data yang biasanya melakukan peran migrasi data dan
algoritma machine learning) dengan data yang visualisasi yang fokus pada menggambarkan masa
tersedia dari domain untuk memecahkan masalah lalu. Gambar 2 mengilustrasikan hubungan yang ada
domain terkait. antara istilah yang terlibat dalam menggambarkan
machine learning.
2
Proceedings Seminar Nasional Riset Ilmu Komputer (SNRIK 2016) Universitas Muslim Indonesia Vol. 1, Desember 2016
Makassar – 14 Desember 2016 ISSN : 2443-048X
untuk mengukur keberhasilan suatu produk dan dalam rangka untuk memastikan bahwa semua
penjualan masa depan dengan menghubungkan masa departemen yang terlibat dalam mengadopsi teknologi
lalu data penjualan, kembali data dan ulasan data big data tersebut. Dengan kata lain, itu membutuhkan
pembeli online untuk produk tersebut. interaksi teknologi, orang dan proses. Anda mungkin
perlu untuk memperoleh, menyimpan dan
Akhirnya, velocity mengacu pada kecepatan
membersihkan data, query, menganalisa dan
data yang besar harus dianalisa. Setiap proyek analisis
memvisualisasikan data. Beberapa dari proses ini
data besar akan menelan, menghubungkan dan
dapat dilakukan dengan mengerahkan algoritma tetapi
menganalisis sumber data, dan kemudian membuat
beberapa membutuhkan intervensi manusia.
jawaban atau hasil didasarkan pada permintaan
Semuanya harus terintegrasi mulus. Pada akhirnya,
menyeluruh. Ini berarti analis manusia harus memiliki
untuk semua konsep big data ini untuk bekerja,
pemahaman yang rinci dari data yang tersedia dan
seluruh organisasi termasuk semua tingkat manajemen
memiliki beberapa sense atas apa jawaban yang
perlu berkomitmen untuk membangun budaya
mereka cari. Velocity juga bermakna, analisis data
berbasis data berfokus pada konsep big data.
besar berekspansi ke bidang-bidang seperti machine
Menerapkan strategi big data yang baik
learning dan artificial intelligence, di mana proses
sangat penting untuk menjamin keberhasilan
analisis meniru persepsi dengan mencari dan
penerapan machine learning untuk mempelajari big
menggunakan pola dalam data yang dikumpulkan.
data. Sebagai hasilnya, tren di big data juga
Gambar 3 menunjukkan big data area.
digambarkan dan didefinisikan berdasarkan lanskap
data besar; Infrastruktur, Analytics, Aplikasi, Cross-
Infrastruktur/Analytics, Open Source, sumber data dan
API, Inkubator, dan sekolah. Gambar 4
mengilustrasikan lanskap big data yang dapat
diintegrasikan untuk mengadopsi teknologi big data.
3
Proceedings Seminar Nasional Riset Ilmu Komputer (SNRIK 2016) Universitas Muslim Indonesia Vol. 1, Desember 2016
Makassar – 14 Desember 2016 ISSN : 2443-048X
learning ke open source. Misalnya, komunitas open dengan penekanan khusus pada deep learning dan
source sekarang mungkin dapat menggunakan dan convolutional nets. Torch banyak digunakan di
menguji beberapa proyek pembangunan machine sejumlah laboratorium akademik seperti di
learning ini yang meliputi SystemML, TensorFlow, Google/DeepMind, Twitter, NVIDIA, AMD, Intel,
GitHub, Trusted Analytics Platform (TAP) dan FAIR. dan banyak perusahaan lainnya. Facebook AI
SystemML dirilis oleh IBM, adalah fleksibel, Research (FAIR) juga akan merilis desain server
scalable model sistem machine learning. Karakteristik hardware yang telah dioptimalkan dari machine
yang membedakan SystemML adalah: Algoritma learnig ke open source. Facebook telah mengajukan
customizability melalui Bahasa pemrograman seperti bahan desain sistem berbasis GPU ke Open Compute
R dan Python, multiple execution modes, termasuk Project (OCP).
Spark MLContext, Spark Batch, Hadoop Batch,
Standalone, dan JMLC. Algoritma ini dianggap V. KESIMPULAN
sebagai optimasi otomatis berdasarkan data dan Tren besar selama beberapa bulan terakhir
karakteristik cluster untuk menjamin efisiensi dan dalam analisa big data telah meningkatnya fokus pada
skalabilitas. artificial intelligence untuk membantu menganalisis
TensorFlow adalah sistem machine learning sejumlah besar data dan berasal dari berbagai macam
terbaru dari Google dan bersifat open source. tipe data (predictive). Hubungan antara artificial
TensorFlow telah memungkinkan Googlers untuk intelligence dan big data adalah begitu dekat sehingga
membangun neural network semakin besar dan beberapa ahli industri sekarang berpikir bahwa
pelatihan untuk ribuan core dalam pusat data mereka. artificial intelligence tidak dapat dipisahkan dengan
Microsoft juga mengumumkan rilis yaitu big data. Pada gilirannya, artificial intelligence
Distributed Machine Learning Toolkit untuk sekarang membantu big data memenuhi janjinya.
komunitas pengembang, yang tersedia di GitHub. Dalam banyak hal, kita masih di babak awal
Toolkit, tersedia sekarang di GitHub, dirancang untuk dari fenomena big data. Beberapa tahun belakangan
didistribusikan machine learning menggunakan ini, membangun infrastruktur untuk menyimpan dan
beberapa komputer secara paralel untuk memecahkan proses data dalam jumlah besar. Artificial
masalah yang kompleks. Ini berisi parameter server- intelligence/machine learning sekarang mempercepat
based programing framework, yang membuat tugas kecenderungan munculnya lapisan aplikasi dari big
machine learning dalam menganalisa big data yang data. Kombinasi big data dan artificial intelligence
sangat terukur, efisien dan fleksibel. Ini juga berisi dua akan mendorong inovasi yang luar biasa hampir di
algoritma pembelajaran mesin didistribusikan, yang setiap industri. Dari perspektif itu, kesempatan big
dapat digunakan untuk melatih model topik tercepat data mungkin bahkan lebih besar dari apa yang orang-
dan terbesar bahkan model superbesar di dunia. orang pikirkan.
Intel juga membuat open source yang Big data terus tumbuh dan berkembang,
dinamakan Trusted Analytics Platform, lebih dikenal namun, istilah itu sendiri mungkin akan hilang, atau
sebagai TAP. TAP adalah perangkat lunak open bahkan tak seorang pun akan menggunakannya lagi.
source, dioptimalkan untuk kinerja dan keamanan, Ini adalah nasib ironis teknologi memungkinkan
yang mempercepat penciptaan kolaborasi cloud-native sukses yang mereka menjadi luas, maka di mana-
yang diakibatkan oleh analisis big data. TAP mana, dan akhirnya tak terlihat.
memudahkan pengembang dan para data scientist di
perusahaan, penyedia layanan cloud, dan system
integrator dengan menyediakan layanan bersama,
REFERENSI
lingkungan yang fleksibel untuk analisis lanjutan di [1] Definition Big Data, Retrieved 15 October 2016, from
area public and private clouds. http://searchcloudcomputing.techtarget.com/definition/big-
Facebook AI Research (FAIR), dirilis ke data-Big-Data.
[2] Matt Turck, Is Big Data Still a Thing? (The 2016 Big Data
open source merupakan modul deep-learning untuk
Landscape), Retrieved 15 October 2016, from
lingkungan pengembangan open source Torch untuk http://mattturck.com/2016/02/01/big-data-landscape/
numerik, machine learning, dan computer vision,
4
Proceedings Seminar Nasional Riset Ilmu Komputer (SNRIK 2016) Universitas Muslim Indonesia Vol. 1, Desember 2016
Makassar – 14 Desember 2016 ISSN : 2443-048X
5
View publication stats