Professional Documents
Culture Documents
Kelompok 4 - HBase - Laporan
Kelompok 4 - HBase - Laporan
Segala puji bagi Allah SWT yang telah memberikan nikmat serta hidayah-Nya terutama nikmat
kesempatan dan kesehatan sehingga kami dapat menyelesaikan makalah mata kuliah
“Infrastruktur dan Manajemen Big Data”. Kemudian shalawat serta salam kita sampaikan
kepada Nabi kita Muhammad SAW yang telah memberikan pedoman hidup yakni Al-qur’an
dan sunnah untuk keselamatan umat di dunia.
Makalah ini merupakan salah satu tugas presentasi mata kuliah Infrastruktur dan Manajemen
Big Data di program studi Sains Data Terapan, Departemen Teknik Informatika dan Komputer
Politeknik Elektronika Negeri Surabaya. Kami mengucapkan terima kasih kepada Ibu Fitrah
selaku dosen mata kuliah Infrastruktur dan Manajemen Big Data dan kepada segenap pihak
yang telah memberikan bimbingan serta arahan selama penulisan makalah ini.
Tim Penulis
APACHE HBASE i
DAFTAR ISI
Daftar Isi
KATA PENGANTAR ............................................................................................................. i
DAFTAR ISI ..........................................................................................................................ii
BAB I .................................................................................................................................... 1
PENDAHULUAN .................................................................................................................. 1
1.1 Latar Belakang ........................................................................................................ 1
1.2 Rumusan Masalah ................................................................................................... 2
1.3 Tujuan .................................................................................................................... 2
BAB II................................................................................................................................... 3
PEMBAHASAN .................................................................................................................... 3
2.1 Sejarah dan Pengertian HBase ................................................................................. 3
2.1.1 Sejarah HBase .................................................................................................. 3
2.1.2 Pengertian HBase ............................................................................................. 3
2.2 Struktur Data HBase ............................................................................................... 3
2.3 Arsitektur HBase ..................................................................................................... 6
2.4 Cara Kerja dari HBase ............................................................................................ 7
2.5 Algoritma Pada HBase ............................................................................................. 8
2.6 Manfaat dari Penggunaan HBase dalam Big Data ..................................................... 9
2.7 Kelebihan dan Kekurangan HBase ........................................................................... 9
2.7.1 Kelebihan HBase .............................................................................................. 9
2.7.2 Kekurangan HBase......................................................................................... 10
2.8 Implementasi dan Studi Kasus dari Penggunaan HBase .......................................... 10
2.8.1 Implementasi Penggunaan HBase.................................................................... 10
2.8.2 Studi Kasus Penggunaan HBase ...................................................................... 11
2.9 Instalasi HBase ...................................................................................................... 12
2.9.1 Mengunduh File Tar HBase Versi Stabil ......................................................... 12
2.9.2 Install HBase di Ubuntu dengan Standalone Mode ........................................... 13
2.9.3 Install HBase dengan Pseudo Distributed Mode ............................................... 15
2.9.4 Install HBase dengan Fully Distributed Mode .................................................. 19
BAB III ............................................................................................................................... 21
PENUTUP ........................................................................................................................... 21
3.1 Kesimpulan ........................................................................................................... 21
DAFTAR PUSTAKA ........................................................................................................... 22
APACHE HBASE ii
BAB I
PENDAHULUAN
APACHE HBASE 1
1.2 Rumusan Masalah
Permasalahan yang akan dibahas di dalam makalah ini adalah sebagai berikut :
1. Apa yang dimaksud dengan Apache HBase?
2. Bagaimana cara meng-install dan cara kerja Apache HBase?
3. Manfaat Apache HBase pada Big Data?
4. Kelebihan dan kekurangan Apache HBase?
1.3 Tujuan
Tujuan dari penulisan makalah ini adalah :
1. Memahami Apache HBase.
2. Mempelajari bagaimana cara meng-install dan cara kerja Apache HBase.
3. Mengetahui manfaat Apache HBase pada Big Data.
4. Mengetahui kelebihan dan kekurangan Apache HBase.
APACHE HBASE 2
BAB II
PEMBAHASAN
APACHE HBASE 3
dengan label timestamp yang berbeda. Data dengan versi terbaru (timestamp terbesar)
akan disimpan paling atas
Nilai (value) dari sebuah pasangan key-value pada HBase dapat memiliki tipe data yang
berbeda-beda, seperti string, byte array, boolean, atau jenis data lainnya. Nilai dari sebuah
key-value pada HBase dapat sangat besar dan kompleks, bahkan bisa berupa file biner
yang sangat besar.
Dengan struktur Key-Value Store yang fleksibel dan efisien, HBase dapat digunakan
untuk menyimpan dan mengakses data dengan volume yang sangat besar dan kompleks.
Dalam aplikasi Big Data, HBase digunakan sebagai salah satu database terdistribusi yang
paling populer dan sering digunakan.
Ketika data yang disimpan dalam satu tabel HBase menjadi semakin banyak dan
melewati batas jumlah baris maksimal yang ditentukan, maka tabel tersebut akan dipartisi
menjadi dua bagian sama besar yang biasanya disebut Region. Region berisi kumpulan
baris data yang disimpan secara terurut berdasarkan kunci atau key yang unik. Setiap
region pada HBase memiliki kunci awal dan akhir yang disebut sebagai row key range.
Ketika tabel pada HBase dibuat, data dalam tabel tersebut secara otomatis dibagi
menjadi beberapa region dan didistribusikan pada beberapa server region secara merata.
Pemisahan data pada region ini dilakukan secara otomatis oleh HBase berdasarkan kunci
atau key pada data.
Setiap region pada HBase memiliki ukuran default sekitar 10GB, namun ukuran
tersebut dapat dikonfigurasi oleh administrator sesuai dengan kebutuhan dan karakteristik
data yang disimpan. Saat ukuran sebuah region mencapai batas maksimum yang
ditentukan, HBase akan melakukan pemecahan region kembali atau splitting, sehingga
region tersebut dibagi menjadi dua region yang baru.
APACHE HBASE 4
Selain itu, HBase juga menggunakan teknologi kompresi pada data yang disimpan pada
region agar memperkecil ukuran data yang disimpan, sehingga menghemat ruang
penyimpanan pada disk.
Dalam arsitektur HBase, region memungkinkan data dapat dipartisi dan didistribusikan
secara merata pada beberapa server region yang berbeda, sehingga memberikan kecepatan
akses data yang cepat dan scalability yang tinggi pada basis data HBase.
Setiap region server pada HBase menyimpan data pada lokal file system, dan setiap
perubahan data yang dilakukan akan dicatat dalam file log yang disebut dengan Write-
Ahead Log (WAL). File log tersebut akan disimpan sementara di dalam memori dan
kemudian ditulis ke HDFS secara periodik.
Selain itu, HBase juga menyediakan fitur snapshot yang memungkinkan pengguna
untuk membuat salinan data yang ada pada sebuah tabel dan menyimpannya ke HDFS.
Snapshot tersebut dapat digunakan untuk tujuan backup, restore, atau untuk analisis data
pada waktu tertentu.
Dalam skenario penggunaan HBase, HDFS dan HBase bekerja secara terintegrasi untuk
menyediakan sistem penyimpanan data yang terdistribusi, scalable, dan fault-tolerant.
HBase menggunakan HDFS untuk menyimpan data yang dihasilkan, sementara HDFS
menyediakan infrastruktur penyimpanan yang andal dan scalable untuk data HBase.
APACHE HBASE 5
2.3 Arsitektur HBase
Arsitektur pada HBase dirancang untuk memberikan skema penyimpanan data yang
scalable dan terdistribusi, sehingga mampu mengakomodasi data dalam skala yang
sangat besar. Berikut adalah beberapa komponen penting dalam arsitektur HBase:
1. HMaster: HMaster adalah master node pada HBase yang bertanggung jawab untuk
mengelola metadata tabel dan mengatur operasi pengelolaan cluster, seperti pembuatan
tabel dan splitting region. HMaster juga mengatur alokasi region pada region server dan
menangani permintaan data dari client.
2. Region Server: Region Server adalah server yang bertanggung jawab untuk
menyimpan dan memproses data pada HBase. Setiap Region Server menyimpan
beberapa region, yang merupakan bagian dari tabel. Region Server juga menyediakan
beberapa fitur penting seperti caching data dan kompresi data untuk meningkatkan
kinerja.
3. ZooKeeper: ZooKeeper adalah komponen penting dalam arsitektur HBase yang
digunakan sebagai koordinator dan pengatur konfigurasi antara HMaster dan Region
Server. ZooKeeper juga digunakan sebagai penyimpanan metadata, seperti informasi
tentang ketersediaan Region Server dan status cluster.
4. HDFS: HDFS (Hadoop Distributed File System) adalah sistem file terdistribusi yang
digunakan sebagai tempat penyimpanan data pada HBase. HDFS menyediakan
infrastruktur penyimpanan data yang scalable dan fault-tolerant, sehingga memastikan
keandalan dan ketersediaan data pada HBase.
APACHE HBASE 6
5. Client: Client pada HBase adalah aplikasi atau program yang mengakses data pada
HBase. Client menggunakan API HBase untuk mengirimkan permintaan data ke
HMaster atau Region Server, dan menerima data sebagai balasan.
Arsitektur HBase sangat cocok digunakan dalam pengembangan aplikasi Big Data dan
sistem terdistribusi karena mampu menyediakan sistem penyimpanan data yang scalable
dan fault-tolerant.
APACHE HBASE 7
meningkatkan kinerja akses data, serta mekanisme fault-tolerant untuk memastikan
ketersediaan data dan keandalan sistem.
APACHE HBASE 8
pada HBase dilakukan secara berkala, sehingga data yang tidak diperlukan dapat dihapus
secara otomatis. Hal ini memastikan ketersediaan ruang penyimpanan dan meningkatkan
kinerja akses data pada HBase.
APACHE HBASE 9
2.7.2 Kekurangan HBase
Jika "Hamster" gagal, dibutuhkan waktu yang lama untuk proses pemulihan.
Kelemahan lain yang dimiliki oleh Hbase adalah tidak menyediakan lebih dari satu
pengindeksan dalam tabel dan adanya masalah pembuatan kueri.
APACHE HBASE 10
2.8.2 Studi Kasus Penggunaan HBase
Berikut adalah beberapa contoh studi kasus penggunaan HBase:
1. Twitter: Twitter menggunakan HBase sebagai database utama untuk menyimpan
tweet dan data pengguna. HBase digunakan untuk menyimpan lebih dari 300 miliar
tweet yang dihasilkan oleh lebih dari 350 juta pengguna setiap hari.
2. Facebook: Facebook menggunakan HBase untuk menyimpan data pengguna,
komentar, like, dan berbagai informasi lainnya. HBase digunakan sebagai basis data
utama untuk Facebook Messenger dan Instagram.
3. Yahoo!: Yahoo! menggunakan HBase sebagai basis data utama untuk beberapa
produknya, termasuk Yahoo! Finance dan Yahoo! Sports. HBase digunakan untuk
menyimpan informasi pasar saham dan data olahraga, serta informasi lainnya yang
memerlukan penyimpanan data dalam jumlah besar.
4. Adobe: Adobe menggunakan HBase sebagai basis data utama untuk produk Adobe
Analytics dan Adobe Social. HBase digunakan untuk menyimpan data analitik dan
sosial media yang dihasilkan oleh produk-produk Adobe.
5. Alibaba: Alibaba menggunakan HBase sebagai basis data utama untuk aplikasi Big
Data seperti sistem rekomendasi, analisis perilaku pengguna, dan analisis risiko
keuangan.
6. China Mobile: China Mobile menggunakan HBase sebagai basis data utama untuk
sistem manajemen jaringan, yang memungkinkan perusahaan untuk memantau dan
mengelola jaringan seluler dengan lebih efisien.
Dalam keseluruhan, HBase telah digunakan secara luas oleh perusahaan besar untuk
memenuhi kebutuhan penyimpanan data dalam jumlah besar dan pengambilan data
yang cepat dan andal.
APACHE HBASE 11
2.9 Instalasi HBase
3. Klik pada hbase-1.1.2-bin.tar.gz. Ini akan mengunduh fite tar. Salin file tar ke
lokasi instalasi
APACHE HBASE 12
2.9.2 Install HBase di Ubuntu dengan Standalone Mode
1. Tempatkan hasil instalasi hbase-1.1.2-bin.tar.gz di /home/hduser
2. Unzip dengan menjalankan perintah $tar -xvf hbase-1.1.2-bin.tar.gz itu akan
membuka isi dari file zip dan akan membuatt hbase-1.1.2 di lokasi /home/hduser
3. Buka hbase-env.sh seperti di bawah ini dan sebutkan jalur JAVA_HOME di
lokasi
4. Buka file ~/.bashrc dan sebutkan jalur HBASE_HOME seperti yang ditunjukkan
di bawah ini
APACHE HBASE 13
5. Buka hbase-site.xml dan tempatkan properti berikut di dalam file
hduser@ubuntu$ gedit hbase-site.xml
Di sini akan ditempatkan dua properti, satu untuk direktori root HBase dan yang
kedua untuk direktori data sesuai dengan ZooKeeper. Semua aktivitas Hmaster
dan Zookeper mengarah ke hbase-site.xml ini.
6. Open hosts yang ada di /etc lokasi dan sebutkan IP seperti berikut
APACHE HBASE 14
7. Kini dapat dilakukan pemeriksaan dengan perintah jps untuk melihat Hmaster
sedang berjalan atau tidak
8. HBase dapat dimulai dengan menggunakan "hbase shell" dan akan masuk ke
mode shell interaktif seperti yang ditunjukkan pada gambar di bawah. Setelah
masuk ke mode shell, kita dapat melakukan semua jenis perintah.
APACHE HBASE 15
4. Buka file ~/.bashrc dan menyebutkan jalur HBASE_HOME seperti yang
ditunjukkan berikut
APACHE HBASE 16
APACHE HBASE 17
Maksud dari perintah-perintah di atas dijelaskan seperti berikut:
1) Menyiapkan direktori root Hbase di properti ini
2) Untuk pengaturan terdistribusi, kita harus mengatur properti ini
3) Properti kuorum ZooKeeper harus diatur di sini
4) Penyiapan replikasi dilakukan di properti ini. Secara default kami
menempatkan replikasi sebagai 1. Dalam mode terdistribusi penuh, beberapa
node data hadir sehingga kami dapat meningkatkan replikasi dengan
menempatkan lebih dari 1 nilai dalam properti dfs.replication
5) Port klien harus disebutkan di properti ini
6) Direktori data ZooKeeper dapat disebutkan di properti ini
6. Memulai daemon Hadoop terlebih dahulu dan setelah itu memulai daemin HBase
seperti berikut
- Di sini pertama-tama harus memulai daemon Hadoop dengan menggunakan
perintah “./start-all.sh”
APACHE HBASE 18
- Sekarang memeriksa jps untuk memastika sistem berjalan atau tidak
APACHE HBASE 19
6. Simpah file konfigurasi dan keluar dari editor teks
7. Salin file konfigurasi ke setiap node pada cluster
8. Jalankan HBase dengan perintah berikut pada setiap node:
APACHE HBASE 20
BAB III
PENUTUP
3.1 Kesimpulan
Big Data adalah istilah yang menggambarkan volume data yang besar, baik data yang
terstruktur maupun data yang tidak terstruktur. Tidak hanya besar data yang menjadi poin
utama tetapi apa yang harus dilakukan organisasi atau perusahaan dengan data tersebut.
Big Data dapat dianalisis untuk wawasan yang mengarah pada pengambilan keputusan dan
strategi bisnis yang lebih baik. NoSQL memiliki keunggulan dibanding relational database
dalam beberapa hal yang diantaranya adalah dari segi struktur data.
HBase berjalan diatas Hadoop Distributed File System yang mampu memproses data
dalam skala besar secara interaktif, tetapi bisa juga berjalan pada distributed file system
lain. Pada saat kebutuhan untuk memproses dan mengolah data dalam ukuran yang besar
yang dikenal dengan istilah Big Data mulai dirasakan oleh kalangan tertentu terutama
perusahaan yang berhubungan langsung dengan pengolahan data . Oleh karena itu,
muncullah implementasi dari konsep-konsep mutakhir Google tersebut dalam proyek
Open Source yang akhirnya menghasilkan produk siap digunakan. HBase adalah database
terdistribusi yang berorientasi pada kolom.
HDFS menyediakan infrastruktur penyimpanan data yang scalable dan fault-tolerant,
sehingga memastikan keandalan dan ketersediaan data pada HBase. Arsitektur HBase
sangat cocok digunakan dalam pengembangan aplikasi Big Data dan sistem terdistribusi
karena mampu menyediakan sistem penyimpanan data yang scalable dan fault-tolerant.
Jika ada server region yang mengalami masalah atau crash, HBase akan melakukan
pemulihan data dari server region lain untuk memastikan ketersediaan data. Dalam cara
kerja HBase, data disimpan secara terdistribusi pada beberapa server region, sehingga
memberikan kecepatan akses data yang cepat dan scalability yang tinggi pada basis data
HBase.
Dengan model basis data relasional tradisional, seseorang harus menyesuaikan diri
dengan model skema yang ketat. Bergantung pada jenis sistem manajemen basis data yang
Anda gunakan, jarum dapat menjadi lebih mudah ditemukan. Ketika berhadapan dengan
database besar, RDBMS yang biasa digunakan, seperti MySQL , berkinerja buruk karena
RDBMS melambat secara eksponensial seiring pertumbuhan data. Dengan HBase,
mencari entri dalam database lebih efisien daripada menggunakan sistem RDBMS biasa
berkat struktur non-relasional HBase yang berorientasi pada kolom.
APACHE HBASE 21
DAFTAR PUSTAKA
Teknologi Big Data. (2013). Diakses pada 25 April 2023 dari https://www.teknologi-
bigdata.com/2013/03/hbase-hyper-nosql-database.html?m=1
Kurniawati, Galuh Nurvinda. 2021. Yuk Kenali Manfaat dan Tantangan Integrasi Big Data.
Diakses pada 25 April 2023 dari https://dqlab.id/kenali-manfaat-dan-tantangan-
integrasi-big-data
Jalli, Artturi. 2022. What is HBase. Diakses pada 25 April 2023 dari https://builtin.com/data-
science/hbase
Ellysse, Amanda. Iqbal, Jamaludin. Kristian, Matius. Riyan. 2014. Pengenalan HBase. Diakses
pada 25 April 2023 dari https://www.slideshare.net/iqbalphillroe/h-base-34649787
Sholeh, Ahmad. 2019. Apache HBase. Diakses pada 25 April 2023 dari
https://prezi.com/p/vlhdm_cshizj/hbase/
Sinha, Shubham. 2016. How Was HBase Used To Solve Storage Issues In Facebook
Messenger. Diakses pada 25 April 2023 dari https://medium.com/edureka/hbase-
tutorial-bdc36ab32dc0
Taylor, Dadid. 2023. How To Install HBase on Ubuntu (HBase Installation). Diakses pada 26
April 2023 dari https://www.guru99.com/hbase-installation-guide.html
APACHE HBASE 22