You are on page 1of 25

KATA PENGANTAR

Segala puji bagi Allah SWT yang telah memberikan nikmat serta hidayah-Nya terutama nikmat
kesempatan dan kesehatan sehingga kami dapat menyelesaikan makalah mata kuliah
“Infrastruktur dan Manajemen Big Data”. Kemudian shalawat serta salam kita sampaikan
kepada Nabi kita Muhammad SAW yang telah memberikan pedoman hidup yakni Al-qur’an
dan sunnah untuk keselamatan umat di dunia.

Makalah ini merupakan salah satu tugas presentasi mata kuliah Infrastruktur dan Manajemen
Big Data di program studi Sains Data Terapan, Departemen Teknik Informatika dan Komputer
Politeknik Elektronika Negeri Surabaya. Kami mengucapkan terima kasih kepada Ibu Fitrah
selaku dosen mata kuliah Infrastruktur dan Manajemen Big Data dan kepada segenap pihak
yang telah memberikan bimbingan serta arahan selama penulisan makalah ini.

Kami menyadari bahwa banyak terdapat kekurangan-kekurangan dalam penulisan makalah


ini, maka dari itu kami mengharapkan kritik dan saran yang konstruktif dari para pembaca demi
kesempurnaan makalah ini.

Surabaya, 26 April 2023

Tim Penulis

APACHE HBASE i
DAFTAR ISI

Daftar Isi
KATA PENGANTAR ............................................................................................................. i
DAFTAR ISI ..........................................................................................................................ii
BAB I .................................................................................................................................... 1
PENDAHULUAN .................................................................................................................. 1
1.1 Latar Belakang ........................................................................................................ 1
1.2 Rumusan Masalah ................................................................................................... 2
1.3 Tujuan .................................................................................................................... 2
BAB II................................................................................................................................... 3
PEMBAHASAN .................................................................................................................... 3
2.1 Sejarah dan Pengertian HBase ................................................................................. 3
2.1.1 Sejarah HBase .................................................................................................. 3
2.1.2 Pengertian HBase ............................................................................................. 3
2.2 Struktur Data HBase ............................................................................................... 3
2.3 Arsitektur HBase ..................................................................................................... 6
2.4 Cara Kerja dari HBase ............................................................................................ 7
2.5 Algoritma Pada HBase ............................................................................................. 8
2.6 Manfaat dari Penggunaan HBase dalam Big Data ..................................................... 9
2.7 Kelebihan dan Kekurangan HBase ........................................................................... 9
2.7.1 Kelebihan HBase .............................................................................................. 9
2.7.2 Kekurangan HBase......................................................................................... 10
2.8 Implementasi dan Studi Kasus dari Penggunaan HBase .......................................... 10
2.8.1 Implementasi Penggunaan HBase.................................................................... 10
2.8.2 Studi Kasus Penggunaan HBase ...................................................................... 11
2.9 Instalasi HBase ...................................................................................................... 12
2.9.1 Mengunduh File Tar HBase Versi Stabil ......................................................... 12
2.9.2 Install HBase di Ubuntu dengan Standalone Mode ........................................... 13
2.9.3 Install HBase dengan Pseudo Distributed Mode ............................................... 15
2.9.4 Install HBase dengan Fully Distributed Mode .................................................. 19
BAB III ............................................................................................................................... 21
PENUTUP ........................................................................................................................... 21
3.1 Kesimpulan ........................................................................................................... 21
DAFTAR PUSTAKA ........................................................................................................... 22

APACHE HBASE ii
BAB I
PENDAHULUAN

1.1 Latar Belakang


Big Data adalah istilah yang menggambarkan volume data yang besar, baik data yang
terstruktur maupun data yang tidak terstruktur. Big kata telah digunakan dalam banyak
bisnis. Tidak hanya besar data yang menjadi poin utama tetapi apa yang harus dilakukan
organisasi atau perusahaan dengan data tersebut. Big Data dapat dianalisis untuk
wawasan yang mengarah pada pengambilan keputusan dan strategi bisnis yang lebih
baik.
Ketika kebutuhan dalam pemrosesan Big Data semakin berkembang, yang
mulanya berkisar pada SQL (Structured Query Language) relational database yang
tersusun rapi sesuai dengan baris, kolom, dan tabel yang mana data tersebut memiliki
aturan, definisi, dan format. Justru kini, banyak orang yang membuat dan menggunakan
data tidak terstruktur dalam berbagai bentuk dan format seperti email, pdf, text file, dan
tweet.
Pada umumnya, data tidak terstruktur dikelola menggunakan NoSQL (Not Only
SQL) database. NoSQL memiliki keunggulan dibanding relational database dalam
beberapa hal yang diantaranya adalah dari segi struktur data. Data tidak terstruktur bisa
berubah strukturnya, yang mana relational database memproses data yang strukturnya
sudah didefinisikan di awal, sementara NoSQL tidak membutuhkan pendefinisian di awal.
Selain itu ada dari segi penyimpanan, relational database bersifat vertically scalable yang
artinya secara fisik disimpan di satu tempat saja yang mana keterbatasannya terletak pada
kapasitas hardware, sedangkan NoSQL bersifat horizontally scalable dimana data secara
fisik disimpan di banyak tempat yang mana keterbatasannya terletak pada seberapa banyak
entiti yang berhasil terhubung.
HBase adalah salah satu sistem database NoSQL yang dikembangkan oleh Apache
Software Foundation dan didasarkan pada model data Bigtable Google. HBase dirancang
untuk menyediakan database yang dapat diandalkan, terdistribusi, dan dapat dijalankan
pada hardware yang relatif murah. HBase berjalan diatas Hadoop Distributed File System
yang mampu memproses data dalam skala besar secara interaktif, tetapi bisa juga berjalan
pada distributed file system lain.

APACHE HBASE 1
1.2 Rumusan Masalah
Permasalahan yang akan dibahas di dalam makalah ini adalah sebagai berikut :
1. Apa yang dimaksud dengan Apache HBase?
2. Bagaimana cara meng-install dan cara kerja Apache HBase?
3. Manfaat Apache HBase pada Big Data?
4. Kelebihan dan kekurangan Apache HBase?

1.3 Tujuan
Tujuan dari penulisan makalah ini adalah :
1. Memahami Apache HBase.
2. Mempelajari bagaimana cara meng-install dan cara kerja Apache HBase.
3. Mengetahui manfaat Apache HBase pada Big Data.
4. Mengetahui kelebihan dan kekurangan Apache HBase.

APACHE HBASE 2
BAB II
PEMBAHASAN

2.1 Sejarah dan Pengertian HBase

2.1.1 Sejarah HBase


Pada saat kebutuhan untuk memproses dan mengolah data dalam ukuran yang
besar yang dikenal dengan istilah Big Data mulai dirasakan oleh kalangan tertentu
terutama perusahaan yang berhubungan langsung dengan pengolahan data
(contohnya : Google). Oleh karena itu, muncullah implementasi dari konsep-konsep
mutakhir Google tersebut dalam proyek Open Source yang akhirnya menghasilkan
produk siap digunakan. Dari konsep Google File System lahirlah Hadoop
Distributed File System, dari konsep Google Map Reduce lahir Hadoop Map Reduce,
dan dari spesifikasi Google Riatable diciptakanlah Hadoop HBase.

2.1.2 Pengertian HBase


Apa itu HBase? HBase adalah database terdistribusi yang berorientasi pada
kolom. HBase adalah program yang berjalan diatas Hadoop Distributed File System
yang mampu memproses data dalam skala besar secara interaktif. HBase merupakan
implementasi dari konsep Google Bigtable. HBase disebutkan berjalan pada HDFS,
tapi tidak terbatas hanya pada HDFS, bisa juga pada distributed file system lain.

2.2 Struktur Data HBase


HBase merupakan salah satu contoh dari database NoSQL yang menggunakan model
data Key-Value Store, dimana data disimpan dalam bentuk pasangan key dan value.
Dalam HBase, setiap baris pada tabel diidentifikasi oleh sebuah kunci unik (key) yang
biasanya berupa string atau angka. Key pada HBase dikonversi menjadi bilangan bulat
yang disebut sebagai row key. Baris-baris ini kemudian diurutkan berdasarkan row key
untuk memudahkan operasi pencarian dan pengambilan data.
Setiap baris pada tabel memiliki satu atau lebih kolom, dan setiap kolom memiliki satu
atau lebih versi. Kolom-kolom tersebut biasa disebut dengan column family dan column,
yang mana column family pada HBase dapat terdiri dari satu, beberapa atau bahkan ribuan
column. Masing-masing versi dari sebuah kolom diberi label waktu yang disebut sebagai
timestamp. Jika suatu data diubah, maka versi yang lama tidak dihapus, namun disimpan

APACHE HBASE 3
dengan label timestamp yang berbeda. Data dengan versi terbaru (timestamp terbesar)
akan disimpan paling atas
Nilai (value) dari sebuah pasangan key-value pada HBase dapat memiliki tipe data yang
berbeda-beda, seperti string, byte array, boolean, atau jenis data lainnya. Nilai dari sebuah
key-value pada HBase dapat sangat besar dan kompleks, bahkan bisa berupa file biner
yang sangat besar.
Dengan struktur Key-Value Store yang fleksibel dan efisien, HBase dapat digunakan
untuk menyimpan dan mengakses data dengan volume yang sangat besar dan kompleks.
Dalam aplikasi Big Data, HBase digunakan sebagai salah satu database terdistribusi yang
paling populer dan sering digunakan.

Gambar 2.2.1 Pasangan Key Value Pada Hbase

Ketika data yang disimpan dalam satu tabel HBase menjadi semakin banyak dan
melewati batas jumlah baris maksimal yang ditentukan, maka tabel tersebut akan dipartisi
menjadi dua bagian sama besar yang biasanya disebut Region. Region berisi kumpulan
baris data yang disimpan secara terurut berdasarkan kunci atau key yang unik. Setiap
region pada HBase memiliki kunci awal dan akhir yang disebut sebagai row key range.
Ketika tabel pada HBase dibuat, data dalam tabel tersebut secara otomatis dibagi
menjadi beberapa region dan didistribusikan pada beberapa server region secara merata.
Pemisahan data pada region ini dilakukan secara otomatis oleh HBase berdasarkan kunci
atau key pada data.
Setiap region pada HBase memiliki ukuran default sekitar 10GB, namun ukuran
tersebut dapat dikonfigurasi oleh administrator sesuai dengan kebutuhan dan karakteristik
data yang disimpan. Saat ukuran sebuah region mencapai batas maksimum yang
ditentukan, HBase akan melakukan pemecahan region kembali atau splitting, sehingga
region tersebut dibagi menjadi dua region yang baru.

APACHE HBASE 4
Selain itu, HBase juga menggunakan teknologi kompresi pada data yang disimpan pada
region agar memperkecil ukuran data yang disimpan, sehingga menghemat ruang
penyimpanan pada disk.
Dalam arsitektur HBase, region memungkinkan data dapat dipartisi dan didistribusikan
secara merata pada beberapa server region yang berbeda, sehingga memberikan kecepatan
akses data yang cepat dan scalability yang tinggi pada basis data HBase.

Gambar 2.2.2 Partisi Tabel per Region

Setiap region server pada HBase menyimpan data pada lokal file system, dan setiap
perubahan data yang dilakukan akan dicatat dalam file log yang disebut dengan Write-
Ahead Log (WAL). File log tersebut akan disimpan sementara di dalam memori dan
kemudian ditulis ke HDFS secara periodik.
Selain itu, HBase juga menyediakan fitur snapshot yang memungkinkan pengguna
untuk membuat salinan data yang ada pada sebuah tabel dan menyimpannya ke HDFS.
Snapshot tersebut dapat digunakan untuk tujuan backup, restore, atau untuk analisis data
pada waktu tertentu.
Dalam skenario penggunaan HBase, HDFS dan HBase bekerja secara terintegrasi untuk
menyediakan sistem penyimpanan data yang terdistribusi, scalable, dan fault-tolerant.
HBase menggunakan HDFS untuk menyimpan data yang dihasilkan, sementara HDFS
menyediakan infrastruktur penyimpanan yang andal dan scalable untuk data HBase.

Gambar 2.2.3 Model Penyimpanan Tabel HBase pada HDFS

APACHE HBASE 5
2.3 Arsitektur HBase
Arsitektur pada HBase dirancang untuk memberikan skema penyimpanan data yang
scalable dan terdistribusi, sehingga mampu mengakomodasi data dalam skala yang
sangat besar. Berikut adalah beberapa komponen penting dalam arsitektur HBase:

Gambar 2.3.1 Arsitektur HBase

1. HMaster: HMaster adalah master node pada HBase yang bertanggung jawab untuk
mengelola metadata tabel dan mengatur operasi pengelolaan cluster, seperti pembuatan
tabel dan splitting region. HMaster juga mengatur alokasi region pada region server dan
menangani permintaan data dari client.
2. Region Server: Region Server adalah server yang bertanggung jawab untuk
menyimpan dan memproses data pada HBase. Setiap Region Server menyimpan
beberapa region, yang merupakan bagian dari tabel. Region Server juga menyediakan
beberapa fitur penting seperti caching data dan kompresi data untuk meningkatkan
kinerja.
3. ZooKeeper: ZooKeeper adalah komponen penting dalam arsitektur HBase yang
digunakan sebagai koordinator dan pengatur konfigurasi antara HMaster dan Region
Server. ZooKeeper juga digunakan sebagai penyimpanan metadata, seperti informasi
tentang ketersediaan Region Server dan status cluster.
4. HDFS: HDFS (Hadoop Distributed File System) adalah sistem file terdistribusi yang
digunakan sebagai tempat penyimpanan data pada HBase. HDFS menyediakan
infrastruktur penyimpanan data yang scalable dan fault-tolerant, sehingga memastikan
keandalan dan ketersediaan data pada HBase.

APACHE HBASE 6
5. Client: Client pada HBase adalah aplikasi atau program yang mengakses data pada
HBase. Client menggunakan API HBase untuk mengirimkan permintaan data ke
HMaster atau Region Server, dan menerima data sebagai balasan.
Arsitektur HBase sangat cocok digunakan dalam pengembangan aplikasi Big Data dan
sistem terdistribusi karena mampu menyediakan sistem penyimpanan data yang scalable
dan fault-tolerant.

2.4 Cara Kerja dari HBase


Cara kerja HBase didasarkan pada konsep key-value store, dimana data disimpan
dalam bentuk pasangan key-value dan didistribusikan pada beberapa server region.
Berikut adalah beberapa tahapan dalam cara kerja HBase:
1. Membuat Tabel: Pertama-tama, pengguna membuat tabel pada HBase dan menentukan
jumlah kolom dan jenis data yang akan disimpan pada tabel tersebut.
2. Memasukkan Data: Setelah tabel dibuat, pengguna dapat memasukkan data ke dalam
tabel dengan menentukan key dan value pada setiap data yang dimasukkan.
3. Distribusi Data pada Region Server: Data pada HBase didistribusikan pada beberapa
server region, dimana setiap region server menyimpan beberapa region dan setiap
region hanya ditempatkan pada satu server region. Distribusi data pada region server
dilakukan secara otomatis oleh HBase berdasarkan kunci atau key pada data.
4. Akses Data: Client dapat mengakses data pada HBase dengan menggunakan API
HBase. Setiap permintaan data dari client akan diteruskan ke HMaster atau Region
Server, dan kemudian data akan dikirimkan sebagai balasan.
5. Splitting Region: Ketika ukuran sebuah region mencapai batas maksimum yang
ditentukan, HBase akan melakukan pemecahan region atau splitting, sehingga region
tersebut dibagi menjadi dua region yang baru. Hal ini dilakukan untuk mengoptimalkan
distribusi data pada server region dan meningkatkan kinerja akses data.
6. Fault-Tolerant: HBase menyediakan mekanisme fault-tolerant untuk memastikan
ketersediaan data dan keandalan sistem. Jika ada server region yang mengalami
masalah atau crash, HBase akan melakukan pemulihan data dari server region lain
untuk memastikan ketersediaan data.
Dalam cara kerja HBase, data disimpan secara terdistribusi pada beberapa server region,
sehingga memberikan kecepatan akses data yang cepat dan scalability yang tinggi pada
basis data HBase. HBase juga menyediakan fitur caching data dan kompresi data untuk

APACHE HBASE 7
meningkatkan kinerja akses data, serta mekanisme fault-tolerant untuk memastikan
ketersediaan data dan keandalan sistem.

2.5 Algoritma Pada HBase


HBase adalah basis data NoSQL yang berbasis pada algoritma LSM (Log-Structured
Merge). Algoritma LSM digunakan untuk memungkinkan penyimpanan data yang
scalable dan cepat dengan meminimalkan operasi input-output disk. Berikut adalah
beberapa tahapan algoritma LSM yang digunakan pada HBase:
1. Write-Ahead Logging (WAL): Ketika data baru dimasukkan ke HBase, data tersebut
disimpan terlebih dahulu dalam file transaksi yang disebut Write-Ahead Log (WAL).
File WAL bertujuan untuk memastikan integritas data dan mencegah kehilangan data
pada kasus sistem crash.
2. Memtable: Setiap kali data baru dimasukkan, HBase menyimpan data tersebut dalam
struktur data sementara yang disebut memtable. Memtable adalah struktur data yang
disimpan di memori dan digunakan untuk menyimpan data sementara sebelum data
tersebut disimpan ke disk.
3. Flush Memtable: Ketika ukuran memtable mencapai batas maksimum yang ditentukan,
HBase akan mengekspor memtable ke disk dalam bentuk file yang disebut HFile. Setiap
HFile berisi data yang disortir dan terbagi menjadi beberapa bagian yang disebut blok.
4. Merge HFile: HBase melakukan penggabungan file-file HFile untuk menghasilkan satu
file yang berisi data yang terurut. Proses ini dilakukan untuk meningkatkan efisiensi
operasi baca dan tulis data pada HBase.
5. Minor Compaction: Ketika jumlah file HFile pada sebuah region mencapai batas
tertentu, HBase akan melakukan minor compaction. Minor compaction adalah proses
penggabungan beberapa file HFile yang memiliki ukuran kecil untuk menghasilkan satu
file HFile yang lebih besar.
6. Major Compaction: Ketika jumlah file HFile pada sebuah region mencapai batas
tertentu yang lebih tinggi, HBase akan melakukan major compaction. Major
compaction adalah proses penggabungan semua file HFile pada sebuah region untuk
menghasilkan satu file HFile yang besar dan mengoptimalkan distribusi data pada
server region.
Algoritma LSM pada HBase memungkinkan penggunaan penyimpanan yang scalable
dan cepat dengan meminimalkan operasi input-output disk. Proses penggabungan data

APACHE HBASE 8
pada HBase dilakukan secara berkala, sehingga data yang tidak diperlukan dapat dihapus
secara otomatis. Hal ini memastikan ketersediaan ruang penyimpanan dan meningkatkan
kinerja akses data pada HBase.

2.6 Manfaat dari Penggunaan HBase dalam Big Data


HBase sangat cocok untuk aplikasi real-time berskala tinggi, seperti aplikasi media
sosial atau aplikasi streaming. Berkat kurangnya skema basis data tetap dalam basis data
non-relasional seperti HBase, pengembang dapat menambahkan data baru tanpa
menyesuaikan dengan model skema. Dengan model basis data relasional tradisional,
seseorang harus menyesuaikan diri dengan model skema yang ketat.
Biasanya database aplikasi web terdiri dari milyaran baris data. Untuk mengakses entri
acak di database, Anda akan mencari jarum di tumpukan jerami; Anda dapat
menemukannya, tetapi itu akan memakan waktu lama. Bergantung pada jenis sistem
manajemen basis data yang Anda gunakan, jarum dapat menjadi lebih mudah ditemukan.
Ketika berhadapan dengan database besar, RDBMS yang biasa digunakan, seperti MySQL
, berkinerja buruk karena RDBMS melambat secara eksponensial seiring pertumbuhan
data. HBase dapat membantu mengatasi masalah kinerja RDBMS karena HBase dirancang
untuk menangani sejumlah besar data. Dengan HBase, mencari entri dalam database lebih
efisien daripada menggunakan sistem RDBMS biasa berkat struktur non-relasional HBase
yang berorientasi pada kolom.

2.7 Kelebihan dan Kekurangan HBase

2.7.1 Kelebihan HBase


Berikut kelebihan HBase :
1. Mengelola data yang sangat besar dalam sistem terdistribusi.
2. Memiliki fungsi sharding original yang dapat bekerja otomatis maupun manual.
3. Mampu menjamin keutuhan data meskipun terjadi kegagalan pada beberapa
komputer.
4. Mampu menangani input data yang terjadi secara terus-menerus dari ribuan user
yang selama menjadi “bottleneck” pada sistem database sebelumnya.

APACHE HBASE 9
2.7.2 Kekurangan HBase
Jika "Hamster" gagal, dibutuhkan waktu yang lama untuk proses pemulihan.
Kelemahan lain yang dimiliki oleh Hbase adalah tidak menyediakan lebih dari satu
pengindeksan dalam tabel dan adanya masalah pembuatan kueri.

2.8 Implementasi dan Studi Kasus dari Penggunaan HBase

2.8.1 Implementasi Penggunaan HBase


Berikut adalah beberapa contoh implementasi dari penggunaan HBase:
1. Analisis data: HBase digunakan sebagai database penyimpanan data mentah atau
sumber data dalam sistem analisis data seperti Hadoop atau Apache Spark.
2. Sistem pencatatan waktu nyata: HBase digunakan sebagai database pencatatan
waktu nyata untuk memantau sistem atau aplikasi di mana data baru ditambahkan
atau diubah dalam waktu nyata.
3. Sistem penggunaan data tinggi: HBase digunakan sebagai basis data utama untuk
aplikasi dengan penggunaan data tinggi, seperti platform media sosial dan aplikasi
e-commerce.
4. Pencarian data: HBase digunakan sebagai basis data pencarian teks penuh untuk
memungkinkan pencarian data yang lebih cepat dan lebih efisien.
5. Aplikasi IoT (Internet of Things): HBase digunakan sebagai basis data penyimpanan
dan pengambilan data sensor dari perangkat IoT yang menghasilkan data dalam
jumlah besar.
6. Permainan online: HBase digunakan sebagai basis data utama untuk menyimpan
data game seperti data pengguna, status game, poin, dan lainnya.
7. Sistem log: HBase digunakan sebagai basis data untuk sistem log untuk
memudahkan pengumpulan dan analisis data log dalam jumlah besar.
Dalam keseluruhan, HBase dapat digunakan untuk berbagai aplikasi yang
membutuhkan penyimpanan data dalam jumlah besar dan pengambilan data yang cepat
dan andal.

APACHE HBASE 10
2.8.2 Studi Kasus Penggunaan HBase
Berikut adalah beberapa contoh studi kasus penggunaan HBase:
1. Twitter: Twitter menggunakan HBase sebagai database utama untuk menyimpan
tweet dan data pengguna. HBase digunakan untuk menyimpan lebih dari 300 miliar
tweet yang dihasilkan oleh lebih dari 350 juta pengguna setiap hari.
2. Facebook: Facebook menggunakan HBase untuk menyimpan data pengguna,
komentar, like, dan berbagai informasi lainnya. HBase digunakan sebagai basis data
utama untuk Facebook Messenger dan Instagram.
3. Yahoo!: Yahoo! menggunakan HBase sebagai basis data utama untuk beberapa
produknya, termasuk Yahoo! Finance dan Yahoo! Sports. HBase digunakan untuk
menyimpan informasi pasar saham dan data olahraga, serta informasi lainnya yang
memerlukan penyimpanan data dalam jumlah besar.
4. Adobe: Adobe menggunakan HBase sebagai basis data utama untuk produk Adobe
Analytics dan Adobe Social. HBase digunakan untuk menyimpan data analitik dan
sosial media yang dihasilkan oleh produk-produk Adobe.
5. Alibaba: Alibaba menggunakan HBase sebagai basis data utama untuk aplikasi Big
Data seperti sistem rekomendasi, analisis perilaku pengguna, dan analisis risiko
keuangan.
6. China Mobile: China Mobile menggunakan HBase sebagai basis data utama untuk
sistem manajemen jaringan, yang memungkinkan perusahaan untuk memantau dan
mengelola jaringan seluler dengan lebih efisien.
Dalam keseluruhan, HBase telah digunakan secara luas oleh perusahaan besar untuk
memenuhi kebutuhan penyimpanan data dalam jumlah besar dan pengambilan data
yang cepat dan andal.

APACHE HBASE 11
2.9 Instalasi HBase

2.9.1 Mengunduh File Tar HBase Versi Stabil


1. Buka link berikut yang akan mengarahkan ke website Apache untuk mengunduh
HBase, https://www.apache.org/dyn/closer.lua/hbase/

2. Pilih versi stabil seperti yang ditunjukkan di bawah versi 1.1.2

3. Klik pada hbase-1.1.2-bin.tar.gz. Ini akan mengunduh fite tar. Salin file tar ke
lokasi instalasi

APACHE HBASE 12
2.9.2 Install HBase di Ubuntu dengan Standalone Mode
1. Tempatkan hasil instalasi hbase-1.1.2-bin.tar.gz di /home/hduser
2. Unzip dengan menjalankan perintah $tar -xvf hbase-1.1.2-bin.tar.gz itu akan
membuka isi dari file zip dan akan membuatt hbase-1.1.2 di lokasi /home/hduser
3. Buka hbase-env.sh seperti di bawah ini dan sebutkan jalur JAVA_HOME di
lokasi

4. Buka file ~/.bashrc dan sebutkan jalur HBASE_HOME seperti yang ditunjukkan
di bawah ini

APACHE HBASE 13
5. Buka hbase-site.xml dan tempatkan properti berikut di dalam file
hduser@ubuntu$ gedit hbase-site.xml

Di sini akan ditempatkan dua properti, satu untuk direktori root HBase dan yang
kedua untuk direktori data sesuai dengan ZooKeeper. Semua aktivitas Hmaster
dan Zookeper mengarah ke hbase-site.xml ini.
6. Open hosts yang ada di /etc lokasi dan sebutkan IP seperti berikut

APACHE HBASE 14
7. Kini dapat dilakukan pemeriksaan dengan perintah jps untuk melihat Hmaster
sedang berjalan atau tidak

8. HBase dapat dimulai dengan menggunakan "hbase shell" dan akan masuk ke
mode shell interaktif seperti yang ditunjukkan pada gambar di bawah. Setelah
masuk ke mode shell, kita dapat melakukan semua jenis perintah.

Standalone Mode tidak memerlukan daemon Hadoop untuk memulai. HBase


dapat berjalan secara mandiri.

2.9.3 Install HBase dengan Pseudo Distributed Mode


1. Tempatkan hbase-1.1.2-bin.tar.gz di /home/hduser
2. Unzip dengan menjalankan perintah $tar -xvf hbase-1.1.2-bin.tar.gz itu akan
membuka isi dari file zip dan akan membuatt hbase-1.1.2 di lokasi /home/hduser
3. Buka hbase-env.sh seperti di bawah ini dan sebutkan jalur JAVA_HOME dan
jalur server wilayah di lokasi, ekspor perintah yang ditunjukkan seperti berikut

APACHE HBASE 15
4. Buka file ~/.bashrc dan menyebutkan jalur HBASE_HOME seperti yang
ditunjukkan berikut

5. Buka HBase-site.xml dan sebutkan properti di bawah ini dalam file

APACHE HBASE 16
APACHE HBASE 17
Maksud dari perintah-perintah di atas dijelaskan seperti berikut:
1) Menyiapkan direktori root Hbase di properti ini
2) Untuk pengaturan terdistribusi, kita harus mengatur properti ini
3) Properti kuorum ZooKeeper harus diatur di sini
4) Penyiapan replikasi dilakukan di properti ini. Secara default kami
menempatkan replikasi sebagai 1. Dalam mode terdistribusi penuh, beberapa
node data hadir sehingga kami dapat meningkatkan replikasi dengan
menempatkan lebih dari 1 nilai dalam properti dfs.replication
5) Port klien harus disebutkan di properti ini
6) Direktori data ZooKeeper dapat disebutkan di properti ini
6. Memulai daemon Hadoop terlebih dahulu dan setelah itu memulai daemin HBase
seperti berikut
- Di sini pertama-tama harus memulai daemon Hadoop dengan menggunakan
perintah “./start-all.sh”

- Setelah itu memulai daemon HBase dengan perintah “start-hbase.sh”

APACHE HBASE 18
- Sekarang memeriksa jps untuk memastika sistem berjalan atau tidak

2.9.4 Install HBase dengan Fully Distributed Mode


1. Pastikan bahwa setiap node di cluster terhubung dengan jaringan yang sama dan
dapat saling terhubung
2. Unduh file HBase dari situs web resmi Apache HBase di
http://hbase.apache.org/downloads.html
3. Ekstrak file HBase di setiap node pada cluster, dan pastikan bahwa setiap node
memiliki konfigurasi yang sama
4. Buka file konfigurasi "hbase-site.xml" di direktori "/opt/hbase/conf"
5. Konfigurasikan pengaturan seperti nama host, port, dan direktori tempat HBase
akan menyimpan data. Berikut adalah contoh konfigurasi untuk fully distributed
mode:

APACHE HBASE 19
6. Simpah file konfigurasi dan keluar dari editor teks
7. Salin file konfigurasi ke setiap node pada cluster
8. Jalankan HBase dengan perintah berikut pada setiap node:

9. Verifikasi instalasi HBase dengan membuka antarmuka web HBase di


http://hbasemaster:16010 di mana "hbasemaster" adalah nama host dari node
master
10. Jika instalasi berhasil, Anda harus dapat melihat antarmuka web HBase dan
dapat melakukan operasi basis data seperti membuat tabel, menambahkan data,
dan melakukan query data.

APACHE HBASE 20
BAB III
PENUTUP
3.1 Kesimpulan
Big Data adalah istilah yang menggambarkan volume data yang besar, baik data yang
terstruktur maupun data yang tidak terstruktur. Tidak hanya besar data yang menjadi poin
utama tetapi apa yang harus dilakukan organisasi atau perusahaan dengan data tersebut.
Big Data dapat dianalisis untuk wawasan yang mengarah pada pengambilan keputusan dan
strategi bisnis yang lebih baik. NoSQL memiliki keunggulan dibanding relational database
dalam beberapa hal yang diantaranya adalah dari segi struktur data.
HBase berjalan diatas Hadoop Distributed File System yang mampu memproses data
dalam skala besar secara interaktif, tetapi bisa juga berjalan pada distributed file system
lain. Pada saat kebutuhan untuk memproses dan mengolah data dalam ukuran yang besar
yang dikenal dengan istilah Big Data mulai dirasakan oleh kalangan tertentu terutama
perusahaan yang berhubungan langsung dengan pengolahan data . Oleh karena itu,
muncullah implementasi dari konsep-konsep mutakhir Google tersebut dalam proyek
Open Source yang akhirnya menghasilkan produk siap digunakan. HBase adalah database
terdistribusi yang berorientasi pada kolom.
HDFS menyediakan infrastruktur penyimpanan data yang scalable dan fault-tolerant,
sehingga memastikan keandalan dan ketersediaan data pada HBase. Arsitektur HBase
sangat cocok digunakan dalam pengembangan aplikasi Big Data dan sistem terdistribusi
karena mampu menyediakan sistem penyimpanan data yang scalable dan fault-tolerant.
Jika ada server region yang mengalami masalah atau crash, HBase akan melakukan
pemulihan data dari server region lain untuk memastikan ketersediaan data. Dalam cara
kerja HBase, data disimpan secara terdistribusi pada beberapa server region, sehingga
memberikan kecepatan akses data yang cepat dan scalability yang tinggi pada basis data
HBase.
Dengan model basis data relasional tradisional, seseorang harus menyesuaikan diri
dengan model skema yang ketat. Bergantung pada jenis sistem manajemen basis data yang
Anda gunakan, jarum dapat menjadi lebih mudah ditemukan. Ketika berhadapan dengan
database besar, RDBMS yang biasa digunakan, seperti MySQL , berkinerja buruk karena
RDBMS melambat secara eksponensial seiring pertumbuhan data. Dengan HBase,
mencari entri dalam database lebih efisien daripada menggunakan sistem RDBMS biasa
berkat struktur non-relasional HBase yang berorientasi pada kolom.

APACHE HBASE 21
DAFTAR PUSTAKA

Teknologi Big Data. (2013). Diakses pada 25 April 2023 dari https://www.teknologi-
bigdata.com/2013/03/hbase-hyper-nosql-database.html?m=1
Kurniawati, Galuh Nurvinda. 2021. Yuk Kenali Manfaat dan Tantangan Integrasi Big Data.
Diakses pada 25 April 2023 dari https://dqlab.id/kenali-manfaat-dan-tantangan-
integrasi-big-data
Jalli, Artturi. 2022. What is HBase. Diakses pada 25 April 2023 dari https://builtin.com/data-
science/hbase
Ellysse, Amanda. Iqbal, Jamaludin. Kristian, Matius. Riyan. 2014. Pengenalan HBase. Diakses
pada 25 April 2023 dari https://www.slideshare.net/iqbalphillroe/h-base-34649787
Sholeh, Ahmad. 2019. Apache HBase. Diakses pada 25 April 2023 dari
https://prezi.com/p/vlhdm_cshizj/hbase/
Sinha, Shubham. 2016. How Was HBase Used To Solve Storage Issues In Facebook
Messenger. Diakses pada 25 April 2023 dari https://medium.com/edureka/hbase-
tutorial-bdc36ab32dc0
Taylor, Dadid. 2023. How To Install HBase on Ubuntu (HBase Installation). Diakses pada 26
April 2023 dari https://www.guru99.com/hbase-installation-guide.html

APACHE HBASE 22

You might also like