Professional Documents
Culture Documents
154 ArticleText 223 3 10 20210531
154 ArticleText 223 3 10 20210531
net/publication/348270759
CITATIONS READS
0 261
2 authors:
All content following this page was uploaded by Aldha Shafrieldha on 09 August 2022.
Abstract
This article examines the use of Big Data technology for the records and archives administration
system in the contemporary era. Big Data can be defined as a collection of data that is extremely
large and complex which cannot be dealt with the traditional data processing software. This
technology makes it possible to store large amounts of data and can be accessed quickly. By
implication, Big Data served sufficiently as a digital records and archives administration system.
One of companies in the world that uses Big Data as a digital system is Google. Inc. This
phenomenon is quite new in the contemporary era, hence it is quite interesting to see "how
Google manages its records and archives administration system through Big Data". In line with
the previous question, this article aims to find out how Google manages its records and archives
administration system through Big Data. This article uses a qualitative research method through
the literature review. The data used in this article is from the secondary data sourced from books
and journal articles. One of the important findings in this article is that Google uses a
distributed storage system to manage structured data called Bigtable. Bigtable makes the other
Google services operate, so it can be stated that Bigtable is a fundamental system in Google.
Although there are quite a few Google services which use Bigtable as the base, there are three
main services that everyone use the most, namely Google Analytics, Google Earth, and
Personalize Search. Through this Big Data technology, it can be seen that the archive
management can use not only the conventional methods, but also the latest technology.
Keywords: Google, Big Data, Digital Archives, Bigtable, Machine Learning Google
Abstrak
Artikel ini mengkaji mengenai pemanfaatan teknologi Big Data dalam sistem kearsipan di era
kontemporer. Big Data sendiri merupakan kumpulan data yang begitu besar dan kompleks
sehingga tidak memungkinkan lagi untuk dikelola dengan perangkat lunak tradisional. Teknologi
ini memungkinkan untuk menyimpan data dalam jumlah besar dan dapat diakses secara cepat.
Implikasinya, Big Data sangat cocok untuk dimanfaatkan sebagai sistem kearsipan digital. Salah
satu perusahaan di dunia yang memanfaatkan Big Data sebagai sistem digital adalah Google. Inc.
Fenomena ini terbilang cukup baru di dunia kontempor, maka dari itu cukup menarik untuk
melihat “bagaimana Google mengelola sistem kearsipannya melalui Big Data”. Linear dengan
pertanyaan sebelumnya, artikel ini bertujuan untuk mengetahui cara-cara Google dalam
mengelola sistem kearsipannya melalui Big Data. Artikel ini menggunakan metode penelitian
122 | Jurnal Kearsipan Volume 15 Nomor 2, Desember 2020
kualitatif melalui studi pustaka. Data yang digunakan berupa data sekunder bersumber dari buku
maupun artikel jurnal. Salah satu temuan penting dalam tulisan ini adalah Google menggunakan
sistem penyimpanan terdistribusi untuk mengelola data terstruktur yang disebut Bigtable.
Melalui Bigtable ini layanan-layanan Google lainnya beroperasi, sehingga dapat dikatakan jika
Bigtable merupaka sistem fundamental dalam Google. Meskipun cukup banyak layanan Google
yang menggunakan Bigtable sebagai dasar, tetapi terdapat tiga layanan utama yang tentu
digunakan semua orang. Layanan Google dengan basis fundamental Bigtable tersebut antara lain
Google Analytics, Google Earth dan Personalize Search. Melalui teknologi Big Data ini
kemudian dapat dilihat jika pengelolaan arsip tidak hanya melalui metode konvensional, tetapi
bisa menggunakan teknologi mutakhir.
Kata Kunci: Google, Big Data, Arsip Digital, Bigtable, Pembelajaran Mesin Google
tahun sebelumnya yaitu 2017 terdapat tujuan memenuhi kewajiban hukumnya atau
sekitar 54,68% penduduk Indonesia digunakan sebagai transaksi bisnis.
menggunakan internet. Dalam survei yang Pengertian lain yang tercantum dalam
sama mayoritas pengguna internet di Electronics Record: A Workbook for
Indonesia atau sekitar 45,3% sering Archive yaitu menyebutkan bahwa arsip
mengunjungi situs film atau video, dan merupakan informasi terekam yang dibuat
sekitar 50,7% menggunakan Facebook atau diterima dalam suatu proses yang terdiri
sebagai media sosial yang paling banyak dari memulai, melaksanakan dan
dikunjungi. Ini berarti telah terhimpun menyelesaikan aktivitas dari suatu institusi
miliaran data dalam sistem Big Data, tidak atau perorangan, dalam definisi ini arsip
hanya di Indonesia, bahkan di dunia. Tahun mengandung konten, konteks dan struktur
2019 lalu, Internet Archive salah satu yang memadai sebagai bukti adanya
lembaga yang mengarsipkan situs web dan aktivitas tersebut. Melalui beberapa definisi
objek didalamnya telah menyimpan sekitar diatas, dapat dipersingkat bahwa arsip
273 miliar halaman web dengan lebih dari merupakan sebuah dokumen baik dalam
361 juta situs web. Seluruhnya disimpan bentuk digital maupun konvensional yang
dalam penyimpanan berkapasitas lima belas berisi rekaman aktivitas atau kejadian ketika
peta byte atau jika dikonversi menjadi suatu institusi atau perorangan melakukan
15.360 terabyte atau 15.728.640 gigabyte. sesuatu.
Teknologi Big Data tidak hanya Arsip dan Big Data di era
menghimpun data-data untuk informasi kontemporer ini semakin erat kaitannya dan
semata. Dalam perkembangannya Big Data hampir tidak dapat dipisahkan. Keduanya
juga bisa digunakan untuk keperluan bisnis saling berkelit kelindan satu sama lain, arsip
dan arsip digital. Arsip sendiri memiliki memanfaatkan teknologi Big Data sebagai
beberapa pengertian, berdasarkan UU No. tempat penyimpanan barunya yang hampir
43 tahun 2009 arsip didefinisikan sebagai tidak memiliki batas. Sedangkan Big Data
rekaman kegiatan atau peristiwa dalam semakin berkembang karena banyak terisi
bentuk media sesuai dengan perkembangan oleh arsip-arsip digital dari berbagai penjuru
teknologi informasi dan komunikasi yang dunia. Uniknya, kedua „alat digital‟ ini dapat
dibuat dan diterima lembaga negara, bersatu dalam sebuah perusahaan bernama
pemerintahan daerah, lembaga pendidikan, Google. Inc (dalam artikel ini nantinya akan
perusahaan, organisasi politik, organisasi konsisten disebut Google). Google
kemasyarakatan, dan perorangan dalam merupakan salah satu perusahaan di dunia
pelaksanaan kehidupan bermasyarakat, yang bergerak dalam teknologi Big Data
berbangsa dan bernegara. Pengertian arsip serta pelopor perpaduan antara teknologi Big
yang tercantum dalam ISO 15489-1 Data – kearsipan,dan dikomersialisasi.
(Records Management – Part 1: General) Komersialisasi tersebut menghasilkan
adalah informasi yang diciptakan, diterima sebuah bisnis baru yaitu menjual data serta
dan disimpan sebagai bukti dan informasi informasi yang terdapat dalam server
oleh organisasi atau seseorang dengan mereka. Dalam artikel ini akan lebih fokus
124 | Jurnal Kearsipan Volume 15 Nomor 2, Desember 2020
2. Arsip aktif, adalah arsip yang harus mengikuti peraturan yang ada
frekuensi penggunaannya tinggi dan dalam dunia sistem informasi. Pada
atau terus menerus. sistem informasi dikenal sebuah
3. Arsip inaktif, adalah arsip yang sertifikasi bernama ISO 27001. ISO
frekuensi penggunaannya telah 27001 merupakan sebuah dokumen
menurun. standar Sistem Manajemen Keamanan
Arsip diolah menjadi informasi, Informasi (SMKI) yang memberikan
pengolah tersebut adalah pengolahan gambaran secara umum mengenai
yang disesuaikan dengan kebutuhan dari kerangka kerja dari sebuah organisasi
informasi yang akan diambil. dalam rangka mengimplementasikan
Perkembangn ilmu pengetahuan dan konsep keamanan informasi (Itg.id,
teknologi modern berdampak pada 2020). Sertifikasi ISO 27001
kemajuan bidang kearsipan yang semakin dikembangkan pararel dengan
maju, kemajuan ini membawa meningkatnya kebutuhan dan
kemudahan untuk melaksanakan tugas- penggunaan teknologi informasi dan
tugas kearsipan, apalagi jika memiliki komunikasi (TIK) dalam menunjang
volume arsip yang sangat besar, maka aktivitas bisnis. Semakin bertambahnya
teknologi akan sangat membantu aktivitas bisnis, semakin meningkat pula
mempercepat dan mengefisienkan proses resiko gangguan kemanan dari
pengelolaan arsip. Salah satu pengaruh penggunaan teknologi informasi.
terbesar dari penggunaan teknologi pada ISO 27001 terdiri dari 14 klausa
sistem kearsipan adalah dimungkinnya yang mencakup 113 kontrol (Itg.id,
pengiriman dan penyampaian informasi 2020). 14 klausa tersebut diantaranya, (1)
menjadi semakin cepat, apalagi jika Information security policies, (2) How
mempunyai sistem yang terstruktur. information security is organised, (3)
Untuk itu diperlukannya sebuah sistem human resources security, (4) Asset
yang sangat besar yang dapat management, (5) Acces control and
menampung segala informasi dari managing user access, (6) Cryptographic
berbagai belahan dunia manapun dan technology, (7) Physical security of the
dapat diakses secara cepat dan mudah organization’s sites and equipment, (8)
oleh khalayak. Sistem teknologi Big Data Operational security, (9) Secure
memungkinkan sebuah kearsipan digital communications and data transfer, (10)
menjadi nyata. Secure acquisition, development, and
Seiring berkembangnya zaman, support of information systems, (11)
sistem kearsipan mulai merambah ke Security for suppliers and third parties,
dunia teknologi. Sistem kearsipan mulai (12) Incident management, (13) Business
berintegrasi dengan teknologi informasi, continuity/disaster recovery, (14)
maka dari itu konsekuensinya adalah Compliance. Keseluruhan klausa dan
126 | Jurnal Kearsipan Volume 15 Nomor 2, Desember 2020
catatan dan informasi atas kumpulan kompleks dimana tidak bisa ditangani
fakta atau keterangan dari suatu hal yang lagi dengan sistem teknologi komputer
didapat dari pengamatan dan pencarian konvensional. Suatu data bisa dikatakan
terhadap sumber-sumber tertentu. sebagai Big Data adalah ketika data-data
Informasi adalah data yang telah diolah tersebut memiliki tiga karakteristik yang
menjadi bentuk yang mempunyai arti harus ada dalam Big Data yaitu volume,
bagi si Penerima dan bermanfaat dalam velocity dan variety.
pengambilan keputusan di masa kini Volume adalah seberapa besar data
maupun masa yang akan datang. ditampung dalam suatu sistem, seperti
Pengetahuan adalah apa yang kita ketahui yang diketahui, Big Data haruslah
yang ada dalam otak kita ataupun yang mempunyai volume data yang sangat
ada di alam semesta, untuk membangun besar yang tidak bisa ditampung oleh
ilmu pengetahuan diperlukannya sebuah komputer konvensional, Google
informasi dan data. Kemudian, setelah sendiri memiliki sekitar 15 Exabytes data
pengetahuan itu diolah maka diperlukan dan volumenya terus meningkat pada
pengambilan keputusan atas data yang tingkatan yang belum pernah terjadi
diolah. sebelumnya. Velocity adalah kecepatan
Agar mempermudah penjelasan data yang masuk, dimana membuat data,
tentang Big Data, dapat dilihat definisi memproses data, menganalisis data
dari Hurwitz. Menurut Hurwitz, et al., kecepatannya terus meningkat dan ada
(2013), Big Data merupakan istilah untuk aliran data yang terjadi. Variety adalah
sekumpulan data yang begitu besar atau tentang mengelola kumpulan dari
berbagai macam data yang kompleks baik Perjalanan Google dimulai pada
yang terstruktur, semi terstruktur maupun tahun 1995, ketika Larry dan Sergey masih
yang tidak terstruktur, kumpulan data berada di Stanford University. Mereka
yang tidak terstruktur lebih mendominasi. awalnya menciptakan sebuah program
Suatu perusahaan perlu menganalisis komputer yang bernama BackRub, sebuah
berbagai tipe data dari berbagai sumber mesin pencarian yang memanfaatkan
informasi dan data yang dihasilkan pun analisis backlink untuk melacak dan
tak terhitung jumlahnya. Seiring dengan merekam data di internet. Mesin pencari ini
berkembangnya teknologi, karakteristik sangat unik karena menggunakan teknologi
Big Data pun berubah, ada dua yang mereka kembangkan bernama
karakteristik lagi yang menjadi acuan Pagerank, yang menetapkan peringkat pada
apakah data yang dikelola itu adalah situs web dengan menghitung jumlah
sistem Big Data. Variability adalah halaman, mengolahnya kemudian
bagaimana user menafsirkan data dari menautkan ke laman yang asli. Kemudian
perubahan yang terjadi dalam struktur hasil yang muncul dalam mesin pencari itu
data. Value adalah sebuah nilai dari suatu berdasarkan seberapa sering kata yang dicari
data, nilai bisnis ini memberikan muncul di halaman web. Sistem PageRank
keuntungan bagi suatu perusahaan. inilah yang mengantarkan Google menjadi
mesin pencarian web yang dibisniskan.
HASIL DAN PEMBAHASAN PageRank adalah teknologi yang belum
Sejarah Google pernah dimiliki search engine lain yang ada
Google Inc. adalah sebuah sebelum Google dan membuat Google
perusahaan search engine yang didirikan menjadi search engine unik di awal masa
oleh Sergey Brin dan Larry Page pada tahun kemunculannya.
1998. Perusahaan ini telah memonopoli Pada 1998 Google menerima
sebesar 70% dari pencarian online dunia. bantuan dari pendiri Microsystem, Andy
Google mempunyai pusat di Mountain Bechtolsheim sebagai modal awal mereka
View, California. Pada awalnya, Google mendirikan perusahaan. Sejak saat itulah
adalah sebuah perusahaan yang bergerak di Google meluncur menjadi mesin pencari
bidang pencarian saja, tetapi seiring internet yang populer. Pada awalnya,
berjalannya waktu, Google Perusahaan Google bernama Googol adalah
mengembangkan lebih dari 50 produk dan sebuah istilah matematika yang berarti
jasa untuk handphone ataupun komputer, sebutan untuk nomor satu dan diikuti oleh
seperti electronic mail (Gmail), Google 100 nol. Pada tahun 2000, Google menjadi
Meets, Google Maps dan banyak lagi. klien dari search engine (mesin pencari)
Walaupun begitu, mesin pencarian Google situs web yang paling populer. Pada tahun
tetap menjadi kunci kesuksesan dari Google. 2004, ketika Yahoo dan Google sudah tak
tak bermitra, mesin pencarian Google
Aldha Shafrieldha Shihab, Anugerah Pagiyan Nurfajar / Sistem Pengelolaan Kearsipan Google | 129
Melalui Big Data
menerima pencarian lebih dari 200 juta kali menjadi CEO, Larry Page ditunjuk menjadi
sehari. Bahkan hingga saat ini Google President of Product dan Sergey Brin
menangani sekitar tiga milyar pencarian per menjadi President of Technology. Pada
hari (Gambar 2). 2015, Google mengalami restrukturisasi
Terlampau banyaknya data yang divisi dan menjadi anak perusahaan dari
masuk perhari, Google membangun 11 pusat Perusahaan Induk Alphabet Inc. Produk-
data di seluruh dunia. Setiap pusatnya produk Google seperti Mesin Pencarian,
mengandung lebih dari ratusan ribu server Youtube, Google Maps, Google Android,
untuk menunjang perusahaan tersebut. Google Advertising, tetap berada dibawah
Google membangun tiga sistem kode yang perusahaan Google. Tetapi, beberapa
menjadi jantung dari Google itu sendiri yaitu Google Ventures yang lain seperti
Google File System, Bigtable dan Longevity Research Company Calico,
Mapreduce. Mereka saling berkait Laboratorium penelitian Google X dan
membangun pondasi besar. beberapa lainnya berada dibawah Alphabet
Google telah berkembang selama Inc. Kemudian Larry Page menjadi CEO
bertahun-tahun dan menjadi perusahaan dari Alphabet Inc., Sergey Brin menjadi
besar multinasional. Pada tahun 2001, para Presiden Eksekutif dan Eric Schmidt
investor menunjuk Eric Schmidt untuk menjadi Ketua Eksekutifnya.
menjadi CEO dari Google karena
kekhawatiran mereka terhadap Brin dan Google dan Teknologi Big Data
Page yang tidak berpengalaman dalam Big Data bisa dijadikan sebagai
memimpin perusahaan. Selama Schmidt bisnis yang menjanjikan. Pada era teknologi
seperti sekarang ini. data merupakan aset Google juga menggunakan Cloud Bawaan
yang berharga, maka diperlukan sebuah untuk menyimpan data-data. Google
sistem untuk menyimpan data-data tersebut memproses 3,5 Milyar permintaan per hari
untuk kemudian dijual sebagai bisnis. dan setiap permintaan menanyakan basis
Google memonetisasi mesin pencari mereka data 20 milyar halaman web.
dengan mencari cara untuk mengambil data Google telah mampu mengelola
yang dikumpulkannya dari seseorang saat dan memberdayakan data yang melimpah
menjelajahi Web, membangun pendapatan pada era Ledakan Informasi. Teknologi
yang besar dengan menjadi penjual iklan crawler yang dimiliki oleh Google mampu
online terbesar di dunia. Di sektor ini, mendownload web page yang ada di dunia
Google adalah pelopor. Pada tahun 2006 secara terus menerus tanpa berhenti bahkan
mereka pernah memperkenalkan Google mengikuti update yang ada pada web-web
Bigtable, yang merupakan sistem database tersebut. Google membangun tiga sistem
berskala besar dan cepat yang digunakan kode yang menjadi jantung dari Google.
Google untuk mengolah berbagai jenis data Google File System (GFS). GFS adalah
dari berbagai layanan Google, termasuk media penyimpanan data yang menyimpan
layanan dari mesin pencarian Google yang data dalam jumlah besar secara terdistribusi.
berbasis internet. Mereka membagi beberapa indeks situs web
Kapasitas dari teknologi dunia mereka di ribuan node penyimpanan, dan
untuk menyimpan informasi dan data telah tersebar di antara banyak pusat komputasi di
meningkat sebanyak dua kali lipat setiap 40 seluruh dunia. Kapasitas penyimpanan dari
bulan sejak tahun 1980. Contohnya saja, GFS bisa terus diperbesar dan diperbanyak
pada tahun 2012 sudah ada lebih dari 2.5 hanya dengan menambahkan jumlah
quintillion bytes data yang dibuat setiap komputer di dalam sistem nya. Jantung yang
harinya. Sejak 2008, Google dengan kedua adalah MapReduce, yang termasuk
menggunakan Big Data Analysis telah kedalam teknologi pengolahan data.
mengantongi 2 petabytes perhari dari Mesin MapReduce mampu mengolah data yang
Pencari saja. Hal itu terus meningkat dan disimpan oleh GFS secara paralel yang
dalam 10 tahun terakhir jumlah data yang mampu mengolah data ukuran besar dalam
ada dalam mesin pencari Google sebanyak waktu yang ratusan kali lipat lebih cepat
160 petabytes perhari. Oleh karena itu, dibanding komputer konvensional dengan
Volume data ini tidak dapat ditangani lagi bantuan ribuan computer. Kemudian yang
oleh Proses manajemen data tradisional, jadi terakhir ada Bigtable, merupakan sebuah
Google menggunakan teknologi lain dalam program basis data yang dimiliki Google.
menangani lonjakan data yang sangat besar Bigtable mampu menyajikan data berukuran
setiap harinya, teknologi tersebut adalah besar yang tidak mampu ditangani oleh
teknologi Big Data. Google memakai Big sistem database yang sudah ada.
Data untuk memelihara sistem file nya.
Aldha Shafrieldha Shihab, Anugerah Pagiyan Nurfajar / Sistem Pengelolaan Kearsipan Google | 131
Melalui Big Data
seperti kode biner yang dipakai dalam sehingga bisa membuat perusahaannya
komputer. Ini adalah perangkat seperti sekarang. Data-data yang Google
penyimpanan data awal yang terletak dalam miliki seperti buku, jurnal, artikel dan
inti khusus Google dari konsep granularity sebagainya terarsipkan seperti perpustakaan
universal yang menjadi sarana untuk pada umumnya namun lebih canggih.
menghasilkan bentuk pencarian yang Melalui sistemnya Google mampu
dipersonalisasi. „memanggil‟ sesuatu dengan mudah tanpa
Misi dari Google adalah perlu menunggu lama. Uniknya seluruh data
“Memfasilitasi akses informasi ke seluruh tersebut tidak sepenuhnya dimiliki oleh
dunia dan dalam setiap bahasa, dengan lebih Google melainkan terintegrasi dengan laman
dari 130 bahasa dengan menggunakan alat penyedia buku, jurnal artikel atau arsip
terjemahan dari Google, setiap orang dapat lainnya. Laman penyedia ini hanya dapat
mengakses informasi dari sisi lain dunia diakses melalui mesin pencari Google, atau
dalam bahasa yang mereka gunakan.” mengetik secara spesifik url yang menjadi
(Google dalam Hillis, dkk. 2012). Sejatinya tujuan. Sayangnya tidak ada satu orangpun
hal ini merupakan bentuk manifestasi dari yang ingin repot mengetik url lengkap
sebuah kisah menara Babel yang dijelaskan sehingga lebih memilih mencari melalui
oleh Kitab Kejadian dan merupakan mesin pencari Google. Tidak hanya itu,
inspirasi untuk Borges menyelesaikan essay data-data yang terdapat di Google dapat
Perpustakaan Total. Menara Babel diakses tanpa memperhatikan dimensi ruang
ditafsirkan sebagai keangkuhan manusia dan waktu sehingga sangat fleksibel.
yang ingin menyaingi Tuhan. Diceritakan, Seseorang dapat dengan mudah mencari
setelah Banjir Besar, sebuah suku bermigrasi buku-buku atau arsip yang sudah dibuat
dari timur ke Shinar (Irak). Seorang puluhan tahun sebelumnya dan arsip
Penguasa besar memerintahkan orang-orang tersebut akan tahan tinggal puluhan tahun
untuk membangun sebuah kota dan sebuah kemudian. Big Data yang terintegrasi
menara yang puncaknya di surga untuk dengan perusahaan Google dirasa mampu
meyakini diri mereka bisa lebih daripada menghasilkan sebuah terobosan gemilang
tuhan. Namun, Tuhan yang melihat itu dan dalam hal pengarsipan sehingga lebih
kemudian marah lalu meruntuhkannya. memudahkan dan lebih efisien.
Melalui kisah ini, keragaman bahasa adalah
hasil dari kemarahan Tuhan. Dan hal itu lah Pengelolaan Data Google Melalui Bigtable
yang menginspirasi Google untuk Google menggunakan sistem
mempersatukan manusia melalui informasi penyimpanan terdistribusi untuk mengelola
agar mereka bisa mengerti informasi dari data terstruktur yang disebut Bigtable.
dunia yang berbeda. Bigtable adalah sistem penyimpanan
Melalui beberapa pemaparan terdistribusi untuk mengelola data
sebelumnya Google kemudian terinspirasi terstruktur yang dirancang untuk menskala
Aldha Shafrieldha Shihab, Anugerah Pagiyan Nurfajar / Sistem Pengelolaan Kearsipan Google | 133
Melalui Big Data
ke ukuran yang sangat besar : petabyte data Column Keys merupakan data yang
di ribuan server komoditas (Chang, 2008). dikelompokkan pada set yang bernama
Lebih dari 60 proyek Google yang Column Families. Column Families ini
menyimpan data pada Bigtable, Contohnya, membentuk unit dasar kontrol akses.
Google Earth, Google Finance, Google Biasanya data yang tersimpan adalah data
Analytics, Okrut dan Pengindeksan Web. yang sama jenisnya. Yang terakhir dari
Big Table menyerupai basis data dalam Model Data adalah Timestamps. Timestamps
banyak hal karena Bigtable memiliki banyak Bigtable Google adalah bilangan bulat 64bit
strategi implementasi dengan basis data dan mengindeks beberapa versi data yang
(Chang, dkk. 2006). Model data dari sama yang ada dalam setiap sel Bigtable.
Bigtable sendiri adalah sebuah peta yang Mereka dapat ditugaskan oleh Bigtable
diurutkan secara multidimensi yang untuk mewakili waktu dalam ukuran
terdistribusi dan persisten. Bigtable akan mikrodetik atau secara lebih spesifik
menyimpan data dalam skala masif. Row ditugaskan oleh aplikasi dari pengguna jasa.
Keys, Column Keys dan Timestamps Versi lain dari data yang sama akan
terindeks pada peta yang setiap nilainya disimpan terlebih dahulu agar pengguna jasa
adalah array bytes yang tidak dapat membaca versi yang lebih baru
terinterpretasikan. dahulu.
Row Keys berfungsi untuk Tabel terdiri dari Row yang
memungkinkan Bigtable menyimpan data bermanifestasikan entitas tunggal, dan
dalam urutan leksikografis. Setiap rentang Column yang berisi nilai individual untuk
dalam row tersebut disebut dengan tablet Row. Setiap baris di indeks dengan satu
yang merupakan unit distribusi dan Row Keys, dan kolom yang berkaitan satu
penyeimbangan beban. Hal ini sama lain biasanya akan dikelompokan
menyebabkan bacaan dari range row menjadi satu Column family. Kombinasi
menjadi lebih pendek dan lebih efisien, Column Family dengan Column Qualifier
sehingga hanya memerlukan bentuk inilah yang nantinya akan diidentifikasikan
komunikasi yang sederhana. Jadi, pengguna oleh setiap Column. Setiap persimpangan
jasa dapat dengan mudah mendapatkan Row atau Column dapat diisi oleh beberapa
lokasi akses untuk data yang mereka cari. sel, atau versi pada timestamps yang
Dalam webtable biasanya website dengan berbeda. Hal ini memberikan catatan tentang
domain yang sama dikelompokkan dalam perubahan data tersimpan dari waktu ke
satu baris yang sama dan komponen waktu.
hostname URL nya dibalik. Hal ini Contoh pada Gambar 3 adalah
membuatnya menjadi lebih efisien. mengenai jejaring sosial media presiden
Contohnya, Google menyimpan data untuk Amerika Serikat yang disebut Prezzy (hanya
maps.google.com/index.html di bawah URL contoh). Dari penelusuran, setiap presiden
com.google.maps/index.html. yang berbeda dapat mengikuti dan melihat
134 | Jurnal Kearsipan Volume 15 Nomor 2, Desember 2020
pos dari presiden lainnya. Tabel diatas lah sistemnya, mengelola sumber daya pada
yang menjadi gambaran tentang siapa yang sharing-pool, menangani kegagalan dari
mengikuti siapa. Pada tabel tersebut, mesin itu serta memantau status dari mesin,
terdapat satu Column Family yang berisi apakah berjalan dengan baik atau tidak.
beberapa Column Qualifier. Ini disebut Chubby adalah layanan distributed lock
dengan follows family, siapa yang mem- yang highly-available dan persistent yang
follows. Kemudian ada Row key sebagai digunakan oleh Bigtable. Layanan ini terdiri
username dengan asumsi bahwa username dari lima replica aktif yang salah satunya
ini tersebar secara merata pada setiap menjadi master dan aktif melayani
alpabet. Jadi akses datanya akaj cukup permintaan. Chubby menggunakan
seragam di seluruh tablet. Kemudian, algoritma Paxos untuk menjaga replica itu
Column Qualifier digunakan sebagai data tetap konsisten ketika mengalami kegagalan
untuk mengetahui siapa yang memfollow sistem. Bigtable menggunakan Chubby
siapa. untuk memastikan ada satu master yang
Bigtable menggunakan Google File aktif setiap saat, untuk menyimpan lokasi
System (GFS) yang didistibusikan untuk bootstrap data Bigtable, untuk menyimpan
menyimpan log dan data. Biasanya informasi skema Bigtable dan untuk
prosesnya sering berbagi mesin dengan menyimpan daftar kolom akses (Chang, dkk.
aplikasi lain. Bigtable bergantung pada 2006).
sistem manajemen cluster untuk Ada tiga komponen utama untuk
menjadwalkan sebuah pekerjaan untuk pengimplementasian Bigtable, yaitu sebuah
Gambar 3. Contoh kasus penggunaan Column Key, Row Key, dan Timestamps
Sumber: cloud.google.com/bigtable
Aldha Shafrieldha Shihab, Anugerah Pagiyan Nurfajar / Sistem Pengelolaan Kearsipan Google | 135
Melalui Big Data
perpustakaan data yang terhubung ke setiap Bigtable Google yang rumit. Dari gambar
pengguna jasa, satu server master dan diatas terlihat Client adalah yang pertama.
banyak server tablet. Master disini adalah Semua permintaan Client akan melalui
komponen yang bertanggung jawab untuk server front-end terlebih dahulu sebelum
menempatkan tablet ke tablet server, dikirimkan ke node. Node yang dimaksud
mendeteksi penambahan dan waktu adalah server tablet. Kemudian, kotak biru
berakhirnya server tablet, menyeimbangkan yang melingkupi node disebut sebagai
beban yang ada pada server tablet dan Cloud Bigtable Cluster, fungsinya adalah
pengumpulan koleksi file di GFS. Setiap untuk untuk mengatur server tablet yang
server tablet mengelola satu set tablet, berantakan. Hal ini juga digunakan sebagai
google memiliki antara sepuluh hingga kontainer untuk memuat berbagai macam
seribu tablet per server. data dari Client. Kemudian setelah itu setiap
Gambar 4 merupakan arsitektur server tablet di cluster menangani subset
yang sederhana dari keseluruhan arsitektur dari permintaan Client ke cluster. Hal ini
engine) yang kini telah merambah ke banyak anak perusahaan yang berada di bawah
sektor. Dibandingkan dengan mesin pencari google akan bertanggung jawab untuk data-
lainya Google jauh lebih unggul dan lebih data yang berada dalam database mereka,
diminati oleh pengguna. Sehingga apakah itu cloud, keamanan internet, peta
menimbulkan banyaknya data yang terdapat dan lainnya. Kemudian mereka akan
pada server Google. menjadi sebuah perusahaan yang akan
Dalam rangka mempermudah berdiri sendiri sebagai perusahaan yang
pencarian informasi melalui Google, mereka terpisah baik di bawah nama perusahaan
kemudian mengeluarkan sebuah platform yang membeli mereka atau menjadi
bernama Google Bigtable. Google Bigtable perusahaan yang tidak dinaungi perusahaan
merupakan sistem database berskala besar lain.
dan cepat yang digunakan Google untuk Jika Google memang berada pada
mengolah berbagai jenis data dari berbagai kebangkrutan yang penuh, dalam arti
layanan google, termasuk layanan dari kehilangan nama atau semua aset yang
mesin pencarian google yang berbasis dimiliki, semua data yang berada dalam
internet. Pada penerapannya Bigtable dapat database Google tidak akan pernah hilang.
dilihat dalam tiga aspek yaitu Google Tetapi, akan ada banyak perusahaan lain
Analyst yang merupakan layanan analisis yang ingin berinvestasi dan membeli semua
data gratis bagi seorang Webmaster. Kedua data yang Google punya. Karena, akan ada
adalah Google Earth yaitu merupakan banyak perusahaan yang ingin membayar
sebuah tiruan dunia virtual yang dapat untuk akses penuh, kontrol dan kepemilikan
melihat penampakan dunia secara jelas. dari informasi digital yang sangat berharga.
Terakhir adalah Personalize Search yang Data-data digital yang berada dalam
mempermudah seseorang dalam mencari database akan terus ada, jika bangkrut akan
data di platform Google. Melalui Bigtable berpindah tangan lagi dan kepemilikan
ini Google menjadi perusahaan yang hingga jam ke-n atau waktu yang tak
bergerak dibidang mesin pencari dan Big terhingga.
Data tersukses di dunia hingga memiliki
data yang hampir tidak terhitung dalam UCAPAN TERIMA KASIH
servernya. Jika Google mengalami Puji dan syukur penulis panjatkan
kebangkrutan, pengelolaan Big Data yang kepada kehadirat yang maha kuasa karena
selama ini diakuisisi oleh google tidak akan telah memberikan kekuatan untuk
menghilang. Google berada dibawah menyelesaikan artikel ini. Hambatan serta
naungan Alphabet Inc, dan mempunyai halangan mampu penulis netralisir berkat
banyak anak perusahaan. Pertama-tama bantuan yang maha kuasa. Sehingga tercipta
yang harus Google lakukan adalah menjual karya yang tidak terkira tenaga serta usaha
aset-aset dan akuisisi yang dimiliki. Setiap yang telah diberikan.
Aldha Shafrieldha Shihab, Anugerah Pagiyan Nurfajar / Sistem Pengelolaan Kearsipan Google | 139
Melalui Big Data
Kune, R., Konugurthi, P.K., Agarwal, A., O‟Connell, Brian. 2018. History of Google:
Chillarige, R.R. dan Buyya, R., How It Began and What’s
2016. The Anatomy of Big Data Happening Beyond 2019. (Online)
Computing. Software: Practice https://www.thestreet.com/technol
and Experience, Vol. 46 No. 1, ogy/history-of-google-14820930.
hlm 79-105. (Diakses 20 Mei 2020).
Maestro. 2010. Apa itu Google Earth. Ramadhan, H.A. dan Putri, D.A., 2018. Big
(Online) Data, Kecerdasan Buatan,
https://maestro.unud.ac.id/apa-itu- Blockchain, dan Teknologi
google-earth/. (Diakses pada 20 Finansial di Indonesia. Jakarta:
Mei 2020). Direktorat Jenderal Aplikasi
Martinez-Uribe, L., 2019. Digital Archives Informatika Kementerian
as Big Data. Mathematical Komunikasi dan Informasi.
Population Studies, Vol. 26, No. 2, Rustam, Muhammad. 2014. Pengelolaan
hlm 69-79. Arsip Elektronik. (Online).
Maryanto, B., 2017. Big Data dan http://repository.ut.ac.id/4158/1/A
Pemanfaatannya dalam Berbagai SIP4429-M1.pdf. (Diakses pada 14
Sektor. Media Informatika, Vol. Mei 2020).
16, No. 2, hlm 14-19. Schmidt, E. dan Rosenberg, J., 2014. How
Milenkovic, Jovan. 2019. 30 Eye-Opening Google Works. United Kingdom:
Big Data Statistics for 2020: Hachette.
Patterns are Everywhere. Sirait, E.R.E., 2016. Implementasi
Komando Tech. (Online) Teknologi Big Data di Lembaga
https://kommandotech.com/statistic Pemerintahan Indonesia. Jurnal
s/big-data-statistics/. (Diakses pada Penelitian Pos dan Informatika,
7 Januari 2021) Vol. 6, No, hlm 113-136.
Muljono, P. 2010. Manajemen Arsip Teknologi Bigdata. 2013. Big Data dan
dengan Sistem Modern. (Online). Rahasia Kejayaan Google.
https://202.124.205.241/bitstream/ (Online). http://www.teknologi-
handle/123456789/33842/KPMpj bigdata.com/2013/02/big-data-dan-
m-Artik8- rahasia-kejayaan-google.html.
Manajemen%20arsip.pdf?sequence (Diakses pada 21 Juni 2020).
=1&isAllowed=y.
142 | Jurnal Kearsipan Volume 15 Nomor 2, Desember 2020