Professional Documents
Culture Documents
KELAS X.5
DISUSUN OLEH :
KELAS : X.5
NO. ABSEN : 28
Makalah ini dibuat dengan tujuan untuk membahas materi tentang Scroping, Floowchart,
Pseudocock. Penulis sangat berharap semoga makalah ini dapat menambah pengetahuan dan
pengalaman bagi pembaca. Bahkan kami berharap lebih jauh lagi agar makalah ini bisa
pembaca praktikkan dalam kehidupan sehari-hari.
Bagi kami sebagai penyusun merasa bahwa masih banyak kekurangan dalam penyusunan
makalah ini karena keterbatasan pengetahuan dan pengalaman kami. Untuk itu kami sangat
mengharapkan kritik dan saran yang membangun dari pembaca demi kesempurnaan makalah
ini. Terimakasih kepada guru yang mengajar informatika atas dukungannya. Terutama kepada
Bapak Nedi Adam sebagai guru informatika.
Penulis
BAB 1
PENDAHULUAN
A. Web Scroping
Pengertian
Web scraping adalah teknik yang digunakan untuk mengumpulkan konten dan data dari
internet. Data ini biasanya disimpan dalam file lokal sehingga dapat dimanipulasi dan
dianalisis sesuai kebutuhan. Jika Anda pernah menyalin dan menempelkan konten dari
sebuah situs web ke dalam lembar Excel, maka hal inilah yang disebut dengan web
scraping, namun masih dalam skala yang sangat kecil.
Fungsi
1. Monitoring harga di pasaran
Adanya web scrapping bisa memonitoring harga produk yang sama di pasaran.
Jika mempunyai produk tertentu, maka bisa dengan mudah melihat
perbandingan harganya dengan memakai web scrapping.
2. Analisa competitor
Bukan hanya bisa mengetahui harga produk yang serupa dari competitor.
Adanya web scrapping juga bisa memberitahukan dengan dalam berbagia
macam informasi perusahaan lain.
3. Parsing HTML
Pada dasarnya, parsing HTML adalah metode yang dilakukan dengan mengirimkan HTTP
request kepada server yang menyimpan data website yang datanya ingin Anda ekstrak.
Dengan teknik ini, Anda dapat melakukan web scraping tidak hanya pada halaman
website yang bersifat statis, tetapi juga dinamis. Selain itu, parsing HTML.
jugamemungkinkan Anda untuk menyalin data dalam jumlah yang besar dalam waktu
singkat. Sayangnya, parsing HTML dapat dicegah dengan proteksi website. Tak hanya itu,
Anda bisa diblokir dari suatu situs jika terlalu sering melakukan teknik ini.
4. Menganalisa DOM
Document Object Model atau DOM adalah representasi struktur sebuah halaman
website yang ditulis dengan HTML. Ketika melakukan parsing HTML, DOM dari halaman
yang ingin diekstrak datanya akan dimuat terlebih dahulu. Untungnya, DOM juga
membawa data yang ada pada file HTML. Oleh karena itu, analisa DOM bisa dijadikan
alternatif untuk melakukan web scraping terhadap halaman situs dinamis jika parsing
HTML tidak membuahkan hasil. Untuk membantu proses ini, Anda bisa mencari
informasi yang diinginkan dengan regular expression (poin nomor 2).
5. Menggunakan XPath
XPath adalah bahasa query yang digunakan untuk memilih node dari struktur file XML
dan HTML. Implementasinya tidak jauh berbeda dengan analisa DOM. Anda
menggunakannya untuk mencari data dari struktur file penunjang halaman. Selain itu,
XPath juga dapat digunakan untuk mencari data pada elemen teks dalam file XML dan
HTML. Dengan demikian, teknik web scraping ini bisa Anda pilih ketika analisa DOM
kurang efektif.