You are on page 1of 40

SEKOLAH TINGGI

TEKNIK CENDEKIA
PROGRAM STUDI TEKNIK INFORMATIKA

PENULISAN ILMIAH

MEMBANGUN KORPUS PORNOGRAFI BAHASA INDONESIA


BERBASIS TEXT MINING PADA ARTIKEL SITUS DEWASA

Nama : Mahasiswa Rajin dan Tekun


NPM : 123456789
Program Studi : Teknik Informatika
Pembimbing : Dr. Miftah Andriansyah, SSi, MSSI.

Diajukan Guna Melengkapi Sebagian Syarat


Dalam Mencapai Gelar Setara Sarjana Muda

JAKARTA

2015
Pernyataan Orisinalitas dan
Publikasi

Saya yang bertanda tangan di bawah ini:


Nama : Mahasiswa Rajin dan Tekun
NPM : 123456789
Judul Penulisan : MEMBANGUN KORPUS PORNOGRAFI
BAHASA INDONESIA BERBASIS TEXT
MINING PADA ARTIKEL SITUS
DEWASA
Tanggal Sidang :
Tanggal Lulus :

Menyatakan bahwa tulisan di atas merupakan hasil karya saya sendiri


dan dapat dipublikasikan sepenuhnya oleh Sekolah Tinggi Teknik Cendekia.
Segala kutipan dalam bentuk apapun telah mengikuti kaidah dan etika yang
berlaku. Semua hak cipta dari logo serta produk yang disebut dalam buku
ini adalah milik masing-masing pemegang haknya, kecuali disebutkan lain.
Mengenai isi dan tulisan merupakan tanggung jawab Penulis, bukan Sekolah
Tinggi Teknik Cendekia.
Demikianlah pernyataan ini dibuat dengan sebenarnya dan dengan pe-
nuh kesadaran.

Jakarta, 14 Agustus 2015

(Mahasiswa Rajin dan Tekun)

ii
Lembar Pengesahan

Nama : Mahasiswa Rajin dan Tekun


NPM : 123456789
Judul Penulisan : MEMBANGUN KORPUS PORNOGRAFI
BAHASA INDONESIA BERBASIS TEXT
MINING PADA ARTIKEL SITUS
DEWASA
Tanggal Sidang :
Tanggal Lulus :

MENYETUJUI

Pembimbing 1 Pembimbing 2

(Dr. Miftah Andriansyah, SSi, MSSI.) (Pembimbing 2, ST., MT.)

Ketua Jurusan Teknik Informatika

(Dr. Miftah Andriansyah, SSi, MSSI..)

iii
Abstraksi

Mahasiswa Rajin dan Tekun. 123456789


MEMBANGUN KORPUS PORNOGRAFI BAHASA INDONESIA BERBASIS TE-
XT MINING PADA ARTIKEL SITUS DEWASA.
Penulisan Ilmiah, Program Studi Teknik Informatika, Sekolah Tinggi Teknik
Cendekia, 2015.
Kata Kunci : Korpus, Kamus Data, Pornografi, Bahasa Indonesia, Text Mining,
PI
(xi+ 46+ lampiran)

Dalam tulisan ini akan dibahas mengenai proses pembuatan suatu korpus
pornografi. Penulis mengangkat tema ini karena saat ini sangat mudah untuk
mengakses situs pornografi maupun artikel-artikel cerita dewasa di internet.
Peran pemerintah dalam memblokir situs pornografi masih belum berhasil,
dikarenkan masih banyak sekali situs maupun artikel cerita dewasa yang
sangat mudah di akses. Korpus adalah suatu set koleksi kata yang terstruktur
yang disimpan didalam komputer dan digunakan untuk mengetahui kata-
kata yang digunakan dalam bahasa tertentu.
Tahapan pengerjaan dalam tulisan ini dimulai dari pengumpulan kata
non pornografi sebagai alat pembanding dalam proses penyaringan kata dari
artikel-artikel cerita dewasa yang akan disaring untuk dijadikan suatu korpus
baru yaitu korpus pornografi.
Dengan adanya korpus pornografi ini diharapkan bisa digunakan sebagai
data dalam membantu pemblokiran situs atau artikel-artikel yang isi dari
halaman situs tersebut banyak mengandung kata pornografi.

Daftar Pustaka (1992-2015)

iv
Kata Pengantar

Segala puji dan syukur penulis naikkan ke hadirat Allah S.W.T yang Maha
Kuasa yang telah memberikan berkat, anugerah dan karunia yang melimpah,
sehingga penulis dapat menyelesaikan Penulisan Ilmiah ini pada waktu yang
telah ditentukan.
Penulisan ini disusun guna melengkapi sebagian syarat untuk mempe-
roleh gelar Setara Sarjana Muda Sekolah Tinggi Teknik Cendekia. Adapun
judul Penulisan ini adalah "Membangun Korpus Pornografi Bahasa Indonesia
Berbasis Text Mining Pada Artikel Situs Dewasa".
Walaupun banyak kesulitan yang penulis harus hadapi ketika menyusun
Penuliasn ini, namun berkat bantuan dan dorongan dari berbagai pihak,
akhirnya Penulisan ini dapat diselesaikan dengan baik. Untuk itu penulis
tidak lupa mengucapkan terima kasih kepada:

1. Ibu Dr. Muhammad Subali., Ketua Universitas Gunadarma.

2. Bapak Dr. Miftah Andriansyah, SSi, MSSI.., Ketua Jurusan Teknik In-
formatika.

3. Bapak Dr. Miftah Andriansyah, SSi, MSSI., Pembimbing penulis yang


ditengah- tengah aktifitas dan kesibukannya telah membimbing penulis
dan memberikan dorongan sehingga penulisan ini dapat diselesaikan.

4. Kedua orang tua dan kakak-kakak tercinta yang selalu mendukung dan
terus memberikan motivasi.

5. Seluruh rekan seperjuangan di Sekolah Tinggi Teknik Cendekia yang


telah banyak membantu penulis.

6. Semua pihak yang tidak tersebutkan yang telah membantu penyele-


saian Tugas Akhir ini, penulis ucapkan juga terima kasih atas segala
bantuan dan sarannya.

v
Sebagai manusia biasa yang tak luput dari kesalahan, maka penulis memin-
ta maaf atas segala kekurangan dan keterbatasan dalam penyusunan Tugas
Akhir ini.
Akhir kata, hanya kepada Tuhan jualah segalanya dikembalikan dan pe-
nulis sadari bahwa penulisan ini masih jauh dari sempurna, disebabkan ka-
rena berbagai keterbatasan yang penulis miliki. Untuk itu penulis mengha-
rapkan kritik dan saran yang bersifat membangun untuk menjadi perbaikan
di masa yang akan datang.
Semoga apa yang ada pada penulisan Tugas Akhir ini dapat bermanfaat
bagi kita semua. Aamiin.

Tangerang, Maret 2015

Penulis

vi
Daftar Isi

Halaman Judul i

Lembar Orisinalitas ii

Lembar Pengesahan iii

Abstraksi iv

Kata Pengantar v

Daftar Isi viii

Daftar Gambar ix

Daftar Tabel x

1 PENDAHULUAN 1
1.1 Latar Belakang . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Batasan Masalah . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Tujuan Penulisan . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.4 Metode Penulisan . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.5 Sistematika Penulisan . . . . . . . . . . . . . . . . . . . . . . 3

2 LANDASAN TEORI 4
2.1 Pornografi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1.1 Definisi Pornografi . . . . . . . . . . . . . . . . . . . . 4
2.1.2 Istilah Pornografi . . . . . . . . . . . . . . . . . . . . . 4
2.1.3 Perkembangan pornografi di Indonesia . . . . . . . . . 5
2.2 Undang - Undang Terkait . . . . . . . . . . . . . . . . . . . . 6
2.2.1 Undang - Undang Republik Indonesia Nomor 44 Tahun
2008 Tentang Pornografi . . . . . . . . . . . . . . . . . 6

vii
2.2.2Undang - Undang Republik Indonesia Nomor 35 Ta-
hun 2014 Tentang Perubahan Atas Undang - Undang
Nomor 23 Tahun 2002 Tentang Perlindungan Anak . . 7
2.2.3 Undang - Undang Republik Indonesia Nomor 11 Tahun
2008 Tentang Infromasi Dan Transaksi Elektronik . . .
8 2.3
Korpus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
2.3.1 Sejarah Korpus . . . . . . . . . . . . . . . . . . . . . . 9
2.3.2 Karakteristik Korpus . . . . . . . . . . . . . . . . . . .
9 2.4 Artikel Dewasa
10
2.5 PHP.........................................................................................................10
2.6 Webcorp.................................................................................................11
2.7 URL.........................................................................................................12

3 PEMBAHASAN DAN ANALISA 14


3.1 Gambaran Umum Aplikasi..................................................................14
3.2 Spesifikasi Hardware dan Software....................................................14
3.3 Tahapan Aplikasi..................................................................................15
3.4 Rancangan Tampilan Aplikasi.............................................................17
3.4.1 Rancangan Tampilan Awal.....................................................17
3.4.2 Rancangan Tampilan “Proses Selesai”...................................17
3.5 Langkah Instalasi..................................................................................18
3.5.1 Instalasi Xampp........................................................................18
3.5.2 Instalasi Notepad++...........................................................19
3.6 Langkah – Langkah Pembuatan Program..........................................20
3.7 Uji Coba dan Implementasi.................................................................22
3.7.1 Hasil kuisoner korpus bahasa indonesia yang mengan-
dung kata pornografi...............................................................24

4 PENUTUP 25
4.1 Kesimpulan............................................................................................25
4.2 Saran......................................................................................................25

DAFTAR PUSTAKA 28

LAMPIRAN 29
viii
Daftar

2.1 Hasil Pencarian Artikel Dewasa..........................................................10


2.2 Halaman Webcorp.................................................................................12

3.1 Tahapan Aplikasi Umum......................................................................15


3.2 Tahapan Aplikasi Khusus.....................................................................16
3.3 Tampilan Awal......................................................................................17
3.4 Proses Selesai........................................................................................18
3.5 Proses instalasi XAMPP........................................................................19
3.6 Proses pemilihan software..................................................................19
3.7 Proses Instalasi notepad++...........................................................20
3.8 Proses pemilihan bahasa.....................................................................20
3.9 Copy URL di Webcorp...........................................................................23
3.10 Tabel di Webcorp..................................................................................23

ix
Daftar

3.1 Korpus Pornografi Bahasa Indonesia.................................................24

x
Bab
PENDAHULUAN

1.1 Latar Belakang


Kemajuan teknologi merupakan sesuatu yang tidak bisa kita hindari da-
lam kehidupan ini, karena kemajuan teknologi akan berjalan sesuai dengan
kemajuan ilmu pengetahuan. Setiap perubahan ditujukan untuk memberik-
an manfaat positif bagi kehidupan manusia. Memberikan banyak kemudah-
an dalam melakukan aktifitas manusia.
Di Indonesia, dengan perkembangan internet ternyata pornografi telah
menjadi hal yang sangat umum karena sangat mudah diakses oleh setiap
kalangan usia. Sebuah survei terbaru menyebutkan, anak usia 12 tahun
hingga 13 tahun rentan kecanduan pornografi melalui internet. Kecandu-
an pornografi pada anak-anak biasanya dimulai ketika anak menghabiskan
terlalu banyak waktu di depan komputer tanpa sepengetahuan atau penga-
wasan orang tua. Dampaknya adalah makin aktifnya perilaku seksual prani-
kah yang disertai ketidaktahuan yang pada gilirannya bisa membahayakan
kesehatan reproduksi remaja.[4]
Pemerintah telah melakukan pencegahan peredaran pornografi dengan
upaya-upaya yang telah dilakukan berupa pemblokiran situs pornografi dan
sosisalisai internet sehat. Pemblokiran tersebut mengikuti UU No 36/1999
tentang Telekomunikasi, khususnya Pasal 21 yang menyebutkan bahwa pe-
nyelenggara telekomunikasi dilarang melakukan kegiatan usaha penyeleng-
garaan telekomunikasi yang bertentangan dengan kepentingan umum, ke-
susilaan, keamanan, atau ketertiban umum. Namun dengan upaya tersebut
ternyata masih banyak cerita-cerita dewasa yang masih mudah di akses dan
sangat berbahaya dampaknya bagi anak-anak. Dengan dibuatnya Korpus
tentang pornografi, diharapkan bisa membantu pemblokiran situs cerita de-

1
2

wasa melalui pendekatan Korpus.


Berdasarkan masalah yang muncul diatas, maka Penulisan ini berjudul
“Membangun Korpus Pornografi Bahasa Indonesia Berbasis Text Mining
Pada Artikel Situs Dewasa“, yang diharapkan Korpus ini dapat membantu
peme- rintah dalam memblokir situs pornografi .

1.2 Batasan Masalah


Batasan penelitian hanya pada bagaimana cara membangun korpus por-
nografi berbahasa Indonesia. Data yang diambil untuk objek penelitian di
ambil dari situs-situs cerita dewasa berbahasa Indonesia. Data diambil ha-
nya dari 10 halaman artikel dari situs dewasa yang berbeda. Situs dewasa
tersebut yang dapat diakses dari dekstop dan smartphone. Penelitian meng-
gunakan pendekatan manual dan otomatis, bahasa pemrograman PHP.

1.3 Tujuan Penulisan


Tujuan dari penulisan ini adalah membuat korpus pornografi berbahasa
Indonesia. Diharapkan korpus yang dibuat dapat membantu dalam pence-
gahan peredaran konten pornografi.

1.4 Metode Penulisan


Metode penulisan yang diterapkan dalam penyusunan ini adalah:

1. Analisa
Analisa dilakukan dengan mengumpulkan bahan-bahan dan sumber in-
formasi yang berkaitan dengan pornografi baik dari buku-buku, paper,
jurnal ataupun media lain seperti internet.

2. Perancangan
Pembuatan tampilan berupa rancangan halaman.

3. Pembuatan
Bahan-bahan yang telah dikumpulkan tersebut akan diolah kedalam
bahasa pemrograman PHP.
3

4. Implementasi
Tahap ini adalah tahap menguji aplikasi yang telah dibuat, apakah
aplikasi dapat berjalan dengan baik sesuai fungsi dan tujuannya yai-
tu membuat Korpus pornografi.

1.5 Sistematika Penulisan


Pembahasan dalam penulisan ilmiah ini akan dibagi ke dalam empat bab
yang terdiri dari:

1. BAB 1 PENDAHULUAN
Bab ini berisi mengenai latar belakang penulisan, rumusan masalah,
batasan masalah, tujuan penulisan, metode penulisan dan sistematika
penulisan.

2. BAB 2 LANDASAN TEORI


Bab ini berisi tentang teori - teori yang mendukung penulisan ini beru-
pa istilah pornografi, perkembangan pornografi di Indonesia, UU por-
nografi, korpus, PHP, Webcorp.

3. BAB 3 PEMBAHASAN DAN ANALISA


Bab ini berisi tentang pembahasan dan analisa yang berhubungan de-
ngan penulisan yang sedang dilakukan.

4. BAB 4 PENUTUP
Bab ini berisi kesimpulan dari apa yang telah diuraikan dalam bab-bab
sebelumnya dan saran-saran yang diharapkan dapat bermanfaat bagi
semua pihak.
Bab 2

LANDASAN TEORI

2.1 Pornografi

2.1.1 Definisi Pornografi


Pornografi adalah gambar, sketsa, ilustrasi, foto, tulisan, suara, bunyi,
gambar bergerak, animasi, kartun, percakapan, gerak tubuh, atau bentuk
pesan lainnya melalui berbagai bentuk media komunikasi dan/atau pertun-
jukan di muka umum, yang memuat kecabulan atau eksploitasi seksual yang
melanggar norma kesusilaan dalam masyarakat.[9]

2.1.2 Istilah Pornografi


Pornografi merupakan istilah yang berasal dari bahasa Yunani, porno-
graphia. Istilah ini bermakna tulisan atau gambar tentang pelacur. Kata ini
pertama kali muncul di Inggris pada masa Ratu Victoria (1837-1901). Ketika
itu arkeolog baru saja menmukan peninggalan benda-benda bersejarah (ar-
tefak) dari penggalian bekas kota Pompei dan Herculanum dekat Napoli di
Italia Selatan. Kedua kota ini terkubur magma dan lapisan abu akibat letusan
gunung Vesubvius selama 17 abad (79-1748). Ada sejumlah lukisan bermu-
atan seksual, baik secara gamblang atau karikatural, yang hadir di tembok -
tembok reruntuhan bangunan Romawi di kota itu. Salah satu contoh yang
menonjol adalah gambar tentang sebuah rumah bordil yang mengiklankan
berbagai pelayanan seksual pada dinding diatas beberapa pintu yang dite-
mukan disana. Bahkan, orang pun dapat menjumpai gambar alat kelamin
laki-laki (zakar dan buah zakar) yang diorehkan di sisi jalan untuk menun-
jukan arah ke rumah bordir dan tempat hiburan. Kenyataan di Pompei ini-
lah, antara lain, yang membuat masyarakat Eropa ketika itu, kemudian me-

4
5

nyimpulkan bahwa benda peninggalan seperti itu berhubungan dengan tem-


pat pelacuran sehingga kemudian lahirlah istilah pornografi (tulisan/gambar
tentang pelacur). Tahun 1857, Oxford Dictionary memberi pengertian pada
kata pornografi sebagai “menulis soal soal pelacur”. Kamus Webster mende-
finisikan pornografi sebagai “lukisan tak bermoral yang menghiasi dinding
ruangan untuk pesta liar, seperti yang terdapat di Pompei.” Perkembangan
selanjutnya, pornografi mengalami perluasan baik dari makna, bentuk ma-
upun variasi. Apalagi, ketika ditemukannya teknologi fotografi dan gambar
hidup (film), serta majalah. Catatan terpenting dari perkembangan porno-
grafi menurut buku Patrick Robertson, adalah hadirnya film-film bermuatan
seks di Eropa seperti Film a l’Ecu d’or Ou La Bonne Auberge di Jerman pada
sekitar tahun 1910 serta terbit dan berkembangnya apa yang disebut “maja-
lah pria” seperti Playboy, Hustler, dan Modern Man, di Amerika Serikat pada
1950-an. Sehingga kemudia pornografi juga mengalami perluasan makna
menyesuaikan dengan perkembangan zama dan teknologi komunikasi yang
semakin canggih: televisi, radio, surat kabar, majalah, komik, CD, VCD/DVD,
hingga internet.[9]

2.1.3 Perkembangan pornografi di Indonesia


Dengan maraknya pornografi dan pornoaksi menyebabkan jumlah kasus
HIV/AIDS di Indonesia semakin tinggi. Menurut UNAIDS Country Coordina-
tor, Nancy Fee saat meluncurkan laporan Penularan HIV pada Hubungan Pa-
sangan Intim di Asia yang bertempat di Jakarta pada awal April 2010, bahwa
sejak tahun 2009, Indonesia dinyatakan sebagai wilayah penularan HIV/AI-
DS tercepat di Asia. Dalam dua tahun terakhir, Indonesia masuk dalam area
epidemis dengan perkembangan tercepat di Asia. Indonesia juga masuk da-
lam masa transisi pola penularan HIV/AIDS. Yang semula pola penularannya
menggunakan jarum suntik, sekarang melalui hubungan seksual. Data dari
Kementrian Kesehatan, Per Juni 2010 jumlah penderita HIV/AIDS di negeri
ini mencapai 21.770 orang dan itu berasal dari 32 pro-pinsi serta 300 ka-
bupaten dan kota. Padahal data sepuluh tahun silam, jum-lah penderita HI-
V/AIDS hanya sekitar 600 orang. Pada tahun 2012, Indonesia adalah juara
pengakses situs porno terbesar peringkat ke-3 di-bawah Cina dan Turki. Dan
sebelumnya malah juara kedua. Namun setelah Kementrian Komunikasi dan
Informatika menerapkan pemblokiran situs porno, peringkat tersebut turun
satu tingkat. Hal tersebut diungkapkan Dirjen Informasi Komunikasi Publik,
Kemkominfo.[10]
6

Agar peringkat Indonesia sebagai pengakses situs porno semakin turun,


tidak hanya melalui penegakan hukum saja, tetapi dibutuhkan filter-filter
yang lain, seperti keluarga, guru agama, tetangga serta lingkungan pendi-
dikan. Orang tua harus lebih peduli lagi kepada anak-anaknya, terutama
jika sedang membuka internet. Kemudian kepedulian lingkungan sekitar
terhadap warnet dan pemakai. Yang selanjutnya adalah para pendidik di se-
kolah. Pahamkan siswa mengenai dampak internet, karena ada sisi negatif
dari penggunaan internet, dan pahamkan juga mereka dari sisi agama. Ke-
mudian yang terakhir adalah pemerintah. Pemerintah harus lebih bertindak
tegas lagi kepada provider internet agar segera menutup akses-akses kesitus
porno. Bagi provider yang melanggar, silahkan untuk ditindak tegas sesuai
dengan undang-undang.

2.2 Undang - Undang Terkait

2.2.1 Undang - Undang Republik Indonesia Nomor 44 Ta-


hun 2008 Tentang Pornografi
Pengaturan pornografi berasaskan Ketuhanan Yang Maha Esa, penghor-
matan terhadap harkat dan martabat kemanusiaan, kebhinekaan, kepastian
hukum, nondiskriminasi, dan perlindungan terhadap warga negara. Hal ter-
sebut berarti bahwa ketentuan yang diatur dalam UndangUndang ini adalah:
1. menjunjung tinggi nilai-nilai moral yang bersumber pada ajaran agama; 2.
memberikan ketentuan yang sejelas-jelasnya tentang batasan dan larangan
yang harus dipatuhi oleh setiap warga negara serta menentukan jenis sanksi
bagi yang melanggarnya; dan 3. melindungi setiap warga negara, khusus-
nya perempuan, anak, dan generasi muda dari pengaruh buruk dan korban
pornografi. Pengaturan pornografi dalam Undang-Undang ini meliputi (1)
pelarangan dan pembatasan pembuatan, penyebarluasan, dan penggunaan
pornografi; (2) perlindungan anak dari pengaruh pornografi; dan (3) pence-
gahan pembuatan, penyebarluasan, dan penggunaan pornografi, termasuk
peran serta masyarakat dalam pencegahan. Undang-Undang ini menetapk-
an secara tegas tentang bentuk hukuman dari pelanggaran pembuatan, pe-
nyebarluasan, dan penggunaan pornografi yang disesuaikan dengan tingkat
pelanggaran yang dilakukan, yakni berat, sedang, dan ringan, serta membe-
rikan pemberatan terhadap perbuatan pidana yang melibatkan anak. [7]
7

2.2.2 Undang - Undang Republik Indonesia Nomor 35 Ta-


hun 2014 Tentang Perubahan Atas Undang - Undang
Nomor 23 Tahun 2002 Tentang Perlindungan Anak
Pemerintah telah mengesahkan Undang-Undang Nomor 23 Tahun 2002
tentang Perlindungan Anak, yang secara substantif telah mengatur bebera-
pa hal antara lain persoalan Anak yang sedang berhadapan dengan hukum,
Anak dari kelompok minoritas, Anak dari korban eksploitasi ekonomi dan
seksual, Anak - Anak yang diperdagangkan, Anak korban kerusuhan, Anak
yang menjadi pengungsi dan Anak dalam situasi konflik bersenjata, Perlin-
dungan Anak yang dilakukan berdasarkan prinsip nondiskriminasi, kepen-
tingan terbaik bagi anak, penghargaan terhadap pendapat anak, hak untuk
hidup, tumbuh dan berkembang. Dalam pelaksanaanya Undang-Undang ter-
sebut telah sejalan dengan amanat Undang-Undang Dasar Negara Republik
Indonesia Tahun 1945 terkait jaminan hak asasi manusia, yaitu Anak sebagai
manusia memiliki hak yang sama untuk tumbuh dan berkembang.
Walaupun instrumen hukum telah dimiliki, dalam perjalanannya Undang-
Undang Nomor 23 Tahun 2002 tentang Perlindungan Anak belum dapat
berjalan secara efektif karena masih adanya tumpang tindih antarpera- turan
perundang-undangan sektoral terkait dengan definisi Anak. Di sisi la- in,
maraknya kejahatan terhadap Anak di Masyarakat, salah satunya adalah
kejahatan seksual, memerlukan peningkatan komitmen dari Pemerintah, Pe-
merintah Daerah, dan Masyarakat serta semua pemangku kepentingan yang
terkait dengan penyelenggaraan Perlindungan Anak.
Perubahan Undang-Undang Nomor 23 Tahun 2002 tentang Perlindung-
an Anak juga mempertegas tentang perlunya pemberatan sanksi pidana dan
denda bagi pelaku kejahatan terhadap Anak, untuk memberikan efek jera,
serta mendorong adanya langkah konkret untuk memulihkan kembali fisik,
psikis dan sosial Anak korban dan/atau Anak pelaku kejahatan. Hal tersebut
perlu dilakukan untuk mengantisipasi Anak korban dan/atau Anak pelaku
kejahatan di kemudian hari tidak menjadi pelaku kejahatan yang sama.[8]
8

2.2.3 Undang - Undang Republik Indonesia Nomor 11 Ta-


hun 2008 Tentang Infromasi Dan Transaksi Elektro-
nik
Pemanfaatan Teknologi Informasi, media, dan komunikasi telah meng-
ubah baik perilaku masyarakat maupun peradaban manusia secara global.
Perkembangan teknologi informasi dan komunikasi telah pula menyebabkan
hubungan dunia menjadi tanpa batas (borderless) dan menyebabkan peru-
bahan sosial, ekonomi, dan budaya secara signifikan berlangsung demikian
cepat.
Dalam UU No. 11 Tahun 2008 tentang Informasi dan Transaksi Elektro-
nik juga tidak ada istilah pornografi, tetapi “muatan yang melanggar kesusi-
laan”. Penyebarluasan muatan yang melanggar kesusilaan melalui internet
diatur dalam pasal 27 ayat (1) UU ITE mengenai Perbuatan yang Dilarang,
yaitu;
“Setiap Orang dengan sengaja dan tanpa hak mendistribusikan dan/a-
tau mentransmisikan dan/atau membuat dapat diaksesnya Informasi Elek-
tronik dan/atau Dokumen Elektronik yang memiliki muatan yang melang-
gar kesusilaan.” Pelanggaran terhadap pasal 27 ayat (1) UU ITE dipidana
dengan pidana penjara paling lama enam tahun dan/atau denda paling ba-
nyak Rp1 milyar (pasal 45 ayat [1] UU ITE). Dalam pasal 53 UU ITE, dinya-
takan bahwa seluruh peraturan perundang-undangan yang telah ada sebe-
lumnya dinyatakan tetap berlaku, selama tidak bertentangan dengan UU ITE
tersebut.[5]

2.3 Korpus
Korpus yang dimaksud dalam penelitian ini adalah korpus linguistik
(selanjutnya disebut dengan “korpus”) yang digunakan dalam setiap proses
dalam banyak pengolahan diantaranya dalam Natural Language Processing
(NLP), Text Mining, Analisis Sentimen, dan lain sebagainya. [Engwall, 1992]
mendefinisikan korpus sebagai himpunan tertutup dari teks yang memiliki
bentuk yang dapat dibaca mesin (machine-readable) atau komputer, dengan
kriteria yang didefinisikan terlebih dahulu. Nadja Nesselhauf [Nesselhauf,
2011] menyebutkan bahwa Korpus Linguistik adalahsuatu analisis terhadap
bahasa yang terjadi secara alami yang berbasis pada korpus atau korpora,
yang pada saat ini dipersempit pemahamannya atas koleksi teks yang ter-
9

komputerisasi [Leech, 1991] menambahkan, korpus dimaksud harus dapat


merepresentasikan dan seimbang dengan faktor khusus atau tertentu atau
dengan kata lain bergenre tertentu atau spesifik atau domain terbatas (clo-
sed domain). Sebagai contoh, yaitu artikel surat kabar bergenre tertentu,
cerita atau literatur fiksi, blog, diari, dan dokumen legal. Selain itu korpus
menurutnya haruslah mewakili atau cerminan dari varietas bahasa jika kon-
ten dari korpus tersebut dapat digeneralisasi ke jenis atau variasi tersebut.[1]

2.3.1 Sejarah Korpus


Tahun 1960, korpus terkenal Brown mulai disusun oleh Francis dan Ku-
cera selama dua dekade. Dalam kurun waktu ’60-an sampai ’70-an ada be-
berapa penelitian terkait dengan korpus, diantaranya: implementasi model
stokastik untuk menyusun speech corpora dan sistem speech recognition. Ta-
hun 1975 pengembangan Survey of English Usage (SEU) dan korpus Brown
yang menghasilkan korpus London-Lund. Tahun 1980, penerbit Collin dan
Universitas Birmingham menyusun korpus Cobuild untuk memproduksi ka-
mus baru bahasa Inggris yaitu korpus Birmingham (20 juta kata) dan Bank
of English Corpus yang menjadi dasar bagi penyusunan kamus BBC Engli-
sh (70 juta kata). Tahun 1990, korpus Penn Treebank dirilis dari bahasa
Inggris alami yang terdiri dari 4,5 juta kata. Pada rentang tahun ini, juga
dirilis British National Corpus (BNC) dengan 100 juta kata. Tahun 1994,
didanai Cambridge University Press, disusunlah korpus Cambridge and Not-
tingham Corpus of Discourse in English (Cancode) yang terdiri dari 5 juta
kata. ahun 2000-an, seiring dengan pertumbuhan World Wide Web (WWW)
dirilis proyek The American National Corpus yang terdiri dari 22 juta sub
korpus. Korpus lainnya seperti Corpus of Contemporary American English
dengan 400 juta kata; juga korpus terbitan Google yaitu Google n-gram cor-
pus yang terdiri dari 1 milyar token kata dari halaman web publik dengan n-
gram. Tahun 2010, organisasi standar internasional (ISO) memulai pe-
ngenalan dan pengembangan format pengkodean teks (text encoding) yang
digunakan untuk penganotasian korpus.[1]

2.3.2 Karakteristik Korpus


Suatu korpus memiliki karaktekteristik dan taksonomi tertentu. Karak-
teristik korpus modern, setidaknya memiliki empat karakter utama yaitu[1]:

• Sampling dan keterwakilan


1

• Ukuran berhingga

• Bentuknya dapat dibaca mesin (komputer) dan

• Rujukan standar

2.4 Artikel Dewasa


Artikel dewasa merupakan rangkaian peristiwa yang disampaikan, ba-
ik berasal dari kejadian nyata (non fiksi) ataupun tidak nyata (fiksi) ber-
hubungan tentang seks. Artikel dewasa banyak terdapat di internet, ada
yang sudah diblokir dan masih banyak yang belum terblokir. Artikel dewasa
yang dimaksud yang isi kontennya, seperti pornografi atau kekerasan, yang
umumnya tidak dianggap tepat untuk dilihat oleh anak-anak. [2] Artikel de-
wasa dapat dicari dengan keyword. Keyword disini adalah suatu susunan
suku kata yang diketikkan di mesin pencarian atau juga bisa satu kata saja.
Contoh keyword: artikel dewasa seperti pada Gambar 2.1.

Gambar 2.1: Hasil Pencarian Artikel Dewasa

2.5 PHP
PHP (akronim dari PHP Hypertext Preprocessor) yang merupakan bahasa
pemrogramman berbasis web yang memiliki kemampuan untuk mempro-
ses data dinamis. PHP dikatakan sebagai sebuah server-side embedded script
language artinya sintaks-sintaks dan perintah yang kita berikan akan sepe-
nuhnya dijalankan oleh server tetapi disertakan pada halaman HTML biasa.
Aplikasi-aplikasi yang dibangun oleh PHP pada umumnya akan memberikan
1

hasil pada web browser, tetapi prosesnya secara keseluruhan dijalankan di


server.[12]
Pada prinsipnya server akan bekerja apabila ada permintaan dari client.
Dalam hal ini client menggunakan kode-kode PHP untuk mengirimkan per-
mintaan ke server. Ketika menggunakan PHP sebagai server-side embedded
script language maka server akan melakukan hal-hal sebagai berikut:

• Membaca permintaan dari client/browser.

• Mencari halaman (page) di server.

• Melakukan instruksi yang diberikan oleh PHP untuk melakukan modi-


fikasi pada halaman (page).

• Mengirim kembali halaman tersebut kepada client melalui internet atau


intranet.

PHP membuat proses pengembangan aplikasi menjadi mudah karena


memiliki beberapa kelebihan, yaitu:

1. PHP dapat dijalankan pada platform yang berbeda-beda, seperti: Win-


dows, Linux, Unix.

2. PHP dapat diintegrasikan ke berbagai server database, seperti: MySQL,


SQL Server, Oracle, PostgreSQL.

3. PHP merupakan bahasa scripting yang paling mudah karena memiliki


referensi yang banyak.

4. PHP mudah dipelajari.

5. PHP dapat membangun halaman web menjadi lebih dinamis.

6. PHP disimpan sebagai plain text dalam format ASCII, sehingga kode
PHP dapat ditulis hampir di semua editor text seperti windows notepad,
windows wordpad, dll.

2.6 Webcorp
Webcorp adalah sebuah media yang memungkinkan akses ke World
Wide Web sebagai korpus, dimana sebuah koleksi teks yang faktanya ten-
tang bahasa yang dapat diekstrasi. Alamat URL Webcorp bisa diakses pada
1

www.webcorp.org.uk. Search engine, seperti Google dan Bing, dirancang


untuk mengambil informasi dari World Wide Web. Mereka menggunakan
teknik yang rumit untuk indeks Web dan mengembalikan dokumen dari in-
deks mereka yang paling relevan untuk permintaan pengguna. WebCorp di-
rancang untuk mengambil data linguistik dari Web: garis konkordansi me-
nunjukkan konteks dimana terjadi istilah pencarian pengguna. Menanggapi
permintaan pengguna, mesin pencari standar kembali daftar URL (alamat
halaman), bersama dengan deskripsi atau teks dari setiap halaman untuk
membantu pengguna memutuskan halaman mana yang paling berguna. Un-
tuk melihat halaman, pengguna harus mengklik pada masing-masing link
individual. WebCorp sebenarnya mengunjungi masing-masing halaman ini,
penggalian baris konkordansi dari mereka. Meskipun beberapa mesin pen-
cari, seperti Google, memberikan kata kunci dalam konteks gaya untuk be-
berapa URL dalam daftar hasil, hal ini tidak berlaku untuk semua URL dan
tidak semua contoh istilah pencarian di setiap halaman diberikan dalam ini
ekstrak singkat. Mungkin kasus yang terjadi istilah pencarian berkali-kali
pada halaman tertentu, tetapi Google-pengguna tidak bisa tahu ini tanpa
mengklik pada setiap link secara manual. Google adalah mesin pencari yang
sangat baik tetapi tidak dirancang sebagai alat linguistik korpus dan tidak
ideal untuk tujuan ini. WebCorp berisi opsi (konkordansi disesuaikan span,
format output, dll) yang dirancang khusus untuk penelitian linguistik.[6]

Gambar 2.2: Halaman Webcorp

2.7 URL
URL singkatan dari Uniform Resource Locator, adalah rangkaian karak-
ter menurut suatu format standar tertentu, yang digunakan untuk menun-
1

jukkan alamat suatu sumber seperti dokumen dan gambar di Internet. URL
merupakan suatu inovasi dasar bagi perkembangan sejarah Internet. URL
pertama kali diciptakan oleh Tim Berners-Lee pada tahun 1991 agar penulis-
penulis dokumen-dokumen dapat merujuk pranala ke Waring Wera Wanua
atau World Wide Web. Sejak 1994, konsep URL telah dikembangkan menjadi
istilah Uniform Resource Identifier (URI) yang lebih umum sifatnya. Walau-
pun demikian, istilah URL masih tetap digunakan secara luas. Contoh URL:
http://www.coba.com/images/hardware/pda.html.[3]
URL menunjukkan sumber daya internet atau alamat sebuah halaman
web (homepage) yaitu halaman suatu dokumen atau program yang ingin
ditampilkan atau digunakan.[11]
Bab 3

PEMBAHASAN DAN ANALISA

3.1 Gambaran Umum Aplikasi


Aplikasi ini dibuat untuk mengumpulkan kata-kata pada artikel cerita
dewasa di internet dimana data-data tersebut akan diolah dan dijadikan se-
bagai Korpus yang kemudian dapat digunakan untuk proses-proses lain yang
memerlukan korpus sebagai datanya.
Aplikasi ini terdapat kumpulan kata non pornografi yang didapat dari
KBBI dan penulis menambahkan secara manual. Kata non pornografi di-
perlukan untuk menyaring data-data dari cerita dewasa tersebut agar ter-
cipta korpus baru, lalu menghasilkan korpus pornografi dalam bentuk txt.
Aplikasi ini dibuat bertujuan untuk membantu dalam pencegahan peredaran
pornografi melalui pendekatan korpus.

3.2 Spesifikasi Hardware dan Software


Spesifikasi Hardware:

1. Processor: Intel Pentium

2. Memory: 2 GB RAM

3. OS: Windows 8.1 32 bit

Spesifikasi Software:

1. XAMPP Versi 3.2.1

Spesifikasi penyedia layanan internet:

1. Jaringan internet Speedy pada dekstop

14
1

2. Jaringan internet provider Axis pada smartphone

3.3 Tahapan Aplikasi


Di sini penulis akan menjelaskan tahapan dari aplikasi yang akan dibu-
at. Tahapan disini adalah proses alur jalannya aplikasi pada saat membuat
korpus dan melihat proses alur aplikasi agar sesuai dengan yang sudah di-
rencanakan.

Gambar 3.1: Tahapan Aplikasi Umum

Pada Gambar 3.1 merupakan proses tahapan umum dalam pembuatan


korpus. URL yang di inputkan merupakan URL dari artikel dewasa yang
sudah diproses pada Webcorp. Selanjutnya adalah proses filtering dimana
dalam proses ini merupakan proses penyaringan kata dari artikel dewasa
dibandingkan dengan kata non pornografi. Proses penyaringan dilakukan
satu per satu pada tiap artikel dewasa yang akan diproses.
1

Gambar 3.2: Tahapan Aplikasi Khusus

Pada Gambar 3.2 merupakan tahapan dari program atau alur proses pem-
buatan korpus secara khusus atau lebih detail dalam pembuatan korpus. Di-
mana setelah proses filtering, akan menghasilkan korpus pornografi pada
tiap artikel-artikel dewasa yang diproses. Korpus-korpus yang terpisah ak-
an digabungkan menjadi satu korpus dalam proses penggabungan program.
Proses penggabungan dilakukan untuk menghindari kata yang sama dalam
sebuah korpus.
Artikel dewasa yang akan di proses pada pembuatan korpus merupakan
halaman judul dari cerita dewasa tersebut bukan halaman utama dari websi-
te cerita dewasa, untuk lebih jelasnya bisa melihat Gambar 3.4 dan Gambar
3.5. Artikel dewasa dapat dicari di internet menggunakan keyword seper-
ti cerita dewasa, artikel dewasa, cerita hot dan sebagainya. Penulis di
sini menggunakan keyword artikel dewasa.
1

3.4 Rancangan Tampilan Aplikasi


Pada tahap ini akan dilakukan perancangan layout aplikasi, tampilan
aplikasi ini sangat sederhana dan tidak terlalu memerlukan banyak menu
karena aplikasi ini lebih menekankan pada proses penyaringan dari sebuah
link artikel cerita dewasa di internet dan hanya menggunakan satu layout.
Tampilan aplikasi ini akan menampilkan input text untuk memasukkan
URL cerita dewasa yang telah di proses sebelumnya pada WebCorp. Selanjut-
nya setelah menekan submit, aplikasi akan melakukan proses penyaringan
untuk membangun korpus baru dari data URL yang telah di masukkan.

3.4.1 Rancangan Tampilan Awal


Pada awal aplikasi dijalankan di browser maka akan menampilkan input
text, lalu tombol submit untuk memproses data, input text disini berfungsi
untuk memasukkan URL yang diambil dari WebCorp dimana data telah dio-
lah menjadi suku kata. Tombol submit merupakan tombol memulai proses
aplikasi dimana suku kata akan disaring dengan kata non porno. Untuk lebih
jelasnya bisa melihat pada Gambar 3.2.

Gambar 3.3: Tampilan Awal

3.4.2 Rancangan Tampilan “Proses Selesai”


Pada halaman aplikasi ini menampilkan bahwa proses penyaringan da-
ta pada aplikasi telah selesai, lalu setelah proses selesai maka akan meng-
hasilkan korpus baru dalam format .txt. Untuk lebih jelasnya bisa melihat
Gambar 3.3.
1

Gambar 3.4: Proses Selesai

3.5 Langkah Instalasi


Dalam pembuatan program aplikasi penulis menggunakan beberapa sof-
tware pembantu yaitu apache sebagai web server. Kemudian dalam penulis-
an code program penulis menggukana notepad++ agar memudahkan da-
lam penulisan programnya karena notepad++ mempunyai plugin beberapa
bahasa terutama bahasa PHP yang penulis gunakan dalam pembuatan apli-
kasi ini, plugin tersebut berguna untuk membantu memberikan pemeriksaan
apakah sintaks yang dituliskan sudah benar.

3.5.1 Instalasi Xampp


Instalasi pertama adalah software XAMPP. Software ini merupakan sof-
tware gratis yang dapat didownload pada website resminya [URL XAMPP]
dan bisa digunakan dengan seluas-luasnya tanpa harus membayar lisensi
apapun. Penulis akan menjelaskan proses penginstalan secara bertahap.
Berikut adalah langkah-langkah penginstalan XAMPP yang harus dilakuk-
an:

1. Jalankan file xampp-win32-5.6.3-0-VC11-installer.exe. dengan cara


klik dua kali, kemudian akan muncul kotak dialog seperti pada Gambar
3.9, pilih next.
1

Gambar 3.5: Proses instalasi XAMPP

2. Kemudian melakukan pemilihan paket software apa saja yang akan kita
install, untuk kemudahan berikan tanda centang pada semua software.

Gambar 3.6: Proses pemilihan software

3.5.2 Instalasi Notepad++


Untuk keperluan teks editor penulis menggunaka nodepad++, software
ini juga merupaka software gratis yang dapat didownload di website res-
minya [URL NOTEPAD]. Berikut adalah langkah-langkah penginstalan Note-
pad++.

1. Jalankan file Notepad++ npp.6.2.3.Installer.exe dengan cara klik dua


kali.
2

Gambar 3.7: Proses Instalasi notepad++

2. Pemilihan bahasa sesuai yang kita inginkan, disini penulis mengguna-


kan bahasa Inggris.

Gambar 3.8: Proses pemilihan bahasa

3.6 Langkah – Langkah Pembuatan Program


1. Tahap pertama adalah proses coding. Pada bagian pertama coding se-
perti di-bawah ini
$dom = new DOMDocument ;
@$dom−>loadHTML ( $content )
;
$rows = array ( ) ;
for e ac h ( $dom−>getElementsByTagName ( ’ t r ’ ) as $t r ){
$ c e l l s = array ( ) ;
for e ac h ( $tr −>getElementsByTagName ( ’ td ’ ) as $td ){
$ c e l l s [] = $td−>nodeValue ;
}
$rows [] = $ c e l l s ;
}
2

Pada coding program di atas merupakan proses pengambilan data


dari webcorp yang sudah bebentuk tabel.

2. Pada bagian coding selanjutnya adalah proses penyaringan.

f o r ( $i =2; $i < count ( $rows ) ; $i++){


i f ( i s s e t ( $rows [ $i ][ 0 ])){
$cek = " beda " ;
f o r ( $k=0; $k < $panjang_data ; $k++){
i f ( $rows [ $i ][0]==$data [ $k ]) {
$cek = " sama " ;
break ;
}
}
i f ( $cek !=" sama " ) {
$rows [ $i ][ 0 ]." < br >";
$t x t = $rows [ $i ] [ 0 ] . " \ n
" ; f w r i t e ( $myfile , $t x t ) ;
}
}
}
}

Pada coding program di atas merupakan proses pengecekan array


dari data webcorp dengan kata non pornografi, jika data webcorp sa-
ma dengan data non pornografi maka proses berhenti, jika tidak sama
maka akan mencetak data webcorp ke korpus dalam bentuk .txt.

3. Pada bagian coding selanjutnya adalah proses penggabungan kata - ka-


ta yang sudah dikumpulkan dari beberapa artikel menjadi satu korpus.
f o r ( $i =0; $i < count ( $data2 ) ; $i++){
$cek = 0 ;
f o r ( $j=$i +1; $j < count ( $data2 ) ; $j++){
i f ( $data2 [ $i]==$data2 [ $j ]{
echo $data2 [ $i ] . " " . $data2 [ $j ]." < br >";
$cek = 1 ;
break ;
}
}
2

i f ( $cek==0) {
f w r i t e ( $handle2 , $data2 [ $i ] . PHP_EOL ) ;
}
}

Pada coding program di atas merupakan proses penggabungan file-


file yang sudah dikumpulkan dari artikel dewasa. Pada proses ini bertu-
juan untuk menggabungkan file-file menjadi satu file korpus dan meng-
hindari adanya kata yang sama dalam korpus.

3.7 Uji Coba dan Implementasi


Pada tahap ini penulis akan melakukan ujicoba menjalankan aplikasi
yang telah selesai dibuat. Karena aplikasi ini berbasis web sehingga proses
pengujian dilakukan pada browser. Untuk lebih jelasnya akan dijelaskan
dengan tahap-tahap di-bawah ini.

1. Pada pembuatan korpus penulis menggunakan alamat URL cerita de-


wasa di internet. Alamat URL yang digunakan dimasukkan ke dalam
http://www.webcorp.org.uk/ dimana webcorp ini digunakan untuk
memisahkan suku kata dan menyajikan dalam bentuk tabel. URL yang
digunakan dalam penelitian diakses pada bulan Juli-Agustus 2015. Di
sini penulis menggunakan 10 URL, berikut 10 URL yang digunakan:

2. Selanjutnya penulis menggunakan URL pertama. Lalu copy pada we-


bcorp di bagian Wordlist. Pada Webcorp terdapat input URL dimana
URL yang dimasukan adalah URL artikel cerita dewasa. Filter Out Sto-
pwords berfungsi untuk menyaring kata stopword. Ngram Size 1 word
berfungsi untuk memecah kalimat menjadi satu kata. Selanjutnya pi-
lih submit untuk melanjutkan proses pemecahan kalimat. Untuk lebih
jelasnya bisa melihat pada Gambar 3.19. Setelah proses selesai ma-
ka akan muncul halaman Webcorp kumpulan kata dalam bentuk tabel.
Untuk lebih jelasnya bisa melihat pada Gambar 3.20.
2

Gambar 3.9: Copy URL di Webcorp

Gambar 3.10: Tabel di Webcorp

Pada Gambar 3.24 merupakan hasil setelah pemecahan kalimat menja-


di 1 suku kata dan ditampilkan dalam bentuk tabel. Frequency berfung-
si untuk mengetahui ada berapa banyak kata yang sama. Contohnya
terdapat 81 kata gita pada artikel yang diproses. Dari 81 kata hanya 1
saja yang akan diproses dalam pembuatan korpus.

3. Browser dan masukan URL dari aplikasi penggabungan file-file. Di-


sini penulis meletakannya pada URL: http:/localhost/mergedata.
Kemudian proses penggabungan akan langsung bekerja, dima-
na setelah proses penggabungan selesai file korpus disimpan di
2

C:\xampp\htdocs\merge data\result dengan nama data_fixed.txt.


Data fixed tersebut merupakan gabungan dari 10 file korpus yang telah
dikumpulkan dalam 1 file tanpa ada kata yang kembar.

3.7.1 Hasil kuisoner korpus bahasa indonesia yang meng-


andung kata pornografi
Uji coba dilakukan dengan membuat kuisioner menggunakan google
form. Berdasarkan uji coba yang dilakukan pada 44 pengguna (pengakses)
terhadap kata – kata yang mengandung pornografi, didapatkan hasil dari
uji coba tersebut melalui kuisioner dengan mengajukan pertanyaan kepada
pengguna situs yaitu:

• Usia,

• Jenis kelamin,

• Berapa kali dalam sebulan mengakses situs atau artikel pornografi dan,

• 100 kata yang disediakan dalam kuisioner, apakah merupakan kata


yang mengandung ponografi, ragu-ragu atau non pornografi.

Dari 100 kata terdapat 39 kata mengandung pornografi dengan persentase


pornografi di atas 50%. Untuk lebih jelasnya bisa melihat Tabel 3.2.

Tabel 3.1: Korpus Pornografi Bahasa Indonesia

Kata
teks teks teks teks
teks teks teks teks
teks teks teks teks
teks teks teks teks
teks teks teks teks
teks teks teks teks
teks teks teks teks
teks teks teks teks
teks teks teks teks
teks teks teks teks
Bab 4

PENUTUP

4.1 Kesimpulan
Proses pengembangan korpus berbantu aplikasi berhasil menyusun kor-
pus pornografi berbahasa Indonesia. Proses pemilihan korpus berdasarkan
pada peniliaian oleh pengguna atau pengakses artikel situs dewasa (porno-
grafi). Kriteria didasarkan pada aspek pornografi, non pornografi dan ragu-
ragu. Dari hasil kuisioner penilaian pengguna yang termasuk pornografi di-
asumsikan diatas 49%, selain itu bukan pornografi. Terdapat 39 kata (term)
terpilih sebagai elemen korpus pornografi dalam Tabel 3.2. Contoh elemen
korpus seperti kata bokep, ngentot, coli, sange merupakan kata (term)
yang tidak ditemui dalam Kamus Besar Bahasa Indonesia (KBBI). Dengan
adanya korpus ini diharapkan dapat digunakan sebagai data dalam memban-
tu pemblokiran situs atau artikel-artikel yang mengandung kata pornografi.
Dari hasil kuisioner dapat disimpulkan kata yang mengandung pornogra-
fi terbesar yaitu kata ngentot dengan tingkat persentase 95.5%, kata yang
tidak mengandung pornografi yaitu kata sakiittt dengan persentase sebe-
sar 72.7%, dan kata ragu-ragu yaitu cite dengan tingkat persentase sebesar
65.9%. Kelemahan dari aplikasi ini adalah keterbatasannya data non porno-
grafi sebagai data pembanding untuk proses penyaringan kata. Dimana ma-
sih terdapat kata-kata yang tidak mengandung pornografi tetapi tetap masuk
dalam korpus pornografi contohnya seperti kata sakiitt maupun cite.

4.2 Saran
Dalam pembuatan aplikasi ini masih terdapat banyak yang perlu dibe-
nahi agar aplikasi ini menjadi semakin baik dan efektif. Adapun saran untuk

25
26

penelitian di masa datang, diantaranya:

• Memperbanyak kata non pronografi sebagai alat pembanding aplikasi


pada proses penyaringan agar korpus pornografi yang dibuat semakin
akurat.

• Menambah artikel-artikel cerita dewasa yang akan diproses. Penam-


bahan artikel dewasa diharapkan dapat menghasilkan korpus porno-
grafi lebih banyak.
DAFTAR PUSTAKA

[1] Miftah Andriansyah. Korpus beranotasi berbasis topic models untuk


sistem penunjang analisis client-consuler dialogue. Universitas Guna-
darma, 2015.

[2] Chang-Hoan Cho and Hongsik John Cheon. Children’s exposure to


negative internet content: effects of family context. Journal of Broa-
dcasting & Electronic Media, 49(4):488–509, 2005.

[3] Shenia A Darma, Jarot S. Buku Pintar Menguasai Internet, halaman


416. mediakita.

[4] Fadia Mutiaratu. Pornografi dampak buruk bagi perkembangan jiwa


remaja, 2009.

[5] Dany Occy Pramudya. Perlindungan hukum terhadap pengguna jasa


transaksi elektronik commerce menurut undang-undang nomor 11 ta-
hun 2008 tentang informasi dan transaksi elektronik. 2013.

[6] Antoinette Renouf, Andrew Kehoe, and Jayeeta Banerjee. Webcorp:


an integrated system for web text search. Language and Computers,
59(1):47–67, 2006.

[7] Pengaruhnya Terhadap Tata-Nilai Seni Rupa. Undang-undang republik


indonesia nomor 44 tahun 2008 tentang pornografi.

[8] David Setiawan. Undang - undang republik indonesia nomor


35 tahun 2014 tentang perubahan atas undang - undang no-
mor 23 tahun 2002 tentang perlindungan anak, November 2014.
http://www.kpai.go.id/hukum/undang-undang-republik-indonesia-
nomor-35-tahun-2014-tentang-perubahan-atas-undang-undang-
nomor-23-tahun-2002-tentang-perlindungan-anak/.

[9] Azimah Soebagijo. Pornografi: Dilarang tapi dicari. Gema Insani, 2008.

27
28

[10] Ajat Sudrajat. Pornografi dalam perspektif sejarah. HUMANIKA, 6(1),


2006.

[11] S.Kom Sunarto. Teknologi Informasi & Komunikasi SMP IX, halaman 90.
Grasindo.

[12] Anon Kuncoro Widigdo. Dasar pemrograman php dan mysql. Dasar
Pemrograman PHP dan MySQL, pages 1–2, 2003.
LAMPIRAN

29

You might also like