Professional Documents
Culture Documents
Master Template Penulisan Ilmiah STTC
Master Template Penulisan Ilmiah STTC
TEKNIK CENDEKIA
PROGRAM STUDI TEKNIK INFORMATIKA
PENULISAN ILMIAH
JAKARTA
2015
Pernyataan Orisinalitas dan
Publikasi
ii
Lembar Pengesahan
MENYETUJUI
Pembimbing 1 Pembimbing 2
iii
Abstraksi
Dalam tulisan ini akan dibahas mengenai proses pembuatan suatu korpus
pornografi. Penulis mengangkat tema ini karena saat ini sangat mudah untuk
mengakses situs pornografi maupun artikel-artikel cerita dewasa di internet.
Peran pemerintah dalam memblokir situs pornografi masih belum berhasil,
dikarenkan masih banyak sekali situs maupun artikel cerita dewasa yang
sangat mudah di akses. Korpus adalah suatu set koleksi kata yang terstruktur
yang disimpan didalam komputer dan digunakan untuk mengetahui kata-
kata yang digunakan dalam bahasa tertentu.
Tahapan pengerjaan dalam tulisan ini dimulai dari pengumpulan kata
non pornografi sebagai alat pembanding dalam proses penyaringan kata dari
artikel-artikel cerita dewasa yang akan disaring untuk dijadikan suatu korpus
baru yaitu korpus pornografi.
Dengan adanya korpus pornografi ini diharapkan bisa digunakan sebagai
data dalam membantu pemblokiran situs atau artikel-artikel yang isi dari
halaman situs tersebut banyak mengandung kata pornografi.
iv
Kata Pengantar
Segala puji dan syukur penulis naikkan ke hadirat Allah S.W.T yang Maha
Kuasa yang telah memberikan berkat, anugerah dan karunia yang melimpah,
sehingga penulis dapat menyelesaikan Penulisan Ilmiah ini pada waktu yang
telah ditentukan.
Penulisan ini disusun guna melengkapi sebagian syarat untuk mempe-
roleh gelar Setara Sarjana Muda Sekolah Tinggi Teknik Cendekia. Adapun
judul Penulisan ini adalah "Membangun Korpus Pornografi Bahasa Indonesia
Berbasis Text Mining Pada Artikel Situs Dewasa".
Walaupun banyak kesulitan yang penulis harus hadapi ketika menyusun
Penuliasn ini, namun berkat bantuan dan dorongan dari berbagai pihak,
akhirnya Penulisan ini dapat diselesaikan dengan baik. Untuk itu penulis
tidak lupa mengucapkan terima kasih kepada:
2. Bapak Dr. Miftah Andriansyah, SSi, MSSI.., Ketua Jurusan Teknik In-
formatika.
4. Kedua orang tua dan kakak-kakak tercinta yang selalu mendukung dan
terus memberikan motivasi.
v
Sebagai manusia biasa yang tak luput dari kesalahan, maka penulis memin-
ta maaf atas segala kekurangan dan keterbatasan dalam penyusunan Tugas
Akhir ini.
Akhir kata, hanya kepada Tuhan jualah segalanya dikembalikan dan pe-
nulis sadari bahwa penulisan ini masih jauh dari sempurna, disebabkan ka-
rena berbagai keterbatasan yang penulis miliki. Untuk itu penulis mengha-
rapkan kritik dan saran yang bersifat membangun untuk menjadi perbaikan
di masa yang akan datang.
Semoga apa yang ada pada penulisan Tugas Akhir ini dapat bermanfaat
bagi kita semua. Aamiin.
Penulis
vi
Daftar Isi
Halaman Judul i
Lembar Orisinalitas ii
Abstraksi iv
Kata Pengantar v
Daftar Gambar ix
Daftar Tabel x
1 PENDAHULUAN 1
1.1 Latar Belakang . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Batasan Masalah . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Tujuan Penulisan . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.4 Metode Penulisan . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.5 Sistematika Penulisan . . . . . . . . . . . . . . . . . . . . . . 3
2 LANDASAN TEORI 4
2.1 Pornografi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1.1 Definisi Pornografi . . . . . . . . . . . . . . . . . . . . 4
2.1.2 Istilah Pornografi . . . . . . . . . . . . . . . . . . . . . 4
2.1.3 Perkembangan pornografi di Indonesia . . . . . . . . . 5
2.2 Undang - Undang Terkait . . . . . . . . . . . . . . . . . . . . 6
2.2.1 Undang - Undang Republik Indonesia Nomor 44 Tahun
2008 Tentang Pornografi . . . . . . . . . . . . . . . . . 6
vii
2.2.2Undang - Undang Republik Indonesia Nomor 35 Ta-
hun 2014 Tentang Perubahan Atas Undang - Undang
Nomor 23 Tahun 2002 Tentang Perlindungan Anak . . 7
2.2.3 Undang - Undang Republik Indonesia Nomor 11 Tahun
2008 Tentang Infromasi Dan Transaksi Elektronik . . .
8 2.3
Korpus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
2.3.1 Sejarah Korpus . . . . . . . . . . . . . . . . . . . . . . 9
2.3.2 Karakteristik Korpus . . . . . . . . . . . . . . . . . . .
9 2.4 Artikel Dewasa
10
2.5 PHP.........................................................................................................10
2.6 Webcorp.................................................................................................11
2.7 URL.........................................................................................................12
4 PENUTUP 25
4.1 Kesimpulan............................................................................................25
4.2 Saran......................................................................................................25
DAFTAR PUSTAKA 28
LAMPIRAN 29
viii
Daftar
ix
Daftar
x
Bab
PENDAHULUAN
1
2
1. Analisa
Analisa dilakukan dengan mengumpulkan bahan-bahan dan sumber in-
formasi yang berkaitan dengan pornografi baik dari buku-buku, paper,
jurnal ataupun media lain seperti internet.
2. Perancangan
Pembuatan tampilan berupa rancangan halaman.
3. Pembuatan
Bahan-bahan yang telah dikumpulkan tersebut akan diolah kedalam
bahasa pemrograman PHP.
3
4. Implementasi
Tahap ini adalah tahap menguji aplikasi yang telah dibuat, apakah
aplikasi dapat berjalan dengan baik sesuai fungsi dan tujuannya yai-
tu membuat Korpus pornografi.
1. BAB 1 PENDAHULUAN
Bab ini berisi mengenai latar belakang penulisan, rumusan masalah,
batasan masalah, tujuan penulisan, metode penulisan dan sistematika
penulisan.
4. BAB 4 PENUTUP
Bab ini berisi kesimpulan dari apa yang telah diuraikan dalam bab-bab
sebelumnya dan saran-saran yang diharapkan dapat bermanfaat bagi
semua pihak.
Bab 2
LANDASAN TEORI
2.1 Pornografi
4
5
2.3 Korpus
Korpus yang dimaksud dalam penelitian ini adalah korpus linguistik
(selanjutnya disebut dengan “korpus”) yang digunakan dalam setiap proses
dalam banyak pengolahan diantaranya dalam Natural Language Processing
(NLP), Text Mining, Analisis Sentimen, dan lain sebagainya. [Engwall, 1992]
mendefinisikan korpus sebagai himpunan tertutup dari teks yang memiliki
bentuk yang dapat dibaca mesin (machine-readable) atau komputer, dengan
kriteria yang didefinisikan terlebih dahulu. Nadja Nesselhauf [Nesselhauf,
2011] menyebutkan bahwa Korpus Linguistik adalahsuatu analisis terhadap
bahasa yang terjadi secara alami yang berbasis pada korpus atau korpora,
yang pada saat ini dipersempit pemahamannya atas koleksi teks yang ter-
9
• Ukuran berhingga
• Rujukan standar
2.5 PHP
PHP (akronim dari PHP Hypertext Preprocessor) yang merupakan bahasa
pemrogramman berbasis web yang memiliki kemampuan untuk mempro-
ses data dinamis. PHP dikatakan sebagai sebuah server-side embedded script
language artinya sintaks-sintaks dan perintah yang kita berikan akan sepe-
nuhnya dijalankan oleh server tetapi disertakan pada halaman HTML biasa.
Aplikasi-aplikasi yang dibangun oleh PHP pada umumnya akan memberikan
1
6. PHP disimpan sebagai plain text dalam format ASCII, sehingga kode
PHP dapat ditulis hampir di semua editor text seperti windows notepad,
windows wordpad, dll.
2.6 Webcorp
Webcorp adalah sebuah media yang memungkinkan akses ke World
Wide Web sebagai korpus, dimana sebuah koleksi teks yang faktanya ten-
tang bahasa yang dapat diekstrasi. Alamat URL Webcorp bisa diakses pada
1
2.7 URL
URL singkatan dari Uniform Resource Locator, adalah rangkaian karak-
ter menurut suatu format standar tertentu, yang digunakan untuk menun-
1
jukkan alamat suatu sumber seperti dokumen dan gambar di Internet. URL
merupakan suatu inovasi dasar bagi perkembangan sejarah Internet. URL
pertama kali diciptakan oleh Tim Berners-Lee pada tahun 1991 agar penulis-
penulis dokumen-dokumen dapat merujuk pranala ke Waring Wera Wanua
atau World Wide Web. Sejak 1994, konsep URL telah dikembangkan menjadi
istilah Uniform Resource Identifier (URI) yang lebih umum sifatnya. Walau-
pun demikian, istilah URL masih tetap digunakan secara luas. Contoh URL:
http://www.coba.com/images/hardware/pda.html.[3]
URL menunjukkan sumber daya internet atau alamat sebuah halaman
web (homepage) yaitu halaman suatu dokumen atau program yang ingin
ditampilkan atau digunakan.[11]
Bab 3
2. Memory: 2 GB RAM
Spesifikasi Software:
14
1
Pada Gambar 3.2 merupakan tahapan dari program atau alur proses pem-
buatan korpus secara khusus atau lebih detail dalam pembuatan korpus. Di-
mana setelah proses filtering, akan menghasilkan korpus pornografi pada
tiap artikel-artikel dewasa yang diproses. Korpus-korpus yang terpisah ak-
an digabungkan menjadi satu korpus dalam proses penggabungan program.
Proses penggabungan dilakukan untuk menghindari kata yang sama dalam
sebuah korpus.
Artikel dewasa yang akan di proses pada pembuatan korpus merupakan
halaman judul dari cerita dewasa tersebut bukan halaman utama dari websi-
te cerita dewasa, untuk lebih jelasnya bisa melihat Gambar 3.4 dan Gambar
3.5. Artikel dewasa dapat dicari di internet menggunakan keyword seper-
ti cerita dewasa, artikel dewasa, cerita hot dan sebagainya. Penulis di
sini menggunakan keyword artikel dewasa.
1
2. Kemudian melakukan pemilihan paket software apa saja yang akan kita
install, untuk kemudahan berikan tanda centang pada semua software.
i f ( $cek==0) {
f w r i t e ( $handle2 , $data2 [ $i ] . PHP_EOL ) ;
}
}
• Usia,
• Jenis kelamin,
• Berapa kali dalam sebulan mengakses situs atau artikel pornografi dan,
Kata
teks teks teks teks
teks teks teks teks
teks teks teks teks
teks teks teks teks
teks teks teks teks
teks teks teks teks
teks teks teks teks
teks teks teks teks
teks teks teks teks
teks teks teks teks
Bab 4
PENUTUP
4.1 Kesimpulan
Proses pengembangan korpus berbantu aplikasi berhasil menyusun kor-
pus pornografi berbahasa Indonesia. Proses pemilihan korpus berdasarkan
pada peniliaian oleh pengguna atau pengakses artikel situs dewasa (porno-
grafi). Kriteria didasarkan pada aspek pornografi, non pornografi dan ragu-
ragu. Dari hasil kuisioner penilaian pengguna yang termasuk pornografi di-
asumsikan diatas 49%, selain itu bukan pornografi. Terdapat 39 kata (term)
terpilih sebagai elemen korpus pornografi dalam Tabel 3.2. Contoh elemen
korpus seperti kata bokep, ngentot, coli, sange merupakan kata (term)
yang tidak ditemui dalam Kamus Besar Bahasa Indonesia (KBBI). Dengan
adanya korpus ini diharapkan dapat digunakan sebagai data dalam memban-
tu pemblokiran situs atau artikel-artikel yang mengandung kata pornografi.
Dari hasil kuisioner dapat disimpulkan kata yang mengandung pornogra-
fi terbesar yaitu kata ngentot dengan tingkat persentase 95.5%, kata yang
tidak mengandung pornografi yaitu kata sakiittt dengan persentase sebe-
sar 72.7%, dan kata ragu-ragu yaitu cite dengan tingkat persentase sebesar
65.9%. Kelemahan dari aplikasi ini adalah keterbatasannya data non porno-
grafi sebagai data pembanding untuk proses penyaringan kata. Dimana ma-
sih terdapat kata-kata yang tidak mengandung pornografi tetapi tetap masuk
dalam korpus pornografi contohnya seperti kata sakiitt maupun cite.
4.2 Saran
Dalam pembuatan aplikasi ini masih terdapat banyak yang perlu dibe-
nahi agar aplikasi ini menjadi semakin baik dan efektif. Adapun saran untuk
25
26
[9] Azimah Soebagijo. Pornografi: Dilarang tapi dicari. Gema Insani, 2008.
27
28
[11] S.Kom Sunarto. Teknologi Informasi & Komunikasi SMP IX, halaman 90.
Grasindo.
[12] Anon Kuncoro Widigdo. Dasar pemrograman php dan mysql. Dasar
Pemrograman PHP dan MySQL, pages 1–2, 2003.
LAMPIRAN
29