Professional Documents
Culture Documents
1
arroem@student.gunadarma.ac.id
2
nony_juwita@student.gunadarma.ac.id
3
iwayan@staff.gunadarma.ac.id
ABSTRAK
permasalahan di atas. Text mining atau tentang text mining adalah sebuah paper
sering disebut text data mining [3] yang berjudul “Text Mining – Knowdlege
merupakan proses pengambilan data- Extraction From Unstructured Textual
data berupa teks dari sebuah sumber. Data”. Martin Rajman dan teamnya
Dengan text mining, dapat dicari kata- melakukan proses ekstraksi kata dari
kata yang dapat mewakili isi dari artikel sebuah kumpulan data mereka yang tidak
berita, lalu dianalisis apakah artikel terstruktur dengan menggunakan teori
berita tersebut tersebut termasuk ke probabilitas frekuensi kemunculan kata
dalam kategori olah raga, kesehatan, kunci.
selebriti, kriminal, ekonomi, politik atau Pada paper ini penulis mencoba
yang lain, dicocokkan dengan database sebuah metode yang serupa dengan metode
kata kunci yang sebelumnya telah yang dilakukan oleh Martin Rajman, yaitu
dibuat. Sehingga diharapkan dapat menggunakan keyword atau kata kunci.
membantu sistem redaksi elektronik Tetapi kata kunci yang digunakan penulis
untuk dapat memilah atau mengetahui pada penelitian ini didapat dari melakukan
kategori dari sebuah artikel berita tanpa ekstraksi dari beberapa artikel yang
memerlukan seorang editor. Hal ini temanya sudah diketahui.
akan menghemat waktu dan biaya
dalam menjalankan bisnis pada model
kantor berita elektronik on-line berbasis
internet. 3. METODE PENELITIAN
Filtering
Tokenizing dan Insert Kata
word counting kunci
2. Pemilahan Berita
Untuk mengetahui kategori dari sebuah artikel berita, dilakukan proses seperti
gambar 2.
Matching
Filtering Database
Tokenizing dan
word counting
Hasil
Artikel sumber
Namun hasil terbaik yang didapat Berikut adalah hasil percobaan yang
adalah dengan nilai batasan minimum 5 dilakukan dengan batasan kecocokan 5
kata yang sama dalam satu kategori. kata .
6. DAFTAR PUSTAKA