Text Mining Untuk Akuisisi Pengetahuan Secara Otomatis Pada Sistem Pakar

Jurnal TELEMATIKA MKOM, Vol.2 No.
1,Maret 2010
ISSN 2085-725X
TEXT MINING UNTUK AKUISISI PENGETAHUAN SECARA

OTOMATIS PADA SISTEM PAKAR
Ardi 1
1
Alumnus PPSTI MKOM Universitas Budi Luhur
Abstrak
Automatic knowledge acquisition method from documented source of expert system, now is
still residing at under done development stage. This research developed a new method to do
automatic knowledge acquisition from text of expert system by combines text mining and neural
network technology. The design of research consists of three steps, that is: development of the
method, development of the prototype and accuracy level evaluation of the produced knowledge
base.
Automatic knowledge acquisition method from documented source, which developed at this
research consist of six steps, that is: document parsing, topics retrieval, topics clustering, domain
extraction, item extraction and solution extraction. Document parsing applied with parsing
method of natural language processing to do POS tagging on text. Topics retrieval developed
based on information retrieval technology to find studied topics/phrase of text. Topics clustering
developed based on self organizing maps technology to group relevant and non relevant
topics/phrase. Domain extraction, item extraction and solution extraction developed based on
information extraction technology and knowledge graph theory. Domain extraction extracted
information of a relevant topic/phrase on text. Item extraction extracted indication information of
a domain. Solution extraction extracted solutions information of a domain. Produced knowledge
base will represent with object oriented. Inference engine developed based on dempster-shafer
theory and fabric fault advisory expert system journal as reference. Automatic knowledge
acquisition system prototype and expert system prototype developed with object oriented software
engineering approach. Evaluation result show that the produced knowledge base accuracy level is
reach 0.6563 and accuracy level can be increase by adding number of knowledge source
document.
Keywords : Automatic Knowledge Acquisition, Expert System, Object Oriented Knowledge
Base Representation, Inference Engine, Text Mining, Neural Network.
PENDAHULUAN memanfaatkan neural network dan

mengembangkan prototype sistem akuisisi
Latar Belakang Masalah pengetahuan otomatis dari sumber
Dengan akuisisi otomatis dari sumber terdokumentasi.
terdokumentasi, kebutuhan terhadap pakar
dapat dikurangi bahkan dapat dihilangkan. Batasan Masalah
Basis pengetahuan sistem pakar dapat 1. Akuisisi pengetahuan otomatis dibatasi
dibangun hanya dari beberapa text file yang pada sistem pakar jenis sistem
berisi pengetahuan yang relevan dengan interpretasi, sistem diagnostik, sistem
domain sistem pakar. Pada dasarnya bidang debugging dan sistem perbaikan yang
ini masih dalam tahap pengembangan metode bersifat simbolik.
baru yang belum matang. Penelitian ini 2. Akuisisi pengetahuan otomatis dibatasi
mengembangkan metode tersebut dan hanya untuk menghasilkan basis
mengusulkan sebuah metode akuisisi pengetahuan sistem pakar dengan
pengetahuan otomatis dari sumber kompleksitas yang rendah dan ruang
terdokumentasi pada sistem pakar dengan lingkup yang tidak terlalu luas.
menggunakan teknologi text mining yang
59
Jurnal TELEMATIKA MKOM, Vol.2 No.1,Maret 2010
ISSN 2085-725X
3. Text Mining dilakukan pada text file yang POS Tagging adalah sebuah proses yang
telah ditentukan oleh knowledge engineer mengelompokkan kata ke sebuah penanda
dan diasumsikan bahwa text file tersebut kelas dalam sebuah kalimat. Kata
cukup relevan dengan domain dikelompokan menjadi: kata benda, kata
pengetahuan sistem pakar yang akan kerja, kata sifat, kata keterangan dan kata
dikembangkan. depan. POS dapat dibagi menjadi 2 kategori
4. Text mining yang dilakukan hanya dapat yaitu closed class dan open class. Yang
mengenali bahasa inggris, sehingga termasuk open class pada bahasa inggris,
pengetahuan sistem pakar yang dihasilkan yaitu kata benda, kata kerja, kata sifat dan
juga akan berbahasa inggris. kata keterangan. Closed class pada bahasa
5. Mekanisme inferensi dibatasi hanya inggris: prepositions, particles, determiners,
menggunakan metode inferensi backward pronouns, conjunctions, auxiliary verbs,
chaining. numerals.
CFG adalah bentuk formal yang
Tujuan memungkinkan pemodelan fakta-fakta
1. Mengembangkan metode akuisisi constituent. Sebuah CFG terdiri atas beberapa
pengetahuan otomatis dari sumber aturan dan produksi yang masing-masing
terdokumentasi pada sistem pakar dengan mengekspresikan cara yang merupakan
mengkombinasikan teknologi text mining simbol bahasa dapat dikelompokkan dan
yang memanfaatkan neural network. diurutkan bersama, dan sebuah kamus kata
2. Merepresentasikan basis pengetahuan dan dan simbol. CFG merupakan model sistem
mengembangkan mesin inferensi pada matematika yang sering digunakan untuk
sistem pakar untuk menggunakan basis memodelkan struktur unsur dalam bahasa
pengetahuan yang ditelah dihasilkan. inggris dan bahasa alami yang lain. Frase kata
3. Mengembangkan prototype sistem benda pada bahasa inggris dapat mempunyai
akuisisi pengetahuan otomatis untuk determinan, angka, pengukur, farase kata sifat
menguji metode yang dikembangkan, dan yang mendahului kata benda, yang dapat
prototype sistem pakar untuk menguji diikuti dengan sebuah angkat dari
basis pengetahuan yang dihasilkan. postmodifiers, gerundive VPs, invinitives VPs
4. Mengukur tingkat akurasi basis dan past participe adalah kemungkinan yang
pengetahuan sistem pakar yang dihasilkan paling umum. Subjek dalam bahasa inggris
dari proses akuisisi pengetahuan otomatis dapat diikuti dengan kata kerja utama pada
dari sumber terdokumentasi. orang dan angka. Kata kerja dapat di sub-
kategorikan oleh tipe komplemen yang
Manfaat diharapkan. Sub-kategorisasi yang sederhana
1. Dapat mengurangi biaya pengembangan adalah transitive dan intransitive. Sub-kelas
sistem pakar dengan menghilangkan dari kata kerja adalah kata penghubung
kebutuhan terhadap pakar dan (auxiliaries) atau kata kerja bantu mempunyai
mempercepat proses pengembangan batasan syntactic tertentu yang dapat dilihat
sistem pakar sebagai salah satu jenis sub-kategorisasi.
2. Sumbangsih bagi ilmu pengetahuan Auxiliaries memasukkan kata kerja modal
bidang artificial intelligence khususnya can, could, may, might, must, will, would,
pada sistem pakar dengan shall, should, have, be.
memperkenalkan metode akuisisi Parsing dengan CFG mengarah pada
pengetahuan otomatis dari sumber proses yang menugaskan pemodelan pohon
terdokumentasi untuk sistem pakar pada yang benar pada input string, dimana dapat
penelitian ini. menutupi semua kalimat dan mempunyai
sebuah node ’S’ pada bagian paling atas.
TINJAUAN PUSTAKA Terdapat 2 batasan yang dapat digunakan
untuk membantu pencarian yaitu batasan
Natural Language Processing berasal dari data dan berasal dari grammer.
(NLP)[ANL01],[DNL01],[DNL02] Pada akhir proses parsing, pada pohon harus
60
ISSN 2085-725X
selalu mempunyai 1 buah akar yang selalu

dimulai dengan simbol S. Terdapat 2 jenis
strategi pencarian parsing yaitu : top-down
parsing dan bottom-up parsing. Top-down
parsing dimulai simbol mulai S dan mencoba Wij = jumlah term i pada dokumen j.
menguraikan input kalimat dengan Wiq = TF-IDF query i.
mengkonstruksikan pohon uraian yang
mendeskripsikan bagaimana grammer Algoritma:
digunakan untuk menghasilkan kalimat. 1. Hitung TF-IDF term terhadap dokumen
Bottom-up parsing dimulai dengan sebuah (Dj) pada keseluruhan dokumen (D).
kata dari input dan mencoba untuk 2. Konversi query menjadi TF-IDF (Q).
membangun pohon dari kata, dengan 3. Untuk setiap Dj in Dhitung nilai
menerapkan aturan dari grammer. Sj=cosine(Dj, Q)
4. Urutkan dari score yang terkecil.
Information Retrieval Text pre-processing berfungsi untuk
(IR)[ANL01],[EIR01],[EIR02],[EIR03], [EIE02] melakukan penyaringan terhadap kata-kata
Information retrieval adalah salah satu dalam teks sebelum pemrosesesan
metode text mining untuk menemukan information retrieval. Terdapat beberapa
informasi yang relevan dalam satu atau metode filterisasi pada information retrieval.
beberapa dokumen berupa teks yang isinya 1. Word extraction. String yang spesifik dan
tidak terstruktur dan menggunakan bahasa tidak mempunya arti dapat dikeluarkan.
alami manusia berdasarkan query atau 2. Stop words removal. Kata-kata dengan
keyword tertentu. Vector space model adalah frekuensi tertinggi dan bersifat umum
salah satu model retrieval information akan dikeluarkan.
retrieval yang sering digunakan. Term- 3. Steamming. Digunakan untuk mencari
weighting adalah sebuah metode yang bentuk dasar sebuah kata, dengan
diimplementasikan pada vector space model menyatukan kata yang mempunyai
yang digunakan untuk mengisi term weight morphology, demikian jumlah kata dapat
dalam dokumen dan query vector dimana direduksi.
setiap term-weight dihitung berdasarkan Information retrieval dapat dioptimasi
skema TF-IDF. dengan menambahkan thesaurus. Untuk
TFi = fij / max{fij}. setiap term t dalam query, query diperlebar
IDFi = Log2 (N / DFi). dengan sinonim dan kata yang berhubungan
TF-IDFi = TFi * IDFi. dengan t dari kamus. Secara umum thesaurus
dapat meningkatkan recall. Secara signifikan
Dimana: dapat mengurangi precision, particular
TF = Term Frequency dengan term yang ambigu.
Fij = Frekuensi kemunculan term i dalam Akurasi information retrieval dapat
dokumen j. dievaluasi berdasarkan penilaian dari manusia
max{fij} = Total frekuensi kemunculan term i berdasarkan output yang dihasilkan. Hasil
pada keseluruhan dokumen evaluasi sangat bersifat sangat subjektif.
IDF = Inverse Document Frequency dari term Akurasi dapat dihitung berdasarkan precision
i. dan recall.
DF = Jumlah dokumen dimana term i Number of relevant documents retrieved
Recall 
muncul. Total number of relevant documents
N = Jumlah keseluruhan dokumen. Number of relevant documents retrieved
Similarity measure adalah sebuah fungsi Precision 
yang menghitung derajat kemiripan anara 2 Total number of documents retrieved
buah vektor. -Measure = (2 * precision * recall) / (precision
+ recall)
61
ISSN 2085-725X
Self Organizing Maps information extraction untuk melakukan

(SOM)[ANN01],[ANN02],[ANN03], [ANN04] proses tersebut, yaitu lexicon, clasify pre-
Self organizing maps merupakan salah segment candidat, sliding window, boundary
satu metode pembelajaran pada neural models, finate state automata dan CFG.
network tidak terawasi (unsupervised Slot pada template biasanya diisi dengan
learning) yang tidak memerlukan target substring dari dokumen. Beberapa slot
output pada proses pembelajaran. mungkin memiliki sekumpulan pengisi pra-
Pada jaringan ini, suatu lapisan yang spesifik konstan yang mungkin muncul dalam
berisi neurons akan menyusun dirinya sendiri teks tersebut. Beberapa slot dimungkinkan
berdasarkan input nilai tertentu dalam suatu diisi oleh beberapa filler.
kelompok yang dikenal dengan istilah cluster. Pola ekstraksi sederhana dapat
Selama proses penyusunan diri, cluster yang dispesifikasikan dengan menggunakan pola
memiliki vektor bobot paling cocok dengan Regular Expression. Pola Pre-filler dapat
pola input (memiliki jarak yang paling dekat) digunakan untuk mengidentifikasikan pola
akan terpilih sebagai pemenang. Neuron yang kata/kalimat sebelum pola filler. Dapat juga
menjadi pemenang akan memperbaiki digunakan pola post-filler untuk
bobotnya. mengidentifikaskan akhir dari filler. Jika slot
Algoritma: mempunyai sekumpulan pengisi pra-spesifik,
1. Tentukan learning rate, tentukan learning kategorisasi teks dapat digunakan untuk
radius, tentukan jumlah neuron, tentukan mengisi slot.
iterasi. Inisialisasi bobot w secara acak Evaluasi tingkat akurasi information
untuk setiap neuron. extraction dilakukan secara terpisah, data
2. Kerjakan selama kondisi < iterasi: pengujian yang tidak digunakan selama
a. Untuk setiap vektor input x terhadap pengembangan sistem. Pengukuran dilakukan
seluruh neuron, kerjakan: pada setiap dokumen menggunakan
D(j) = ∑ (wij – xi)2 pengukuran yang diadaptasikan dari
b. Tentukan neuron dengan hasil terkecil information retrieval sebagai berikut :
dari D(j).
c. Untuk setiap unit neuron j perbaiki Re call 
Number of extracted slot/value pairs that are correct
bobot: Total number of correct extraction s in the solution t emplate
wij(baru) = wij(lama) + α (xi –
wij(lama)) Number of extracted slot/value pairs that are correct
Pr ecision 
3. Perbaiki learning rate. Total number of slot/value pairs extracted by the system
Information Extraction (IE) F-Measure=(2 * precision * recall) /

[BNL01],[EIE01],[EIE02],[EIE03], [EIE04], [EIE05] (precision + recall)
Information extraction adalah salah satu Dempster-Shafer Theory[AES01],[ANN03]
metode text mining untuk melakukan Salah satu model yang sering digunakan
ekstraksi data dari text file yang tidak untuk ketidakpastian dalam sistem pakar
terstruktur. Information extraction adalah teori dempster-shafer. Teori ini
mengidentifikasi potongan-potongan spesifik menunjukkan suatu cara untuk memberikan
dari informasi dari sebuah dokumen textual bobot keyakinan sesuai dengan fakta yang
yang tidak terstruktur atau semi terstruktur. dikumpulkan.
Information extraction melakukan Secara umum teori dempster-shafer ditulis
transformasi dari informasi yang tidak dalam bentuk interfal:
terstruktur dalam dokumen ke dalam [Belief, Plausability].
database yang terstruktur. Belief (Bel) adalah ukuran kekuatan
Information extraction terdiri atas tiga evidence dalam mendukung suatu himpunan
proses yaitu segmentasi, klasifikasi, asosiasi proposisi. Jika bernilai 0 maka
dan klusterisasi. Information extraction dapat mengindikasikan bahwa tidak ada evidence,
diaplikasikan pada jenis teks yang berbeda. dan jika bernilai 1 menunjukkan adanya
Terdapat beberapa macam model teknik kepastian.
62
ISSN 2085-725X
Plausability (Pl) dinotasikan sebagai: indikator chunks. Berikut ini adalah chunks
Pl(s) = 1 – Bel(-s) indicators yang digunakan pada knowledge
Plausability juga bernilai 0 sampai 1. Jika graph :
kita yakin akan _s, maka dapat dikatakan 1. Indicator 0: Sekumpulan koma (‘,’)
bahwa Bel(_s)=1, dan Pl(_s)=0. Pada teori dan/atau tanda periode.
dempster-shafer kita mengenal adanya frame 2. Indicator 1: Frame word, termasuk kata
of discernment yang dinotasikan dengan θ. kerja bantu.
Frame ini merupakan semesta pembicaraan 3. Indicator 2: Acuan kata-kata.
dari sekumpulan hipotesis. 4. Indicator 3: “Jumps”, berkenaan dengan
grammer.
Object Oriented Software Engineering 5. Indicator 4: Kata penghubung, termasuk
(OOSE) kata depan.
Belakangan ini muncul model proses
agile yang merupakan proses yang adaptif, Integrating an object oriented approach and
fokus pada hasil dan cenderung menggunakan rule-based reasoning in the design of a
iterasi yang singkat. Extreme Programming fabric fault advisory expert system. [CES01]
(XP) adalah salah satu contoh model proses Paper ini menjelaskan tentang desain
agile yang merupakan metodologi ringan sebuah sistem pakar yang tidak hanya
untuk proyek skala kecil sampai menengah. memberikan nasihat pada pengguna tekstil
XP mendominasi coding sebagai kunci pada fabric fault tetapi juga pada pada
aktivitas dalam keseluruhan proyek. pengguna non-tekstil, tetapi juga membantu
Tahapan analisis di tujukan untuk untuk mendiagnosa fabric fault. Sistem pakar
menganalis, menspesifikasikan dan ini mengintegrasikan pendekatan berorientasi
mendefinisikan sistem yang akan dibangun. objek dan rule-based reasoning. Sistem ini
Dalam proses Object Oriented Analisys berdasarkan pada premis yang merupakan
(OOA) juga dilakukan pengumpulan desain dari komponen yang harus di pisahkan
persyaratan untuk menciptakan skenario use dari implementasi detil. Secara singkat,
case. dijelaskan bahwa rules yang memanipulasi
Object Oriented Design (OOD) satu set object dipisahkan dari satu set objek
mentransformasikan model analisis OOA ke yang sama. Pemisahan definisi objek dari
dalam model desain dan menemukan. Design rules yang memanipulasi mereka pada basis
pattern merupakan sebuah strategi desain pengetahuan, dan pemisahan pengetahuan
kelas dan objek dalam OOD agar fleksibel, berbasis objek dari mesin inferensi berbasis
reusable, generic, independent. object yang melakukan infers kondisi, artinya
Coding merupakan tahap yang suatu perubahan yang dilakukan pada salah
menerjemahkan hasil OOD ke dalam bahasa satu dari komponen ini tidak berarti
pemrograman berorientasi objek. Refactoring perubahan juga harus dilakukan pada
adalah sebuah perubahan yang dilakukan komponen lain, dan juga setiap komponen ini
pada struktur internal perangkat lunak tanpa autonomous. Ketergantungan antar
mengubah behavior. component dalam sebuah object pada
Knowledge graph theory and structural pendekatan berorientasi objek, kemampuan
parsing [BNL01] sistem semacam ini, properties yang
Knowledge graph adalah salah satu jenis diwariskan, penggunaan kembali sebuah
sudut pandang baru yang digunakan untuk object adalah keuntungan yang sama dalam
mendeskripsikan bahasa manusia dan lebih mengadopsi sebuah pendekatan berorientasi
fokus pada semantik dari pada aspek objek.
syntaksis. Knowledge graph adalah sebuah
metode representasi pengetahuan yang baru Sistem Pakar
berdasarkan pada jaringan semantic. Sistem pakar merupakan suatu sistem
Dengan interpretasi dari sebuah kalimat, informasi yang menangkap dan menggunakan
sebagai pernyataan dari sebuah graph, pengetahuan serta metode pengambilan
sebagai panduan untuk mencoba mencari keputusan yang digunakan oleh seorang atau
63
ISSN 2085-725X
beberapa orang ahli dalam bidang keahlian manusia. Pengetahuan terdokumentasi

tertentu. Sistem pakar didasarkan pada sistem memiliki potensi besar untuk otomatisasi.
pengetahuan, sehingga memungkinkan Pendekatan ini digunakan dalam sistem
komputer dapat berfikir dan mengambil berbasis pengetahuan di mana penanganan
keputusan atau kesimpulan dari sekumpulan sejumlah besar informasi kompleks lebih
kaidah. diutamakan daripada keahlian tingkat dunia.
Berdasarkan jenis dan tipenya, sistem Pengetahuan yang diperoleh dari sumber
pakar memiliki banyak variasi antara lain: terdokumentasi sering disebut sebagai text
sistem pakar vs sistem berbasis pengetahuan, mining. Pengetahuan dari sumber
sistem pakar berbasis aturan, sistem berbasis terdokumentasi dapat dianalisis secara
frame, sistem hybrid, sistem berbasis model, manual atau dengan menggunakan teknologi
sistem off-the-shelf dan sistem pakar real- Artificial Intelligence (gabungan natural
time. Berdasarkan fungsinya, sistem pakar language processing, agen cerdas dan sistem
dapat diklasifikasikan dalam beberapa cara, pakar), sehingga dengan demikian sistem
salah satu cara adalah berdasarkan area cerdas dapat digunakan untuk membangun
persoalan umum yang ditanganinya. sistem pakar lain. Data yang disimpan dalam
sistem komputer lain dapat diambil secara
The
The Expert
Expert System
System
elektronik untuk membuat atau
Inference
Inference
memperbaharui basis pengetahuan pada
Expert Engine
Engine
Advice User
User Program
Program sistem pakar, tanpa campur tangan knowledge
Interface
Interface
Programs
Programs
Knowledge
Base
engineer atau pakar manusia. Bidang ini pada
Explaination
Explaination
Facility
Facility dasarnya berada pada tahap pengembangan
User Workstation
metode baru yang menginterpretasikan arti
Expert System
System Development untuk menentukan aturan dan bentuk lain
Knowledge
pengetahuan, misalnya frame untuk
Knowledge
Engineering
pertimbangan berbasis kasus. Sejumlah
Acquisition
Acquisition
Program metode baru dikembangkan dan
Workstation Expert and/or
Knowledge Engineer
diimplementasikan.
Basis pengetahuan berisi pengetahuan
Gambar 1. Struktur sistem pakar. ([ASE01], 24,
penting untuk pengertian, formulasi, dan
dimodifikasi).
pemecahan masalah. Basis pengetahuan
memasukkan dua elemen dasar, yaitu: Facts,
Akuisisi pengetahuan adalah akumulasi,
seperti situasi masalah dan teori dari area
transfer, dan transformasi keahlian
masalah. Heuristic khusus atau rules yang
pemecahan masalah dari beberapa sumber
menghubungkan penggunaan pengetahuan
pengetahuan terdokumentasi ke program
untuk pemecahan masalah spesifik dalam
komputer untuk konstruksi atau perluasan
sebuah domain khusus. Basis pengetahuan
basis pengetahuan. Metode akuisisi dapat
harus direpresentasikan dalam format yang
dilakukan secara Otomatis, yaitu pengetahuan
dapat dipahami oleh manusia dan dieksekusi
dihasilkan dari fakta yang ada. Dalam metode
pada komputer. Terdapat banyak metode
ini, peran pakar dan knowledge engineer
untuk representasi pengetahuan. Yang paling
hampir tidak diperlukan. Metode yang dapat
populer adalah aturan produksi, frame, pohon
digunakan untuk akuisisi pengetahuan
keputusan, objek dan logika juga berguna
otomatis adalah induksi dan akuisisi dari
dalam beberapa kasus.
sumber terdokumentasi. Terdapat dua alasan
Frame. Merupakan struktur data yang
utama penggunaan akuisisi pengetahuan
menyertakan semua pengetahuan tentang
otomatis, yaitu: knowledge engineer yang
objek tertentu. Frame pada dasarnya adalah
baik sangat mahal dan sulit didapat, dan
aplikasi pemrograman berorientasi objek
pakar domain biasanya sibuk dan kadang
untuk artificial intelligence dan sistem pakar.
tidak kooperatif. Akibatnya metode elisitasi
Frame mencakup dua elemen dasar yaitu slot
manual bahkan semiotomatis lambat dan
dan facet. Slot adalah set atribut yang
mahal. Pengetahuan sering dapat diperoleh
dari sumber lain selain atau pengganti pakar
64
ISSN 2085-725X
mendeskripsikan objek yang program dapat menganalisis alasan

direpresentasikan oleh frame. keberhasilan atau kegagalannya sehingga
Representasi pengetahuan berorientasi mengarah pada peningkatan kualitas basis
objek. Merupakan pendekatan lanjutan yang pengetahuan. Komponen tersebut tidak
mengadopsi banyak konsep frame yang telah tersedia dalam sistem pakar komersil saat ini,
lama menjadi norma dalam analisis dan tetapi sedang dikembangkan dalam sistem
desain. Pada dasarnya frame adalah objek dan pakar eksperimental pada beberapa
sesuai dengan paradigma pendekatan universitas dan lembaga riset.
berorientasi objek terhadap pengembangan
sistem pakar. Objek mengenkapsulasi Kerangka Konsep
properti dan tindakan, seperti halnya frame
menyimpan pengetahuannya. Selanjutnya,
frame diatur dalam kelas, yang diatur ke
dalam hierarki. Tiap frame mewarisi
propertinya dari frame induk, seperti halnya
objek mewarisi properti. Aturan dapat
memadukan kelakuan frame atau dilekatkan
ke dalam frame. Paradigma berorientasi objek
mencocokkan struktur sistem pakar hybrid
untuk bekerja dengan frame dan aturan.
Objek memilih set aturan untuk diterapkan
pada situasi tertentu.
Mesin inferensi menyediakan metodologi
untuk reasoning tentang informasi dalam
basis pengetahuan dan untuk formulasi
kesimpulan. Komponen ini memberikan arah
tentang bagaimana menggunakan
pengetahuan sistem dengan membangun
agenda yang mengorganisir dan mengontrol
langkah-langkah yang diambil untuk
pemecahan masalah. Dua pendekatan populer
untuk menarik kesimpulan adalah metode
forward chaining dan backward chaining.
Forward chaining mencocokan fakta atau
pernyataan dimulai dari bagian sebelah kiri
(IF), setelah semua kondisi terpenuhi, aturan
dipilih untuk mendapatkan kesimpulan. Pada
backward chaining pencocokan fakta atau
pernyataan dimulai dari bagian sebelah kanan Gambar 2.Kerangka konsep.
(THEN). Pendekatan ini dumulai dari
kesimpulan dan hipotesis bahwa kesimpulan METODE PENELITIAN
adalah benar.
Sistem penjelasan adalah Kemampuan Penelitian ini akan mengusulkan sebuah
melacak pertanggungjawaban untuk konklusi metode baru untuk melakukan akuisisi
ke sumber adalah krusial dalam transfer pengetahuan otomatis dari sumber
keahlian dan dalam pemecahan masalah. terdokumentasi pada sistem pakar. Metode
Subsistem penjelasan dapat melacak tersebut akan di implementasikan lewat
tanggungjawab dan penjelasan perilaku pengembangan prototype dan hasil output
sistem pakar. dari prototype akan dievaluasi melalui rumus
Sistem perbaikan pengetahuan adalah pengukuran tingkat akurasi tertentu.
evaluasi pengetahuan sistem pakar diperlukan
untuk pembelajaran komputer sehingga
65
ISSN 2085-725X
Secara umum terdapat tiga proses besar

yang terjadi dalam model yang
dikembangkan pada penelitian ini. Proses
tersebut adalah proses pemasukan dokumen,
proses akuisisi pengetahuan otomatis dan
proses operasi sistem pakar. Proses
pemasukan dokumen dilakukan oleh
Gambar 3. Desain penelitian. knowledge engineer ke dalam database
sistem. Kemudian berdasarkan dokumen
Secara keseluruhan sistem pakar akan dalam database tersebut dilakukan proses
menggunakan basis pengetahuan hasil dari akuisisi pengetahuan otomatis. Hasil akuisisi
proses akuisisi pengetahuan otomatis. kemudian akan disimpan kembali ke database
Penelitian ini menekankan pada penggunaan sebagai basis pengetahuan yang akan
teknologi Text Mining yang memanfaatkan digunakan oleh sistem pakar untuk
teknologi Neural Network untuk melakukan berinteraksi dengan pengguna.
proses akuisisi pengetahuan otomatis pada
sistem pakar. Berikut adalah ringkasan Pengembangan Text Mining
singkat penelitian ini. Tahapan proses akuisisi pengetahuan
otomatis
Gambar 4. Ringkasan penelitian.
Proses penelitian dibagi menjadi 3 tahap,

yaitu tahap pengembangan model/metode,
tahap pengembangan prototype sistem
akuisisi pengetahuan otomatis dan prototype
sistem pakar dan tahap ketiga adalah evaluasi
tingkat akurasi pengetahuan.
ANALISIS DAN INTERPRETASI
Analisis
Gambar 5. Gambaran sistem secara umum. Gambar 6. Diagram konteks proses akuisisi
pengetahuan otomatis.
66
ISSN 2085-725X
Seperti yang terlihat pada gambar 6,

bahwa file yang termasuk pada kategori basis
pengetahuan sistem pakar ada tiga yaitu
DomainBase file, ItemBase file dan
SolutionBase file. Untuk mengisi ketiga file
basis pengetahuan tersebut diperlukan
masing-masing satu proses yang juga
termasuk dalam proses akuisisi pengetahuan
otomatis.
Pada proses akuisisi pengetahuan
otomatis, langkah awal akan dilakukan
knowledge engineer sebagai aktor tunggal
dalam proses ini. Knowledge engineer hanya
melakukan klik tombol proses yang tersedia
pada sistem dan sistem akan melakukan
keenam proses tersebut. Tahapan proses
tersebut, yaitu: documents parsing, topics
retrieval, topics clustering, domain
extraction, item extraction, solution
extraction.
Documents parsing
Merupakan proses yang melakukan POS

tagging pada setiap kalimat dalam
keseluruhan dokumen sumber pengetahuan.
Parsing dilakukan dari file dokumen yang
sebelumnya telah di-input oleh knowledge
engineer. Hasil proses ini akan disimpan pada
WordTag file berupa kata-kata dan frase
dalam dokumen tersebut yang telah diurai
berdasarkan hasil POS tagging.
Tahapan ini menggunakan metode
parsing with CFG pada teori natural
language processing untuk melakukan proses
parsing kalimat pada semua dokumen. Proses
parsing ini berguna untuk mencari setiap kata
benda pada kalimat, karena setiap domain
pada sebuah permasalahan pasti merupakan
kata benda. Proses pencarian dilakukan
dengan memberi tag pada setiap frase, dan
frase yang merupakan kata benda mempunyai
tag ’NP’ atau ’NN’.
Gambar 7. Flowchart proses document

parsing.
67
ISSN 2085-725X
Topics retrieval
Merupakan proses yang menemukan
topik-topik apa saja yang dibahas pada
keseluruhan dokumen. Topik tersebut dapat
berupa kata, frase kata atau kalimat singkat.
Topik-topik tersebut akan dicari pada
WordTag file dan hasil dari proses ini akan
disimpan pada TopicBase file dan setiap
kata/frase pada WordTag file akan disimpan
pada TopicItem file sebagai relasi child.
Selama proses pencarian, setiap kata, frase
atau kalimat tersebut akan diberikan nilai,
hasil perhitungan tersebut akan disimpan
pada TopicCalculation file. Beberapa nilai
akan dinormalisasi dari TopicCalculation file
dan disimpan pada TopicBase file.
Tahapan ini menggunakan metode
information retrieval pada teknologi Text
Mining. Tahapan ini mencari topik-topok
yang dibahas pada setiap dokumen yang
dimasukkan sebagai sumber pengetahuan
sistem pakar. Topik yang dibahas akan
berbentuk frase kata benda, dan ada
kecenderungan frekuensi kemunculan
kata/frase tersebut akan cukup tinggi, tetapi
kata/frase dengan frekuensi kemunculan yang
cukup tinggi pada semua dokumen bukan
merupakan topik yang dibahas. Untuk itu
maka digunakan model retrieval term
weighting (TF, IDF, TF-IDF) untuk
memberikan nilai tingkat relevansi dan
derajat kemiripian (cosine similarity) pada
sebuah frase.
Gambar 8 Flowchart proses topics retrieval.

Topics clustering
68
ISSN 2085-725X
Gambar 9. Arsitektur self organizing maps neural

networks.
Merupakan proses yang melakukan

clustering terhadap kandidat-kandidat topik
pada TopicBase file, dimana setiap kandidat
topik akan dikelompokkan berdasarkan nilai
yang diberikan pada proses sebelumnya.
Tujuan pengelompolan adalah untuk
memisahkan antara kandidat yang cukup
berpotensial dan yang kurang potensial untuk
menjadi domain sistem pakar. Hasil proses ini
akan melakukan update dengan memberi
status tertentu pada record kandidat topik
tersebut.
Tahapan ini menggunakan salah satu
algoritma pembelajaran neural network yaitu
self organizing maps. Self organizing maps
digunakan untuk melakukan clustering pada
setiap frase dimana tidak dibutuhkan data
pelatihan. Input yang dimasukkan adalah TF
average, IDF, TF-IDF average, cosine
Gambar 10. Flowchart proses topics
similarity average, dengan empat buah
clustering.
neuron. Tujuan melakukan clustering adalah
untuk mengelompokkan topik yang relevan
dan tidak relevan berdasarkan nilai hasil Domain extraction
perhitungan tahapan sebelumnya.
pembentukan ulang kalimat kandidat domain
yang telah dipilih untuk menjadi domain
berdasarkan hasil yang disimpan pada
TopicBase file pada proses sebelumnya. Hasil
pembentukan kalimat harus mempunyai pola
tagging tertentu yang mengandung makna
dan pengetahuan tentang domain tersebut.
Kandidat topic yang memenuhi syarat pola
kalimat akan disimpan pada DomainBase file.
Kalimat pada DomainBase file merupakan
kalimat yang akan diinformasikan kepada
pengguna sistem pakar tentang masalah yang
dihadapinya berdasarkan indikasi-indikasi
yang disampaikan pengguna pada sistem
pakar lewat interaksi tanya-jawab antara
pengguna dan sistem pakar.
69
ISSN 2085-725X
Tahapan ini menggunakan metode Item extraction

information extraction untuk melakukan Merupakan proses yang melakukan
ekstraksi kalimat. Tahapan ini melakukan pencarian terhadap indikasi-indikasi dari
ekstraksi informasi pada setiap kalimat yang domain permasalah pada DomainBase file.
mengandung kata/frase/topik yang relevan Pada proses ini dilakukan pembentukan ulang
dalam teks. Ekstraksi dilakukan dengan kalimat berdasarkan domain tertentu, dimana
mendeteksi pola tagging kalimat topik hasil pembentukan ulang kalimat tersebut
tersebut. Pola tagging kalimat yang mempunyai pengetahuan indikasi pada
digunakan adalah domain tersebut. Pola kalimat yang
NP_VBZ_!TO!NP!WHPN!VP! dan harus memenuhi syarat akan disimpan pada
mengandung tag RB atau kata cannot, not ItemBase file. Jika sebuah domain ternyata
atau kata lain yang ditentukan, dimana NP tidak mempunyai kalimat atau memenuhi
adalah kata/frase sebuah topik yang relevan. pola atau tidak mempunyai pengetahuan
indikasi, maka domain tersebut dianggap
bukan merupakan domain permasalah dan
akan dihapus dari DomainBase file.
Tahapan ini sama dengan domain
extraction tetapi dengan pola tagging yang
berbeda. Tahapan ini melakukan ekstraksi
informasi indikasi sebuah domain yang
mencerminkan ciri domain tersebut pada
setiap kalimat yang mengandung
kata/frase/topik sebuah domain. Pola tagging
kalimat yang digunakan adalah NP_VBZ.
Gambar 11. Flowchart domain extraction.

70
ISSN 2085-725X
Solution extraction
pencarian terhadap solusi dari domain
permasalahan pada DomainBase file. Pada
proses ini juga dilakukan pembentukan ulang
kalimat berdasarkan domain tertentu, dimana
hasil pembentukan ulang kalimat tersebut
mempunyai pengetahuan tentang solusi
terhadap permasalahan tersebut. Pola kalimat
yang mempunyai pengetahuan tentang solusi
pada domain tersebut akan disimpan pada
SolutionBase file. Domain yang tidak
mempunyai solusi tetapi mempunyai indikasi,
tetap dianggap sebagai domain permasalahan.
Hal ini akan diinformasikan pada user bahwa
permasalahan yang dihadapi belum
mempunyai solusi yang dapat diberikan,
karena solusi tersebut belum terdapat pada
basis pengetahuan sistem pakar.
Tahapan ini juga sama dengan domain
extraction tetapi dengan pola tagging yang
berbeda. Tahapan ini melakukan ekstraksi
informasi solusi sebuah domain pada setiap
kalimat yang mengandung kata/frase/topik
sebuah domain dan terdapat POS tagging
kalimat VB.
Gambar 12. Flowchart item extraction.
71
ISSN 2085-725X
Knowledge Base Update

Update knowledge dapat berguna untuk
menambah isi dari basis pengetahuan.
Kesalahan informasi pengetahuan yang
diterima pada saat proses akuisisi sebelumnya
dapat diperbaiki pada proses update ini.
Dengan demikian kualitas basis pengetahuan
akan bisa ditingkatkan.
Update knowledge dilakukan dengan cara
menambahkan dokumen-dokumen sumber
pengetahuan pada sistem. Kemudian proses
akuisisi dilakukan dari tahap awal sampai
tahap akhir, sesuai yang telah dijelaskan
sebelumnya. Tetapi tahap pertama, kedua,
keempat, kelimat, keenam hanya dilakukan
pada dokumen-dokumen yang baru
dimasukkan tersebut. Hanya proses ketiga
yang dilakukan terhadap seluruh data pada
dokumen. Proses ketiga ini berfungsi untuk
melakukan pengelompokan ulang, untuk
mencari calon topik baru atau menghapus
topik yang ternyata tidak relevan.
Secara umum, proses update basis
pengetahuan sebenarnya sama dengan semua
tahapan. Tetapi pada tahap kedua, terdapat
sedikit perbedaan. Pada proses update ini,
ditambahkan satu proses untuk memeriksa
kata/frase pada TopicBase file, jika ternyata
topik tersebut sudah muncul, maka seluruh
nilai-nilai variabel perhitungan akan
ditambahkan, kemudian perubahan tersebut
disimpan kembali ke file. Setelah perubahan
nilai disimpan ke file, proses selanjutnya
sama dengan proses akuisisi pada tahapan
kedua hingga tahap keenam.
Gambar 13. Flowchart solution extraction.
72
ISSN 2085-725X
Representasi Pengetahuan dan

Pengembangan Mesin Inferensi
Hasil akuisisi pengetahuan otomatis
menghasilkan representasi pengetahuan
berorientasi objek. Mekanisme inferensi
dilakukan berdasarkan gejala yang terjadi
pada sebuah domain. Proses pelacakan dapat
terjadi antar objek, pelacakan gejala terhadap
sebuah objek diprioritaskan terhadap objek
yang memiliki probalitas yang paling besar.
Pemberian bobot probablilitas sebuah domain
dilakukan berdasarkan jawaban pengguna
terhadap pertanyaan gejala yang diajukan.
Gambar 15. Representasi pengetahuan berorientasi

objek.
Gambar 16. Struktur basis pengetahuan.
Mekanisme inferensi ini menggunakan

Gambar 14. Flowchart proses knowledge penalaran statistik probabilitas dari teori
base update. Dempster-Shafer dengan tujuan untuk
mengatasi ketidakpastian pada penalaran non-
monotis dan untuk mengurangi jalur
pelacakan setiap gejala pada semua objek.
Selain itu digunakan juga tinjauan studi
fabric fault advisory expert system sebagai
referesi tambahan untuk pengembangkan
mesin inferensi. Mekanisme inferensi
dilakukan secara berulang hingga nilai
probabilitas akhir sebuah domain telah
mencapai nilai probabilitas maksimal yang
ditentukan pengguna.
73
ISSN 2085-725X
1.2
Probabilitas Akhir
0.8
0.6
0.4
0.2
0
0 0.2 0.4 0.6 0.8 1
Probabilitas Maksimal
Jawaban True Pertanyaan Muncul

Domain Muncul Probabilitas
Gambar 18. Grafik nilai probabilitas hasil

percobaan inferensi.
Pengembangan Prototype
Pengembangan prototype sistem akuisisi
Gambar 17. Flowchart mekanisme inferensi.
Sesuai dengan teori dempster-shafer

bahwa nilai probabilitas akan berjarak antara
1 dan 0, nilai bobot probabilitas sebuah Gambar 19. Package diagram sistem akuisisi
domain juga berjarak antara 1 dan 0. Semakin pengetahuan otomatis.
mendekati nilai 1 artinya bobot probabilitas
tersebut semakin besar demikian sebaliknya.
Nilai bobot probabilitas sebuah domain akan
bertambah jika item dijawab true oleh
pengguna. Dalam proses inferensi jika telah
terdapat sebuah domain yang bobot
probabilitiasnya telah mencapai nilai bobot
maksimal yang ditentukan maka proses
inferensi akan berhenti dan domain tersebut
yang diputuskan sebagai masalah yang
dihadapi pengguna dengan nilai probabilitas
terakhir hasil input pengguna.
Berdasarkan hasil percobaan ditemukan
bahwa nilai probabilitas maksimal yang
harmonis berada antara 0.6 dan 0.8. Berikut
adalah grafik hasi percobaan tersebut.
Gambar 20. User Interface sistem akuisisi
74
ISSN 2085-725X
Pengembangan prototype sistem pakar Ac = Tingkat akurasi sistem pakar secara

kesekuruhan.
N = Total keseluruhan sistem pakar yang
dihasilkan.
FIE = F-Measure information retrieval pada
sistem pakar.
FIR = F-Measure information extraction pada
sistem pakar.
Berikut adalah hasil percobaan terhadap 3
basis pengetahuan yang dihasilkan:
Tabel 1. Hasil evaluasi.

Expert FIR FIE AcEs
Gambar 21. Package diagram sistem pakar. System
(1). 0.414 0.79 0.602
MODEM
(2). 0.46 0.823 0.641
Network
(3). Car 0.5136 0.97 0.726
Rata-rata 0.46253 0.861 0.6563

Gambar 22. User interface sistem pakar.
Evaluasi Tingkat Akurasi Basis 1.2

Pengetahuan 1
Evaluasi dilakukan untuk mengukur
Tingkat Akurasi
0.8
seberapa tinggi tingkat akurasi basis
0.6
pengetahuan yang dihasilkan melalui proses
0.4
akuisisi pengetahuan otomatis. Evaluasi
dilakukan dengan mengadaptasikan model 0.2
perhitungan F-Measure pada information 0

0 2 4 6 8 10 12 14
retrieval dan information extraction,
Jumlah Dokumen
kemudian nilai-nilai tersebut dinormalisasi.
IR F-Measure IE F-Measure Accuracy Measure
Tingkat akurasi dievaluasi berdasarkan hasil
penilaian manusia secara subjektif. Gambar Grafik evaluasi.
FIR  FIE
AcEs  Dari hasil pengujian diatas bahwa nilai
2 akhir (Ac) yang diterima adalah 0.6563,
 AcEs tingkat akurasi basis pengetahuan meningkat
Ac  i jika jumlah dokumen sumber pengetahuan
N semakin banyak dimasukkan. Pada percobaan
AcEs = Tingkat akurasi 1 buah sistem pakar ini terlihat bahwa jumlah dokumen sangat
jenis tertentu yang dihasilkan. mempengaruhi tingkat akurasi basis
pengetahuan sistem pakar. Nilai akurasi akhir
75
ISSN 2085-725X
yang rendah disebabkan karena jumlah ditemukan bahwa nilai probabilitas maksimal
dokumen yang dimasukkan pada setiap yang harmonis berada antara 0.6 dan 0.8.
percobaan bervariasi dari basis pengetahuan Prototype dikembangkan dengan
dengan jumlah sedikit sampai ke jumlah pendekatan rekayasa perangkat lunak
dokumen yang banyak. berorientasi objek menggunakan UML
Semakin banyak dokumen yang sebagai tools untuk memodelkan dan
dimasukkan juga menyebabkan semakin mendokumentasikan sistem. Software process
lamanya proses akuisisi pengetahuan yang digunakan untuk pengembangan
dilakukan. Rata-rata waktu yang dibutuhkan prototype adalah proses iterative
1 dokumen untuk keseluruhan proses adalah menggunakan model agile metode Extreme
sekitar 30 menit jam sampai 1 jam, Programming (XP). Tahapan coding
tergantung dari usuran dokumen. Proses yang mendominasi keseluruhan pengembangan
paling lama dilakukan adalah pada proses prototype.
parsing dan topics retrieval, kedua proses Evaluasi dilakukan untuk seberapa tinggi
tersebut memakan waktu kurang lebih 60% tingkat akurasi basis pengetahuan yang
dari keseluruhan proses. dihasilkan melalui proses akuisisi
pengetahuan otomatis. Dari hasil pengujian
KESIMPULAN DAN SARAN diketahui bahwa nilai akhir (Ac) yang
diterima adalah 0.6563, performance sistem
Kesimpulan meningkat jika semakin banyak dokumen.
Penelitian telah mengembangkan sebuah Pada percobaan ini terlihat bahwa jumlah
metode baru untuk akuisisi pengetahuan dokumen sangat mempengaruhi tingkat
otomatis pada sistem pakar dari sumber akurasi knowledge base sistem pakar. Nilai
terdokumentasi berupa text file yang terdiri akurasi akhir yang rendah disebabkan karena
dari enam tahapan dan satu proses update jumlah dokumen yang dimasukkan pada
basis pengetahuan. Output setiap tahapan setiap percobaan bervariasi dari knowledge
akan digunakan pada tahapan berikutnya base dengan jumlah sedikit sampai ke jumlah
sebagai input. Pengembangan metode ini, dokumen yang banyak.
mengkombinasi teknologi natural language
processing, information retrieval, self Saran
organizing maps dan information extraction a. Untuk penelitian lebih lanjut, pada proses
dan tinjauan studi knowledge graph sebagai domain extraction, item extraction dan
tambahan referensi pada teknologi solution extraction dapat dikembangkan
information extraction. Keenam tahapan menggunakan machine learning, sehingga
proses tersebut, yaitu: Document parsing, sistem dapat belajar sendiri menentukan
Topics retrieval, Topics clustering, Domain pola kalimat yang akan diekstrak.
extraction, Item extraction, Solution b. Pada penelitian ini, metode akuisisi
extraction, ditambah satu proses update pengetahuan otomatis hanya bisa
pengetahuan. melakukan pembacaan dari text file, untuk
Hasil akuisisi pengetahuan otomatis penelitian lebih lanjut, dapat
menghasilkan representasi pengetahuan dikembangkan agar akuisisi dapat
berorientasi objek. Mekanisme inferensi ini dilakukan dari file HTML. Hal tersebut
menggunakan penalaran statistik probabilitas dapat dilakukan dengan menggunakan
dari teori dempster-shafer dengan tujuan pengenalan pola HTML, regular
untuk mengatasi ketidakpastian pada expression dan machine learning
penalaran non-monotis dan untuk mengurangi information extraction.
jalur pelacakan setiap gejala pada semua c. Pada penelitian ini, sumber pengetahuan
objek. Mekanisme inferensi dilakukan secara yang dimasukkan harus dicari terlebih
berulang hingga nilai probabilitas akhir dahulu secara manual. Untuk penelitian
sebuah domain telah mencapai nilai lebih lanjut dapat dikembangkan agar
probabilitas maksimal yang ditentukan sistem dapat mencari sendiri dokumen
pengguna. Berdasarkan hasil percobaan tersebut melalui API Search Engine yang
76
ISSN 2085-725X
tersedia. Dengan demikian knowledge Algorithms, and Applications). Prentice-

engineer tinggal memasukkan keyword Hall, New Jersey 1994.
tentang basis pengetahuan sistem pakar [ANN03] Kristanto, Andri, Jaringan Syaraf
yang akan dibangun. Hal ini dapat Tiruan, Konsep Dasar, Algoritma dan
dilakukan dengan menggunakan metode Aplikasi. Gaya Media, Yogyakarta 2004.
information retrieval pada penelitian ini. [ANN04] Zurada, M Jacet, Introduction to
d. Untuk penelitian lebih lanjut, dapat Artificial Neural Systems, West
dikembangkan tools untuk proses parsing Publishing Company, St. Paul, 1992.
dalam bahasa Indonesia, sehingga dapat [ASE01] Fowler, Martin, UML Distilled -
dibangun basis pengetahuan sistem pakar 3rd ed. Pearson Education, Boston, 2003.
dalam bahasa indonesia. [ASE02] Freeman, Eric, et. Al. Head First
e. Pada penelitian ini proses clustering Design Patterns. O Reilly, Sebastopol,
dilakukan dengan neural network self 2004.
organizing maps yang tipe [ASE03] Pressman, Roger S, Software
pembelajarannya adalah unsupervised Engineering: A Practitioner's
learning. Untuk penelitian ke depan dapat Approach. McGraw-Hill, New York
dilakukan percobaan dengan 2005.
menggunakan pembelajaran supervised [ASE04] Sommerville, Ian, Software
learning. Untuk pembelajaran supervised Engineering - 7th ed. Addison-Wesley,
learning dapat dicoba menggunakan Massachusetts 2006.
algoritma pembelajaran backpropagation [BNL01] Zhang, Lei, 2002, Knowledge
atau tipe jaringan ANFIS (Adaptive Graph Theory and Structural Parsing,
Neuro-Fuzzy Inferences System). Hal ini PhD Thesis, University of Twente,
untuk membandingkan tingkat akurasi Netherlands,
basis pengetahuan yang dihasilkan, dan http://www.tup.utwente.nl/catalogue/book
mengetahui algoritma pembelajaran mana /index.jsp?isbn=9036518350 (diakses 10
yang lebih baik. Maret 2008)
f. Untuk penelitian lebih lanjut, proses [CES01] Nomusa et. Al, September 2007.
akuisisi yang sangat lambat harus Integrating an Object Oriented
dipercepat. Salah satu hal yang dapat Approach and Rule-based Reasoning in
dilakukan untuk meningkatkan the Design of a Fabric Fault Advisory
performance sistem adalah melakukan Expert System, Fibres and Textile in
refactoring terhadap kode program pada Eastern Europe,
prototype untuk mempercepat proses. http://proquest.umi.com/pqdweb?did=978
659
DAFTAR PUSTAKA 391&sid=3&Fmt=2&clientId=73831&RQ
T=309&VName=PQD (diakses 10 Maret
[AES01] Marimin, Teori dan Aplikasi 2008)
Sistem Pakar dalam Teknologi [DNL01] Northedge, Richard, Statistical
Manajerial. IPB Press, Bogor, 2007. parsing of English Sentences,
[AES02] Turban, Efraim, et.Al, Decission http://www.codeproject.com/KB/recipes/e
Support System and Intelligent System nglishparsing.aspx, (diakses 2 Maret
- 7th ed. Pearson Education, New Jersey 2008)
2005. [DNL02] Northedge, Richard, Maximum
[ANL01] Jurafsky, Daniel & Martin, James Entropy Modeling Using
H, Speech and Language Processing, SharpEntropy,
Prentice Hall, New Jersey, 1999. http://www.codeproject.com/KB/cs/sharpe
[ANN01] Dewi, Sri Kusuma, Artificial ntropy.aspx, (diakses 2 Maret 2008)
Intelligence, Teknik dan Aplikasinya. [ENN01] Kirillov, Andrew, Neural
Graha Ilmu, Yogyakarta, 2003. Networks on C#, 2008,
[ANN02] Fausset, Laurence, Fundamental http://www.codeproject.com/
of Neural Networks (Architecture,
77
ISSN 2085-725X
KB/recipes/aforge_neuro.aspx (diakses 7
July 2008)
[EIR01] Mayfield, James, Information
Retrieval, 2008, http://www.clsp.jhu.edu/
ws2000/presentations/preliminary/jim_ma
yfield/homewood_ir_tutorial.ppt (diakses
13 Maret 2008)
[EIR02] Radev, Dragomir R., Information
Retrieval,2008,
http://tangra.si.umich.edu/
~radev/650/notes/1.ppt (diakses 3 Juli
2008)
[EIR03] Mooney, J Raymond, Mining
Complex Types of Data: Information
Retrieval, 2008,
http://www.cs.utexas.edu/users/mooney
/ir-course (diakses 10 Maret 2008).
[EIE01] Cowie, Jim & Wilks,Yorick,
Information Extraction, 2008,
http://www.dcs.shef.ac.uk/~yorick/papers/
infoext.pdf (diakses 14 Maret 2008)
[EIE02] Even, Yair & Zohar, Introduction

to Text Mining, 2008,
http://algdocs.ncsa.uiuc. edu/PR-
20021116-2.ppt (diakses 13 Maret 2008)
[EIE03] Grishman, Ralph, Information
Extraction: Techniques and Challenges,
2008, http://web.njit.edu/~ql23/teaching/
cis634FTF/notes/Information_extraction_
paper.pdf (diakses 14 Maret 2008)
[EIE04] McCallum, Andrew & Cohen,
William, Information Extraction
from the World Wide Web, 2008,
http://www.cs.cmu.edu/~wcohen/nips-ie-
tutorial.ppt (diakses 13 Maret 2008)
[EIE05] Mihalcea, Rada & Somai, Andras,
Introduction to Information Extraction,
2008, http://lit.csci.unt.edu/~classes
/CSCE5200/Lectures/IntroInformationExt
raction.ppt (diakses 13 Maret 2008)
78

Text Mining Untuk Akuisisi Pengetahuan Secara Otomatis Pada Sistem Pakar

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Text Mining Untuk Akuisisi Pengetahuan Secara Otomatis Pada Sistem Pakar

Uploaded by

Copyright:

Available Formats

Jurnal TELEMATIKA MKOM, Vol.2 No.

TEXT MINING UNTUK AKUISISI PENGETAHUAN SECARA

PENDAHULUAN memanfaatkan neural network dan

selalu mempunyai 1 buah akar yang selalu

Self Organizing Maps information extraction untuk melakukan

Information Extraction (IE) F-Measure=(2 * precision * recall) /

beberapa orang ahli dalam bidang keahlian manusia. Pengetahuan terdokumentasi

mendeskripsikan objek yang program dapat menganalisis alasan

Secara umum terdapat tiga proses besar

Gambar 4. Ringkasan penelitian.

Proses penelitian dibagi menjadi 3 tahap,

ANALISIS DAN INTERPRETASI

Seperti yang terlihat pada gambar 6,

Merupakan proses yang melakukan POS

Gambar 7. Flowchart proses document

Gambar 8 Flowchart proses topics retrieval.

Gambar 9. Arsitektur self organizing maps neural

Merupakan proses yang melakukan

Tahapan ini menggunakan metode Item extraction

Gambar 11. Flowchart domain extraction.

Gambar 12. Flowchart item extraction.

Knowledge Base Update

Gambar 13. Flowchart solution extraction.

Representasi Pengetahuan dan

Gambar 15. Representasi pengetahuan berorientasi

Gambar 16. Struktur basis pengetahuan.

Mekanisme inferensi ini menggunakan

Jawaban True Pertanyaan Muncul

Gambar 18. Grafik nilai probabilitas hasil

Gambar 17. Flowchart mekanisme inferensi.

Sesuai dengan teori dempster-shafer

Pengembangan prototype sistem pakar Ac = Tingkat akurasi sistem pakar secara

Tabel 1. Hasil evaluasi.

Gambar 21. Package diagram sistem pakar. System

(1). 0.414 0.79 0.602

(2). 0.46 0.823 0.641

(3). Car 0.5136 0.97 0.726

Rata-rata 0.46253 0.861 0.6563

Evaluasi Tingkat Akurasi Basis 1.2

perhitungan F-Measure pada information 0

tersedia. Dengan demikian knowledge Algorithms, and Applications). Prentice-

[EIE02] Even, Yair & Zohar, Introduction

You might also like