Welcome to Scribd, the world's digital library. Read, publish, and share books and documents. See more ➡
Download
Standard view
Full view
of .
Add note
Save to My Library
Sync to mobile
Look up keyword
Like this
23Activity
×
0 of .
Results for:
No results containing your search query
P. 1
Pemenggalan suku kata

Pemenggalan suku kata

Ratings: (0)|Views: 9,248|Likes:
Published by Dito C Argiatama

More info:

Published by: Dito C Argiatama on May 23, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See More
See less

10/16/2013

pdf

text

original

 
SUATU MODEL KAIDAH PEMENGGALAN SUKUPERTAMA PADA KATA BAHASA INDONESIA: KASUSPADA HURUF AWAL B
Dali Santun Naga
1)
 
Viny Christanti Mawardi
2)
Freddy Kurniawan
3)
 
1,2,3)
Fakultas Teknologi InformasiJl. Let.Jend.S.Parman no. 1, Jakarta 11440 Indonesia
1)
email : dalinaga@gmail.com,
2)
email : viny@untar.ac.id,
1)
email : fred_lyx@yahoo.com
ABSTRACT
 Almost all words in Indonesian consist of syllables. Occasionally due to certain reasons the words have to besegmented or cut into pieces by putting hyphens between them. In Indonesian there are rules as to where in theword the hyphens should be placed. In order that the hyphenation could be done by computer program somerules even with their exceptions have to be introduced into the program. At this occasion we begin thishyphenation rules at the first syllables of the words starting with letter B.
Key words
 Information Retrieval, Natural Language Processing, Pemenggalan kata
1.
 
Pendahuluan
Sejak komputer berhasil diciptakan orang, di kalangan pakar komputer timbul keinginan untuk menggunakannya sebagai alat penerjemah bahasa. Mereka menamakannya mesin penerjemah. Ternyatakeinginan ini tidak mudah dilaksanakan karena bahasa tidak mengenal aturan yang ketat seperti halnya aturanpada matematika atau logika. Sekalipun demikian, dari keinginan demikian muncul bidang pengetahuan baruyang berkenaan dengan komputer dan bahasa. Di antaranya muncul bidang pengetahuan seperti linguistik komputasional dan bahkan inteligensi buatan. Di bidang tersebut pun muncul berbagai ilmu yang berkaitandengan bahasa seperti
 Information Retrieval
dan
 Natural Language Processing
.NLP adalah salah satu bidang ilmu dalam
computer science
dan linguistik yang berkonsentrasi pada interaksiantara mesin dan bahasa alami manusia [1]. Sedangkan IR adalah ilmu yang berkaitan dengan representasi,penyimpanan, pengelolaan, dan pengaksesan terhadap informasi [2]. Pada saat ini NLP sudah banyak digunakan
 
sebagai teknik dalam IR. Di dalam taksonomi
computer science
pada gambar 1, IR berada di bawah NLP. Danteknik yang terdapat di dalam NLP dapat digunakan untuk mengembangkan IR.
Gambar 1. Diagram Taksonomi
Computer Science
 
Mesin penerjemah adalah salah satu aplikasi dalam NLP yang terus diteliti agar dapat dihasilkan mesinpenerjemah yang dapat menerjemahkan bahasa yang satu ke dalam bahasa yang lain. Pembangunan mesinpenerjemah haruslah melalui beberapa tahap dan salah satu di antaranya adalah pengenalan kata untuk memperoleh makna dari sebuah kalimat. Di bidang IR dan NLP dikenal pula kajian mengenai pemrosesannaskah (
text processing
). Salah satu kajian di bidang pemrosesan naksah adalah pengenalan kata oleh komputermelalui kaidah tertentu. Di dalam NLP dikenal beberapa tingkatan pengenalan kata yaitu fonologi, morfologi, leksikal, sintaktik,semantik, discourse dan pragmatik [3]. Untuk dapat mencapai tingkat paling atas yaitu pragmatik diperlukanpengetahuan mengenai fonologi, morfologi, dan seterusnya. Permasalahan yang muncul dalam NLP adalahkomputer harus dapat memodelkan morfologi dari kata untuk mengerti sebuah kalimat dan morfologi tersebutdigunakan untuk membangun kalimat yang betul. Banyak penelitian telah dilakukan untuk memperoleh hasilpengenalan kata yang betul. Mereka dimulai dari pemotongan imbuhan untuk dapat memperoleh kata dasarsampai ke memberikan
 part-of-speech tagging
untuk dapat mengenali jenis kata dan pengenalan subyek,predikat, dan obyek.
ComputerDatabasesArtificialIntelligenceAlgorithmsNetworkingRoboticsNaturalLanguageProcessingSearchInformationRetrievalMachineTranslationLanguageAnalysisSemantics Parsing
 
Stemmer 
adalah pemotongan imbuhan pada kata berimbuhan untuk mendapatkan kata dasar.
Stemmer 
untuk bahasa Indonesia sudah banyak diteliti. Nazief melakukan penelitian pemotongan imbuhan berdasarkan kamusbahasa Indonesia [4]. Dalam hal ini kualitas
stemmer 
selalu berdasarkan besarnya kamus yang digunakan.Selain itu kelemahan dari
stemmer 
Nazief adalah panjangnya waktu yang diperlukan dalam proses pencariankata di dalam kamus.Fadillah F. Tala melakukan penelitian pemotongan imbuhan berdasarkan aturan morfologi pada bahasaIndonesia dan mengadaptasi
stemmer 
Porter dalam bahasa Inggris [5]. Kesalahan yang umum terjadi padaalgoritma
stemmer 
untuk bahasa Indonesia adalah
overstemming
atau
understemming
. Kesalahan ini terjadikarena dalam algoritma
stemmer 
, kata langsung dipenggal mulai dari akhir atau awal kata. Contoh
overstemming
adalah berbadan => bad seharusnya badan. Sedangkan contoh
understemming
adalah mengecek => ecek seharusnya cek.
Part of Speech tagging
(POS-Tagging) adalah proses menandai kata-kata pada teks (korpus) berkenaandengan
 part-of-speech
tertentu berdasarkan definisi maupun konteksnya [6]. Bentuk-bentuk sederhananyaadalah identifikasi kata-kata sebagai kata benda (
noun
), kata kerja (
verb
), kata sifat (
adjective
), kata keterangan(
adverb
), dan lain-lain. Beberapa penelitian telah berhasil menemukan bagaimana cara memberikan
tagging
 secara otomatis untuk bahasa Inggris.
Tagger 
Brill adalah salah satu POS-tagging untuk bahasa Inggris berdasarkan aturan lingustik dari suatubahasa [7] seperti aturan leksikal penggunaan imbuhan.
Tagger 
Brill banyak diadaptasi untuk bahasa lain sepertiuntuk bahasa Indonesia namun dalam hal ini masih muncul banyak kesalahan karena pengenalan kata imbuhanyang masih salah. Di dalam
tagger 
Brill diperoleh aturan leksikal seperti
kan hassuf 3 VB
yang berarti dalamkata terdapat akhiran –kan. Namun dalam penerapannya masih terdapat kekeliruan berupa
tagger 
tidak dapatmengenal pemenggalan kata yang betul. Kata makan dan perkenalkan dianggap merupakan kata yang memilikiakhiran –kan.Penelitian ini akan membahas pengenalan kata. Pengenalan kata demikian berguna pada olah kata(
wordprocessing
) di dalam komputer. Melalui kaidah tertentu, pengenalan kata ini dapat digunakan untuk pemeriksaan betul-tidaknya ejaan dan bahkan lebih jauh lagi sampai ke pemeriksaan betul-tidaknya tata bahasa.Diharapkan hasil penelitian ini dapat diteruskan dan digunakan untuk penelitian lebih lanjut seperti penelitian
stemmer 
dengan pemenggalan kata sehingga tidak terjadi
overstemming
atau
understemming
. Pemenggalan katadapat memberikan informasi tempat bagian kata tersebut dipotong.
2.
 
Pemenggalan Suku Kata
Kata di dalam bahasa Indonesia terdiri atas suku kata, baik pada kata dasar maupun pada kata berimbuhan.Ada kata yang teridri atas satu suku kata, atas dua suku kata, dan ada pula kata yang terdiri atas tiga atau lebihsuku kata. Menurut ketentuan bahasa, pemenggalan kata bahasa Indonesia hanya boleh dilakukan pada sukukata. Kata bendahara, misalnya, hanya boleh dipenggal menurut suku kata menjadi ben-da-ha-ra.Pemenggalan kata ke dalam suku kata dilakukan dengan memberikan tanda suku -. Dengan sedikitpengecualian, misalnya, do-a, hanya kata dengan empat atau lebih huruf yang menggunakan tanda suku padapemenggalan suku kata. Agar pemenggalan suku kata seperti ini dapat dilakukan oleh komputer, kita

Activity (23)

You've already reviewed this. Edit your review.
1 thousand reads
1 hundred reads
malinaazura liked this
mr black star liked this
Asrhi Leaf liked this

You're Reading a Free Preview

Download
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->