Bab II Sintaksis

Bahasa mesin adalah bentuk terendah pada komputer. Kita dapat berhubungan langsung dengan bagian-bagian yang ada didalam komputer seperti bit, register dan sangat primitif. Bahasa mesin tidak lebih dari urutan bitbit 0 dan 1. Bagaimana dengan orang yang tidak mengerti bahasa mesin? Bahasa mesin adalah jenis mesin komputer yang digunakan. Bagaimana jika jenis komputer mengalami perubahan? Oleh karena itu manusia berusaha menciptakan suatu bahasa yang dapat dimengerti baik oleh manusia maupun oleh komputer, yang disebut dengan bahasa tingkat tinggi. Dari bahasa tingkat tinggi ke bahasa mesin dibutuhkan sesuatu untuk menterjemahkan agar mesin (komputer) mengerti apa yang diinginkan oleh manusia, yaitu : 1. Interpreter 2. Compiler Contoh : Cobol, Pascal, Fortran, dll Untuk membuat penterjemah seperti compiler perlu dibuat standar atau tata bahasa atau aturan, seperti manusia berkomunikasi mempunyai tata bahasa agar lawan bicara dapat mengerti yang dibicarakan. Demikian juga untuk menterjemahkan kedalam bahasa mesin (komputer) harus dibuat suatu aturan agar komputer mengerti apa yang diinginkan oleh manusia melalui program yang dibuatnya. Sintaks Sintaks merupakan kumpulan aturan yang mendefinisikan suatu bentuk bahasa. Sintaks mendefinisikan bagaimana suatu kata dikombinasikan menjadi suatu statement yang benar sehingga dapat disusun suatu program yang dapat berjalan dengan benar. Sintaks dari bahasa pemrograman didefinisikan dengan dua kumpulan aturan, yaitu : • • Aturan Lexical /Lexical Analysis (Scanner) Aturan Sintaksis / Syntax Analyzer (Parser)

Konsep dan Notasi Bahasa • Alfabet : himpunan hingga yang tidak kosong (hampa) dari symbol. Symbol anggota dari alfabet dinamakan huruf atau karakter atau token. Contoh : ∑1 = {a, b, c, .., z} ∑2 = {α, β, γ, δ} Contoh alfabet pada Basic : 26 huruf besar, 26 huruf kecil, 10 angka, dan symbol khusus seperti : ‘(‘, ‘)’, ‘.’, ‘+’ dsb

1

│= Noun mouse 2 . Np = noun phrase S → SpVp Sp → AN Vp → Vo o → Np Np → AN Kalimat : The cat ate a mouse Sentence Subject phrase Article The Noun cat Verb ate Verb phrase Object Noun phrase Article A Contoh tata bahasa sederhana : <program> <Stat_list> <stat> <expression> <term> <factor> <var> <op1> → → → → → → → → BEGIN <stat_list> END <stat>│ <stat>. vp = verb phrase. yaitu menjadi 4 class yang disebut dengan hirarki Chomsky. symbol awal yang dibatasi oleh aturan-aturan produksi.• • Bahasa : merupakan himpunan hingga ataupun tak hingga dari kalimat atau kumpulan kalimat.│Z +│ . v = verb. <stat_list> <var> :=<expression> <term> │ <term><op1><expression> <factor> │<factor><op2><term> <var> │ <constant> A│ B │. Tahun 1959 Backus memperkenalkan notasi formal baru untuk sintaks bahasa yang lebih spesifik Peter Naur (1960) merevisi metode dikenal dengan BNF(Backus Nour Form) dari sintaks yang sekarang • • • Contoh : S = sentence. o = object. s = subject phrase. symbol non terminal. Tata Bahasa atau Grammar : sekumpulan dari himpunan variabelvariabel.. Tahun 1956 – 1959 Noam Chomsky melakukan penggolongan tingkatan dalam bahasa. N = noun. symbol-symbol terminal. A = article.

. Hirarki Chomsky Unrestricted Context Sensitive Context Free Regular Keterangan Gambar : • • Tipe 0 / Unrestricted : tidak ada batasan pada aturan produksi Abc → De Tipe 1 / Context sensitive : panjang string ruas kiri harus < (lebih kecil) atau = (sama dengan) ruas kanan Ab → DeF CD → eF Tipe 2 / Context Free Grammar : ruas kiri haruslah tepat satu symbol variabel. B := A + 2 End. yaitu simbol non terminal B → CDeFg D → BcDe Tipe 3 / Regular : ruas kanan hanya memiliki maksimal satu symbol non terminal dan diletakkan paling kanan sendiri A → e A → efg A → efgH C → D • • Aturan Produksi • • Aturan produksi dnyatakan dalam bentuk α → β.<op2> <constant> <real_number> <integer_part> <fraction> <digit> Contoh : Begin → → → → → → ^│ * │/ <real_number> │ <integer_part> <integer_part> │ <fraction> <digit> │ <integer_part> <digit> <digit> │ <digit> <fraction> 0 │ 1 │ . α menghasilkan atau menurunkan β α symbol-symbol untuk ruas kiri. │ 9 A := 1. β symbol-symbol untuk ruas kanan 3 .

c.• • • Symbol-symbol dapat berupa terminal dan non terminal dimana non terminal dapat diturunkan menjadi symbol yang lainnya Umumnya symbol terminal disymbolkan dengan huruf kecil (a. dsb). yang disebut Q : subhimpunan hingga yang tidak kurang dari secara umum sebuah elemen (α. {a. T menghasilkan a E → T │ T + E. β) dari Q ditulis produksi. S.C. penting didalam penggambaran dan Derifasi : proses pembentukan kalimat di grammar Grammar Context Free merupakan pembentuk bahasa Context Free Contoh : L (G3) = {Anban │ n > = 1} Dimana : G3 = ({S.b. adalah : S → aCa → aaCaa → aaaCaaa → aaabaaa Notasi BNF (Backus – Nour Form) Aturan produksi dapat dinyatakan dengan notasi BNF BNF menggunakan abstraksi untuk struktur sintaks ::= │ < > { } identik dengan symbol → sama dengan atau pengapit symbol non terminal pengulangan dari 0 sampai n kali E → T │ T + E │ T – E T → a Contoh : Aturan Produksi sebagai berikut : 4 . dsb) Contoh aturan produksi : T → a. sedangkan untuk symbol non terminal disymbolkan dengan huruf besar (A. dengan Q adalah produksi S → aCa C → aCa C → b Derifasi untuk a3ba3 atau aaabaaa. E menghasilkan T atau E menghasilkan T + E Sebuah grammar didefinisikan dengan 4 tupel : G = (VN. Q) dimana VT dan VN : himpunan symbol terminal dan symbol S : suatu elemen tertentu dari VN.C}. Context Free Grammar (CFG) sangat penterjemahan bahasa pemrograman. VT.B. Q). non terminal symbol start relasi(VTυVN)*(VTυVN)* atau sebagai α → β dan disebut Dari 4 tingkatan bahasa maka kita akan membahas tentang Context Free Grammar. S.b}.

operator. sering disebut dengan scanner.<E> T ::= a Tanda untuk non terminal (<>) yang ruas kiri bersifat optional Fase-fase proses kompilasi adalah sebagai berikut : Program Sumber Penganalisa Leksikal (Scanner) Penganalisa Sintaks (Parser) Penganalisa Semantik Pengelola tabel simbol Pembangkit Kode antara Penanganan Kesalahan Pengoptimal Kode Pembangkit Kode Bahasa Sasaran Aturan Lexical atau Lexical Analysis (Scanner) Berhubungan dengan bahasa. mengidentifikasi semua besaran yang membangun suatu bahasa b. menangani tabel symbol f. menangani kesalahan e. bertugas sebelum proses syntax Analyzer dan Intermediate Code dilakukan dimana tugas Lexical Analysis ini mendekomposisi program sumber menjadi bagianbagian kecil. scanner di desain untuk mengenali keyword. mentransformasikan ke token-token (symbol terminal dari teori bahasa automata) c. identifier 5 . Tugas-tugas Aturan Lexical atau Lexical Analysis secara detil adalah : a.Notasi BNF : E ::= <T> │ <T> + <E> │ <T> . menentukan jenis dari token-token d.

scanner dapat mengolah program sumber secara terpisah. Analisis leksikal mempunyai tujuan untuk memisahkan naskah program sumber yang masuk menjadi bagian leksikografis terkecil atau Token seperti konstanta. string. end (pada Pascal) . *. Boolean (true/false). Kemudian token disimpan dalam sebuah file atau dalam sebuah file besar. seperti kurung buka. titik. seperti : enter. Scanner biasanya berinteraksi dengan parser melalui salah satu dari 2 cara berikut.8 Maka akan diterjemahkan ke dalam token-token sebagai berikut : Identifier Operator Integer Operator penjumlahan Identifier → → → → → Fahrenheit := 32 + celcius 6 . Yang pertama. spasi. nama varibel. kurung tutup. titik dua. integer (Pascal). begin . scanner dipanggil oleh parser bila token berikut dalam program sumber diperlukan. contoh : Statement : Fahrenheit := 32 + celcius * 1. Lexical Analysis.contoh : Besaran Lexical : (tergantung program) • • • • • Identifier dapat berupa keyword seperti if. Cara kedua melibatkan antara Parser dan Scanner yang saling berinteraksi. reserved word dan operator. -. koma.. bilangan pecahan(float / real). operator logika(< = >) Delimiter : berguna bagi pemisah atau pembatas. else. int float (pada C) Konstanta : besaran yang berupa bilangan bulat (integer). Contoh : Nama variabel Konstanta Label Keyword Operator penambahan Operator penugasan Operator pengurangan 1 2 3 4 5 6 7 operator perkalian operator pembagian tanda baca koma tanda baca titik dua tanda baca titik koma dan lain-lain 8 9 10 11 12 Token tersebut disimpan dalam suatu tabel label serta nama variabel akan dimasukkan kedalam tabel identifier. sebagai satu fasa sebelum Parser mulai bekerja. white_space White_space : pemisah yang diabaikan oleh program. titik koma. sedangkan konstanta dimasukkan ke tabel konstanta dan suatu token yang tidak berkaitan dengan label (seperti operator) maka lokasinya adalah 0 (nol). Token hasil pekerjaan scanner biasanya disajikan dalam bentuk Bilangan Penyajian internal berupa bilangan bulat (integer) yang unik. ganti baris dan akhir file Program sumber merupakan input dari penganalis leksikal ala scanner. dll Operator : operator aritmatika (+. /).

maka syntax analyzer sering disebut dengan parser Pohon sintaks yang dihasikan digunakan untuk semantic analyzer yang bertugas untuk menentukan maksud dari program sumber.Operator perkalian Real / float → * → 1. misalnya operator penjumlahan maka semantic analyzer akan mengambil aksi apa yang harus dilakukan Parsing atau Proses Penurunan Parsing dari sebuah kalimat adalah sintaks untuk kalimat tersebut.8 Statement : Jumlah A = A + B GOTO KERJA Buatlah tabel untuk penyajian Token : Token Jumlah : A = A + B GOTO KERJA Bilangan Penyajian Internal 3 11 1 6 1 5 1 4 1 Lokasi Keterangan 1 Label 0 Delimiter 2 Identifier 0 Assignment 2 Identifier 0 Operator Penjumlahan 3 Identifier 0 Reserved word 4 Identifier Syntax Analyzer (Parser) • • • • • Bertugas memeriksa kebenaran dan urutan dari token-token yang terbentuk oleh Lexical Analysis Pengelompokan token-token kedalam class syntax (bentuk sintaks). seperti prosedur. statement dan expression Grammar dipakai oleh syntax analyzer untuk menentukan struktur dari program sumber Proses pendeteksian (pengenalan token) disebut dengan parsing. Parsing dapat dilakukan dengan cara : • • Penurunan terkiri (Leftmost derivation) : symbol variabel yang paling kiri diturunkan (tuntas) dahulu Penurunan terkanan (Rightmost derivation) : symbol yang paling kanan diturunkan (tuntas) dahulu konstruksi atau pembentukan pohon Contoh : ingin dihasilkan string aabbaa dari Context free language : S → aAS │ a A → SbA │ ba 7 .

c dan d adalah symbol terminal Latihan : 8 . 6. penanganan kesalahan 3. yaitu dengan cara mencoba segala kemungkinan untuk setiap non terminal • Back Up : pengulangan suatu produksi dengan alternatif produksi yang lain. Top Down Penelusuran dari root ke leaf atau dari symbol awal ke symbol terminal Metode ini meliputi : 1. penanganan kode Parsing digolongkan menjadi : a. b. 4. S S A A B B → → → → → → aAd aB b c ccd ddc S. waktu eksekusi 2. Sementara itu a. bila produksi yang digunakan tidak sesuai dengan symbol input. Contoh : Grammar : 1. 2.Penurunan kiri S → → → → → aAS aSbAS aabAS aabbaS aabbaa Penurunan kanan S → → → → → aAS aAa aSbAa aSbbaa aabbaa Metode Parsing Pada metode parsing ada tiga hal yang perlu diperhatikan. yaitu : 1. 5. 3. A dan B adalah symbol non terminal dengan S adalah symbol start. Backtrack / back up : Brute Force • • • Memilih produksi mulai dari kiri Meng-expand symbol non terminal sampai pada symbol terminal Bila terjadi kesalahan (string tidak sesuai) maka dilakukan backtrack Algoritma ini membuat pohon parsing secara top-down.

(tidak dibahas) Contoh rekursif : S → Sab │ Sbd S → aAc A → Ab │ ∑ Parsing : Recursive Descent Parser Parsing dengan Recursive Descent Parser • Salah satu cara untuk mengaplikasikan bahasa context free • Symbol terminal maupun symbol variabelnya sudah bukan sebuah karakter • Besaran leksikal sebagai symbol terminalnya. Misalnya pada CFG yang mengandung variabel bersifat rekursif kiri (mengandung minimal satu non terminal rekursif kiri). S S S tidak sesuai dengan untai accd. maka akan terjadi loop yang tak hingga.Membentuk pohon sintaks bagi untai accd dengan menggunakan metode Brute Force. maka diperlukan Back Up untuk pilihan a A d a A d produksi A yang lain (a) (b) b (c) S d a A c (e) S a (f) B a c S B c (g) Namun teknik Parsing Top Down tidak selalu dapat bekerja pada setiap CFG. Untuk menanganinya maka CFG tersebut harus dihilangkan terlebih dahulu rekursif kirinya. besaran syntax sebagai symbol variabelnya / non terminalnya • Dengan cara penurunan secara rekursif untuk semua variabel dari awal sampai ketemu terminal d d Sama seperti diatas hanya Back Up untuk pilihan produksi S karena produksi A sudah tidak ada pilihan S a A (d) 9 .

i * i + i Latihan 2 : Buatlah pohon sintaks dari kalimat : • A monkey climbs a tree → gramatikal dan semantik benar • The banana ate a cat → gramatikal benar. dan pembagian (/) Symbol diartikan sebagai suatu nama variabel atau identifier : VN = { C. (. *. pengurangan(-). /. S = E Dengan produksi : F → i F → (E) T → T / F E → T T → T → F T * F E → E → E + T E – T Berikan derifasi untuk ekspresi sebagai berikut : i + i. F}. i * (i + i). VT = (i.)}. perkalian(*). -.• • Tidak pernah mengambil token secara mundur (back tracking) Beda dengan turing yang selalu maju dan mundur dalam melakukan parsing Parsing Bottom Up Teknik Bottom Up adalah dengan memulai pada daun dan bergerak ke atas menuju akar dimulai dengan diberikannya sebuah untai. Latihan 1 : Diberikan sebuah grammar yang menyajikan operasi aritmatika sederhana meliputi penambahan(+). +. T. i – i / i. semantik salah 10 . kemudian kita mencoba untuk mencapai symbol start Grammar.

Sign up to vote on this title
UsefulNot useful