You are on page 1of 8

Joko Adianto Pemrograman Aplikasi Jaringan - 8

Pendahuluan XML
Asal dan Penjelasan XML
XML(Extensible Markup Language) pertama kali diperkenalkan pada tahun 1996 dan merupkan bagian dari SGML(Standard Generalized Markup Language). Tujuan dari perancangan dari dokumen awal W3C-XML adalah agar markup language yang baru yang digunakan didalam Internet dapat diintegrasikan kedalam markup language yang sudah ada sebelumnya, seperti HTML dan SGML dan masih dapat dibaca oleh orang.. Akhirnya apada tahun 1998 XML 1.0 telah menjadi W3C Recommendation Status dan menjadi topic yang paling hangat dibicarakan sejak pembuatan Web pertama kali ada. Yang membut Xml istimewa adalah namanya sendiri Extensible Markup Language, artinya bahasa tersebut flexible, scalable, dan adaptable. XML dapat menjadi apapun seperti yang diperlukan oleh dokumen untuk pendistribusioan informasi melalui internet atau antara aplikasi. Dengan menggabungkan XML dengan DTD (Data Type Definition) atau schema document, tags atau elements yang digunakan didalam markup dapt didefinisikan secara unik dan spesifik. Mereka dapat dibuat khusus sesuai dengan kebutuhanb dan diatur sedemikian rupa yang memungkinkan informasi dipertukarkan dalam bentuk yang juga dimengerti oleh orang. Dengan membuat aturan dan elemen yang memenuhi kebutuhan pertukaran informasi, XML memungkinkan pertukaran struktur data didalam format yang mudah dibaca.

Struktur XML
Aturan yang ditetpakan untuk struktur dokumen adalah : Rancangan XML harus formal dan ringkas. Setiap rancangan dokumen XML memiliki logical structure dan physical structure : 1. Logical structure yang mendefinisikan units dan subunits dari data container(elemen-elemen), mendefinisikan datatype, attributes, dll. 2. Physical structure yang menyediakan data yang akan diletakkan didalam elemen, sperti text,

Pusat Pengembangan Bahan Ajar - UMB

Ir. Joko Adianto M.Inf.Sys. PEMROGRAMAN APLIKASI JARINGAN

Joko Adianto Pemrograman Aplikasi Jaringan - 8 images, atau media yang lain , sebagaimana ditentukan didalam aturan logical structure. Well-formedness adalah bagian dari logical structure. Sebagai contoh setiap dokumen berisi satu, dan hanya satu root, atau elemen dokumen, yang membuka dan menutup dokumen. 1. Dokumen menggunakan syntax XML versi 1 2. Tidak ada eksternal DTD : standalone=yes 3. encoding=UTF-8 Perhatikanlah contoh berikut yang merupakan dokumen yang lengkap : <?XML version="1.0" standalone="yes" encoding="UTF-8"?> <letter> <greeting> Hello There </greeting> </letter> Pada dokumen diatas diperlihatkan Physical layout dari XML document. Setelah physical structure dikembangkan dengan menambahkan containers, atau componens dari documents, yang diikuti dengan logical components : 1. Physical structure adalah struktur yang berisi DATA DAN INFORMASI. 2. XML document memiliki logical structure sebagaimana didefinisikan pada schema atau DTD. 3. Physical structure akan bervariasi. 4. <greeting> ..... </greeting> merupakan logical structure yang dapat berisi apa saja. Perhatikanlah bahwa <greeting> ..... </greeting> terdapat didalam <letter> .....</letter> artinya wellformedness harus dipenuhi didalam dokumen tersebut dimana. Perhatikanlah contoh yang lebih complex :

Pusat Pengembangan Bahan Ajar - UMB

Ir. Joko Adianto M.Inf.Sys. PEMROGRAMAN APLIKASI JARINGAN

Joko Adianto Pemrograman Aplikasi Jaringan - 8

<?XML version="1.0" standalone="yes" encoding="UTF-8"?> <letter> <greeting> Hello There </greeting> <signature> <message> Most Sincerely ... </message> <name> Joni Goodkill </name> </signature> </letter> Pada contoh diatas structure logical menunjukkan bahwa letter terdiri dari greeting dan signature, sementara itu signature terdiri dari message dan name. Yang harus diperhatikan adalah seluruh elements haruslah ditutup baik yang berupa pasangan maupun tag. Aspek penting dari XML adalah penggunaan entity yang merupakan representasi karakter yang digunakan untuk melakukan identifikasi bagian dari markpu. Sebagai contoh < digunakan untuk mengidentifikasi sebuah tag. Jika ingin menampilkan tanda < didalam broser maka digunakan &lt. Referensi terhadap entity dimulai dengan & dan diakhiri dengan ;. Untuk menggunakan sebuah entity dapat membuat referensi dengan menggunakan nama yang unique. Deklarasi entity memingkinkan

Pusat Pengembangan Bahan Ajar - UMB

Ir. Joko Adianto M.Inf.Sys. PEMROGRAMAN APLIKASI JARINGAN

Joko Adianto Pemrograman Aplikasi Jaringan - 8 asosiasi dari sebuah nama dengan fragme isi uang merupakan baghian dari text regular, bagian dari DTD atau file eksternal yang berisi text atau binary data. Ada tiga jenis entity didalam XML : 1. Internal Entity. Adalah Entity yang didefinisikan didalam sebuah dokumen. 2. External Entity. Adalah entity yang didefinisikan didalam dokumen yang berbeda. 3. Parameter Entity. adalah entity yang hanya dapat dirujuk oleh sebuah markup declaration dan biasanya dicadangkan untuk perancangan DTD. Disamping itu adalah lima buah built in entity characters yang digunakan : HTML &gt; &lt; &amp; &apos; &quot; Character > < & ' Description Greater than Less than Ampersand Apostrophe Double quote

Mereka digunakan jika diperlukan untuk menampilkan arakter yang disebutkan diatas. Jika dokumen semakin complex maka aturannya tetap sama : 1. Mulai dengan deklarasi XML dokumen. 2. Paling tidak harus ada satu root elements. 3. Tags harus berpasangan dengan benar. 4. Gunakan tags awal dan akhir untuk elemen-elemen yang tidak kosing, tutp empty tags dengan benar 5. Beri tanda kutip untuk atribute. Dokumen yang tidak well-formed tidak akan diproses dengan benar dan dapat menyebabkan kesalahan pada parser, karena itu setiap dokumen yang digunakan haruslah well-formed XML. Karena setiap well-formed document tidak harus mengikuti sebuah struktur tertentu, tetapi susunannya ditentukan

Pusat Pengembangan Bahan Ajar - UMB

Ir. Joko Adianto M.Inf.Sys. PEMROGRAMAN APLIKASI JARINGAN

Joko Adianto Pemrograman Aplikasi Jaringan - 8 oleh bagaimana data akan diinterpretasikan dan digunakan, dan juga dibandingkan dengan DTD. JIKA SEBUAH DOKUMEN WELL-FORMED DAN MENGIKUTI ATURAN DTD, MAKA AKAN MENJADI DOKUMEN XML YANG SAH.

DTD
DTD adalah kunci untuk arti elemen, attributes, logical structures, dan context. DTD (Data Type Definition) diperlukan agar dokumen menjadi valid. DTD adalah sehimpunan aturan yang secara eksplisit menentukan : 1. nama 2. isi 3. context dari setiap elemen Sehingga DTD merupakan dasar dari sebuah dokumen XML. DTD diperlukan agar sebuah dokumen menjadi valid. Struktur dari DTD adalah sebagai berikut : 1. Elements. Elemen adalah badan utama block HTML seperti body, head, title, tag, XML, dan bagian lainnya 2. Attributes. Informasi yang menjelaskan lebih lanjut lagi dari sebuah elemen, seperti <body text = #00000> 3. Entities. Variable yang menjelaskan referensi text secara umum. 4. PCDATA. Merupakan Parsed character data. PCDATA adalah text yang terletak antara start dan end tags dari sebuah elemen XML. PCDATA adalah text yang akan diproses oleh parser. Seluruh text akan dianggap sebagai markup, dan entities akan diproses. 5. CDATA. Adalah character data, text yang terdapat dibawah tag CDATA tidak akan diproses, dan markup akan diabaikan.

Pusat Pengembangan Bahan Ajar - UMB

Ir. Joko Adianto M.Inf.Sys. PEMROGRAMAN APLIKASI JARINGAN

Joko Adianto Pemrograman Aplikasi Jaringan - 8 Didalam DTD elemen XML dideklarasikan sebagai sebuah deklarasi elemen. Adapun sintaksnya adalah : <!ELEMENT element-name-category> atau <!ELEMENT element-name (element-content)> Secara umum struktur dari DTD dimulai dengan definisi dari root element, lalu definisi akan dipersempit ke level text. Setiap elemen yang diperlukan didefinisikan secara tepat dan lengkap menggunakan format standard. Berikut adalah contoh DTD untuk contoh dokumen sebelumnya : <!ELEMENT letter (greeting, signature)> <!ELEMENT greeting (#PCDATA)> <!ELEMENT signature (message, name)> <!ELEMENT message (#PCDATA)> <!ELEMENT name (#PCDATA)> Setiap elemen diberi nama dan strukturnya adalah : <!ELEMENT name-content >. Jika sebuah elemen memiliki attributes, maka harus dideklarasikan juga. Attributes biasanya berbentuk : <!ATTLIST element-name name CDATA #IMPLIED>

Schemas
Schema digunakan didaam XML untuk mengidentifikasi penggunakan dokumen-dokumen XML dan aturan-aturan untuk kobinasi dokumen secara benar. Sebuah schema adalah XML-based alternative untuk menjelaskan struktur sebuah dokumen XML Seperti DTD, schema menjelaskan :

Pusat Pengembangan Bahan Ajar - UMB

Ir. Joko Adianto M.Inf.Sys. PEMROGRAMAN APLIKASI JARINGAN

Joko Adianto Pemrograman Aplikasi Jaringan - 8 1. Elemen-elemen yang muncul didalam dokumen. 2. Attributes yang muncul didalam dokumen. 3. Elemen-elemen yang merupakan elemen-elemen anak. 4. Urut-urutan yang memungkinkan elemen anak dapat muncul. 5. Jumlah child elements 6. Menentukan apakah sebuah elemen kosong atau dapat berisi text. 7. Nilai default untuk attributes. Schema diharapkan mengantikan DTD. W3C merekomendasikan Schema pada bulan Mei 2001 dengan alasan : 1. Lebih mudah dipelajari dibandingkan dengan DTD. 2. Ekstensible atau bisa diperluas. 3. Lebih kaya dibandingkan dengan DTD. 4. Mendukung datatypes. 5. Mendukung namespaces. 6. Ditulis dalam XML. Tetapi DTD lebih digunakan jika : 1. Definisi lebih singkat. 2. Data dalam bentuk text 3. Nesting lebih penting dibandingkan dengan datatyping 4. Perangkat yang ada tidak mendukung Schema

Pusat Pengembangan Bahan Ajar - UMB

Ir. Joko Adianto M.Inf.Sys. PEMROGRAMAN APLIKASI JARINGAN

Joko Adianto Pemrograman Aplikasi Jaringan - 8

Validation
Validasi adalah hal yang sangat penting didalam XML. Berbeda dengan HTML yang ditujukan untu dilihat melalui browser, XML ditujukan untuk dibaca oleh software apapun yang boleh jadi bukanlah sebuah browser tetapi merupakan software lain. Jika ada ketidak lengkapan maka dokumen sudah pasti akan gagal dibaca. Validasi dilakukan dengan XML parser. Parser sebagai contoh adalah : SAX berbasis Java, dan banyak Parser yang tersedia untuk bermacam-macam bahasa. Xerces adalah parser untuk C++ yang dirancang oleh apache.org (xml.apache.org)

Character Sets and Encoding


Character set yang digunakan adalah text based dan standard encoding yang digunakan adalah UTF-8 yang merupakan character set unicode. characterset tersebut digunakan oleh industri komputasi seperti Oracle, SAP, apache.org, dll

&&&&&&&&

Pusat Pengembangan Bahan Ajar - UMB

Ir. Joko Adianto M.Inf.Sys. PEMROGRAMAN APLIKASI JARINGAN

You might also like