You are on page 1of 31

NOTE: All information provided in this document is confidential.

Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Garis Panduan Transkripsi


Pengenalan
Matlamat projek: Matlamat projek ini adalah untuk mentranskripsi fail audio yang akan membantu
pelanggan kami membina model pengesanan pertuturan automatik yang terbaik.

Tujuan projek ini adalah untuk mentranskrip dengan tepat (contohnya dengan menaip atau menggunakan tag
yang telah disediakan) pertuturan yang diberikan kepada anda dalam fail audio. Anda akan menggunakan
platform transkripsi dalam talian kami yang digelar ADAP Quality Flow. Garis panduan yang berasingan untuk
penggunaan platform ini telah disediakan.

Sila baca keseluruhan garis panduan ini dan pastikan ia mudah untuk diakses ketika anda memulakan
transkripsi. Terdapat banyak perkara yang harus diingat, tetapi anda akan mendapati bahawa tugasan ini
akan menjadi lebih mudah setelah anda membuat beberapa transkripsi. Jika ada perkara yang tidak jelas, sila
hubungi penyelia projek anda. Semoga berjaya!

1
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Maklumat umum
Tujuan projek ini adalah untuk mentranskrip semua pertuturan yang jelas
dan juga bunyi bukan pertuturan yang berlaku pada masa yang sama
dengan pertuturan.
Pertuturan adalah apa-apa yang mengandungi bahasa manusia. Dalam projek
ini, kita mentranskripsi pertuturan walaupun ianya tidak tepat dari segi
tatabahasa — ini termasuklah:

● Teragak-agak ("hm", "ah"),


● Bahasa basahan ("camna", "kekadang","kat" ), dan
● Perkataan berulang ("mereka mungkin mungkin akan berada di sana.").

Contoh
Speech, non-speech
noise, and no-speech ● TRANSKRIPSI: warna terang seperti ah merah, oren dan ah kuning.
saya nampak
● TRANSKRIPSI: pada pendapat saya, pasukan Selangor adalah
Pertuturan, bunyi pasukan terbaik. dia orang <colloquial>kekadang</colloquial>
bukan pertuturan dan
tiada pertuturan
Kebanyakan pertuturan diwakili oleh perkataan dan aksara. Walau
bagaimanapun, sesetengah pertuturan tidak dapat difahami atau bertindih
dengan pertuturan yang lain dari penutur yang berbeza. Pertuturan ini harus
diwakili dengan tag-tag yang telah disediakan.
Bunyi bukan pertuturan yang berlaku semasa pertuturan juga perlu ditag. Jika
bunyi bukan pertuturan seperti muzik, ketawa, batuk, klik, dan dentuman berlaku
dalam tempoh 1 saat pertuturan, bunyi-bunyi ini harus ditag.
Sebarang audio yang tidak mengandungi apa-apa pertuturan (perkataan),
bunyian dari audio tersebut tidak perlu ditag. Sebaliknya, hanya gunakan satu
tag no speech sahaja.
Sekiranya terdapat pertuturan, gunakan tag no-speech bilamana terdapat jeda
(berhenti sekejap) selama lebih satu saat.

Foreground
Tetapan kelantangan anda hendaklah ditetapkan supaya pertuturan yang paling
speech/noise kuat adalah pada kelantangan yang selesa. Pertuturan utama adalah sebarang

2
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Pertuturan pertuturan yang dapat difahami dengan jelas pada kelantangan tersebut tanpa
utama/bunyi bising perlu cuba mendengar dengan teliti atau didengar berulang kali.

Pertuturan yang jelas lebih perlahan dari pertuturan utama ( contoh pertuturan
Background speech perlahan di latar belakang yang boleh difahami) perlulah di transkripsi mengikut
garis panduan yang disediakan di dalam dokumen ini sepertimana yang
dipaparkan dalam bahagian pertuturan utama dan bunyi, ianya kemudian harus
Pertuturan Latar
ditanda dengan <bg></bg>. Bagi pertuturan latar belakang yang tidak dapat
Belakang
difahami sila gunakan tag .
Units Ujaran ialah satu unit transkripsi. Setiap ujaran mempunyai kotak input teks
tersendiri dan perlu disimpan (save) sebelum pengguna dapat beralih ke ujaran
seterusnya. Pecahan antara ujaran pada umumnya boleh diabaikan: ia hanya
Unit bertujuan untuk memecahkan audio kepada bahagian yang mudah ditranskripsi

Unit Group
Satu kelompok kerja transkripsi (unit group) ialah fail audio tunggal yang
berterusan yang selanjutnya dibahagikan kepada halaman dan ujaran.
Kelompok
Untuk sesetengah kelompok kerja (unit group), maklumat mengenai sumber
audio tersebut akan dipaparkan di bahagian ‘Source’.

Source Sila gunakan maklumat ini sebagai rujukan bagi ejaan untuk kata nama seperti
nama orang, tempat, produk dan jenama.
Sumber
Nota: maklumat tambahan ini mungkin mengandungi kesalahan ejaan. Oleh itu,
sila semak semula menggunakan carian dalam talian (online search) jika anda
ragu-ragu terhadap ejaan tersebut.
Bagi meningkatkan produktiviti, sila gunakan singkatan untuk papan kekunci
(keyboard shortcuts) bagi tujuan penandaan (taggings). Untuk menggunakan
singkatan, pastikan cursor berada dalam keadaan aktif di kotak transkripsi dan
kemudian tekan kombinasi papan kekunci yang diberikan.
Shortcuts Singkatan untuk tag utama (Event Tags)
Singkatan Pastikan cursor di tempat yang ingin ditag, dan tekan Ctrl + E bagi membuka
kotak senarai singkatan dan diikuti dengan Ctrl + Alt + abjad singkatan (contoh
Ctrl + Alt + D untuk tag change-spk atau Ctrl + Alt + E untuk tag noise).

Singkatan untuk tag penandaan (Span Tags)

3
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Bagi penggunaan tag penanda (span tags), pilih perkataan yang ingin ditanda
dan kotak singkatan akan dipaparkan, tag utama akan di kelabukan pada masa
ini. Gunakan Ctrl + Alt + abjad singkatan untuk memilih (contoh
Ctrl + Alt + A untuk colloquial atau Ctrl + Alt + C untuk mispronunciation)

4
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Mentranskripsi pertuturan
Gunakan ejaan Bahasa Melayu yang standard, ini termasuk kata pinjam.

Contoh:
Betul Salah
agenda ajenda
organisma organisme
kalendar kelendar
televisyen television
kuih kue/kueh

Senarai kekeliruan dalam ejaan untuk perkataan yang mempunyai tona yang
hampir sama.

Spelling Contoh
ia ya
Ejaan
padahal pada hal

telur telor

lembab lembap

Untuk senarai lengkap bagi ejaan standard dan kekeliruan, sila klik di sini.

komponen pendua haruslah dipisahkan oleh tanda sempang atau sengkang,


preposisi dan urutan kata benda hendaklah dipisahkan sebagai dua perkataan.

Contoh
● melambung-lambung
● gunung-ganang
● siapa-siapa
● insya-Allah
● anti-Amerika

5
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Partikel atau kata penegas -lah, -tah, -kah -kan dan juga -pun harus ditulis
melekat pada perkataan sebelumnya.

Contoh
● melampaulah , bolehlah
● apatah
● mungkinkah , diakah
● adapun
● menekankan

Walaubagaimanapun, perkataan ‘lah’ dan ‘kan’ dalam ekspresi dialek dan


perkataan ‘pun’ yang membawa maksud juga perlulah ditulis secara berasingan

Contoh
● lah, kau yang datang?
● ada lah, mana boleh bagitahu kan.
● ya dia pun ada sekali.

Kata ganti -ku -mu -nya juga ditulis melekat pada perkataan sebelumnya

Contoh
● keranamu
● padaku
● rupanya
● padaNya

Kata hubung di- ditulis sama ada disambung atau dijarakkan bergantung kepada
jenis perkataan. Kata kerja (perbuatan) mestilah disambung manakala selain dari
kata kerja ditulis secara dijarakkan.

Contoh
● ditulis
● dimakan
● di sana
● di barat

Acceptable Jika sebutan hanya berbeza satu bunyi dari ejaan standard Bahasa Melayu, sila
guna ejaan standard Bahasa Melayu. Jika pertuturan berbeza lebih dari satu
non-standard bunyi, sila eja mengikut pertuturan dan gunakan tag colloquial.
spellings

6
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Example
Ejaan tidak Satu bunyi berbeza
standard yang ● leh, ngan ==> TRANSKRIPSI: boleh, dengan
diterima ● K ==> TRANSKRIPSI: okey
● tu, mau, tau ==> TRANSKRIPSI: itu, mahu, tahu
● iya / ye, ke ==> TRANSKRIPSI: ya, kah
● ko, diorang , korang ==> TRANSKRIPSI: kau, dia orang, kau orang

Lebih dari satu bunyi berbeza

● pasaipa, camna==> TRANSKRIPSI: pasaipa, camna


● toksah ==> TRANSKRIPSI: toksah
● kekadang ==> TRANSKRIPSI: kekadang
Guna peraturan penggunaan huruf besar Bahasa Melayu dengan satu
Capital letter pengecualian: jangan gunakan huruf besar pada permulaan ayat.

Nama kebanyakan orang ("Fahmi Fadzil"), nama lokasi ("Dataran Merdeka",


Huruf Besar "Sarawak"), produk dan jenama ("Massimo","Adabi" "YouTube") acara dan
peristiwa ("Sukan Asia") perlu menggunakan huruf besar.
Untuk mentranskripsi pertuturan yang mengandungi kata nama Bahasa Inggeris
(nama jenama, nama tempat, nama orang, dan sebagainya), sila fahami bahasa
Script mana yang dimaksudkan oleh perkataan itu dan transkripsikan seperti yang
disebut. Dalam kes di mana ia boleh menjadi Bahasa Inggeris atau Bahasa
Skrip Melayu, gunakan Bahasa Melayu jika ejaannya diseragamkan dan digunakan
secara meluas. Jika tidak, sila gunakan ejaan Bahasa Inggeris yang rasmi.

7
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Gunakan sebagai ganti untuk satu perkataan, atau beberapa perkataan, yang
tidak dapat difahami kerana terdapat gangguan, masalah audio, atau kerana
penutur tersebut tidak bertutur dengan jelas.
Gunakan tag ini sebagai pengganti pertuturan yang tidak dapat difahami setelah
tiga kali percubaan mendengar.
Sekiranya terdapat lebih dari satu perkataan yang tidak dapat difahami dalam
urutan, gunakan hanya satu tag sahaja. Jika keseluruhan ayat atau ujaran tidak
dapat difahami, gunakan satu tag unintelligible sahaja.

Sila gunakan juga tag ini untuk pecahan perkataan (fragmen) dan kegagapan.

Sekiranya perkataan tersebut tidak dapat difahami kerana ia dalam bahasa asing,

sila gunakan tag .


unintelligible
Contoh
Penutur menyebut perkataan yang anda tidak faham

TRANSKRIPSI: saya akan ke esok.

Penutur mengatakan 'pergi e-esoklah'

TRANSKRIPSI: pergi esoklah.

Gunakan apabila dua atau lebih penutur utama bertutur pada masa yang sama
atau pada kelantangan yang lebih kurang sama (tidak kira sama ada kedua-dua
penutur adalah penutur utama atau latar belakang). JANGAN mentranskripsi
pertuturan yang bertindih, masukkan tag ini di tempat bertindihnya perkataan
tersebut. Sekiranya, kedua-dua penutur adalah penutur latar belakang, sila
overlap gunakan tag <bg></bg> bersama dengan <overlap/>
Jangan gunakan tag overlap jika terdapat pertuturan latar belakang dan anda
boleh mendengar dengan jelas penutur utama. Dalam situasi begini, abaikan
pertuturan latar belakang dan transkripkan penutur utama dan bunyi sahaja.
Definisi nyanyian (singing) dalam projek ini ialah: mengalunkan bunyi berirama
Singing menggunakan suara. Dalam projek ini terdapat dua jenis tag yang berlainan
untuk kategori nyanyian.

8
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Nyanyian Tag <singing/> adalah untuk nyanyian secara langsung atau live sepertimana
yang dinyatakan di bahagian ini, oleh penutur utama atau penutur latar
belakang.

⚠ Nyanyian berlirik dari rakaman audio (bukan dari penutur) tidak ditag sebagai
<singing/> dalam projek ini. Sebaliknya, sila gunakan tag <lyrics/>. Sila semak di
bahagian berkaitan untuk penggunaan tag <lyrics/>

Berikut adalah termasuk dalam kategori nyanyian apabila disebutkan oleh


penutur utama atau latar belakang dengan alunan atau irama:

● Bacaan sajak dan pantun yang bermelodi


● Rap
● Perkataan yang disebut secara berirama dan/atau bermelodi.
Contohnya: mentera (mantra), ayat-ayat suci dalam agama atau doa.

Yang di atas dikategorikan sebagai pertuturan (bukan nyanyian) jika ia tidak


disebut dengan cara berirama.

Terdapat dua cara mentranskripsi nyanyian. Pertama dengan menggunakan tag

bagi menggantikan setiap perkataan atau seluruh perkataan


dalam nyanyian yang tidak dapat difahami. Kedua, dengan menggunakan tag

bagi menandakan nyanyian dari bahasa Melayu


yang boleh ditranskripsi.

Nyanyian dianggap sebahagian dari pertuturan, oleh itu tag


perlu digunakan sekiranya terdapat pertukaran dalam penutur atau penyanyi.

1. Gunakan tag untuk setiap perkataan atau kelompok perkataan


yang dinyanyikan dan tidak dapat difahami (contohnya nyanyian yang tidak dapat
dikenalpasti dsb) atau nyanyian dalam bahasa asing (walaupun anda dapat

memahaminya). Gunakan juga tag untuk kata-kata berirama yang


tidak membawa apa-apa maksud.

9
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Contoh:
Penutur memulakan ayat dalam Bahasa Melayu dan kemudian menyebut
perkataan dalam Bahasa Jerman dengan cara berirama
“kaaaartoffeeeeellll!”.

TRANSKRIPSI: lepas itu dia kata !

Penutur menyanyikan kata-kata yang tiada maksud


“dam dum dam tadam ba dah”: Gunakan satu tag sahaja.

TRANSKRIPSI:

Sekiranya terdapat lebih dari satu perkataan yang dinyanyikan, gunakan hanya

satu tag untuk semua nyanyian yang tidak dapat difahami.

Contoh:
Penutur ‘rapping’ dan anda tidak dapat memahaminya. Tetapi anda pasti
terdapat 5 perkataan sekurang-kurangnya.

TRANSKRIPSI:

Contoh:
Penutur menyanyikan dua perkataan yang tidak dapat difahami dan
kemudian penutur kedua mula ‘rapping’ pada masa yang sama.

TRANSKRIPSI:

Contoh:
Penutur bersyair dalam bahasa Tamil dan kemudiannya penutur kedua
mula bersyair.

TRANSKRIPSI:

2. Sekiranya anda dapat memahami perkataan yang dinyanyikan dan ianya

10
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

dalam Bahasa Melayu, anda perlu mentranskripsikannya dan menandakan


perkataan tersebut dengan tag .

Contoh:
Penutur membacakan puisi.

TRANSKRIPSI: <singing>tersebutlah kisah suatu cerita, Arjuna dan


Dara</singing>

Beberapa orang penutur menyanyikan selamat hari jadi pada waktu yang
sama

TRANSKRIPSI: <singing>selamat hari jadi Liz, selamat hari jadi!</singing>

Beberapa orang penutur menyanyikan lagu Frère Jacques dengan nada


bertindih (dengan jarak hanya beberapa saat dari setiap seorang)

TRANSKRIPSI:

Beberapa orang penutur menyanyi secara begilir-gilir:

TRANSKRIPSI: <singing>air pasang pagi,</singing>


<singing> surut pukul lima</singing>

Penutur utama bercakap diikuti dengan penutur kedua bernyanyi.

TRANSKRIPSI: apa dia? <singing>aku cinta


padamu!</singing>

/!\ Tip:

● Gunakan tag untuk nyanyian yang tidak dapat difahami.

● Gunakan tag untuk kelompok perkataan bagi nyanyian


dalam bahasa asing.

11
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

● Gunakan tag hanya untuk nyanyian dari penutur, dan


bukan untuk lirik dari rakaman muzik yang didengari di dalam unit. Bagi
rakaman lirik dan muzik, sila gunakan tag <lyrics/>.
● Sila abaikan nyanyian latar belakang (contoh dari TV, radio atau muzik
latar belakang)
● Sila abaikan muzik latar belakang dengan nyanyian. Muzik yang kurang
dari sesaat dalam satu-satu ujaran juga boleh diabaikan.

● Sila gunakan tag untuk pertukaran penutur dalam


nyanyian, sama seperti pertuturan.
● Gunakan tanda baca yang berkenaan bagi pantun, syair, sajak, puisi dan
sebagainya.
● Sekiranya beberapa penutur menyanyikan perkataan yang sama, sila
transkripsikannya sebagai satu penutur sahaja.
● Sekiranya beberapa penutur menyanyikan lain-lain perkataan pada waktu
yang sama (contohnya lagu yang berbeza atau tidak sekata dan

bertindih), gunakan tag .


● Sekiranya nyanyian dan pertuturan bertindih pada masa yang sama

dalam kelantangan yang hampir sama, sila gunakan tag .


● Sekiranya nyanyian dan pertuturan bertindih pada masa yang sama,
tetapi salah satunya jauh lebih kuat atau salah satunya ialah bunyi latar
belakang sahaja, transkripsikan hanya penutur/penyanyi utama.
Lirik yang direkodkan atau dirakam dengan muzik yang dapat didengari di dalam
unit mestilah ditranskripsi sepertimana nyanyian, bagaimanapun, bukan dengan
tag <singing/> tetapi menggunakan tag <lyrics/>

1. Gunakan tag <lyrics/> bagi perkataan atau sekelompok perkataan di dalam lirik
yang tidak dapat difahami. (contoh nyanyian atau alunan yang tidak dapat
difahami...) juga untuk perkataan atau sekelompok perkataan dalam bahasa
asing di dalam lirik (walau ianya dapat difahami). Gunakan tag <lyrics/> untuk
Lyrics nyanyian yang tidak bermaksud.

Untuk turutan lirik yang tidak dapat difahami dan lebih dari satu perkataan, sila
gunakan hanya satu tag lirik.

2. Sekiranya lirik tersebut boleh difahami (dan dalam Bahasa Melayu),


transkripkan dan gunakan tag penandaan <lyrics>perkataan</lyrics>.

12
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Terdapat dua cara mentranskripsi bahasa asing. Pertama dengan menggunakan

tag bagi menggantikan perkataan yang tidak dapat dikenalpasti.


Kedua, dengan menggunakan tag bagi menandakan
perkataan dari bahasa asing yang boleh ditranskripsi.

Gunakan tag untuk perkataan dalam bahasa lain selain Bahasa


Melayu yang tidak difahami oleh rata-rata penutur bahasa Melayu. Kata pinjam
seperti "standard" “tambi” “lu” dan “alhamdulillah” adalah diterima dan perlu
ditranskrip.
Perkataan Bahasa Inggeris, Kantonis/Hokkien, Tamil, Arab dan lain-lain yang
selalu digunapakai pula, seperti “so” “and” “warahmatullahi” “bo liao” dan “macha”
perlu ditranskrip dan ditandakan sebagai .

Contoh:
Foreign Speech

Bahasa Asing Penutur menyebut perkataan asing selepas ‘ucapkan’ dan anda tidak
dapat mengenalpasti perkataan tersebut

TRANSKRIPSI: saya nak ucapkan . lepas ni saya nak

Sekiranya terdapat lebih dari satu perkataan asing dalam ayat, gunakan hanya
satu tag <foreign/> untuk kesemua kelompok perkataan tersebut.

Contoh:
Penutur menyebut “wo hen hao la“ di tengah ujaran dan ia tidak dapat
difahami.

TRANSKRIPSI: dia kata tadi sambil tersenyum.

Contoh:
Penutur menyebut “babu ma ja‘a fi al-bayanah“ di hujung ujaran dan ia
tidak dapat difahami.

13
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

TRANSKRIPSI: maka hadis kata

Sekiranya anda dapat memahami perkataan asing tersebut, sila


transkripsikan perkataan tersebut dan tandakan dengan tag

Contoh:
Penutur menyebut “and so you guys know“ di tengah ujaran dan ia dapat
difahami.

TRANSKRIPSI: ada lagi satu <foreign>and so you guys know</foreign> kalau

Penutur menyebut “wo hen hao la“ di tengah ujaran dan ia dapat
difahami.

TRANSKRIPSI: dia kata tadi <foreign>wo hen hao la</foreign> sambil


tersenyum.

Contoh 3:
Penutur menyebut “warahmatullahi wabarakatuh“ di hujung ujaran dan ia
dapat difahami.

TRANSKRIPSI: hai assalamualaikum <foreign>warahmatullahi


wabarakatuh</foreign>.

/!\ Tip:

● Kata pinjam adalah perkataan dari bahasa lain yang digunapakai secara
meluas dan difahami oleh rata-rata penutur Bahasa Melayu. Bagi projek
ini ia tidak diklasifikasikan sebagai bahasa asing dan tidak seharusnya
ditag sebagai foreign.
● Kata nama khas dari bahasa asing (nama orang, tempat dan lain-lain)
tidak diklasifikasikan sebagai bahasa asing dan perlu ditranskripsi.

14
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

● Sekiranya anda tidak dapat memahami perkataan tersebut disebabkan


kualiti audio atau penutur bercakap dengan nada yang tidak jelas TETAPI
perkataan tersebut adalah di dalam Bahasa Melayu, gunakan tag

● Sekiranya anda tidak dapat memahami perkataan atau sekelompok


perkataan tersebut disebabkan penutur menggunakan bahasa asing,

gunakan tag s
● Sekiranya anda kurang pasti akan ejaan perkataan pinjam tersebut tetapi
anda memahaminya dan ia digunakan dalam pertuturan sehari-hari,
gunakan carian internet atau DBP untuk mendapatkan ejaan yang selalu
digunapakai.
● Sekiranya anda memahami perkataan asing tersebut, transkripsikannya
dan tandakan dengan tag

● Nyanyian dalam bahasa asing perlulah ditag sebagai (satu


tag untuk sekelompok perkataan), jangan mentranskripsikan nyanyian
dalam bahasa asing walaupun anda boleh memahaminya.

Nombor hendaklah dieja dalam perkataan penuh sebagaimana ia disebutkan.

Contoh
Nombor '2020' boleh disebut dalam pelbagai cara

● 2020 ==> TRANSKRIPSI: dua puluh dua puluh


● 2020 ==> TRANSKRIPSI: dua ribu dua puluh
Numbers
Penutur menyatakan nombor loteri (4 8 6 2)
Nombor
● 4 8 6 2 ==> TRANSKRIPSI: empat lapan enam dua

Penutur membaca waktu

● waktu sekarang ialah 5:30pm. ==> TRANSKRIPSI: waktu sekarang


ialah lima setengah PM.

15
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

● waktu sekarang ialah 5:30 petang. ==> TRANSKRIPSI: waktu sekarang


ialah lima setengah petang.

Penutur membaca persamaan matematik

● 1 + 1 = 2. ==> TRANSKRIPSI: satu tambah satu bersamaan dengan


dua.

Penutur menggunakan matawang

● barang ini berharga RM12.99. ==> TRANSKRIPSI: barang ini berharga


dua belas ringgit sembilan puluh sembilan sen.

Digit (contohnya 1 2 3 4 5 ...) HANYA boleh digunakan apabila ia bergabung


dengan huruf tanpa ruang dan membentuk sebahagian daripada nama.

Contoh

● H2O ==> TRANSKRIPSI: H2O


● iPhone 6S ==> TRANSKRIPSI: iPhone 6S
● TV3 ==> TRANSKRIPSI TV3
● PS4 ==> TRANSKRIPSI: PS4

Walau bagaimanapun

● Xbox 360 ==> TRANSKRIPSI: Xbox tiga enam kosong

● Jalan Bestari 6 ==> TRANSKRIPSI: Jalan Bestari Enam

● Festival Jom Heboh Ke-12 ==> TRANSKRIPSI: Festival Jom Heboh ke


Dua Belas

Acronyms & Akronim dan Inisial (kependekan) adalah perkataan yang terbentuk daripada
Initialisms huruf-huruf pertama beberapa perkataan. Ianya mungkin disebutkan sebagai satu
perkataan, atau setiap huruf disebut secara berasingan. Akronim dan

16
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Akronim & kependekan dieja menggunakan huruf besar tanpa jarak atau noktah di
Kependekan antaranya.

Contoh

● U.T.C atau U T C ==> UTC


● U.S.A. atau U S A ==> USA
● A.M / P.M. ==> AM / PM
● PH
● ASEAN
● JAKIM
● UMNO
● UNESCO

Apabila penutur mengeja perkataan, huruf demi huruf, sila transkripsikan


menggunakan huruf besar dengan ruang di antaranya.

Spelled out words Example

● TRANSKRIPSI: urutan ejaan ditranskripsikan sebagai huruf besar yang


Perkataan yang berasingan. jika saya mengeja nama saya kepada kamu, saya akan
dieja sebut J O H A N.
● TRANSKRIPSI: jika penutur mengeja Terengganu dan sebut t e r e n
dua g a n u maka transkripsi yang betul adalah T E R E N dua G A N U.

Sekiranya anda perlu mentranskripsi alamat emel atau alamat laman web, sila
pisahkan elemen-elemen seperti yang disebutkan.

Emails / websites
Contoh
Emel / laman web
● www.facebook.com ==> TRANSKRIPSI: WWW dot Facebook dot com.
● amirchan@gmail.my ==> TRANSKRIPSI: Amir Chan at Gmail dot MY.

17
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Inappropriate
language Semua bahasa yang tidak sepatutnya (bahasa kasar dan bahasa kesat) harus
ditranskripsi. Sekiranya anda merasa tidak selesa menaip perkataan tertentu, sila
Bahasa yang tidak gunakan tag unintelligible (rujuk unintelligible tag) sebagai ganti.
sepatutnya
Transkripsikan keraguan dan kegagapan (teragak-agak) yang lain seperti aa dan
hmm.

Senarai Keraguan dan Pencelahan


Ekspresi Ejaan yang diterima
Mengiyakan mhm, haah, aha, ai, okey, ooh, ya, ah
Menidakkan eh, aiya, aiyo, alahai, haish, ish, huu
Keraguan aa, uh, ah, uui, hmm, kut, kah
ooh, wau, wah, hoh, peh, tada, tara,
Kejutan
aik, jeng, deng, ops, wuu, lol, fui seh

Hesitations and Kesakitan aduh, adoi


interjections Pengesahan ek, meh, deh, kah, ha, noh, kan
Marah / Benci / Tidak ee, ceh, hei, ish, eww, eleh, alah, haih,
Keraguan dan Suka haip, huh, yuck, nuh, pui
Pencelahan
Keseronokan/ amboi, ewah, aww, fulamak, fuh, fuiyoh,
Gembira yeay, yeah, yum, alolo, wuhu, walaweh
Panggilan hai, hoi, hei, weh, wei, yo
Penekanan /
lah, maa, ha, nah, seh, wo, phew, alah
Kelegaan

Untuk senarai lengkap bagi keraguan dan pencelahan, sila klik di sini.
Contoh

● TRANSKRIPSI: hmm, apa yang saya cakap?


● TRANSKRIPSI: oh, terlupa pula saya.

18
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

● TRANSKRIPSI: aku nak tengok filem ni aa dengan aa

dia macam <colloquial>kekadang</colloquial>


jiwang lah!

19
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Tag Span (Penandaan)


Terdapat dua jenis tag: tag penanda atau span tags dan tag utama atau event tags. Sila lihat maklumat dan
tangkap skrin (screenshot) di bawah untuk keterangan lanjut.
Tag utama dimasukkan di antara perkataan, manakala tag penanda digunakan untuk mengelilingi
perkataan.
Untuk memadam tag, hanya tekan butang backspace dua kali dan tag akan dikeluarkan.

Tag Span Cara menggunakannya


Untuk perkataan dan ejaan tidak standard yang sering muncul dalam
bahasa harian, transkripsikan apa yang didengar dan tandakan perkataan
tersebut menggunakan tag span colloquial.

Secara umumnya, jika perkataan tersebut tidak wujud dalam kamus atau
konteks penulisan formal (contohnya surat khabar), maka berkemungkinan
perkataan tersebut adalah bahasa percakapan atau bahasa pasar
(colloquial).

Sekiranya perkataan tersebut wujud di dalam kamus rasmi DBP dan


bertanda ‘bp atau bahasa pasar’ (colloquial), sila gunakan tag ini.
Sekiranya anda ragu-ragu, sila gunakan tag colloquial daripada
meninggalkan perkataan tanpa ditag.

Contoh
colloquial
Sebutan
Transkripsi Bentuk Penuh
Penutur
camena <colloquial>cam</colloquial> mana macam mana
oder <colloquial>oder</colloquial> pesanan
kekadang <colloquial>kekadang</colloquial> kadang-kadang
toksah <colloquial>toksah</colloquial> tak usah
nokharom <colloquial>nokharom</colloquial> anak haram
kekwat <colloquial>kekwat</colloquial> sombong

20
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Kebanyakan perkataan dalam loghat atau dialek Bahasa Melayu


semenanjung telahpun didaftarkan di dalam kamus Dewan,
perkataan-perkataan ini tidak perlu ditandakan sebagai colloquial.

Contoh

hangpa, kome, kecek, dan sebagainya.

Walau bagaimanapun, perkataan yang diklasifikasikan sebagai bp


(bahasa percakapan atau colloquial) oleh kamus Dewan, hendaklah ditag
sebagai colloquial.

Contoh

pi, aje, moh, kat dan sebagainya

Untuk senarai yang lebih panjang bagi perkataan colloquial, sila klik di
sini.

Gunakan ini untuk menanda sebarang perkataan yang disalah sebut


secara tidak sengaja. Ejakan perkataan tersebut secara betul, kemudian
tandakan dengan tag ini. Anda tidak perlu menggunakannya jika
seseorang itu mempunyai loghat/dialek — ia hanya perlu digunakan
apabila penutur menyebut sesuatu secara salah dalam keadaan tidak
sengaja. Jika anda ragu-ragu, tanyakan kepada diri anda sendiri "adakah
orang ini akan menyebut perkataan itu secara berbeza jika saya
memintanya untuk ulang semula?" Jika ya, ia boleh diklasifikasikan
sebagai salah sebut (mispronunciation).

mispronunciation
Contoh

Anda dengar “apakah barna kesukaan anda?”


TRANSKRIPSI: apakah <mispronunciation>warna</mispronunciation>
kesukaan anda?

Sekiranya anda mendengar perkataan di dalam audio yang anda kurang


pasti atau kurang yakin ejaannya, sila tandakan perkataan tersebut

21
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

best guess dengan tag best guess.

Tag ini mungkin diperlukan jika penutur menyebut kata nama khas yang
jarang didengari.

Contoh:

● Penutur menyebut "dia kata nak pergi Wolengi” tetapi anda kurang
pasti apakah itu Wolengi atau bagaimana cara ejaannya; ejakan
seperti yang anda dengari dan gunakan tag:
<best_guess>Wolengi</best_guess>

Jangan gunakan tag best guess jika pertuturan tidak dapat difahami atas
sebab kualiti audio yang kurang jelas, penutur bercakap dalam nada yang

tidak jelas, dan lain-lain. Sila gunakan tag untuk situasi


yang di atas.

JANGAN gunakan tag ini untuk perkataan-perkataan yang dapat disemak


dengan mudah dalam carian internet.

Contoh:

● Anda kurang pasti ejaan nama seorang artis, "Emir Kusturica"


sila semak ejaannya menggunakan carian internet dengan
menggunakan ejaan yang paling dekat + kata kunci (contohnya
penutur menyebut "filem" di dalam audio)
● Anda kurang pasti ejaan "tatabahasa" = sila semak melalui
carian DBP dan gunakan ejaan yang tepat.

/!\ Nota:
Sekiranya anda mendengar sesuatu perkataan dalam Bahasa Melayu
tetapi kurang yakin akan apakah perkataan tersebut, sila gunakan tag

22
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Sekiranya anda mendengar sesuatu perkataan dalam bahasa asing dan

ia tidak dapat difahami, sila gunakan tag

23
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Penandaan bunyi bukan pertuturan dan peristiwa


Tag disenaraikan dalam urutan kekerapan ianya digunakan. Tag-tag lazim disenaraikan di bahagian atas jadual.

Tag Peristiwa Cara menggunakannya


Sebarang jeda (tiada percakapan atau bunyi) selama satu saat dan lebih haruslah di
tag sebagai no speech.

Bunyi-bunyian bukan pertuturan yang tidak berlaku dalam lingkungan 1 saat pertuturan
tidak perlu ditanda.

Contoh
Anda mendengar pertuturan yang diselangi dengan batuk, diikuti oleh jeda
selama 1 saat (berhenti sekejap), dan kemudian bunyi yang kuat:

TRANSKRIPSI:

kau pernah dengar pasal dia.

no speech
/!\ Sekiranya keseluruhan ujaran tidak mengandungi apa-apa pertuturan, ia harus
ditranskripsikan dengan satu tag SAHAJA: tag no speech. Walaupun ia mengandungi
sebarang bunyi lain, anda mesti mengabaikannya jika tiada pertuturan

Contoh

Seluruh ujaran mengandungi bunyi orang menangis, bunyi bising atau muzik
instrumental:

TRANSKRIPSI:
Anda mesti mengabaikan semua bunyi jika tiada pertuturan dalam ujaran tersebut.

Digunakan untuk semua bunyi bukan pertuturan yang dihasilkan oleh orang utama
(contohnya nafas, batuk, bunyi bibir, dan ketawa).
spk
Hanya gunakan tag ini jika:

24
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

- Kelantangannya berada pada atau hampir dengan kelantangan persekitaran


penutur utama.
- DAN bunyi berlaku dalam satu saat pertuturan.

Contoh
Penutur batuk di tengah-tengah ayat
TRANSKRIPSI: biar betul kau ini merepek!
Penutur tengah bercakap dan seseorang kemudian batuk dengan kuat.

TRANSKRIPSI: lepas itu aku ke H And M untuk beli baju.

Gunakan untuk muzik (tanpa lirik atau nyanyian) yang tidak bertindih dengan pertuturan
utama. Nyanyian dari penutur utama hendaklah ditag sebagai singing, bukan sebagai
music. Sementara itu rakaman muzik berserta lirik mestilah ditag sebagai lyrics.

Hanya gunakan tag ini jika:


- Kelantangannya berada pada atau hampir dengan kelantangan persekitaran
penutur utama.
- DAN bunyi berlaku dalam satu saat pertuturan.

Contoh
Pemberita mengumumkan berita utama sebelum muzik latar bermula kurang
sesaat dari perkataan akhir disebut:

music TRANSKRIPSI: berita utama Buletin TV3.

Muzik yang diikuti dengan jeda (pause) tanpa sebarang bunyi lebih dari sesaat
dan diikuti dengan percakapan. Muzik mestilah diabaikan kerana jarak antara
percakapan dan muzik terlalu jauh (lebih dari sesaat).

TRANSKRIPSI: kan aku dah kata!

25
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Gunakan untuk sebarang bunyi bukan pertuturan yang berlaku pada kelantangan yang
sama dengan penutur utama. Jangan tag bunyi latar belakang yang mempunyai
kelantangan lebih rendah daripada pertuturan.

Hanya gunakan tag ini jika:


- Kelantangannya berada pada atau hampir dengan kelantangan persekitaran
penutur utama.
- DAN bunyi berlaku dalam satu saat pertuturan.
noise
Contoh
Bunyi ketukan kuat di pintu and kurang sesaat kemudian penutur bercakap:

TRANSKRIPSI: ya siapa ya?

Masukkan tag pertukaran penutur pada mana-mana bahagian penutur utama


berubah. Ini mungkin berlaku pada pemulaan unit atau pertengahan unit.
Tag pertukaran penutur hanya perlu digunakan untuk pertuturan atau nyanyian —
bunyian yang datang daripada penutur berbeza tidak memerlukan tag pertukaran
penutur.

Contoh
change-spk Penutur utama dijawab oleh penutur lain di latar belakang:

TRANSKRIPSI: ya siapa pula? <bg>ini Bob ini.</bg>

Gunakan apabila perkataan terputus pada akhir ujaran kerana komputer tidak
memotong audio dengan betul. Ini berbeza dengan pecahan ayat atau fragmen (di
mana penutur tersebut berhenti bercakap pada pertengahan perkataan). Dalam
truncation pemotongan perkataan (truncation), rakaman itu telah dipotong ketika orang tersebut
sedang menyebut sesuatu perkataan. Oleh itu, pemotongan kata hanya berlaku pada
awal atau akhir unit.

26
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Apabila anda mendengar pemotongan perkataan pada akhir unit dan anda pasti anda
dapat mentranskripsi perkataan tersebut, sila tulis secara penuh perkataan yang telah

dipotong tersebut diikuti dengan tag . Apabila anda mendengar

pemotongan perkataan pada awal unit, masukkan tag sahaja.

Contoh
Perkataan ‘kemungkinan’ dipotong kepada kemung-" pada akhir unit pertama
dan "-kinan" pada awal unit kedua.

UNIT 1: dalam hal ini kemungkinan

UNIT 2: kita akan semak semula.

Sekiranya anda tidak dapat mengenal pasti perkataan yang dipotong, masukkan tag

di tempat perkataan tersebut diikuti dengan tag .

Contoh
Perkataan yang tidak dapat difahami telah dipotong dalam dua unit dan hanya
separuh dari perkataan dapat didengari tetapi anda tidak dapat mengenalpasti
apakah perkataan tersebut.

UJARAN 1: kami ke pasar

UJARAN 2: dan beli ikan serta

Sekiranya anda mendapati ada maklumat peribadi pengguna (UII), elakkan dari
mentranskripsi informasi tersebut dan sebaliknya, gunakan tag ini. Tujuannya adalah
uii
untuk tidak mendedahkan maklumat sulit pengguna.

27
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

UII termasuk perkara-perkara seperti nama penuh, nama pengguna (usernames),


gamertags, alamat jalan, nombor telefon, nombor kad kredit, nombor kad pengenalan,
dan sebagainya.
Terdapat pengecualian dalam hal ini. Anda tidak perlu menandakan UII jika maklumat
tersebut adalah umum, contohnya::

● Ia adalah siaran berita, rancangan TV, program Radio atau TV


● Ianya jelas promosi komersil (contohnya iklan) tanpa jangkaan privasi
● Ia adalah penyiaran dari blogger awam
● Nama penuh tokoh awam yang terkemuka (penyanyi, penulis, ahli politik, atlet,
dan sebagainya). Tokoh masyarakat tempatan juga terkecuali dari ditandakan
sebagai UII (contohnya seorang cikgu yang terkenal)
● Ia bukan nama penuh (anda hanya mendengar nama pertama atau nama
keluarga sahaja)

/!\ Awas, nama penuh yang disebut dalam undian / cabutan bertuah hendaklah
sentiasa ditanda sebagai UII..

Kami telah pun mengeluarkan kebanyakan fail yang mengandungi UII, dengan itu
anda tidak perlu menggunakan tag ini secara kerap

28
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Tanda Baca
Sebuah ayat adalah unit yang lengkap dari segi tatabahasanya. Ayat biasanya, tetapi tidak
semestinya, mengandungi subjek (contohnya "kucing") dan kata kerja ( contohnya
"duduk"). Contoh ayat lengkap dari segi tatabahasa yang tidak mempunyai subjek dan kata
kerja termasuklah jawapan kepada soalan (contohnya "ya." dan "tidak.") dan seruan
("sakitnya!" dan "ya kah?").

Contoh

● TRANSKRIPSI: semuanya berjalan dengan baik. ada lagi yang perlu aku
tambah? ya, mungkin.

Di akhir setiap ayat, gunakan sama ada noktah (.) untuk pernyataan, tanda tanya (?) untuk
Punctuation soalan, atau tanda seru (!) untuk seruan. Jangan gunakan kombinasi tanda baca ("?!", "!!!",
"..."). Jangan gunakan sempang (-) atau tanda petikan (") untuk menunjukkan petikan atau
pertuturan yang disebut. Tiada tanda baca lain (seperti : ; ) harus digunakan.
Tanda Baca Hanya gunakan tanda baca pada penghujung ujaran jika penghujung ujaran tersebut juga
merupakan penghujung ayat. Jika penutur meneruskan ayat yang sama dalam ujaran
seterusnya, gunakan tanda baca di mana perlu dalam pertuturan tersebut. Lihat
penerangan unit.

Contoh:

● TRANSKRIPSI:
UJARAN 1: akan menang tahun ni! apa pendapat kau orang
UJARAN 2: pasal Piala Thomas? atlet kita akhirnya nampak

Lihat bahagian tag "incomplete" di bawah untuk arahan mengenai pecahan ayat yang
tidak lengkap dari segi tatabahasa.
Masukkan tag incomplete apabila penutur utama memulakan ayat dan sama ada (a)
terganggu oleh penutur baru, atau (b) memulakan ayat baru sebelum ayat pertama
incomplete tersebut lengkap dari segi tatabahasanya.Tag ini tidak boleh digunakan untuk
menunjukkan bahawa ayat tersebut bersambung ke unit kedua.

29
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Contoh
Penutur mula bercakap tetapi diganggu oleh penutur yang lain:

● TRANSKRIPSI: kami nak ke cantik ya tempat ini.

Penutur mula bercakap kemudian mengubah ayatnya sebelum menghabiskan ayat


mula:
● TRANSKRIPSI: entahlah, tak pasti pula kalau dia orang eh
empat gram serbuk kari kan?

Anda tidak perlu menggunakan tag incomplete apabila penutur memulakan semula atau
mengulangi sesuatu perkataan atau ayat.
Gunakan tanda koma (,) dalam situasi-situasi ini sahaja:

● Untuk mengasingkan sesuatu senarai dalam ayat ("saya makan dua biji rambutan,
tiga ulas durian dan sebiji epal.")
Commas ● Di belakang kata penghubung pada awal ayat. ("oleh sebab itu, dia tidak datang.")
● Apabila menggunakan ayat seru ("amboi, comelnya kucing ni!")
Koma ● Untuk memisahkan unsur-unsur dalam ayat yang berbeza ("barang ni mahal, tapi
tahan lama tau.")

Apabila anda tidak pasti sama ada untuk menggunakan koma ataupun tidak, adalah lebih
baik untuk tidak menggunakannya.

30
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Sumber
● Dewan Bahasa dan Pustaka
● Tanda baca dalam Bahasa Melayu

31

You might also like