NOTE: All information provided in this document is confidential.

Any ​publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Malayalam Transcription Guidelines

Project goal: The goal of this project is to transcribe audio files that will
ultimately help our client build state of the art automatic speech
recognition models.

േ പാജക്ടിെ ല ം: ആർ ് ഓേ ാമാ ിക് സ്പീ ് െറ ിഷൻ േമാഡലുകള െട

അവ സൃഷ്ടി ാൻ ഞ ള െട യ െന സഹായി ു ഓഡിേയാ
ഫയലുകൾ ടാൻസ് കിപ് ് െച ക എ താണ് ഈ േ പാജക് ിെ ല ം.

The aim of this project is to accurately transcribe (i.e. type out or represent with
pre-filled tags) the speech presented to you in audio files. You will be using our
online transcription platform called "Ampersand". A separate guide is provided for
using Ampersand.

നി ൾ ് ലഭി ിരി ു ശബ്ദ ഫയലുകൾ ഏ വും കൃത മായ രീതിയിൽ

ടാൻസ്ൈ കബ് െച ക എ ു താണ് ഈ േ പാജക്ടിെ ല ം. "Ampersand”
എ ് വിളി ു ഞ ള െട ഓൺൈലൻ ാ ്േഫാം ആയിരി ും. നി ൾ
ടാൻസ്ൈ കബ് നട ുവാൻ േവ ി ഉപേയാഗി ു ത്. Ampersand-െന ുറി ്
നി ൾ ് ഒരു പേത ക ൈഗഡ് തരു തായിരി ും.

Please read these guidelines in full and keep them handy when you start
transcription. There are a lot of things to remember, but you will find it gets
easier once you have done a few transcriptions. If anything is unclear, please
contact your project supervisor. Good luck!

ദയവായി നി ൾ പൂർ മായും guideline ​വായി തിനുേശഷം േവണം

ടാൻസ്ൈ കബ് നട ുവാൻ. അേനകം കാര ൾ നി ൾ ഓർേ തു ്.
പേ , കുെറ േനരെ ടാൻസ്ൈ കബിനു േശഷം നി ൾ ് അനായാസമായി

െച വാൻ സാധി ും. എെ ിലും നി ൾ ് മന ിലാവാ ത് ഉെ ിൽ
ദയവായി നി ള െട േ പാജക് ് സൂ ർൈവസറുമായി ബ െ ടുക.

General information
െപാതു മാർ നിർേ ശ ൾ
The purpose of this project is to transcribe all valid speech as
well as the non-speech sounds which occur at the same time as

എ ാ സംഭാഷണശകല ള ം അേത സമയ ു നട ു

സംഭാഷണം അ ാ ശബ്ദ ള ം ടാൻസ്ൈ കബ് െച ക
എ താണ് ഈ േ പാജക്ടിെ ഉേ ശ ം.

Speech​ is anything which contains human language. In this project,

we transcribe speech even if it is not grammatically correct —
Speech, including:
non-speech noise, ● hesitations ("um", "er"),
and no-speech ● colloquial words ("gonna", "wassup"), and
ഭാഷണം, ഭാഷേണതര ● repeated words ("they they was gonna be there.").
ശബ്ദം, േനാ-സ്പീച്
മാനുഷിക ഭാഷ ഉൾെ ടു ഏത് സംസാര ശകല ള ം ഇതിൽ
ഉൾെ ടാം. വ ാകരണപരമായി ശരിയ ാ സ്പീ ് ആെണ ിൽ
േപാലും െ പാജക് ിൽ ന ൾ ടാൻസ്ൈ കബ് െച ു:

● വികാരപരമായ വാ ുകൾ ("ഊം", "ആ", "ഏ")

● സമാ ര ഭാഷാപദ ൾ ("എേ ?", "എ ടാ?")
● ആവർ ി വരു വാ ുകൾ ("ഞാൻ ഞാൻ അവിെട
ഉ ായിരു ു.")
● TRANSCRIPTION: warm colors like uh red, orange and uh

yellow. I seen
● TRANSCRIPTION: in my opinion, the Cavs are the best team.
they're gonna
● TRANSCRIPTION:​ ​ഞാൻ ആഹ് മലയാളം, ആഹ് ഇം ീഷ്
എ ിവ നാ ായി സംസാരി ും.
● TRANSCRIPTION:​ ​നീ എേ എെ കൂെട വരാെ ?
● TRANSCRIPTION:​ഞാൻ ഞാൻ അവിെട ഉ ായിരു ു

Most speech is represented by words and characters. Some speech,

however, is unintelligible or overlaps with other speech from a different
speaker. This speech should be represented with pre-filled ​tags​.

മി സംഭാഷണ െളയും വാ ുകള ം പതീക ളം

സൂചി ി ു ു.. എ ിരു ാലും, ചില സംസാരം മനസിലാ ാൻ
കഴിയാ താണ് അെ ിൽ മെ ാരു സ്പീ റിൽ നി ു മ ്
സംഭാഷണ ള മായി ഓവർലാ ് െച ു. മുൻകൂ ി പൂരി ി
ടാഗുകൾ (tags​) ഉപേയാഗി ് ഈ സംഭാഷണെ സൂചി ി ണം..

Non-speech sounds​ which occur during speech also need to be

tagged. If non-speech sounds such as music, laughter, coughing,
clicks, and bangs occur within 1 second of speech, these sounds should
be tagged.

നി ൾ ് ലഭി ു ഓഡിേയാ ി ിൽ സംസാരം ഇ ാ

ഏെത ിലും ശബ്ദം കയറി വ ാൽ അതിന് േനാൺ സ്പീച് ടാഗ്
ഉപേയാഗിേ താണ്. ഓഡിേയാ ി ിന് ഇടയിൽ ഒരു
െസ ൻേഡാ, അതിനകേ ാ സംഗീതം, ചിരി, ചുമ, ി ുകൾ
ബാ ് വിളി സൗ ് എ ിവ നി ൾ ് േകൾ ുകയാെണ ിൽ
അ രം ശബ്ദ ൾ ടാഗ് െച ണം.

If an entire utterance doesn't contain ​any speech​ (words), then the

sounds that occur in this utterance should not be tagged. Instead, use
the tag ​no speech​ and move on.
If the utterance contains speech, then insert the tag ​no speech
wherever a pause longer than one second occurs.

െമാ ം ഉ ാരണ ിൽ (utteranace)​ ഒരു സംഭാഷണവും

(വാ ുകൾ) അട ിയി ിെ ിൽ, ഈ ഉ ാരണ ിൽ സംഭവി ു
ശബ്ദ ൾ ടാഗുെച രുത്. പകരം, no speech​ എ ടാഗ്
ഉപേയാഗി ് മുേ ാ ് േപാകുക.

ഉ ാരണ ിൽ (utterance)​ സംഭാഷണം അട ിയി െ ിൽ, ഒരു

െസ ൻഡിൽ കൂടുതൽ താൽ ാലികമായി നിർ ു ിടെ ാം
സംഭാഷണമി എ ടാഗ് േചർ ുക.

Your volume settings should be set so that the loudest speaker in the
utterance is at a comfortable volume. ​Foreground speech​ is any
speech which can be clearly understood at that volume, without
straining or repeated listening.

ടാൻസ് കിപ്ഷന് മു ായി നി ള െട േവാളിയം െസ ്

െചയ്തിരി ണം കാരണം ആ ശബ്ദ ശകല ിെല ഏ വും ഉയർ
ശബ്ദം നി ൾ ു േകൾ ാനാകും. ഇവിെട േഫാർ ഗൗ ് സ്പീ ്
Foreground എ ാൽ നി ൾ െസ ് െചയ്തിരി ു നി ിത േവാളിയ ിൽ
speech/noise നി ൾ ്വ മായി മന ിലാ ാൻ കഴിയു സംഭാഷണമാണ്.
അത് ബു ിമു കൂടാെത വീ ും വീ ും േകൾ ാെത
പധാനഭാഷണം/ ശബ്ദം
മന ിലാ ാൻ കഴിയു ത് ആയിരി ും.

Speech and noises which are clearly quieter than this volume should
not be transcribed or tagged, even if they are audible and intelligible.

ആ െസ ് െചയ്തിരി ു േവാളിയ ​ ളെര താെഴയായി േകൾ ു

ിലും വ
സംസാരേമാ, മ ശബ്ദേമാ സ്പഷ്ടം ആെണ ിൽ േപാലും ടാൻസ്ൈ കബ്
െചേ തി .

An utterance is a single unit of transcription. Each utterance has its

own text input box and needs to be saved before a user can move on
Utterance to the next utterance. The breaks between utterances can generally be
ഉദീരണം ignored: they are only intended to break up the audio into easily
transcribable sections.
ഒരു utterance ,​ അെ ിൽ ഒരു വാക ം എ താണ് ടാൻസ് കിപ്ഷൻ

ഒരു യൂണി ായി കണ ാ ു ത്. ഓേരാ utterancenനും
അതിെ തായ ഒരു ഇൻപു ് േബാക്സുകൾ ഉ ായിരി ും. അടു
utterance​േല ് കട ു തിനുമു ് എ ാ ഇൻപു കള ം േസവ്
െച ണം. ഒരു utterance ന ​ ് േശഷം അടു utterance ​ലഭി ു തിന്
മു ു വിടവ് കാര മാേ തി .ആ വിടവുകൾ നി ൾ ്
ടാൻസ്ൈ കബ് െച വാനു ഓഡിേയാ കമീകരി ു തിന്
േവ ിയാണ്.

A batch of transcription work is a single, continuous audio file which is

further divided into pages and utterances.
ഗണം batchകളായി, ഓേരാ വാക ളായി വിഭജി െ തുടർ യായ ഓഡിേയാ
ി കെളയാണ് ടാൻസ് കിപ്ഷനിെല ഒരു batch എ
​ ് പറയു ത്.
Transcribing speech
സ്പീ ് ടാൻസ്ൈ കബ് െച ു

In this project you will be transcribing ​Malayalam ​in Malayalam script.

If you come across Indian English words and sentences, you should
also transcribe them but they should be transcribed in Latin script.

ഈ േ പാജക്ടിൽ മലയാളം സ് കിപ് ് ഉപേയാഗി ് നി ൾ മലയാളം

ടാൻസ് കിപ്ഷൻ ആണ് ​െച ത്. ഇ ൻ ഇം ീഷിലാണ് വാക ൾ
എ ിൽ അത് ലാ ിൻ സ് കിപ് ് ഉപേയാഗി ് െച ണം.

For instance if a speaker uses English words in their Malayalam

sentence or say an entire sentence in Indian English, you should be
transcribing them in Latin script.
ഉദാഹരണമായി ഒരു സ്പീകർ അവരുെട മലയാള വാക ൾ ിെട
ഇം ീഷ് വാ ് ഉപേയാഗി ു ു അെ ിൽ ഒരു വാക ം െമാ ം
ഇം ീഷിൽ പറയു ു എ ിൽ നി ൾ അത് ലാ ിൻ സ് കിപ് ് ഉപേയാഗി ്
Spelling ടാൻസ് കിപ്ഷൻ െച ണം.
അ രവിന ാസം
Use Latin script for Indian English words/sentences occurring
in the speech.
Refer to the Script section below for more details on script usage.
But, if the words/sentence is in foreign English, use unintelligible tag.
ഇ ൻ ഇം ീഷിന് ലാ ിൻ സ് കിപ് ് ഉപേയാഗി ുക.
കൂടുതൽ വിവര ൾ ് േവ ി സ് കിപ് ് െസ ൻ റഫർ െച ക.
പെ , വാേ ാ/വാക േളാ വിേദശഭാഷയിൽ ആെണ ിൽ
unintelligible ടാഗ് ഉപേയാഗി ുക.


● ​ ഞാൻ Monday സ്കൂളിൽ വരി .

● ഇ േലാക ിെല ഒരു വലിയ ജനാധിപത nation എ തിൽ
ആർ ാണ് സംശയം.
Use standard British English spelling when you hear Indian English

ഇ ൻ ഇം ീഷ് വാ ുകൾ നി ൾ േകൾ ുേ ാൾ ബി ീഷ്

ാൻേഡർഡ് സ്െപ ിംഗ് ഉപേയാഗി ുക.

Incorrect Correct
(െത ് ) (ശരി)
traveled travel​l​ed
canceled cancel​l​ed
neighbor neighbo​u​r

Use standard contractions ("I'm", "could've", "let's" but not "tryna" or

"'em") if this is how a word is pronounced in the audio. Also use
possessive apostrophes where necessary, e.g. "Mike's job", "both kids'

"I'm", "could've, "let's" but not "tryna" or "'em"​ എ

ി െനയാണ് ഒരു
ഓഡിേയായിൽ ഉ െത ിൽ ാൻേഡർഡ് ആയ ലാ ിൻ
ചുരുെ ഴു ് രൂപം ഉപേയാഗി ുക. കൂടാെത, ആവശ മു ിട ്
േപാ ിവ് അേപാസ് ടഫിയും ഉപേയാഗി ുക. ഉദാ "Mike's job",
"both kids' toys".

Avoid unnecessarily repeated characters. Transcribe words as

according to dictionary spelling, even if the sounds are stretched out in
the audio.
അനാവശ മായ ആവർ ി വരു അ ര ൾ ഒഴിവാകുക.
ശബ്ദം നീ ി പറയു ുെ ിലും നിഘ ു പകാരം ടൻസ്ൈ കബ്
െച ക.
● Speaker says: “Muuuuuuum, heeeeeelp!”
● Speaker says: കൺൺൺ ്
When transcribing numbers in English, ​hyphens​ are sometimes

required to distinguish large numbers from sequences of smaller
numbers. This is not applicable in Malayalam.

ന റുകളിൽ, പേത കി ം ഇം ീഷ് ഭാഷയിൽ (മലയാള ിൽ

ബാധകമ ) വലിയ അ ള ന റുകൾ െചറുതാ ി
കാണി ാൻ ൈഹഫൻ ഉപേയാഗി ണം.

Speaker says '24' – use a hyphen
● 24 ==> TRANSCRIPTION: twenty-four
Speaker says '20' followed by '4' – do NOT use a hyphen
● 20 4 ==> TRANSCRIPTION: twenty four

This distinction is not needed when typing in Malayalam.

ഈ വ ത ാസം മലയാള ിൽ ൈട ് െച േ ാൾ ആവശ മി .

So-called expressions should use hyphens.

ബ ളിൽ ഉ വിളി െ ടു േപരുകൾ ും ൈഹഫൻ
ഉപേയാഗി ണം (ഇം ീഷിൽ)

● TRANSCRIPTION: her mother-in-law and her so-called genius


If a pronunciation is only one sound different from its conventional

spelling, please use the conventional spelling. If the spoken form
differs by more than one sound, and there is a commonly-used and
Acceptable accepted spelling for this form, please use that spelling.
spellings പര രാഗത സ​ ്െപ ിംഗിൽ നി ് ഒരു ശബ്ദം മാ തം
സ ീകാര മായ മാതൃക വ തസ്തമാെണ ിൽ പര രാഗത സ്െപ ിംഗ് രീതി
പരമ ാ ഉപേയാഗി ണം. ഒരു ശബ്ദേ ാൾ കൂടുതൽ
അ രവിന ാസം
വ ത സ്തമാെണ ിൽ, ആ രീതി മലയാള സ്െപ ി ിൽ ഉെ കിൽ
ആ സ്െപ ി ിൽ ഉപേയാഗി ് തെ എഴുതുക.
One sound different

● bruh ==> TRANSCRIPTION: bro

● walkin' , talkin' , seein' ==> TRANSCRIPTION: walking, talking,

​ രു ശബ്ദം മാ തം വ ത ാസമാണ്.

● ==> ടാൻസ് കിപ്ഷൻ: ഇ

● ==> ടാൻസ് കിപ്ഷൻ: ഇ
● ഇ ് ==> ടാൻസ് കിപ്ഷൻ: ഉ ്

More than one sound different

● wanna, gonna ==> TRANSCRIPTION: wanna, gonna

● c'mon, cuz, dunno, gimme ==> TRANSCRIPTION: c'mon, cuz,
dunno, gimme

ഒ ിൽ കൂടുതൽ ശബ്ദം വ ത ാസെ ടു ു.

● എണീ ്==> TRANSCRIPTION: എ
​ ണീ ്
● ഓടിേ ാ ==> TRANSCRIPTION: ​ഓടിേ ാ

Use English capitalization rules with one exception: ​do not use a
capital letter if the only reason to do so is that the word is at
the start of a sentence. ​Capital letters should only be used for
proper nouns and acronyms, as appropriate. Use Google search for
correct capitalisation.
Capital letters
വല ര ൾ
"I", as in me, is always capitalized.
ലാ ിൻ സ് കിപ് ് ഉപേയാഗി ് ടാൻസ്ൈ കബ് െച േ ാൾ
ഇം ീഷിെല ‘ക ാപി ൈലേസഷൻ’ നിയമം പാലി ണം. പെ , ഒരു
പദ ിെ ആദ അ രം ക ാപി ൽ ആയിരി ണം എ ത് ഇവിെട
ബാധകമ . അതായത്, ഒരു വാക ിെ ആദ അ രം ആണ്

എ ഒ ാരണം െകാ ാണ് എ ിൽ ക ാപി ൽ ആേ തി .
‘me’ എ അർ തിലു ‘I’ എേ ാഴും ക ാപി ൽ ആയിരി ണം.

Most person names ("Barack Obama"), location names ("Golden Gate

Bridge", "Russia"), products, and brand names ("Five Guys",
"YouTube") should be capitalized.

വ ികള െട േപരുകൾ ("Barack Obama"), ലേ രുകൾ ("Golden

Gate Bridge", "Russia"), ഉത്പ ള െട േപരുകൾ, ബാൻഡ് േപരുകൾ
("Five Guys", "YouTube") ഇവയുെടെയ ാം ആദ ാ രം ക ാപി ൽ
ആ ണം.
The key is to understand which language the word is intended to be in
and transcribe as is.
ഏത് ഭാഷയിലാേണാ സംസാരി ു ത് ആ ഭാഷയിെല സ് കിപ് ്
ഉപേയാഗി ് ടാൻസ്ൈ കബ് െച ക.

Example: ​നിരീ ണം ‘nireekshaNam’ is a Malayalam word, which

should be transcribed in Malayalam, whereas ‘observation’, which is an
English word, should be transcribed as ‘observation’ in Latin script
according to its English spelling.

ഉദാഹരണം: ‘നിരീ ണം’ എ ത് ഒരു മലയാളപദം ആണ്. അത്

മലയാള ിൽ തെ ടൻസ്ൈ കബ് െച ണം. അത്േപാെല,
Script ‘observation’ എ ത് ഒരു ഇം ീഷ് പദമാണ്. അതിനാൽ അത്
ലിപി ഇം ീഷിൽ ടൻസ്ൈ കബ് െച ണം.

Generally, use Latin script for English words and Malayalam script for
Malayalam words.

െപാതുവായി റ ാൽ, ഇം ീഷ് പദ ിന് ലാ ിൻ സ് കിപ് ം

മലയാളപദ ിന് മലയാളം സ് കിപ് ം ഉപേയാഗി ുക.

Indian English words should be transcribed in Latin script. Foreign

English words (non-Indian English) should be tagged as unintelligible.
The Oxford English-Malayalam dictionary can be referred to for correct
ഇ ൻ ഇം ീഷ് വാ ുകൾ ലാ ിൻ സ് കിപ് ് ഉപേയാഗി ്

ടൻസ്ൈ കബ് െച ണം. ഇ ൻ ഇം ീഷ് അ ാ വിേദശ ഇം ീഷ്
വാ ുകൾ ് unintelligible​ ടാഗ് െച ണം.

Example:​ Monday, nation, fireplace

Malayalam words should be transcribed in Malayalam script. ​ശബ്ദ

താരാവലി: മലയാള നിഘ ു can be referred to for correct Malayalam

മലയാളം വാ ുകൾ മലയാളം സ് കിപ് ിൽ ടൻസ്ൈ കബ് െച ണം.

ശരിയായ സ്െപ ിംഗിനു േവ ി ശബ്ദ താരാവലി : മലയാള നിഘ ു
റഫർ െച ാവു താണ്.

Example: ത
​ ി ൾ, ഭാരതം, താരാവലി.

Ideally, most of the transcription should be in Malayalam.

Below are the basic points to consider when you have to choose
between Malayalam or Latin script.
ടാൻസ് കിപ്ഷൻ ഭൂരിഭാഗവും മലയാള ിലായിരി ണം.
മലയാള ിേനാ ലാ ിൻ സ് കിപ് ിേനാ ഇടയിൽ നി ൾഎ ്
തിരെ ടു ണം എ തിനു അടി ാന വിവര ൾ താെഴ
േചർ ു ു.

In cases where it can be either English or Malayalam script, use the

Malayalam version if the transliteration is standardized, does not have
spelling variants, and is widely used. Otherwise, use the official English
മലയാളവും ഇം ീഷും ര ും ഉപേയാഗി ാം എ
ിതിയാെണ ിൽ, മലയാളം ലിപ രീകരണ ിൽ വ ത ാസമി ,
വ ാപകമായി ഉപേയാഗി ു ു എ ിൽ മലയാളം ഉപേയാഗി ുക.
അ െനയെ ിൽ, ഔേദ ാഗിക ഇം ീഷ് സ്െപ ിംഗ്
ഉപേയാഗി ുക.

Example: ബു ,് െപൻ
English words that are not commonly pronounced in Malayalam or

have spelling variations when written in Malayalam script should be
written in Latin script.
മലയാള ിൽ െപാതുവായി ഉപേയാഗി ാ തും, മലയാള ിൽ
എഴുതിയാൽ സ്െപ ിംഗ് െത ാൻ സാധ തയു തതുമായ വാ ുകൾ
ലാ ിൻ സ് കിപ് ് ഉപേയാഗി ് എഴുതുക.

Example​: globalisation, intention, conservative

In the case of English loanwords (like bus, car etc.), use Malayalam
script if the spelling is standard. Otherwise, if there are spelling
variations for the loanword when written in Malayalam, use English

bus, car​ േപാെല ഇം ീഷിൽ നി

ും കടെമടു വാ ുകളാണ്
എ ിൽ ാൻേഡർഡ് മലയാളം സ്െപ ിംഗ് ഉപേയാഗി ുക, ഇനി
ാൻേഡർഡ് സ്െപ ിംഗ് ഇ എ ിൽ ലാ ിൻ ഉപേയാഗി ുക.

Example:​ ​ബസ്, സ ി ്, േഫാൺ

English words with a Malayalam suffix should be written as they are

without any space.
മലയാളം പത യം (suffix) ഉ
​ ഇം ീഷ് പദ ൾ അകലം വിടാെത
Example: ​development​െ ഭാഗമായി, keyboard​െ , resort​േല ്.

English acronyms should always be in Latin. If they are attached to a

Malayalam suffix, they should be written without any space.
ഇം ീഷ് ചുരു േ രുകൾ എേ ാഴും വലിയ അ ര ിൽ
ആയിരി ണം. മലയാളം േപരിന് കൂെട ഒ ി വരു താെണ ിൽ,
അകലം വിടാെത എഴുതണം.
Example: ​BJP​യുെട, ATM​േല ,് CAA​െയ കുറി .്
However, if the Malayalam suffix changes the pronunciation of the

base English word and would therefore change the spelling of the base
English word, write the full word in Malayalam script.
എ ിരു ാലും, മലയാള ിെല പത യം ഇം ീഷ് പദ ിെ
ഉ ാരണം വ ത ാസെ ടു ുകയും അത് കാരണം, ഇം ീഷിെല
പധാനപദ ിെ സ്െപ ിംഗ് വ ത ാസമാവു ുമുെ ിൽ ആ പദം
മുഴുവൻ മലയാള ിൽ എഴുതുക.

● എഫ്ഫക്േ ാെട NOT ​effect​ഓെട
● േബാ ിലിൽ NOT ​bottle​ൽ
● മിക്സാ ി NOT ​mix​ ി

Brand names- ബാൻഡ് േപരുകൾ

Brand names should be transcribed the same way as they are written
officially. Refer to the official site of the particular brand for correct
spellings, correct case, and the correct script to use (Latin script or
ബാൻഡ് േപരുകൾ അത് എ െനയാേണാ അവർ ഒഫീഷ ലായി
എഴുതു ത്, അത് േപാെല തെ എഴുതണം. ശരിയായ
സ്െപ ിംഗിനു േവ ി പേത ക ബാൻഡിെ ഔേദ ാഗിക ൈസ ്
റഫർ െച ക.
Example: ​YouTube, TikTok, TV9,​ ​മലയാള മേനാരമ, മാതൃഭൂമി

If a digit is connected to a brand name without a space, it should be

written as a digit. If there is a space between the letters and the digit,
it should be spelled out. Conduct web search to find the official
ബാൻഡിെ േപരിന് കൂെട അകലമി ാെത േചർ ് അ ം
വരു ു ് എ ിൽ അത് അ മായി തെ എഴുതണം (വാ ുകൾ
ആയി ) അ ര ിനും അ ിനുമിടയിൽ അകലം ഉെ ിൽ
അത് വാ ുകൾ ആയി എഴുതണം (അ ളായി ). ഔേദ ാഗിക

സ്െപ ിംഗ് ലഭി ാൻ ഗൂഗിൾ റഫർ െച ക.
Example: ​TV9, News18, V4

Incorrect Correct

Heinz 57 Heinz fifty-seven

Udaya 24X7 Udaya twenty-four by seven

People’s names- വ ികള െട േപരുകൾ

People’s names should be transcribed in Malayalam script if they have
an Indian origin and should be transcribed in Latin script if they are
foreign names.

സ േദശ (ഇ ൻഉ വ) േപരുകൾ മലയാളം സ് കിപ് ിൽ എഴുതണം.

വിേദശ േപരുകൾ ലാ ിൻ സ് കിപ് ് ഉപേയാഗി ് എഴുതണം.

Example: ​പിണറായി വിജയൻ, സ ാതി, ൈവ ം മുഹ ദ് ബഷീർ

Example: J​ ohn, David, Peter

Place names- ലേ രുകൾ

Place names that are located in Kerala should be transcribed in
Malayalam script.
േകരള ിെല ലേ രുകൾ മലയാള ിൽ എഴുതണം.
Example: ​കാസർേഗാഡ്, തിരുവന പുരം, ഉദുമ, േചവായൂർ

Place names that have variations in Malayalam spelling or are not

located in Kerala should be transcribed in Latin. Refer to Google search
for correct spelling.
മലയാള ിൽ എഴുതുേ ാൾ സ്െപ ിംഗ് വ ത ാസം വരു
ലേ രുകള ം, േകരള ിൽ അ ാ ലേ രുകള ം ലാ ിൻ
സ് കിപ് ് ഉപേയാഗി ് ടൻസ്ൈ കബ് െച ക. ശരിയായ സ്െപ ിംഗ്

അറിയാൻ ഗൂഗിൾ റഫർ െച ക.
Example: ​Uttar Pradesh, India, Karnataka

If there is no standardized spelling in English, use the standard

Malayalam spelling.
ാൻേഡർഡ് ആയി എ ിൽ (മംഗള ർ, മംഗലാപുരം
എെ ാെ യാണ് Mangalore-െന ഉ രി ു െത ിൽ) അ രം
വാ ുകൾ മലയാളം സ് കിപ് ിൽ ടാൻസ്ൈ കബ് െച ണം.

Other proper names- മ പേത കനാമ ൾ

For movie names and TV series names, use standard spelling to reflect
the form heard in the audio. Use Google to search for correct
capitalization, if using Latin script. Remember to spell the digit in these
names if they are not attached, even if this is not the correct title.
സിനിമ, സീരിയൽ േപരുകൾ ് ാൻേഡർഡ് സ്െപ ിംഗ്
ഉപേയാഗി ുക. ലാ ിൻ സ് കിപ് ് ഉപേയാഗി ുേ ാൾ ശരിയായ
ക ാപി ൽ നിയമ ിന് ഗൂഗിൾ റഫർ െച ക. ഓർ ുക, ഇതിെ
കൂെട അ ൾ വരു ുെ ിൽ അത് വാ ുകളിൽ എഴുതണം
ശരിയായ ൈട ിൽ അെ ിൽ േപാലും.
Example (movie names):-സിനിമാ േപരുകൾ
Incorrect - ശരിയ ാ ത് Correct- ശരിയായത്

15 August Fifteen August

Mumbai Pune Mumbai 3 Mumbai Pune Mumbai Three

Super 30 Super Thirty

Write Indian festival names in Malayalam script and foreign festival

names in Latin script.
നാടൻ ഉ വ ൾ മലയാളം സ് കിപ് ിൽ ടാൻസ്ൈ കബ് െച ണം.

വിേദശ ഉ വ ൾ, ലാ ിൻ സ് കിപ് ിലും ടാൻസ്ൈ കബ് െച ണം.
Example: ​ഓണം, തൃ ർ പൂരം, വിഷു, െത ം.
Example: ​Christmas, Easter, Halloween

Use as a placeholder for a word, or several words, that cannot be

understood because there is interference, an audio problem, or
because the person is not talking clearly.
Enter this tag in place of the speech which cannot be understood after
three attempts at listening.
If there is more than one unintelligible word in sequence, use a single
tag. If the entire sentence or utterance cannot be understood, use a
single unintelligible tag.Also use this tag for word fragments and

unintelligible​ എ
ടാഗ് ഉപേയാഗി ു വിധെ കുറി ാണ്
പറയുവാൻ േപാകു ത്. ന ൾ േകൾ ു ഓഡിേയാ ി ്
പലതവണ േക ി ം മന ിലാ ാൻ പ ാ വിധം ാരി ി ഇ ാെത
വരികേയാ ഓഡിേയാ േ പാ ംസ് ഉ ാവുകേയാ, സംസാരി ു
വാ ുകൾ മൂ ് തവണ േക ി ം മന ിലാ ാെത വരികേയാ
െചയ്താൽ ഈ ടാഗ്അവിെട ഉപേയാഗി ണം. നമു ്
ലഭി ിരി ു ഓഡിേയാ ി ് പൂർണമായും ഒരു വാ ു േപാലും
മന ിലാ ാൻ പ ാ വിധ ിൽ ആണ് എ ിരി െ ,
അ െനയാെണ ിൽ ആ മുഴുവൻ ി ം unintelligible​ ടാഗ്
ഉപേയാഗിേ താണ്.

മുറി ു വരു വാ ുകള ം, വി ി വി ി പറയു വാ ുകൾ ും

ഈ ടാഗ് ഉപേയാഗി ണം.
If you cannot understand a word because it is in a foreign language,
use the tag
മലയാളം അ ാ ഭാഷയിെല വാ ുകൾ എ കാരണം െകാ ് ഒരു
വാ ് മന ിലാ ാൻ കഴിയു ി എ ിൽ
ഉപേയാഗി ുക.

A speaker says a word you don't understand
TRANSCRIPTION: I want to go to tomorrow

A speaker says "bien s'étendre" in the middle of a sentence

TRANSCRIPTION: I thought he said . and then

Speaker says 'go t- tomorrow'

TRANSCRIPTION: go tomorrow

നി ൾ ് മന ിലാകാ ഒരു വാ ു സ്പീ ർ പറയു ു

TRANSCRIPTION:​ഞാൻ വിചാരി അവൻ അത്


സ്പീ ർ ഇട ് “ക്ണാ ൻ” എ ് പറ ു . പെ നമു ു

മനസിലായി .

TRANSCRIPTION:അവൻ എ ാണ് പറ ത്.

സ്പീ ർ പറയു ു 'എനി ് നാ- നാെള'

TRANSCRIPTION:​ എനി ് നാെള

ഇവിെട വാ ുകൾ നമു ു ഇട ് പൂർ മായി മനസിലായി ി ,

അത് െകാ ്ന ൾ ഇട ് േചർ ു.

There are two ways to transcribe foreign speech: a tag

​Foreign Speech f to replace a word you do not know and use ​not_MAL​ to highlight
foreign words you can write down.
വിേദശ ഭാഷ ടാൻസ്ൈ കബ് െച ാൻ ര ് രീതികള ്: ഒരു വിേദശ

വാ ് നി ൾ ് അറിയി എ ിൽ ആ വാ ിെന ടാഗ്
ഉപേയാഗി ് ടാഗ് െച ക.
ഇനി ആ വിേദശ വാ ് നി ൾ ് മന ിലാകു ുെ ിൽ not_MAL
സ്പാൻ ടാഗ് െകാ ് ൈഹൈല ് െച ക

Use the tag for speech in a language other than

Malayalam which would not be understood by native Malayalam
Loan words such as “car” and “bus” are acceptable and should be
മലയാളം സ്പീ റിന് മന ിലാ ാൻ പ ാ മലയാളം അ ാ
ഭാഷയിെല വാ ുകൾ ് t​ ag​ െകാടു ുക. car, bus
േപാെലയു മ ് ഭാഷകളിൽ നി ് കടെമടു ് മലയാള ിൽ
പചാരമു വാ ുകൾ (loan words) ടാൻസ്ൈ കബ് െച ണം.

A speaker says a foreign word after “ഭാഷയിൽ” and you
cannot identify the foreign word

TRANSCRIPTION: Russian ഭാഷയിൽ എ തിെ

അർഥം എ ാണ്?

If there is more than one foreign word in sequence, ​use one

tag for each word​. Use your best judgement to
determine the number of foreign words.
ഒരു നിരയിൽ ഒ ിൽ കൂടുതൽ വിേദശ ഭാഷ ഉെ ിൽ ഒരു വാ ിന് ഒരു
ടാഗ് എ രീതിയിൽ െച ക.

A speaker says “denken Sie an die Kinder“ in the middle of a
sentence but you do not understand
ഒരു സ്പീ ർ ഒരു വാചക ിനിെട “denken Sie an die Kinder“ എ ്
പറയു ു, പേ നി ൾ ് മന ിലാവു ി , എ ിൽ
​If you can understand the foreign language​, please write the
words down and highlight them with the ​span tag​ ​not_MAL​.
നി ൾ ് വിേദശ ഭാഷ മന ിലാകു ുെ ിൽ ആ വാ ുകൾ എഴുതി
ൈഹൈല ് െചയ്തു not_MAL​ ടാഗ് െകാടു ുക.

A speaker says “denken Sie an die Kinder“ in the middle of a
sentence and you understand the words
ഒരു സ്പീ ർ ഒരു വാചക ിനിെട “denken Sie an die Kinder“ എ ്
പറയു ു, പേ നി ൾ ് മന ിലാവു ു എ ിൽ

TRANSCRIPTION: ഞാൻ വിചാരി denken Sie an die Kinder​ പിെ

/!\ Tips:

● Remember that loanwords are words ​borrowed​ from other

languages that are widely known and understood by Malayalam
speakers. They are ​not​ considered foreign words for the
purposes of this project and should ​not​ receive a foreign tag.
● മ ഭാഷയിൽ നി ും കടെമടു തും മലലയാള ിൽ
പചാരമു തും ആയ വാകുകൾ ആണ് loanwords. ഇ രം
വാ ുകൾ ് ഈ െ പാജക്ടിൽ not_MAL​ െകാടു ാൻ പാടി .
പകരം, അവ മലയാള ിൽ തെ ടാൻസ്ൈ കബ് െച ണം.
● Foreign names (people’s names, places, etc.) are ​not​ considered
foreign words and ​should be transcribed​.
● Foreign names (വിേദശ േപരുകൾ - വ ി, ല ൾ
മുതലായവയുെട േപരുകൾ) foreign വാ ുകളായി
കാണ ാകുകയി . അത് െകാ ് അവ ടാൻസ്ൈ കബ് െച ണം.
● If you cannot understand a word due to interference, audio
problems, or because the person is not talking clearly but ​it is in

your language​, use

● ​ ി ള െട ഭാഷയിൽ ഒരാൾ സംസാരി ു ു. പ
ന ​ േ , ഓഡിേയാ
പശ്നം, വ മായി സംസാരി ു ി തുട ിയ കാരണം െകാ ്
വാ ുകൾ മന ിലാകാെത വരു ുെ ിൽ ടാഗ്

ഉപേയാഗി ുക.
● If you cannot understand a word ​because it is in a foreign
language​, use

● നി ൾ ് വിേദശ ഭാഷയിെല വാ ്എ കാരണ ാൽ
മന ിലാവാെത വരു ു ് എ ിൽ ടാഗ്
െകാടു ുക.
● If you are unsure of the spelling but you understand the word
and it is used in your language as a loanword, do an internet
search to find the most common spelling.
● നി ൾ ് ഒരു വാ ിെ സ്െപ ിങ് ഉറ ി പേ ആ വാ ്
നി ൾ ് മന ിലാ ാൻ പ കയും ആ വാ ് േലാൺ വാ ്
ആയി ഉപേയാഗി ുകയും െച ു ് എ ിൽ െപാതുവായി
ഉപേയാഗി ു സ്െപ ിങ് ലഭി ാൻ ഇ ർെന ിൽ തിരയുക.
● If you can understand and transcribe what is said but it is not in
Malayalam ​and not a loanword, please highlight the words with
● നി ൾ ് പറ വാ ് മന ിലാ ാൻ സാധി ു ു ് പേ
ആ വാ ് മലയാള ിേലാ, കടെമടു േതാ (loan word) അ
എ ിൽ ആ വാ ് െസലക്ട് െചയ്ത് not_MAL​ െകാടു ുക.
● Singing in a foreign language should be tagged as

● വിേദശ ഭാഷയിെല പാ കള് ് െകാടു ുക.

Use for any singing in the foreground. Singing includes rapping,

chanting mantras, recital of poetry, words spoken in a sing-song
manner, or ritualistic holy sermons.
േഫാർെ ഗൗ ിലു ഏത് രൂപ ിലു പാ ിനും ഈ ടാഗ്
ഉപേയാഗി ുക. റാപ് ഗാന ൾ, മ ൾ, കവിത പാരായണം, പാ ്
g രൂപ ിൽ പറയു വാ ുകൾ, വിശു വാക ൾ ഇവെയ ാം പാ ിെ
ഗണ ിൽ െപടു ു.

Also use this tag for singing in a foreign language.

വിേദശ ഭാഷയിലു ഗാന ൾ ും ഈ ടാഗ് ഉപേയാഗി ണം.
Only use this tag if:

- the volume is at or near the volume of the surrounding
foreground speech.
- AND the sound occurs within one second of speech
ഈ ടാഗ്
- േവാളിയം ചു മു ശബ്ദ ിനു സമാനമാണ്
- ശബ്ദം ഒരു െസ ൻറിനു താെഴയാണ് എ ിൽ മാ തം
ഉപേയാഗി ുക.

Use when two or more foreground speakers talk at the same time at
more or less the same volume. Do NOT transcribe overlapping speech,
insert this tag in place of overlapping words.

രേ ാ അതിൽ കൂടുതേലാ മുൻ പധാന സ്പീ െറ (ഏ വും

വ മായി േകൾ ു പധാന ആള െട സംസാരം, ബാ ്െ ഗൗ ്
സ്പീ ർ അ .) ഒരുമി ് സംസാരി ുേ ാൾ, െചറിയ ശബ്ദ ിേലാ,
വലിയ ശബ്ദ ിേലാ ആയാലും ശരി, ഈ ടാഗ് ഉപേയാഗി ണം.
ഓവർലാ ിംഗ് സ്പീ ് (ഒ ി സംസാരി ു സ്പീ ്
ടാൻസ്ൈ കബ് െച രുത്, പകരം ആ ല ് ഈ ടാഗ് െച ണം.)
overlap o

Do not use the overlap tag when there is background speech and you
can clearly hear a single foreground speaker.

പ ാ ല സംഭാഷണം ഉെ ിലും നി ൾ ് ഒരു മുൻ പധാന

സ്പീ െറ ന ായി േകൾ ാൻ കഴിയുെമ ിൽ ഓവർലാ ് ടാഗ്
ഉപേയാഗി രുത്, അവ ടാൻസ്ൈ കബ് െച ണം.

Numbers​ should be spelled out as full words in the way they were

ന റുകൾ അത് പറയു രീതിയിൽ മുഴുവൻ വാ ുകളായി

Numbers എഴുതണം.
അ ൾ

The number '2012' may be said in many different ways

ഉദാഹരണം: '2012'​ എ ത് വ ത സ്തമായ രീതിയിൽ പറയാം.
● 2012 ==> ​ ടാൻസ് കിപ്ഷൻ: ഇരുപേത പ ്
● 2012 ==> ​ ടാൻസ് കിപ്ഷൻ: ര ായിര ിപ ്

Speaker states a lottery number (4 8 6 2)

സ്പീ ർ േലാ റി ന ർ പറയു ു

● 4 8 6 2 ==> TRANSCRIPTION: four eight six two

● 4 8 6 2 ==> ​ ടാൻസ് കിപ്ഷൻ: നാല് എ ് ആറ് ര ്

In Malayalam, there can be a difference between how speakers pronounce

numbers. The standard form is that where the last letter of the word is a
half rounded vowel, but in some dialects it ends with ē sound. Transcribe
both variants as per the dictionary form, using the word-final half rounded

ഇനി ചിലേ ാൾ സ്പീ ർ രേ നാേല എേ ആേറ ര ്

എ ി െനയാണ് സംസാരി ു െത ിൽ (ചില പാേദശിക
ഭാഷാേഭദ ളിൽ ഇ െന ഉ രി ാറു ്) അത് ാൻേഡർഡ് രീതിയിൽ
നിഘ ുവിൽ ഉ ത് േപാെല ടസ്ന്സ്ൈ കബ് െച ണം.

Speaker says “​രേ നാേല എേ ആേറ ര ്’’
TRANSCRIPTION: ​ര ് നാല് എ ് ആറ് ര ്

Speaker reads the time

സ്പീ ർ സമയം പറയു ു.

● now it is 5:30pm. ==> TRANSCRIPTION: now it is five thirty

● ഇേ ാൾ സമയം 5:30 PM​ ആണ്. ==>​ ടാൻസ് കിപ്ഷൻ:
ഇേ ാൾ സമയം അേ മു ത് PM​ ആണ്.

Speaker reads a math equation

സ്പീ ർ ഒരു ഗണിത സമവാക ം പറയു ു.
● 1 + 1 = 2. ==> TRANSCRIPTION: one plus one equals two.

● 1 + 1 = 2. ==>​ ​ ടാൻസ് കിപ്ഷൻ: ഒേ കൂ ണം ഒ ് സമം
ര ്.

Note that if the notation is read in English, they must be written in

Latin script i.e. “ഒ
​ േ plus​ ഒ ് is equal to​ ര ്.”

ഇനി ഗണിത ചി ം ഇം ീഷിൽ ആണ് വായി ു െത ിൽ അവ

ലാ ിൻ സ് കിപ് ിൽ എഴുതണം, അതായത് “ഒേ plus​ ഒ ് is equal
to​ ര ്.”

Speaker uses a currency

സ്പീ ർ കറൻസി ഉപേയാഗി ു ു.

● this item costs ​₹​ 12.99. ==> TRANSCRIPTION: this item costs
twelve rupees ninety-nine paise.
● ഇതിന് വില ₹​ 12.99​ ആണ്. ==> ​ ടാൻസ് കിപ്ഷൻ: ഇതിന്
വില പ ് രൂപയും െതാ ിഒ ത് ൈപസയും ആണ്.

Digits​ (e.g. 1 2 3 4 5 ...) can be used ​ONLY​ when they are joined to a
letter as part of a name without a space.
േപരിെ ഭാഗമായി കൂെട വരു താണ് ന റുകൾ എ ിൽ മാ തേമ
അ ം ഉപേയാഗി ാൻ പാടു .
Refer to web search result for correct spelling for words that should
have digits together.
േപരിെ കൂെട അ ൾ വരു വാ ുകളിൽ സംശയം വ ാൽ
ഗൂഗിളിൽ തിരയുക

Some numbers accompany Latin script as part of the official name.
േപരിെ ഭാഗമായി ലാ ിൻ സ് കിപ് ിെ കൂെട വരു ന റുകൾ,
കാരണം ഇെതാരു േ പാപർ നാമമാണ്.


● iPhone 6S ==> TRANSCRIPTION: iPhone 6S


However, ​when numbers are not joined to the letters, even when
they are part of the official name, they must be spelled out.

ന ർഅ ര േളാെടാ ം േചർ ി ി , അത് ഔേദ ാഗിക

നാമ ിെ ഭാഗമാെണ ിൽ േപാലും, എ ിൽ അവ വാ ുകളിൽ
എഴുതണം, അ ം ഉപേയാഗി രുത്.

● Xbox 360 ==> TRANSCRIPTION: Xbox three sixty

Acronyms and initialisms are words made up of the first letters of

words. They may be pronounced as a word, or each letter may be
pronounced separately. Acronyms and initialisms are spelled using
uppercase​ ​letters ​with no space or period in between.


Incorrect Correct
Acronyms & ശരിയ ത് ശരിയായത്
സംേ പ ൾ/ N.A.S.A NASA
ആദ ാ ര ൾ NASA
കൂ ിേചർ ്ഉ ാ ിയ
പദ ൾ U.S.A. USA


fifa FIFA

unesco UNESCO
ചില വാ ുകളിൽ ചില വാ ുകള െട ആദ െ

അ ര ള പേയാഗി ് ന ൾ അവെയ ചുരു ി വിളി ാറു ്.
അവയ് ് ഒരുദാഹരണമാണ് NASA​. നാസയുെട േപര് നാം ചുരു ി
വിളി ു താണ്. എ ാൽ അവയ് ് ഓേരാ അ ര ിനും
ഓേരാേരാ വാ ുകള െട ആദ െ അ ര ളാണ്. അതുേപാെല
തെ യാണ് FIFA​. ഇനി ഒ ് പറ ാൽ, UNESCO, AM, PM,​ ഇ രം
വാ ുകൾ തീർ യായും ലാ ിൻ സ് കിപ് ിൽ വലിയ അ ര ളിൽ
തെ , ഇടയിൽ വിരാമ ചി ം കൂടാെത, െത കൂടാെത
എഴുേത താണ്.

When a speaker spells a word out, letter by letter, please transcribe

uppercase letters with a space in between.
ഒരു സ്പീ ർ സംസാരി ുേ ാൾ ഓേരാ അ രവും
േവർതിരി ാണ് പറയു െത ിൽ അത് അ െനതെ
Spelled out words ടാൻസ്ൈ കബ് െചേ താണ്. സ്പീ ർ ഇ ിഷിൽആണ് ആ
േവർതിരി പറയു
വാ ിെ അ ര ൾ പറയു െത ിൽ അത് എഴുതുേ ാൾ
പദ ൾ
ഇ ിഷ് വലിയ അ രം തെ ഉപേയാഗി ണം.
മലയാള ിലാെണ ിൽ അ ര ൾ േവർതിരി എഴുതണം.
● TRANSCRIPTION: spelling sequences are transcribed as

isolated uppercase letters. if I spell my name to you, I would
say J O H N.

● ടാൻസ് കിപ്ഷൻ: കാസറേഗാഡ്. കാ സ റ േഗാ ഡ്

If you need to transcribe an email address or website address,

separate the elements as spoken.

ഓഡിേയാ ി ിംഗിൽ ഒരു ഇെമയിൽ ഐഡി അെ ിൽ

െവബ്ൈസ ് നാമം ഉെ ിൽ, അത് എ ായ്േ ാഴും ഇം ീഷ്
അ രമാല (ലാ ിൻ സ് കിപ് ്) ഉപേയാഗി ് എഴുതിയതാണ്. ഇ രം
വാ ുകൾ വരുേ ാൾ അത് പറ രീതിയിൽ തെ എഴുതണം.

Emails / websites
ഇെമയിൽ/െവബ്ൈസ ് Example


Facebook dot com.
● ==> TRANSCRIPTION: John Doe at Gmail
dot TV.
● ==> TRANSCRIPTION: WWW dot Amazon dot

Inappropriate All inappropriate language should be transcribed. If you feel

language uncomfortable typing a particular word, use the unintelligible tag (see
അനുഗുണ ഭാഷ unintelligible tag​) in its place.
േമാശം ഭാഷയിലാണ് സംസാരി ു െത ിലും ടാൻസ്ൈ കബ്

െച ണം. ഒരു പേത ക വാ ് ൈട െച തിൽ നി ൾ ്
ബു ിമു െ ിൽ, unintelligible​ tag​ ഉപേയാഗി ുക.

Transcribe hesitations​ ​and​ ​other​ ​disfluencies​ l​ike ​uh-huh​ and ​hm,​ using
the table below.

ഒഴു ി ാെത ശ ി പറയു സ്പീ ം (hesitatations)

ടാൻസ്ൈ കബ് െച ണം. െപാതുവായി മലയാള ിൽ
ഒഴു ി ാെത സംസാരി ുേ ാൾ ഉപേയാഗി ു വാ ുകള െട
പ ിക താെഴ െകാടു ു ു. ശ ി പറയു സ്പീ ിന് (hesitatations)
പ ികയിലു വാ ുകൾ മാ തം ഉപേയാഗി ുക.

List of Hesitations/Interjections
വേ പം/നിസംഗത എ ിവകള െട പ ിക.

Meaning- അർഥം Acceptable spelling-

Hesitations and സ ീകാര മായ സ്െപ ിംഗ്
വ ാേ പക ള ം/ ശ ാ Agreement ്, ആ, ങാ, ഓ, അം, ഉ ്
പദ ളം സ തം

Disagreement ഉം ഉം, ഏയ്

വിസ തം

Surprise േഹയ്!, ഒഹ്!, െവൗ, ങ്േഹ!

ആ രം

Seeking confirmation േങ, ഓ


Disgust അഹ്, ഇശ്

െവറു ,​് അറ ്

Calling someone എയ്, േടാ, ഊയ്, ഏയ്, കൂയ്,

വിളി പൂയ്
Emphasising ഊം, ഊ
ഊ ി റയുക

Sadness, regret െ ,െ ാ, അേ ാ
​ ഖദം
ദുഃഖം, േ


​ m​, what did I say?
● TRANSCRIPTION: o​ h​, I totally forgot that.
● TRANSCRIPTION: I'd like to watch this movie ​uh​ with ​uh
it's some love story.
● ടാൻസ് കിപ്ഷൻ: േങ, ഞാൻ എ ാ പറെ ?
● ടാൻസ് കിപ്ഷൻ: ​എനി ് ആ പടം കാണണെമ ു ​
.് ആ ഹ്
​ രു േ പതപടമാണ്
അത് ഒ

Spacing - അകലമിടൽ

Malayalam is agglutinative, white space should not be inserted for

compound words or before suffixes.
There is lots of variation in the way that spaces are used in Malayalam,
such as between a base word and suffix, or between words in
compound words. Both of these usages are considered non-standard.
Dialectal variation
Inserting space in these places can also change the meaning of the
and spelling word. When transcribing, think carefully about the meaning of the
variation words and use spaces appropriately so that the text matches the
പാേദശിക words that are heard in the audio.
ഭാഷാേഭദ ള ം ലിപി
േഭദ ളം മലയാളം ഒരു സ ീർ പദസംേയാജക ഭാഷയാണ്. അതിനാൽ തെ ,
സംയു (compound) പദ ൾ ിടയിേലാ, പത യ ൾ ് (suffix)
മുേ ാ അകലം ഇടരുത്.
അടി ാനപദ ിനും പത യ ിനും ഇടയിൽ,
സംയു പദ ൾ ിടയിൽ തുട ി അകലമിടുക എ തിന് ഒരുപാട്
വ തിയാന ൾ മലയാള ിലു ്. ഇവ ര ും ാൻേഡർഡ് അ .
ഇവകൾ ിടയിൽ അകലമിടു ത് ചിലേ ാൾ പദ ള െട
അർ ളിൽ േപാലും മാ ം ഉ ാ ും. ടൻസ്ൈ കബ്

െച േ ാൾ അകലം ഇടൽ െകാ ് അർ വ ത ാസം വരു ി
എ ഉറ ി തിന് േശഷം മാ തേമ അകലം ഇടാവു.

Variation - incorrect Standard -

transcription correct transcription
വ തിയാനം - ശരിയ ാ ാൻേഡർഡ് - ശരിയായ
ടാൻസ് കിപ്ഷൻ ടാൻസ് കിപ്ഷൻ

മലയാള ​ഭാഷ മലയാളഭാഷ

ഒരു ​പെ ഒരുപെ

ആന പുറ ു കയറി ആന റ ു കയറി

ആന റ ് കയറി ആന റ ുകയറി

Sound changes - ശബ്ദ വ തിയാനം.

There are common differences between the way that Malayalam is

spoken and how it is written. It is common for speakers to simplify the
sounds of words during speech, in order to make speech quicker and
easier. This can lead to spelling errors and variations in written
Malayalam. For this transcription project, you are required to type the
standard, dictionary spelling of the word if the spoken word is only
different by one sound. If the spoken word is different from the
standard dictionary spelling by more than one sound, you are required
to transcribe according to how the word is pronounced.

മലയാളഭാഷയിെല ഉ ാരണവും എഴു ും ത ിൽ ചില

വ ത ാസ ൾ ഉ ്. സംസാരം എള വും സുഗമാമാവുമാ ാൻ
ശബ്ദ െള ലഘൂകരി ുക എ ത് െപാതുവായി കാണെ ടു
ഒ ാണ്. ഇത് മലയാള ിെല സ്െപ ി ുകളിൽ വ ത ാസം
ഉ ാ ിേയ ാം. ഈ ടാൻസ് കിപ്ഷൻ െ പാജക് ിൽ നി ൾ
ാൻേഡർഡ് രൂപം അഥവാ നിഘ ു രൂപം ആണ്
ഉപേയാഗിേ ത്. ഉ രി െ വാ ് ാൻേഡർഡ് രൂപ ിൽ
നി ് അഥവാ നിഘ ു രൂപ ിൽ നി ് ഒ ിൽ കൂടുതൽ
ശബ്ദ ളിൽ വ ത ാസം ഉെ ിൽ ഉ രി െ ത് േപാെല

ടൻസ്ൈ കബ് െച ക.

Spoken form Written form

Incorrect Correct Comment
ഭാഷണ രീതി - എഴു ു രീതി - വ ഖ ാനം
ശരിയ ാ ത് ശരിയായത്

ബൂമി ഭൂമി <ബ> is used

ബാരം ഭാരം instead of <ഭ>

ഉപേയാകം ഉപേയാഗം <ക> is used instead

of <ഗ>

Anusvara vs nasal consonant - അനുസ രയും നാസിക

വ ാനാകഷരവും

Sometimes, there is confusion between nasal consonants such as<​ങ>,

<ഞ>, <ണ>, <​ൻ>, <ൺ>, and the nasal marker, anusvara <​◌്>,
which leads to spelling differences. When transcribing, please choose
the correct character, as per dictionary spelling.

ചിലേ ാൾ, <ങ>, <ഞ>, <ണ>, <ൻ>, <ൺ> േപാലു നാസിക

വ ന ൾ, നാസിക അടയാളം, അനുസ ര <◌്> എ ിവ സ്െപ ിംഗ്
വ ത ാസം ഉ ാ ിേയ ാം. ടൻസ്ൈ കബ് െച േ ാൾ ശരിയായ
അ ര അടയാളം െതരെ ടു ുക.

Variation Incorrect spelling Correct spelling

വ തിയാനം ശരിയ ാ ശരിയായ സ്െപ ിംഗ്
സ്െപ ിംഗ്

◌് / ങ ഏറങ ഏറ്

◌് / ഞ കഴി ഞ കഴി ്

◌് / ണ േഗാപാലകൃഷ് േഗാപാലകൃഷണ

◌് / ൻ െജയ്സ് െജയ്സൻ
◌് / ൺ സീസ് സീസൺ

Span Tags (highlighting)

സ്പാൻ ടാഗ് (ഐഡ ഫിേ ഷൻ)
There are two types of tags: span tags (colored) and event tags (gray). Look for
these in the screenshot below.

ര ് തര ിലു ​ വ
ടാഗുകൾ ഉ ്: സ്പാൻ ടാഗുകൾ (കളർ), ഇ ് ടാഗുകൾ
(ചാരനിറം). ചുവെടയു സ് കീൻേഷാ ിൽ ഇവ േനാ ുക.

Event tags are inserted between words, while span tags are used to highlight
words. To undo highlighting tags, select the highlighted word and then click on
untag​. You will not notice any change until you move on, then the highlighting
color will revert to white

​ ദ ൾ ൈഹൈല ് െച ാൻ സ്പാൻ ടാഗുകൾ ഉപേയാഗി ുേ ാൾ
വാ ുകള െട ഇടയിൽ ഇവ ് ടാഗുകൾ േചർ ും. നി ൾ ടാഗുെചയ്തതിന്
േശഷം ടാഗ് നീ ം െച ാേനാ ഇ ാതാ ാേനാ ആ ഗഹി ുകയാെണ ിൽ,
അടയാളെ ടു ിയ വാ ് തിരെ ടു ് Untag​-ൽ ി ുെച ക. ഇത്
െചയ്ത േശഷം, മെ ാ ് തിരെ ടു ുേ ാൾ, വർ മാർ ് െവള
നിറ ിേല ് മാറും.

Span Tag Shortcut How to use it

For non-standard words and spellings that often appear in spoken

language, transcribe what is heard and highlight the word using the
colloquial span tag.
സാധാരണയായി മലയാള ിൽ സംസാരി ുേ ാൾ അപക മായ
വാ ുകൾ ( ാൻേഡർഡ് അ ാ വാ ുകൾ) കയറി വരാറു ,്
അ െനയു വാ ുകൾ എ െനയാേണാ േകൾ ു ത്

അേതപടി ൈട ് െചയ്ത് ഈ ടാഗ് ഉപേയാഗി ് കാണി ുക.

ഉദാ: എ ാ ഉെ ടാ ഉേ , ആ പിെ , അേ ാടാ etc

In general, if a word would not appear in a dictionary or formal written

context (e.g. a newspaper), then the word is likely to be colloquial.
When in doubt, use the colloquial tag rather than leaving a word

സാധാരണയായി നിഘ ുവിൽ ഇ ാ ഒരു വാേ ാ

ഔേദ ാഗികമായി േരഖകളിേലാ ദിനപ ത ളിേലാ കാണാ ഒരു
വാേ ാ ആെണ ിരി െ .അ െനയാെണ ിൽ, അത്
കൂടുതലായും െകാേളാ ിയൽ ആയിരി ും. എ ാൽ സംശയം
േതാ ു ുെവ ിൽ ആ വാ ് ഉേപ ി ു തിലും ന ത് ന ത് ടാഗ്
െച താണ്.

Speaker’s Transcription Full form

pronunciation ടാൻസ് കിപ്ഷൻ പൂർ രൂപം
ഭാഷകെ ഉ ാരണം

െയ ം െയ ം യ ം

െകാട െകാട കുട

ചിറി ചിറി ചു ്

മ മ മുകളിൽ

Use this to highlight any words that were accidentally mispronounced.

Spell the word in the ​normal​ (correct) way, then highlight it. There is
no need to use this if someone has an accent — it should only be used
mispronunciat when the person accidentally said something the wrong way. When in
ion doubt ask yourself "would this person pronounce the word differently if
I asked them to repeat themselves?" If they would, it can be classified
as a mispronunciation.
അവിചാരിതമായി െത ി പറ ഏതു വാ ും ൈഹൈല ്

െച തിന് ഇത് ഉപേയാഗി ുക. ഒരാള െട ൈശലിയിൽ അയാൾ
ആ വാ ് ഉപേയാഗി ു ത് അ െനയാെണ ിൽ
ടാഗ്െചേ തി . എ ാൽ അബ വശാൽ ഒരു വാ ് അെ ിൽ
ഒരു വാക ം െത ായി പറ ാൽ അത് ടാഗ് െച ണം. എെ ിലും
സംശയം േതാ ിയാൽ അയാൾ ആ വാ ് ശരിയായി തെ യാേണാ
പറ ത് എ ് നേ ാടു തെ ഒ ് േചാദി ണം. ഒരുപേ റിപീ ്
െചയ്തു േചാദി ുേ ാൾ അേ ഹം അ െന തെ ആയിരി ുേമാ
വീ ും പറയു ത് എ ് ഒ ് ആേലാചി തിനുേശഷം,
ഉപേയാഗി ണം.


You hear “what time are you lea​b​ing?”

TRANSCRIPTION: what time are you ​leaving​?

“​എേ ാഴാണ് നി ൾ േപാവുണത്”

TRANSCRIPTION​:​ എേ ാഴാണ് നി ​ പാവു
ൾേ ത്?
Tagging non-speech noises and events

സംഭാഷണമ ാ ശബ്ദ ള ം സംഭവ ളം
ടാഗുെച ു
These are listed in order of how often they are likely to be used. The more common
tags are listed at the top of the table.

അവ സാധാരണയായി എ ത തവണ ഉപേയാഗി ​

െ ടു ു എ തിെ
അടി ാന ിലാണ് അവ പ ികെ ടു ിയിരി ു ത്. സാധാരണ കൂടുതലായി
ഉപേയാഗി ു ടാഗുകൾ പ ികയുെട മുകളിൽ േരഖെ ടു ിയിരി ു ു.

Event Tag Shortcut How to use it

Any pause of at least one second without speech should be tagged with
the ​no speech​ tag.

Non-speech noises which are not within 1 second of speech do not need
to be tagged.

ഒരു െസ ൻഡിലധികം ൈദർഘ മു ഓഡിേയായിൽ സംസാരേമാ

സംഭാഷ ഇെ ിൽ, ​അതിെന no speech​ ടാഗുെച ക.
സംസാര ിേലാ മനുഷ സംഭാഷണ ിെ ശബ്ദമിെ ിൽ, ​അത്
ടാഗുെചേ ആവശ മി .

no speech
You hear some speech punctuated by a cough, followed by a 1
second pause, and then a loud noise:

TRANSCRIPTION: I ever heard of him.

നി ൾ ഒരു ചുമ െകാ ു കുറ ് സംസാരം േകൾ ു ു,
േശഷം ഒരു വലിയ ശബ്ദവും, കുറ േനരം സ്പീ ് ഒ ും തെ

േകൾ ു ി

ടാൻസ് കിപ്ഷൻ: ഞാൻ ഒരി ലും അയാെള കുറിച്

േക ി ി

/!\ If an entire utterance does not contain any speech, it should be

transcribed with one tag ONLY: ​no speech tag. ​Even if it contains
other sounds, you must ignore them if there is no speech at all.

/!\ ഒ
​ രു ഓഡിേയാ ി ിൽ സംസാരം ഒ ുമി എ ിൽ no speech tag
എ ഒേര ഒരു ടാഗ് മാ തം ഉപേയാഗി ് ടാഗ് െച ക.
സംസാരമി ാ ഓഡിേയാ ി ിൽ, പെ മ ് ശബ്ദ ൾ
ഉെ ിൽ അവ അവഗണി ുക.


The whole utterance contains someone crying, loud noises or

instrumental music:

You must ignore all sounds if there is no speech in the entire


ഒരു ഓഡിേയാ ി ിൽ മുഴുവൻ കര ിൽ, േഘാരശബ്ദം അെ ിൽ

വാേദ ാപകരണ സംഗീതം േകൾ ു ു.


ഓഡിേയാ ി ിൽ ഉ സംസാരം അ ാ എ ാ ശബ്ദ ളം

തീർ യായും അവഗണി ുക.
Use for all sounds made by a foreground speaker which is not speech
(e.g. breath, cough, lipsmack, and laughing).

Only use this tag if:

- the volume is at or near the volume of the surrounding
foreground speech.
- AND the sound occurs within one second of speech.
spk മനുഷ ഭാഷയുെട വാ ുകളി ാെത, സ്പീ റിൽ നി ും (ശ സനം,
ചുമ, ചു ിെ ശബ്ദം, ചിരി) േകൾ ാൻ കഴിയു ശബ്ദ ൾ
വ ാൽ ഈ ടാഗ് ഉപേയാഗി ുക. ഈ ശബ്ദ ൾ സംഭാഷണ
ശബ്ദ ിന് അടു ായിരി ുേ ാേളാ, ഒ മായിരി ുേ ാേളാ
മാ തം ഈ ടാഗ് ഉപേയാഗി ുക.

Use for music (without lyrics) that does not overlap with foreground
speech. Singing from the foreground speaker should be tagged as

, not as .

Only use this tag if:

- the volume is at or near the volume of the surrounding
foreground speech.
- AND the sound occurs within one second of speech.

പധാന ഭാഷണവുമായി ഓവർലാ ് (ഒ ി വരിക) െച ാ

m സംഗീത ശബ്ദ ൾ ് (പാ ിെ വരികൾ ഇ ാ ) ഈ ടാഗ്
ഉപേയാഗി ുക.

പധാന ഭാഷകൻ (foreground speaker​) പാ ് പാടു ു എ ിൽ (കവിത,

മു ദാവാക ൾ, ഭജനം, മ ജപ ൾ, വിശു ഗ
പാരായണ ൾ ഇവെയാെ പാ ിെ ഗണ ിൽ െപടു ു.)
ടാഗ് ഉപേയാഗി ുക. ടാഗ്
ഉപേയാഗി രുത്.

ഈ താെഴ പറയു സ ർഭ ളിൽ മാ തം ഉപേയാഗി ുക

- ​ ു മു
ച േഫാർെ ഗൗ ് സംഭാഷണ ിെ
േവാളിയ ിനടുേ ാ, സമീപേ ാ ആണ് േവാളിയം എ ിൽ
- സംഗീത ശബ്ദം ഒരു െസക ൽ താെഴയാെണ ിൽ.

Use for any non-speaker noise that occurs at the same volume as
foreground speech.
Do ​not​ tag background noise that is at a lower volume than speech.

Only use this tag if:

- the volume is at or near the volume of the surrounding
foreground speech.
- AND the sound occurs within one second of speech.

പധാന ഭാഷണ ിെ അേത ഒ ിൽ വരു സ്പീ ർ

അ ാ വയുെട ശബ്ദ ൾ ് ഈ ടാഗ് ഉപേയാഗി ുക.
n ഭാഷണേ ാൾ താഴ് ശബ്ദ ിലു പ ാ ല
noise ശബ്ദ ൾ ് ഈ ടാഗുെച രുത്

- ചു മു േഫാർെ ഗൗ ് സംഭാഷണ ിെ
േവാളിയ ിനടുേ ാ, സമീപേ ാ ആണ് േവാളിയം
എ ിൽ
- സംഗീത ശബ്ദം ഒരു െസക ൽ താെഴയാെണ ിൽ

മാ തം ഈ ടാഗ് ഉപേയാഗി ുക.

Insert the speaker change tag at​ any point that the foreground
speaker changes​. This may be at the beginning of an utterance or in
the middle of an utterance.
Speaker change tags only need to be used for ​speech​ — tagged noises
from a different speaker do not require a speaker change tag.
ഒരു utteranceയുെട ആദ േമാ ഇടയിേലാ എവിെട ആയാലും
പധാനമായും സംസാരി ു വ ​ ാറി
ി (foreground speaker). ​ മ
മെ ാരാളായാൽ ഈ ടാഗ്ഉപേയാഗി ​ രു സ്പീ
ണം. ഒ റിൽ നി ും
സംസാരം മാറുേ ാൾ മാ തേമ ടാഗ് ഉപേയാഗി ാൻ പാടു .

സംസാരമാ ാ ശബ്ദ ൾ മാ തമാണ് മാറു െത ിൽ ഈ ടാഗ്
ഉപേയാഗിേ തി .

Use when a word gets cut off at the end of an utterance because the
computer has not cut up the audio correctly. This is different from a
fragment (where the person stops talking part way through a word). In
a truncation, the recording has cut someone off while they were saying
a word. Therefore, truncations only occur at the ​start or end of an

നമു ് ലഭി ു ശബ്ദ ശീലുകൾ ക റാണ് മുറി ു ത്,

അേ ാൾ സ ാഭാവികമായും ചില വാ ുകള െട ആദ ം ആദ േമാ
അ േമാ മുറി ു േപാകാറു ്. കാരണം അത് അപൂർ മായ ഒരു
വാക ം ആയതുെകാ പകരം െറേ ാർഡിങ് മുറി ത് മൂലം
വാ ുകൾ നഷ്ടെ താണ്. അതുെകാ ് ഈ ടാഗ് വരു ത്
വാക ിന് ആദ േമാ അവസാനമായിരി ും.

t When you hear a truncation at the ​end of an utterance​ and you can
truncation transcribe the word with certainty, write out the truncated word in full

followed by the tag. When you hear a truncation at the

start of an utterance​, insert the tag only.

ഒരു വാക ം അവസാനി ുേ ാൾ ആ വാ ് നി ൾ ്

മന ിലാ ാൻ കഴിയും എ ിൽ ആ വാ ് പൂർ മായും

എഴുതിയതിന് േശഷം ടാഗ് ഉപേയാഗി ുക.

ഒരു utterance ആരംഭി േ ാൾ “ചിലേ ാൾ” എ വാ ിെ “ചില”
മാ തേമ കി ിയു എ ിൽ ഇ െന െച ക.
UTTERANCE 1:​ എെ ിലും കാരണവശാൽ ചിലേ ാൾ

UTTERANCE 2​: ​ െ ാരുവഴി തുറേ

മ ും

If you are unable to tell what the truncated word is at the end of an

utterance, simply insert the tag in place of the word

followed by the tag.

എെ ിലും കാരണവ ാൽ (വാ ് നി ൾ ു മനസിലായിെ ിൽ)

ഉപേയാഗി ുക, അതിനു േശഷം

ഉപേയാഗി ുക.

മന ിലാവാ ഒരു വാ ് ടേ ഷൻ സംഭവി .

UTTERANCE 1: ​എെ ിലും കാരണവശാൽ

UTTERANCE 2:​ മെ ാരു വഴി

തുറേ ും.

If you come across ​user-identifiable information​ (UII), do not

transcribe those words, and insert this tag instead. The purpose is not
to disclose a user's private information.
i UII includes things like ​full​ names, usernames, gamertags, street
uii addresses, telephone numbers, credit card numbers, social security
numbers, etc.
സ കാര തയ് ായി, ഉപേയാ ൃ-തിരി റിയൽ വിവര ൾ ​(UII)

അട ിയിരി ു ഫയലുകൾ നി ൾ ് കി കയാെണ ിൽ
ടാൻസ്ൈ കബു െച രുത്.
UII​ എ തിൽ പൂർ മായ േപരുകൾ, ഉപേയാ ൃനാമ ൾ,
െഗയിമർടാഗുകൾ, സ് ടീ ് വിലാസ ൾ, െടലിേഫാൺ ന റുകൾ,
െ കഡി ് കാർഡ് ന റുകൾ, സാമൂഹിക സുര ാ ന റുകൾ
തുട ിയവ ഉൾെ ടു ു. അതിനാൽ ഈ ഓഡിേയായിൽ
എവിെടെയ ിലും ഉെ ിൽ UII ​ ഈ ടാഗ് തിരെ ടു ുക. (ആ
വാക ിെല ഒരു വാ ് േപാലും ൈട ് െച രുത്, പകരം UII ടാഗ്
മാ തം നൽകുക.)

There are exceptions. You do ​not​ need to mark UII if the information is
public, e.g.:

● It is a news broadcast, TV show, TV or Radio program

● It is clearly a commercial promotion (e.g. an advertisement) with
no expectation of privacy
● It is a public blogger broadcast
● The full name is of a well-known public figure (singer, writer,
politician, athlete, etc.). A well-known local public figure is also
not marked as UII (e.g. a well-known teacher)
● It is not a full name (you hear either the first name or the

താെഴപറയു ചില കാര ളിൽ UII​ എ ് അടയാളെ ടുേ

ആവശ മി :
● വാർ ാ പേ പണം
● വ മായി സ കാര ത പതീ ി ാെത ഒരു വാണിജ പചാരം
(ഉദാഹരണം ഒരു പരസ ം)
● ഒരു അറിയെ ടു െപാതുമുഖ ിെ പൂർ േപര്.
/!\ Please use caution, full names mentioned in raffles/lucky
draws should always be marked as UII.

/!\ ഭ
​ ാഗ ുറിയിൽ/ േലാ റിയിൽ ഒെ പതിപാദി ു മുഴുവൻ
േപരുകൾ ് UII​ ടാഗ് െച ണം.
We have already removed most files that contain UII so you should
not need to use this tag often.

UII ഉൾെ ടു ഭൂരിഭാഗം ഫയലുകൾ േനരെ തെ

ഒഴിവാ ിയതിനാൽ ഇത് ഇടയ് ിെട ഉപേയാഗിേ ആവശ മി .

ചി ന ൾ


A sentence is a grammatically complete unit. A sentence will usually, but

not always, contain a subject (e.g. "the cat") and a verb (e.g. "sat").
Examples of grammatically complete sentences which do not have a
subject and verb include answers to questions (e.g. "yes." and "no.") and
exclamations ("what!" and "really?").

ഒരു വാചകം വ ാകരണപരമായി പൂർ മായ ഒരു യൂണി ് ആണ്.

​ രു കർ
എ ായ്േ ാഴും, ഒ ാവും ഒരു കിയയും അട ിയിരി ും
on കർ ാവും കിയയും ഇ ാ വ ാകരണമു വാക ൾ, അെത, അ
േപാലു , േചാദ ള െട ഉ ര ൾ ആയിരി ാം, അെ ിൽ
ചി ൾ ആ ര ചിന്ഹ ൾ ആയിരി ാം. (ശരി ും!, എ !് )


● ടാൻസ് കിപ്ഷൻ: ഇേ ാൾ സുഗമമായി േപാകു ു. എനി ്

കൂടുതൽ െച ാൻ കഴിയുേമാ? പ ​ രുപെ
ം, ഒ .
At the end of each sentence, use either a period (.) for statements, a
question mark (?) for questions, or an exclamation mark (!) for
exclamations. Do not use punctuation combinations ("?!", "!!!", "..."). Do
not use hyphens or quotation marks to indicate quoted or mentioned
speech. No other punctuation (such as : ;) should be used.

ഓേരാ വാക ിെ യും അവസാനം utteranceകൾ ായി (.)

ഉപേയാഗി ുക, േചാദ ൾ ായി ഒരു േചാദ ചി ം (?), അെ ിൽ
ആ ര ചി ൾ ായു ആ ര ചി ം (!) ഉപേയാഗി ുക.
ചി ന േകാ ിേനഷനുകൾ ഉപേയാഗി രുത് ("?!", "!!!", "..."). ഉ രി
അെ ിൽ സൂചി ി സംഭാഷണം സൂചി ി ാൻ ൈഹഫനുകേളാ
ഉ രണി അടയാള േളാ ഉപേയാഗി രുത്. മ ് വിരാമചി ൾ ഒ ും
തെ ഉപേയാഗി രുത്.

Only place punctuation at the end of an utterance if the end of the

utterance is also the end of a sentence. If the speaker continues the same
sentence into the next utterance, put the punctuation wherever it
naturally falls in the speech.

ത ഓഡിേയാ ി ിൽ പൂർ ിയാവാ സംസാര ശകല ൾ

അവസാനി ാൽ ഫുൾേ ാ ് െകാടു രുത്.

പകരം ആ വാക ം എേ ാൾഅവസാനി ു ുേവാ അേ ാൾ മാ തേമ(.)

ചി ം െകാടു ാവൂ, ഈചി ിെ കാര ിൽ മാ തമ ഏതു
ചി ൾ ആയാലും സ ാഭാവികമായി അവ അർഹി ു ാന ു
മാ തേമ ഇടാവൂ.

See the description of an ​utterance​.

ഒരു ഭാഷണ ിെ വിശദീകരണം കാണുക.

● ടാൻസ് കിപ്ഷൻ:
UTT 1:​ ഈ വർഷം വിജയി ുക!​ നീ എ ് ചി ി ു ു
UTT 2:​ വിേനാദിെന ുറി ാേണാ?​ അവർ അവസാനം അ െന

See the "​incomplete​" tag section below for instructions about sentence
fragments which are not grammatically complete.

വ ാകരണപരമ ാ അപൂർണമായ വാക ൾ ് േവ ി താെഴ

െകാടു ിരി ു "incomplete"​ ടാഗ് മാർ നിർേ ശ ൾ വായി ുക.

Insert the incomplete tag when a foreground speaker begins a sentence

and is either ​(a)​ interrupted by a new speaker, or ​(b)​ begins a new
sentence before the first grammatically complete sentence is finished.

സംസാരി െകാ ിരി ു വ ി സംസാരം തുട ിയ സമയ ് തെ

മെ ാരാൾ വ ് തട െ ടു ുകേയാ അെ ിൽ, വ ാകരണപരമായി ആ
വാക ം പൂർ ിയാ ു തിന് മു ് അടു വാക ം ആരംഭി ുകേയാ
െചയ്താൽ ഈ ടാഗ് ഉപേയാഗി ണം.

The tag should not be used to indicate that a sentence is continuing into a
second utterance.

ഒരു വാക ം ര ാമെ ഉ ാരണ ിൽ തുടരു തായി സൂചി ി ു തിനായി

​x ടാഗ് ഉപേയാഗി രുത്.


● TRANSCRIPTION: ​നിന റിയാേമാ അവൻ എ ാ െചയ്തെത ്

അത് പുതിയത് േമടിേ ാ?

● TRANSCRIPTION: ​അത് എനി ് പധാനെ താെണ ിൽ

അവർ എ ാണ് പറയു െത ് എനി റിയി .

You ​do not ​need to use the incomplete tag when the speaker restarts or
repeats a single word.

സ്പീ ർ ഒരു വാ ് പുനരാരംഭി ുകേയാ ആവർ ി ുകേയാ

െചയ്താൽ ഈ ടാഗ് ഉപേയാഗിേ തി .

Use commas (,) in two situations only:

● For lists of items ("I ate two apples, three oranges, and a
banana.") and sequences of adjectives ("he was a big, red haired,
evil man.")

● For introductory phrases ("so I was thinking, how do you do it?",

"at the end of the day, what matters is your health.").

When unsure whether to use a comma, err on the side of ​not​ using one.

േകാമ ര ് സ ർഭ ളിൽ മാ തേമ േകാമ ഉപേയാഗി ുകയു :

● ഇന ള െട ലി കൾ ് ("ര ് ആ ിൾ, ​മൂ ് ഓറ ,് ​ഒരു

വാഴ)", "​നാമവിേശഷണ ിെ േ ശണികൾ" ("അവൻ ഒരു വലിയ
ചുവ ​ ുഷ്ടനായ മനുഷ നായിരു ു")
മുടിയായിരു ു, ദ

● മലയാള ിൽ ബാധകമ .

േകാമ, ഇടേണാ േവ േയാ എ സേ ഹ ിലാണ് എ ിൽ, േകാമ

ഇടു താണ് ഏ വും ന ത്.

വിഭവ ൾ
● English Punctuation Rules
● Capitalization in English
● ശബ്ദ താരാവലി: മലയാളം നിഘ ു. - ശീകേണഠശ രം ജീ. പതമനാഭപി .
●​ (online dictionary)

