Professional Documents
Culture Documents
17.0 Hindi Guideline
17.0 Hindi Guideline
Confidential Page 1 of 26
1. से#म% टेशन
से#म% टेशन एक ऑ,डयो फ़ाइल म% हर 6पीकर का "टाइम 6टै ि;पंग" करता है । ऑ,डयो
फ़ाइल होनेवालA बातचीत के DवEन Fकार, उHचारण और वाKयांशL के बीच भेद करने
के Oलए से#म% टेशन आवQयक है । इसके अलावा, से#म% टेशन से SाT6Uइब करनेवाले
Vकसी भी भाषण को छोटे छोटे Yह6सL म% सन
ु कर आसानी से SाT6Uइब कर सकता ह[।
Confidential Page 2 of 26
च`ु पी/वाइट नाइस के अलावा, ऑ,डयो फ़ाइल म% आमतौर पर Eन;नOलlखत DवEन
Fकार होते ह[::
Confidential Page 3 of 26
● Start time - ‘सेकंaस.OमलAसेकTaस’ फ़ॉमxट म% से#म% ट का टाइम6टै ;प Fारं भ कर% ।
● End time - से#म% ट का टाइम6टै ;प अंत भी ‘सेकंaस.OमलAसेकTaस’ फ़ॉमxट म% भरे ।
● Segment ID - एक नंबर जो yवOशzट bप से से#म% ट को पहचानती है । जैसे UUIDs.
● Loudness level - तीन DवEन 6तरL म% से एक का उपयोग कर% : Loud (जोर), Normal
(सामाTय) या Quiet (शांत)। यYद आप 6तर को नहAं समझते तो, “Normal” का
उपयोग कर% ।
● Primary Sound Type - पांच DवEन FकारL म% से: Speech, Babble, Music, Noise,
Overlap, जो बैठता है उसे चन
ु %.
इसके अEत|रKत, केवल भाषण से#म% ट के Oलए, Eन;नOलlखत अंश को भी भरा जाना चाYहए
● Language code - एक फ़ॉमxट कोड जो से#म% ट म% बोलA जाने वालA भाषा के दो-अ}र
ISO-639-1 भाषा कोड के साथ ISO-3166 दे श कोड के अ~फा -2 कोड को जोड़ती है ।
● Speaker ID - यह हर 6पीकर के Oलए एक yवOशzट पहचान संeया है । हम इसके Oलए
UUID का उपयोग कर% गे। 6पीकर आईडी परू े फाइल म% एक हA होनी चाYहए।
● Transcription - एक भाषण का शािrदक bप
2. 5ा6स789शन आचरण
हर शrद जैसे बोला गया है वैसे हA Oलखा जाना चाYहए - Vकसी भी अ6पzट उHचारण,
परू क शrद, गलत श€
ु आत या अTय DवTया•मक yववरण सYहत। जब तक अTयथा
EनYद‚ zट न हो, शrदावलA हA सामाTय SाTसVU`शन मोड है ।
Confidential Page 4 of 26
SांसVU`शन म% ऊपरA और Eनचले अ}र, एपो6Sफ^, कॉमा, yव6मयाYदबोधक
iच„न, हाइफ़न, अवiध, FQना iच„न, |रKत 6थान और सीOमत yवशेष माक‚-अप
iचTहL को हA शाOमल होनी चाYहए।
• "मेरे पास $100 है ।" = "मेरे पास सौ डॉलर है ।"/"मेरे पास डॉलर सौ है ।”
• “वह ब$त अ'ा/अजीब था” = “वह ब$त अ'ा
<lang:English>slash</lang:English> अजीब था।”
Confidential Page 5 of 26
<> Angle खल
ु ने और बंद करने क^ टै ग से पहले और बाद म% ,
brackets
उदा: <initial>
Confidential Page 6 of 26
जब तक Oलlखत सं6करण म% Vकसी भी उHचारण 6वीकार नहAं Vकया जाता है ,
तब तक "मानक" 6पेOलंग के साथ SाT6Uइब कर% ।
• "तम
ु जाईये, मै दौड़ करता है ।” = "तम
ु जाईये, मै दौड़ करता है ।"
• "मझ
ु े आने के बाद हA हुआ है ।" = "मझ
ु े आने के बाद हA हुआ है ।"
Confidential Page 7 of 26
SाTसVU`शन परू ा होने के बाद, एक बार सभी SाTसVU`शन फाइल को 6पेल-चेक
करे । जब कोई भी शrद या नाम क^ 6पेOलंग के बारे म% संदेह हो, तो शrदकोश या
इंटरनेट पर प|रशीलन करे । गाने, मव
ू ी, टAवी शो, ‰ांड आYद का सहA तरAके म%
SाT6Uइब करने के Oलए, इंटरनेट पर Vकसी भी yवQवसनीय वेबसाइट का उपयोग
कर% ।
2.3 का?पटलैज़ेशन
करना चािहए। उदाहरण के िलए, वाFय के पहले श*द को कै िपटल करना, लोग,
या Iांड का उपयुK नाम (उदा: Jeff Bezos, France, iPad, eBay), साथ ही
Confidential Page 8 of 26
SाTसVU`शन म% अपने आप को संŠ}`त bप मत लानी चाYहए। जैसे वो उHचारण
Vकया जाता है , हमेशा वैसा हA इसका परू ा शrद का उHचारण को लेनी चाYहए।
स;मान पव
ू क
‚ उपसग‚ जैसे Ms, Mrs, Mr, और Mx, जो Vकसी oयिKत के नाम से
पहले आते ह[, उनको संŠ}`त नहAं, बि~क शrद माना जाता है । वैसा उनका
उपयोग करते समय, उTह% Ms, Mrs, Mr, और Mx के bप म% हA SाT6Uइब कर% ।
हालांVक, जब Vकसी को बल
ु ाते वKत ये इ6तेमाल Vकया जाता है (बाद म% नाम के
cबना), तो उTह% पण
ू ‚ bप म% हA SाT6Uइब कर% (जैसे: mister या missus)।
Confidential Page 9 of 26
2.5 संVW9त 7कया गया शOद (Contractions)
आमतौर पर संŠ}`त Vकए जाने वाले शrदL का उHचारण जैसा भी होता है , वैसे हA
उनको SाT6Uइब करना चाYहए (उदा: isn't, where's, y'al)। 6पेOलंग म%
एपो6Sफ^ का उपयोग कर% ।
• gimme
• gonna
• gotta
• lemme
• wanna
• watcha
• kinda
6पीकर िजन अ}रL को अलग अलग करके उHचारण करता है , उनके बीच म% एक
एक जगह रखते हुए बड़े अ}रL म% Oलख के SाT6Uइब कर% ।
2.7. नंबर
Confidential Page 10 of 26
6पीकर एक संeया क^ उHचारण जैसा करता है , उसी तरह, उTह% संeयाओं के
बजाय, पण
ू ‚ 6पेOलंग म% Oलख%। यह Eनयम का,ड‚नल (उदा: 0, 215) और आडŒनल
संeयाओं (उदा: 1 व% , 5 व% ) दोनL पर लागू होगा।
• "5" = "पांच"
• "5 व% " = "पांचव% "
• "11 व% पाट‚ " = "#यारव% <lang:English>part</lang:English>"
• "306" = "तीन सौ छे ", "तीन शT
ू य छे ", जैसा भी 6पीकर hवारा बताई गई।
• "109.4 FM रlखये।" = "<lang:English>one oh nine point four
FM</lang:English> रlखये।"
• "नई Yद~लA 110049" = "नई Yद~लA, <lang:English>one one zero zero four
nine</lang:English>"
• "twenty-five"
• "three hundred"
• "five hundred fifty-two"
• "nineteen forty-five"
Confidential Page 11 of 26
केवल एपो6Sफ^, कामा, yव6मयाYदबोधक iच„न, हाइफ़न, पी|रयड, और FQन
iच„नL का उपयोग, yवराम iच„न के bप म% Vकया जाना चाYहए। अTय अंqेजी
yवराम iच„न (जैसे: अध‚yवराम और कोटे शन) का उपयोग न कर% ।
पण
ू ‚ वाKय के अंत म% हA पी|रयड (।) का उपयोग कर% ।
Periods
• म[ आज घर जा रहा हूं।
• वो अEत सT
ु दर है !
• पता नहAं वो Yदन कब आने वालA है !
Confidential Page 12 of 26
वाKय के बीच म% आने वालA yवराम iच„न
Confidential Page 13 of 26
एक लंबा वाKय को तोड़ने के Oलए अ~पyवराम का उपयोग
कर% । इससे पाठकL को समझने म% आसानी होती है ।
अ~पyवराम का उपयोग म% कुछ सझ
ु ाव यहां Yदए गए ह[:
• सच
ू ीबhध तीन या अiधक yवषय को अलग करने के Oलए,
धारावाYहक (ऑKसफ़ोड‚) अ~पyवराम का उपयोग कर%
(यानी, अंEतम दो व6तओ
ु ं के संयोजन [conjunction] से
जोड़ने से पहले):
o वे केवल कूदना, तैरना और भागना जानते ह[।
• जब Vकसी को सीधे से बल
ु ाया जाता है :
o Vकरण, Dयान से सन
ु ो।
Commas
o म[ बात नहAं Vकया, OमtL, रोया।
Confidential Page 14 of 26
o उTहLने जो Vकया, वा6तव म% , Vकसी ने भी नहAं
Vकया था।
o एक अHछˆ छूट, yपछले वष‚ क^ तरह, इस बार भी दA
जाएगी।
Confidential Page 15 of 26
शrदL के बीच म% आने वालA yवराम iच„न
Confidential Page 16 of 26
भाषा के मानक (ऑथ‡qाVफ़क) EनयमL के अनस
ु ार हाइफ़न
का उपयोग कर% । यYद आप अEनिQचत ह[ Vक Vकसी
स;मीOलत (compound) शrद म% हाइफ़न लगाना है या
नहAं, तो yवQवसनीय शrदकोश या इंटरनेट वेबसइट म% दे खे
।
• a-line
• d-day
Hyphens
• ex-boyfriend, ex-drummer
• extra-loud
• self-aware
• t-shirt
• u-turn
• v-neck
• x-ray
Confidential Page 17 of 26
अंqेजी के अलावा Vकसी अTय भाषा को SांसVU`ट करते समय, उस भाषा के
yवराम iच„न और EनयमL का पालन कर% । 6पीकर एक सेगम% ट के बीच म% एक
yवदे शी भाषा म% बदल सकता है । Vफर, yवदे शी yवराम iच„नL का उपयोग yवदे शी
भाषा के टै ग के बीच म% Vकया जाना चाYहए: <lang:Foreign></lang:Foreign>
नोट: कुछ ?वराम Zच[न] का उपयोग एक ?वशेष शैल_ म% वह_ शOद के Eलए
उपयोग 7कया जा सकता है । इन अंतर] को आमतौर पर cुdटयाँ नह_ं माना
जायेगा।
Confidential Page 18 of 26
• "I work for IBM." = "I work for <initial>IBM</initial>."
• "I like ZZ Top." = "I like <initial>ZZ</initial> Top."
• "http://www.gmail.com/" = "<initial>HTTP</initial> colon slash
slash <initial>WWW</initial> dot gmail dot com."
केवल उपनाम का संकेत करने वाले अ}रL के Oलए पी|रयड(.) का उपयोग कर%
(जैसे E. B. White, George W. Bush)। अथवा, Oसफ‚ उपनाम के Oलए पी|रयड क^
आवQयकता नहAं है ।
Confidential Page 19 of 26
• "I'll be taking my S (cough) AT next month." = "I'll be taking my
[cough] <initial>SAT</initial> next month."
dट9पiणयाँ:
कुछ बार अटके हुए भाषण और दोहराव को SाT6Uइब करने के Oलए, से#म% ट को
कुछ और बार को सन
ु ने के बाद, उसके अनस
ु ार का अपना सव‚•ेzठ Fयास कर% ।
• "घर के जाने.. जाने.. जाने वालA रा6ता म% हA था।" = "घर के जाने जाने
जानेवालA रा6ता म% हA था।"
• "आप वो गी… गाना ब... बंद करो।" = "आप वो गी~ गाना ब~ बंद करो।"
Confidential Page 20 of 26
• "न… न… नहAं। स.ू .. सरू ज तब नहAं आया हुआ था।” = "न~ न~ नहAं। स~ू सरू ज
तब नहAं आया हुआ था।"
कुछ भाषा म% 6पीकर hवारा उपयोग Vकए जाने वाले परू क शrद:
परू क शrद
बोलA जाने वालA भाषा के आधार पर परू क शrद OभTन हो सकते ह[।
Confidential Page 21 of 26
6पीकर के उHचारण के परू A आधार पर, परू क शOद] कm CपेEलंग म% बदलाव न कर% ।
यYद 6पीकर परू क शrद या DवEनयL का उपयोग करता है जो सच
ू ी म% नहAं ह[, तो
आपको उनके उHचारण के सबसे Eनकट रहने वालA परू क शrद को चन
ु ना चाYहए।
समझने या SाT6Uइब करने म% मिु Qकल या असंभव Yदखने वालA (जब 6पीकर
बहुत धीरे से बोलता है या कोई और आवाज़ बहुत तेज़ होती है ) भाषणL को इंiगत
करने के Oलए डबल ‰ैकेट (()) का उपयोग करना चाYहए। डबल ‰ैकेट के आगे और
बाद म% एक |रKत 6थान Yदया जाना चाYहए, लेVकन उनके बीच नहAं।
• "कल सब
ु ह ???? Vकया।" = "कल सब
ु ह (()) Vकया।"
• "इसका ????? Fचार हो रहा है ।" = "इसका ((yवपरAत)) Fचार हो रहा है ।"
• "Vफर सय
ू ा‚6त आ ????." = "Vफर सय
ू ा‚6त आ ((गया))।"
जब कोई 6पीकर बीच म% से YहंदA से Vकसी अTय भाषा को बदलता है , तो बदले हुए
शrद क^ श€
ु आत म% <lang:Foreign> टै ग और उसक^ अंत म% </lang:Foreign>
टै ग का उपयोग कर% । जब Vकसी से#म% ट म% एक ओपEनंग <lang:Foreign> टै ग
होता है , तो उसका अंत टै ग </lang:Foreign> भी होना चाYहए।
Confidential Page 22 of 26
यYद आप Eन6संदेह 6पीकर के बीच म% बोलA जाने वालA Vकसी अTय भाषा क^
पहचान करने म% स}म है , तो "Foreign" के बजाय उस भाषा का नाम इस टै ग म%
रखा जा सकता है । और इस भाषा के नाम का पहला अ}र कैyपटल लेटर बनाएं।
• "म[ उनको बोल दे ता हूँ que ya no la quiero." = "म[ उनको बोल दे ता हूँ,
<lang:Foreign>(())</lang:Foreign>."
• "उसी वष‚ एक सन
ु ामी आ गया था।" = "उसी वष‚ एक सन
ु ामी आ गया था।"
Confidential Page 23 of 26
• "परA}ा अगले स`ताह को शेaयल
ू Vकया गया ह[।" = "परA}ा अगले स`ताह को
शेaयल
ू Vकया गया ह[।"
[cry] मानव मख
ु र DवEन रोना/दःु ख
[laugh] मानव मख
ु र DवEन हं सी
Confidential Page 24 of 26
बैकqाउं ड म% होनेवालA दस
ू रL के
[bg-speech] अTय DवEनयाँ शrद जब 6पीकर नहAं बोल रहा
है
Confidential Page 25 of 26
हालाँVक, इस गैर-भाषण टै ग को Vकसी भी शrद के बीच म% न डाल%। जब Vकसी
शrद के बीच म% गैर-भाषण DवEन होती, तो उस शrद से पहले संबंiधत गैर-भाषण
टै ग लगाएं।
यYद गैर-भाषण शोर कई बार लगातार आता है , तो इसे केवल एक बार इंiगत कर% ।
भाषण के बीच जब कुछ समय तक कोई आवाज़ नहAं होता, उस Yह6से पर [no-
speech] टै ग का उ~लेख कर% ।
• "वो (pause) नहAं आ रहा है ।" = "वो [no-speech] नहAं आ रहा है ।"
Confidential Page 26 of 26