You are on page 1of 9

1.

Task ve Arabirim

Çalışma Alanı:

Anlaşılır insan konuşmasının bir bölümünü ses dosyasından kesme ve konuşmayı yazıya
dökme.
Açıklama:

● Varsayılan kesme: orijinal ses dosyasının süresi (gri alan)


● Mevcut kesme: Sizin kestiğiniz ses dosyası kısmı (mavi alan)

● Ses sınıflandırmaları: 

o Speech (konuşma)-anlaşılır insan konuşması

o Discard (kullanılamaz)- Ses ASR kurallarına uymuyor ve atılması gerekli 

● Text box – Metin kutusu: Anlaşılır insan konuşması olan sesi yazıya döktüğünüz alan

II. Operasyona giriş


1. Ses dosyasının kesilmesine gerek olup olmadığını analiz etme: Sistem size bir parça ses
dosyasını varsayılan olarak gösterecektir. Bu gri alandır. Bu varsayılan gri alanın içindeki
konuşma kısmını kesmeniz gerekmektedir (mavi alan). 

1. Kesme durumu:Detaylar (III. Açıklama Yönergeleri – 1. Ses sınıflandırmaları)


içindedir.

2. Kesme işlemi: İstediğin kesme süresini seçmek için gri alan içinde belirlediğiniz
başlama noktasını mouse ile işaretleyin [start cut] tuşuna ya da kılavyenizde (S)
kısayol tuşuna basın ve belirlediğiniz bitiş noktasını mouse ile işaretleyin, [end cut]
butonuna ya da kılavyeniz üzerinde (E) kısayol tuşuna basın. Sonra, mevcut sürenin
doğruluğundan emin olmak için [play cut] butonuna basın, bu işlemi klavyenizden
(A) tuşuna basarak yapabilirsiniz. Kestiğiniz ses dosyası otomatik olarak
oynayacaktır, bu da kesme işleminin başarılı olduğu anlamına gelir. 

2. Bu ses dosyası için doğru ses sınıflandırmasını seçin (speech/discard).

3. Konuşmayı yazıya dökün

4. Klavye kısa yolları (mouse metin kutusunun dışında aktifken çalışır):

o Space bar (ara tuşu/boşluk çubuğu) – Gönder (submit)

o 1-bıraktığın yerden oynatmaya devam et

o 2-duraklat

o 3-ses dosyasını başından itibaren oynat

o 5-Varsayılan ses dosyasını (gri alan) oynat

o s-Kesmeyi başlat

o e-Kesmeyi bitir

o a-Mevcut kesilmiş bölümü (gri alan) baştan oynat

o ctrl+q(win) / fn+q(mac)-discard (at)

o shift+alt(win) / shift+option(mac)-yazı kutusuna geç

o yazı kurusu içinden hızlıca çıkmak için TAB tuşunu kullanınız.

III. Açıklama Yönergeleri


1. Ses sınıflandırmaları
Ses sınıflandırmaları için 2 alternatif vardır: 【speech】 ve 【discard】, tanımlamaları
aşağıdaki gibidir:

1. Speech (konuşma):

1. Türkçe olan ve konuşmanın anlaşılır olduğu kısmı seçebilirsiniz.

2. Sadece “speech”i seçtiğinizde, ses dosyasını yazıya dökmeniz gerekmektedir.

2. Discard (at):
1. Ses dosyasındaki konuşma Türkçe değildir; 

2. Tüm ses dosyası anlaşılır değildir veya konuşma duyulamamaktadır;

3. Tüm dosya insan sesi haricinde, bir melodi, şarkı söyleme, hayvan veya doğa
sesleri içeren bir konuşmadır.

4. discard (at) opsiyonunu seçtiğinizde, yazıya dökmenize gerek yoktur. Sadece


submit (gönder)’e basın ve bir sonraki ses örneğine geçin.

2. Kesilen konuşma
Sistem tarafından size varsayılan bir parça ses dosyası verilecektir (gri alan). Bu varsayılan
gri alanın içinden konuşma kısmını kesmeniz gerekmektedir (mavi alan). Konuşma kısmını
kesmek için yapmanız gerekenler:

1. Kesmeye konuşmanın başladığı yerden başlayıp, konuşmanın bittiği yerede bitirin.

2. Üstüste binen konuşmaları seçmeyin (2 veya daha fazla kişinin aynı anda konuştuğu
durumlar);

● (Üstüste binen kısım: Aynı anda 2 veya daha fazla kişi farklı şeyler hakkında
konuşuyorsa bu kısmı atın.)

1. Atmamanız gereken durum: Eğer 2 veya daha fazla kişi aynı anda aynı
kelimeleri söylüyorsa ve kelimeler anlaşılırsa, bu bölümü seçmeniz ve yazıya
dökmeniz gerekmektedir; Eğer 2 veya daha fazla kişi aynı anda
konuşmuyorsa, parça atılmamalıdır. Eğer bir grup sohbetinde bir ana ses varsa
ve diğer sesler kısık veya belirsiz ise, ana sesi yazıya dökün.

2. Eğer bir konuşma ve gülme veya modal (ha, hı, aha gibi belirteçlere “modal”
denmektedir) kelimeler üst üste binimişse, konuşmayı yazıya dökün ve modal
kelimeleri görmezden gelin. Örneğin: modal kelimeler ve konuşma üst üste
binmişse, sadece konuşmayı yazın.

● Örnek: https://tcs-sg.bytedance.net/workprocess/6800354640727638530?
mode=scan&task_ids=6801098552338825730

3. Müzik, melodiler, şarkı söyleme, hayvan veya doğa seslerini seçmeyin.

o Eğer tüm ses klibi müzik, melodiler, şarkı söyleme, hayvan veya doğa sesleri gibi
insan sesi dışında sesler içeriyorsa, ses dosyasını “discard” edin (atın). 

o Eğer arkaplandaki ses sözlü bir şarkı ise, bu bölümü kesip çıkarın ve anlaşılır insan
konuşması içeren kısmı tutun veya tüm ses klibini “discard” edin (atın).***ANCAK,
arkaplandaki ses konuşmacının konuşmasının netliğini etkilemiyorsa, konuşmacının
konuşmasını yazıya dökün ve arkaplandaki sesi göz ardı edin. Örnek:.https://tcs-
sg.jiyunhudong.com/workprocess/6804455726539342344?
mode=scan&task_ids=6813515925897101825&submit=directly
o Eğer arkaplandaki ses sözsüz bir melodiyse, klibi atmayın ve tüm konuşmayı yazıya
dökün..

4. Mavi alana alacağınız ses klibini seçerken, kişilerin konuşmalarının ne olduğunu


anlayamayacağınız kadar gürültülü veya belirsiz kısımları seçmeyin.

5. Seçilen konuşma en fazla 2 modal kelime ile başlamalı veya bitmelidir. Örneğin
konuşmanın başında veya sonunda pek çok modal kelime varsa (örneğin 10 tane
“ha”), sadece 2 tanesini seçip klibe atın (modal kelimelerin yazılımı ile ilgili diğer
kurallar 3.g.’de devam edecektir).

6. Ses klibini keserken cümlenin anlamlı bir bütün oluşturup oluşturmadığını


düşünmeyin.

7. Eğer ses dosyasının içeriği iki kişinin duraklamalı ve gürültülü karşılıklı konuşmasını
içeriyorsa (örneğin: anlaşılır konuşma1 + duraklama/gürültü + anlaşılır konuşma2),
duraklama ve gürültülü kısım seçilen ses klibinin içinde kalabilir.

▪ Örnek: "konuşma + duraklama/gürültü+konuşma". Kesmeye gerek yok +


konuşma kısmını yazıya dök+ duraklama/gürültü kısmını göz ardı et.(Bu üst
üste binen konuşmalar için uygun değildir).

▪ Örnek. "konuşma kısmı + üstüste binen kısım + konuşma kısmı”. Bu


durumda, ilk konuşma veya son konuşma parçalarından hangisini yazıya
dökebiliyorsanız yazın, gerisini kesip atın. Ama, yukarıdaki 【III-2-
b】kısmında anlatılan gerekliliğe uyulmuşsa, tüm ses klibini yazıya
dökmeniz gerekmektedir.

8. Eğer gürültü içeriği etkiliyorsa, kesin, Türkçe sesin herhangi bir kısmını tutun ve
Türkçe olan kısmı yazıya dökün. Eğer gürültü içeriği etkilemiyorsa, göz ardı edin ve
tüm ses klibini yazıya dökün.

3. Yazıya dökme (Metin transkripti)


1. Kelimeler arasına boşluk konması gereklidir.

2. Kesme işareti (') ve tire (-) dışında noktalama işareti kullanmayın. Kesme işareti (')
ve tire (-) gerektiğinde yazıya dökülebilir.

● Örn1. Paris'e (Türkçe)  --- to Paris / Paris'de (Türkçe)   --- in Paris  (İngilizce) 

● Paris'den (Türkçe)  --- from Paris (İngilizce) 

● Paris'in (Türkçe)  --- belong to Paris (İngilizce) 

● Paris'le  (Türkçe) --- with Paris (İngilizce)

● Örn2. aşk-ı memnu, hadis-i şerif, e-posta, e-okul


● Yabancı kelimelere gelen Türkçe ekler kesme işaetiyle ayrılır: like’landın, zoom’ladı
vb.

● Lakapların yazımı: Güdük Necmi, Müslüm baba, Bebe Ruhi, Ramiz dayı, Ahmet
bey’in vs.

3. Özel karakterler ve rakamlar Türkçe kelime olarak yazılmalıdır, Örnek. 6 -> altı , & -
> ve

4. Kısaltmalar, İsimler, Yer isimleri, cadde isimleri, üniversiteler, okullar vs gibi büyük
harfle başlayan kelimeler dışında cümleye başlarken büyük harf kullanmayın.Örn.
"Sam", "New york"(Eğer yer ismi birden fazla kelimeden oluşuyorsa, sadece ilk
kelimenin ilk harfini büyük yazın).

o Kısaltmaların ilk harfi büyük yazılmalıdır, özel isim olup olmamasına bakılmaz: örn.
"Kfc" , "Tl" , "Tnt", ‘’Tv’’

o Kişinin soyadı hariç birden fazla kelime olan tüm durumlar için geçerlidir.

o Kelimenin ortasında herhangi bir harfi büyük harfle yazmayın. Örn.  iPhone Sistem
için doğru olan: "Iphone"

5. Genellike ses dosyasının başında ve sonunda, ama bazen de ortasında bir kelime
yarım veya eksik telaffuz edilmiş olabilir.

o Eğer ses klibinin başında veya sonunda yarım telaffuz edilmiş bu kelime ayrı bir
kelime değilse, yazıya dökmeyin ve kesip çıkarın. 

▪ Örn. Cümlenin tamamı: "Senin Amerikalı olmanı istiyorum". Ama sizin


duyduğunuz "Senin Amerikalı olmanı isti", sadece "isti" telaffuz edilmiş ve
bu bir kelime değil. Bunu kesip atın ve geri kalanını yazıya dökün. Doğru
yazım "Senin Amerikalı olmanı" 

o Eğer yarım telaffuz edilmiş kelime ses klibinin başında veya sonunda söylenen ayrı
bir kelimeyse, klibin hepsini yazıya dökün. 

▪ Örn. Cümlenin tamamı "Araba satın al al al... .dın mı?", ama sizin
duyduğunuz "Araba satın al al al", sadece "aldın mı" yerine sadece ‘’al’’
telaffuz edilmiş ve bu bir kelime. Anlamını düşünmeden tüm ses klibini
yazıya dökün. Doğru yazım “Araba satın al al al”.

o Eğer yarım telaffuz edilmiş kelime ortadaysa, ayrı bir kelime olup olmadığına
bakmaksızın kesmeyin. 

▪ Eğer yarım telaffuz edilmiş kelime, ayrı bir kelime değilse, geri kalanını
yazıya dökün. Örn.3. "Beni ha ha hala seviyor musun”, bu iki “ha” halanın
yarım telaffuz edilmiş hali, bunu yazmayın. Doğru yazım “beni hala seviyor
musun”
▪ Eğer yarım telaffuz edilen kelime ayrı bir kelimeyse, yazın ve tüm ses
dosyasını yazıya dökün. Örn.4: Duyduğunuz “Tüm süper süper süpermarket
büyük bir yangında mahvoldu”. (Belki konuşan kişi kekemedir). Bu iki
“süper”, “süpermarket” kelimesinin yarım telaffuzudur ve “süper” bir
kelimedir. Bu durumda “süper” kelimesini iki kere yazın. Doğru yazım  "
Tüm süper süper süpermarket büyük bir yangında mahvoldu.”    

6. Tekrarlanan kelimeler ve cümleler tam olarak kaç kere tekrarlandıysa o kadar kere
yazılmalıdır.

7. Modal kelimeler yazıya dökülmelidir. Örn: “ha ha”, “hi”, “yoo”. Modal kelimeler
sadece net olarak anlaşıldığında yazıya dökün, yani modal kelimenin tam olarak kaç
kere söylendiğini net bir şekilde bildiğiniz zaman. Örn: bir gülmede kaç kere modal
kelime kullanıldığını sayamayız, onu yazıya dökmeyin; “ha ha” denmişse, yazıya
dökün. Tekrar eden modal kelimeler için, ses klibinde kaç kere modal kelimeyi
duyduysanız o kadar kez yazın. Örn: Ses kliminde 3 “ha” varsa, metinde üç kere “ha”
yazmanız gereklidir.
***NOT: "ha" bir, "ha ha" iki sayılır. Eğer iki "ha" varsa, "ha ha" olarak yazıya
dökün (2 "ha" arasında boşluk olmalıdır)

▪ Eğer ses dosyasında duyulabilir ve sayılabilir öpücük varsa, o da modal


kelimedir ve yazıya dökülmelidir (muck). Aşağıdaki dosyanın sonunda
olduğu gibi

▪ Örnek ID:
https://tcs-sg.bytedance.net/workprocess/6800169168764142082?
mode=scan&task_ids=6807206191060894210&submit=directly

8. Modal kelimeler resmi olarak kitabi şekilde yazılır, mesajlaşma dilindeki gibi
yazılamaz. Örn: “oh” kelimesi “oooooh” şeklinde yazılamaz.

9. Son kesilen ses klibi en az iki kelime (≥2). yan yana bir cümle bütünlüğü anlamı
içermiyorlarsa da yan yana duran en az 2 kendi başına anlamı olan kelime yazıya
dökülebilir. Daha az anlamlı kelime sayısı discard edilmelidir.

10. Ses klibinde İngilizce ;

o Eğer başlangıçta veya sonda tamamlanmış bir cümle varsa, İngilizce cümleyi kesin. 

               Örnek:  "That is a good idea, Lütfen yap" cümlesi "Lütfen yap" şeklinde dahil
edilebilir.

o Türkçe cümleler arasında İngilizce bir bölüm varsa, İngilizce bölümün 3 kelime veya
daha az olup olmadığına karar verin. Öyleyse, İngilizce kısmı olduğu gibi tutun ve
yazıya dökün. Eğer İngilizce kısım 3 kelimden uzunsa, o kısmı kesmeniz
gerekmektedir. O kısmı kesin, Türkçe ses olan kısmı tutun ve Türkçe kısmı yazıya
dökün.

11. Son kelime eşsesli ise, doğru olup olmadığına karar veremiyorsanız, 2 tane yöntem
var:
1. Tüm cümlenin ne olduğunu teyit etmek için takip eden varsayılan ses
kesmesini dinleyin ve bağlamına göre doğru kelimeyi yazın. (dikkat: referans
olan varsayılan ses kesmesini geçen bölümü kullanmayın)

● BU TÜRKÇE İÇİN GEÇERLİ DEĞİLDİR. TÜRKÇE’DE EŞSESLİ


KELİMELERİN YAZILIŞI VE OKUNUŞU AYNI, ANLAMI FARKLIDIR.Örn.
Mevcut klipte duyduğunuz "The hole (veya buna benzer bir başka ses /həʊl/ ama
teyit edemiyorsunuz) ", Ancak takip eden varsayılan klipten biliyorsunuz ki cümlenin
kendisi "The whole town disagreed with the mayor." O zaman kelimenin “hole” değil
“whole” olduğundan emin olabilirsiniz. Bu durumda doğru yazım “the whole”.

2. Eğer varsayılan cümlenin anlamına uygun birden fazla eşsesli kelime varsa
(tüm ses kaydının anlamını düşünmeyin), herhangi birini yazabilirsiniz.

● Örn. Varsayılan kesilmiş klip "where is my  deer/dear." Diyorsa, her iki kelime de
cümlenin anlamına uygun düşmektedir. Herhangi birini yazabilirsiniz.

12. Eğer ses klibinde konuşan kişi basitleştirilmiş form veya günlük ağızla konuşuyorsa,
konuşan kişinin söylediği gibi yazıya dökün.

● Örn. “Spora gidiyom”. Ses klibine göre “gidiyom” yazılmalıdır, “gidiyorum”


şeklinde yazılamaz.

13. Lehçe

● Eğer lehçenin yazılı lisanda karşılığı varsa, lehçedeki gibi yazıya dökün. Eğer
lehçenin yazılı lisanda karşılığı yoksa, lehçe kısmını kesip çıkarın ve geri kalanını
yazıya dökün.

Not
1. Bir sonraki bölüme geçmeden metinin ses ile uyumlu olduğundan emin olmak için iki kere
kontrol edin..

2. Dilbilgisi kurallarına aykırıklar da dahil olmak üzere, duyduğunuzu yazıya dökün. Ama
DİL DIŞINA FAZLA ÇIKMADAN: herkes yerine herkez yazmak, -ğ sesini yazmamak
(ramen, diil vb) hatadır.

3. Dökümler konuşmanın kesilen bölümünün 100% doğru karşılığı olmalıdır. Eğer konuşma
bitiyor ve ses dosyası devam ediyorsa; harf olarak karşılığı bulunmayan bir ses kesimin
içinde tutulmuşsa Fail olur. Kesim harf karşılığı nerede bitiyorsa, orada bitmelidir.
Konuşmadan sonra kalan arka plandaki şarkının sözü, arka plandan gelen başka konuşma ya
da gürültü Fail olur.

4. Ses klibindeki tüm semboller ve sayılar Türkçe kelimeler olarak yazıya dökülmelidir.
Ek açıklama
1. Eğer “k” veya “g” telaffuzu net değilse (bazen ses kalitesi veya arkaplan etkisi “k” nın “g”
gibi duyulmasına neden olur) ve mükemmel netlikte bir “g” duymuyorsanız, lütfen “k”
olarak yazıya dökünüz.

o  Türkler genellike “k” ile başlayan kelimeleri “g” ile telaffuz ederler. “g” ile telaffuz
ederken, ses bazen muğlak kalır. “k” ile “g” arasında bir ses gibidir.

2. ÜNLEM/HEYECAN KELİMELERİ UPDATE:

Eğer ünlem kelimeleri açıkça duyulup anlaşılıyorsa ve sayılabiliyorsa sizle


paylaştığımız “Turkish modals list”de olmasa bile yazıya dökmemiz
gerekiyor. Bu gibi ifadelFer doğru yazıldığında ya da küçük hatalar
barındırsa bile QC tarafından kabul edilecektir. Mesela, konuşan “ıhı ıhı”
şeklinde gülüyorsa “ıhı hıh” bile kabul edilebilir.

3. BÜYÜK HARF KULLANIMI UPDATE:

Eğer bir tane özel isim varsa, büyük harfle başlayın. “Şule” Ankara, Brezilya

Eğer bir kelimeden fazla ve isim/soyisim şeklindeyse, iki kelimeye de büyük


harfle başlayın. “Şule Kaya”

Eğer bir kelimeden fazla ve isim/soyisim şeklinde DEĞİLSE, sadece ilk


kelimeyi büyük harfle başlatın.

Örnek: İstanbul Milletvekili Sayın Mehmet Ahmet: YANLIŞ

İstanbul milletvekili sayın Mehmet Ahmet: DOĞRU

Burda isim/soyisim olan Mehmet Ahmet’i ayrı, İstanbul milletvekili sayın’ı


ayrı değerlendirmek lazım.

3. KESME İŞARETİ KULLANIMI UPDATE:

Kesme işareti tamamen Türkçe gramere uygun olarak kullanılmalıdır. ( http://


tdk.gov.tr/icerik/yazim-kurallari/kesme-isareti/ )

Örnek: tiktokta çok video var: YANLIŞ

Tiktok’ta çok video var: DOĞRU

Michael’ın, Kemal bey’in, comment’de, Çiçek mahallesi’nde vs. like’ladım

4. Heceleme, birleşik kelime yazımı, doğru harf kullanımında şüpheye


düştüğünüz tüm kelimeler için, http://tdk.gov.tr/ ve sozluk.gov.tr sitelerine
danışın ve ona göre yazın: hoş geldin, sağ olasın, birader vs.
5. ŞARKILAR UPDATE:

Soru: eğer konuşan arkada melodi olmadan sadece şarkı sözlerini


söylüyorsa, bunları discard mı yapmalıyız?

Cevap: Eğer şarkıysa discardlamalıyız. Şarkı içinde ritim olan kelimelerin


hepsini kapsar, arkada melodiye gerek duymadan.

6. SORU: Eğer konuşmacı hayvan sesleri çıkarıyorsa bunu yazıya dökecek


miyiz?

CEVAP: Bu durumlarda heyecan/ünlem kelimeleri kuralını göz önüne alın:


açık anlaşılır ve sayılabiliyorsa, yazıya dökün.

7.

SORU: Tek harflik sesleri nasıl yazıya dökmeliyiz? (Misal, birisi “k” harfini
söylüyorsa bunu “ka/ke” olarak mı yoksa sadece “k” olarak mı yazıya
dökmeliyiz?

CEVAP: “k” yazıya dökmek için yeterli. Örneğin, “18 k”= “on sekiz k”
şeklinde. Örnek: “a b c d şıkları”, “a’dan z’ye” vb.

8. Soylendiginde anlasilmasi kisiden kisiye farklilik gosteren kelimeler,


yaziminda muamma olan kelimeler TDK’ye gore yazilmalidir (AÇIK VE
ANLAŞILIR BİR ŞEKİLDE VURGULANMADIĞI SURECE): herkez degil
herkes, diil yerine diğil/değil, sora degil sonra vb.

HIZLI LİNKLER:
Latest Updated List of Modal Words - MUST CHECK OFTEN: https://bytedance.feishu.cn/docs/
doccnoUvF5Czj11os3UIpHjBxCe#q4rDqG

Latest Updated List of Confusing Cases (MUST CHECK):


https://bytedance.feishu.cn/sheets/shtcnuUtmk9mKOHh8YasLZUInce

Link to the Work Platform: https://tcs-sg.jiyunhudong.com/

You might also like