You are on page 1of 15

PSIHOLOGIJA, 2006, Vol. 39 (1), str. 75-89 UDC 159.9.072:811.163.41347.

73

DIJAHRONIJSKE PROMENE VEROVATNOA VRSTA


REI I LEKSIKE U JEZIKU DNEVNE TAMPE

Jelena Stankovi i Aleksandar Kosti1


Laboratorija za eksperimentalnu psihologiju,Filozofski fakultet u Beogradu

Dijahronijske promene u srpskom jeziku u rasponu od pedeset godina


ispitane su globalno na nivou vrsta rei kao gramatikih kategorija i na nivou
leksike u okviru pojedinih vrsta rei (imenice, pridevi, glagoli i predlozi). U
ispitivanju smo koristili dva uzorka dnevne tampe. Prvi uzorak je preuzet iz
Korpusa srpskog jezika ora Kostia, i obuhvata dnevnu tampu (list
Politika) u periodu od 1945. do 1957. godine. Drugi poduzorak preuzet je iz
Ebart medijske dokumentacije kojim je obuhvaeno sedam dnevnih listova i
pet nedeljnika u periodu od 2002. do 2003. godine. Uzorci na kojima je
obavljeno istraivanje sastoje se od oko milion rei.
Dobijeni nalazi pokazuju da su imenice i pridevi uestaliji u vremenski
starijem uzorku, dok su glagoli i predlozi uestaliji u savremenom uzorku, to
ukazuje na to da je u jeziku dnevne tampe tokom poslednjih pet decenija dolo
do skraenja reenice. Najvea odstupanja u distribuciji verovatnoa
pojedinanih leksema uoena su na imenicama i pridevima, odstupanja kod
glagola su daleko manja, dok su kod predloga odstupanja zanemariva. Ovi
nalazi sugeriu da su imenice najvie podlone dijahronijskim promenama,
dok se predlozi, kao vrsta rei, mogu smatrati izuzetno stabilnim i otpornim na
promene.

Kljune rei: korpusna lingvistika, dijahronija

Predmet ovog rada je utvrivanje stabilnosti verovatnoa razliitih vrsta rei u


kontekstu dijahronijskih promena u jeziku dnevne tampe u rasponu od pet decenija.
Budui da je dnevna tampa, kao funkcionalni stil, po prirodi svog sadraja vezana
za drutvene situacije i okolnosti, moe se pretpostaviti da je u rasponu od pedeset
godina dolo do promena u uestalosti pojedinih rei, a moda i u distribuciji

1
Adresa autora: akostic@f.bg.ac.yu
Jelena Stankovi i Aleksandar Kosti

uestalosti vrsta rei. Stoga je ovo istraivanje usmereno na utvrivanje promena


uestalosti vrsta rei i pojedinanih leksema u okviru date vrste rei na dva
vremenski udaljena uzorka - savremenoj dnevnoj tampi i dnevnoj tampi u periodu
izmeu 1945. i 1957. godine.
Ukoliko bi se pokazalo da je u rasponu od pedeset godina dolo do promena
verovatnoa pojedinanih rei, kao i promena u distribuciji verovatnoa vrsta rei,
moe se postaviti pitanje vrste rei koja je u najveoj meri podlona dijahronijskim
promenama. Stepen promena verovatnoa na nivou vrste rei bi u tom sluaju
mogao da poslui kao indikator njene leksike stabilnosti, odnosno otpornosti na
dijahronijske promene.

Poreenje dva vremenski udaljena uzorka dnevne tampe

Dijahronijske analize teksta mogu da obuhvate poreenje pojedinih


funkcionalnih stilova u razliitim vremenskim periodima, ali i poreenje vremenskih
uzoraka u okviru istog funkcionalnog stila. U naem istraivanju usmerili smo se na
ispitivanje razlika u okviru dnevne tampe u rasponu od pet decenija. Razlog
ovakvom izboru je taj to pretpostavljamo da je dnevna tampa funkcionalni stil u
kojem su u relativno kratkim vremenskim intervalima uoljive promene verovatnoa
pojedinanih rei, a moda i gramatikih kategorija. Drugim reima, pretpostavili
smo da su dijahronijske promene leksike i morfologije za iste vremenske razlike
izraenije u jeziku dnevne tampe nego u literarnoj prozi, na primer, ili naunim i
poetskim tekstovima.
U istraivanju smo koristili dva uzorka tekstova dnevne tampe. Prvi uzorak
izveden je iz Korpusa srpskog jezika ora Kostia, nastalog krajem pedesetih
godina prolog veka, koji se sastoji od 11 miliona rei i sadri sve znaajnije
funkcionalne stilove od XII do XX veka (Kosti, ., 2001). Svaka re u Korpusu
srpskog jezika (u daljem tekstu KSJ) runo je gramatiki obraena sistemom
anotacije koji razlikuje oko 2000 gramatikih oblika. Deo Korpusa koji se odnosi na
savremeni jezik sadri oko 7 miliona rei i sastoji se od est funkcionalnih stilova:
a) proznih tekstova, b) poetskih tekstova, c) dnevne tampe (Politika), d) naunih
tekstova i e) politikih tekstova. Svi tekstovi pisani su u periodu od 1945. do 1957.
godine. Uzorak dnevne tampe, napravljen na dnevnom listu Politika, sadri
808.409 rei i obuhvata period od 1945. do 1957. godine. Uzorkovanje tekstova
vreno je po datumu, strani i mestu teksta na stranici novina metodom sluajnog
odabira, a tretirano je celokupno izdanje od prve do poslednje stranice. Iz ovog
uzorka i uzorka savremene poezije napravljen je Frekvencijski renik savremenog
srpskog jezika (Kosti, ., 1999) koji je posluio kao osnova za nae istraivanje.
Renik sadri frekvencije odrednica i gramatikih oblika odrednica, pri emu smo
za ovo istraivanje izdvojili deo koji se odnosi na dnevnu tampu. Drugi uzorak
zasnovan je na korpusu savremene dnevne tampe Ebart medijske dokumentacije (u
daljem tekstu EBR) koji sadri oko 65 miliona rei, a pokriva period od 2002. do

76
Dijahronijske promene verovatnoa vrsta rei i leksike u jeziku dnevne tampe

2003. godine. Ovim uzorkom obuhvaeno je sedam dnevnih listova i pet nedeljnika,
a u istraivanju je korien poduzorak od 1.000.000 rei. Pomenuta dva uzorka
emo tretirati kao dve take u vremenskom kontinuumu u rasponu od pedeset
godina, sa ciljem da utvrdimo jezike promene koje su se u tom vremenskom
rasponu dogodile.

METOD

U poreenju distribucija verovatnoa vrsta rei na dva vremenska uzorka


ispitali smo dijahronijske promene na nivou vrsta rei i promene u okviru leksike
imenica, prideva, glagola i predloga. Ispitali smo, dakle, promene leksike u okviru
tri promenljive i jedne nepromenljive vrste rei. Verovatnoe, izraene kao
proporcije u odnosu na celokupan uzorak, izraunate su kako za vrste rei uzete
globalno, tako i unutar svake vrste rei. Analize u okviru pojedinih vrsta rei
ograniili smo na 50 najfrekventnijih rei. Za poreenje ranga uestalosti 50
najuestalijih imenica, prideva, glagola i predloga uzeli smo 500 najfrekventnijih
rei na oba vremenska uzorka kako bismo bili sigurni da rei iz jednog uzorka imaju
svoj ekvivalent meu 50 najuestalijih rei na drugom uzorku. Razlike u distribuciji
verovatnoa u dva vremenska uzorka ispitane su korelacionim postupkom, pri emu
je koeficijent korelacije tretiran kao indikator slinosti dve distribucije, a ne kao
mera njihove povezanosti. Takoe, diskutovan je i nagib linearne funkcije u
regresionoj analizi koji ukazuje na relativni stepen promena izmeu dva uzorka.
Odnose dveju distribucija verovatnoa grafiki emo prikazati skatergramima i
linijskim grafikonima, dok e poreenja od znaaja biti prikazana i histogramima.

REZULTATI

a. Vrste rei. Poreenje distribucija verovatnoa vrsta rei na uzorcima


izvedenim iz EBR i KSJ zahtevalo je, najpre, izraunavanje sirovih frekvencija za
sve vrste rei na oba uzorka, a zatim njihovo pretvaranje u proporcije. Odnos
distribucija verovatnoa za deset vrsta rei izvedenih iz KSJ i EBR prikazan je na
slici 1.

77
Jelena Stankovi i Aleksandar Kosti

Slika 1. Odnos distribucija verovatnoa vrsta rei na uzorku EBR i uzorku KSJ.
1 - imenice, 2 - glagoli, 3 - predlozi, 4 - sveze, 5 - pridevi, 6 - zamenice, 7 - prilozi, 8 - brojevi, 9
- rece i 10 uzvici. Skatergram (X-osa EBR, Y-osa KSJ).

0 01 02 03 0

Koreliranjem distribucija verovatnoa na dva uzorka dobijen je znaajan


koeficijent korelacije: r=0.97; F(1, 8)=149.98; p<0.01, to ukazuje na visoku
slinost dveju distribucija (skatergram, slika 1). Nagib linearne funkcije iznosi 1.08,
to ukazuje na to da su razlike u verovatnoama vrsta rei na savremenom uzorku
praene ekvivalentnim razlikama na vremenski starijem uzorku. Ipak, izmeu dve
distribucije postoje izvesna odstupanja, emu najvie doprinosi relativna uestalost
imenica i prideva (slika 1, linijski grafikon). Naime, imenice i pridevi su uestaliji
na vremenski starijem uzorku (tabela 1 u dodatku). Dok na uzorku izvedenom iz
KSJ (kvadrati na grafikonu) ima 36.7 % imenica i 12 % prideva, na uzorku
izvedenom iz EBR (kruii na grafikonu) ima 31.5 % imenica i 10 prideva %.
Glagoli i sveze su, pak, na savremenom uzorku uestaliji nego na uzorku izvedenom
iz KSJ (glagoli: 20.33% prema 16%; sveze: 10.5% prema 7.87%) (tabela 1).
b. Imenice. Poreenje distribucija verovatnoa imenica na dva vremenska
uzorka sprovedeno je na 50 najuestalijih imenica iz EBR, a zatim utvrivanjem
uestalosti tih imenica meu 500 najuestalijih na uzorku izvedenom iz KSJ. Za oba
uzorka frekvencije su izraene u proporcijama. Najpre emo razmotriti 50
najuestalijih imenica, ukljuujui i onomastiku, a zatim emo analizirali
najuestalije imenice bez onomastike (tabele 2 i 3). Iz razmatranja su iskljuene
imenice gora koja je po rangu frekvencije u EBR na 24. mestu i banka (30. mesto)
koje se u KSJ ne nalaze meu 500 najfrekventnijih imenica.
Odnos distribucije verovatnoa najfrekventnijih imenica u EBR i KSJ ispitan
je korelacionim postupkom, pri emu je dobijen znaajan koeficijent korelacije r
=0.43, F(1,46)=10.741; p<0.01 (slika 2).

78
Dijahronijske promene verovatnoa vrsta rei i leksike u jeziku dnevne tampe

Slika 2. Odnos distribucije verovatnoa najfrekventnijih imenica na uzorku EBR i distribucije


verovatnoa tih imenica na uzorku KSJ. Skatergram (X-osa EBR, Y-osa KSJ).

Nagib linearne funkcije iznosi 0.63, to znai da je prirataj verovatnoa


imenica u EBR praen sporijim priratajem verovatnoa tih imenica u KSJ.
Raspodela frekvencija izvedenih iz KSJ znatno odstupa od raspodele na
savremenom uzorku. Najdrastinije odstupanje je u sluaju imenice Srbija
(obeleeno strelicom na skatergramu) koja je na savremenom uzorku prva po rangu
uestalosti, dok se na vremenski starijem uzorku nalazi na 88. mestu (odnos
proporcija 5:1). Kako razlike u verovatnoama ovog toponima doprinose i rasturu
vrednosti prikazanih na skatergramu, u daljim analizama on e biti iskljuen.
Kada se iz razmatranja izuzme toponim Srbija, slinost distribucija
verovatnoa dva vremenska uzorka je vea: r=0.58, F(1,45)=22.91, p<0.01).
Takoe, nagib funkcije je vei i iznosi 1.013, to ukazuje na to da kada se iskljui
toponim Srbija promene u distribuciji verovatnoa na uzorku EBR bivaju praene
proporcionalnim promenama na uzorku izvedenom iz KSJ.
Znaajnija odstupanja empirijske raspodele iz KSJ i njihovog ranga na EBR
primeena su u sluaju imenica ovek, put, svet, dete, policija, crkva i sud ije
frekvencije u EBR imaju relativno visoke rangove, za razliku od njihovih rangova
na vremenski starijem uzorku (odnos proporcija se za date imenice kree od 2:1 do
5:1. S druge strane, imenice zemlja (0.00131; 0.0022, 7. i 4. mesto) i vlada
(0.00118;0.018, 9. i 8. mesto) takoe doprinose odstupanjima jer su po globalnim i
relativnim frekvencijama ee na vremenski starijem uzorku. Isti smer, ali sa jo
izrazitijim odstupanjima, uoen je za imenice rad (0.00088; 0.0022, 20. i 5. mesto),
predsednik (0.000868; 0.00155, 21. i 13. mesto) i toponim Jugoslavija (0.00075;
0.0016, 32. i 11. mesto). Neke od imenica sa najveim odstupanjima u uestalosti na
dva vremenska uzorka prikazana su na slici 3.

79
Jelena Stankovi i Aleksandar Kosti

Slika 3. Proporcije imenica sa najveim odstupanjima uestalosti na dva vremenska uzorka


(beli stubi EBR).

0.003
0.0025
0.002

0.0015
0.001
0.0005
0
Srbija covek zemlja svet rad policija Jugoslavija

Koreliranjem distribucije verovatnoa imenica bez onomastikih pojmova na


uzorku EBR i verovatnoa izvedenih iz KSJ dobijena je znaajna mera slinosti
distribucija; r=0.52, F(1,46)=16.67, p<0.01. Koeficijent nagiba regresione prave
iznosi 0.89 to ukazuje na to da su razlike u relativnoj frekvenciji imenica u EBR
praene neto manjim razlikama na vremenski starijem uzorku. Odstupanja su
najvea za imenice put, svet, rad, policija i crkva, to je prikazano na slici 4.

Slika 4. Proporcije imenica bez onomastikih pojmova sa najveim odstupanjima u uestalosti


na dva vremenska uzorka (beli stubi EBR).

0.0025

0.002

0.0015

0.001

0.0005

0
put svet rad policija crkva

80
Dijahronijske promene verovatnoa vrsta rei i leksike u jeziku dnevne tampe

Onomastiki pojmovi. Od 14 onomastikih pojmova koji su se na oba


vremenska uzorka nali meu 500 najfrekventnijih imenica 13 su toponimi, dok
samo jedna imenica oznaava instituciju (Tanjug). Zanimljivo je da je meu 500
najuestalijih rei na uzorku izvedenom iz KSJ jedini antroponim Tito (65. mesto po
rangu frekvencije), ali se on ne nalazi meu 500 najuestalijih imenica u EBR. Sa
druge strane, u EBR prisutni su onomastiki pojmovi Boi (51. mesto) i Srbin (62.
mesto), kojih na vremenski starijem uzorku nema meu 500 najuestalijih imenica.
Razlike u onomastici na dva uzorka postoje i u sluaju institucija; dok su na
vremenski starijem uzorku prisutni nazivi sportskih klubova (Crvena Zvezda i
Partizan), na savremenom uzorku se nalazi naziv sudske institucije (Hag), kao i
nazivi politikih stranaka ( DOS i SPS) (tabela 4).
Odnos distribucije verovatnoa onomastikih pojmova u EBR i KSJ ispitan je
korelacionim postupkom, pri emu je dobijen znaajan koeficijent korelacije;
r=0.59, F(1,12)=6.57, p<0.05 (slika 5). Koeficijent nagiba regresione prave,
meutim, iznosi 0.54 to ukazuje na to da porast u relativnim frekvencijama u EBR
prate mnogo sporije promene relativnih frekvencija u KSJ. Odnos frekvencija
onomastikih pojmova i ranga frekvencija za vremenski stariji uzorak odstupa od
raspodele onomastikih pojmova u savremenom uzorku, emu najvie doprinosi
toponim Srbija, a zatim toponimi Jugoslavija i Evropa. Najvea odstupanja
prikazana su na slici 6. S obzirom na to da je u sluaju toponima Srbija uoena
najvea razlika, ovaj toponim e u daljem razmatranju biti iskljuen.

Slika 5. Odnos distribucija verovatnoa onomastikih pojmova u EBR (krui na linijskom


grafikonu) i KSJ. 1. Srbija, 2. Beograd, 3. Jugoslavija, 4. Evropa, 5. Hrvatska, 6. SAD, 7.
Italija, 8. London, 9. Rusija, 10. Pariz. Skatergram (X-osa EBR, Y-osa KSJ).

Iskljuenjem toponima Srbija odnos distribucija verovatnoa onomastikih


pojmova na dva vremenska uzorka se bitno menja, a koeficijent korelacije iznosi
r=0.94, F(1,11)=77.102, p<0.01. Nagib regresione funkcije iznosi 1.30, to ukazuje
na to da (kada izuzmemo toponim Srbija) razlike u verovatnoama na savremenom

81
Jelena Stankovi i Aleksandar Kosti

uzorku bivaju praene veim razlikama u distribuciji verovatnoa na vremenski


starijem uzorku.
c. Pridevi. Poreenje distribucija verovatnoa 50 najfrekventnijih prideva na
dva vremenska uzorka sprovedeno je identifikovanjem 50 najuestalijih prideva u
EBR, a zatim utvrivanjem frekvencija tih prideva meu 500 najuestalijih u KSJ
(tabela 5). Iz razmatranja su iskljueni pridevi ustavni koji je na savremenom uzorku
na 23. mestu po rangu frekvencije, zatim novogodinji (29. mesto), svet (42. mesto)
i pravoslavan (47. mesto) koji se u KSJ ne nalaze meu 500 najuestalijih prideva.
Odnos verovatnoa 50 najfrekventnijih prideva u EBR i KSJ prikazan je na slici 6.

Slika 6. Distribucija verovatnoa najfrekventnijih prideva u EBR (krui na linijskom


grafikonu) i distribucije verovatnoa tih prideva u KSJ. Skatergram (X-osa EBR, Y-osa KSJ).

Odnos distribucija verovatnoa prideva na dva vremenska uzorka ispitan je


korelacionim postupkom, pri emu je utvren znaajan koeficijent korelacije;
r=0.73, F(1,44)=51.53, p<0.01. Visina koeficijenta korelacije sugerie da su
distribucije verovatnoa prideva na dva vremenska uzorka sline. Koeficijent nagiba
regresione prave iznosi 0.77, iz ega zakljuujemo da je prirataj u frekvencijama 50
najuestalijih prideva u EBR praen neto manjim priratajem frekvencija tih
prideva u KSJ.
Izrazita odstupanja uoena su za prideve srpski (0.00133:0.00014, odnos
proporcija je 9:1), crn (0.00094:0.00021), evropski (0.00069:0.00017) (odnos
proporcija za ova dva prideva je 4:1) i svetski ( 0.00068:0.000301). Ovi pridevi su
na savremenom uzorku znatno uestaliji.
Odnosi izmeu frekvencija prideva i ranga njihovih frekvencija za dva
vremenska uzorka razlikuju se i u suprotnom smeru u sluaju prideva ameriki
(0.00061:0.001), zatim, jo izrazitije za prideve narodni (0.00046:0.0024, odnos
proporcija je 1:5) i jugoslovenski (0.000385:0.00137, odnos proporcija je 1:3), i
neto manja odstupanja za pridev francuski (0.00034:0.00069). Ovi pridevi su
uestaliji u KSJ. Najizrazitija odstupanja u uestalosti prideva na dva uzorka
prikazana su na slici 7.

82
Dijahronijske promene verovatnoa vrsta rei i leksike u jeziku dnevne tampe

Slika 7. Proporcije prideva sa najveim odstupanjima u uestalosti na dva vremenska


uzorka (beli stubi EBR).

0.004

0.003

0.002

0.001

0
nov mali srpski crn evrop. svetski ameri c ki narodni jugos. franc.

d. Glagoli. Poreenje distribucija verovatnoa 50 najfrekventnijih glagola na


dva vremenska uzorka sprovedeno je identifikovanjem 50 najuestalijih glagola u
EBR, a zatim utvrivanjem frekvencija tih glagola meu 500 najuestalijih glagola
u KSJ (tabela 6). Svih 50 najuestalijih glagola na savremenom uzorku nalaze se
meu 500 najuestalijih u KSJ.
Odnos distribucija verovatnoa najfrekventnijih glagola na dva vremenska
uzorka ispitan je korelacionim postupkom, pri emu je dobijen visok koeficijent
korelacije r=0.99, F(1,48)=34799.44, p<0.01 (slika 8).

Slika 8. Odnos distribucije verovatnoa 20 najfrekventnijih glagola u EBR (krui na linijskom


grafikonu) i distribucije verovatnoa ovih glagola u KSJ. Skatergram (X-osa EBR, Y-osa KSJ).

Dobijeni koeficijent korelacije ukazuje na to da su distribucije verovatnoa


glagola u EBR i KSJ skoro identine. Vrednost nagiba regresione funkcije iznosi
0.73, to znai da je prirataj frekvencija glagola u savremenom uzorku praen neto

83
Jelena Stankovi i Aleksandar Kosti

sporijim priratajem u vremenski starijem uzorku. Primetimo, takoe da je razlika u


relativnoj frekvenciji najfrekventnijeg glagola (pomoni glagol biti) u odnosu na
razlike u relativnim frekvencijama glagola niih po rangu izrazito velika (odnos
proporcije glagola biti i proporcije prvog sledeeg glagola po rangu frekvencije
(hteti) na oba uzorka iznosi 10:1). Moe se pretpostaviti da ovako visoka uestalost
pomonog glagola biti donekle zamagljuje realni odnos distribucija verovatnoa na
dva vremenska uzorka. Stoga e u daljem razmatranju ovaj pomoni glagol biti
iskljuen (slika 9).

Slika 9. Odnos distribucija verovatnoa glagola bez pomonog glagola biti u EBR (krui na
linijskom grafikonu) i KSJ. Skatergram (X-osa EBR, Y-osa KSJ).

8
7
6
5
4
3
2
1

Izostavljanjem pomonog glagola biti slinost distribucija verovatnoa glagola


u dva vremenska uzorka je neto manja; r=0.94, F (1, 47)=384.36, p<0.01, dok je
koeficijent nagiba regresione prave doiveo neznatnu izmenu (0.70). Najvea
odstupanja uoena su za glagole hteti (0.007:0.0051), imati (0.0035:0.0024), zatim
za kazati (0.0021:0.00068), raditi (0.0016:0.00074), nemati (0.0012:0.0007) i znati
(0.0011:0.00069). Ovi glagoli su ei u uzorku savremenog jezika.
e. Predlozi. Poreenje distribucija verovatnoa 50 najfrekventnijih predloga na
dva vremenska uzorka sprovedeno je identifikovanjem 50 najuestalijih predloga u
EBR, a zatim utvrivanjem frekvencija tih predloga meu 95 najuestalijih predloga
u KSJ (tabela 7). Svih 50 najuestalijih predloga na savremenom uzorku nalaze se u
KSJ. Frekvencije predloga na oba uzorka izraene su u proporcijama, a slinost
distribucija ispitana je korelacionim postupkom. Najpre je razmatrano svih 50
predloga, a zatim su iskljueni predlozi koji imaju visok rang frekvencija, kao i
priblino isti odnos relativnih i globalnih frekvencija na oba uzorka.
Izmeu distribucija verovatnoa predloga na dva vremenska uzorka dobijena je
znaajna korelacija: r=0.99, F(1, 49)=7737.90, p<0.01, to govori o velikoj slinosti
dveju distribucija (slika 10). Raspodele verovatnoa savreno se uklapaju u
aproksimirani odnos izraen regresionom pravom, to potvruje i koeficijent nagiba

84
Dijahronijske promene verovatnoa vrsta rei i leksike u jeziku dnevne tampe

regresione prave koji iznosi 0.99. Naime, promene u relativnim frekvencijama


predloga u EBR praene su skoro identinim promenama u KSJ.

Slika 10. Odnos distribucije verovatnoa najfrekventnijih predloga u EBR (krui na linijskom
grafikonu) i KSJ. Skatergram (X-osa EBR, Y-osa KSJ).

0 0 01 0 02 0 03 00

Pregledom slike 10 uoava se da je odnos izmeu relativnih frekvencija


predloga i rangova njihovih frekvencija za oba vremenska uzorka funkcija koja se
opisuje Zipfovom raspodelom. Mogue je pretpostaviti da su upravo predlozi
visokog ranga, iji se odnos globalnih i relativnih frekvencija tokom vremena nije
znaajno promenio, doprineli visokoj slinosti distribucija verovatnoa predloga na
dva vremenska uzorka, te e u daljem razmatranju oni biti iskljueni.
Iskljuenjem predloga u, na i za slinost distribucija predloga na dva
vremenska uzorka je neto manja; r=0.98; F(1, 46)=1148.12; p<0.01. Iako se na
osnovu koeficijenta korelacije moe zakljuiti da u distribucijama predloga tokom
vremena nije dolo do ozbiljnijih promena, koeficijent nagiba (b=0.88) sugerie da,
kada se gore pomenuti predlozi izuzmu, prirataj frekvencija u savremenom uzorku
biva praen neto sporijim priratajem na vremenski starijem uzorku. Uoena su
odstupanja kod predloga s (0.0082:0.0062), zbog (0.0017:0.0009), pre (0.0013:
0.00091), bez (0.0012:0.00075), uz (0.00091:0.00053) i nakon (0.00050:0.000015).
Ovi predlozi su po globalnim i relativnim frekvencijama ei u uzorku EBR.

Vrste rei i leksika stabilnost

Koeficijenti korelacije izmeu EBR i KSJ, dakle, uzoraka jezika savremene


dnevne tampe i dnevne tampe od pre pedeset godina uzeti su kao mera slinosti
distribucija verovatnoa dva uzorka. Ukoliko je izmeu dva uzorka dobijen vii

85
Jelena Stankovi i Aleksandar Kosti

koeficijent korelacije, tj. ukoliko su dva uzorka slinija, zakljuujemo da su


promene u distribuciji verovatnoa nastale tokom pet decenija manje, i obrnuto,
ukoliko je koeficijent korelacije nii, stepen promene je vei. Imajui to u vidu,
koeficijent korelacije moe da poslui kao indikator leksike stabilnosti pojedinih
vrsta rei. Ako je koeficijent korelacije izmeu dva uzorka za datu vrstu rei vii, to
znai da izmeu njih postoji vea slinost u distribuciji verovatnoa to, dalje, znai
da su se tokom vremena u okviru ove vrste rei dogodile manje promene
verovatnoa u odnosu na vrstu rei kod koje je koeficijent korelacije nii.
Pregledom koeficijenata korelacije za dva uzorka dobijenih na imenicama,
pridevima, glagolima i predlozima primeujemo da je najnii koeficijent korelacije
dobijen za imenice, zatim za prideve, dok su koeficijenti korelacije za glagole i
predloge blizu maksimumu (r=0.99). Meutim, ukoliko iz analize uklonimo leksemu
kod koje je uoena najvea promena verovatnoe ili, pak, lekseme ije su
verovatnoe dramatino vee od verovatnoa ostalih leksema u okviru date vrste
rei, dobijamo neto drugaije vrednosti koeficijenata korelacije, iako ove
intervencije nisu dovele do ordinalnih promena.2 Vrednosti koeficijenata korelacije
za etiri vrste rei prikazane su na slici 11.

Slika 11. Vrednosti koeficijenata korelacije izmeu EBR i KSJ za imenice, prideve, glagole i
predloge (crni stubi: vrednosti korelacije sa izbaenim ekstremnim vrednostima).

1
0.8

0.6

0.4
0.2

0
im p g pr

Na osnovu vrednosti koeficijenata korelacije za etiri vrste rei zakljuujemo


da su na dijahronijske promene najvie osetljive imenice i pridevi, dok se za glagole
i predloge, kao vrste rei, moe rei da su izuzetno stabilni i da su njihove
verovatnoe u manjoj meri podlone dijahronijskim promenama.

2
U sluaju imenica to je toponim Srbija, dok je u sluaju glagola to pomoni glagol biti. Kod prideva i
predloga nisu uoene lekseme ije verovatnoe drastino odstupaju.

86
Dijahronijske promene verovatnoa vrsta rei i leksike u jeziku dnevne tampe

DISKUSIJA

Nalazi dobijeni poreenjem distribucija verovatnoa vrsta rei na dva


vremenski udaljena uzorka pokazuju visoku slinost izmeu distribucija (r=0.97).
Ipak, paljivijim uvidom u razlike meu distribucijama uoavamo izvesne
pravilnosti. Naime, proporcija imenica i prideva neto je via u KSJ nego u EBR,
dok je proporcija glagola i sveza neto via u EBR.3 Dobijeni nalazi navode na
pretpostavku da je tokom poslednjih pet decenija dolo do skraenja duine
reenice. U svetlu ovakve pretpostavke nalaz o veoj relativnoj uestalosti glagola u
EBR ne treba shvatiti kao realni porast uestalosti, ve kao posledicu smanjenja
proporcije imenica i prideva. Do smanjenja uestalosti imenica i prideva, uz
relativno nepromenjenu uestalost glagola, moe doi samo u sluaju skraenja
reenice.
Na nivou promene verovatnoa pojedinanih leksema najdrastinije razlike
ustanovljene su kod imenica i neto manje kod prideva, dok su kod glagola i
predloga uoene minimalne promene u toku poslednjih pet decenija. Ovi zakljuci
izvedeni su na osnovu razlika koeficijenata korelacije za etiri vrste rei. Kada su u
pitanju imenice, drastine promene su se dogodile na nivou onomastikih pojmova,
naroito u okviru toponima. Slinost distribucija verovatnoa prideva u EBR i KSJ
vea je od slinosti utvrene za imenice, ali i manja od one utvrene za glagole i
predloge. Distribucije verovatnoa glagola i predloga u dva vremenska uzorka
pokazuju najveu stabilnost. Gotovo da nema razlika u distribucijama verovatnoa
glagola na dva vremenska uzorka. Odnos distribucija verovatnoa 50 najuestalijih
predloga na dva vremenska uzorka ukazuje na izuzetno visoku slinost (r=0.99), to
potvruje i koeficijent nagiba linearne funkcije (b=0.99). Kada su iz razmatranja
iskljueni predlozi koji imaju izrazito visoku frekvenciju na oba uzorka, slinost
distribucija je neto manja (r=0.98). Najvea odstupanja uoena su za predloge s, iz,
zbog, pre, bez, uz, nakon i tokom jer su ovi predlozi ei na savremenom uzorku.
Ispitivanjem stabilnosti distribucija verovatnoa pojedinih vrsta rei na dva
uzorka dnevne tampe pokazano je da su imenice najpodlonije promenama.
Relativna nestabilnost distribucija verovatnoa imenica praena je relativnom
nestabilnou distribucija verovatnoa prideva. Odstupanja u distribuiranju
verovatnoa imenica, onomastikih pojmova i prideva na dva vremenska uzorka
ukazuju da se kroz jezik ovog funkcionalnog stila reflektuju drutveni, ideoloki i
kulturni uticaji. Ovde nije re o dijahronijskim promenama na nivou morfologije (o
nivou morfolokih promena govori podatak da je smanjena relativna uestalost
imenica i prideva kao vrste rei), ve na nivou leksike, tj. uestalosti pojedinih rei,

3
Odnos relativnih ucestalosti imenica i glagola u EBR uzorku je 1,5:1, dok je ovaj ovaj odnos u
KSJ 2:1. Odnos relativnih ucestalosti prideva i glagola za savremeni uzorak iznosi 1:2, a za
vremenski stariji uzorak 1:1,3.

87
Jelena Stankovi i Aleksandar Kosti

pre svega imenica, koje se mogu smatrati grubim pokazateljem relevantnosti


oznaenih pojmova u odreenom socio-kulturnom kontekstu.

LITERATURA

Kosti, . (1999). Frekvencijski renik savremenog srpskog jezika. Beograd, Institut


za eksperimentalnu fonetiku i patologiju govora i Laboratorija za
eksperimental-nu psihologiju.
Kosti, (2001). Korpus srpskog jezika. Beograd, Institut za eksperimentalnu
fonetiku i patologiju govora i Laboratorija za eksperimentalnu psihologiju.

ABSTRACT

88
Dijahronijske promene verovatnoa vrsta rei i leksike u jeziku dnevne tampe

DIACHRONIC CHANGES IN WORD PROBABILITY


DISTRIBUTIONS IN DAILY PRESS

Jelena Stankovi and Aleksandar Kosti

Laboratory for Experimental Psychology, University of Belgrade

Changes in probability distributions of individual words and word types were


investigated within two samples of daily press in the span of fifty years. Two
samples of daily press were used in this study. The one derived from the Corpus of
Serbian Language (CSL) /Kosti, ., 2001/ that covers period between 1945. and
1957. and the other derived from the Ebart Media Documentation (EBR) that was
complied from seven daily news and five weekly magazines from 2002. and 2003.
Each sample consisted of about 1 million words.
The obtained results indicate that nouns and adjectives were more frequent in
the CSL, while verbs and prepositions are more frequent in the EBR sample,
suggesting a decrease of sentence length in the last five decades. Conspicuous
changes in probability distribution of individual words were observed for nouns and
adjectives, while minimal or no changes were observed for verbs and prepositions.
Such an outcome suggests that nouns and adjectives are most susceptible to
diachronic changes, while verbs and prepositions appear to be resistant to such
changes.

Key words: Corpus linguistics, diachronic changes

89

You might also like