Professional Documents
Culture Documents
Teorija Informacija PDF
Teorija Informacija PDF
Novo znanstveno područje ”Teorija informacija”, nastalo je zbog
praktičnih problema, koji su se javljali kod projektiranja, izvođenja, rada i
održvanja komunikacijskih uređaja u telegrafsko-telefonskim i
radiokomunikacijskim sustavima i TV vezama, te svim sličnim sustavima u
kojima prenosimo, prerađujemo i pohranjujemo informacije.
U sklopu modernizacije željezničkog prometa, HŽ uvodi informacijske
sustave u poslovanje željeznice. To su: UIS (upravljačko-informacijski
sustav), PIS (poslovni informacijski sustav) i SDU (sustav daljinskog
upravljanja) te SPEV (stabilna postrojenja električne vuče). Zbog toga je za
obrazovanje kadrova na željeznici uveden predmet ”Informacijski sustavi u
željezničkom prometu” u kojem se teoretski i praktički razmatra
funkcioniranje i stanja objekata, usluga, procesi kretanja putnika, vlakova i
određena posljedica. Stvarnost je negdje između ta dva moguća stanja, a na
nama je da budućnost predvidimo sa što većom vjerojatnošću.
Mjerenjem parametara dobije se brojčni pokazatelj neizvjesnosti ili
mjera nereda i obično se naziva entropija sustava. Točno definiranje i
određivanje entropije (stanja) sustava brojčanim određivanjem pojedinih
parametara, jedan je od problema koji rješava teorija informacija.
1.2. Komunikacijski sustav
Svaki se informacijski sustav razmatra na određeni način. Tako će se i
informacije u željezničkom prometu razmatrati samo s aspekta određenih
problema na željeznici i pomoću parametara koji određuju ovu vrstu
prometa. Na jedaoj strani se stvaraju informacije u obliku signala: naredbi i
događaja (položaja skretnice, prolaza vlaka i sl.), koji čine izvor podataka.
SMETNJE
Već 1948. godine postavljeni su temelji Teoriji informacije, kad je
amerikanac C.E. Shannon objavio ”A Mathematical Theory of
Communications”. U tom je značajnom djelu obradio matematičke modele i
definirao parametre za konstruktivnu analizu tehničkih komunikacijskih
sustava. Dao je jednostavni shematski prikaz komercijalnog sustava, koji je
polazište predodžaba o funkcioniranju komunikacijskih sustava i prikazan je
sIikom 1.2.
SMETNJE
r
razvoja je primjena koja koristi teorijske postavke i dostignuća za rješavanje
konkretnih problema. Za nas je interesantna primjena kod upravljanja i
nadzora željezničkog prometa, kao i u računarskoj tehnici.
1.3.2. Definicija informacije
Informaciju možemo smatrati podatkom o nečemu, uputom,
obavještenjem. Različiiti izvori daju informacije preko suvremenih
sredstava predaje i prijenosa kao što su radio, novine, televizija, telefon,
telegraf i sl. Informaciju također možemo promatrati kao kvalitativni faktor.
Kao takva određuje stanje nekog sustava, te utjecaj jednog sustava na drugi.
Zahtijeva mogućnost mjerenja informacije, pa se ona mora kvantitativno
izraziti.
Bilo kakovu informaciju, tekst ili sliku predočvamo u obliku diskretnih
ili kontinuiranih signala (najčešće binarnih znakova) ili brojeva. Oni su
nosioci informacije i možemo ih teoretski i računski obradivati.
1.3.3. Važni parumetri za prijenos informacija
1. Prijenos signala
Tu spadaju:
U sklopu mreže trcba osigurati pouzdan rad uređaja i omogućiti
realizaciju njihova pravilnog funkcioniranja. Tako problemi mreže
rješavaju:
− uređaji za preradu podataka
− uređaji za uskladištenje podataka
− uređaji za distribuciju podataka
− kriteriji (uvjeti) za upravljanjc mrežom: sigurnost, kvaliteta, brzina
3. Optimiziranje sustava
Sustavi su sve složeniji, pa da bi se postigli: brzina, ekonomičnost i
vjernost, treba ostvariti:
− optimalne i sigurnosne kodove
Izvor informacija može dati brojeve, tekst, govor, glazbu, slike, naredbe
itd. Takve informacijc mogu biti diskretne i kontinuirane.
IZVOR KODER KODER DEKODER DEKODER
INFORMACIJA INFORMACIJA SIGNALA KANAL SIGNALA INFORMACIJA ODREDIŠTE
SMETNJE
Sl. 1.3. Detaljna blok shema komunikarijskog sustuva
(Međunarodni kodovi), zbog lakšeg prijenosa signala. Dakle u prvom
koderu odašiljača tekst se kodira, odnosno transformira u niz točaka i crta ili
nula i jedinica, pa šalje kao takav u kanal ili prije toga ponovno kodira u
koderu signala u prikladan oblik za prijenos preko kanala veze s
prijemnikom.
Koja je svrha kodiranja? Cilj i svrha kodiranja je što brži i sigurniji
prijenos poruka od odašiljača do prijemnika. To znči da se tekst pretvara u
oblik što je moguće kraćih (zbog brzine) niza znakova, a da pri tome
vjerojatnost pogrešnog prijema bude što manja, odnosno točnost prijema
ispravnog sadržaja teksta što veća (zbog sigurnosti).
1. Prvi teorem ispunjava koder informacije, a znači: "sadržaj informacije
jednak je prosječnom broju binarnih znamenaka poruke".
2. "Uz određene uvjete signali se mogu kodirati i dekodirati tako, da
vjerojatnost pogrešnog prijama informacije bude po volji malena".
faktora. Navedeno će biti pet najvažnijih.
Struktura mreže. Mogući su različiti zahtijevi kao npr. a) kanal veze
mora biti stalno spojen izmedu dvije fiksne točke i b) drugi kanali veze za
prijenos podataka uk1jučuju se automatskom komutacijom.
Karakter poruke. Poruka može biti zvučna, slika, podaci štampača, slova,
brojke. Važni su zahtjevi korisnika na izobličenja poruke.
prenose kao niz izmjeničnih ili istosmjernih impulsa napona ili struje.
Pod kanalom veze podrazumijeva sc dio komunikacijskog sustava (vidi
točnih informacija. Pri tom je važna brzina prijenosa podataka. Maksimalna
brzina kojom se podaci mogu prenositi je propusna moć kanala veze.
Prijenos informacija ovisi i o stanju kanala, koje se mijenja ovisno o:
prethodno prenesenim signalima; to je kanal s određenom memorijom,
kapacitetu kanala; to je i propusna moć nekog kanala bez memorije.
Kapacitet C kanala zavisi i o frekvencijskom opsegu prijenosnog sustava,
trajanju signala i o omjeru veličina signala i šuma.
Važno je znati, da je nemoguće postići brzinu prijenosa informacija veću
od kapaciteta kanala. Medutim, paralelnim spajanjem kanala veze ili preko
multipleksera, moguće je povećati brzinu prijenosa informacija.
Prijenos diskretnim kanalima K1 i K2 bez memorije s kapacitetima C1 i
C2 ima slijedeću ovisnost. Kad kanale K1 i K2 paralelno spojimo dobiti ćemo
1.6. Informacija
Da bi se informacija mogla kvantitativno razmatrati, mora se prikazati
brojem. U takvom se obliku informacija može tretirati poput bilo koje fizikalne
veličine (puta, brzine, energije, sile itd.), kvalitativno i kvantitativno.
ODAŠILJAČ
x y=f(x,z) PRIJEMNIK
KANAL
z
SMETNJE
odrediti i definirati parametre I(x) (vlastite informacije) obzirom na
prispjelu I(x,y) informaciju. Vjerojatnost je mjera određenosti nastupa
događaja ili informacije, koja je slučajna veličina i podliježe statistici.
Teoretsko razmatranje toka informacija u komunikacijskim sustavima nije
moguće bez poznavanja računa vjerojatnosti i statistike.
1.7. Izvor informacije
u odašiljač će biti upisano ”n” znakova teksta koji sadržava znakove
abecede, brojeve, interpunkcije, adresu primaoca i naredbe (start, stop i sl.).
Da bi se teoretski razmatralo ovakav sustav, mora se načiniti matematički
svi znakovi abecede. Tako npr. slova naše abecede imaju konačn broj
znakova i čine skup X koji sadrži 27 elemenata, pa ”n” poprima vrijednosti
od 1 do 27. Međutim za bolje sporazumijevanje, tekst koji predstavlja našu
veze. Zbog toga skup simbola za korektno prenošenje poruka treba imati
znatno više od 27 elcmenata. Za brzu i kvalitetnu vezu dvaju korisnika
(odašiljača i prijemnika) trebalo bi osigurati i isto toliko kanala, koliko ima
broj kombinacija:
X=Bn.
Tako npr. u binarnom sustavu s n=7 elemenata (simbola) možemo
načiniti maksimalno X=27=128 brojeva ili znakova.
3. Smetnje se superponiraju korisnim signalima i oni u prijemnom dijelu
više nemaju izvorni oblik.
Dio sustava koji sadrži koder na ulazu, a dekoder na izlazu, možemo
nazvati komunikacijskim sustavom predočenim slikom 1.6. Na ulaz u taj
sustav dolaze slučajni događaji iz skupa X. Na izlazu će se takvi kodirani
događaji pojaviti kao elementi članova skupa Y koji čine m-člani niz:
y = (y1,y2,….ym) j=1,2,….m.
Suština procesa prijenosa informacija je u tome da se od n simbola na
ulazu (npr. xi od skupa X) na izlazu primijeti yj, a nakon toga odluči koji je
simbol bio predan ulazu.
4. Kod slanja poruka koristimo ”jezik” u kojem vladaju određene
statističke zakonitosti. Tako se frekvencija pojavljivanja simbola određuje
vjerojatnostima. Npr. xi se pojavljuje s apriornom (prije događaja)
vjerojatnošću p(xi).
Sustav čine realni sklopovi i mediji. U njima djeluju slučajni događaji
kao što su šumovi, smetnje i izobličenja. Stoga se događaju xi može
pridružiti događaj yj. Ali takva se pridruživanja ne događaju stalno. Svaki će
p(xi/yj).
Istovremeno pojavljivanje parova ili združena vjerojatnost p(xi,yj) može
simbola xi.
1.7.1. Sadržaj informacije
razmatranjem. To znači da se svaka informacija mora kvantitativno izraziti.
Promatranjem događaja i činjenica došlo se do zaključka da je mjera
količine informacija koju donosi pojedini signal, logaritamskog karaktera.
Predloženo je da se signalu koji se bira iz skupa ” n ” mogućih signala
pridruži informacija I(n) = log n.
Obično se informacija sastoji od barem dvaju podataka iz skupova s ”m”
i ”n” mogućih signala. Poruka što ju takav par nosi jednaka je izrazu:
I(m n) = I(m) + I(n),
te je logično da je informacija I logaritamska funkcija i zbraja se prema
izrazu:
log(m n) = log m + log n.
Informacija je svaki prirodni broj ”n” i log n > 0. To znači da je
p xi / y j
( )
I xi ; y j = log
p (xi )
( )
I xi ; y j = ld
p (xi )⋅ p (y j ) p (xi )⋅ p (y j )
pa se iz toga vidi da je sadržaj informacije simetrična funkcija u odnosu
na događaje xi i yj, odnosno vrijedi:
I(xi;yj) = I(yj;xi).
U komunikacijskim sustavima nisu nam interesantni pojedini znakovi
(sadržaji informacija), već svojstva sustava u cjelini. To se postiže
uvođenjem srednjih (prosječnih) sadržaja informacija u odnosu na cijeli
skup događaja. Sada sadržaj informacije, s pripadajućim vjerojatnostima,
čine statistički skup X, za koji se mogu računati prosjeci. Veličina I(X;yj)
predstavlja srednji sadržaj informacije koju donosi primljeni simbol yj, a
koji se odnosi na skup svih predanih simbola X.
Veličina I(X) predstavlja srednji vlastiti sadržaj informacije. Ona
predstavlja onaj iznos informacija koji je u prosjeku potreban da bi se
odredila bilo koja pojedinačna vijest iz skupa X mogućih vijesti koje se
prenose nekim sustavom. Uobičajeno je pisati za I(X) i H(X). U tom se
slučaju zove entropija diskretne slučajne veličine X. H(X) ili entropija je
mjera neizvjesnosti ili kvantitativna mjera neodređenosti neke vijesti, prije
prikazani na slici 1.5.
Prethodno navedeni izrazi za vezu srednjeg sadržaja informacija i
SMETNJE
Zbog toga signali na prijemnu stranu ulaze kao modificirani elementarni
simboli i označeni su: (y1,y2,….yn).
Mjera neizvjesnosti ili entropija srednjeg sadržaja izlaznih informacija iz
komunikacijskog sustava, koji ulaze u prijemnik, označena je kao H(Y). To
je srednji sadržaj stvarno primljene informacije.
Zbog gubitaka u sredstvima prijenosa, jedan dio informacija nestaje.
Označen je kao H(X/Y) i predstavlja srednji sadržaj izgubljenih informacija.
Veličina I(X;Y) je obzirom na odašiljač, preneseni dio informacija od izvora
k odredištu i ima smisao transformacije, pa se označava i kao HT.
Veličina I(X; Y) zove se i srednji uzajamni sadržaj informacije, jer to je i
srednji sadržaj primljene informacije. Na prijemni dio osim korisnih signala, stigle
su i smetnje označene kao H(Y/X). Zato se veličina H(Y/X) zove i ”entropija
šuma”. Ona ne predstavlja korisnu informaciju već dio primljene informacije, koji
je povećan za iznos smetnji, kojima je šum najveći doprinos. Veličina H(Y/X)
može se lako odrediti mjerenjem na realnom sustavu, a teže teoretski, jer je
određena strukturom smetnji i karakterom njihove interakcije sa signalom.
1.8. Kodiranje
Postoji nekoliko tipova kodova, već prema broju elemenata i oni mogu
biti višeznačni tj. mogu imati 5, 6, 7 ili 8 elemenata u kodnoj kombinaciji.
Kodovi mogu biti ravnomjerni i neravnomjerni. Ravnomjerni imaju
se može predočiti kao jedan strujni (ili naponski) impuls. Signal trajanja to
predstavlja točku, a signal koji traje 3t0 predstavlja crtu. Razmak između
impulsa je bezstrujni (ili beznaponski) impuls trajanja to. Slovo "e"
predstavlja točka, a vrijednost broja nula predstavlja 5 crta. To su primjeri
različitog trajanja pojedinih kodnih znakova. U Morzeovom kodu prosječan
broj elemenata za jedan znak je velik (oko 9.5 elementarnih impulsa po
znaku) i zbog toga je neekonomičan. Koristi se za vezu radiotelegrafista, jer
je od svih kodova najprikladniji za prijem na sluh, zbog najmanjeg utjecaja
smetnji.
Tablica 1. Morzeov kôd
1.8.2. Ravnomjerni kôd
ravnomjernom kodu npr. binarni broj 24 sačinjavaju 2 jedinice i 3 nule. Ako
kod ima 25 = 32 kombinacije, a to znači 5 elemenata, onda će mu signal
izgledati kao niz 11000, tj. ima 5 elementarnih simbola. Broj 3 se može
prikazati samo s dvije jedinice, ali u ravnomjernom kodu kojeg čine po 5
elemenata, treba imati 5 impulsa u znaku, pa će broj 3 izgladati kao niz
00011, tj. dodati će se jedinicama onoliko nula koliko je potrebno do
ravnomjernog broja, a to znači i jednakog trajanja signala za pojedini znak
(u ovom slučaju 5 to).To je potrebno zbog jednostavnije tehničke izvedbe
uređaja za odašiljanje i prijem signala.
Tipičan primjer petoznačnog ravnomjernog koda je Međunarodni kod
broj 2, koji koriste teleprinteri. Takvi su kodni signali i odgovarajuće rupice
na perforiranoj traci, prikazani tablicom 2.
Nule i jedinice mogu se odašiljati bilo kao strujni i bezstrujni impulsi, ili
kao pozitivni i negativni impulsi. Prije slanja kombinacije znaka daje se
polazni (start) impuls (trajanja to) koji je bezstrujni, zatim slijedi 5
elementarnih impulsa poslanog znaka, a na kraju strujni stop impuls
(trajanja 1,5 to prema CCITT standardima). Na slici T.I.7. prikazan je oblik
teleprinterskog signala slova D.
Teleprinter zbog malog broja kodnih kombinacija (25 = 32) nema malih
slova. Brojevi od 0 do 9 i znakovi interpunkcije, koriste iste kodne
kombinacije koje vrijede i za slova. Piše se jednostavno s označenim
tipkama na tastaturi, dok teleprinter automatski prebacuje pisanje sa slova
na brojeve i obrnuto.
START
to
1 2 3
5 to
4
5 STOP
1,5 to
t
Ts = 7,5 to
zove i donji (od 0 do broja 127). U računalima se koristi i gornji ASCII kod
(od broja 128 do 255) prikazan tablicom 4.
naših slova č,ć,đ,š i ž), umjesto znakova za specijalne namjene (npr. uglate i
vitičaste zagrade).
Ovako su smješteni znakovi naše abecede prema starom standardu JUS I
B1.002.
Tablica 3. ASCII kod
Tablica 4. Gornji dio ASCII koda
Međunarodni standardi predviđaju znakove za različite jezike u gornjem
dijelu ASCII tablice kodova. To je 8-bitni ASCII kod, već važeći standard,
predočen tablicom 4.
U najnovijem MS (MicroSoft) DOS (Disk Operating System) 5 programu,
određena su mjesta za naše posebne znakove tzv. afrikate. Taj je program
modificiran srazmjerno razvoju grafički orjentiranom multimodalnom
operacijskom sustavu Windows, s posebnim multinacionalno orjentiranim
kodnim stranicama. Osnovicu ovog sustava čini ANSI kod, a za slavensko
europsko područje inačica Latin 2 prikazana tablicom 5.
Tablica 5. Latin 2 kod
1.8.4. Kodovi za otkrivanje i ispravljanje pogrešaka
otkrivanje pogrešaka u toku prijenosa informacija. Druga je namjena
detektiranje i ispravljanje nastalih pogrešaka.
U informacijskim i komunikacijskim sustavima koristi se binarni kod (s
dekodirati dobiveni izlazni niz veličina y. To nazivamo "shemom
odlučivanja", a znači funkcijski određnu zavisnost varijable x o prispjeloj y.
Ta funkcija mora biti tako definirana, da šo višsmanji utjecaj smetnji. Dakle
osnovna ideja "sheme odlučvanja" ili funkcijske zavisnosti x o y je u tome,
da se "međsobno pridružju najvjerojatniji" ulazni i izlazni nizovi.
U "idealnoj shemi odlučvanja" ili ustanovljavanja pogreška, uspoređuju
se nizovi kombinacija elemenata i određje njihova razlika. Pri tome se misli
na razlike između poslane poruke x i primljene y. Ta se razlika definira kao
"udaljenost" d, a ona je zapravo funkcija x i y varijabli ili d = f(x,y). U
literaturi se navodi i kao Hammingova udaljenost binarnih nizova x i y. Radi
što sigurnijeg prijenosa informacija, nizovi se biraju tako, da njihove
međusobne Hammingove udaljenosti budu što je moguće veće.
d ≥ 2 ip + 1 .
Ovdje "ip" predstavlja broj ispravljenih pogrešaka. Prema tom izrazu, što
ispravan rad izlaznih jedinica, poput štampača kod računala ili bušača kod
teleprintera. Taj impuls kontrolira ispravan rad terminalnih jedinica i
b1 b2 b3 b4 b5 b6 b7 b8
t
1 2 3 4 5 6 7 8
to 2 to
START 8 to STOP
Ts = 11 to
Sl.1.9. Oblik odaslanog signala slova D prema 7-bitnom ASCII kodu
prema ASCII kodu ima slijedeće oznake: 44 (heksadecimalna) 1000100
(binarna b7,b6,b5,b4,b3,b2,b1) i 068 (decimalna). Budući da ima parni broj