You are on page 1of 25

Człowiek do 90 % informacji odbiera w postaci obrazów widzialnych.

Człowiek dokonuje czynności przetwarzania, analizy i rozpoznawania


obrazów przez praktycznie cały czas swojej pracy i wypoczynku, przy
czym czynności te nasz mózg wykonuje w sposób tak szybki i naturalny, że
nie zdajemy sobie sprawy z ogromnej złożoności tego procesu.
2
Analiza procesu pozyskiwania informacji za pomocą wzroku ujawnia całą
złożoność tego, co nazywamy patrzeniem i postrzeganiem.
Zautomatyzowanie tego procesu jest bardzo trudne, przynieść jednak może
wielkie korzyści.
3
Cel przetwarzania, analizy i rozpoznawania obrazów:

Chcemy aby system (komputer) mógł udzielać odpowiedzi na proste


(dla człowieka) pytania w rodzaju:

‰ czy na obrazie występują pewne obiekty czy nie (np. pęknięcia, wżery, ...)?
‰ czy powierzchnia jest dobrze obrobiona czy nie?
‰ czy narzędzie jest dobre czy zużyte?
‰ czy tkanka jest zdrowa czy chora?
‰ czy materiał sypki wykazuje dostateczną jednorodność?
‰ ...

4
W procesie widzenia (zarówno naturalnym, jak i sztucznym) można wydzielić
następujące etapy:

‰ Akwizycja obrazu;
‰ Przetwarzanie obrazu;
‰ Analiza obrazu;
‰ Rozpoznawanie („rozumienie”) obrazu.

Akwizycja Analiza Rozpoznawanie


Obraz Opis Decyzja

Przetwarzanie 5
Akwizycja obrazu jest procesem pozyskiwania informacji o otaczającym świecie i
przekształcania jej na postać obrazu będącego notacją „wyglądu” obserwowanej sceny.
Klasyczne obrazy są obrazami analogowymi – współrzędne wybranego punktu obrazu,
jak również jego kolor, mogą przyjmować dowolne ciągłe wartości z określonych
rzeczywistych przedziałów.
Obraz cyfrowy powstaje z obrazu analogowego w wyniku procesów próbkowania i
kwantowania.
Do akwizycji obrazów cyfrowych mogą zostać wykorzystane różne urządzenia
techniczne, takie jak cyfrowy aparat fotograficzny, kamera cyfrowa, skaner.

Akwizycja Analiza Rozpoznawanie


Obraz Opis Decyzja

Przetwarzanie 6
Przez przetwarzanie obrazu rozumiemy stosowanie szeregu przekształceń
poprawiających jakość obrazu (np. eliminujących jego zbędne lub szkodliwe składowe
/zakłócenia/) pod kątem uwypuklenia treści istotnych dla analizy obrazu.
Proces poprawy jakości obrazu nie prowadzi do zwiększenia jego treści, ale może
ułatwić jej wydobycie.
Wiele koncepcji przetwarzania obrazów opiera się na adaptacji metod zapożyczonych z
innych dziedzin wiedzy (np. przetwarzania sygnałów).
Wynikiem przetwarzania obrazu jest inny, przetworzony obraz.
Przetwarzanie obrazu polega zatem na transformowaniu obrazu z jednej postaci do
drugiej.

Akwizycja Analiza Rozpoznawanie


Obraz Opis Decyzja

Przetwarzanie 7
Analiza obrazu jest procesem wyodrębniania z obrazu informacji istotnej z punktu
widzenia rozpoznawania obrazu.
Wynikiem analizy obrazu są dane (informacja) stanowiące opis obrazu.
Opis obrazu jest znacznie bardziej podatny na zastosowanie metod i algorytmów
rozpoznawania niż sam obraz.
Podczas analizy obrazu gubiona jest bezpowrotnie pewna część informacji (pełny
obraz, z setkami jego subtelnych szczegółów, zastąpiony zostaje ograniczonym
zbiorem cech).
Rezultat analizy (opis) powinien jednak zawierać informację użyteczną z punktu
widzenia rozpoznawania obrazu.

Akwizycja Analiza Rozpoznawanie


Obraz Opis Decyzja

Przetwarzanie 8
Rozpoznawanie („rozumienie”) obrazu jest procesem interpretacji zawartości obrazu.
Może ono obejmować identyfikację elementów obrazu i klasyfikację obiektów
uwidocznionych na obrazie oraz ich stanów.
Wynikiem rozpoznawania obrazu jest decyzja, będąca podstawą pojęcia dalszych
działań.
Rozpoznawanie obrazu często wymaga odwołania się do inteligencji (naturalnej lub
sztucznej).

Akwizycja Analiza Rozpoznawanie


Obraz Opis Decyzja

Przetwarzanie 9
Praktycznymi dziedzinami, w których istnieje potrzeba „sztucznego widzenia”,
czyli przetwarzania, analizy i rozpoznawania obrazów, są między innymi:

‰ robotyka (rozpoznawanie obiektów – polepszenie autonomiczności


robotów);
‰ komunikacja (wykrywanie obecności, kierunku i natężenia ruchu
pojazdów, określanie wielkości kolejki pojazdów czekających na
skrzyżowaniach, automatyczne wykrywanie kolizji i wypadków);
‰ wytwarzanie (kontrola materiałów, kontrola jakości wyrobów);
‰ metrologia (pomiary dokonywane na podstawie obrazu);
‰ geodezja i kartografia (automatyczne przetwarzanie wielkich ilości danych
obrazowych – zwłaszcza zdjęcia lotnicze i satelitarne);
‰ rozpoznawanie znaków (sortowanie przesyłek pocztowych, czytanie
etykiet, rozpoznawanie tekstu);

10
Praktycznymi dziedzinami, w których istnieje potrzeba „sztucznego widzenia”,
czyli przetwarzania, analizy i rozpoznawania obrazów, są między innymi:

‰ medycyna (automatyczna analiza i rozpoznawanie obrazów preparatów


tkankowych, rentgenogramów, ultrasonogramów, obrazów z tomografii,
itp.);
‰ wojskowość (kierowanie naprowadzaniem inteligentnej broni na
współczesnym polu walki);
‰ bioidentyfikacja (identyfikacja na podstawie: obrazu twarzy, odcisków
palców, obrazu tęczówki oka, obrazu siatkówki oka, kształtu dłoni, sposobu
chodzenia, odcisku ust, i innych cech biometrycznych);
‰ zabezpieczanie obiektów pod szczególnym nadzorem (kontrola bagaży,
nadzór nad ruchem w pewnym obszarze, wykrywanie intruzów);
‰ kryminalistyka (wyszukiwanie w obrazie cech i szczegółów nie
rozróżnialnych ludzkim wzrokiem, przeszukiwanie bazy zdjęć);
‰ astronomia i astrofizyka (analiza obrazów o zakresie widmowym
przekraczającym możliwości ludzkiego wzroku).
11
Oznaczanie szkieletu obiektu na zdjęciu
rentgenowskim dłoni:
a) obraz oryginalny;
b) poprawa kontrastu;
c) segmentacja;
d) binaryzacja;
e) szkieletyzacja;
f) „obcinanie gałęzi”;
g) „nałożenie” szkieletu na obraz oryginalny.

12
Kontrola poprawności procesu produkcyjnego
Intelligent manufacturing

System pomiaru kształtu 3D System wizyjny kontrolujący


w zastosowaniach kontroli przemysłowej poprawność wykonania płyt
głównych komputerów PC

13
Rozpoznawanie twarzy

System identyfikacji twarzy automatycznie lokalizujący Produkt jest oparty na


twarz na obrazie i przeprowadzający jej porównanie z bazą sztucznej sieci neuronowej,
danych która pozwala eliminować
takie problemy jak: obrót
głowy, różne oświetlenie,
makijaż, okulary, opaleniznę,
kolczyki, inną fryzurę,
mimikę itp.

14
Rozpoznawanie znaków

‰ System sortowania przesyłek pocztowych.


‰ Systemy wyodrębniające tekst z zeskanowanych dokumentów.

Automatyczna analiza dokumentów

15
Roboty bojowe i antyterrorystyczne

Robot bojowy SWORDS Robot antyterrorystyczny Inspektor


(firma Foster-Miller) (Przemysłowy Instytut Automatyki)

16
Inicjatywa Inteligentny Samochód (ang. Intelligent Car Initiative) ma na celu
wspieranie prac badawczo-rozwojowych w dziedzinie pojazdów bardziej
inteligentnych, ekologicznych i bezpiecznych oraz wspomaganie zastosowania i
wykorzystania wyników badań.

17
Systemy zapobiegania wypadkom spowodowanym złym stanem 18

psychofizycznym kierowcy, w szczególności zmęczeniem lub


rozproszeniem uwagi: detektory zjeżdżania z pasa jezdni, detektory
nienormalnych ruchów kierownicy, analizatory pulsu, analizatory EEG
(elektroencefalogram), detektory nieuporządkowanych ruchów głową,
detektory stanu oczu, detektory zmian wyrazu twarzy.

W USA odsetek wypadków spowodowanych złym stanem psychofizycznym kierowcy


sięga 20%.
Systemy ostrzegające przed zmianą pasa ruchu (ang. Lane Departure 19
Warning System) monitorują położenie pojazdu w obrębie danego pasa ruchu i
ostrzegają (jeśli pojazd porusza się powyżej pewnej prędkości, a kierunkowskaz
nie jest włączony), że pojazd zaraz zboczy z danego pasa lub że już zbacza.
Ocena pozycji pojazdu na jezdni odbywa się na podstawie interpretacji
obrazów rejestrowanych przez kamery umieszczone w pojeździe.
Wiele rozwiązań bazuje na wizyjnym rozpoznawaniu malowanych pasów na
jezdni (rozpoznanie błędne np. przy zaśnieżeniu drogi).

Urządzenia pomagające utrzymać pas ruchu lub wyprzedzać mogłyby zapobiec 1500
wypadkom rocznie w całej UE, jeśli posiadałoby je zaledwie 0,6 % samochodów.
System rozpoznawania zmęczenia firmy Bosch rozpoznaje objawy wyczerpania fizycznego
na podstawie ruchów kierownicy.
Typowymi oznakami malejącej koncentracji są fazy, w których kierowca w ogóle nie kieruje,
a następnie wykonuje kilka gwałtowniejszych ruchów kierownicą, aby skorygować tor jazdy.
Na podstawie częstotliwości takich typowych korekt położenia kierownicy oraz innych
parametrów, jak np. czas podróży, włączanie kierunkowskazów oraz pora dnia, system
oblicza współczynnik zmęczenia.

Jeżeli wartość współczynnika


zmęczenia przekroczy
określony próg, na zestawie
wskaźników zapala się
migająca kontrolka z
symbolem filiżanki kawy,
zachęcająca kierowcę do
postoju i odpoczynku.

20
Systemy wykrywające senność kierowcy (ang. Driver Drowsiness Monitoring and 21
Warning) kontrolują wizualnie twarz i oczy kierowcy oraz ruchy głowy.
Oczy należą do najważniejszych sygnalizatorów stanu zmęczenia człowieka. Parametrami
kontrolnymi mogą być: częstotliwość zamykania powiek, kierunek spojrzenia, ruchy gałki
ocznej, wielkość źrenicy.
Zmęczenie powoduje osłabienie mięśni szyi, co w konsekwencji ujawnia się okresowym
opadaniem głowy do przodu lub na boki.
Wyraz twarzy informuje o stanie emocjonalnym kierowcy, w tym o zmęczeniu grożącym
wypadkiem.
Kierowca jest ostrzegany w przypadku wykrycia senności lub braku uwagi.
Urządzenia budzące zasypiających kierowców mogłyby zapobiec 30 % śmiertelnych
wypadków na autostradach i 9 % wszystkich śmiertelnych wypadków.
22
Systemy ostrzegania przed przeszkodami i zderzeniem (ang. Obstacle and Collision
Warning) pomagają kierowcom zapobiec lub zmniejszyć skutki wypadków wykrywając
pojazdy lub inne przeszkody znajdujące się przed samochodem oraz ostrzegając
kierowcę przed bliskim zderzeniem.
Systemy stanowią uzupełnienie systemów adaptacyjnej regulacji prędkości jazdy (ACC).
W systemach wykorzystywane są informacje z radarów (lidarów) i kamer
umieszczonych w pojeździe.

Oprócz ostrzeżenia kierowcy, system może również wstępnie


wypełnić obwody układu hamulcowego w celu zapewnienia
pełnej siły hamowania w chwili wciśnięcia pedału hamulca,
a także wstępnie „uzbroić” poduszki powietrzne lub napiąć
wstępnie pasy bezpieczeństwa po to, by przygotować pojazd
do zbliżającego się zderzenia.
Systemy kontroli dopuszczalnej prędkości jazdy (ang. Speed Alert) ostrzegają kierowcę,
wydając sygnały dźwiękowe, wzrokowe lub dotykowe w sytuacji, gdy prędkość pojazdu
przekracza przepisowe lokalne ograniczenie prędkości.

Informacje o ograniczeniach prędkości mogą być uzyskiwane na podstawie interpretacji


obrazów rejestrowanych przez kamery umieszczone w pojeździe.

23
24
Systemy noktowizyjne (ang. Night Vision) zapewniają lepszą widoczność w nocy.

Kierowca może wykryć


wcześniej niebezpieczne
sytuacje i szybciej
zareagować.
Analizując zastosowania metod przetwarzania, analizy i rozpoznawania
obrazów w różnych dziedzinach można stwierdzić, że „sztuczne widzenie”
może mieć następujące zalety w stosunku do ludzkiego zmysłu wzroku:

‰ możliwość łatwego i taniego powielania sprawdzonych rozwiązań;


‰ możliwość automatycznego rejestrowania wyników;
‰ niższe koszty funkcjonowania;
‰ możliwość dowolnego programowania procesu przetwarzania;
‰ praca w miejscach niedostępnych dla człowieka;
‰ brak takich „ludzkich” czynników jak zmęczenie, znudzenie, stres,
podatność na przekupstwo, itp.;
‰ praca w dowolnym zakresie zarówno światła widzialnego, jak i
podczerwieni czy nadfioletu;
‰ brak strachu i oporów moralnych w walce.

25

You might also like