You are on page 1of 11

Προβολή του Κόσμου σε μια Εικόνα-Τεχνητή Όραση

Δρ Ταουκτσόγλου Αναστασία
Τμήμα Μηχανικών Παραγωγής & Διοίκησης, Πολυτεχνική Σχολή,
Δημοκρίτειο Πανεπιστήμιο Θράκης,
ataoukts@pme.duth.gr

Περίληψη.
Η προβολή του τριδιάστατου χώρου στις δύο διαστάσεις αποτέλεσε
πρόκληση από την αρχαιότητα ακόμη για καλλιτέχνες και επιστήμονες. Στη
σύγχρονη εποχή της τεχνολογίας είναι ένα θέμα καθημερινής χρήσης. Η
παρούσα εργασία επιχειρεί, να παρουσιάσει τα Μαθηματικά, που κρύβονται
πίσω από την προοπτική προβολή του τριδιάστατου χώρου στο επίπεδο μιας
φωτογραφίας ή μιας οθόνης. Η Προβολική Γεωμετρία, οι Ομογενείς
Συντεταγμένες, οι Πίνακες Προβολικών Απεικονίσεων, Αφφινικών και
Ισομετρικών Μετασχηματισμών του επιπέδου και του χώρου, η Ομοιότητα
των Τριγώνων συστρατεύονται, προκειμένου να «χαθεί σωστά μια
διάσταση». Διδακτικός στόχος της εργασίας είναι, να παρουσιάσει στους
μαθητές/φοιτητές, οι οποίοι διδάσκονται θεωρητικά αυτά τα μαθηματικά
εργαλεία, μια εφαρμογή αυτών στην Τεχνητή Όραση.
Λέξεις-Κλειδιά. Όμοια Τρίγωνα, Κόλουρη Πυραμίδα Θέασης, Ομογενείς
Συντεταγμένες, Προβολικό Επίπεδο, Κατ’ εκδοχήν Σημεία, Σημεία Φυγής,
Πίνακες, Γεωμετρικοί Μετασχηματισμοί, Τεχνητή Όραση.

Abstract.
The projection of three-dimensional space in two dimensions has been a
challenge for artists and scientists since ancient times. In the modern age of
technology it is a matter of daily use. This paper attempts to present the
Mathematics, which are hidden behind the perspective projection of three-
dimensional space at the plane of a photograph or a screen. Projective
Geometry, Homogeneous Coordinates, Matrices of Projective Mappings,
Affine and Isometric Transformations of plane and space, Similarity of

38ο Πανελλήνιο Συνέδριο Μαθηματικής Παιδείας © Ε.Μ.Ε. - 2023


698 38ο Πανελλήνιο Συνέδριο Μαθηματικής Παιδείας

Triangles conspire in order to "correctly lose a dimension". The didactic


objective of the work is to present to the students, who are taught
theoretically these mathematical tools, an application of them in Artificial
Vision.
Key Words. Similar Triangles, View Frustum, Homogeneous Coordinates,
Projective Plane, Points at Infinity, Vanishing Points, Matrices, Geometric
Transformations, Artificial Vision.

1. Συστήματα Συντεταγμένων
Θέλουμε να προβάλλουμε σε εικόνα ένα αντικείμενο του χώρου. Η
εικόνα αυτή μπορεί να είναι ένα παράθυρο, μέσα από το οποίο βλέπουμε το
αντικείμενο, ένας πίνακας ζωγραφικής, μία φωτογραφία, ή η οθόνη ενός
υπολογιστή. Το επίπεδο, πάνω στο οποίο κείται η εικόνα μας, καλείται
επίπεδο προβολής (image plane). Τότε, το αντικείμενο, που θέλουμε να
απεικονίσουμε, κείται μεταξύ του επιπέδου προβολής και ενός παραλλήλου
προς αυτό επιπέδου, το οποίο οριοθετεί το τέλος του οπτικού μας πεδίου.
Το ορθογώνιο πλαίσιο της εικόνας μας, το επίπεδο αυτό και η θέση του
ματιού μας (ή της κάμερας) ορίζουν μια κόλουρη πυραμίδα, η οποία
καλείται κόλουρη πυραμίδα θέασης (view frustum) (βλ. [1]). Οποιοδήποτε
αντικείμενο βρίσκεται εντός της κόλουρης πυραμίδας θέασης θα προβληθεί
στην εικόνα μας, ενώ οποιοδήποτε αντικείμενο εκτός αυτής δεν θα
προβληθεί (βλ. Σχήμα 1).

Σχήμα 1: Επίπεδο Προβολής και Κόλουρη Πυραμίδα Θέασης

Η θέση του αντικειμένου, που θέλουμε να απεικονίσουμε,


προσδιορίζεται από ένα (ακίνητο) καρτεσιανό σύστημα συντεταγμένων
OUVW , το οποίο καλείται παγκόσμιο σύστημα συντεταγμένων (world
coordinate system) και είναι ανεξάρτητο από θέση C της κάμερας ή του
επιπέδου προβολής.
38ο Πανελλήνιο Συνέδριο Μαθηματικής Παιδείας 699

Στη θέση C , από την οποία βλέπουμε το αντικείμενο, θεωρούμε, ότι


υπάρχει ένα δεύτερο καρτεσιανό σύστημα συντεταγμένων CXYZ , το οποίο
καλείται σύστημα συντεταγμένων της κάμερας (camera coordinate system).
Το επίπεδο προβολής θεωρούμε, ότι βρίσκεται ανάμεσα στη θέση C και το
αντικείμενο. Ο Z -άξονας του
συστήματος CXYZ
επιλέγεται κάθετος στο
επίπεδο προβολής με φορά
αντίθετη από αυτήν προς το
αντικείμενο και καλείται
οπτικός άξονας (optic axis)
(βλ. Σχήμα 2). Έτσι, αν f
είναι η απόσταση του
σημείου C από το επίπεδο
προβολής, τότε η εξίσωση Σχήμα 2: Σύστημα Συντεταγμένων
του επιπέδου προβολής στο της Κάμερας CXYZ και της Εικόνας Ixy
σ.σ. CXYZ είναι Z  f .
Η απόσταση f καλείται εστιακό μήκος (focal length) και το σημείο C
οπή (pinhole). Ο οπτικός άξονας τέμνει το επίπεδο προβολής στο σημείο  ,
το οποίο καλείται οπτικό κέντρο (optical center).
Πάνω στο επίπεδο προβολής και με αρχή το οπτικό κέντρο  θεωρούμε
ένα τρίτο καρτεσιανό σύστημα συντεταγμένων xy του επιπέδου, τέτοιο
ώστε ο άξονας x ' x να είναι ομόρροπος του άξονα  '  του σ.σ. της
κάμερας και ο άξονας y ' y να είναι ομόρροπος του άξονα Y 'Y του σ.σ.
της κάμερας. Το σύστημα
συντεταγμένων αυτό καλείται
σύστημα συντεταγμένων της
εικόνας (image coordinate
system) (βλ. Σχήμα 2).
Τέλος, καθώς ο σκοπός μας
είναι να απεικονίσουμε το
αντικείμενό μας σε μια οθόνη, Σχήμα 3: Σύστημα Συντεταγμένων
θεωρούμε ένα ακόμη σύστημα Εικόνας Ixy και Εικονοστοιχείων Puv
συντεταγμένων Puv , του
οποίου η αρχή P είναι τοποθετημένη στην πάνω αριστερή κορυφή της
οθόνης προβολής, u είναι ο αριθμός, που δείχνει πόσα pixels δεξιά
βρισκόμαστε και v είναι ο αριθμός, που δείχνει πόσα pixels κάτω
βρισκόμαστε από την αρχή P . Το σύστημα συντεταγμένων Puv καλείται
700 38ο Πανελλήνιο Συνέδριο Μαθηματικής Παιδείας

σύστημα συντεταγμένων των εικονοστοιχείων (pixel coordinate system) (βλ.


Σχήμα 3).

2. Σχέσεις μεταξύ των Συστημάτων Συντεταγμένων


2.1. Παγκόσμιες Συντεταγμένες και Συντεταγμένες Κάμερας
Ας θεωρήσουμε ένα σημείο  με συντεταγμένες  (U, V, W) ως προς το
παγκόσμιο
  
σ.σ., του οποίου τα μοναδιαία διανύσματα των αξόνων ας είναι
i W , jW , k W αντίστοιχα. Το σημείο  θα έχει συντεταγμένες (  ,  , ) ως
προς το σ.σ.
  
της κάμερας, του οποίου τα μοναδιαία διανύσματα των αξόνων
ας είναι iC , jC , k C αντίστοιχα. Έστω επίσης C(U 0 , V0 , W0 ) οι συντεταγμένες
του σημείου C ως προς το παγκόσμιο σ.σ.
     
Ως γνωστόν, τα σύνολα  i W , jW , k W  και i , j , k 
C C C αποτελούν δύο
βάσεις του χώρου. Επομένως, αν R είναι ο πίνακας μετάβασης από τη
       r11 r12 r13 
βάση  i W , jW , k W  στη βάση  iC , jC , k C  , τότε ισχύει R   r21 r22 r23  , όπου
 
r r r 
 31 32 33 
   
iC  r11 i W  r12 jW  r13k W
   
jC  r21 i W  r22 jW  r23k W (1)
   
k C  r31 i W  r32 jW  r33k W
Καθώς οι δύο παραπάνω βάσεις του χώρου είναι ορθοκανονικές, ο πίνακας
R είναι ορθογώνιος, δηλ.

R   R 1. Έτσι,

ισχύει 1
i W  r11 iC  r21 jC  r31k C
   
jW  r12 iC  r22 jC  r32 k C (2)
   
k W  r13 iC  r23 jC  r33k C
      
Ως γνωστόν, OA  OC  CA , όπου OA  U i W  VjW  Wk W και
   
OC  U 0 i W  V0 jW  W0 k W . Άρα,

1
Οι σχέσεις (2.2) υποδεικνύουν έναν πρακτικό τρόπο σχηματισμού του πίνακα R :
Κοιτώντας το μοναδιαίο διάνυσμα i W του άξονα U 'U του παγκόσμιου σ.σ. από το σύστημα

συντεταγμένων της κάμερας, εκφράζουμε το iW ως γραμμικό συνδυασμό των διανυσμάτων
      
της βάσης  iC , jC , k C  , δηλ. i W  r11 i C  r21 jC  r31k C και τις συντεταγμένες του τις γράφουμε ως 1η
 
στήλη ενός πίνακα. Συνεχίζουμε ανάλογα με τα διανύσματα jW , k W . Ο πίνακας, που
σχηματίζεται με τον τρόπο αυτό, είναι ο πίνακας R.
38ο Πανελλήνιο Συνέδριο Μαθηματικής Παιδείας 701
     
C    C  (U  U 0 ) i W  (V  V0 ) jW  (W  W0 )k W (3)
Αλλά ισχύει επίσης    
CA  X iC  YjC  Zk C . (4)
Εξισώνοντας τα δεξιά μέλη των (3), (4) και με τη βοήθεια των (1)
βρίσκουμε, ότι για το τυχαίο σημείο  του χώρου οι συντεταγμένες του
(U, V, W) ως προς το παγκόσμιο σ.σ. και οι συντεταγμένες του ( ,  , ) ως
προς το σ.σ. της κάμερας συνδέονται με τη σχέση
   U   U0  
      (5)
    R   V    V0  
    W   W0  
     
Παρατηρούμε, ότι η σχέση, που συνδέει τις συντεταγμένες του  ως
προς τα δύο σ.σ., μπορεί να ερμηνευθεί ως μια μεταφορά κατά
  U 0 V0 W0  , ώστε τα δύο σ.σ. να αποκτήσουν την ίδια αρχή, και στη

συνέχεια μία στροφή, ώστε να «ευθυγραμμιστούν» οι άξονες. Λόγω της


μεταφοράς αυτής, η οποία δεν αποτελεί γραμμικό μετασχηματισμό, δεν
μπορεί να εκφραστεί ως γινόμενο πινάκων ο μετασχηματισμός από τις
παγκόσμιες συντεταγμένες στις συντεταγμένες κάμερας. Τη λύση στο
πρόβλημα αυτό έρχονται να δώσουν οι ομογενείς συντεταγμένες.

2.2. Ομογενείς Συντεταγμένες


Ας θεωρήσουμε ένα σημείο  με συντεταγμένες ( ,  , ) ως προς ένα
οποιοδήποτε καρτεσιανό σ.σ. του χώρου. Θεωρούμε, ότι κάθε διατεταγμένη
τετράδα αριθμών [  ',  ',  ', W '] , για την οποία ισχύει
' ' '
 ,  ,   (W '  0) (6)
W' W' W'
αποτελεί μία τετράδα ομογενών συντεταγμένων (homogeneous coordinates)
για το  (βλ. [2], σελ. 117). Γράφουμε συμβολικά [  ',  ',  ', W '] 2.
Θεωρούμε επίσης, ότι η τετράδα [0,0,0,0] δεν αποτελεί τετράδα ομογενών
συντεταγμένων κανενός σημείου.
Οι ομογενείς συντεταγμένες μάς επιτρέπουν, να ενσωματώσουμε τα κατ’
εκδοχήν σημεία του χώρου, τα οποία ορίζονται ως αυτά με ομογενείς
συντεταγμένες της μορφής [  ',  ',  ',0] , όπου  '2   '2   '2  0 και έτσι
να περάσουμε από τον ευκλείδειο στον προβολικό χώρο.

2
Συχνά χρησιμοποιείται ο συμβολισμός  [  :  :  : W] , προκειμένου να τονιστεί, ότι η
αναλογία των ομογενών συντεταγμένων διατηρείται σταθερή.
702 38ο Πανελλήνιο Συνέδριο Μαθηματικής Παιδείας

Παρατηρούμε, ότι ενώ σε κάθε τετράδα ομογενών συντεταγμένων


[  ',  ',  ', W '] , όπου  '2   '2   '2  W 2  0 , αντιστοιχεί ακριβώς ένα
σημείο, σε κάθε σημείο αντιστοιχούν άπειρες τετράδες ομογενών
συντεταγμένων. Ωστόσο, αν [  ',  ',  ', W '] είναι μια τετράδα ομογενών
συντεταγμένων ενός σημείου, τότε όλες οι τετράδες ομογενών
συντεταγμένων του σημείου αυτού είναι [ ',  ',  ', W '] , όπου λ
πραγματικός μη μηδενικός αριθμός, πράγμα που δικαιολογεί και το όνομα
ομογενείς.
Για ένα σημείο του χώρου με καρτεσιανές συντεταγμένες ( ,  , )
συνήθως θεωρούμε ως ομογενείς συντεταγμένες την τετράδα [  ,  , ,1] .
Με τη βοήθεια των ομογενών συντεταγμένων η σχέση (2.5) παίρνει τη
μορφή
    r11 r12 r13 0  1 0 0  U 0  U 
     
     r21 r22 r23 0  0 1 0 V0  V  , (7)
    r31 r32 r33 0  0 0 1  W0  W 
     
1  0 0 0 1 
 0 0 0 1  1 
όπου ο μετασχηματισμός των συντεταγμένων από το παγκόσμιο σ.σ. στο
σ.σ. της κάμερας έχει εκφραστεί πλέον ως γινόμενο πινάκων.

2.3. Συντεταγμένες Κάμερας και Συντεταγμένες Εικόνας


Ας θεωρήσουμε ένα σημείο  με συντεταγμένες ( ,  , ) ως προς το
σ.σ. της κάμερας. Το σημείο αυτό θα απεικονιστεί στο σημείο (x, y) του
επιπέδου προβολής. Προβάλλοντας το σημείο  στους άξονες του σ.σ. της
εικόνας σχηματίζονται δύο ζεύγη όμοιων ορθογωνίων τριγώνων, όπως
φαίνονται στο Σχήμα 4.
38ο Πανελλήνιο Συνέδριο Μαθηματικής Παιδείας 703

Σχήμα 4: Αναλογία διαστάσεων αντικειμένου και ειδώλου


Από την αναλογία των πλευρών τους προκύπτουν οι σχέσεις
x 
 ,
y Y
 δηλ. x  f  , y  f Y . Έτσι, θεωρούμε ως εικόνα του
f  f   
σημείου (  ,  , ) πάνω στο επίπεδο προβολής το σημείο με ομογενείς
συντεταγμένες [fX,fY, Z] . Οι ομογενείς συντεταγμένες του σημείου 
υπολογίζονται τότε από το γινόμενο των πινάκων

 x   f 0 0 0   
      (8)
 y    0 f 0 0  
 z   0 0 1 0   
    1 
 
Λαμβάνοντας υπόψη τη (7) βρίσκουμε τη σχέση μεταξύ ομογενών
συντεταγμένων του  στο σ.σ. της εικόνας και ομογενών συντεταγμένων
του  στο παγκόσμιο σ.σ.
 r11 r12 r13 0  1 0 0  U 0  U 
 x   f 0 0 0     
     r21 r22 r23 0  0 1 0  V0  V  (9)
 y    0 f 0 0 r r32 r33 0  0 0 1  W0  W 
    31
 z   0 0 1 0   0 0 0 1 

0 0 1 
 
  0  1 

2.4. Συντεταγμένες Εικόνας και Συντεταγμένες Εικονοστοιχείων


Το τελευταίο βήμα, που έχει μείνει, είναι να βρούμε τις συντεταγμένες
της εικόνας  στο σ.σ. Puv των εικονοστοιχείων της οθόνης. Αν το οπτικό
κέντρο  έχει απόσταση d x από την αριστερή πλευρά της οθόνης και
απόσταση d y από την πάνω πλευρά της οθόνης, τότε η θέση (u, v) της
εικόνας  στο σ.σ. Puv δίνεται από τις σχέσεις (βλ. Σχήμα 5)
704 38ο Πανελλήνιο Συνέδριο Μαθηματικής Παιδείας

u  x  dx
(10)
v  y  dy

Στο σ.σ. των


εικονοστοιχείων Puv οι
συντεταγμένες u, v είναι
Σχήμα 5: Σχέσεις μεταξύ Συντεταγμένων Εικόνας φυσικοί αριθμοί, που
και Συντεταγμένων Εικονοστοιχείων υποδεικνύουν τη στήλη
και τη γραμμή του αντίστοιχου εικονοστοιχείου. Για το λόγο αυτό, αν s x ,s y
είναι οι διαστάσεις κάθε εικονοστοιχείου, οι σχέσεις (10) πρέπει να
τροποποιηθούν σε
x y (11)
u  Ix , v    Iy
sx sy

όπου I x  d x , I y  d y είναι οι συντεταγμένες του οπτικού κέντρου  στο


sx sy
σ.σ. των εικονοστοιχείων.
 u  1 s x 0 I x  x 
Σε ομογενείς συντεταγμένες γράφουμε       .
 v    0 1 s y I y  y 
 w   0 0 1  
    z 
Θεωρώντας τη σχέση ισοδυναμίας ~ μεταξύ των τριάδων ομογενών
συντεταγμένων του ίδιου σημείου του επιπέδου, γράφουμε
 u  1 s x 0 I x  x 
     
 v  ~  0 1 s y I y  y  (12)
1  0 
0 1  z  
  
Από τις σχέσεις (9) και (12) έχουμε τελικά
0  U 0  U 
 r11 r12 r13 0  1 0
 u  1 s x 0 I x  f 0 0 0     
 ~  0  V0  V  (13)
  r21 r22 r23 0  0 1
 v   0 1 s y I y  0 f 0 0   r 1  W0  W 
r32 r33 0  0 0
1  0 0 1   31
    0 0 1 0   00 1 0
 
0

1 
  1   0 0
Από την παραπάνω σχέση βρίσκουμε την εικόνα (u, v) στο σ.σ. των
εικονοστοιχείων, αν γνωρίζουμε το προς απεικόνιση σημείο (U, V, W) στο
παγκόσμιο σ.σ.
Παρατηρούμε, ότι η έκφραση της σχέσης των συντεταγμένων των δύο
σημείων με τη βοήθεια πινάκων διευκολύνει τον υπολογισμό, αλλά
παράλληλα επιτρέπει τροποποιήσεις σε ενδιάμεσα στάδια.
38ο Πανελλήνιο Συνέδριο Μαθηματικής Παιδείας 705

1 s x 0 I x 
Παρατηρούμε επίσης, ότι ο πίνακας  0 1 s y I y  μπορεί να θεωρηθεί
 
 0 0 1 
 
ως πίνακας ενός αφφινικού μετασχηματισμού (μεταφοράς και κλιμάκωσης)
μεταξύ των συντεταγμένων της εικόνας και των συντεταγμένων των
f 0 0 0
εικονοστοιχείων. Ο πίνακας  0 f 0 0  μπορεί να θεωρηθεί ως πίνακας
 
0 0 1 0
 
 r11 r12 r13 0
 
προβολικής απεικόνισης του χώρου σε επίπεδο, ενώ ο πίνακας  r21 r22 r23 0
 r31 r32 r33 0
 
0 0 0 1 
μπορεί να θεωρηθεί ως πίνακας στροφής των αξόνων του χώρου. Μπορεί
μάλιστα να αναλυθεί σε γινόμενο τριών στροφών, μιας γύρω από κάθε
άξονα.
Η σχέση (13) γράφεται πιο σύντομα (βλ. [3], σελ. 19)
 r11 r12 r13 c1  U 
 u  1 s x 0 I x  f 0 0 0    
  ~    r21 r22 r23 c 2  V  (14)
 v   0 1 s y I y  0 f 0 0   r r32 r33 c3  W 
1  0 0 1   31
    0 0 1 0   0 0 0 1 
 
  1 
όπου ci  ri1U 0  ri2 V0  ri3 W0 , i  1, 2,3 .

3. Προοπτική Προβολή
Καθορίζοντας τη θέση της κάμερας C και το εστιακό μήκος f
προβάλλουμε τον κύβο του παρακάτω σχήματος πάνω στο επίπεδο

Σχήμα 6: Προοπτική Προβολή Κύβου και Σημεία Φυγής F1,F2,F3


706 38ο Πανελλήνιο Συνέδριο Μαθηματικής Παιδείας

προβολής με τη βοήθεια της (14). Στην προοπτική αυτή προβολή του


αντικειμένου διακρίνονται τα σημεία φυγής (vanishing points) F1 , F2 , F3 (βλ.
Σχήμα 6), τα οποία είναι ακριβώς οι εικόνες στο επίπεδο προβολής των
κατ’εκδοχήν σημείων του χώρου. Τα σημεία φυγής μπορεί, να κείνται εντός
του πλαισίου της εικόνας μας ή εκτός αυτής.
Παρατηρούμε, ότι αύξηση του εστιακού μήκους σημαίνει μεγέθυνση
μεγέθους της εικόνας του αντικειμένου, όπως φαίνεται και από τη σχέση
(14) (βλ. Σχήμα 7).
Αν η κάμερα βρεθεί μεταξύ αντικειμένου και επιπέδου προβολής, η
εικόνα του αντικειμένου αντιστρέφεται (βλ. Σχήμα 8). Τέλος,

Σχήμα 7: Αύξηση εστιακού μήκους και αύξηση μεγέθους του ειδώλου


απομακρύνοντας την

κάμερα προς τα πίσω και καθώς


το εστιακό μήκος τείνει στο άπειρο,
παρατηρούμε την εικόνα του
αντικειμένου (προοπτική προβολή)
να τείνει στην ορθογραφική
Σχήμα 8: Αντιστροφή του ειδώλου
προβολή του αντικειμένου (βλ.
Σχήμα 9).

Σχήμα 9: Όταν το εστιακό μήκος τείνει στο άπειρο,


η προοπτική προβολή τείνει στην ορθογραφική
38ο Πανελλήνιο Συνέδριο Μαθηματικής Παιδείας 707

Βιβλιογραφία

1. http://users.sch.gr/papalouk/index.php/2015-11-30-14-39-41/2015-12-
01-11-35-19/opengl/104-opengl-4-3d (30.8.2023)
2. Στεφανίδης, Ν.Κ. (1985). Εισαγωγή στη Γεωμετρία, Θεσσαλονίκη.
Εκδόσεις Ζήτη.
3. http://3.www.cse.psu.edu/~rtc12/CSE486/lecture13 (14.9.2023)

You might also like