You are on page 1of 7

2η Σειρά Ασκήσεων (με τη λύση τους)

ΑΝΑΛΥΣΗ & ΤΕΧΝΟΛΟΓΙΑ ΕΙΚΟΝΩΝ & ΒΙΝΤΕΟ


8Ο ΕΞΑΜΗΝΟ ΣΧΟΛΗΣ ΗΜΜΥ
ΜΑΙΟΣ 2023

Ασκηση 1

Τα φίλτρα h1 & h2 συνελίσσονται, με zero padding, και παράγουν το φίλτρο h3. Προσδιορίστε τις τιμές των συντελεστών
του φίλτρου h2.

h1 : 1 2 1 h2 : a b c h3 : 1 4 6 4 1
2 4 2 d e f 3 12 18 12 3
1 2 1 g h I 4 16 24 16 4
3 12 18 12 3
1 4 6 4 1

Ποια νομίζετε ότι είναι η χρησιμότητα των ανωτέρω φίλτρων;

Απάντηση: Επειδή το φίλτρο h3 είναι συμμετρικό, προκύπτει ότι και το h2 θα είναι συμμετρικό,
άρα a=c=g=l και b=h και d=f. Μας λείπουν 4 συντελεστές, οι a,b,d,e.
Ας κάνουμε τις συνελίξεις, π.χ., για τα pixels με τιμές 24, 12, 18, 16.
24=4e+(2+2)b+(2+2)d+(1+1+1+1) a , δηλ. 6=e+b+d+a (1)
12=4a+2b+2d+e (2)
18=4b+(2+2)a+2e+(1+1)d, δηλ. 9=2b+2a+e+d (3)
16=4d+(2+2)a+2e+(1+1)b δηλ. 8=2d+2a+e+b (4)

Προκύπτει a=d=1 και b=e=2, δηλ. το φίλτρο θα είναι

1 2 1
1 2 1
1 2 1
Κατωδιαβατά φίλτρα.

Ασκηση 2

Α) Με ποιο φίλτρο από τα εξής: φίλτρο μέσου όρου, φίλτρο ενδιάμεσης τιμής, γκαουσιανό φίλτρο, νομίζετε
ότι έγινε η εξομάλυνση της εικόνας που φαίνεται στο επόμενο σχήμα;
Απάντηση: Εγινε με το φίλτρο ενδιάμεσης τιμής, διότι μόνο αυτό θα εξαφάνιζε το στενό L, που βρίσκεται στο
άνω αριστερά μέρος της αρχικής εικόνας, από την εξομαλυμένη εικόνα που φαίνεται δεξιά.

Β) Ποιοι από τους επόμενους μετασχηματισμούς εκτελούν τις επόμενες ενέργειες:


Μετατροπή σε πιο ανοικτό (lightening) - μετατροπή σε πιο σκούρο (darkening) - συμπίεση σε σκούρο
(compressed to darks) – συμπίεση σε ανοικτό (compressed to lights)

Κάτω από κάθε μετασχηματισμό δίδεται η απάντηση.

Γ) Με ποια φίλτρα μπορεί να βελτιωθεί η ποιότητα της επόμενης εικόνας;


Με φίλτρα όπως ενδιάμεσης τιμής ή μέσου όρου. Λόγω του είδους του θορύβου (salt and pepper) το φίλτρο
ενδιάμεσης τιμής (median) θα απέδιδε καλύτερα.

Ασκηση 3

Στο Σχήμα βλέπετε την αρχική εικόνα (a) και 3 εικόνες που προκύπτουν αν εφαρμόσουμε διαφορετικές
μεθόδους επεξεργασίας σε αυτήν. Ποιό από τα επόμενα φίλτρα έχει χρησιμοποιηθεί σε κάθε περίπτωση
(b), (c), (d); Δικαιολογείστε σύντομα τις επιλογές σας.

1) Gaussian, 2) Box-Low pass, 3) Fourier transform, 4) Inverse Fourier, 5) Difference of Gaussian, 6) Canny
edge detector, 7) Image thresholding
(b)-7, κατωφλίωση δίνει μαύρο-άσπρο
(c)-5, είναι ομοιόμορφο γκρί, αλλά με τονισμένες ακμές (DoG)
(d)-6, ανίχνευση ακμών.

Ασκηση 4

Α) Για κάθε μια από τις εικόνες (a)-(d), περιγράψτε πώς θα είναι το ιστόγραμμά της. Δικαιολογείστε την απάντησή σας.
(a) (b)
(c) (d)

(a) οι τιμές του ιστογράμματος γύρω από το μέσο της κλίμακας (127)
(b) Οι τιμές πολύ κοντά στο 0
(c) Ισοσταθμισμένο ιστόγραμμα
(d) Οι τιμές κοντά στο 255

Β) Κάθε ένα από τα ιστογράμματα (1)-(4) αντιστοιχεί σε μια διαφορετική εκδοχή της ίδιας εικόνας. Περιγράψτε τι
διαφορετικά χαρακτηριστικά θεωρείτε ότι έχει η κάθε εκδοχή.
(1) Όπως η (a) στο Α (2) Όπως η (d) στο Α

(3) Όπως η (b) στο Α (4) Όπως η (c) στο Α

Ασκηση 5

Σας δίδεται η επόμενη δυαδική εικόνα (μαζί με την φυσική διάσταση του ενός pixel) και σας ζητείται να
εφαρμόσετε μορφολογική επεξεργασία της (a) συστολής, (b) διαστολής, (c) ανοίγματος, (d) κλεισίματος, με
ένα δομικό στοιχείο 3x3.

Απάντηση:
Ασκηση 6

Α) Η είσοδος σε ένα νευρωνικό δίκτυο (όχι συνελικτικό) είναι μια έγχρωμη εικόνα 300x300. Το πρώτο
κρυμμένο επίπεδο του δικτύου έχει 100 νευρώνες πλήρως συνδεδεμένους στην είσοδο. Πόσες άγνωστες
παραμέτρους έχει το επίπεδο αυτό;

Απάντηση: Στην είσοδο έχουμε 3 x 300 x 300 τιμές (των pixels των 3 αποχρώσεων R, G, B) συνδεδεμένες με
100 νευρώνες, άρα 3 x 300 x 300 x 100 βάρη συνδέσεων και επιπλέον 100 τιμές των κατωφλίων των
νευρώνων. Επομένως 3 x 300 x 300 x 100 + 100 άγνωστες παραμέτρους.

B) Στα συνελικτικά δίκτυα η χρήση ‘parameter sharing’ επιτρέπει τα επόμενα:


- μείωση του συνολικού αριθμού άγνωστων παραμέτρων
- εφαρμογή ανίχνευσης features σε πολλαπλές θέσεις των εικόνων εισόδου
- το sharing των παραμέτρων που υπολογίστηκαν για μια κατηγορία εικόνων και σε άλλες διαφορετικές
κατηγορίες (transfer learning). Συμφωνείτε ή όχι; Γιατί;

Απάντηση: Τα δυο πρώτα είναι αληθή, και είναι οι λόγοι που χρησιμοποιούμε parameter sharing στα
συνελικτικά δίκτυα. Το τρίτο είναι κάτι ανεξάρτητο, δεν έχει σχέση με την δομή ενός συνελικτικού δικτύου,
αλλά με το πώς χρησιμοποιούμε την εκμάθηση ενός συνελικτικού δικτύου σε άλλα δίκτυα και εφαρμογές.

You might also like