Professional Documents
Culture Documents
Imageproblems2 2023
Imageproblems2 2023
Ασκηση 1
Τα φίλτρα h1 & h2 συνελίσσονται, με zero padding, και παράγουν το φίλτρο h3. Προσδιορίστε τις τιμές των συντελεστών
του φίλτρου h2.
h1 : 1 2 1 h2 : a b c h3 : 1 4 6 4 1
2 4 2 d e f 3 12 18 12 3
1 2 1 g h I 4 16 24 16 4
3 12 18 12 3
1 4 6 4 1
Απάντηση: Επειδή το φίλτρο h3 είναι συμμετρικό, προκύπτει ότι και το h2 θα είναι συμμετρικό,
άρα a=c=g=l και b=h και d=f. Μας λείπουν 4 συντελεστές, οι a,b,d,e.
Ας κάνουμε τις συνελίξεις, π.χ., για τα pixels με τιμές 24, 12, 18, 16.
24=4e+(2+2)b+(2+2)d+(1+1+1+1) a , δηλ. 6=e+b+d+a (1)
12=4a+2b+2d+e (2)
18=4b+(2+2)a+2e+(1+1)d, δηλ. 9=2b+2a+e+d (3)
16=4d+(2+2)a+2e+(1+1)b δηλ. 8=2d+2a+e+b (4)
1 2 1
1 2 1
1 2 1
Κατωδιαβατά φίλτρα.
Ασκηση 2
Α) Με ποιο φίλτρο από τα εξής: φίλτρο μέσου όρου, φίλτρο ενδιάμεσης τιμής, γκαουσιανό φίλτρο, νομίζετε
ότι έγινε η εξομάλυνση της εικόνας που φαίνεται στο επόμενο σχήμα;
Απάντηση: Εγινε με το φίλτρο ενδιάμεσης τιμής, διότι μόνο αυτό θα εξαφάνιζε το στενό L, που βρίσκεται στο
άνω αριστερά μέρος της αρχικής εικόνας, από την εξομαλυμένη εικόνα που φαίνεται δεξιά.
Ασκηση 3
Στο Σχήμα βλέπετε την αρχική εικόνα (a) και 3 εικόνες που προκύπτουν αν εφαρμόσουμε διαφορετικές
μεθόδους επεξεργασίας σε αυτήν. Ποιό από τα επόμενα φίλτρα έχει χρησιμοποιηθεί σε κάθε περίπτωση
(b), (c), (d); Δικαιολογείστε σύντομα τις επιλογές σας.
1) Gaussian, 2) Box-Low pass, 3) Fourier transform, 4) Inverse Fourier, 5) Difference of Gaussian, 6) Canny
edge detector, 7) Image thresholding
(b)-7, κατωφλίωση δίνει μαύρο-άσπρο
(c)-5, είναι ομοιόμορφο γκρί, αλλά με τονισμένες ακμές (DoG)
(d)-6, ανίχνευση ακμών.
Ασκηση 4
Α) Για κάθε μια από τις εικόνες (a)-(d), περιγράψτε πώς θα είναι το ιστόγραμμά της. Δικαιολογείστε την απάντησή σας.
(a) (b)
(c) (d)
(a) οι τιμές του ιστογράμματος γύρω από το μέσο της κλίμακας (127)
(b) Οι τιμές πολύ κοντά στο 0
(c) Ισοσταθμισμένο ιστόγραμμα
(d) Οι τιμές κοντά στο 255
Β) Κάθε ένα από τα ιστογράμματα (1)-(4) αντιστοιχεί σε μια διαφορετική εκδοχή της ίδιας εικόνας. Περιγράψτε τι
διαφορετικά χαρακτηριστικά θεωρείτε ότι έχει η κάθε εκδοχή.
(1) Όπως η (a) στο Α (2) Όπως η (d) στο Α
Ασκηση 5
Σας δίδεται η επόμενη δυαδική εικόνα (μαζί με την φυσική διάσταση του ενός pixel) και σας ζητείται να
εφαρμόσετε μορφολογική επεξεργασία της (a) συστολής, (b) διαστολής, (c) ανοίγματος, (d) κλεισίματος, με
ένα δομικό στοιχείο 3x3.
Απάντηση:
Ασκηση 6
Α) Η είσοδος σε ένα νευρωνικό δίκτυο (όχι συνελικτικό) είναι μια έγχρωμη εικόνα 300x300. Το πρώτο
κρυμμένο επίπεδο του δικτύου έχει 100 νευρώνες πλήρως συνδεδεμένους στην είσοδο. Πόσες άγνωστες
παραμέτρους έχει το επίπεδο αυτό;
Απάντηση: Στην είσοδο έχουμε 3 x 300 x 300 τιμές (των pixels των 3 αποχρώσεων R, G, B) συνδεδεμένες με
100 νευρώνες, άρα 3 x 300 x 300 x 100 βάρη συνδέσεων και επιπλέον 100 τιμές των κατωφλίων των
νευρώνων. Επομένως 3 x 300 x 300 x 100 + 100 άγνωστες παραμέτρους.
Απάντηση: Τα δυο πρώτα είναι αληθή, και είναι οι λόγοι που χρησιμοποιούμε parameter sharing στα
συνελικτικά δίκτυα. Το τρίτο είναι κάτι ανεξάρτητο, δεν έχει σχέση με την δομή ενός συνελικτικού δικτύου,
αλλά με το πώς χρησιμοποιούμε την εκμάθηση ενός συνελικτικού δικτύου σε άλλα δίκτυα και εφαρμογές.