You are on page 1of 12

Препознавање на ноти

од даден документ

Изработено од:
Петковски Горан
Велков Филип
Милан Петров јуни, 2015
Вовед
● Проблем за препознавање на музички симболи во текст.

● Реставрација на композиции стари до неколку векови, т.е, нивно дигитализирање.


● Различни специјални знаци содржани во документ (ноти, паузи, снижувалки, повишувалки)

2
Истражување
● Постојат голем број успешни комерцијални производи.

● Пример за еден таков систем е ,,Audiveris’’ ( https://audiveris.kenai.com/)

3
Опис на системот
Нашиот систем е множество од следниве чекори:
● Детекција на ширина на простор меѓу линии и самата дебелина на истите во петолинијата.
● Одстранување на петолинијата и зачувување на y-координатите на нивното појавување.
● Лабелирање на нотите во добиената слика од горенаведениот чекор.
● Соодветно, нивно класифицирање според првичната слика.

4
Архитектура и влез
● Како влез во системот се користат следниве параметри:
○ Првичната слика (композиција)
○ Сликата со одстранети петолинија
○ Векторот од карактеристики на едно петолиние (ширина, висина и дебелина)
○ y-координати на секоја линија од секое петолиние
● Излезот се состои од карактеристика на нотите (почеток, ширина, висина) со соодветната класа:
○ 1-C
○ 2-D
○ 3-E
○ 4-F
○ 5-G
○ 6 -A
○ 7-H

5
Вектор на карактеристики
1. Се почнува со скенирање на сликата од (0,0)
2. Доколку се наиде на линија (ред од црни пиксели):
a. Се означува дека е пронајдена линија
b. Се зачувува послеедната ширина во вектор.
3. Доколку се наиде на празен простор (ред бели пиксели):
a. Се означува дека е наидено на празен простор
b. Се зачувува послеедната дебелина на линија во вектор
4. При завршување со скенирање, вака добиените вредности во двата вектора се подредуваат според
кумулативната честота.
5. Најчестите две вредности се означуваат како (n1, n2) и (d1, d2) соодветно.

6
Детекција и одстранување на петолинија
1. Скенирање од (0,0)
2. Доколку се наиде на црн пиксел и бројот на последователни црни пиксели е поголем од некој праг
(threshold):
a. Доколку вертикално од оваа позиција, бројот на последователни црни пиксели е приближен на d
(ширина на петолинието), овој пиксел останува непроменет.
b. Инаку, обележи го како бел.
3. Се зачувува позицијата на ваквата линија во вектор кој ќе се користи како влез во системот.

7
Лабелирање на ноти
1. Скенирање од (0,0)
2. Доколку се наиде на црн пиксел:
a. Се оди по позитивната насока на y-оската се додека во интервалот (y0-d2-n2, y0+d2+n2) не е
пронајден црн пиксел (сите пиксели се бели).
b. Се означува позицијата каде што концентрацијата на црни пиксели е најголем.
c. Вака добиената рамка, се зачувува во позиција (y0-leftmax, i) и има димензии (ymax-i, rightmax-
leftmax).
d. Доколку концентрацијата на црни пиксели е најголема до i, тогаш нотата е превртана

8
Последен чекор - класификација
● Доколку рамката на нотата се наоѓа на половина помеѓу две соседни линии (празнина):
○ Прва празнина - E
○ Втора празнина - G
○ Трета празнина - H
○ Четврта празнина - D
○ На петтолиние - F
● Доколку рамката се наоѓа на линија од петолинието:
○ Прва линија - D
○ Втора линија - F
○ Трета линија - A
○ Четврта линија - C
○ Петта линија - E

9
Резултати
● 9 од 16-те ноти се класифицирани коректно
● Препознаени два невалидни симболи.

10
Заклучок
● Очигледно, за развивање на комплексен и прецизен систем, потребен е тренирачки модел со голем број
на примероци.

● Алгоритамот не работи коректно за закривени слики.

● За рачно составени композиции комплексноста е голема.

11
КРАЈ
Крај на презентацијата.

ПРАШАЊА?

12

You might also like