Professional Documents
Culture Documents
2009 год
1
Цель:
Интегрировать существующие
методы получения воспринимаемо
значимых векторов свойств и
использовать их в приложении для
взаимодействия с музыкальными
коллекциями с новыми
возможностям визуализации,
фильтрации, поиска.
2
Мотивация:
Новая музыка
появляется– но её
невозможно найти
Большие коллекции
Требовательные пользователи
3
Получение информации из Музыки
(Music Information Retrieval – MIR)
Задачи
•Интегрировать методы MIR описанные в литературе.
•Визуализировать данные.
•Создать возможность взаимодействия с музыкальными
произведениями.
•Создать возможность задания значимости величин в векторе
свойств данных.
•Создать возможность фильтрации музыкальных произведений
по значениям величин в векторе свойств.
4
Как можно описать Музыку?
5
Основы MIR находятся в Computer Audition
Машинное
Обработка
обучение
Сигналов(Signal
(Machine learning)
processing) Human Computer
Interaction
Компьютерное
Information Компьютерный слух зрение(Computer
Retrieval (Computer Audition ) Vision)
Визуализация Восприятие(Percep
(Visualization) tion)
7
Ухо. Колебания воздуха во
вмнешем ухе пробразовываются
средним в колебания жидкости во
внутреннем. После передаются в
Spane
мосх.
8
Жидкость 2 Овальное Улитка
Жидкость 1 окно
9
Cлушание Познание Обучение
Предсказание Предположения
Внимание
Кратко- Долго-
Feature
Слух срочная срочная
Extraction
память память
t0 t 13
Вычисление MFCC
(Мелочастотные
кепстральные
коэффициенты)
14
Последовательность вычислений
Каждое
музыкальное
свойств относится
к одному из
измерений
традиционно
определенных в
музыкальной
теории.
•Отпечаток (Fingerprint);
•Содержание;
•Контекст;
17
ОРГАНИЗАЦИЯ
Со старым интерфейсом
19
М УМЕНЬШЕНИЯ
у РАЗМЕРНОСТИ
з (DIMENSION REDUCTION)
ы Векторы свойств B = TxA
к
n m
а
л
ь
н
ы DR
е
к
о
м
п
о
з
и
ц
и Получение из выборки n-мерных векторов(A) новой m-мерной (B) с
и сохранением максимального количества информации(разнообразия и исходной
топологии)
20
1
min
22
Autoencoder - сеть обратного распространения с узким горлом
23
КЛАСТЕРИЗАЦИЯ
Методы
24
Самоорганизующаяся карта Кохонена (англ. Self-
organizing map — SOM) — соревновательная
нейронная сеть с обучением без учителя,
выполняющая задачу визуализации и кластеризации.
Является методом проецирования многомерного
пространства в пространство с более низкой
размерностью (чаще всего, двумерное), применяется
также для решения задач моделирования,
прогнозирования и др. Является одной из версий
нейронных сетей Кохонена.
25
Импульсно-кодовая модуляция (PCM — Pulse Code Modulation)
ИКМ используется для оцифровки аналоговых сигналов. Практически все
виды аналоговых данных (видео, голос, музыка, данные телеметрии,
виртуальные миры) допускают применение PCM.
26
ВИЗУАЛИЗАЦИЯ .Отдельные мелодии
27
Beethoven’s "Moonlight" Sonata
28
Вычисление текущего тона
Отображение переходов(черные точки)
GenreGram
Класификация “на лету”
Значения достоверности по
вертикальной оси
29
Коллекции
TimbreGram
•Временные серии векторов-свойств > PCA > RGB-пространство цвета
30
Коллекции
Islands of Music
31
Component planes + цветовая схема синоптических карт
32
Развивающаяся SOM
(Emergent SOM)
•Много нейронов
•Безграничный тороид вместо
плоскостной топологии позволяет
убрать краевые эффекты , а именно
=> 1. Кластеры в углах и вдоль
границ; 2. Центральное
пространство карты довольно пусто
•U-Matrix/U-Map визуализируют
исходные расстояния в
пространстве данных
•Метафора географической карты
Аллеи = кластеры
Горы = границы
Тороид
33
Пример использования ESOM
34
Плавное изменение
Похожее
35
ВЫДЕЛЕНИЕ НУЖНЫХ
СВОЙСТВ
36
При большом маштабе
можно отображать
кластеры,
описывая их
собирательными
чертами песен в их
составе
37
ВСЁ ВМЕСТЕ # Своства # Измерения
x x
# Песни # Песни
Музыкальная
библиотека
Организация
Анализ
Уменьшение
Получение Визуализация
размерности,
песни свойств взаимодействие
кластеризация
MARSYAS
MIRtoolbox
Last.fm Реализации
Echonest.com SOM, PCA, …
Allmusic.com
.
.
38
Работа
получение свойств контента-> PCA -> scatter
39
Работа
Выделение нужных свойств
40
Работа
Реализация MIR системы на MATLAB 2009a
Получения данных Анализ
Statistics Toolbox Neural Network Toolbox
Signal Processing Statistics Toolbox
Toolbox
Wavelet Toolbox SOMToolbox
AuditoryToolbox Netlab Toolbox
MIRToolbox(содержит Dimension Reduction
manual с сравнением с Toolbox
другими решениями)
XBAT (программа для
биоакустики)
Визуализация
Встроеные средства MATLAB
и решения предоставляемые в
toolbox’ах, GUIDE
41
Реализация MIR системы на .NET 3.5
Получения данных Анализ
MATLAB Builder NE
Matlab Builder NE NN: NeuronDotNet, FANN
Marsyas
Math:
Web-servises: Math.NET Numerics и другие
The Echonest Api
Last.fm
Визуализация
WPF(настольная)и SL(для Web)
MATLAB 2009a может использовать Web-sevices, базы
данных(Database Toolbox), любые Java и .NET объекты=> все что
можно использовать на этих платформах.
MATLAB поддерживает OOP и JIT компиляцию. Основные
преобразования выполняются параллельно. Есть Parallel Computing
Toolbox.
42
ОРГАНИЗАЦИЯ И ВИЗУАЛИЗАЦИЯ МУЗЫКИ ПО
СОДЕРЖИМОМУ ИСПОЛЬЗУЯ ТЕХНИКИ
САМООРГАНИЗУЮЩИХСЯ КАРТ И АНАЛИЗА
ГЛАВНЫХ КОМПОНЕНТ
43
Литература относящаяся к MIR
[001] Anita Shen Lillie “MusicBox: Navigating the space of your music”
August, 2008
[002] Elias Pampalk “Islands of Music. Analysis, Organization, and
Visualization of Music Archives” Deсember, 2001
[003] George Tzanetakis “Manipulation, analysis and retrieval systems for
audio signals” June, 2002
[004] Tristan Jehan “Creating Music by Listening” September, 2005
[005] J. Stephen Downie “Music Information Retrieval” 2003
[006] Priit Kirss “Audio Based Genre Classification of Electronic Music
“June, 2007
[007] Olivier Lartillot “MIRtoolbox 1.1 User’s Manual” May, 2008
44
Литература относящаяся к анализу, DR и Clusterization
45
Ссылки:
www.ismir.org
46