You are on page 1of 3

PRZEGLD ELEKTROTECHNICZNY (Electrical Review), ISSN 0033-2097, R.

87 NR 9a/2011 187
Marcin KOODZIEJ, Andrzej MAJKOWSKI, Remigiusz J. RAK
Instytut Elektrotechniki Teoretycznej i Systemw Informacyjno-Pomiarowych
Wydzia Elektryczny, Politechnika Warszawska


Wykorzystanie t-statystyk do szybkiej selekcji cech sygnau
EEG na uytek interfejsu mzg-komputer


Streszczenie: Gwnym zadaniem systemu BCI jest odczytanie sygnaw generowanych przez neurony mzgowe. Do efektywnego dziaania
interfejsu mzg-komputer potrzebna jest skuteczna metoda selekcji cech sygnau EEG. W artykule autorzy zaproponowali uycie wspczynnika t-
statystyk do uszeregowania i redukcji cech na uytek systemw BCI.

Abstract: The main task of BCI is to translate the signals generated by neurons in the brain. For the effective operation of the brain-computer
interface, an efficient method of feature selection of EEG signal is needed. In this article authors propose the use of t-statistics to feature selection
for BCI systems. (Application of t-statistics for processing of EEG signal in brain-computer interface)

Sowa kluczowe: interfejs mzg-komputer, ekstrakcja cech, klasyfikacja
Keywords: brain-computer interface, BCI, feature extraction, classification

Wstp
Interfejs mzg-komputer (Brain-Computer Interface:
BCI) to jedno z nowych wyzwa, ktre stanowi cz
szerszego zagadnienia okrelanego mianem komunikacji
czowiek-komputer, umoliwiajcego zamian myli w
dziaanie. Potencjalnie wic BCI stanowi cze pomidzy
mzgiem a wiatem zewntrznym. Gwnym zadaniem
systemu BCI jest odczytanie sygnaw generowanych przez
neurony mzgowe, rozszyfrowanie ich znaczenia i
wygenerowanie sygnaw odpowiednich do sterowania
innym systemem. Najbardziej znaczcym zastosowaniem
BCI jest usprawnienie funkcjonowania osb
sparaliowanych.

Proponowana metoda selekcji cech
Do efektywnego dziaania interfejsu mzg-komputer
potrzebna jest skuteczna metoda selekcji cech sygnau
EEG [1]. Selekcja cech jest tak wanym elementem
systemw BCI, gdy najlepsze cechy dla danego
uytkownika mog zmienia si z dnia na dzie, a nawet z
godziny na godzin. Dlatego systemy BCI dziaaj w dwch
trybach: kalibracji (dostosowanie do uytkownika) i
interpretacji sygnau EEG czyli klasyfikacji. Tryb kalibracji
powinien nastpowa przed kadym uyciem interfejsu. Dla
poszczeglnych zada mylowych (np. wyobraania sobie
ruchu) na etapie kalibracji generowane s cechy. Liczba
wygenerowanych cech zaley od wykorzystywanego
potencjau mzgowego i moe waha si od kilku a do
kilku tysicy. Dua liczba cech praktycznie uniemoliwia
skuteczne nauczenie klasyfikatora, wic zachodzi potrzeba
zastosowania ich selekcji. Celem selekcji jest wybranie
najlepszych cech, ktre skutecznie zrnicuj klasy.
Istnieje wiele algorytmw selekcji cech, najszybsze spord
nich to metody rankingowe. W artykule autorzy
zaproponowali uycie t-statystyk do uszeregowania i
redukcji cech na uytek systemw BCI.
Podstaw metody jest uszeregowanie cech zgodnie z t-
statystyk Welcha. Najlepsze cechy to takie, ktre uzyskuj
najwiksz warto bezwzgldn wspczynnika t - testu
Welcha (1):

(1) t =
x
1
-x
2
_
s
1
2
N
1
+
s
2
2
N
2


gdzie x
1
to rednia w 1-szej prbie, s
1
2
wariancja w 1-szej
prbie, a N
1
to liczno 1-szej prby, podobnie dla 2-giej.
Wspczynnik t mona interpretowa jako pewn
warto, ktra okrela stopie zrnicowania cech dla
dwch rozpatrywanych klas. Im wiksza rnica rednich w
liczniku wzoru (1) i mniejsze wariancje zmiennych w
mianowniku tym wikszy wspczynnik t, a zatem wiksza
szansa na zrnicowanie klas za pomoc tych zmiennych.
Zmienne mona uszeregowa zgodnie ze wzrostem
wspczynnika t i wybra te z najwikszymi wartociami.
Osobnym problemem jest liczba cech, dajca najlepszy
rezultat klasyfikacji. Prba rozwizania tego problemu
zawarta jest w artykule.

Opis przeprowadzonych bada
Badania obejmoway kilka etapw. W pierwszym kroku
wygenerowano odpowiedni zbir cech z zarejestrowanego
wczeniej sygnau EEG. Do wygenerowania cech autorzy
uyli szybkiej transformaty Fouriera. Kolejnym etapem bya
selekcja cech za pomoc t-statystyk. Ostatecznym testem
bya weryfikacja jakoci wybranych cech. Miar jakoci
doboru cech by bd nauki klasyfikatora. Dodatkowo
przeprowadzono badania wpywu liczby cech na jako
klasyfikacji.

Generowanie zbioru cech
Do wygenerowania zbioru cech autorzy posuyli si
baz danych sygnaw EEG zarejestrowanych na potrzeby
bada interfejsu mzg-komputer [2]. Zarejestrowany sygna
EEG zawiera kilka sesji dla trzech uytkownikw. W
artykule przedstawiono wyniki eksperymentw dla jednego
uytkownika. Kady z uytkownikw realizowa pewne
zadania mylowe (mental tasks). Zadaniami tymi byy
wyobraanie sobie ruchu praw rka, lew rk oraz
generowanie sowa na wyznaczon liter. Czstotliwo
prbkowania zarejestrowanego sygnau wynosi f
s
=512Hz.
Sygna EEG, zarejestrowany by za pomoc 32 elektrod w
systemie 10-20.
Sygna zosta podzielony na jednosekundowe okna (po
512 prbek). W celu wygenerowania wikszego zbioru
cech. Okna rozmieszczane byy co kolejne 32 prbki, to jest
co 62,5ms. Z kadego takiego okna zostay
wyekstrahowane cechy. Cechami tymi byy prki widma po
transformacji Fouriera (FFT). Tylko cz prkw widma
czstotliwociowego niesie uyteczne informacje o
waciwociach sygnau EEG, liczba cech zostaa
ograniczona do 40 [2]. Takie cechy reprezentoway
czstotliwoci od 1 do 40 Hz. Liczba kanaw wynosia 32,
a liczba cech z pojedynczej elektrody 40, zatem cakowita
liczba cech za 1 sekund zapisu EEG wynosia 1280. Tak
dua liczba cech utrudnia nauk klasyfikatora.

188 PRZEGLD ELEKTROTECHNICZNY (Electrical Review), ISSN 0033-2097, R. 87 NR 9a/2011






















Rys.1. Proces generowania cech z sygnau EEG.

Selekcja cech za pomoc t-statystyk
W wyniku procesu generowania cech otrzymano zbiory
danych reprezentujce trzy klasy 1, 2 oraz 3. Zatem
problem klasyfikacji obejmowa przyporzdkowanie 1-
sekundowego zapisu sygnau EEG do jednej z trzech klas.
Dziki t statystykom (1) moliwe byo wyznaczenie rankingu
cech midzy klasami: 1-2, 1-3, oraz 2-3. Autorzy
zaproponowali jeden wsplny wspczynnik (t
c
) opisujcy
statystyk midzy wszystkimi klasami (2):

(2) t
c
= t
12
+ t
13
+t
23


Wspczynnik ten moe by interpretowany jako czna
suma zrnicowania midzy klasami. Im wiksza warto
wspczynnika t
c
tym cechy powinny bardziej rnicowa
populacje.
W celu wyznaczenia wspczynnika t
c
dla kadej z 1280
cech wyznaczono wspczynniki t
12
, t
13
oraz t
23
zgodnie ze
wzorem (1). Nastpnym etapem byo uszeregowanie cech
od najwikszej do najmniejszej wartoci t
c
.












Rys. 2. Proces tworzenia wspczynnika t
c
oraz sposb wyboru
najlepszych cech

Na kolejnym etapie klasyfikacji wybierana bya pewna liczba
N najlepszych cech (z najwiksz wartoci t
c
).

Okrelenie bdu klasyfikatora
Wanym elementem sprawdzenia metody selekcji cech
byo okrelenie bdu klasyfikacji. Do okrelenia tego bdu
wykorzystano test krzyowy 10-krotny (ang. 10-cross
validation test) [3]. Cay zbir zosta podzielony na 10
podzbiorw. Test krzyowy uczy klasyfikator na pierwszych
9-ciu podzbiorach, a testowa na ostatnim 10-tym.
Nastpnie proces nauki obejmowa podzbiory od 1-8 oraz
10, a test przeprowadzany by na 9 podzbiorze. Proces ten
by powtarzany dla kadego z 10 podzbiorw. Testy
przeprowadzono dla dwch klasyfikatorw. Bya to liniowa
analiza dyskryminacyjna (LDA) z opcj linear i z opcj
quadratic. Przy czym, bardziej miarodajnym klasyfikatorem
jest LDA separujcy klasy liniowo. Taki klasyfikator cechuje
si lepszym uoglnieniem dla danych z nowej sesji. Wyniki
otrzymane za pomoc klasyfikacji nieliniowej s lepsze,
jednak dla danych z nowej sesji, klasyfikator sprawowa si
moe znacznie gorzej. Klasyfikator dostosowuje si do
danych uczcych.
Na efektywno nauki klasyfikatora ma wpyw nie tylko
jako cech, ale rwnie ich liczba. Dlatego autorzy
zmieniali liczb wybranych cech uszeregowanych od
najwikszej wartoci t
c
.


Rys. 3. Bd klasyfikacji dla klasyfikatora LDA z opcj linear dla
zastosowanej t-statystyki oraz losowo wybranego zbioru cech


Rys. 4. Bd klasyfikacji dla klasyfikatora LDA z opcj quadratic dla
zastosowanej t-statystyki oraz losowo wybranego zbioru cech

Wnioski
Zaproponowan metod selekcji cech mona zaliczy
do metod rankingowych lub te filtracyjnych [3]. Jej zalet w
zastosowaniu do interfejsu mzg-komputer, jest
niewtpliwie szybko uszeregowania cech w porwnaniu z
innymi metodami selekcji, np. algorytmami genetycznymi
[4]. Metoda umoliwia wyznaczenie najlepszych cech dziki
rankingowi, otrzymanemu poprzez zsumowanie
wspczynnikw t pomidzy cechami dla wszystkich klas.
Autorzy zaproponowali takie podejcie, poniewa podczas
bada okazao si, e niejednokrotnie cechy uszeregowane
wzgldem t
12
t
13
oraz t
23
s takie same. Na jako
klasyfikacji ma niewtpliwie wpyw liczba cech. Wiksza
liczba cech lepiej charakteryzuje model (zjawisko),
zmniejsza bd klasyfikacji szczeglnie w przypadku testu
krzyowego. Autorzy przebadali zaleno jakoci
klasyfikacji od liczby cech, dla losowo wybranych cech oraz
dla cech po selekcji t-statystykami. Badania wykonano dla
klasyfikatorw LDA, separacja liniowa (linear) oraz
nieliniowa (quadratic). Rysunki 3 i 4 pokazuj bd
klasyfikacji w zalenoci od liczby wybranych cech z

PRZEGLD ELEKTROTECHNICZNY (Electrical Review), ISSN 0033-2097, R. 87 NR 9a/2011 189
zastosowaniem t-statystyk oraz dla losowo wybranej liczby
cech. Dla klasyfikatora LDA liniowego selekcja
zaproponowan metod pozwolia na zmniejszenie bdu
klasyfikacji o ok. 14% (dla liczby 50 cech bdy
odpowiednio: 0.31 oraz 0.45 (rys. 3)). Dla klasyfikatora
LDA nieliniowego, selekcja zaproponowan metod
pozwolia na zmniejszenie bdu klasyfikacji o ok. 15% (dla
liczby 50 cech bdy odpowiednio: 0.18 oraz 0.33 (rys. 4)).
Zauway mona, e wraz z liczb wybranych cech maleje
znaczenie zaproponowanej metody selekcji cech.
Dodatkowo autorzy przebadali efekty zastosowania
wspczynnika Fishera zamiast t-statystyki. Wspczynnik
Fishera wyznaczy mona ze wzoru (3):

(3) K
12
=
|
1
-
2
|
c
1
+c
2


gdzie p
1
oznacza warto oczekiwan zbioru cech klasy
pierwszej a o
1
oznacza odchylenie standardowe cech dla
klasy pierwszej, podobnie dla klasy drugiej. Analogicznie
jak w rwnaniu (2) wyznaczono warto wspczynnika K
c
.
Podczas testw okazao si, e uszeregowanie cech z
pomoc t-statytsyk i oraz z pomoc wspczynnika Fishera
daje bardzo zblione rezultaty.
Wanym elementem przeprowadzonych bada, bya
prba wskazania jakie cechy s najlepsze (nios najwicej
informacji) dla procesu klasyfikacji. W tym celu wyznaczono
sum wspczynnikw t
c
oraz K
c
dla kadej czstotliwoci.



Rys. 5. Suma wspczynnikw t dla poszczeglnych czstotliwoci.
Im wiksza warto tej sumy tym prek widma ma wiksze
znaczenie



Rys. 6. Warto wspczynnika t
c
dla 10 Hz. Wiksza warto
wspczynnika okrela wano obszaru na gowie pacjenta z
ktrego powinien zosta zarejestrowany potencja EEG

Rys. 7. Wspczynnik t pomidzy klasami 2-3 dla czstotliwoci 10
Hz. Wyznaczy mona obszary, na ktrych powinny by naklejane
elektrody w celu zrnicowania klas 2 i 3

Otrzymane rezultaty jednoznacznie pokazuj, e
najlepiej do rozrnienia klas nadaj si zakresy
czstotliwoci 911 Hz oraz 2023 Hz co jest zgodne z
dotychczasow teori [1].
Nastpn prb oceny przydatnoci t-statystyk w
zastosowaniu do selekcji cech, na uytek interfejsu mzg-
komputer, byo wybranie czstotliwoci 10 Hz i
rozrysowanie sumy wartoci t-statystyk dla tej
czstotliwoci na gowie uytkownika (rys. 6).
Dziki rozrysowaniu t-statystyki dla 10 Hz, moliwa jest
ocena z jakiego obszaru naley zbiera sygnay EEG.
Uzyskane obrazy pozwalaj wskaza takie obszary. S to
elektrody zamocowane w obszarze kory sensomotorycznej,
co rwnie zgadza si z teori (rys.7) [1].

LITERATURA
[1] Gr ai mann B., Al l i son B. , Pf ur t schel l er G., Brain-
Computer Interfaces: Non-Invasive and Invasive Technologies
(2010)
[2] Mi l l n J. del R., On the need for on-line learning in brain-
computer interfaces Proc. Int. Joint Conf. on Neural Networks.,
(2004)
[3] Wol paw J. R, Bi r baumer N. Heet der ks ,W J.,
McFar l and D J., Hunt er Peckham P., Schal k G.,
Donchi n E., Quat r ano L. A., Robi nson C. J., Vaughan
T. M., BrainComputer Interface Technology: A Review of the
First International Meeting, IEEE Transactions On
Rehabilitation Engineering, Vol. 8, No. 2, June (2000)
[4] Ko odzi ej M., Maj kowski A., Rak R., Wizualizacja rozkadu
potencjau EEG na gowie pacjenta w zastosowaniu do
asynchronicznego interfejsu mzg-komputer MPM, X
Jubileuszowe Sympozjum "Modelowanie i Pomiary w
Medycynie", Krynica, (2011)

Autorzy: prof. dr hab. in. Remigiusz J. Rak, e-mail:
rakrem@iem.pw.edu.pl; dr in. Andrzej Majkowski, e-mail:
amajk@iem.pw.edu.pl; mgr in. Marcin Koodziej, e-mail:
kolodzim@iem.pw.edu.pl Politechnika Warszawska, Instytut
Elektrotechniki Teoretycznej i Systemw Informacyjno-
Pomiarowych, ul. Koszykowa 75, 00-661 Warszawa

You might also like