You are on page 1of 9


2 Multivariate Two-Sample π‘»πŸ -Test

Kita sekarang mempertimbangkan kasus di mana p variabel diukur pada setiap unit sampling
di dua sampel. Kita ingin menguji :

𝐻0 : πœ‡1 = πœ‡2 Vs 𝐻1 : πœ‡1 β‰  πœ‡2

Kita memperoleh sampel acak 𝑦11 , 𝑦12 , 𝑦13 , ... , 𝑦1𝑛 dari 𝑁𝑝 (πœ‡1 , Ξ£1 ) dan sampel random
kedua 𝑦21 , 𝑦22 , 𝑦23 , ... , 𝑦2𝑛 dari 𝑁𝑝 (πœ‡2 , Ξ£2 ). Kita asumsikan bahwa dua sampel bersifat
independen dan bahwa Ξ£1 = Ξ£2 = Ξ£, katakanlah Ξ£ tidak diketahui. Asumsi-asumsi ini
diperlukan dalam rangka untuk 𝑇 2 - statistika di (5.9) untuk mencapai 𝑇 2 - distribusi.

Tes dari 𝐻0 : Ξ£1 = Ξ£2 diberikan di sesi 7.3.2. Untuk aproksimasi tes dari 𝐻0 : πœ‡1 = πœ‡2 yang
dapat digunakan ketika Ξ£1 β‰  Ξ£2 lihat Rencher (1998, Bagian 3.9).

1 1𝑖 𝑛 𝑦 2 2𝑖 𝑛 𝑦
Vektor mean sampel adalah 𝑦 Μ…1 = βˆ‘π‘–=1 Μ…2 = βˆ‘π‘–=1
dan 𝑦 , W 1 dan W 2 menjadi
𝑛1 𝑛2
matriks jumlah kuadrat dan produk silang untuk keduanya sampel:

π‘Š1 = βˆ‘(𝑦1𝑖 βˆ’ 𝑦̅𝑖 ) (𝑦1𝑖 βˆ’ 𝑦̅𝑖 )β€² = (𝑛1 βˆ’ 1)𝑆1


π‘Š2 = βˆ‘(𝑦2𝑖 βˆ’ 𝑦̅𝑖 ) (𝑦2𝑖 βˆ’ 𝑦̅𝑖 )β€² = (𝑛2 βˆ’ 1)𝑆2

Karena (𝑛1 βˆ’ 1)𝑆1 adalah penduga yang tidak bias dari (𝑛1 βˆ’ 1)Ξ£ dan (𝑛2 βˆ’ 1)𝑆2 adalah
penaksir tidak bias (𝑛2 βˆ’ 1)Ξ£ , kita dapat mengumpulkan mereka untuk memperoleh
penduga yang tidak bias matriks kovariansi populasi umum,:

1 𝑆𝑝
1 = (π‘Š + π‘Š2 )
𝑛1 + 𝑛2 βˆ’ 2 1
= 𝑛1+𝑛2βˆ’2 [(𝑛1 βˆ’ 1)𝑆1 + (𝑛2 βˆ’ 1)𝑆2 ]
Jadi 𝐸(𝑆𝑝1 ) = Ξ£

Kuadrat dari t -statistik univariat (5.8) dapat dinyatakan sebagai

t2 ο€½ ( y1 ο€­ y 2 )( S p21 )( y1 ο€­ y 2 )
n1  n2

Ini dapat digeneralisasikan ke p variabel dengan mensubstitusi 𝑦̅1 βˆ’ 𝑦̅2 untuk y 1 - y 2 dan
S p1 S pl untuk S p21 untuk memperoleh

T2 ο€½ ( y1 ο€­ y 2 )' ( S pο€­11 )( y1 ο€­ y 2 )
n1  n2

skalar. 𝑦̅2 dan 𝑆𝑝1 telah 2 dikurangi menjadi skala tunggal dimana T besar jika bukti sampel mendukung 𝐻1 : πœ‡1 β‰  πœ‡2 dan kecil jika bukti mendukung 𝐻0 : πœ‡1 = πœ‡2 . Untuk derajat kebebasan T kita memiliki 𝑛1 + 𝑛2 βˆ’ 2. Jumlah 3 p + p (p . 2 4. Untuk melaksanakan 2 2 uji. T 2 -statistic (5. Untuk tabel kekuatan dari T 2 -test (kemungkinan menolak 𝐻0 ketika itu salah) dan ilustrasi dari mereka gunakan.9) dapat dinyatakan dalam bentuk karakteristik sebagai standar jarak antara y1 dan y 2 : ο€­1  1 1 οƒΉ T ο€½ ( y1 ο€­ y 2 ) οƒͺ(  ) S p1 οƒΊ ( y1 ο€­ y 2 ) 2 '  n1 n2  1 1 dimana (  ) S p1 adalah matriks kovariansi sampel untuk y1 ο€­ y 2 dan S p1 adalah n1 n 2 independen dari y1 ο€­ y 2 karena pengambilan sampel dari multivariat normal.9). sebagaimana dicatat dalam (5. Bagian 3. Nilai-nilai kritis dari T 2 ditemukan di Tabel A.7): 𝑛1 + 𝑛2 βˆ’ 𝑝 βˆ’ 1 2 𝑇 = 𝐹𝑝. Beberapa properti kunci dari dua sampel T 2 -tes diberikan dalam daftar berikut: 1.11). statistik T .1 ) / 2 dalam 𝑦̅1 . lihat Rencher (1998. 𝑇 2 -statistic dapat langsung diubah ke F-statistic menggunakan (5. yang merupakan a distribusi miring yang terkenal. Wilayah kritis 𝑇 2 > 𝑇𝛼2 adalah satu sisi.7. kami menolak 𝐻0 jika jarak standar antara 𝑦̅1 dan 𝑦̅2 adalah besar. 6. T 2 secara langsung berkaitan dengan F . Diperlukan untuk 𝑛1 + 𝑛2 βˆ’ 2 > 𝑝 untuk 𝑆𝑝1 menjadi nonsingular. menghitung T (5. 2 2.10). seperti tipikal banyak tes multivariat. yang sama seperti untuk t - statistic univariat yang sesuai (5. Karena batas bawah dari T adalah nol dan tidak ada batas atas.8). Hipotesis alternatif 𝐻1 : πœ‡1 β‰  πœ‡2 adalah dua sisi.n1n 2ο€­2 . densitas miring. lihat Rencher (1998.yang didistribusikan sebagai Tp2. 5.𝑛1+𝑛2βˆ’π‘βˆ’1 (𝑛1 + 𝑛2 βˆ’ 2)𝑝 . dan menolak 𝐻0 jika T β‰₯ Tp2.n1n 2ο€­2 ketika 𝐻0 : πœ‡1 = πœ‡2 benar. namun. kami mengumpulkan dua sampel. tentu saja. Bagian 3. Bahkan. Untuk sebuah 2 pembahasan ketahanan T untuk berangkat dari asumsi multivariat normalitas dan homogenitas matriks kovarian (Ξ£1 = Ξ£2 ) .7). 2 3.

2 Empat tes psikologi diberikan kepada 32 pria dan 32 wanita. Data dicatat dalam Tabel 5. matriks kovariansi lation.1 (Beall 1945). (Tes signifikansi untuk memeriksa asumsi ini dilakukan dalam Contoh 7. di mana lagi dimensi 𝑝 dari 𝑇 2 -statistic menjadi derajat pertama dari parameter kebebasan untuk F -statistic.4. dan hipotesis H0 : Ξ£1 β‰  Ξ£2 tidak ditolak. Contoh 5.3. Variabel-variabelnya adalah y 1 = inkonsistensi bergambar y 3 = pengenalan alat y 2 = papan bentuk kertas y 4 = kosakata Matriks kovarians sampel tidak menunjukkan adanya perbedaan dalam populasi.2.) Kumpulan matriks kovariansinya adalah : .

01.373. kita dapat : 𝑛1𝑛2 βˆ’1 (𝑦 𝑇2 = (𝑦1 βˆ’ 𝑦2 )β€² 𝑆𝑝1 1 βˆ’ 𝑦2 ) = 97.9).7.6015 𝑛1 + 𝑛2 2 Dari interpolasi pada Tabel A.5 untuk diskusi tentang variabel mana yang berkontribusi sebagian besar untuk pemisahan kedua kelompok. . Lihat Contoh 5.62 = 15. dan kami karenanya tolak 𝐻0 : πœ‡1 = πœ‡2 .Dengan (5.4. kita memperoleh𝑇.

. yang kami perkenalkan secara informal.5 TESTS ON INDIVIDUAL VARIABLES CONDITIONAL ON REJECTION OF π‘―πŸŽ BY THE π‘»πŸ -TEST Jika hipotesis 𝐻0 : πœ‡1 = πœ‡2 ditolak.3 Likelihood Ratio Tests Pendekatan kemungkinan maksimum untuk estimasi diperkenalkan di Bagian 4. kita bekerja dengan 𝑑 2 (π‘Ž). 𝑧 = π‘Žβ€² 𝑦. Kami mencari garis (arah) dimana perbedaan y 1 .5) adalah tes rasio kemungkinan. y n. . 𝑧̅1 = Μ…1 dan 𝑧̅2 = π‘Žβ€² 𝑦̅2 ..9). Tetapi tidak ada jaminan bahwa 𝐻0 : πœ‡1𝑗 = πœ‡2𝑗 akan menjadi ditolak untuk beberapa j dengan tes univariat.54).. Fungsi linear 𝑧 = π‘Žβ€²π‘¦ adalah proyeksi y ke garis melalui titik asal. adalah (ada kelipatan dari) βˆ’1 Μ… π‘Ž = 𝑆𝑝1 (𝑦1 βˆ’ 𝑦 Μ…2) .𝑦̅2 ) [standar oleh S pl a seperti pada (5. Demikian pula.12) dapat ditulis sebagai : π‘Žβ€² 𝑦 Μ…1 βˆ’ π‘Žβ€² 𝑦̅2 𝑑(π‘Ž) = √( 1 + 1 )π‘Žβ€² 𝑆𝑝1 π‘Ž 𝑛1 𝑛2 Karena 𝑑(π‘Ž) bisa negatif.. adalah tes terbaik menurut kriteria tertentu. Jadi (5.3. Jadi 𝑇 2 -test. setara.. 2 . Nilai dari sebuah proyek ke ini garis.kasus sampel. kemungkinan Pendekatan rasio mengarah langsung ke Hotelling’s 𝑇 2 -test di dalam (5. 𝑇 2 -statistic di (5. Metode rasio kemungkinan konstruksi tes menggunakan rasio maksimal nilai fungsi likelihood dengan asumsi π»π‘œ bernilai true di bawah 𝐻1 . Oleh (3. atau. Ketika diterapkan pada sampel normal multivariat dan 𝐻0 : πœ‡1 = πœ‡2 . maka ada setidaknya satu koefisien vektor yang : 𝑧̅1 βˆ’ 𝑧̅2 𝑑(π‘Ž) = √( 1 + 1 )𝑠𝑧2 𝑛1 𝑛2 akan menolak hipotesis yang sesuai 𝐻0 : πœ‡π‘§1 = πœ‡π‘§2 atau 𝐻0 : π‘Žβ€² πœ‡1 = π‘Žβ€² πœ‡2 2 . 5.13)] akan kurang di arah lain dari itu sejajar dengan garis yang menghubungkan 𝑦 Μ…1 dan 𝑦̅2 . yang pada dasarnya tidak dibatasi. fungsi kemungkinan adalah kepadatan gabungan dari y 1.5. jika kita menganggap kombinasi linear variabel. Nilai dari parameter yang memaksimalkan fungsi kemungkinan adalah kemungkinan maksimum penduga.55) estimator varians 𝑠𝑧2 adalah estimator yang π‘Žβ€² 𝑦 dikumpulkan π‘Žβ€² 𝑆𝑝1 π‘Ž . implikasinya adalah πœ‡1𝑗 β‰  πœ‡2𝑗 untuk setidaknya satu j = 1 . .13).1. Namun.. Perbedaan yang diproyeksikan a ( 𝑦 Μ…1 .y 2 dimaksimalkan ketika diproyeksikan.4. 2 (π‘Ž) memaksimalkan 𝑑 dalam (5. Sebagai mencatat ada. p . y 2. Tes rasio kemungkinan biasanya memiliki kekuatan yang baik dan kadang-kadang memiliki kekuatan optimal atas berbagai kelas alternatif. di satu. dan dari (3.

32) di Bagian 5. n 1 + n 2 βˆ’2 . Akibatnya. βˆ’1 (𝑦 Ketika π‘Ž = 𝑆𝑝1 Μ…1 βˆ’ 𝑦̅2 ) .9) . bahkan kombinasi linear yang dipilih setelah melihat data. 𝑦̅1𝑗 βˆ’π‘¦Μ…2𝑗 𝑑𝑗 = 𝑗 = 1. Analisis diskriminan bertahap (lihat Bagian 8. Korelasi antara variabel dan fungsi diskriminan (lihat tion 8. fungsi diskriminan π‘Žβ€²π‘¦ akan menyebabkan penolakan 𝐻0 : π‘Žβ€² πœ‡1 = π‘Žβ€² πœ‡2 menggunakan (5. yaitu.𝑣 diberikan di Tabel A.𝑛1+𝑛2βˆ’2 untuk (5.15) (𝑛1+𝑛2) √[ ]𝑠𝑗𝑗 𝑛1𝑛2 di mana 𝑠𝑗𝑗 adalah π‘˜π‘’ βˆ’ 𝑗 elemen diagonal dari 𝑆𝑝1.9). maka 𝑧 = π‘Žβ€²π‘¦ disebut fungsi diskriminan . dengan π‘Ž = 𝑆𝑝1 βˆ’1 (𝑦 Μ…1 βˆ’ 𝑦̅2 ) .3). T Ξ±. Lihat (5. Kami daftar ini dan prosedur lain yang dapat digunakan untuk memeriksa setiap variabel melenguh penolakan 𝐻0 oleh dua sampel𝑇 2 -test: 1.𝑛1+𝑛2βˆ’2 . p. p. … .6.15) adalah T Ξ±. Koefisien fungsi diskriminan standar (lihat Bagian 8. p.5) 6.atau t. 𝑝 (5.2. n 1 + n 2 βˆ’2 .8. Kita dapat kemudian memeriksa masing-masing 𝒂𝒋 dalam untuk indikasi kontribusi yang sesuai π’šπ’‹ terhadap penolakan 𝐻0 .3) 7. 2𝑝 dari Bailey (1977).2 dan dalam Bab 8 dan 9. Pemeriksaan tindak lanjut dari masing .15) (Bonferroni 2𝑝 1936).𝑦̅2 ke garis sejajar dengan garis yang menghubungkan 𝑦 Μ…1 dan 𝑦̅2 . 2. dan ini memang demikian (lihat Soal 5.7.14) memproyeksikan 𝑦 Μ…1 . Untuk menyesuaikan tingkat.9) 7. lihat Rencher 2𝑝 (1998. penggunaan T Ξ± bahkan lebih konservatif daripada menggunakan t Ξ± / 2 p . Kadang vektor itu sendiri dalam (5. T Ξ±. Fungsi diskriminan akan muncul lagi di Bagian 5. Nilai kritis Bonferroni 𝑑 𝛼 .8] 5. satu untuk setiap variabel. Untuk interval kepercayaan pada Β΅ 1 j . 4. n 1 + n 2 βˆ’2 = √ T 2 Ξ±. Hal ini memungkinkan untuk semua variabel p yang akan diuji serta semua kemungkinan binations.15).7. Nilai kritis lain yang dapat digunakan dengan (5.tion 3.14) secara longgar disebut sebagai fungsi diskriminan.13). seperti pada (5. kita bisa gunakan nilai penting Bonferroni 𝑑 𝛼 . Univariat t.Sejak 𝒂 dalam (5. Partial F . n 1 + n 2 βˆ’2 .masing j harus dilakukan saja jika 𝐻0 : πœ‡1 = πœ‡2 ditolak oleh 𝑇 2 . Jika 𝐻0 : πœ‡1 = πœ‡2 ditolak oleh 𝑇 2 di (5. di mana T Ξ± adalah akar kuadrat dari T 2 Ξ± dari Tabel A. Analisis diskriminan bertahap (lihat Bagian 8.6). Tolak 𝐻0 : πœ‡1𝑗 = πœ‡2𝑗 jika | 𝑑𝑗 | > 𝑑 𝛼 . bahwa adalah. p.test [uji setiap variabel yang disesuaikan untuk variabel lain. dan menghasilkan 2𝑝 2 keseluruhan 𝛼 level konservatif. 3.13). SEBUAH nilai kritis 𝑑 𝛼 jauh lebih besar daripada 𝑑𝛼 .test. Sec.Ξ± yang dihasilkan dari melakukan tes p dalam (5. n 1 + n 2 βˆ’2 > t Ξ± / 2 p.Β΅ 2 j . kami berharap bahwa 𝑑 2 (π‘Ž) = 𝑇2 .

tes berikut penolakan H 0 oleh T 2 -tes (tes yang dilindungi).test univariat hanya jika multivariat T 2 -tes signifikan. Metode 7 sering digunakan untuk mengidentifikasi bagian dari variabel penting atau bahkan untuk menentukan peringkat variabel berdasarkan urutan entri. kami lebih memilih yang kelima prosedur. Rencher (1988) telah menunjukkan bahwa korelasi ini sebanding dengan t -atau F. Kami sekarang mempertimbangkan prosedur univariat 1.tes univariat . Tabel 5. 2. Bahkan. yang pertama tampaknya lebih disukai.7. vations. dan tes berdasarkan t Ξ± / 2 dalam prosedur 1 bersifat liberal (keseluruhan Ξ± terlalu tinggi). Dengan demikian tes menggunakan t Ξ± / 2 p dan T Ξ± menjadi lebih konservatif.Tiga metode pertama adalah pendekatan univariat yang tidak menggunakan kovarian atau korelasi antara variabel dalam perhitungan statistik uji. 2. Ξ± keseluruhan terlalu tinggi. The inflated Ξ± 's menghasilkan jika t -tests digunakan tanpa memperhatikan hasil dari T 2-test terlihat jelas.2 memberikan cuplikan Hummel dan Hasil Sligo. maka tes berdasarkan t Ξ± / 2 p dan T Ξ± dalam prosedur 2 dan 3 bersifat konservatif (secara keseluruhan Ξ± juga rendah). tanpa T 2-test. dan 3. Mereka juga membandingkan prosedur ini dengan prosedur melakukan tes univariat tanpa terlebih dahulu T 2-test (tes tidak dilindungi). Metode 6. itu sedikit konservatif. mereka menemukan bahwa menggunakan t Ξ± / 2 untuk nilai kritis menghasilkan Ξ± secara keseluruhan yang dapat diterima dekat dengan nominal . Tentunya tes akan menolak jarang (di bawah H 0) jika mereka dilakukan hanya jika T 2 menolak. Namun. Untuk kasus ini. kecuali ukuran sampel sangat besar. Di antara pendekatan multivariat (prosedur 4. Tapi Rencher dan Larson (1980) telah menunjukkan bahwa metode bertahap memiliki risiko tinggi memilih variabel palsu. Jika kita melakukan tes univariat saja. tingkat kesalahan eksperimen berubah. 05.05.2 juga menyoroti pentingnya menggunakan t. direkomendasikan dalam banyak teks dan paket perangkat lunak. Prosedur ini tampaknya memiliki keseluruhan yang diinginkan Ξ± level dan jelas akan memiliki kekuatan yang lebih baik daripada tes menggunakan T Ξ± atau t Ξ± / 2 p sebagai kritis nilai. seperti yang diharapkan. Namun.test individu (lihat Bagian 8. Hummel dan Sligo (1971) mempelajari tingkat kesalahan eksperimen untuk t univariat .3). Koefisien ini sering akan menceritakan kisah yang berbeda dari pengujian univariat. dan 7). Hummel dan Sligo menyarankan untuk melakukan multivariat T 2 -tes diikuti oleh t. yang membandingkan (nilai absolut) koefisien dalam diskriminan berfungsi untuk menemukan pengaruh masing-masing variabel dalam memisahkan kedua kelompok pengamat. Jadi di antara yang tiga prosedur univariat (prosedur 1. r 2 di umum adalah untuk setiap pasangan variabel. dan tes menggunakan t Ξ± / 2 menjadi lebih diterima. Ukuran sampel untuk masing-masing dari dua sampel. karena tes univariat tidak memperhitungkan korelasi antar variabel ables atau pengaruh masing-masing variabel pada T 2 di hadapan variabel lain. 5. ketika tes ini dilakukan hanya setelah penolakan oleh T 2-test (tes tersebut kadang-kadang disebut tes yang dilindungi). membuat ini menjadi univariat yang disukai tes (dalam batas-batas studi mereka). dan 3). Tabel 5. Empat terakhir metode multivariat dalam arti bahwa struktur korelasi secara eksplisit diambil memperhitungkan dalam perhitungan. yang melibatkan korelasi antara masing-masing variabel dan diskriminan fungsi. Menggunakan Ξ± = . SEBUAH variabel biasanya akan memiliki efek yang berbeda dengan adanya variabel lain selain itu dengan . Probabilitas penolakan satu atau lebih dari tes p univariat ketika H 0 benar disebut Ξ± keseluruhan atau tingkat kesalahan eksperimen . Dengan demikian metode ini setara dengan metode 1 dan merupakan univariat bukan pendekatan multivariat.

sendirinya. lihat Rencher (1993. kami memperoleh y 1 .2. Dalam fungsi diskriminan z = ay = a 1 y 1 + a 2 y 2 + Β·Β·Β· + a p y p .5. dimana a = S βˆ’1 pl ( y 1 . Vektor koefisien fungsi diskriminan diperoleh dari (5. 1998. Bagian 3. ..5. a p menunjukkan relatif penting. Jika variabel tidak sepadan (serupa dalam skala dan varians). Rencher dan Scott (1990) memberikan dekomposisi informasi dalam koefisien fungsi diskriminan standar..y 2 ) . Contoh 5. Untuk data psikologis pada Tabel 5. koefisien a 1 . ini memungkinkan untuk lebih valid perbandingan antar variabel. yang koefisien harus distandarisasi.3). Untuk sebuah analisis rinci dari efek setiap variabel di hadapan variabel lain..tance dari variabel dalam konteks multivariat.14) sebagai Dengan demikian kombinasi linear yang paling baik memisahkan kedua kelompok adalah . a 2 . seperti dalam Bagian 8.tidak.5 dan 3.tes univariat dapat.5. sesuatu t. dan S pl dalam Contoh 5.4.1. y 2 .3.

(Setelah standardisasi. kontribusi relatif dari variabel agak berubah.di mana y 1 dan y 3 tampaknya berkontribusi paling besar untuk pemisahan kedua kelompok.7 di Appendix B. lihat Jawaban untuk Soal 8.) .