Professional Documents
Culture Documents
ANALISIS DATA
Hazura Mohamed
DATA ANALISIS
Objektif :
Kemahiran dalam menganalisis data menggunakan teknik-teknik berstatistik
Analisis Statistik
Merupakan tatacara, teknik dan kaedah yang digunakan untuk tujuan memahami data dan maklumat, membuat penelitian, meringkas dan membuat analisis bagi memperihalkan berbagai ragam data. Peranan utamanya ialah supaya data yang berbagai macam ini mudah difahami oleh orang ramai.
Kategori Statistik
Statistik deskriptif
Menggunakan kaedah berangka dan grafik untuk menentukan corak set data, meringkaskan maklumat daripada set data dan mempersembahkan maklumat yang dikumpul daripada sampel dalam bentuk yang menarik.
Oleh kerana pemerihalannya terhad kepada sampel sahaja ia tidak digunakan untuk tujuan membuat kesimpulan dan generalisasi menyeluruh kepada populasi yang dikaji
Statistik Inferens
Prosidur-prosidur untuk membuat generalisasi mengenai populasi yang dikaji berdasarkan maklumat daripada sampel yang diambil dari populasi.
Deskriptif Statistik
1- Analisis UNIvariate 2- Analisis Bivariate
Analisis Univariate
1.Taburan Frekuensi
Paling basic (and least useful) Percentage Mod (nominal data) Min (interval data ) Mod (nominal data) Median (ordinal data)
Sambung
3.Ukuran Serakan
Minimum Maksimum Julat perbezaan di antara maksimum dan minimum Sisihan piawai ukuran sejauh mana subjek-subjek yang dikaji berbeza daripada min kumpulan.(the more heterogeneous the group, the higher the standard deviation)
Sambung
Skew = 0
Analisis Bivariat
Korelasi
Data
Teknik--teknik berstatistik adalah ditentukan oleh jenis data. Pemahaman asas mengenai jenis data membantu dalam pemilihan kaedah analisis dan ujian statistik yang sesuai
Jenis Data
Dua jenis data iaitu: Data Kuantitatif-numerik nilai-nilai data adalah bilangan atau ukuran berangka. Data kuantitatif boleh dalam bentuk:
Contoh: bilangan buah bagi setiap pokok dalam kebun, saiz kasut bagi pelajr sebuah kelas dan bilangan anak dalam setiap keluarga dsbnya atau
Selanjar- Tidak boleh mengambil nilai yang tepat tetapi boleh dihampirkan kepada ukuran tertentu
Contoh: tinggi pelajar, berat buah jambu , halaju kereta, PNGK pelajar-pelajar sarjana UKM-NPC, gaji pensyarah dan sebagainya.
Jenis Data
Data Kualitatif- bukan numerik Nilai-nilai data adalah kategori bukan berangka.
Skala Pengukuran
Data Nominal
Data nominal sesuai pada data yang hanya dapat diklasifikasikan ke dalam kategori, nama atau label. Kategori tidak dapat disusun mengikut urutan. Dapat memberikan nilai numerik pada kategori tapi tidak dapat melakukan operasi matematik terhadap nilai-nilainya. Cth: male = 0 dan female = 1, budak ceria = 1 dan budak tak ceria = 2
Skala Pengukuran
Data Ordinal
Sama seperti data nominal. Membezakan ialah data boleh disusun mengikut urutan. Tetapi kita tidak boleh mengukur perbezaan di antara dua data. Kita dapat memberikan nilai numerik namun tidak dapat melakukan operasi matematik Cth:
Pengundi-pengundi diklasifikasikan sebagai low-income, middleincome, or high-income Frekuensis Penerbangan: tidak pernah, jarang, kadang-kadang, selalu. Bagaimana penilaian anda terhadap restoran itu? Sangat baik, baik, cukup, kurang.
Skala Pengukuran
Data Interval/Sela
Data interval adalah sama spt data ordinal iaitu data boleh disusun. Perbezaan antara data bermakna dan boleh diukur. Cth. Senarai suhu-suhu didih bagi cecair yang berbeza. Kita boleh tahu samada suhu didih cecair A lebih tinggi daripada suhu didih cecair B. jika suhu didih cecair A adalah 212darjah dan suhu didih cecair B adalah 284 darjah , suhu didih cecair B adalah lebih tinggi daripada suhu didih cecair A. Nilai sifar bersifat arbitrari.(tidak menggambarkan kosong secara mutlak)
Skala Pengukuran
Data Nisbah(ratio data) Data nisbah adalah sama seperti data interval kecuali nisbah memberi makna.. Data ratio mempunyai nilai kosong secara mutlak. Nilai kosongnya mempunyai maksud tiada kuantiti. Seseorang yang tidak bekerja bermaksud gajinya RM 0. Cth. 4 orang dipilih secara rawak dan ditanya berapa banyak duit yang mereka bawa sekarang. Berikut adalah hasilnya : $21, $50, $65, and $300. Adakah data ini boleh disusun ikut urutan? Ya, $21 < $50 < $65 < $300. Bolehkah kita mengira nisbah ? Ya sebab $0 nilai paling maksimum yang mereka bawa. Individu yang mempunyai $300 adalah mempunyai 6 kali ganda daripada individu yang mempunyai $50.
Cth lain: umur, skor ujian, jumlah jam belajar untuk suatu ujian.
Statistik Inferens
Pengujian Hipotesis
Pengujian hipotesis merupakan kaedah yang paling berkesan untuk membuat kesimpulan mengenai suatu populasi yang dikaji berpandukan keputusan yang didapati daripada sampel. Hipotesis statistik adalah satu kenyataan yang dibuat tentang suatu populasi Kenyataan ini mungkin benar atau tidak Benar atau tidak +++> lakukan pengujian hipotesis
Penting untuk menguji adakah perbezaan yang wujud di antara data dalam sampel dan populasi adalah benar-benar berbeza atau berbeza secara kebetulan sahaja.
Takrif Hipotesis
Hipotesis statistik adalah suatu pernyataan atau anggapan yang mungkin benar atau tidak terhadap suatu populasi atau lebih (Walpole, 1990). Hipotesis yang baik mempunyai sifatsifat seperti berfokus, jelas, logik, difahami dan dapat diuji.
Penyataan hipotesis Jenis Taburan Data Aras keertian Ujian Statistik Kawasan Penolakan Pengiraan ujian statistik Keputusan Kesimpulan
Pernyataan Hipotesis
Hipotesis nol ditandakan dengan H0 ialah hipotesis yang hendak diuji dan diharap akan ditolak.
oMesti yang membawa maksud kesamaan. oJadi ada 3 kemungkinan: sama ada = atau atau .
Contoh: Ho: Purata pendapatan pelajar MIT UKM Bangi adalah RM4,000.00 sebulan
Pernyataan Hipotesis
Hipotesis alternatif ditandakan dengan H1 , biasanya dinamakan hipotesis penyelidik yang dirumuskan dengan harapan untuk menerimanya. Kebiasaannya sebarang pernyataan yang hendak dibuktikan benar, ditulis dalam hipotesis alternatif Mesti membawa maksud ketaksamaan. o Jadi ada 3 kemungkinan: sama ada atau < atau >. o Diterima jika Ho ditolak.
Contoh: H1: Purata pendapatan pelajar MIT UKM Bangi adalah kurang RM4,000.00 sebulan
Pernyataan Hipotesis
Pernyataan hipotesis penyelidikan yang terlalu kabur. Cth: terdapat hubungan kecerdasan dan sikap Pernyataan hipotesis penyelidikan yang terlalu umum. Cth: pelajar yang bijak mempunyai sikap yang baik Pernyataan hipotesis penyelidikan dalam bentuk yang tidak boleh diuji. Cth: pelajar yang rajin ke kuliah lebih beriman
Taburan Data
Taburan data sampel perlu di kenalpasti terlebih dahulu untuk membolehkan kita menggunakan statistik ujian yang betul. Bagi data yang diambil dari taburan normal, taburan sampel nya juga normal. Bagi data yang diambil dari taburan bukan normal, teorem had memusat diperlukan. Ujian kenormalan juga boleh digunakan untuk menguji adakah data tertabur secara normal. oBina histogram , Bina plot batang-daun oKira pekali kepencongan dan kepuncakannya. oGunakan hubungan min, mod dan median dengan bentuk taburan. oAtau gunakan perisian untuk menguji kenormalan
Aras Keertian
Menerima atau menolak H0 bergantung kepada tahap signifikan atau aras keertian (level of significance) Aras keertian ditandakan dengan simbol Juga dipanggil sebagai kebarangkalian berlakunya ralat jenis I, iaitu dalam membuat keputusan, hipotesis nol ditolak sedangkan pada hakikat ianya benar. Maka semakin besar nilai , semakin besar kemungkinan kita akan menolak hipotesis nol yang benar Lazimnya nilai yang digunakan ialah 0.1, 0.01 atau 0.05
Ujian Statistik
Sebelum memilih suatu ujian statistik , tanya: Berapa banyak pembolehubah kajian? Adakah taburan data normal? Adakah sampel independent atau dependent? Apakah hipotesis anda? Adakah data nominal, ordinal, selang/ratio?
Kajian hubungan
Design Scale of Measurement Correlation Coefficients Phi Coefficient
Two nominal variables A nominal variable and an interval or ratio variable Survey or Correlational Studies
Point-biserial
Ordinal
Spearman's r
Interval or ratio
Pearson's r
Ratio or Interval
T-test: Population variance must be estimated Nominal Chi-Squared Sign test, Wilcoxon's rank-sum test ,U-Mann Whitney test(tidak bersandar) Student's t-test
Two-group between-subject
Ordinal
Interval or ratio
Kruskal-Wallace's H-test
Fisher's F-test (ANOVA) If significant, test individual means with Tukey's HSD
Contoh
Seorang pensyarah ingin mengetahui adakah belajar secara dalam kumpulan menyebabkan peningkatan prestasi dalam exam berbanding belajar secara individu..
1.
2.
3. 4. 5.
6.
Tujuan : menguji adakah teknik belajar memberi kesan kepada pencapaian markah. Mengkaji dua kumpulan sampel yang independent Pembolehubah kajian : markah peperiksaan Skala pengukuran: nisbah. Hipotesis H0: Tiada perbezaan purata markah di antara belajar berkumpulan dan belajar sendiri. Statistik ujian yang sesuai :
Kawasan Penolakan
o o o Ada 3 jenis hujung ujian: 2 hujung 1 hujung sebelah kiri 1 hujung sebelah kanan Bergantung kepada H1. Kawasan penolakan adalah kawasan yang membolehkan Ho di tolak
Nilai Kritikal
Keputusan Kesimpulan
Semua keputusan ujian statistik bergantung kepada samada menolak atau menerima hipotesis nol. Namun ianya dipengaruhi oleh 2 ralat statistik Ralat jenis I
berlaku jika kita menolak H0 apabila dalam keadaan sebenar, ia benar dan berlaku apabila kita tidak menolak H0 sedangkan dalam keadaan sebenar, ia palsu.
Ralat jeis II
Secara Matematik
= kb (Ralat jenis I ) = kb ( tolak H0| H0 benar ) dan = kb (Ralat jenis II) = KB (Terima H0| H0 palsu)
Apa itu SPSS? SPSS (Statistical Package for the Social Sciences) Satu sistem yang berupaya mengurus data dan menganalisis secara berstatistik. Mudah digunakan dan boleh memanipulasi data. Tetapi SPSS tidak boleh menyelesaikan sebarang masalah anda. Ia boleh digunakan untuk menganalisis data Yang penting, anda mesti ada pengetahuan asas mengenai statistik untuk mentafsirkan output.
Data Nominal Frequency, Crosstabs, bar charts dan pie charts Data Ordinal - Frequency, Crosstabs dan descriptivee statistics, bar charts, pie charts, steam-lesf plots Data selanjar descriptive statistics, histograms, boxplots, dan scatter plot bagi dua pembolehubah
Kumpulan 1. Menguji jika terdapat perbezaan yang bererti di antara dua pembolehubah; Kumpulan 2. Menguji kesignifikanan hubungan di antara dua pembolehubah; dan Kumpulan 3. Menguji jika terdapat perbezaan yang signifikan diantara lebih daripada dua pembolehubah.
Analisis Inferensi
Kumpulan 1. Menguji jika terdapat perbezaan yang bererti di antara dua pembolehubah
Kedua, jika membandingkan dua atau lebih kumpulan, periksa kehomogenan bagi varians di antara kumpulan.
Guna explore
Bagi perbandingan dua kumpulan, guna Independent ttest bagi independent sample dan dependet t-test bagi paired sample Jika tidak normal guna analyze nonparametric
Analisis Inferensi
Nominal data guna crosstab dan pilih ujian yang sesuai untuk nominal data Ordinal data guna crosstabs, bivariate correlation spt pekali korelasi Spearman Data Selanjar guna bivariate correlation spt Pearson correlation
Analisis Inferensi
Kumpulan 3. Menguji jika terdapat perbezaan yang bererti di antara lebih dua pembolehubah Bagi data tidak normal pilih
Sekian
Terima Kasih