You are on page 1of 21

Ten Errors in Statistical

Conclusions
Indang Trihandini
1. It’s Not Technically Statistically
Significant, But
• Intermediate Statistik adalah Tentang
membangun model dan melakukan analisis data,
fokus untuk eksplorasi data dan mencari tahu
cerita di baliknya.
• Kesalahan ketika entri data atau kesalahan
pencatatan.
• Kesalahan pada grafik atau statistik deskriptif
dasar sebelum menganalisis data
Data

– Bagaimana mengumpulkan data?


– Bagaimana data diverifikasi?
– Bagaimana data dikelompokkan /
dibedakan? (titik potong)
– Pecilan data
– Bagaimana data yang sudah
didapat akan dianalisa?
Test of mu = 26.000 vs mu not = 26.000

Variable N Mean StDev SE Mean T P


With 16 25.625 3.964 0.991 -0.38 0.71
Without 15 24.733 1.792 0.463 -2.74 0.016

Variable N Mean StDev SE Mean 95.0 % CI


With 16 25.625 3.964 0.991 (23.513, 27.737)
Without 15 24.733 1.792 0.463 (23.741, 25.725)
2. Pemilihan teknik statistik yang tepat

Pulse Rates Before and After Marching

Student BEFORE AFTER DIFFA-B


1 60 78 18
2 56 66 10
3 90 96 6
4 78 88 10
T-test Independent

Kesimpulan tidak ada perbedaan rate pulse


Paired Test

Paired T for AFTER - BEFORE

N Mean StDev SE Mean


AFTER 4 82.00 12.96 6.48
BEFORE 4 71.00 15.87 7.94
Difference 4 11.00 5.03 2.52

95% CI for mean difference: (2.99, 19.01)


T-Test of mean difference = 0 (vs not = 0):
T-Value = 4.37
P-Value = 0.02

Kesimpulan ada perbedaan rate pulse sebelum dan


sesudah
3. Laporkan CI bersama p Value
• P-value tells you if statistically significant.
• Confidence interval tells you what the population
value might be

Two sample T for Phone

Gender N Mean StDev SE Mean


Male 59 79 162 21
Female 80 153 247 28

95% CI for mu (1) - mu (2): ( -142, -5)


T-Test mu (1) = mu (2) (vs not =): T = -2.11 P = 0.036
DF = 135
P-value tells us significant difference, but confidence interval tells us
that the difference in the averages could be as small as 5 minutes.
Outliers
Menghilangkan Outlier

Two sample T for Phone

Gender N Mean StDev SE Mean


Male 58 59.9 66.5 8.7
Female 79 129 133 15

95% CI for mu (1) - mu (2): ( -103.7, -35)


T-Test mu (1) = mu (2) (vs not =): T = -4.02 P = 0.0001
DF = 121

The difference in male and female phone usage becomes even more significant.
We are 95% confident that the difference in the averages is now more than 35
minutes.
4. Menggunakan Non Random (sampel)

• Menggunakan non-random/unrepresentative
sample.
• Contoh
• Shere Hite wrote a book in 1987 called “Women in
Love”
• 100,000 questionnaires about love, sex, and
relationships sent to women’s groups. Only 4,500
questionnaires returned.
• Entire book devoted to results of survey.
• Examples: 91% of divorcees initiated the divorce;
70% of women married 5 years committed adultery.
5. X --> Y
• penelitian di kelas statistik, Faktor-faktor yang
berhubungan dengan nilai ujian akhir Anda. Data
dari 500 mahasiswa, menjawab pertanyaan
Berapa banyak tidur yang Anda dapatkan malam
sebelum ujian. Hasil didapatkan bahwa trend tidur
malam yang sebelum ujian seiring dg trend positif
nilai tinggi.
6. Assumed the Data Was Normal
• Mengasumsikan data berdistribusi normal,
mengakibatkan kesalahan perhitungan uji statistik.
7. Only Reporting “Important” Results

Hasil yang signifikan, menarik, dan bermakna, tetapi Anda juga


harus dapat memeriksaangka setiap pilihan dan melihat data
dengan cara yang sesuai
Setiap teknik memiliki kesempatan untuk kesalahan seperti tingkat
α adalah 0,05,
Pada artikel jurnal menunjukkan statistik yang signifikan hasil
(ketika Ho ditolak). Menolak Ho adalah satu-satunya kesimpulan
penting
Bagaimana dengan semua saat-saat Ho tidak bisa ditolak? Misalnya,
ketika dokter gagal untuk menyimpulkan bahwa minum diet cola
menyebabkan kenaikan berat badan, atau ketika jajak pendapat
tidak menemukan bahwa orang-orang tidak senang dengan
presiden? masyarakat
Lebih baik jika para peneliti dan media didorong untuk melaporkan
statistik tidak signifikan tetapi tetap merupakan masih hasil penting,
bersama dengan hasil signifikan secara statistik.
• Intinya adalah ini: Dalam rangka untuk mengetahui apakah
kesimpulan statistik benar, Anda tidak bisa hanya melihat
hasil analisis saja tetapi hasil yang tidak sesuai dg hipotesis
Anda.
• Hindari keinginan untuk terburu-buru untuk menolak Ho
8. A Bigger Sample Is Always Better

• Ukuran sampel harus cukup besar untuk memberikan presisi


dan pengulangan hasil Anda, tetapi terlalu besar, akan
membuat kesalahan. seperti menolak hipotesis nol,
• Pertanyaan yang perlu dimengerti adalah untuk apa anda
menghitung besar sampel
• Waspadalah terhadap seseorang yang mengatakan, "Hasil
ini secara statistik signifikan, dan ukuran sampel besar dari
100.000 memberikan bukti lebih kuat untuk itu."
9. Low Power

• Success = Yes, I recycle.

• Gender X N Sample p
• Male 33 59 0.559322
• Female 54 79 0.683544

• Estimate for p(1) - p(2): -0.124222


• 95% CI for p(1) - p(2): (-0.287215, 0.0387704)
• Test for p(1) - p(2) = 0 (vs not = 0): Z = -1.49
• P-Value = 0.135
Low Power

Power and Sample Size


Test for Two Proportions

Testing proportion 1 = proportion 2 (versus not =)


Calculating power for:
proportion 1 = 0.55 and proportion 2 = 0.70
Alpha = 0.05 Difference = -0.15

Sample
Size Power
60 0.4366
70 0.4911
80 0.5421 *Sample size = # in EACH group
10. Just Decided to Leave It Out
Menghapus data yang tidak sesuai dengan
model yang diinginkan (dengan kata
lain,"Fudging" data).
Thank You

You might also like