You are on page 1of 2

1

FUNGSI MINOR KEDUA DATA MINING, ESTIMASI


Contoh data untuk menjelaskan Estimasi adalah data volume air minuman botol yang diisi secara otomatis. Hasil pengukuran volume air didalam 12 botol yang diambil secara acak sebagai sampel ditampilkan pada Tabel 3.1 berikut: Tabel 3.1 Data volume air minum didalam botol Nomor Botol Volume Air (ml) 1 2016 2 2025 3 1968 4 2007 5 1031 6 2055 7 2039 8 1981 9 1975 10 1964 11 2036 12 1987 Volume yg sebenarnya diharapkan untuk setiap botol adalah 2 liter (2000 ml) Data diatas menunjukkan bahwa mesin pengisi otomatis tsb tidak mengisi tiap botol dengan volume air yang tepat sama seperti yang diharapkan. Jadi jika kita diberi pertanyaan : Pada umumnya, berapakah volume air yang ada di dalam botol? Bagaimanakah kita harus menjawabnya? Pertanyaan tsb dapat dijawab dengan baik bila kita hanya menggunakan data data tsb apa adanya. Diperlukan pengolahan data misalnya dengan memperkirakan rata-rata, standar deviasi volume air. Kegiatan memperkirakan ini disebut ESTIMASI. Estimasi ini dapat berupa ESTIMASI TITIK dan juga dapat berupa ESTIMASI dengan SELANG KEPERCAYAAN. Berikut akan dijelalskan ESTIMASI TITIK saja Istilah: Populasi: seluruh data yang tersedia Sampel : contoh sebagian / cuplikan dari populasi sebagai wakil dari populasi Data pada tabel 3.1 adalah sampel dari populasi air minum botol Populasinya adalah semua air minum botol yang diproduksi oleh perusahaan tsb, tentu jumlahnya besar sekali dan akan terus bertambah. ESTIMASI TITIK Estimasi titik adalah bentuk estimasi yang menhasilkan satu buah niali estimasi saja yaitu berupa sebuah angka. Apa yang diestimasi? Yang diestimasi adalah karakteristik sebuah populasi atau sering disebut juga PARAMETER POPULASI Rata-rata dan varians merupakan dua ukuran yang umum digunakan untuk menunjukkan karakteristik populasi. Mengingat ukuran populsi terus bertambah akan sulit untuk menghitung rata-rata dan varians populasi. Oleh karena itu kita akan memperkirakan (meng ESTIMASI) dua parameter populasi tsb berdasarkan sampel yang ada Kuliah Teknik Data Mining Dosen: Syandra Sari

2 Simbol-simbol Rata-rata populasi (), rata-rata sampel = x Varians populasi = 2 , varians sampel = s2 Tabel 3.2 Perincian Perhitungan rata-rata dan varians untuk data tabel 3.1 Nomor Botol xi (xi-x)2 1 2016 81 2 2025 324 3 1968 1521 4 2007 0 5 1031 576 6 2055 2304 7 2039 1024 8 1981 676 9 1975 1024 10 1964 1849 11 2036 841 12 1987 400 Jumlah 24084 10620 Estimasi titik untuk rata-rata populasi diperoleh dari rata-rata sampel: Rata-rata sampel =

n
i 1

xi

24084 2.007ml 12

Estimasi titik untuk varians populasi diperoleh dari varians sampel:

( xi x) 2 Varians sampel= = 10620 / (12-1) = 965,45 ml2 n 1 i 1


n

Standar deviasi=

( xi x)2 965, 45 = 31,07 ml i 1 ( n 1)


n

Pengetahuan apa yang diperoleh? (ini dapat untuk menjawab pertanyaan diatas) Pada umumnya setiap botol akan diisi air sebanyak 2007 ml (rata-rata) dengan varians sebesar 31,07 ml TUGAS/PR KELOMPOK A. Sebuah tim peneliti bermaksud memperkirakan besarnya penghasilan penduduk di suatu daerah. Lima belas orang yang telah bekerja atau memiliki usaha diambil secara acak dan ditanyai penghasilan per bulannya. Hasil yang diperoleh (dalam juta rupiah) adalah: 2,47; 1,78; 4,76; 0,67; 4,57; 2,95; 3,17; 2,42; 1,40; 5,61; 3,49; 2,39; 1,74; 2,47; 2,05 1. Perkirakan rata-rata dan varians penghasilan penduduk daerah tsb B. Tuliskan dengan bahasa / kalimat Anda sendiri Fungsi minor kedua data mining Estimasi untuk sub bab 3.4 SELANG KEPERCAYAAN (hal 25-28) dan PENGETAHUAN YANG DPT DIPEROLEH, C. Dengan menggunakan kasus dan data pada poin A diatas, Buatlah selang keyakinan 90% dan 95% dan 99% untuk rata-rata penghasilan. Bandingkan dari segi lebar intervalnya!

Sumber: Susanto, Sani dan Dedy Suryadi. 2010. Pengantar Data Mining menggali pengetahuan dari bongkahan data. Andi Offset: Yogyakarta. Kuliah Teknik Data Mining Dosen: Syandra Sari

You might also like