Rabu, 18 Mei 2016

Uji Chi Squared dan Annova


Kali ini berhubungan dengan Chi Squared dan Annova

Dimulai dengan chi-squared

Uji chi squared merupakan salah satu jenis uji komparatif non parametris yang dilakukan pada dua variabel, di mana skala data kedua variabel adalah nominal.
  • Jika frekuensi dekat dengan frekuensi harapan , nilai X0 kecil dan kesesuaian baik sehingga mendukung penerimaan terhadap H0
  • Jika frekuensi berbeda dengan frekuensi harapan , nilai X0 besar dan  kesesuaian buruk sehingga mendukung penolakan terhadap H0
  • Uji ini sebaikanya digunakan jika setiap frekuensi harapan paling sedikit 5  atau tidak boleh lebih dari 20%.
1. Goodness Of Fit test

Merupakan pengujian hipotesis untuk menentukan apakah suatu himpunan frekuensi yang diharapkan sama dengan frekuensi yang diperoleh dari suatu distribusi, seperti distribusi binomial, poisson, normal, atau dari perbandingan lain. Secara singkat, goodness of fit merupakan pengujian kecocokan atau kebaikan suai antara hasil pengamatan (frekuensi pengamatan) tertentu dengan frekuensi yang diperoleh berdasarkan nilai harapannya (frekuensi teoretis).

2. Uji Kebebasan (Independensi)
Memeriksa independensi 2 variabel (frekuensi teramati dan frekuensi harapan) sehingga disimpulkan apakah kedua variable tersebut saling bebas (tidak berhubungan / berpengaruh) atau saling berkaitan.

Langkah-langkah pengujian  Chi-squared of fit adalah sebagai berikut:
a. Menentukan hipotesis
H0 : frekuensi pengamatan sesuai dengan frekuensi yang diharapkan
H1 : frekuensi pengamatan tidak sesuai dengan frekuensi yang diharapkan

b. Menentukan tingakat signifikansi ( α ) dan nilai χ2 dari tabel
Tingakat signifikansi ( α ) dan nilai χ2 tabel ditentukan dengan derajat bebas (db) = k – N

Keterangan:
k = banyaknya kejadian
N = banyaknya besaran yang digunakan

c. Menentukan kriteria pengujian
H0 diterima apabila χ20 ≤ χ2α (k – N)
H0 ditolak apabila χ20 > χ2α (k – N)

d. Menentukan nilai uji statistik

e. Membuat kesimpulan
Menyimpulkan apakah H0 ditolak atau diterima berdasarkan nilai statistik uji yang diperoleh.

Berikut merupakan tabel Chi yang dapat digunakan untuk Uji Chi Squared :


Kemudian masuk ke pembahasan Anova

Annova merupakan pengujian yang dilakukan untuk pengambilan keputusan menggunakan distribusi F. Oleh karnanya uji anova sering pula disebut uji-F.

Pada pengujian anova ini memiliki bebera asumsi :
Data berdistribusi normal
Skala pengukuran minimal interval
Variansi homogeny
Pengambilan sampel secara acak

Secara garis besar, anova, yaitu :
1.One way (satu arah)
Merupakan beberapa kelompok yang dihadapi merupakan pembagian dari satu variable bebas (single factor experient atau complete random design-CRD ).
Ini adalah metode uji hipotesis rata-rata k sampel, bila pada setiap sampelnya hanya terdiri atas atu kategori. Jadi  dalam ANOVA satu arah menggunakan sampel acak berukuran n diambil masing-masing dari k populasi.

Dekomposisi varians dapat diajabrkan : SST = SSK + SSE


Cara perhitungannya ada 2, yaitu :
1. Rumus perhitungan kuadrat


2. Matriks

Berikut rumus yang digunakan dalam Annova one way


2.Two way (dua arah)
merupakan jenis annova yang memungkinkan beberapa kelompok yang dihadapi merupakan pembagian dari beberapa variable bebas. denagn istilah lain disebut dengan two factor experiment, factorial design ataurandomized block design. Pengujian dilakukan dengan tidak hanya melihat satu faktor (perlakuan) saja, tetapi juga dengan mempertimbangkan faktor blok .



Dekomposisi varians dapat dijabarkan: SST = SSB + SSK + SSE


Berikut beberama rumus yang digunakan untuk menentukan annova :


Berikut merupakan tabel T yang digunakan untuk perhitungan Annova:


Estimasi


Estimasi
Merupakan proses menaksir nilai sebuah parameter berdasarkan informasi yang diperoleh dari sebuah sampel. Nilai-nilai tersebut mendeskripsikan populasi Bluman ( 2009, 0.356 )

Sifat-sifat dari estimator :

  • Unbias estimator : sampel sama dengan parameter (akurat)
  • Relative efficient estimator : unbias estimator yang memiliki variansi terkecil (presisi)
  • Consistent estimator : unbias yang mendekati nilai yang sebenarnya sejalan dengan bertambahnya ukuran sampel


Masalah pada saat menggunakan estimasi :
Penaksiran yang bisa dilakukan dengan hasil lebih tinggi atau lebih rendah. Maksudnya adalah ada nilai yang tiba-tiba terlalu jauh dari pada umumnya. Mengakibatkan 2 grafik yang masing-masing memiliki nilai tengah (biased). Bila 2 grafik tapi masih memiliki nilai tengah yang sama bisa disebut juga sebagai unbiased



Istilah-istilah dalam estimasi :

  • Interval estimate : menaksir suatu parameter
  • Confidence interval : interval kepercayaan, mengandung parameter dari sampel besar
  • Confidence level : dengan nilai desimal

Estimasi pada sampel besar, parameter sigma diketahui. Misalnya setiap populasi distribusi normal memiliki formulasi margin error. Sedangkan untuk estimasi pada sampel kecil, kalau simpangan baku tidak diketahui  sebaran penghitungan menggunakan table t-student bukan table Z

Distribusi Sampling Rataan dan Proporsi


Distribusi = Pengiriman barang dan jasa dari produsen kepada konsumen
Sampling = Proses dan cara mengambil sampel
Rataan  = Ukuran statistik kecenderungan terpusat

Jadi Distribusi Sampling Rataan itu merupakan proses pengambilan sample dengan ukuran statistik terpusat yang dilakukan pada pengiriman barang dari produsen ke konsumen ?

Bukan seperti itu hehe... 

Distribusi Sampling adalah distribusi probabilitas suatu statistik berdasarkan semua kemungkinan sampel dengan karakteristik statistik yang berbeda-beda. Nilai statistik dari sampel yang terbentuk dijadikan penduga dari parameter populasinya

Nah dalam menentukan distribusi sampling,dibutuhkan teori limit pusat atau Central Limit Theorem ( CLT ) yang berisikan Distribusi Normal 

Berdasarkan teori, Teorema Limit atau Central Limit Theorem ( CLT ) pusat berdasarkan 2 sample yaitu :
1. Sampel Besar
2. Sampel Kecil

Mari kita bahas lebih lanjut...

1. Sample  Besar

Merupakan sample yang menjelaskan hubungan antara distribusi sampling rataan sampel dan populasinya. Penghitungan pada sampel besar ini dengan menggunakkan table normal, atau table Z, dan dihitung dengan menggunakan distribusi normal


Apa itu distribusi normal ?


Distribusi normal ( Distribusi Gauss ) merupakan distribusi yang bersifat kontiniu dan dapat membentuk kurva normal.

Berdasarkan teorinya terdapat 3 sifat utama distribusi normal :
1. Grafiknya selalu diatas sumbu x atau f(X) > 0
2. Bentuk simetris terhadap garis tegak x = µ
3. Mempunyai satu modus, kurva unimodal pada posisi : x = µ 

Saat sample ukuran n berulang kali diambil dari sebuah populasi ,dimana populasi ini terbentuk dari statistik sample dinamakan dengan Distribusi Sampling

Hubungan antara ukuran Statistik Sample dengan Distriusi Sampling 
Statistika rataan => Distribusi sampling rataan
Statistika proporsi => Distribusi sampling proporsi
Statistika vaiansi => Distribusi sampling variansi dan sebagainya

Berikut merupakan tabel z yang dapat digunakan untuk distribusi normal 


2. Sample kecil 

Merupakan penghitungan yang dilakukan pada sampel kecil ini dengan menggunakkan table t, atau table student, dan dengan menggunakan distribusi – t
Apa itu distribusi-t ?


Distribusi-t merupakan distribusi yang digunakan ketika σ tidak diketahui dan dengan ini distribusi tersebut dianggap hampir normal

Terdapat beberapa hal yang harus diperhatikan ketika menggunakan distribusi –t  :
 1. Derajat keabebasan ( degree of freedom )  disingkat db atau v dengan : v = n-1
 2. Nilai α , yaitu luas daerah di kanan dengan nilai (+t) atau di kiri dengan nilai (-t)



Berikut merupakan tabel–t yang dapat digunkana pada distribusi–t 


Berhubungan dengan judul kita kali ini,setelah mengetahui apa itu distribusi sampling, kita akan membahas mengenai distribusi sampling rataan
Distribusi sampling rataan ?




Distribusi sampling rataan merupakan distribusi rata- rata aritmatika dari seluruh sampel acak berukuran n yang mungkin , yang dipilih dari sebuah populasi berukuran N. Dikatakan distribusi sampling rata-rata karena tujuan menaksir rata-rata atau mean dari populasi

Sifat Distribusi sampling rataan
1.Mean dari rataan samoke akan sama dengan mean populasi


2.Standar deviasi rataan sample akan lebih kecil dari standar deviasi sebuah populasi, dan itu akan sama dengan standar deviasi populasi dibagi dengan akar kuadrat dari ukuran sample


Berikut merupakan ringkasan distribusi sampling rataan ( X )





Distribusi sampling selisih rataan
Dimana formulasi distribusi sampling selisish rataan seperti berikut :




Proporsi 
Dengan konsep sebagai berikut :



Konsep utama dari distribusi sampling proporsi yaitu apabila suatu populasi berukuran N mengandung peristiwa jenis P memiliki parameter proporsi p dengan mean populasi µ = ( X/ N)
Brikut merupakan beberapa rumus yang digunakan untuk menentukan Distribusi sampling proporsi :
  

Populasi, Sample dan Sampling dalam menentukan Ukuran Sampel


Bagaimana cara agar kita dapat menguji tingkat kesejahteraan masyarakat Indonesia pada tahun 2106? 
Jika 250 juta penduduk di uji ? Apa yang akan terjadi ?

Pastinya memakan waktu, tenaga, dan source yang sangat banyak bukan ?
Oleh karnanya diperlukan suatu sample dalam menentukan sebagian kecil populasi yang dianggap dapat mewakili seluruh populasi yang ada.

Populasi ???
Sample ???


Bicara mengenai populasi,apa itu Populasi ?




Populasi merupakan suatu wilayah generalisasi yang terdiri atas: objek dan subjek yang mempunyai kuantitas dan karakteristik tertentu yang ditetapkan oleh peneliti untuk dipelajari kemudian ditarik kesimpulannya. (Sugiyono, 2014, p.148).

Secara garis besar populasi terbagi atas 2 jenis,yaitu :

  • Infinite Population

Merupakan populasi yang mana jumlahnya tidak pernah diketahui dengan pasti (there is no upper limit). Karena jumlahnya sangat besar sehingga tidak mungkin/ sangat sulit untuk dihitung (uncountable).
Contoh :
• Jumlah penduduk penduduk Indonesia.
• Populasi anggrek di dunia
• Kemacetan total kendaraan di suatu jalan.


  • Finite Population

Merupkan populasi yang mana jumlahnya diketahui dengan pasti (there is upper limit) dan dapat diberi nomor identifikasi sehingga dapat dihitung (countable).
• Jumlah mesin di perusahaan akan diperbaiki ketika diketahui suatu perusahaan memiliki 10 buah.
• Jumlah penduduk Indonesia hasil sensus 2010.

Setelah mengetahui Populasi, Sample dirasa juga menarik.. 



Sample adalah bagian dari jumlah dan karakteristik yang dimiliki oleh populasi.
Sample yang baik merupakan sampel yang merepresentasikan semuanya populasi baik dari ukuran, besar,tidak memiliki kesalahan tafsir dan tidak terdapat bias didalamnya. Sampel sangat diperlukan untuk pengambilan data jika penggunaan sensus tidak memungkinkan.

Berdasarkan teori terkait dengan pengumpulan data, terdapat 2 pendekatan dalam mengumpulkan data:
1. Sensus (complete survey)
Sensus merupakan cara pengumpulan data, dimana setiap anggota populasi diteliti seluruhnya satu persatu tanpa kecuali dipilih menjadi anggota sampel (when a population is sampled in its entirety) dalam penjelasan singkat, sensus yaitu teknik mengumpulkan data secara lengkap dari suatu populasi.

2. Sampling (sample survey)
Sampling merupakan cara pengumpulan data, dimana hanya sebagian saja dari anggota populasi yang dipilih menjadi objek penelitian (subset of representative units from the population) dalam penjelasan singkat, sampling yaitu teknik mengumpulkan data hanya sebagian dari suatu populasi.

Mengapa pengumpulan data secara keseluruhan tidak menggunakan sensus ?
Karena terdapat beberapa alasan mengapa mengguankan sensus:
1.Populasi terhingga atau sangat kecil. 
2.Tersedia sumber daya yang cukup.
3.Tidak mengharapkan hasil yang cepat.

Pertanyaan yang sama jika mengapa semua data tidak dikumpulkan dengan sampling ?
berikut merupakan alasan mengapa menggunakan sampling
1. Populasi tak terhingga atau terlalu banyak.
2. Tidak ekonomis 
3. Penelitian eksperimen yang sifatnya merusak . 
4. Sampling terkadang lebih baik dari sensus

Jenis jenis teknik sampling terdapat pada gambar berikut :

Pada sampling terdapat beberapa tahapan  
a. Definisikan Target Populasi 
b. Siapkan Kerangka Sampling 
c. Pilih Teknik sampling 
d. Tentukan Sample size 
e. Lakukan proses sampling

Pada prosesnya sampling juga memiliki penyimpangan ( Error Sampling ).



Error Sampling terbagi atas 2 macam :
1. Sampling Error 
Merupakan suatu penyimpangan yang disebabkan karena pemakaian sampel. Dalam hasil pengukuran sampel diperoleh nilai‐nilai statistik dalam probablistik sampling. Nilai statistik ini tidak akan persis sama dengan nilai parameternya. Perbedaan inilah yang disebut penyimpangan (Sampling Error).

2. Non Sampling Error
Merupakan suatu penyimpangan yang disebabkan bukan oleh pemakaian sampel penyimpangan. Penyimpangan dalam non probabilistik sampling, sampling, nilai sampel terhadap terhadap populasinya tidak mungkin diukur. Disini Penyimpangan yang timbul akibat kesalahan perencanaan teknik sampling, penggantian sampel, salah tafsir enumerator, salah tafsir responden, kesengajaaan responden salah menjawab ataupun kesalahan akibat pengolahan data. Kesalahan pertama diatasi dengan pemakaian metode sampel yang tepat. Dan yang kedua ketelitian dalam perencanaan, implementasi dan pengolahan data hingga penerbitan

Data Statistik , Jenis Data dan Penyajian data


Data statistik ? Mengapa harus ada data ?  Jenisnya apa saja ? Data disajikan dengan apa ?
Nah disini kita akan membahas lebih dalam mengenai DATA STATISTIK.

Dalam data statistik terdapat suatu data mentah. Data Mentah atau raw data adalah data yang sudah terkumpul tetapi belum terorganisasi secara numerik. Spiegel (2008, p.37)
Contohnya
“ Catatan atau rekaman kumpulan angka waktu bicara per-menit dari hasil pengukuran 50 buah baterai Li-Ion 100 mAh “
Dari data diatas memberikan informasi sangat terbatas (ungrouped data). Nah oleh karena itu data yg didapatkan tersebut kita organisir dengan cara Pengolahan Data, Pengolahan ini meliputi rangking, pengelompokkan, tabulasi ataupun grafis yang akan memeberikan informasi yang lebih banyak mengenai Statistik & Statistika.

Bicara mengenai data, data adalah keterangan mengenai sesuatu dari suatu unit pengamatan, yang dapat berbentuk angka (bilangan) atau bukan bilangan. Asra(2014, p.3)

Pada prosesnya,perubahan data terjadi dengan skema sebagai berikut :


Transformasi dari Data Mentah yang diolah dengan statistika menjadi Data Statistik sehingga menghasilkan Informasi Statistik.

Informasi statistik ?

Informasi Statistik merupakan statistik yang memiliki makna dan mampu memberikan informasi bagi user untuk mengambil kesimpulan dan membuat keputusan. Statistika mengandung pengertian statistik dan kesimpulan,akan tetapi secara praktis lebih umum sering dikatakan sebagai“Informasi Statistik”.

Nah kemudian Setelah data didapatkan,bagaimana jenis2 dari data tersbut ?
Berikut merupakan mind mapping dari klasifikasi data :


Setelah kita mngetahui klasifikasi data yang ada,maka kita dapat menyajikan data tersebut.

Secara garis besar,menampilkan data dalam statistika deskriptif dapat dilakukan dengan 2 cara diantaranya :

1.  Secara numerik
     Meringkas data  dengan menentukan ukuran pusat, letak , penyebaran , korelasi linier sederhana

2. Secara Tabulasi & Grafis


  • Tabulasi


Tabulasi merupakan proses penyajian data berupa diagram , tabel , gambar , grafik yang bertujuan untuk memberikan keterangan berbentuk angka.
• Tabel baris kolom
• Tabel kontingensi
• Tabel frekuensi
• Tabel frekuensi relatif, dsb



  • Grafis
Yaitu proses penyajian data dengan grafik atau chart , diagram ataupun gambar yang tujuannya diantaranya memberikan keterangan mengenai trend, perbandingan dan infographics lainnya
• Grafikhistogram
• Grafikpolygon
• Kurvaogive
• Boxplot, Diagram batang-daun , dsb

Minggu, 15 Mei 2016

Menghitung Pengeluaran pada Sampel Mahasiswa Selama 6 Hari


Sebelum kita melakukan penghitungan sample,maka terlebih dahulu kita harus mengetahui teori dasar mengenai pengukuran.Berdasarkan teori statistika terdapat dua jenis pengukuran dalam menghitung suatu data statistik.

1. Ukuran pemusatan
Merupakan pengukuran yang dapat melihat bagaimana data tersebut digunakan sebagai nilai yang dapat mewakili dari suatu rangkaian data. Adapun istilah lain dari ukuran pemusatan data adalah ukuran tendensi sentral, dimana pada ukuran pemusatan kita dapat menghitung :
o Rata-rata hitung (mean)
o Median
o Modus
o Rata-rata gabungan

2. Ukuran Penyebaran
Merupakan pengukuran ukuran yang digunakan untuk mengetahui seberapa jauh penyebaran data dari nilai rata-ratanya. Adapun istilah lain dari ukuran penyebaran data adalah ukuran dispersi, dimana pada ukuran penyebaran data kita dapat menghitung:
o Jangkauan atau dengan istilah lain yaitu range.
o Simpangan rata-rata
o Variansi
o Quartil
o Jangkauan quartil
o Standar Deviasi

          Dalam menghitung nilai statistik sering kali kita mengalami kesalahan dalam pengukuran, kesalahan ini disebabkan oleh alat ukur dalam melakukan pengukuran. Kesalahan pengukuran akibat pengaruh alat ukur dinamakan dengan kesalahan sistematis.

Kami telah melakukan survei pada beberapa waktu dibawah ini :
1) Survey Hari Pertama (Jumat 13 Januari 2016 )
2) Survey Hari Kedua (Jumat 14 Januari 2016 )
3) Survey Hari Ketiga (Jumat 15 Januari 2016 )
4) Survey Hari Keempat ( Sabtu 16 Januari 2016 )
5) Survey Hari Kelima (Minggu 17 Januari 2016 )
6) Survey Hari Keenam (Senin 18 Januari 2016 )

          Saat melakukan pengukuran kita diharuskan memiliki sebuah alat ukur.  Alat ukur ini berguna untuk menunjang survey yang dilakukan. Pada kasus ini,kami memiliki saran alat ukur yang berguna untuk mendapatkan hasil survei kami secara lebih efektif dan efisien dalam mengelola pengeluarannya yaitu dengan menggunakan aplikasi Money Lover.

          Money Lover merupakan suatu aplikasi gratis yang bisa diunduh di PlayStore maupun AppStore. Aplikasi ini memilki kegunaan untuk dapat menuliskan pemasukan pengeluaran serta berbagai macam transaksi kita sehari-hari. Transaksi yang ada berupa pengeluaran yang akan kita rencanakan diwaktu mendatang, berikut tampilan dari aplikasi Money Lover


          Berikut merupakan hasil survei yang didapatkan dari sample mahasiswa selama 6 hari dari aplikasi Money Lover:

1) Survey Hari Pertama (Jumat 13 Januari 2016 )


2) Survey Hari Kedua (Jumat 14 Januari 2016 )

3) Survey Hari Ketiga (Jumat 15 Januari 2016 )

4) Survey Hari Keempat ( Sabtu 16 Januari 2016 )

5) Survey Hari Kelima (Minggu 17 Januari 2016 )

6) Survey Hari Keenam (Senin 18 Januari 2016 )

Nah sekarang kita lihat,bagaimana data yg telah didapatkan ?

Dari data diatas terlihat fluktuatif, sehingga pengeluaran mahasiswa tergolong berbeda setiap harinya.

Kemudian,bagaimana perhitungan yang dilakukan pada proses pengukuran sampel ? 
berikut merupakan perhitungan yang telah dilakukan dengan tools Ms. Excel. 

Microsoft Office Excel merupakan sebuah program aplikasi lembar kerja spreadsheet yang dibuat dan didistribusikan oleh Microsoft Corporation yang memiliki fitur kalkulasi dan pembuatan grafik yang, dengan menggunakan strategi marketing Microsoft yang agresif, menjadikan Microsoft Excel sebagai salah satu program komputer yang populer digunakan di dalam komputer mikro hingga saat ini. 

Dengan menggunakan MS. Excel didapatkan hasil perhitungan sebagai berikut :


Sehingga dapat dianalisis pengeluaran rata - rata mahasiswa setiap harinya dan perhitungan nilai penyebaran dan pemusatannya sebagai berikut :


Setelah dianalis kita dapat menarik kesimpulan bahwa pengeluaran mahasiswa dalam skala cukup tidak terlalu sedikit dan tidak terlalu banyak dengan range pengeluaran kurang lebih 40.000,00 setiap harinya yaitu diantara 20.000,00 sampai dengan 60.000,00