Minggu, 08 Agustus 2021

Conditional Probability & Multiplication Rule

 Conditional Probability & Multiplication Rule


Apa itu Conditional Probability?
Conditional Probability adalah probabilitas kemunculan suatu event, dengan mengetahui bahwa event lain sudah muncul atau terjadi


Contoh :

Dua buah kartu diambil secara berurutan dari setumpuk playing cards (terdiri dari 52 kartu).

Berapa probability untuk kartu kedua yang diambil adalah Queen (B) bila diketahui bahwa kartu pertama yang diambil adalah King (A)? (asumsikan kartu pertama tidak dikembalikan ke dalam tumpukan kartu). (Without Replacement)



Tabel berikut adalah hasil pengamatan terhadap kemunculan pola gen tertentu terhadap kondisi IQ sejumlah anak. Berapa probability seorang anak memiliki “High IQ” bila diketahui anak tersebut memiliki pola gen (“gene present”)?


Independent Events

Dua events adalah independent bila kemunculan dari event yang satu tidak mempengaruhi probability kemunculan event kedua.


Dependent Events

Events yang tidak independent dikenal sebagai dependent events.

Contoh

Independent Events Vs Dependent Events




The Multiplication Rule

Untuk mencari probability dari dua events yang muncul secara berurutan, kita bisa memanfaatkan Multiplication Rule.



Contoh :

a.       Dependent Events

Dua buah kartu diambil (without replacement) dari tumpukan playing cards (terdiri dari 52 kartu). Berapakah probability untuk mendapatkan kartu King lalu diikuti kartu Queen?


a.       Independent or Dependent events?

Diketahui probability keberhasilan (sukses) dari suatu operasi usus buntu adalah 95%








Konsep Dasar Probability & Counting

Konsep Dasar Probability & Counting


Apa itu Probability?

Probability adalah pengukuran terhadap suatu kemungkinan atau peluang. Pemahaman terkait probability merupakan dasar untuk melangkah ke Statistika Inferensi (Inferential Statistics).

Terminologi
  • Hasil dari suatu percobaan (trial) dikenal sebagai outcome.
  • Himpunan dari seluruh kemungkinan outcome pada suatu probability experiment dikenal sebagai sample space.
  • Bagian dari sample space dikenal sebagai event.
  • Event bisa terdiri dari satu atau lebih outcomes.
Probability Experiments
Probability Experiments adalah aksi atau percobaan (trial) yang menghasilkan suatu perhitungan, pengukuran, atau respon (counts, measurements, or responses).

Contoh:

Tree Diagram
Tree Diagram digunakan untuk memberikan gambaran secara visual terkait setiap outcome dari suatu probability experiment.

Contoh :

Event
  • Event umumnya direpresentasikan dengan huruf kapital (uppercase letters), seperti A, B, dan C.
  • Suatu event yang terdiri dari sebuah outcome dikenal sebagai simple event.

Contoh :
  • Event melempar sebuah koin dan dadu enam sisi serta mendapatkan head dan 3 merupakan simple event dan bisa direpresentasikan sebagai A = {H3}.
  • Sedangkan event melempar sebuah koin dan dadu enam sisi serta mendapatkan head dan bilangan genap bukan merupakan simple event karena memiliki 3 kemungkinan outcomes; event ini bisa direpresentasikan sebagai B = {H2, H4, H6}.

Fundamental Counting Principle
  • Pemanfaatan Tree Diagram untuk menghitung banyaknya outcome dari sejumlah event tidaklah praktis.
  • Sebagai alternatif, kita bisa memanfaatkan Fundamental Counting Principle untuk mengetahui jumlah kemungkinan outcomes dari dua atau lebih event yang muncul secara berurutan.
Contoh :

Studi Kasus :

Types of Probability

Classical (theoretical) Probability

Contoh :
    

Empirical (statistical) Probability
Empirical Probability didasarkan pada observasi dari probability experiments


Contoh :
Suatu perusahaan melakukan survey online dengan memilih sejumlah responden secara acak untuk dimintai keterangan seberapa sering mereka melakukan recycle. Sejauh ini mereka mendapatkan data dari 2,451 responden.


Law of Large Number
Ketika suatu probability experiment dilakukan secara berulang-ulang, maka nilai empirical probability yang dihasilkan akan mendekati nilai theoretical probability dari event terkait.
http://digitalfirst.bfwpub.com/stats_applet/stats_applet_10_prob.html


Subjective Probability
Subjective Probability didasarkan pada intuisi, educated guesses, dan estimasi.

Contoh:
● Seorang dokter memberikan estimasi keberhasilan dari proses operasi yang ditanganinya sebesar 90%.
● Seorang mahasiswa merasa yakin bahwa peluangnya untuk lulus di matakuliah statistika adalah 70%.

Kamis, 05 Agustus 2021

Measure of Position dalam Statistika

Measure of Position dalam Statistika




Apa itu Measure of Position?

Measure of Position dapat didefinisikan sebagai suatu pengukuran nilai yang digunakan untuk menentukan posisi relatif dari suatu entri data (data point) pada dataset.


Quartile (Kuartil)

Quartile adalah nilai yang membagi suatu dataset terurut menjadi empat bagian yang sama. Terdapat tiga nilai quartile, yaitu: Q1, Q2, dan Q3
Interpretasi:
● Terdapat ¼ propinsi dengan jumlah pabrik 9 atau kurang
● Terdapat ½ propinsi dengan jumlah pabrik 16 atau kurang
● Terdapat ¾ propinsi dengan jumlah pabrik 33 atau kurang

Interquartile Range (IQR)
Interquartile Range (IQR) adalah measure of Variation (pengukuran keberagaman/sebaran data) dengan menselisihkan nilai quartile ketiga dan quartile pertama.

Deteksi Outlier dengan IQR
Entri data (data point) pada suatu dataset bisa dikategorikan sebagai outlier bila:
● Lebih kecil dari Q1-1.5(IQR)
● Lebih besar dari Q3+1.5(IQR)

Contoh :


Box and Whisker Plot (Box Plot)

Contoh :


Percentile (Persentil)
Percentile adalah nilai yang membagi suatu dataset terurut menjadi 100 bagian yang sama.
Terdapat 99 nilai percentaile, yaitu: P1, P2, …, P99
  • P25 menunjuk posisi yang sama dengan Q1
  • P50 menunjuk posisi yang sama dengan Q2
  • P75 menunjuk posisi yang sama dengan Q3
Deteksi Outlier dengan Percentile
Entri data (data point) pada suatu dataset bisa dikategorikan sebagai outlier bila:
  • Lebih kecil dari P5
  • Lebih besar dari P95
Contoh :


Standard Score (z-score)



Deteksi Outlier dengan Standard Score (Z-Score)


Contoh : 




Measure of Variation dalam Statistika

 Measure of Variation dalam Statistika


Apa itu Measure of Variation?

Measure of Variation dapat didefinisikan sebagai suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan keberagaman atau sebaran data.


Range (Jangkauan)

Range dari suatu dataset merupakan hasil perhitungan selisih antara nilai tertinggi dengan nilai terrendah pada dataset tersebut. Pengukuran nilai keberagaman dengan menggunakan range memiliki kelemahan di mana hanya menyertakan dua nilai saja dalam proses pengukuran.

Contoh
Range =  47 - 38 = 10


Variance (Variansi)

Variance dari suatu dataset merupakan hasil perhitungan rerata simpangan tiap entri data pada dataset terhadap nilai mean dari dataset tersebut.


Contoh : 

Standard Deviation (Simpangan Baku)

Kelemahan utama dari Variance adalah nilai yang dihasilkan tidak lagi memiliki satuan yang sama dengan entri data. Kelemahan ini dapat diatasi dengan Standard Deviation.


Contoh :


Review Notasi



Standard Deviation dan Bentuk Distribusi



Empirical Rule

  • Data yang kita temui di lapangan, umumnya memiliki bentuk distribusi yang mendekati bentuk distribusi simetris (bell shaped).
  • Empirical Rule dapat diterapkan pada bentuk distribusi simetris (bell shaped).
Contoh :


Chebychev’s Theorem

● Empirical Rule hanya berlaku untuk symetric distribution (bell shaped distibution).
● Sedangkan Chebychev’s Theorem dapat diterapkan untuk semua bentuk distribusi.

Contoh :
Berapakah proporsi data yang berada dalam rentang dua standard deviation dari mean? Sertakan interpretasi!
Kalkulasi:
● 38.8 − 2(22.5) = −6.2
● 38.8 + 2(22.5) = 83.8
Interpretasi:
Setidaknya 75% dari populasi
penduduk di New York berusia antara 0
sampai 83.8 tahun


Standard Deviation for Grouped Data (Frequency Distribution)

Contoh :


Coefficient of Variation
  • Standard Deviation dapat digunakan untuk membandingkan keberagaman/sebaran data antar dataset yang memiliki satuan pengukuran yang sama dengan nilai mean yang mirip.
  • Sedangkan untuk dataset yang memiliki satuan pengukuran yang berbeda atau nilai mean yang jauh berbeda, maka kita mesti menggunakan Coefficient of Variation.

Contoh :






Distribusi Probabilitas (Probability Distribution)

  Distribusi Probabilitas (Probability Distribution) RANDOM  VARIABLES Random variable x merepresentasikan suatu nilai numerik yang bera...