STATISTIKA DAN
PROBABILITAS
PERTEMUAN KE 1
SAFITRI JAYA, S.Kom, M.T.I
KURIKULUM TEKNIK
INFORMATIKA UPJ
NO KODE MK NAMA MK SKS SIFAT 1 GNR101 BAHASA INDONESIA 2 MKU 2 GNR103 BAHASA INGGRIS 2 MKU 3 GNR105 DASAR LOGIKA MATEMATIKA 3 MKU 4 INF101 ALGORITMA PEMROGRAMAN 3 MKMA 5 INF103 PEMROGRAMAN BERORIENTASI OBJEK 3 MKMI 6 INF105 ALJABAR LINEAR 3 MKMI
7 INF107 STATISTIKA DAN PROBABILITAS 3 MKMI
KONTRAK PERKULIAHAN
SKS MK : 3 SKS (2 SKS TEORI + 1 SKS LATIHAN)
LAMA PERKULIAHAN : 100 MENIT TEORI + 50 MENIT LATIHAN
JUMLAH TM : 14 PERTEMUAN (7 SEBELUM UTS DAN 7 SETELAH UTS) PELAKSANAAN UTS : 16 – 20 OKTOBER 2017 (16 OKTOBER 2017) PELAKSANAAN UAS : 18 – 22 DESEMBER 2017 (18 DESEMBER 2017) JADWAL KULIAH : SENIN, PKL 12.50 – 15.20 WIB, R-614
TOLERANSI KETERLAMBATAN : 15 MENIT, > 15 MENIT ABSEN NIHIL SYARAT IKUT UJIAN : ABSENSI MINIMAL 70 % (4X ABSEN)
PENILAIAN : 10% ABSENSI, 20% LATIHAN DI LOG BOOK, 35% UTS, 35% UAS ALAT KOMUNIKASI : SILENT/MODE GETAR SELAMA PERKULIAHAN BERLANGSUNG KEWAJIBAN ALAT BM : LOG BOOK, BUKU AJAR (PERKELOMPOK, STATISTIKA
PROBABILITAS, SUDARYONO, ILMU STATISTIKA ACHMAD
ZANBAR SOLEH)
MATERI PERKULIAHAN
1. STATISTIKA DESKRIPTIF 2. PELUANG
3. DISTRIBUSI PROBABILITAS DISKRET 4. STATISTIKA INFERENSI
5. REGRESI LINEAR SEDERHANA 6. DISTRIBUSI SAMPLING
7. PENDUGAAN PARAMETER
8. ANALISIS VARIANSI SATU PIHAK (ONE WAY) 9. HUBUNGAN STATISTIKA DUA PEUBAH
STATISTIKA DESKRIPTIF
Statistika merupakan suatu cabang ilmu pengetahuan yang bertujuan untuk mempelajari tata cara pengumpulan data
(sampling), pengolahan data, penyajian data, analisis data, dan pengambilan keputusan berdasarkan data.
Penjabaran metodologi statistik didasarkan pada tiga hal : 1. Proses analisis
Analis deskriptif
Informasi diberikan secara visual dan bersifat subjektif dalam pembuatan analisisnya.
Analis konfirmatif (inferensi)
Informasi lebih bersifat objektif terutama dalam proses pengambilan
STATISTIKA DESKRIPTIF
Penjabaran metodologi statistik didasarkan pada tiga hal :
2. Asumsi bentuk distribusi
Statistik Parametrik
Variabel yang menjadi input memiliki bentuk distribusi tertentu
Statistik Non Parametrik
Variabel yang menjadi input tidak memiliki asumsi bentuk distribusi
3. Banyaknya variabel yang dilibatkan
Multi-variate
melibatkan banyak variabel
Uni-variate & bi-variate
DATA
Menurut Webster’s New World Dictionary, Data diartikan sebagai sesuatu yang diketahui atau diasumsikan. Menurut referensi lainnya mengatakan
bahwa data adalah sumber informasi yang diketahui/dicari/diasumsikan untuk memberikan gambaran mengenai suatu keadaan atau persoalan. Syarat untuk memperoleh data dengan kriteria “baik” :
1. Data harus objektif (data harus sesuai dengan keadaan yang sebenarnya);
2. Data harus representatif (data harus mewakili objek yang diamati);
3. Data harus memiliki standard error yang kecil (data harus memiliki tingkat ketelitian yang tinggi);
DATA
Beberapa istilah penting yang terkait dengan proses pengumpulan data :
1. Populasi merupakan himpunan atau kumpulan dari semua objek yang diamati;
2. Sampel merupakan himpunan bagian dari populasi;
3. Sensus merupakan cara pengumpulan data dimana seluruh elemen populasi diamati satu per satu (banyak data sama dengan banyaknya anggota populasi);
4. Sampling merupakan cara pengumpulan data dimana yang diselidiki adalah elemen sampel dari suatu populasi;
UKURAN PEMUSATAN DATA
1. Modus merupakan data yang memiliki frekuensi maksimum 2. Mean atau rata-rata
3. Median (simbol : Md, Quartil ke-2 [Q2] atau M) M = Data terurut ke (n+1) / 2
4. Tri rata (simbol : TRI)
CONTOH SOAL
Seorang mahasiswa planologi diberikan tugas yaitu mengamati besarnya dana yang digunakan oleh 12 kota di Pulau Jawa dalam menata kawasan kumuh. Mahasiswa tersebut mendatangi kantor dinas tata kota di ke 12 kota dan memperoleh informasi sebagai berikut :Nama Kota Dana (satuan : Rp Milyar) Simbol data mentah Simbol data
PENYELESAIAN : UKURAN
PEMUSATAN DATA
1. Modus = 0
2. Mean = (1/12)(1412,11) = 117,68 3. Median = data terurut ke (12+1)/2 = data terurut ke 6,5 = x[6,5]
= x[6] + 0,5 {x7 – x6}
= 102,09 + 0,5 {111,79 – 102,09} = 106,94
4. Quartil Atas (QA) = data terurut ke (12+1) (3/4) = data terurut ke 9,75
= x[9,75]
= x[9] + 0,75 {x10 – x9} = 121,54 5. Quartil Bawah (QB) = data terurut ke (12+1) (1/4) = data terurut ke 3,25
7. Rata-rata antar quartil (RAK)
Ada 3 data yang terletak diantara QA dan QB, yaitu 102,09 101,66 99,92 m = 3
UKURAN PENYEBARAN DATA
1. Rentang data / Range (simbol : R)
R = Nilai data terbesar – Nilai data terkecil
2. Sebaran tengah / Deviasi antar kuartil (simbol : dq) dq = QA – QB
3. Deviasi rata-rata (simbol : d)
4. Variansi (simbol : s2) dan simpangan baku (simbol : s)
PENYELESAIAN : UKURAN
3. Deviasi rata-rata d = / 12
= 385,21 / 12 = 32,101
BENTUK DISTRIBUSI
Distribusi merupakan pola atau model yang merupakan gambaran kondisi sekelompok data.
Simetris
Menjurai ke
DIAGRAM BATANG DAUN
(
STEAM LEAF
)
Prinsip dari steam leaf adalah memanfaatkan nilai data untuk
melihat distribusi data. Adapun langkah-langkah membuat steam leaf adalah sebagai berikut :
1. Tentukan data yang memiliki nilai terbesar dan nilai terkecil; 2. Gunakan nilai data terbesar dan terkecil sebagai patokan
penentuan dari batang. Misalkan data terbesar adalah 76 dan terkecil adalah 6, maka satuan batang yang dapat dipilih adalah puluhan;
3. Tentukan satuan daun. Karena satuan batang adalah puluhan, maka satuan daun harus lebih kecil dari satuan batang (satuan, persepuluhan, perseratusan, dst);
PENYELESAIAN DIAGRAM
BATANG DAUN
1. Nilai terbesar = 300,78 dan nilai terkecil = 20,19;
2. Satuan batang berdasarkan nilai terbesar adalah ratusan dan puluhan;
3. Satuan daun adalah satuan, sepersepuluh, seperseratus; 4. Batang Daun30 078
.... .... .... .... 13 572 12 413
11 375; 179; 249
DIAGRAM KOTAK (
BOX PLOT
)
Prinsip dari box plot adalah membagi data menjadi empat
kelompok berbeda yang dibatasi oleh QA, QB, dan M. Adapun langkah-langkahnya adalah sebagai berikut :
1. Tentukan nilai terbesar dan nilai terkecil; 2. Hitung nilai QA, QB dan M dari data;
3. Gambarkan box plot sebagai berikut :
X
min QB Median QA
PENYELESAIAN DIAGRAM
KOTAK (BOX PLOT)
Penyelesaian masalah adalah sebagai berikut :
1. Nilai terbesar adalah 300,78 dan nilai terkecil adalah 20,19; 2. QA = 121, 54 QB = 99,84 Median = 106,94;
3. Gambar box plot adalah sebagai berikut
20,19
Karena data mengumpul di nilai-nilai kecil dan
MEMBANDINGKAN MEAN
DAN MEDIAN
Cara yang sangat mudah dan cepat dalam menyimpulkan bentuk distribusi adalah dengan cara membandingkan nilai mean dan
median. Hasil yang dapat diperoleh diantaranya : 1. Distribusi Simetris jika nilai mean = nilai median;
2. Distribusi menceng ke kiri atau menjurai ke kanan jika median < rata-rata;
PENYELESAIAN MEMBANDINGKAN
MEAN DAN MEDIAN
Mean = 117,68 Median = 106,94
Hasil = Median < Mean, maka
PENCILAN
Pencilan (outlier) memberikan informasi mengenai data yang harganya jauh berbeda dari nilai data lainnya.
Mendeteksi data yang masuk pencilan sangat penting dalam
statistika, karena data tersebut dapat mengganggu hasil analisis data. Oleh karena itu, data pencilan harus dianalisis tersendiri dan terpisah dari kelompoknya. Langkah-langkah mendeteksi pencilan adalah sebagai berikut :
1. Hitung besar nilai sebaran tengah, dq = QA – QB;
PENYELESAIAN PENCILAN
1. Sebaran tengah dq = QA – QB = 121,54 – 99,84 = 21,7; 2. BPP = QB – [1,5 x dq] = 67,29;
3. BAP = QA + [1,5 x dq] = 154,09;
4. Terdapat satu data yang nilainya dibawah nilai BPP yaitu 20,19, hal ini berarti terdapat satu pencilan bawah yaitu data dengan nilai 20,19.