LAPORAN UAS
PRAKTIKUM ANALISIS DATA EKSPLORATIF
Disusun Oleh :
Nama : Alya Puspitasari
NIM : 13/348069/PA/15438
Dosen Pengampu :
Dr. Aditya Ronnie Effendie, M.Sc
Asisten praktikum : Dessi Ariyani (13653) Awwalina Ghaida R (13820)
LABORATORIUM KOMPUTASI MATEMATIKA DAN STATISTIKA
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS GADJAH MADA
BAB I
PERMASALAHAN
1. Sebuah perusahaan memproduksi zat additive X untuk ahan bakar kendaraan bermotor. Diambil 15 sampel mobil dengan diberi produk tambahan X dan tanpa produk tambahan. Dengan asumsi bahwa kondisi mengemudi untuk keduanya sama, apakah terdapat perbedaan jarak tempuh dengan penambahan produk X ? Kalau ada, mana yang memberikan hasil lebih kecil ?
Deng Internet (SosMed) dengan IP semesternya. Hasilnya diberikan pada tabel di bawah ini :
Internet –Sosmed (jam) Nilai
25 2.00
Lakukan analisa data untuk hubungan kedua variabel di atas !
3. Suatu penelitian dilakukan untuk membandingkan rata-rata waktu pemakaian handphone oleh mahasiswa dan mahasiswi sebuah perguruan tinggi per minggunya. Lima puluh mahasiswa dan 50 mahasiswi dipilih dari Universitas Midwstern kemudian dihitung jumlah jam pemakaian untuk melakukan panggilan telfon dari handphone mereka selama 1 minggu (anggap angkatan diambil dari populasi normal).
Hasilnya ditunjukkan pada tabel di bawah ini :
Mahasiswa Mahasiswi
Dengan tingkat kepercayaan 95%, ujilah apakah ada perbedaan yang nyata jumlahjam pemakaian untuk panggilan telfon per minggu antara mahasiswa dan mahasiswi tersebut !
a. Produksi dikatakan lancar jika menghasilkan susu antara 300 dan 350, maka berapa peluangnya?
b. Jika 45% dari produksi tersebut dikirim ke kota lain, maka tentukan batas minimal susu yang dikirim ! (lakukan pembulatan tanpa desimal)
5. Diketahui sampel random baterai yang diproduksi oleh suatu pabrik mempunyai daya tahan / massa hidup (jam) seperti pada tabel berikut :
198 272 252 275 216 253 282 219 253 284 224
262 288 225 264 291 230 268 294 236 271 295
Apakah rata-rata daya tahan hidup baterai tersebut lebih dari 250 jam?
BAB II PEMBAHASAN
1. Diambil data 15 sampel mobil dengan penanbahan zat additive produk x serta tanpa penmabahan produk x. Akan diuji apakah terdapat perbedaan,jika ada maka ditentukan pula mana yang memberikan hasil lebih kecil.
a. Uji korelasi
Dari hasil diatas didapatkan Pearson correlation sebesar 0,976. Hasil tersebut mendekati 1 maka data termasuk data dependen ( data yang saling terikat).
Gambar diatas adalah boxplot dari data yang dengan penambahan produk x (kiri) dan boxplot dari data yang tidak dengan penambahan produk x (kanan). Boxplot pertama masih belum normal karena garis median belum berada tepat ditengah-tengah artinya data belum berdistribusi normal,belum simetris(sedikit menjurai ke atas), dan juga terdapat outlier yang dinotasikan dengan * (data terlampau besar selisihnya dengan data yang lain ). Begitu pula dengan boxplot kedua, gambar masih menunjukkan data belum berdistribusi normal. Garis median tidak berada tepat ditengah-tengah dan belum simetris, pada boxplot kedua juga terdapat outlier. Dari hasil tersebut maka perlu dilakukan transformasi.
- Transformasi boxcox
Gambar diatas adalah boxplot dari data yang dengan penambahan produk x (kiri) dan boxplot dari data yang tidak dengan penambahan produk x (kanan) setelah transformasi boxcox. Boxplot pertama hampir normal karena garis median hampir ditengah-tengah, jarak antara nilai max dengan kuartil atas hampir sama dengan jarak antara kuartil bawah degna nilai minimum, artinya kaki-kaki boxplot simetris. Namun pada boxplot kedua data belum berdistribusi normal, garis median belum berada ditengah-tengah dan kesimetrisannya belum terlihat,dan juga terdapat outlier yang dinotasikan dengan * (data terlampau besar selisihnya dengan data yang lain ). Akan tetapi karena transformasi boxcox merupakan transformasi paling baik untuk mendapatkan data normal maka data diatas dianggap sudah normal.
c. Uji hipotesis
Pengujian hipotesis apakah terdapat perbedaan antara dengan produk x (μ1¿ dan tanpa penambahan produk x (μ2)
Hipotesis Ho : μ1−μ2=d Hi : μ1−μ2≠ d
Tingkat signifikansi : α=0,05
P-value = 0,005
Daerah kritik : Ho ditolak jika P-value < α
Kesimpulan :
Karena P-value = 0,005 < 0,05 (α¿ maka Ho ditolak sehingga ada perbedaan jarak tempuh antara penambahan produk x dengan tidak dilakukan penambahan produk x.
Lalu untuk mengetahui antara dengan produk x atau tanpa produk x mana yang memberikan hasil lebih kecil maka dilakukan pengujian hipotesis lagi.
Hipotesis Ho : μ1≤ μ2 Hi : μ1>μ2
Tingkat signifikansi : α=0,05
Statistik uji P-value
P-value = 0,003
Daerah kritik : Ho ditolak jika P-value < α
Kesimpulan :
2. Tiga puluh mahasiswa disurvey mengenai studi yang melibatkan waktu penggunaan Internet (SosMed) dengan IP semesternya. Ingin diketahui hubungan antara penggunaan internet dengan IP.
Analisis : karena penggunaan internet yang mempengaruhi IP maka Internet (SosMed) sebagai variabel X ( yang mempengaruhi/independen) IP sebagai variabel Y (yang dipengaruhi/dependen)
a. Liniearitas
Dari hasil diatas diperoleh nilai pearson correlation sebesar -0,976 ,nilai negatif maka antara internet dengan nilai memiliki hubungan yang negatif.
Uji hipotesis
1. Ho : P2 = 0 (tidak terdapat hubungan liniear antara internet dengan nilai) H1 : P2≠ 0 ( terdapat hubungan liniear antara internet dengan nilai ). 2. Tingkat signifikansi : ∝=0,05
3. Statistik uji : Pvalue = 0,000
4. Daerah kritik : Ho ditolak jika Pvalue < ∝ Pvalue < ∝
0,000 < 0,05 5. Kesimpulan :
Karena Pvalue= 0,000 < 0,05 ( ∝) maka Ho ditolak sehingga terdapat hubungan liniear anatara internet dengan nilai.
Dari hasil uji hipotesis dan uji korelasi yang menghasilkan pearson correlation negatif, maka dapat disimpulkan bahwa terdapat hubungan negatif antara internet dengan nilai.
Grafik menunjukkan pola linear negatif, artinya semakin sering penggunaan Internet (variabel X) maka semakin berkurang nilai IP (variabel Y), antara penggunaan Internet (SosMed) memiliki pola hubungan negatif.
c. Analisis regresi
R-sq =95,3 %
interpretasi : variabilitas nilai IP dapat diterangkan oleh variabel internet (sosmed) sebesar 95,3 %, sisanya dipengaruhi oleh faktor lain yang belum dijelaskan.
Nisbah
Nisbah=variansi(RES I)
variansi(Y)
¿0,007560,1608
¿0,0470149
Diperoleh Nisbah = 0,0470149, hasil nisbah mendekati nol maka dapat disimpulkan bahwa keeratan bagus.
d. Uji hipotesis Uji overall
Hipotesis
Ho : β0=β1=0(model regresi tidak layak digunakan)
Hi : minimal ada1β ≠0(model regresi layak digunakan)
Tingkat signifikansi : α=0,05
P-value = 0,000
Daerah kritik : Ho ditolak jika P-value < α Kesimpulan :
Karena P-value = 0,000 < 0,05 (α¿ maka Ho ditolak sehingga model regresi layak digunakan.
Uji parsial
- Untuk konstanta
Hipotesis
Ho : β0=0(konstanta tidak layak masuk model)
Hi : β0≠0(konstanta layak masuk model)
Tingkat signifikansi : α=0,05
Statistik uji P-value
P-value = 0,000
Daerah kritik : Ho ditolak jika P-value < α Kesimpulan :
Karena P-value = 0,000 < 0,05 (α¿ maka Ho ditolak sehingga konstanta layak masuk model.
- Untuk variabel independen
Hipotesis
Ho : β1=0(variabel internet(sosmed)tidak layak masuk model)
Hi : β1≠0(variabel internet(sosmed)layak masuk model)
Statistik uji P-value
P-value = 0,000
Daerah kritik : Ho ditolak jika P-value < α Kesimpulan :
Karena P-value = 0,000 < 0,05 (α¿ maka Ho ditolak sehingga variabel internet(sosned) layak masuk model.
e. Model regresi
Nilai = 3,49 - 0,0594 Internet – Sosmed (jam)
Model regresi diatas dapat diartikan setiap penambahan 1 satuan lamanya waktu penggunaan internet maka nilai IPK akan dikurangi sebesar 0,0594 jika variabel lain diabaikan. Juga dapat disimpulkan bahwa antara internet dan sosmed ada hubungan negatif.
3. Suatu penelitian dilakukan untuk membandingkan rata-rata waktu pemakaian handphone oleh 50 mahasiswa dan 50 mahasiswi sebuah perguruan tinggi per minggunya. Ingin diuji apakah ada perbedaan jumlah jam pemakaian untuk panggilan telfon per minggu antara mahasiswa dan mahasiswi tersebut !
a. Uji korelasi
Pearson correlation of mahasiswa and mahasiswi = 0,012
Dari hasil diatas didapatkan Pearson correlation sebesar 0,012. Hasil tersebut mendekati 0 maka data termasuk data independen ( data yang tidak saling terikat). Uji independen
( variansi mahasiswa dan mahasiswi berbeda)
Tingkat signifikansi : α=0,05
P-value = 0,407
Daerah kritik : Ho ditolak jika P-value < α Kesimpulan :
Karena P-value = 0,407 > 0,05 (α¿ maka Ho diterima sehingga σ12=σ22 (variansi mahasiwa dan mahasiswi sama).
c. Uji Hipotesis
Pengujian hipotesis apakah terdapat perbedaan pemakaian telepon perminggu antara makasiswa (μ1¿ dengan mahasiswi (μ2)
Hipotesis Ho : μ1−μ2=¿ 0 Hi : μ1−μ2≠0
Tingkat signifikansi : α=0,05
P-value = 0,762
Daerah kritik : Ho ditolak jika P-value < α
Kesimpulan :
Karena P-value = 0,762 > 0,05 (α¿ maka Ho tidak ditolak sehingga tidak ada perbedaan yang nyata jumlah jam pemakaian untuk panggilan telfon per minggu antara mahasiswa dan mahasiswi tersebut.
4. Suatu sampel produksi susu sapi segar di salah satu peternakan New Zealand per hari (liter) memiliki mean 320 dan standar deviasi 30.
a. Peluang produksi lancar, dikatakan lancar jika menghasilkan susu antara 300 dan 350.
Hasil perhitungan minitab:
P(300≤ X ≤350)=P(X ≤350)−P(X ≥300)
¿0,841345−(1−0,252493)
¿0,841345−(0,747507)
¿ 0,093838
Jadi besarnya peluang produksi lancar adalah 0,093838.
b. Jika 45% dari produksi tersebut dikirim ke kota lain, maka tentukan batas minimal susu yang dikirim ! (lakukan pembulatan tanpa desimal)
P(X ≥ a)=0,45
5. Diketahui sampel random baterai yang diproduksi oleh suatu pabrik mempunyai daya tahan / massa hidup (jam), ingin diketahui apakah rata-rata daya tahan hidup baterai tersebut lebih dari 250 jam.
a. Uji normalitas
Gambar diatas adalah boxplot dari data survey mengenai daya tahan baterai, dari gambar dapat diketahui bahwa data belum normal, garis median data tidak berada tepat ditengah-tengah, sehingga boxplot tidak simetris, boxplot cenderung menjurai kebawah, begitu pula kaki-kaki boxplot yang atas serta yang bawah terlihat berbeda. Karena data belum berdistribusi normal maka perlu dilakukan transformasi.
Dari gambar diatas diperoleh lambda estimate sebesar 2,99790. Maka transformasi data dilakukan dengan memangkatkan setiap data dengan 2,99790, maka diperoleh data baru.
Gambar diatas adalah boxplot dari data survey mengenai daya tahan baterai setelah transformasi boxcox. Boxplot belum normal karena garis median belum berada tepat ditengah-tengah, jarak antara nilai max dengan kuartil atas hampir sama dengan jarak antara kuartil bawah degna nilai minimum, artinya kaki-kaki boxplot hampir simetris. Akan tetapi karena transformasi boxcox merupakan transformasi paling baik untuk mendapatkan data normal maka data diatas dianggap sudah normal.
Uji hipotesis
Karena data berjumlah 22 serta variansi tidak diketahui maka menggunakan uji 1-sample t. Rata-rata daya tahan baterai (μ1¿, μ0=250
Hipotesis Ho : μ1≤250 Hi : μ1>250
Tingkat signifikansi : α=0,05
Statistik uji P-value
P-value = 0,057
Daerah kritik : Ho ditolak jika P-value < α
Kesimpulan :
Karena P-value = 0,057 > 0,05 (α¿ maka Ho tidak ditolak sehingga rata-rata daya tahan batearai kurang dari atau sama dengan 250 jam.
KESIMPULAN
1. Kririk :
- Apabila dalam menampilkan distribusi data dalam bentuk boxplot didapatkan gambar yang menunjukkan bahwa data tidak berdistribusi normal maka dilakukan transformasi,transformasi yang paling baik adalah boxcox.
- Untuk menetukan hubungan antara kedua data dapat dilakukan dengan uji korelasi.
- Terkadang dengan menggunakan boxcox, data blum juga berdistribusi normal,akan tetapi karena transformasi boxcox adalah transformasi yang paling baik maka data hasil transformasi boxcox dianggap sudah normal.
2. Saran :