Pemerihalan Data Pemerihalan Data PM DR KMISH OSMN Sukatan kecenderungan memusat Sukatan kedudukan Sukatan serakan Sukatan serakan relatif Ukuran korelasi G603 1 G603 Pengenalan Mengeluarkan maklumat daripada data secara berangka. Persoalan: dakah data-data tertumpu pada satu nilai? dakah data-data tersebut tertabur secara normal? dakah data-data tersebut terpencong? Jika ya, adakah terpencong ke kiri atau ke kanan? dakah data-data jauh terserak antara satu sama lain? G603 3 Sukatan kecenderungan memusat G603 4 min populasi, µ χ N χ + 1 χ +... N + χ N Nilai purata bagi satu kumpulan data Dikira dengan menjumlahkan semua data dan dibahagikan dengan bilangan data. G603 5 min sampel, χ χ n χ + 1 χ +... + n χ n G603 6 1
: Contoh #1 : Contoh # Jumlah derma yang dipungut Pel RM 1 18 19 3 0 4 0 5 0 6 0 7 0 8 9 4 10 8 Jumlah 18 + 19 + 0 + 0+ 0+ 0 + 0 + + 4 + 8 11 11 10 1.1 dakah angka baru ini (min) wajar untuk taburan data di sebelah? Ya, penggunaan min dalam contoh ini adalah wajar. Jumlah derma yang dipungut Pel RM 1 18 19 3 0 4 0 5 0 6 0 7 0 8 9 4 10 10 Jumlah 18 + 19 + 0 + 0+ 0+ 0 + 0 + + 4 + 10 303 Mean 303 10 30.3 ngka baru Tidak mengambarkan taburan markah Tidak adapun seorang pelajar yang pungutan dermanya hampir dengan RM30.3 Tidak merupakan penilaian kecenderungan memusat yang wajar acaan berulang dengan yang paling tinggi. Notasi mod >> χ Sesuatu set data tidak semestinya mempunyai mod, dan jika wujud belum tentu tunggal. Contoh 3.3: erikut merupakan markah ujian statistik bagi 0 orang pelajar. 33 5 33 75 84 75 65 57 84 70 61 53 38 70 81 69 70 71 59 67 G603 9 G603 10 Contoh 3: Susun data secara menokok 5 33 33 38 53 57 59 61 65 67 69 70 70 70 71 75 75 81 84 84, χ adalah 70 Kekerapan paling tinggi G603 11 acaan/data yg wujud di tengah-tengah apabila data disusun dalam tertib menaik atau menurun. Notasi median ~ χ Jika bil data ganjil, median data di tengah. Jika bil data genap, median purata dua data di tengah. G603 1
erikut merupakan markah ujian statistik bagi 9 orang pelajar. 69 57 61 53 70 67 59 65 70 Susun data secara menokok. 53 57 59 61 65 67 69 70 70 ~, χ adalah 65 Data di tengah G603 13 G603 14 erikut merupakan markah ujian statistik bagi 10 orang pelajar. 70 65 59 70 61 53 69 70 57 67 Susun data secara menokok. 53 57 59 61 65 67 69 70 70 70 mbil purata G603 15 ~, χ adalah 66 G603 16 - Jadual taburan Menggunakan jadual taburan, utk dapatkan min guna rumus berlainan. Ini kerana, setelah data dikumpulkan, nilai sebenar sudah tidak diketahui lagi. mf, χ f m tanda kelas f kelas - Jadual taburan Data PNGK 30 orang pelajar telah diringkaskan dlm bentuk terkumpul. 1.50-1.99 1.745 3.49.00 -.49.45 7 15.7.50 -.99.745 10 7.45 3.00-3.49 3.45 8 5.96 3.50-3.99 3.745 3 11.4 G603 17 G603 18 3
- Jadual taburan 1.50-1.99 1.745 3.49.00 -.49.45 7 15.7.50 -.99.745 10 7.45 3.00-3.49 3.45 8 5.96 3.50-3.99 3.745 3 11.4 χ mf f 83. 85 30. 79 G603 19 berpemberat >> Pengiraan min bergantung kpd pemberat-pemberat tertentu. berpemberat, χ wd w w pemberat d data mentah atau tanda kelas data terkumpul G603 0 berpemberat Seorang pensyarah statistik ingin mendapatkan purata bagi markah-markah yg didapati oleh seorg pelajar yang setiapnya mempunyai pemberat atau peratusan yg tersendiri. Peratusan diberi, tugasan 0%, ujian 30% dan akhir 50%. Markah pelajar berkenaan adalah 85, 74 dan 68. Jadual taburan ˆ χ L atau ˆ χ L + C + C +...( R1)...( R) G603 1 G603 Jadual taburan Dimana sempadan atas kelas mod L L sempadan bawah kelas mod beza antara kelas mod dgn kelas sebelumnya beza antara kelas mod dgn kelas berikutnya C saiz kelas mod Jadual taburan 1.50-1.99 1.745 3.49.00 -.49.45 7 15.7.50 -.99.745 10 7.45 3.00-3.49 3.45 8 5.96 3.50-3.99 3.745 3 11.4 Kelas mod.50-.99 Maka, L.995 L.495 3 C 0.5 G603 3 G603 4 4
R1 R Jadual taburan 3 ˆ χ. 495 + 0. 5 + 3. 795 ˆ χ. 995 0. 5 + 3. 795 G603 5 ~ χ L atau ~ χ L n + 1 F + C f m...( R1) n + 1 n F C f m...( R) G603 6 Dimana L sempadan atas kelas mod L sempadan bawah kelas mod n bilangan cerapan F hasil tambah kelas-kelas sesudah kelas median F hasil tambah kelas-kelas sebelum kelas median C saiz kelas median frekuensi kelas median f m Tentukan kelas median terlebih dahulu, sebelum menggunakan rumus. Untuk mendapatkan kelas median, gunakan rumus >> n + 1 G603 7 G603 8 Mula-mula, tentukan median 30 + 1 15. 5 G603 9 1.50-1.99 1.745 3.49.00 -.49.45 7 15.7.50 -.99.745 10 7.45 3.00-3.49 3.45 8 5.96 3.50-3.99 3.745 3 11.4 Daripada jadual, f 1 ; f 7; f 3 10; f 4 8; f 5 3 Dapatkan kelas median: f 1 + f 9 < 15.5 dan f 1 + f + f 3 19 > 15.5 G603 30 5
f 1 + f + f 3 19 > 15.5 Maka, L.995 L.495 n 30 F 11 F 9 C 0.5 f m 10 Maka, median berada dlm kelas ke-3. Kelas median ialah.50.99 R1 ~ 155. 9 χ. 495+ 0. 5 10. 8 G603 31 G603 3 Contoh 3.8b: 1.50-1.99 1.745 3.49.00 -.49.45 7 15.7.50 -.99.745 10 7.45 3.00-3.49 3.45 8 5.96 3.50-3.99 3.745 3 11.4 Daripada jadual, f 1 ; f 7; f 3 10; f 4 8; f 5 3 Dapatkan kelas median: f 5 + f 4 11 < 15.5 dan f 5 + f 4 + f 3 1 > 15.5 G603 33 f 5 + f 4 + f 3 1 > 15.5 Maka, median berada dlm kelas ke-3. Kelas median ialah.50.99 G603 34 Maka, L.995 L.495 n 30 F 11 F 9 C 0.5 f m 10 Hubungan di antara, dan entuk Simetri R ~ 30 155. 11 χ. 995 0. 5 10. 8 G603 35 Pembolehubah G603 36 6
entuk Terpencong Ke Kanan entuk Terpencong Ke Kiri Frekuensi Frekuensi Pembolehubah Pembolehubah G603 37 G603 38 Jelaskan Mengapa ❶ Sesuatu taburan itu adalah TERPENCONG KE KIRI? ❷ Sesuatu taburan itu adalah TERPENCONG KE KNN? LTIHN Nyatakan apakah ukuran kecenderungan memusat yang PLING SESUI untuk memperihalkan: ❶ Data Nominal ❷ Data Ordinal ❸ Interval ❹ Ratio/Nisbah JELSKN JWPN ND!!! G603 39 G603 40 LTIHN Kriteria yg diberikan di bawah merujuk kepada uku. Kecenderungan memusat yang mana? ❶ Paling boleh dipercayai ❷ Paling kurang dipercayai ❸ Mudah dipengaruhi oleh sesuatu nilai dalam cerapan ❹ oleh dianggarkan secara langsung drp kelok ogif ❺ oleh dianggarkan secara langsung drp histogram @ poligon frekeunsi G603 41 LTIHN Jika kebanyakan drp pelajar dlm kelas anda telah mengulangkaji dengan baik topik yang anda ajarkan, skor ujian yang bakal diberikan nanti akan cenderung untuk bertabur: - secara NORML? - secara TERPENCONG POSITIF? - secara TERPENCONG NEGTIF? G603 4 7
Sukatan Kedudukan Sukatan Kedudukan KURTIL 5% 5% 5% 5% KURTIL PERSENTIL 5% 5% 5% 5% 1% 1% Q 1 berada pada kedudukan ke - ¼(n+1) Q berada pada kedudukan ke ½(n+1) Q 3 berada pada kedudukan ke ¾(n+1) Q1 Q Q3 P1 P P98 P99 G603 43 G603 44 Sukatan Kedudukan Diberi data markah statistik bagi 15 orang pelajar. 6 58 49 7 50 70 38 58 68 61 84 60 75 7 40 Dapatkan kuartil pertama, kedua dan ketiga. 6 38 40 49 50 58 58 60 61 68 70 7 7 75 84 G603 45 Sukatan Kedudukan K 1 adalah pada kedudukan ke- ¼(15+1) 4 K adalah pada kedudukan ke- ½(15+1) 8 K 3 adalah pada kedudukan ke- ¾(15+1) 1 K 1 terletak di antara data ke-4 K 1 49 K terletak di antara data ke-8 K 60 K 3 terletak di antara data ke-1 K 3 7 G603 46 Sukatan Kedudukan PERSENTIL Sukatan Serakan 1% 1% P1 P P98 P99 Persentil pertama, P 1 berada pada kedudukan 1/100 (n+1) Persentil ke-7, P 7 berada pada kedudukan 7/100 (n+1) Persentil ke-k, P k berada pada kedudukan k/100 (n+1) JULT SISIHN NTR KURTIL VRINS & SISIHN PIWI G603 47 G603 48 8
JULT Pengukuran paling mudah untuk serakan Kurang sesuai untuk mengukur serakan data kerana ia hanya mengambil kira antara nilai maksimum dan minimum Julat Nilai maksima Nilai ima Julat 44 49 50 58 58 60 61 68 70 7 Julat data maksimum data minimum 7 44 8 G603 49 G603 50 Julat SISIHN NTR KURTIL 1.50-1.99 1.745 3.49.00 -.49.45 7 15.7.50 -.99.745 10 7.45 3.00-3.49 3.45 8 5.96 3.50-3.99 3.745 3 11.4 Perbezaan di antara kuartil ke-3 dan kuartil-1 Ia memberikan julat bagi data di tengah iaitu 50% daripada cerapan SK (K3 K1) Julat had atas kelas terakhir had bawah kelas pertama 3.99 1.50.49 G603 51 G603 5 SISIHN PIWI & VRINS SISIHN PIWI & VRINS Sisihan piawai adalah pengukuran yang paling sesuai digunakan untuk mengukur serakan data Sisihan piawai yang diperolehi memberikan nilai bagi kedudukan data yang bertabur sekitar min Nilai sisihan piawai yang tinggi memberikan gambaran bahawa data itu tertabur jauh daripada min (kurang padat) KES DT TK TERKUMPUL KES DT TERKUMPUL G603 53 G603 54 9
SISIHN PIWI & VRINS KES DT TK TERKUMPUL SISIHN PIWI & VRINS KES DT TERKUMPUL Varians populasi : Varians sampel: σ ( - µ) / N dan s ( ) / n-1 Di mana σ adalah varians populasi, s adalah varians sampel dan G603 55 Varians populasi : Varians sampel: σ f (m - µ) / N dan s f(m ) / n-1 m f [( mf) / n] n-1 Di mana σ adalah varians populasi, s adalah varians sampel dan m adalah titik tengah suatu kelas G603 56 SUKTN SERKN RELTIF V Sisihan piawai min V pekali varians dan ia tidak berunit. Semakin besar nilai pekali varians, maka semakin terseraklah sesuatu data. Walaubagaimanapun, nilai pekali ini hanya memberikan makna jika nilainya tidak terlalu kecil G603 57 STTISTIK KORELSI Mengambarkan kekuatan hubungan di antara dua pembolehubah: Contohnya: hubungan antara sikap pelajar terhadap matapelajaran dengan pencapaian pelajar dalam matapelajaran tersebut Kekuatan hubungan diringkaskan dengan nilai r (pekali korelasi). Nilai r adalah dalam julat +1 dan 1.00 Tanda + @ - menunjukkan arah hubungan Nilai menggambarkan kekuatan hubungan G603 58 STTISTIK KORELSI Seandainya pembolehubah yang ingin dihubungkan adalah bersifat interval, maka korelasi Pearson digunakan. Sebaliknya, jika data adalah bersifat nominal/ordinal maka, korelasi Spearman digunakan Oleh itu, selalulah melihat JENIS DT yang akan dihubungkan!!! LTIHN: UKURN SERKN (JULT, SP, VRIN) 1. Ukuran yang PLING TIDK IS?. Ukuran yang PLING IS? 3. Ukuran yang PLING KURNG STIL? 4. Ukuran yang PLING DIPENGRUHI OLEH SIZ SMPEL? 5. Ukuran yang mempunyai nilai yang sama TNP MENGIR SIZ SMPEL? 6. Ukuran yang PLING MUDH DIKIR? G603 59 G603 60 10
PKH RUMUSN YNG DPT ND ERIKN ERHUUNG PERNN STTISTIK DESKRIPTIF DLM PENYELIDIKN? SEKIN TERIM KSIH DI TS PERHTIN ND. G603 61 G603 6 11