post

Pencilan data juga disebut sebagai pencilan data. Memahami nilai-nilai anomali terdiri dari data pengamatan yang muncul dengan nilai-nilai ekstrem, baik univariat dan multivariat.

Pengertian Data Outlier Univariat dan Multivariat

Yang dimaksud dengan nilai-nilai ekstrem yang diamati adalah nilai yang jauh atau berbeda bersama dengan sebagian besar nilai lain dalam kelompok. Misalnya, nilai tes siswa dalam satu kelas berjumlah 40 siswa, 39 siswa menerima nilai tes di kisaran 70 hingga 80. Lalu ada seorang siswa yang nilainya sangat menyimpang dari yang lain, yaitu mendapat skor 30. Ya, jelas. 1 dari siswa ini memiliki nilai ekstrim yang diindikasikan sebagai pencilan.
Diagram data anomali

Gambarnya seperti gambar di bawah ini:
Contoh diagram data abnormal
Contoh data abnormal

Data abnormal dalam penelitian harus mendapat perlakuan khusus, karena dapat menimbulkan bias dalam hasil penelitian. Tetapi semuanya masih tergantung pada tujuan penelitian, karena jika nilai-nilai ekstrem tersebut benar-benar tergoda untuk dievaluasi keberadaannya atau dinilai oleh fenomena tersebut, maka outlier ditinggalkan dengan damai. Namun, jika tujuan dari penelitian ini adalah untuk menggeneralisasi, khususnya untuk menentukan model prediksi seperti dalam regresi linier, data harus menerima perlakuan khusus. Apa pengobatannya? yaitu, kita dapat mengubah data jika nilai ekstrim masih dapat dikurangi dengan jarak dari grup lain. Jika terlalu jauh, Anda dapat melepaskan data yang menyimpang dari pencarian.
Sisa siswa

Contoh analisis regresi linier, penampilan outlier dilihat oleh nilai-nilai mahasiswa residual. Residu yang diiswakan adalah nilai residu terstandarisasi berdasarkan nilai rata-rata dan deviasi standar. Jika nilai absolut residu siswa lebih besar dari 3, pengamatan yang relevan adalah nilai-nilai anomali yang univariat. Untuk mengetahui nilai anomali multivariat dalam regresi linier, kita dapat melihat dari nilai leverage atau nilai probabilitas mahalanobis. Jika probabilitas mahalanobis kurang dari 0,001, pengamatan yang relevan menjadi nilai anomali multivariat.
Univariat Outlier

Apa itu pencilan univariat? Pencilan univariat adalah pencilan yang disebabkan oleh variabel dependen atau variabel dependen. Dapat ditafsirkan, yaitu, jika variabel dependen adalah nilai anomali, maka besar kemungkinan bahwa nilai anomali univariat akan terjadi. Jika ini dibiarkan tanpa pengobatan, itu dapat menyebabkan masalah normalitas residual dalam regresi linier. Dan tentu saja nilai R dan R Squared adalah Bias. Bias dalam regresi linier adalah nilai R Square yang salah dalam menjelaskan variabel dependen. Bisa jadi nilai R Square tinggi, tetapi sebenarnya sebaliknya.
Nilai anomali multivarian

Apa itu pencilan multivarian? Multivariate outlier adalah nilai-nilai anomali yang disebabkan oleh serangkaian variabel independen atau variabel independen. Jika satu atau lebih variabel independen memiliki nilai ekstrem, ada kemungkinan bahwa nilai anomali multivarian dapat terjadi.

Nah, ini adalah penjelasan singkat tentang outlier. Jika Anda tertarik mempelajari cara menentukan outlier dalam regresi linier dengan SPSS, Anda dapat mempelajari artikel berikutnya, yaitu Regresi Linier dengan SPSS.

Sumber : https://rumusbilangan.com