
Pengujian Normalitas dengan Shapiro-Wilk
Pendahuluan
Dalam penelitian kuantitatif, sebelum melakukan analisis statistik (terutama analisis parametrik seperti uji t, ANOVA, regresi, dsb.), sangat penting untuk memeriksa distribusi data terlebih dahulu. Salah satu aspek prasyarat yang sering dibutuhkan adalah bahwa data berdistribusi normal (normal distribution). Jika asumsi normalitas tidak terpenuhi, maka hasil analisis parametrik bisa menyesatkan, atau malah seharusnya menggunakan metode nonparametrik. Oleh karena itu, pengujian normalitas merupakan tahap awal yang krusial dalam desain penelitian dan analisis data.
Salah satu metode pengujian normalitas yang paling banyak digunakan adalah Shapiro–Wilk test, sering disingkat “Shapiro-Wilk”. Metode ini cocok terutama ketika ukuran sampel relatif kecil hingga sedang. Tulisan ini bertujuan menjelaskan secara mendalam tentang Shapiro-Wilk, mulai dari definisi, teori dasar, kelebihan/kekurangan, hingga penerapannya dalam penelitian empiris.
Definisi Shapiro–Wilk test
Definisi Shapiro–Wilk secara umum
Shapiro-Wilk adalah metode statistik yang digunakan untuk menguji apakah suatu sampel berasal dari populasi dengan distribusi normal. Dalam artian formal, Shapiro-Wilk menguji hipotesis nol bahwa data sampel mengikuti distribusi normal. Jika hasil uji menunjukkan p-value di atas tingkat signifikansi yang ditetapkan (misalnya 0,05), maka kita gagal menolak hipotesis nol, yang berarti data dianggap berdistribusi normal. Sebaliknya, jika p-value lebih kecil dari α, maka hipotesis nol ditolak, artinya data dianggap bukan dari distribusi normal. [Lihat sumber Disini - en.wikipedia.org]
Shapiro-Wilk pertama kali diperkenalkan oleh peneliti Samuel Sanford Shapiro dan Martin B. Wilk pada tahun 1965. [Lihat sumber Disini - en.wikipedia.org]
Metode ini didasarkan pada perbandingan antara urutan nilai sampel (ordered statistics) dengan nilai-nilai yang diharapkan dari distribusi normal, secara matematis, menghitung seberapa “rapi” sampel mengikuti pola distribusi normal. Statistik uji yang dihasilkan disebut W (nilai W), dengan rentang nilai antara 0 sampai 1; nilai mendekati 1 menunjukkan kesesuaian tinggi dengan distribusi normal. [Lihat sumber Disini - en.wikipedia.org]
Definisi Shapiro–Wilk menurut KBBI
Karena Shapiro–Wilk adalah istilah teknis dalam statistik dan bukan istilah bahasa Indonesia, dalam sumber populer (termasuk materi praktikum/statistik di perguruan tinggi), definisinya sering diterjemahkan bebas sebagai “uji normalitas Shapiro-Wilk”, yaitu alat untuk menguji normalitas data sampel. Sebagai metode pengujian normalitas, istilah ini umumnya dipertahankan dalam bentuk aslinya (tidak diterjemahkan). Oleh karena itu, di kamus umum seperti KBBI istilah “Shapiro-Wilk” kemungkinan besar tidak muncul sebagai entri tersendiri.
Meski demikian, dalam literatur statistik berbahasa Indonesia, “uji normalitas” dijelaskan sebagai “prosedur untuk menentukan apakah data mengikuti distribusi normal (Gaussian)”. Demikian pula, bagian “uji normalitas” dalam dokumen-dokumen statistik di Indonesia menyebut “Shapiro-Wilk” sebagai nama metode, tanpa menerjemahkannya. [Lihat sumber Disini - poltekkes-solo.ac.id]
Dengan demikian, definisi resmi dalam KBBI tidak tersedia, tetapi istilah “uji normalitas” sesuai arti statistik sudah lazim digunakan.
Definisi Shapiro–Wilk menurut Para Ahli
Berikut beberapa pendapat dari literatur dan ahli mengenai Shapiro-Wilk:
- Menurut artikel “Normality Tests for Statistical Analysis: A Guide for Non-Statisticians”, Shapiro-Wilk dianggap memiliki power lebih baik dibandingkan uji normalitas lain seperti Kolmogorov–Smirnov test (termasuk versi dengan koreksi Lilliefors), terutama untuk sampel kecil. [Lihat sumber Disini - pmc.ncbi.nlm.nih.gov]
- Dalam “Descriptive Statistics and Normality Tests for Statistical Data”, disebutkan bahwa Shapiro-Wilk lebih tepat digunakan untuk ukuran sampel kecil (<50), meskipun dapat juga digunakan untuk sampel lebih besar. [Lihat sumber Disini - pmc.ncbi.nlm.nih.gov]
- Menurut evaluasi berbagai metode uji normalitas, Shapiro-Wilk menawarkan kombinasi keandalan dan sensitivitas tinggi dalam mendeteksi penyimpangan dari distribusi normal,sehingga sering direkomendasikan sebagai metode utama. [Lihat sumber Disini - researchgate.net]
- Namun, sebagaimana disoroti dalam artikel terbaru tahun 2025, penggunaan Shapiro-Wilk, terutama pada data regresi, sering disalahpahami atau disalahgunakan. Test normalitas tidak selalu cukup untuk menjamin bahwa metode parametrik dapat diterapkan secara akurat; penelitian harus mempertimbangkan konteks, ukuran sampel, transformasi data, serta asumsi lain seperti homogenitas varians dan independensi. [Lihat sumber Disini - royalsocietypublishing.org]
Pengujian Normalitas dengan Shapiro-Wilk
Prinsip Dasar dan Logika Uji
Tujuan utama dari Shapiro-Wilk adalah untuk menilai apakah sampel data “cukup dekat” dengan distribusi normal. Secara teknis, Shapiro-Wilk menghitung statistik W berdasarkan urutan nilai data (order statistics) dan nilai ekspektasi distribusi normal standar. [Lihat sumber Disini - en.wikipedia.org]
Hipotesis uji biasanya:
- H₀ (hipotesis nol): Data berasal dari populasi yang berdistribusi normal.
- H₁ (hipotesis alternatif): Data tidak berasal dari populasi yang berdistribusi normal.
Bila p-value > α (sering 0,05), maka gagal menolak H₀ ⇒ data dianggap normal. Bila p-value ≤ α, maka H₀ ditolak ⇒ data dianggap tidak normal. [Lihat sumber Disini - scirp.org]
Nilai W berkisar 0–1; nilai mendekati 1 menunjukkan kesesuaian dengan distribusi normal, sedangkan nilai jauh dari 1 menunjukkan penyimpangan. Namun, penting diingat bahwa seperti semua uji statistik, hasil Shapiro-Wilk harus dipahami bersama alat interpretasi lain, misalnya grafik (histogram, Q-Q plot) atau statistik deskriptif (kemiringan, kurtosis), untuk memberikan gambaran lengkap tentang distribusi data. [Lihat sumber Disini - sciencedirect.com]
Kapan Sebaiknya Menggunakan Shapiro-Wilk
- Shapiro-Wilk sangat cocok untuk ukuran sampel kecil hingga sedang, misalnya n < 50. [Lihat sumber Disini - pmc.ncbi.nlm.nih.gov]
- Untuk sampel besar (contoh n ≥ 50), beberapa literatur menyarankan metode lain seperti Kolmogorov–Smirnov atau tes berbasis grafis/kuantitatif lain. [Lihat sumber Disini - journals.lww.com]
- Meski demikian, Shapiro-Wilk sering tetap dipakai untuk sampel lebih besar jika peneliti menginginkan deteksi penyimpangan distribusi, meskipun dengan catatan bahwa uji menjadi sangat sensitif terhadap penyimpangan kecil (yang kadang kurang bermakna secara praktis). [Lihat sumber Disini - en.wikipedia.org]
Kelebihan dan Keterbatasan
Kelebihan
- Memiliki power tinggi: lebih sensitif dalam mendeteksi penyimpangan dari normalitas daripada banyak tes lain seperti Kolmogorov–Smirnov, Lilliefors, atau Anderson-Darling dalam berbagai kondisi. [Lihat sumber Disini - nrc.gov]
- Efektif untuk sampel kecil, sangat berguna dalam penelitian dengan keterbatasan jumlah responden. [Lihat sumber Disini - pmc.ncbi.nlm.nih.gov]
- Mudah diimplementasikan dalam perangkat lunak statistik umum (misalnya SPSS, SAS, R, Python), sehingga praktis untuk peneliti. [Lihat sumber Disini - statistikian.com]
Keterbatasan / Catatan Penting
- Sangat sensitif terhadap ukuran sampel besar, kadang uji menolak normalitas meskipun penyimpangan dari normalitas secara praktis kecil atau tidak berpengaruh besar terhadap hasil analisis. [Lihat sumber Disini - en.wikipedia.org]
- Hasil uji saja tidak cukup; harus dikombinasikan dengan analisis grafik dan statistik deskriptif agar interpretasi lebih menyeluruh. [Lihat sumber Disini - sciencedirect.com]
- Dalam beberapa konteks, meskipun data tidak normal, tetapi jika sampel cukup besar, penggunaan metode parametrik masih dapat diterima (tergantung tujuan penelitian dan ketahanan metode). [Lihat sumber Disini - sciencedirect.com]
Penerapan Shapiro-Wilk dalam Penelitian: Contoh dan Temuan
Berikut beberapa penerapan Shapiro-Wilk dalam penelitian empiris terkini dan implikasinya:
- Dalam penelitian “Penerapan Distribusi Normal Dalam Pengukuran Tinggi Badan Mahasiswa FMIPA Universitas Negeri Medan 2024”, peneliti menggunakan Shapiro-Wilk dan menemukan nilai W ≈ 0,921 dan p-value = 0,361, menunjukkan data tinggi badan berdistribusi normal. [Lihat sumber Disini - journal.arimsi.or.id]
- Sebuah studi pendidikan terhadap siswa kelas IV menggunakan desain quasi-eksperimen, setelah dilakukan pre-test dan post-test, uji normalitas dengan Shapiro-Wilk menunjukkan bahwa data berdistribusi normal; sehingga peneliti melanjutkan dengan uji parametrik atau uji nonparametrik sesuai asumsi homogenitas. [Lihat sumber Disini - jbasic.org]
- Dalam riset tentang kepuasan kerja dan kinerja karyawan pada suatu bank di Pontianak, peneliti menerapkan Shapiro-Wilk sebagai bagian dari prasyarat analisis data, untuk memastikan apakah data kuisioner memenuhi asumsi normalitas sebelum melakukan analisis lanjutan. [Lihat sumber Disini - media.neliti.com]
- Namun demikian, sebuah artikel tahun 2025 memperingatkan bahwa banyak peneliti kerap “menyalahgunakan” hasil uji normalitas, misalnya, terlalu mengandalkan p-value tanpa mempertimbangkan ukuran sampel, transformasi data, dan asumsi analisis lebih luas seperti independensi dan homogenitas. [Lihat sumber Disini - royalsocietypublishing.org]
Dari contoh–contoh di atas, terlihat bahwa Shapiro-Wilk sering digunakan sebagai langkah awal validasi data sebelum analisis utama. Tetapi penggunaannya perlu disertai interpretasi kontekstual dan pemeriksaan lanjutan.
Implikasi bagi Peneliti dan Praktisi
Bagi peneliti, terutama di Indonesia, pemahaman dan penggunaan Shapiro-Wilk secara benar memiliki beberapa implikasi penting:
- Menyediakan prosedur yang relatif mudah, cepat, dan andal untuk memeriksa normalitas data, membantu menentukan apakah analisis parametrik layak dilakukan.
- Memungkinkan pengambilan keputusan metodologis lebih bijak: apakah harus lanjut dengan uji parametrik, atau beralih ke metode nonparametrik jika normalitas tidak terpenuhi.
- Mengurangi risiko kesalahan interpretasi hasil penelitian akibat asumsi distribusi yang dilanggar.
- Namun, peneliti harus bijak: jangan hanya mengandalkan uji statistik, gunakan juga analisis grafik, deskriptif, dan pertimbangan praktis (misalnya apakah deviasi dari normalitas cukup besar untuk mempengaruhi hasil).
Kesimpulan
Pengujian normalitas merupakan tahap fundamental dalam analisis data kuantitatif, dan Shapiro-Wilk adalah salah satu metode paling populer dan efektif untuk keperluan ini, terutama bila sampel relatif kecil hingga sedang.
Shapiro-Wilk memiliki power tinggi dan secara luas diakui sebagai metode andal untuk mendeteksi penyimpangan dari distribusi normal. Namun demikian, hasil uji ini tidak seharusnya dianggap mutlak atau tunggal: interpretasi yang komprehensif memerlukan kombinasi dengan analisis grafik, ukuran sampel, serta pemahaman kontekstual mengenai data dan tujuan analisis.
Dengan demikian, bagi peneliti dan praktisi, menggunakan Shapiro-Wilk dengan tepat dan bijak dapat meningkatkan validitas dan kredibilitas hasil penelitian, tetapi harus disertai pemahaman menyeluruh tentang kekuatan dan keterbatasannya.