
Pengujian Reliabilitas Tes dengan KR-20 dan KR-21
Pendahuluan
Dalam penyusunan instrumen tes (terutama tes diagnostik, tes hasil belajar, maupun kuesioner sederhana dengan jawaban benar/salah), penting untuk memastikan bahwa instrumen tersebut tidak hanya valid tetapi juga reliable, artinya hasil pengukuran konsisten dan stabil. Reliabilitas menjadi indikator kualitas instrumen, yang menentukan apakah kita dapat mempercayai skor tes sebagai representasi sejati dari kemampuan atau atribut yang diukur. Salah satu metode paling umum untuk menguji reliabilitas internal pada tes dengan jawaban dikotomi (benar/salah) adalah menggunakan rumus Kuder‑Richardson Formula 20 (KR-20) dan Kuder‑Richardson Formula 21 (KR-21).
Tujuan artikel ini adalah membahas definisi KR-20 dan KR-21, landasan teori reliabilitas, kondisi penggunaannya, perbandingan keduanya, serta kelebihan dan keterbatasannya, sehingga pembaca, terutama peneliti atau pendidik, dapat memahami kapan dan bagaimana menggunakan dua rumus ini dengan tepat.
Definisi KR-20 dan KR-21
Definisi KR-20 dan KR-21 Secara Umum
KR-20 dan KR-21 adalah rumus atau koefisien yang digunakan untuk mengukur reliabilitas internal dari instrumen tes yang terdiri atas item dengan jawaban dikotomous (dua kemungkinan: benar/salah, ya/tidak, benar/keliru). [Lihat sumber Disini - en.wikipedia.org]
Reliabilitas internal berarti seberapa konsisten item-item dalam tes mengukur konstruk atau kemampuan yang sama, dalam hal ini, apakah tiap item “berjalan bersama” dalam mengukur aspek yang sama. [Lihat sumber Disini - sciencedirect.com]
KR-20 paling cocok untuk tes di mana tiap item dijawab secara dikotomous dan tingkat kesulitan item bisa berbeda-beda antar soal. [Lihat sumber Disini - statology.org]
Sementara itu, KR-21 merupakan versi yang lebih sederhana dan lebih konservatif dari KR-20, yang dipakai bila asumsi bahwa semua item memiliki tingkat kesulitan yang sama dapat diterima. [Lihat sumber Disini - en.wikipedia.org]
Definisi KR-20 dan KR-21 dalam Kamus / KBBI
Istilah “KR-20” dan “KR-21” secara teknis bukanlah istilah umum dalam Kamus Besar Bahasa Indonesia (KBBI), melainkan terminologi statistik/psikometri. Karena itu, definisi dalam KBBI mungkin tidak tersedia secara eksplisit. Namun, dalam literatur psikometri dan evaluasi pendidikan di Indonesia, KR-20 dan KR-21 diakui sebagai teknik untuk mengukur “konsistensi internal” instrumen tes dikotomous. Sebagai contoh, dalam publikasi tentang analisis instrumen, KR-20 dan KR-21 disebut sebagai bagian dari “uji reliabilitas konsistensi internal”. [Lihat sumber Disini - edukatif.org]
Sebagai catatan: definisi reliabilitas sendiri, sebagai konsistensi hasil pengukuran, dijabarkan dalam literatur metode penelitian pendidikan. [Lihat sumber Disini - prosiding.bkstm.org]
Definisi KR-20 dan KR-21 Menurut Para Ahli
Berikut definisi menurut beberapa ahli dan penelitian terkini:
- Koefisien KR-20 adalah “metode pengukuran konsistensi internal untuk data dikotomi (right/wrong), yang ekuivalen dengan melakukan metode split-half di semua kombinasi soal.” [Lihat sumber Disini - real-statistics.com]
- KR-20 mengukur reliabilitas internal dari tes kemampuan atau hasil belajar berbasis jawaban benar/salah, dan hasil koefisien berada pada rentang 0 sampai 1; semakin mendekati 1, semakin tinggi reliabilitas. [Lihat sumber Disini - statology.org]
- KR-21 adalah versi sederhana dari KR-20 yang digunakan bila seluruh item dipandang memiliki tingkat kesulitan yang sama, menggunakan rata-rata skor dan varians total tes dalam perhitungannya. [Lihat sumber Disini - statisticshowto.com]
- Menurut penelitian modern, ketika asumsi keseragaman kesulitan tidak terpenuhi, seperti variasi tingkat kesulitan antar item, KR-20 lebih disarankan dibanding KR-21. [Lihat sumber Disini - en.wikipedia.org]
- Dalam konteks instrumen pendidikan di Indonesia, banyak penelitian menggunakan KR-20 (dan KR-21 kadang pula) untuk menguji reliabilitas internal instrumen, terutama instrumen dengan jawaban dikotomi. [Lihat sumber Disini - researchgate.net]
Landasan Teori dan Kepentingan Reliabilitas Tes
Reliabilitas dalam konteks instrumen pengukuran mengacu pada seberapa konsisten dan stabil sebuah tes dalam mengukur konstruk yang sama ketika dilakukan berulang kali atau dalam kondisi berbeda. [Lihat sumber Disini - prosiding.bkstm.org]
Reliabilitas internal adalah salah satu aspek penting, yaitu konsistensi antar item dalam tes pada satu kesempatan pengukuran tunggal. Untuk data dikotomous, metode yang paling tepat adalah menggunakan koefisien seperti KR-20 atau KR-21, daripada metode untuk data skala (misalnya skala Likert). [Lihat sumber Disini - sciencedirect.com]
Tanpa reliabilitas yang baik, skor tes bisa jadi tidak stabil, sehingga interpretasi hasil menjadi tidak dapat dipercaya. Di dunia pendidikan, hal ini penting agar keputusan berdasarkan tes (misalnya kelulusan, diagnosis kesulitan belajar, evaluasi hasil belajar) dapat berlandas pada data yang valid dan andal.
Perbandingan KR-20 dan KR-21
Kapan menggunakan KR-20
- Tes dengan item dikotomous (benar/salah, ya/tidak, jujur/palsu). [Lihat sumber Disini - real-statistics.com]
- Ketika item-item dalam tes memiliki tingkat kesulitan berbeda (ada soal mudah, sedang, sulit). [Lihat sumber Disini - statology.org]
- Umumnya dianggap lebih fleksibel dan akurat dibanding KR-21 dalam kasus realistik di pendidikan atau penelitian. [Lihat sumber Disini - en.wikipedia.org]
Kapan KR-21 bisa dipakai
- Bila diasumsikan bahwa semua item memiliki tingkat kesulitan yang sama (seragam). [Lihat sumber Disini - statisticshowto.com]
- Digunakan sebagai estimasi reliabilitas jika kondisi keseragaman item terpenuhi, namun dalam praktik sering sulit memastikan keseragaman ini. [Lihat sumber Disini - en.wikipedia.org]
Perbedaan mendasar
- KR-20 berdasarkan pada proporsi jawaban benar/benar per item (p dan q per item), berbeda dengan KR-21 yang menggunakan nilai rata-rata jawaban benar untuk seluruh item. [Lihat sumber Disini - lib.umpr.ac.id]
- KR-21 cenderung menghasilkan estimasi reliabilitas yang lebih “konservatif” (kadang terlalu rendah) ketika kondisi kesulitan item tidak seragam, sedangkan KR-20 lebih fleksibel menghadapi variasi item. [Lihat sumber Disini - en.wikipedia.org]
- Jika format soal memungkinkan jawaban selain benar/salah (misalnya pilihan berganda, skala, skor parsial), KR-20 atau KR-21 tidak tepat, dan biasanya digunakan metode lain seperti Cronbach's Alpha. [Lihat sumber Disini - researchgate.net]
Implementasi dan Temuan dalam Penelitian di Indonesia
Beberapa penelitian dan analisis instrumen di Indonesia maupun lembaga pendidikan menggunakan KR-20 / KR-21 sebagai metode uji reliabilitas. Misalnya:
- Dalam penelitian di 2024 yang membandingkan reliabilitas dengan metode Cronbach’s Alpha, KR-20, KR-21, dan split-half, penulis menggunakan ketiga teknik tersebut untuk menilai reliabilitas tes akhir semester mahasiswa. Hasil penelitian menunjukkan bahwa KR-20 dan KR-21 dipakai bersamaan dengan metode lain untuk mendapatkan gambaran reliabilitas yang lebih komprehensif. [Lihat sumber Disini - ejournal.undiksha.ac.id]
- Di penelitian lain, analisis butir soal dan reliabilitas soal pilihan ganda dengan KR-20 menunjukkan tingkat reliabilitas yang dapat diterima (misalnya koefisien sekitar 0,743), yang menunjukkan bahwa instrumen dapat digunakan sebagai alat ukur dengan konsistensi yang memadai. [Lihat sumber Disini - bimaberilmu.com]
- Dalam penelitian tes miskonsepsi berbasis KR-20, instrumen diuji pada sekelompok siswa dan menghasilkan nilai reliabilitas sebesar 1,00 (sangat tinggi), menunjukkan bahwa instrumen sangat homogen dalam mengukur konstruk yang ditargetkan. [Lihat sumber Disini - ejournal.unesa.ac.id]
Secara umum, banyak penelitian yang menyebut bahwa KR-20 (dan kadang KR-21) merupakan bagian dari “paket” analisis reliabilitas internal, bersama metode seperti split-half, Cronbach’s Alpha, terutama ketika menggunakan data dikotomous. [Lihat sumber Disini - edukatif.org]
Kelebihan dan Keterbatasan KR-20/KR-21
Kelebihan
- KR-20 dan KR-21 secara khusus dirancang untuk data dikotomous, sehingga sangat cocok untuk tes benar/salah, ya/tidak, dan sejenisnya. [Lihat sumber Disini - real-statistics.com]
- KR-20 fleksibel menghadapi variasi tingkat kesulitan antar item; membuatnya lebih realistis dalam banyak situasi tes pendidikan. [Lihat sumber Disini - en.wikipedia.org]
- Prosedurnya relatif sederhana dan dapat dihitung dengan software statistik atau spreadsheet (misalnya Excel). [Lihat sumber Disini - statistikian.com]
Keterbatasan
- KR-20 / KR-21 hanya cocok untuk data dikotomous, jika tes menggunakan format lain (misalnya pilihan ganda dengan lebih dari dua opsi, Likert scale, atau soal dengan skor parsial), metode ini tidak sesuai. [Lihat sumber Disini - researchgate.net]
- KR-21 mensyaratkan asumsi bahwa seluruh item memiliki kesulitan yang sama, asumsi ini jarang terpenuhi secara realistis dalam tes pendidikan atau evaluasi. [Lihat sumber Disini - en.wikipedia.org]
- Meskipun KR-20 lazim digunakan, ada kritik bahwa koefisien ini, seperti halnya koefisien reliabilitas klasik lain, dapat over-estimate reliabilitas dalam arti “generalizable measure”, khususnya bila digunakan untuk inferensi di luar sampel atau konteks tes. [Lihat sumber Disini - rasch.org]
- Karena reliabilitas hanya aspek salah satu kualitas instrumen, penggunaan KR-20/KR-21 saja tidak cukup; analisis butir soal, validitas (konten, konstruk, kriteria) dan distraktor (untuk soal pilihan ganda) tetap diperlukan agar tes benar-benar valid dan reliabel. Banyak penelitian yang mengombinasikan KR-20 dengan analisis validitas dan analisis item. [Lihat sumber Disini - jurnal.untan.ac.id]
Rekomendasi Praktis bagi Peneliti dan Pendidik
- Gunakan KR-20 bila membuat tes dengan jawaban dikotomous (benar/salah, ya/tidak) dan soal-soal memiliki variasi tingkat kesulitan, ini adalah pilihan paling tepat untuk menguji reliabilitas internal.
- Hindari menggunakan KR-21 kecuali ada alasan kuat bahwa seluruh item setara dalam kesulitan, tetapi tetap perhatikan bahwa asumsi ini sulit dipenuhi di banyak konteks nyata, maka pakai KR-20 sebagai default jika ragu.
- Untuk tes dengan format lain (misalnya pilihan berganda dengan banyak opsi, skala Likert, skor parsial, atau soal uraian), gunakan metode reliabilitas lain seperti Cronbach’s Alpha, atau lakukan analisis butir + metode reliabilitas yang sesuai.
- Selalu kombinasikan uji reliabilitas dengan analisis validitas dan analisis butir (item analysis: tingkat kesukaran, diskriminasi, distraktor) agar instrumen benar-benar “baik” dari segi kualitas.
- Dokumentasikan proses uji reliabilitas dan hasilnya (nilai koefisien, asumsi terkait soal, jumlah peserta, nilai varians, proporsi jawaban benar) agar transparansi dan replikasi penelitian tetap terjaga.
Kesimpulan
KR-20 dan KR-21 adalah rumus klasik dalam psikometri untuk mengukur reliabilitas internal instrumen tes yang terdiri dari item dikotomous. KR-20 umumnya lebih fleksibel dan cocok ketika soal memiliki variasi dalam tingkat kesulitan, sedangkan KR-21 hanya cocok jika semua item dianggap setara. Penggunaan kedua koefisien ini memegang peran penting dalam menentukan apakah sebuah tes konsisten dan dapat dipercaya. Namun, keduanya memiliki keterbatasan: tidak cocok untuk format selain dikotomous, dan hasilnya perlu disertai dengan analisis butir serta validitas agar instrumen benar-benar valid dan reliabel. Bagi peneliti dan pendidik, penting untuk memilih metode reliabilitas dengan bijak sesuai karakteristik tes, serta mendokumentasikan proses dan hasilnya secara sistematis.