PENGUJIAN RELIABILITAS DAN VALIDITAS

INSTRUMEN PENELITIAN

Oleh: Hasan Basri al-Mardawy

A. Pendahuluan

Reliabilitas dan validitas merupakan dua kriteria utama yang biasa digunakan dalam menentukan kualitas instrumen penelitian. Setiap instrumen yang akan digunakan dalam penelitian harus diuji terlebih dahulu sebelum instrumen tersebut dijadikan sebagai alat pengumpulan data. Sebagian besar prosedur pengambilan data tergantung pada kualitas proses instrumen pengukuran yang digunakan. Instrumen yang baik harus memenuhi dua persyaratan penting yaitu reliabel dan valid. Sebuah instrumen dikatakan valid apabila mampu mengukur apa yang ingin diukur dan dapat mengungkap data dari variabel yang diteliti secara tepat.

Tingkat reliabilitas dan validitas menunjukkan mutu seluruh proses pengumpulan data dalam suatu penelitian, mulai dari penjabaran konsep-konsep sampai pada saat data siap untuk dianalisis. Dalam menilai reliabilitas dan validitas sejumlah pertanyaan penting harus dijawab, antara lain: Apakah konsep-konsep penelitian dijabarkan dengan tepat? Apakah rumusan pertanyaan dalam kuesioner sudah cukup jelas? Apakah responden menjawab dengan jujur dan konsisten? Apakah alat ukur yang dipakai berhasil mengukur apa yang ingin diukur? Untuk mengetahui lebih jauh tentang reliabilitas dan validitas, makalah ini mencoba membahasnya dengan sistematika: pendahuluan, definisi reliabilitas dan validitas, macam-macam validitas, kriteria pengukuran instrumen, teori reliabilitas, pengujian indeks reliabilitas, pengujian validitas, dan penutup.

B. Definisi Reliabilitas dan Validitas

Untuk menghindari kesalahpahaman terhadap istilah yang dipakai dalam kajian ini, maka perlu dijelaskan terlebih dulu definisi dua kata kunci seperti yang tertera dalam judul di atas, yaitu: reliabilitas dan validitas.

1. Reliabilitas

Reliabilitas secara literal berasal dari kata reliability yang berarti “dapat dipercaya” atau “dapat diandalkan”. Menurut istilah, reliabilitas berarti “derajat ketepatan dan ketelitian atau akurasi yang ditunjukkan oleh instrumen pengukuran” (Sevilla, et. al., 1993: 175). Linn dan Gronlund (1985: 48) memberi definisi, reliability refers to the consistency of assessment results. If we obtain quite similar scores when the same assessment procedure is used with the same students on two different occasions, we can conclude that our results have a high degree of reliability from one occasion to another. Pada intinya, definisi ini menggarisbawahi bahwa reliabilitas merupakan hasil penilaian yang bersifat konsisten. Makna konsisten di sini ditandai pada keajegan penilaian dan hasil yang sama (consistency of the results) dengan prosedur yang sama pada kesempatan atau waktu yang berbeda. Istilah-istilah lain yang digunakan untuk reliabilitas adalah stabilitas, dapat dipercaya, dan dapat diramalkan. Sebagai contoh: jika suatu instrumen memperoleh hasil yang sama dari dua pengujian di bawah kondisi yang sama, maka tes tersebut dikatakan konsisten, dan karena itu dapat diandalkan. Dalam hal yang sama, kalau seorang peneliti ingin meramalkan hasil tes yang akan datang, yang didasarkan atas hasil pengujian terdahulu, maka dapat dikatakan pengujian tersebut adalah stabil. Kemudian, Hagul (1985: 88) menjelaskan bahwa reliabilitas lebih mudah dimengerti dengan memperhatikan tiga aspek dari suatu alat ukur, yaitu: kemantapan, ketepatan, dan homogenitas.

a. Kemantapan

Suatu alat ukur dikatakan mantap apabila dalam mengukur sesuatu berulang kali, alat ukur tersebut memberikan hasil yang sama. Tentu saja dengan syarat bahwa kondisi saat pengukuran tidak berubah. Dalam kaitan ini, reliabilitas berarti dapat diandalkan (dependability) dan hasilnya dapat diramalkan (predictability).

b. Ketepatan

Ukuran ketepatan dapat dilihat pada hasil pengukuran. Apakah ukuran yang diperoleh merupakan hasil pengukuran yang benar dari sesuatu yang ingin diukur.

c. Homogenitas

Agar suatu karakteristik dapat diketahui secara mendalam, maka diperlukan bermacam-macam keterangan. Seluruh keterangan tersebut mempunyai kaitan yang erat satu sama lain.

Dengan demikian dapat dikatakan bahwa reliabilitas artinya memiliki sifat dapat dipercaya (reliable). Suatu alat ukur dikatakan memiliki reliabilitas apabila dipergunakan berkali-kali oleh peneliti yang sama atau peneliti lain tetap memberikan hasil yang sama pula. Jadi, reliabilitas mengandung makna stabilitas, konsistensi, dan dependabilitas (Rakhmat, 2004: 17).

2. Validitas

Menurut bahasa, validitas (berasal dari kata validity) berarti “keabsahan” atau “kebenaran”. Secara terminologi, validitas artinya “derajat ketepatan suatu alat ukur tentang pokok isi atau arti sebenarnya yang diukur.” (Sevilla, et. al., 1993: 176). Menurut Sugiyono (2003: 1-2), validitas adalah “derajat ketepatan antara data yang sesungguhnya terjadi pada objek dengan data yang dapat dikumpulkan oleh peneliti.” Menurut Linn dan Gronlund (1985: 47), validity refers to the adequacy and appropriateness of the interpretations made from assessments, with regard to a particular use. Linn dan Gronlund mensyaratkan validitas dengan interpretasi-interpretasi yang tepat (appropriateness) dan memadai (adequacy) dari penilaian-penilaian (assessments). Jadi, validitas selalu berhubungan dengan kegunaan khusus dari hasil-hasil penilaian dan kesahihan interpretasi yang dikemukakan peneliti tentang hasil-hasil tersebut. Misalnya, jika seorang peneliti ingin menggambarkan prestasi belajar siswa, maka dia harus mampu menginterpretasikan skor yang relevan dan representatif dari ranah prestasi belajar yang diukur.

Kemudian, Sugiyono menyatakan bahwa data yang telah terkumpul sebelum diketahui validitasnya, maka dapat diuji melalui pengujian reliabilitas dan objektivitas. Pada umumnya jika data itu reliabel dan objektif, maka terdapat kecendrungan data tersebut akan valid. Namun, data yang reliabel dan objektif belum tentu valid. Maka, validitas data penelitian dapat diperoleh dengan cara menggunakan instrumen penelitian yang valid, menggunakan sumber data yang tepat dan cukup jumlahnya, serta menggunakan metode pengumpulan dan analisis data yang benar. Secara singkat dapat dikatakan validitas adalah kesesuaian dan ketepatan alat ukur dengan apa yang hendak diukur.

C. Kriteria Pengukuran Instrumen

Kendatipun reliabilitas dan validitas adalah hal yang sangat penting dalam pengukuran instrumen, ada sejumlah kriteria yang perlu dipertimbangkan, antara lain: sensitivitas, objektivitas, dan fisibilitas.

1. Sensitivitas

Sensitivitas adalah “kemampuan suatu instrumen untuk melakukan diskriminasi yang diperlukan untuk masalah penelitian” (Sevilla, et. al., 1993: 177). Bila suatu validitas dan reliabilitas suatu tes tinggi, maka tes tersebut cukup sensitif, mempertajam perbedaan dalam derajat variasi-variasi karakteristik yang diukur.

2. Objektivitas

Objektivitas adalah “derajat di mana pengukuran yang dilakukan bebas dari pendapat dan penilaian subjektif; bebas dari bias dan perasaan orang-orang yang menggunakan tes” (Sevilla, et. al., 1993: 178). Aspek objektivitas ini berkaitan dengan pelaksanaan tes, skoring, dan penafsiran. Jenis kelamin, umur, dan penampilan serta gerak langkah peneliti, responden harus memperoleh skor yang stabil dan akurat, bebas dari berbagai pengaruh variabel individu peneliti. Analisis soal, misalnya, adalah suatu proses yang membuat soal-soal tes objektif.

3. Fisibilitas

Fisibilitas adalah berkenaan dengan aspek-aspek ketrampilan, biaya, dan waktu. Ada beberapa tes tertentu yang mensyaratkan ketrampilan minimun dalam menyusun tes dan mungkin mempersyaratkan latihan minimum dalam pelaksanaan, skoring, penganalisisan, dan penafsiran data tes (Sevilla, et. al., 1993: 178).

D. Teori Reliabilitas

Pengukuran reliabilitas mempunyai landasan dalam teori measurement error (salah ukur). Secara sederhana dapat dikatakan bahwa mengukur itu tidak lain daripada memberikan angka pada sesuatu berdasarkan aturan-aturan tertentu. Angka yang diberikan itu menunjuk pada kuantitas atribut yang diukur. Meteran, misalnya, adalah alat yang digunakan untuk mengukur panjang (Rakhmat, 2004: 17; Ary, et. al., t.th: 301-306).

Dalam pengukuran reliabilitas, instrumen yang standar itu secara teoretis dianggap ada; hasil atau angka yang diperoleh dengan menggunakan instrumen itu disebut “angka yang benar” (true score). Sedangkan hasil atau angka yang diperoleh dengan menggunakan instrumen yang ada disebut “angka yang diperoleh” (obtained score). Selisih antara angka yang diperoleh dan angka yang benar disebut “salah ukur” (measurement errorr). Secara matematis ketiga konsep ini dapat disederhanakan dalam bentuk persamaan berikut ini:

Xt = X + Xe

Xt = angka yang diperoleh

X = angka yang benar

Xe = salah ukur

Besarnya salah ukur dapat dihitung dengan menggunakan rumus:

ru = Xt - Xe

ru = koefisien reliabilitas

Dari rumus di atas dapat disimpulkan bahwa semakin kecil salah ukur (Xe) semakin kecil pula perbedaan antara angka yang diperoleh (Xt) dan angka yang benar; dan semakin tinggi pula koefisien reliabilitas (ru). Apabila dalam pengukuran tidak terdapat sedikit pun kesalahan, maka angka yang diperoleh adalah sama dengan angka yang benar, dan koefisien reliabilitas sama dengan 1 (satu).

E. Pengujian Indeks Reliabilitas

Reliabilitas instrumen penelitian dapat diuji atau dinilai dengan menggunakan beberapa metode, antara lain:

1. Metode Pengulangan (Test and Retest Method)

Menguji reliabilitas dengan teknik kesesuaian adalah dengan cara mencari indeks kesesuaian kasar (crude index of agreement). Caranya adalah dengan mengulang penelitian (test and retest) dengan menggunakan alat atau instrumen yang sama, responden yang sama, situasi yang lebih kurang sama, dan pada waktu yang berlainan. Hasil penelitian pertama kemudian dibandingkan dengan hasil penelitian kedua; dan stabilitas dari jawaban dianalisis. Jika instrumen yang dipakai itu stabil, maka jawaban yang diperoleh dari dua waktu yang berbeda itu seharusnya sama pula. Dengan metode ini dapat dihitung indeks reliabilitas kasar (Nazir, 1999: 168; Hagul, 1988: 91).

2. Metode Paralel (Parallel Method)

Dalam metode ini sebuah variabel atau kelompok variabel diukur dua kali pada waktu yang sama atau hampir bersamaan pada responden atau sampel yang sama pula. Dalam pelaksanaannya terdapat dua kemungkinan: dua orang peneliti menggunakan alat ukur yang sama atau seorang peneliti dengan dua alat ukur yang berbeda; tetapi bermaksud mengukur variabel yang sama. Sebagai contoh, status ekonomi yang diukur dengan pendapatan dapat dibandingkan dengan indeks pemilikan barang-barang berharga. Reliabilitas kedua alat ukur ini tergantung pada sejauh mana keduanya berhasil menempatkan responden dalam urutan yang konsisten (Hagul, 1988: 94).

Salah satu cara untuk menilai reliabilitas dari dua alat ukur adalah dengan koefisien korelasi (Product Moment Pearson). Koefisien korelasi (r) akan menunjukkan derajat korelasi dua set angka di atas. Apabila koefisien r dikuadratkan maka akan diperoleh koefisien determinasi yang sekaligus merupakan indeks reliabilitas untuk kedua alat ukur.

3. Metode Belah-Dua (Split-Half Method)

Metode ini dipergunakan apabila peneliti ingin menguji suatu alat ukur yang terdiri dari beberapa pertanyaan atau pernyataan, biasanya dalam bentuk skala. Karena sebuah skala biasanya mengukur suatu konsep, pertanyaan atau pernyataan yang membentuk skala itu haruslah mempunyai kaitan erat satu sama lain. Jadi, yang diukur dalam metode belah-dua ini adalah homogenitas dan internal consistency pertanyaan-pertanyaan yang termasuk dalam suatu alat ukur (Hagul, 1988: 95). Proses pengujian reliabilitas dalam metode ini hampir sama dengan metode paralel, di mana suatu instrumen yang dibagi akan menghasilkan dua instrumen. Kelemahan metode ini adalah koefisien korelasi dan indeks reliabilitasnya cendrung fluktuatif, tergantung pada cara pengelompokan pertanyaan-pertanyaan.

Selanjutnya, Rakhmat (2004: 17-18) menyebutkan bahwa ada tiga cara untuk menentukan reliabilitas: antaruji, antarbutir, dan antarpenilai. Cara pertama untuk menguji reliabilitas ialah membandingkan beberapa hasil pengukuran dari populasi yang sama pada waktu yang berbeda atau oleh peneliti yang berlainan. Perbandingan ini dihitung untuk mencari angka korelasinya. Cara kedua ialah alat ukur yang terdiri dari sejumlah butir tes dibagi dua. Ini disebut split half procedure. Skor responden pada kelompok butir tes yang pertama dikorelasikan dengan kelompok tes butir kedua. Atau skor responden pada butir-butir tes bernomor ganjil dikorelasikan dengan kelompok butir tes bernomor genap. Cara ketiga, responden yang sama diukur, diuji, dan diamati oleh beberapa orang penguji. Skor yang diberikan oleh setiap penguji kemudian dikorelasikan. Reliabilitas antarpenilai biasanya dinyatakan dengan angka kesepakatan di antara penilai.

F. Macam-macam Validitas

Validitas banyak macamnya. Menurut Ebel (1972: 436-437), validitas dibagi menjadi tujuh macam:

1. Concurrent validity yaitu validitas yang berkenaan dengan hubungan antara skor dengan kriteria penampilan (performance).

2. Construct validity yaitu validitas yang berkenaan dengan sejauh mana suatu alat ukur mengukur konstruk teoretis tertentu, seperti suatu keadaan yang diduga mempunyai hubungan sebab akibat.

3. Content validity validitas yang berkaitan dengan baik buruknya sampling dari suatu populasi.

4. Face validity yaitu validitas yang berhubungan dengan penilaian para ahli terhadap suatu alat ukur.

5. Factorial validity yaitu validitas suatu alat ukur merupakan korelasi antara alat ukur tersebut dengan faktor-faktor yang sama dalam kelompok atau ukuran-ukuran perilaku lainnya; dan validitas tersebut didasarkan atas analisis faktor.

6. Intrinsic validity yaitu validitas yang berkaitan dengan penggunaan teknik percobaan dan bukan teknik korelasi terhadap suatu kriteria untuk memperoleh bukti kuantitatif dan objektif yang mendukung bahwa alat ukur tersebut benar-benar mengukur apa yang sebenarnya harus diukur.

7. Predictive validity yaitu validitas peramalan yang berkenaan dengan hubungan antara skor ujian dengan hasil atau kemungkinan di masa mendatang.

Thorndike dan Hagen (1955: 100-110) membagi validitas atas dua macam saja, yaitu: validitas langsung dan validitas derivatif. Validitas langsung adalah jenis validitas yang bergantung pada analisis rasional dan putusan profesi (professional judgment); sedangkan validitas derivatif bergantung pada pembuktian statistik dan empiris.

Sementara itu, Kerlinger (1973: 456-466) membagi validitas atas tiga jenis, yakni: validitas isi (content validity), validitas yang berhubungan dengan kriteria (criterion related validity), dan validitas konstruk (construct validity).

1. Validitas Isi

Validitas isi mempersoalkan apakah isi dari suatu alat ukur (bahannya, topiknya, substansinya) cukup representatif atau cukup merupakan sebuah sampling? Validitas isi dipandu oleh pertanyaan: Apakah isi atau substansi suatu alat ukur merupakan representatif dari isi atau substansi universal dari sifat-sifat yang ingin diukur? Validitas isi adalah “derajat tes yang menggambarkan esensi, topik-topik, dan ruang lingkup tes yang dirancang untuk pengukuran” (Sevilla, et. al., 1993: 179).

2. Validitas yang Berhubungan dengan Kriteria

Validitas yang berhubungan dengan kriteria adalah suatu kriteria atau variabel yang diketahui atau dipercaya dapat digunakan untuk mengukur suatu atribut tertentu. Jika skor atau skala yang diukur dibandingkan dengan satu atau lebih kriteria atau variabel yang dianggap mengukur hal yang ingin diukur, maka yang dikerjakan adalah menetapkan validitas alat ukur. Validitas perdiktif termasuk dalam validitas yang berhubungan dengan kriteria. Jadi, sebuah alat ukur dapat dikatakan mempunyai validitas yang berhubungan dengan kriteria yang tinggi, jika alat ukur tersebut dapat menolong peneliti dalam membuat keputusan yang tepat dalam menempatkan seseorang, baik dalam pekerjaan maupun tugas tertentu.

3. Validitas Konstruk

Validitas konstruk disebut juga validitas konsep. Kerlinger (1973) menekankan bahwa “validitas konstruk menitiberatkan perhatian pada teori, konstruk-konstruk teoretis dan penemuan empiris ilmiah yang meliputi pengujian hubungan yang dihipotesiskan.” Dalam membahas validitas konstruk, seperti intelegensia, status ekonomi, fertilitas, persepsi, pendidikan tradisional, dan sebagainya, maka yang pertama-tama dikerjakan oleh seorang peneliti adalah menganalisis unsur-unsur apa yang menjadi bagian dari konstruk tersebut.

Selanjutnya, G. Sevilla, et. al (1993: 184), menambah satu macam validitas lagi, yaitu face validity (validitas paras). Validitas paras adalah tipe validitas yang berhubungan dengan keabsahan corak/wajah/paras tes yang jika dipandang dari instrumen tampaknya dapat mengukur apa yang hendak diukur. Soal-soal tes diperiksa dan kemudian secara superfisial dinilai keabsahannya untuk mengukur variable yang akan diukur. Karena itu, suatu instrumen yang hanya menunjukkan validitas paras ini saja, lebih kurangnya terbuka untuk dikritik. Secara umum tipe validitas ini tidak didukung oleh bukti-bukti bahwa tes tersebut dapat mengukur sesuatu. Tanpa validasi isi, instrumen semacam ini tidak dapat digunakan khususnya dalam penelitian tingkat pascasarjana. (Sevilla, et. al., 1993: 184).

Nazir (1999: 179) menjelaskan bahwa ada dua pengertian tentang validitas paras (muka): pertama, validitas muka berhubungan dengan pengukuran atribut yang konkret tanpa memerlukan inferensi. Misalnya, untuk mengetahui kemahiran mengetik seseorang, maka suruhlah dia mengetik dan hitung jumlah huruf atau kalimat yang dapat diselesaikan permenit. Kedua, validitas yang berkaitan dengan penilaian para ahli terhadap suatu alat ukur. Misalnya, jika seorang peneliti ingin menyusun skala tentang persepsi, maka skala tersebut diperlihatkan kepada beberapa ahli. Apabila ahli-ahli ini sepakat bahwa skala tersebut dapat mengukur persepsi secara baik, maka skala itu mempunyai validitas muka yang tinggi.

Ada beberapa cara yang dapat ditempuh untuk meningkatkan validitas paras suatu instrumen:

1. Pemanfaatan Soal

Naskah awal dari instrumen diperiksa oleh suatu kelompok evaluator, misalnya pembimbing tesis, ahli pembuat tes, dan para tenaga profesional yang berpengalaman dalam bidangnya.

2. Konsistensi Antarpenilai

Naskah awal yang telah diperiksa oleh para ahli tersebut diberi tanda, mana yang layak dan tidak layak. Kemudian, dipilah dan diseleksi mana yang paling cocok untuk dijadikan alat ukur atau instrumen. Tentu saja, layak atau tidak layaknya instrumen tersebut dilihat dari hasil penilaian para ahli secara konsisten dan objektif.

Selanjutnya, validitas dalam kaitannya dengan pengujian (testing) dan penilaian (assessment), Linn dan Gronlund (1985: 49) menegaskan ada sejumlah pertimbangan yang perlu diperhatikan: pertama, validitas mengacu kepada ketepatan interpretasi hasil dari suatu prosedur penilaian terhadap sekelompok individu; bukan kepada prosedur itu sendiri. Kedua, validitas memiliki perihal derajat tertentu dengan kategori-kategori: validitas tinggi (high validity), validitas sedang (moderate validity), dan validitas rendah (low validity). Ketiga, validitas senantiasa mengacu kepada kegunaan atau interpretasi yang spesifik; tidak ada penilaian yang valid untuk semua kegunaan. Keempat, validitas adalah kesatuan konsep yang didasarkan atas berbagai macam bukti yang muncul. Kelima, validitas merupakan sistem evaluasi secara terpadu dan menyeluruh (overall evaluative judgement). Di samping itu, Linn dan Gronlund menyarankan agar dalam membuat interpretasi dan menggunakan hasil penilaian memperhatikan pertimbangan-pertimbangan mendasar, seperti isi (content), hubungan-hubungan kriteria tes (test-criterion relationships), construct yaitu faktor-faktor yang mempengaruhi hasil atau prestasi (performance). dan konsekuensi atau akibat yang bakal terjadi (consequence).

G. Pengujian Validitas

Untuk menguji tingkat validitas empiris instrumen, maka instrumen tersebut dujicobakan pada sasaran dalam penelitian. Langkah ini lazim disebut dengan kegiatan uji coba (try-out) instrumen. Apabila data yang didapat dari uji coba ini sudah sesuai dengan yang seharusnya, maka berarti bahwa instrumennya sudah baik dan valid. Untuk mengetahui ketepatan data ini diperlukan teknik uji validitas.

Dilihat dari cara pengujiannya, validitas instrumen dapat dibagi dua: pertama, validitas eksternal; dan kedua, validitas internal.

1. Validitas Eksternal

Validitas eksternal dapat dicapai jika data yang dihasilkan dari instrumen sesuai dengan data atau informasi mengenai variabel penelitian yang dimaksud. Misalnya, validitas tes hasil belajar IPS dapat dilakukan dengan mencobakan tes tersebut kepada siswa yang diambil sebagai subjek uji coba. Hasil yang diperoleh kemudian dikorelasikan dengan nilai IPS siswa tersebut, misalnya diambil dari nilai tes sumatif atau nilai rapor. Nilai rapor ini dijadikan sebagai ukuran atau kriterium.

2. Validitas Internal

Dikatakan validitas internal jika terdapat kesesuaian antara bagian-bagian instrumen dengan instrumen secara keseluruhan. Dengan kata lain, sebuah instrumen dikatakan memiliki validitas internal apabila setiap bagian instrumen mendukung “misi” instrumen secara keseluruhan yaitu mengungkap data dari variabel yang dimaksud. Dalam kaitan ini dikenal adanya validitas butir dan validitas faktor.

a. Sebuah instrumen memiliki validitas yang tinggi apabila butir-butir yang membentuk instrumen tersebut tidak menyimpang dari fungsi instrumen.

b. Sebuah instrumen dikatakan memiliki validitas yang tinggi apabila faktor-faktor yang merupakan bagian instrumen tersebut tidak menyimpang dari fungsi instrumen (Arikunto, 2002: 147-148).

Secara singkat dapat dikatakan bahwa pengujian validitas sebuah instrumen dapat dilakukan dengan dua cara: pertama, melakukan analisis faktor (anafak); dan kedua, melakukan analisis butir (anabut).

H. Penutup

Dari pembahasan di atas tampak jelas bahwa reliabilitas dan validitas suatu instrumen dalam pengumpulan data sangat signifikan. Suatu data tidak akan berarti tanpa menggunakan instrumen yang tepat dan konsisten. Demikian juga sebuah penelitian tidak akan bernilai jika tidak menggunakan instrumen yang handal, teruji, dan terpercaya.

Pemenuhan syarat validitas dan reliabilitas biasanya diawali dengan pengujicobaan instrumen, jika instrumennya dibuat sendiri oleh peneliti. Alangkah baiknya jika instrumen yang dipakai sudah teruji validitas dan reliabilitasnya oleh para peneliti sebelumnya sehingga menjadi instrumen baku dan dapat dipergunakan oleh siapa saja dan kapa saja. Karakteristik instrumen yang baik sebagai alat evaluasi hendaklah memenuhi persyaratan validitas dan reliabilitas. Dengan demikian, alat evaluasi yang baik dapat dilihat dari: validitas, reliabilitas, objektivitas, praktikabilitas, daya pembeda, derajat kesukaran, efektivitas opsi, dan efisiensi. ■

PENCERAHAN INTELEKTUAL

Kamis, 30 September 2010

VALIDITAS DATA