Wednesday, 12 March 2014
Validitas dan Reliabilitas
A. Validitas Tes Hasil Belajar
1.
Pengertian Validitas
Validitas merupakan derajat kemampuan suatu tes yang
mengukur apa yang hendak diukur. Secara tidak langsung itu meliputi tes dan skala yang
terdiri atas sejumlah tugas yang dipilih untuk berfungsi sebagai indikator
hasil belajar.
Validitas berkenaan dengan ketetapan alat penilaian
terhadap konsep yang dinilai sehingga betul-betul menilai apa yang yang
seharusnya dinilai. Sebagai contoh menilai kemampuan siswa dalam matematika.
Misalnya diberikan soal dengan kalimat yang panjang dan berbelit-belit sehingga
sukar ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karena tidak
memahami pertanyaannya. Validitas tidak berlaku universal sebab bergantung pada
situasi dan tujuan penilaian. Alat penilaian yang telah valid untuk suatu
tujuan tertentu belum otomatis akan valid untuk tujuan yang lain.
Dalam menggunakan
validitas suatu tes, ada beberapa hal yang perlu diperhatikan, yaitu :
a.
Mengacu pada materi yang hendak diujikan.
b.
Mengacu pada hasil dari suatu tes atau instrument
evaluasi yang dikenakan pada sekelompok individu.
c.
Berkaitan dengan derajar dengan istilah validasi
tinggi, sedang, rendah.
d.
Mengacu pada penggunaan hasil evaluasi.
2. Teknik-Teknik Validasi Tes
a. Validitas Tes Acuan Normatif
1) Validitas Isi
Merupakan derajad dimana suatu tes mengukur
bidang-bidang isi pelajaran yang hendak diukur. Hal ini sangat penting bagi tes
hasil belajar. Validitas isi mempersyaratkan adanya validitas butir soal dan
sampel isi pelajaran. Esensi validitas isi berkaitan dengan sampel. Dan menjadi
penting apabila ingin menggambarkan kinerja siswa terhadap suatu ranah tugas
tertentu.
Validitas
isi ditentukan oleh penilaian (judgement) para pakar. Tidak ada rumus untuk
menghitungnya dan tidak ada cara untuk mengungkapnya secara kuantitatif. Para
pakar mengkaji seluruh butir soal dan membuat penilaian tentang seberapa baik
butir soal itu mencerminkan bidang yang diujikan.
2) Validitas Konstruk
Merupakan derajat dimana suatu tes mampu mengukur
konstruk hipotetik yang hendak diukur. Tahapan validitas konstruk yaitu
mengidentifikasi konstruk yang diperkirakan untuk menghitung kinerja tes,
menarik hipotesis berkenaan dengan kinerja tes dari teori masing-masing
konstruk, menguji hipotesis berdasarkan logika dan data empirik.
3) Validitas Kongkaren
Merupakan derajat dimana skor suatu tes berkaitan
dengan skor tes lainnya, yakni tes yang telah sahih kemudian diujikan pada
waktu yang bersamaan dengan tes yang baru dibuat.
4) Validitas Peramalan
Merupakan derajat dimana suatu tes dapat meramalkan
seberapa baik siswa akan melaksanakan tugas di dalam situasi mendatang.
Validitas peramalan ditentukan dengan cara merumuskan hubungan antara skor tes
dengan ukuran keberhasilan pada situasi yang diinginkan.
b. Validitas Tes Acuan Patokan
Tujuan utama TAP untuk mengukur hasil belajar pada satu tujuan pembelajaran
atau lebih, sehingga validitas isi akan menjadi perhatian utama di dalam
menentukan reliabilitasnya.
1) Validitas Isi
Validitas isi pada TAP berkaitan dengan derajat
kemampuan tes mengukur pencapaian tujuan pembelajaran. Seperti halnya dengan
TAN, pada TAP juga berkaitan dengan validitas butir soal dan validitas sampel
tujuan pembelajaran. Validitas isi juga disebur sebagai validitas deskriptif.
2) Validitas Peramalan
Validitas peramalan pada TAP mempertanyakan kemampuan
tes meramalkan kinerja siswa di masa depan. Validitas ini juga disebut sebagai
validitas fungsional. Dengan demikian salah satu fungsi tes adalah untuk
membuat peramalan di masa depan. Apabila tes itu baik, maka dapat dikatakan bahwa
tes tersebut memiliki validitas fungsional.
3. Uji Validitas
a.
Validitas eksternal
Merupakan teknik validitas yang mengkorelasikan antara
skor hasil pengukuran baru dengan skor hasil pengukuran lain yang memiliki
tujuan sama.
b.
Validitas Internal
Merupakan teknik validitas yang berusaha ingin
mengetahui kesesuaian antara satu butir dengan keseluruhan butir. Dua teknik
yang digunakan yaitu analisis bagian atau faktor dan analisis butir.
4. Faktor Yang Mempengaruhi Validitas
a. Ketidakjelasan petunjuk tes.
b. Kesulitan siswa dalam memahami padanan kata dan struktur kalimat.
c. Tingkat kesulitan butir soal.
d. Pembuatan butir soal.
e. Kedwimukaan (ambiguity).
f. Butir soal kurang baik.
g. Butir soal terlalu pendek.
h. Penyusunan butir soal dalam tes.
i.
Pola-pola jawaban.
B. Reliabilitas Tes
1. Pengertian
Reliabilitas adalah indeks yang menunjukan sejauh mana suatu alat ukur dipercaya
atau dapat diandalkan. Reliabilitas mengacu pada keajegan hasil evaluasi, yakni
konsistensi skor tes (test score) dari masa ke masa.jika seorang guru memperoleh
skor yang sama pada tes yang sama pada kelompok siswa yang sama pada waktu yang
berbeda, maka dia dapat menyimpulkan bahwa hasil tes itu memiliki derajat
reliabilitas tes yang tinggi dari suatu masa ke masa.konsistensi hasil evaluasi itu
menjadi sangat berharga. Jika didasarkan pada data yang valid dan ditetapkan secara
objektif.Suatu hasil evaluasi pada umumnya tidak pernah mencapai konsistensi
secara sempurna. Beberapa jenis pengukuran tentu memiliki berbagai jenis
kesalahan ada beberapa factor berkaitan dengan karakteristik yang bersifat
temporer atau permanen. Sumber lain berkaitan dengan karakteristik tes itu atau
cara melaksanakan ujian, penskoran dan penafsiran hasil ujian.
Makna reliabilitas dapat diklarifikasikan dengan memperhatikan
hal- hal berikut :
a.
Reliabilitas mengacu pada hassil yang diperoleh.
b.
Estimasi reliabilitas biasanya mengacu pada jenis
konsistensi tertentu.
c.
Reliabilitas adalah penting, namun
bukan menjadi prasyarat bagi validitas.
d.
Reliabilitas selalu menggunakan statistic.
2. Teknik-teknik reliabilitas
Penghitungan reliabilitas untuk tes
acuan normative setidak-tidaknya lebih mudah dibandingkan dengan pernghitungan validitas. Ada banyak jenis
reliabilitas yang berbeda-beda, masing-masing ditentukan dengan cara-cara yang bebeda
dan masing-masing menjelaskan jenis konsistensi yang berbeda . Teknik
reliabilitas tes ulang, bentuk setara, dan belah dua semua
nya ditentukan melalui korelasi.
a. Teknik Reliabilitas Untuk Tes Acuan Normatif
Skor tes dapat
menjadi reliable atau konsisten secara berbeda.skor itu dapat
dikatagorisasikan sesuaikan dengan apakak sekor-sekor itu diperoleh dari
satu tes yang diujikan sekali, dua kali, ataukah dua tes diujukan dalam
satu waktu sekali.rliabelitas ini dapat diestimasikan dengan menggunakan teknik
korelasi, dan diungkap dengan angka decimal antara 0,00 sampai dengan
1,00
1)
Reliabilitas tes ulang
(test-retest reliability)
Teknik reliabilitas tes ulang adalah
derajat dimana skor tes tetap konsisten sepanjang masa. Ia menunjukan sebaran
skor yang terjadi dari bebrapa kegiatan ujian sebagai hasil dari kesalahan
pengukuran.
2)
Reliabilitas bentuk
setara (Equivalent-form Reliability)
Teknik reliabilitas setara adalah dua tes
yang identik kecuali untuk soal-soal aktual. Dua bentuk tes itu mengukur bidang
isi pelajaran yang sama, jumlah soal sama, struktur soal sama, tingkat
kesulitan sama, dan petunjukn ujian, penskoran dan penafsiran sama.
3)
Reliabilitas Belah
Dua (Spil-Half Reliabiliy)
Reliabilitas belah dua merupakan jenis
reliabilitas yang didasarkan pada konsistensi internal dari suatu tes. Karena
prosedur reliabilitas belah dua hanya memerlukan satu kali ujian, maka sumber
kesalahan pengukuran dapat dikurangi, seperti perbedaan situasi dan kondisi
ujian, yang dapat terjadi pada perhitungan reliabilitas tes ulang.
4)
Reliabilitas kesetaraan
nasional (Retional Equivalence
Reliability)
Reliabilitas kesataraan nasional tidak
dihitung melalui korelasi, namun melalui penetapan hubungan antara satu butir
soal dengan seluruh butir lainnya dan total butir soal dalam tes.
b. Reliabilitas Tes Acuan Patokan
Reliabilitas tes acuan patokan mengacu
pada konsistensi tes mengukur apa yang diukur. Perhatian tes acuan patokan
adalah asesmen derajat stabilitas atau kesetaraan, yakni reliabilitas bentuk
tes ulamg dan kesetaraan.
1)
Tes acuan patokan non-materi
Walaupun secara teoritik variabilitas skor
yang dicapai siswa tidak ada dalam tes acuan patokan, namun demikian
variabilitas itu tetap ada. Oleh karena itu apabila tes acuan patokan itu
diterapkan dan tingkat kinerja setiap siswa dicatat, maka hampir selalu terjadi
variabilitas skor. Derajat variabilitas itu akan bervariasi dari kelompok ke
kelompok dan dari tes ke tes lainnya.
Apabila terdapat variabilitas skor, maka
dapat digunakan pengukuran tradisional untuk menghitung reliabilitas.
Pendekatan yang digunakan untuk menghitung koefisien reliabilitas pada tes
acuan patokan hingga sekarang ini belum ada yang diterima oleh semua pihak.
2)
Tes acuan patokan materi
Livingston telah mengusulkan pendekatan
untuk membuat estimasi reliabilitas tes acuan patokan. Rumus yang digunakan
pada dasarnya adalah generalisasi dari teori reliabilitas klasik. Rumus yang
digunakan itu menghitung reliabilitas tes acuan patokan dengan cara
pertama-tama menghitung reliabilitas tradisional, seperti pada acuan tes
normatif, kemudian menyesuaikan berdasrkan pada kriteria skor tes acuan
patokan. Rumus yang digunakan hanya cocok untuk jenis tes materi.
3. Faktor –faktor Yang Mempengaruhi Reliabilitas
Banyak faktor mempengaruhi reliabilitas, beberapa faktor dberkaitan dengan tes itu
sendiri, siswa yang mengikuti ujian,lingkungan dimana ujian itu
diselenggarakan, administrassi tes dan prossedur pensekoran. Faktor-faktor
tersebut akan dapat digunakan sebagai bahan untuk memperbaiki proseddur pengembangan
tes, pemakain tes, dan analisis informasi tes.
Pertimabngan
tentang faktor-faktor yang mempengaruhi realiabilitas tes ini buakn saja membantu
guru dalam menasirkan kofisien reliabilitass tes standar searalebih baik, melainkan
juga membantu kita didalam merumuskan tes yang lebih reliable. Beberapa faktor yang dimaksud secara
ringkas dijelaskan sebagai berikut:
a. Panjang Tes (length of test)
Kemunginan cara
paling rasional untuk meningkatkan reliabilitas adalah menambah jumlah butiran soal.penambahan butiran soal akan memperbaiki
sampel ranah perilaku yang diujikan, perbaikan sampel ranah perilaku itu akan
menghasilkan validitas lebih tinggi dan mengurangi faktor kebetulan seperti tekanan.
Walaupun sampel
perilaku itu banyak dan dapat menjaddikan butir soal semakn banyak
pula,namun perlu diperhatiakan adalah butiran soal itu jangan
terlalau banyak sehinnga waktu yang disediakan untuk ujian tidak cukup untuk siswa yang mengerjakannya. Pendeknya, semakin banyak butir soal
yang ada pada suatu tes maka semakin baik sampel perilaku yang diukur
didalam tes tersebut.
b. Sebaran skor (spread of scores)
Metode korelasi
untuk mmengestimasi reliabilitas memerlukan sebaran sekor. Jika sebaran sekor
itu sempit, maka koefisien reliabilitas akan menjadi randah.begitu
pula jika sebaran skor itu luas, maka koefisien reliabiltas akan menjadi
tinggi.
Sebaran skor yang
diperoleh siswa pada suatu tes adalah tergantung pada tingkat kesulitan
butir soal yang disajikan dan kemampuan siswa dalam mengerjakan soal.
c. Keobjektivan skor (score objectivity)
Tes objektif
merupakan tes yang mampu mengurangi subjektivitas penskoran, artinya:
setiap orang yang menskor hassil tes akan menemukan skor yang sama pada siswa
yang sama. Untuk meningkatkan objektivitas, proses pensekoran harus dilakuakan seobjektif mungkin
dan mengurangi pengaruh guru dalam menskor hassil ujian siswa.
4. Aspek-aspek Reliabilitas
5. Teori Reliabilitas Nominal (Metode Kuder-Richardson /KR-20)
6. Teori Reliabilitas Ordinal (Metode alfa cronbach)
dimana :
k: adalah banyaknya belahan item
Si2: adalah varians dari item ke-i
S2: total adalah total varians dari keseluruhan item
Bila koefisien reliabilitas telah dihitung, maka untuk menentukan keeratan hubungan bisa digunakan kriteria Guilford (1956), yaitu :
1. kurang dari 0,20 : Hubungan yang sangat kecil dan bisa diabaikan
2. 0,20 - < 0,40 : Hubungan yang kecil (tidak erat)
3. 0,40 - < 0,70 : Hubungan yang cukup erat
4. 0,70 - < 0,90 : Hubungan yang erat (reliabel)
5. 0,90 - < 1,00 : Hubungan yang sangat erat (sangat reliabel)
6. 1,00 : Hubungan yang sempurna
4. Aspek-aspek Reliabilitas
a. Keekuivalenan (inter-rater
reliabilitas)
Sejak
awal peneliti harus sudah menyusun dua perangkat instrument yang parallel
(ekuivalen), yaitu dua buah instrument yang disusun berdasarkan satu buah
kisi-kisi. Setiap butir soal dari instrument yang satu selalu harus dapat
dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut
diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen
tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi
Pearson).
b. Stabilitas (test-retest)
Menggunakan
sebuah instrument, namun dites dua kali. Hasil atau skor pertama dan kedua
kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas.Teknik
perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu
rumus korelasi Pearson.
Menurut
Saifuddin Azwar, realibilitas tes-retest adalah seberapa besat derajat skor tes
konsisten dari waktu ke waktu. Realibilitas diukur dengan menentukan hubungan
antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu
yang berbeda.
Metode pengujian reliabilitas
stabilitas yang paling umum dipakai adalah metode pengujian tes-kembali
(test-retest). Metode test-retest menggunakan ukuran atau “test” yang sama
untuk variable tertentu pada satu saat pengukuran yang diulang lagi pada saat
yang lain. Cara lain untuk menunjukkan reliabilitas stabilitas, bila kita
menggunakan survai, adalah memasukkan pertanyaan yang sama di dua bagian yang
berbeda dari kuesioner atau wawancara. Misalnya the Minnesota Multiphasic
Personality Inventory (MPPI) mengecek reliabilitas test-retest dalam satu
kuesionernya dengan mengulang pertanyaan tertentu di bagian-bagian yang berbeda
dari kuesioner yang panjang.
Kesulitan terbesar untuk menunjukkan
reliabilitas stabilitas adalah membuat asumsi bahwa sifat/ variable yang akan
diukur memang benar-benar bersifat stabil sepanjang waktu. Karena kemungkinan
besar tidak ada ukuran yang andal dan sahih yang tersedia. Satu-satunya faktor
yang dapat membuat asumsi-asumsi ini adalah pengalaman, teori dan/atau putusdan
terbaik. Dalam setiap kejadian, asumsi ini selalu ditantang dan sulit rasanya
mempertahankan asumsi tersebut atas dasar pijakan yang obyektif.
c. Kekonsistenan secara internal
(metode belah dua)
Peneliti
boleh hanya memiliki seperangkat instrument saja dan hanya diujicobakan satu
kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh
instrument menjadi dua sama besar. Cara yang diambil untuk membelah soal bisa
dengan membelah atas dasar nomor ganjil-genap, atas dasar nomor awal-akhir, dan
dengan cara undian.
Menurut
Saifuddin Azwar, realibilitas ini diukur dengan menentukan hubungan antara skor
dua paruh yang ekuivalen suatu tes, yang disajikan kepada seluruh kelompok pada
suatu saat. Karena reliabilitas belah dua mewakili reliabilitas hanya separuh
tes yang sebenarnya, rumus Spearman-Brown dapat digunakan untuk mengoreksi
koefisien yang didapat.
Koefisien Reliabilitas Kuder-Richardson (KR-20)
dapat dihitung dengan menggunakan rumus sebagai berikut :
dimana :
n =
jumlah item
S2 = Varians total
p = Proporsi dari orang
yang menjawab benar pada item ke-i.
1- p = Proporsi dari
orang yang menjawab salah pada item = q
Bila koefisien reliabilitas telah dihitung, maka untuk menentukan keeratan hubungan bisa digunakan kriteria Guilford (1956), yaitu :
1. kurang dari 0,20 : Hubungan yang sangat kecil dan bisa diabaikan
2. 0,20 - < 0,40 : Hubungan yang kecil (tidak erat)
3. 0,40 - < 0,70 : Hubungan yang cukup erat
4. 0,70 - < 0,90 : Hubungan yang erat (reliabel)
5. 0,90 - < 1,00 : Hubungan yang sangat erat (sangat reliabel)
6. 1,00 : Hubungan yang sempurna
Bila koefisien reliabilitas telah dihitung, maka untuk menentukan keeratan hubungan bisa digunakan kriteria Guilford (1956), yaitu :
1. kurang dari 0,20 : Hubungan yang sangat kecil dan bisa diabaikan
2. 0,20 - < 0,40 : Hubungan yang kecil (tidak erat)
3. 0,40 - < 0,70 : Hubungan yang cukup erat
4. 0,70 - < 0,90 : Hubungan yang erat (reliabel)
5. 0,90 - < 1,00 : Hubungan yang sangat erat (sangat reliabel)
6. 1,00 : Hubungan yang sempurna
6. Teori Reliabilitas Ordinal (Metode alfa cronbach)
Teknik perhitungan koefisien reliabilitas yang
digunakan disini adalah dengan menggunakan Koefisien Reliabilitas Alpha yang
dihitung dengan menggunakan rumus sebagai berikut :
dimana :
k: adalah banyaknya belahan item
Si2: adalah varians dari item ke-i
S2: total adalah total varians dari keseluruhan item
Bila koefisien reliabilitas telah dihitung, maka untuk menentukan keeratan hubungan bisa digunakan kriteria Guilford (1956), yaitu :
1. kurang dari 0,20 : Hubungan yang sangat kecil dan bisa diabaikan
2. 0,20 - < 0,40 : Hubungan yang kecil (tidak erat)
3. 0,40 - < 0,70 : Hubungan yang cukup erat
4. 0,70 - < 0,90 : Hubungan yang erat (reliabel)
5. 0,90 - < 1,00 : Hubungan yang sangat erat (sangat reliabel)
6. 1,00 : Hubungan yang sempurna
Subscribe to:
Post Comments (Atom)
0 komentar:
Post a Comment