Validitas dan Reliabilitas

A. Validitas Tes Hasil Belajar

1. Pengertian Validitas

Validitas merupakan derajat kemampuan suatu tes yang mengukur apa yang hendak diukur. Secara tidak langsung itu meliputi tes dan skala yang terdiri atas sejumlah tugas yang dipilih untuk berfungsi sebagai indikator hasil belajar.

Validitas berkenaan dengan ketetapan alat penilaian terhadap konsep yang dinilai sehingga betul-betul menilai apa yang yang seharusnya dinilai. Sebagai contoh menilai kemampuan siswa dalam matematika. Misalnya diberikan soal dengan kalimat yang panjang dan berbelit-belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karena tidak memahami pertanyaannya. Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan penilaian. Alat penilaian yang telah valid untuk suatu tujuan tertentu belum otomatis akan valid untuk tujuan yang lain.

Dalam menggunakan validitas suatu tes, ada beberapa hal yang perlu diperhatikan, yaitu :

a. Mengacu pada materi yang hendak diujikan.

b. Mengacu pada hasil dari suatu tes atau instrument evaluasi yang dikenakan pada sekelompok individu.

c. Berkaitan dengan derajar dengan istilah validasi tinggi, sedang, rendah.

d. Mengacu pada penggunaan hasil evaluasi.

2. Teknik-Teknik Validasi Tes

a. Validitas Tes Acuan Normatif

1) Validitas Isi

Merupakan derajad dimana suatu tes mengukur bidang-bidang isi pelajaran yang hendak diukur. Hal ini sangat penting bagi tes hasil belajar. Validitas isi mempersyaratkan adanya validitas butir soal dan sampel isi pelajaran. Esensi validitas isi berkaitan dengan sampel. Dan menjadi penting apabila ingin menggambarkan kinerja siswa terhadap suatu ranah tugas tertentu.

Validitas isi ditentukan oleh penilaian (judgement) para pakar. Tidak ada rumus untuk menghitungnya dan tidak ada cara untuk mengungkapnya secara kuantitatif. Para pakar mengkaji seluruh butir soal dan membuat penilaian tentang seberapa baik butir soal itu mencerminkan bidang yang diujikan.

2) Validitas Konstruk

Merupakan derajat dimana suatu tes mampu mengukur konstruk hipotetik yang hendak diukur. Tahapan validitas konstruk yaitu mengidentifikasi konstruk yang diperkirakan untuk menghitung kinerja tes, menarik hipotesis berkenaan dengan kinerja tes dari teori masing-masing konstruk, menguji hipotesis berdasarkan logika dan data empirik.

3) Validitas Kongkaren

Merupakan derajat dimana skor suatu tes berkaitan dengan skor tes lainnya, yakni tes yang telah sahih kemudian diujikan pada waktu yang bersamaan dengan tes yang baru dibuat.

4) Validitas Peramalan

Merupakan derajat dimana suatu tes dapat meramalkan seberapa baik siswa akan melaksanakan tugas di dalam situasi mendatang. Validitas peramalan ditentukan dengan cara merumuskan hubungan antara skor tes dengan ukuran keberhasilan pada situasi yang diinginkan.

b. Validitas Tes Acuan Patokan

Tujuan utama TAP untuk mengukur hasil belajar pada satu tujuan pembelajaran atau lebih, sehingga validitas isi akan menjadi perhatian utama di dalam menentukan reliabilitasnya.

1) Validitas Isi

Validitas isi pada TAP berkaitan dengan derajat kemampuan tes mengukur pencapaian tujuan pembelajaran. Seperti halnya dengan TAN, pada TAP juga berkaitan dengan validitas butir soal dan validitas sampel tujuan pembelajaran. Validitas isi juga disebur sebagai validitas deskriptif.

2) Validitas Peramalan

Validitas peramalan pada TAP mempertanyakan kemampuan tes meramalkan kinerja siswa di masa depan. Validitas ini juga disebut sebagai validitas fungsional. Dengan demikian salah satu fungsi tes adalah untuk membuat peramalan di masa depan. Apabila tes itu baik, maka dapat dikatakan bahwa tes tersebut memiliki validitas fungsional.

3. Uji Validitas

a. Validitas eksternal

Merupakan teknik validitas yang mengkorelasikan antara skor hasil pengukuran baru dengan skor hasil pengukuran lain yang memiliki tujuan sama.

b. Validitas Internal

Merupakan teknik validitas yang berusaha ingin mengetahui kesesuaian antara satu butir dengan keseluruhan butir. Dua teknik yang digunakan yaitu analisis bagian atau faktor dan analisis butir.

4. Faktor Yang Mempengaruhi Validitas

a. Ketidakjelasan petunjuk tes.

b. Kesulitan siswa dalam memahami padanan kata dan struktur kalimat.

c. Tingkat kesulitan butir soal.

d. Pembuatan butir soal.

e. Kedwimukaan (ambiguity).

f. Butir soal kurang baik.

g. Butir soal terlalu pendek.

h. Penyusunan butir soal dalam tes.

i. Pola-pola jawaban.

B. Reliabilitas Tes

1. Pengertian

Reliabilitas adalah indeks yang menunjukan sejauh mana suatu alat ukur dipercaya atau dapat diandalkan. Reliabilitas mengacu pada keajegan hasil evaluasi, yakni konsistensi skor tes (test score) dari masa ke masa.jika seorang guru memperoleh skor yang sama pada tes yang sama pada kelompok siswa yang sama pada waktu yang berbeda, maka dia dapat menyimpulkan bahwa hasil tes itu memiliki derajat reliabilitas tes yang tinggi dari suatu masa ke masa.konsistensi hasil evaluasi itu menjadi sangat berharga. Jika didasarkan pada data yang valid dan ditetapkan secara objektif.Suatu hasil evaluasi pada umumnya tidak pernah mencapai konsistensi secara sempurna. Beberapa jenis pengukuran tentu memiliki berbagai jenis kesalahan ada beberapa factor berkaitan dengan karakteristik yang bersifat temporer atau permanen. Sumber lain berkaitan dengan karakteristik tes itu atau cara melaksanakan ujian, penskoran dan penafsiran hasil ujian.

Makna reliabilitas dapat diklarifikasikan dengan memperhatikan hal- hal berikut :

a. Reliabilitas mengacu pada hassil yang diperoleh.

b. Estimasi reliabilitas biasanya mengacu pada jenis konsistensi tertentu.

c. Reliabilitas adalah penting, namun bukan menjadi prasyarat bagi validitas.

d. Reliabilitas selalu menggunakan statistic.

2. Teknik-teknik reliabilitas

Penghitungan reliabilitas untuk tes acuan normative setidak-tidaknya lebih mudah dibandingkan dengan pernghitungan validitas. Ada banyak jenis reliabilitas yang berbeda-beda, masing-masing ditentukan dengan cara-cara yang bebeda dan masing-masing menjelaskan jenis konsistensi yang berbeda . Teknik reliabilitas tes ulang, bentuk setara, dan belah dua semua nya ditentukan melalui korelasi.

a. Teknik Reliabilitas Untuk Tes Acuan Normatif

Skor tes dapat menjadi reliable atau konsisten secara berbeda.skor itu dapat dikatagorisasikan sesuaikan dengan apakak sekor-sekor itu diperoleh dari satu tes yang diujikan sekali, dua kali, ataukah dua tes diujukan dalam satu waktu sekali.rliabelitas ini dapat diestimasikan dengan menggunakan teknik korelasi, dan diungkap dengan angka decimal antara 0,00 sampai dengan 1,00

1) Reliabilitas tes ulang (test-retest reliability)

Teknik reliabilitas tes ulang adalah derajat dimana skor tes tetap konsisten sepanjang masa. Ia menunjukan sebaran skor yang terjadi dari bebrapa kegiatan ujian sebagai hasil dari kesalahan pengukuran.

2) Reliabilitas bentuk setara (Equivalent-form Reliability)

Teknik reliabilitas setara adalah dua tes yang identik kecuali untuk soal-soal aktual. Dua bentuk tes itu mengukur bidang isi pelajaran yang sama, jumlah soal sama, struktur soal sama, tingkat kesulitan sama, dan petunjukn ujian, penskoran dan penafsiran sama.

3) Reliabilitas Belah Dua (Spil-Half Reliabiliy)

Reliabilitas belah dua merupakan jenis reliabilitas yang didasarkan pada konsistensi internal dari suatu tes. Karena prosedur reliabilitas belah dua hanya memerlukan satu kali ujian, maka sumber kesalahan pengukuran dapat dikurangi, seperti perbedaan situasi dan kondisi ujian, yang dapat terjadi pada perhitungan reliabilitas tes ulang.

4) Reliabilitas kesetaraan nasional (Retional Equivalence Reliability)

Reliabilitas kesataraan nasional tidak dihitung melalui korelasi, namun melalui penetapan hubungan antara satu butir soal dengan seluruh butir lainnya dan total butir soal dalam tes.

b. Reliabilitas Tes Acuan Patokan

Reliabilitas tes acuan patokan mengacu pada konsistensi tes mengukur apa yang diukur. Perhatian tes acuan patokan adalah asesmen derajat stabilitas atau kesetaraan, yakni reliabilitas bentuk tes ulamg dan kesetaraan.

1) Tes acuan patokan non-materi

Walaupun secara teoritik variabilitas skor yang dicapai siswa tidak ada dalam tes acuan patokan, namun demikian variabilitas itu tetap ada. Oleh karena itu apabila tes acuan patokan itu diterapkan dan tingkat kinerja setiap siswa dicatat, maka hampir selalu terjadi variabilitas skor. Derajat variabilitas itu akan bervariasi dari kelompok ke kelompok dan dari tes ke tes lainnya.

Apabila terdapat variabilitas skor, maka dapat digunakan pengukuran tradisional untuk menghitung reliabilitas. Pendekatan yang digunakan untuk menghitung koefisien reliabilitas pada tes acuan patokan hingga sekarang ini belum ada yang diterima oleh semua pihak.

2) Tes acuan patokan materi

Livingston telah mengusulkan pendekatan untuk membuat estimasi reliabilitas tes acuan patokan. Rumus yang digunakan pada dasarnya adalah generalisasi dari teori reliabilitas klasik. Rumus yang digunakan itu menghitung reliabilitas tes acuan patokan dengan cara pertama-tama menghitung reliabilitas tradisional, seperti pada acuan tes normatif, kemudian menyesuaikan berdasrkan pada kriteria skor tes acuan patokan. Rumus yang digunakan hanya cocok untuk jenis tes materi.

3. Faktor –faktor Yang Mempengaruhi Reliabilitas

Banyak faktor mempengaruhi reliabilitas, beberapa faktor dberkaitan dengan tes itu sendiri, siswa yang mengikuti ujian,lingkungan dimana ujian itu diselenggarakan, administrassi tes dan prossedur pensekoran. Faktor-faktor tersebut akan dapat digunakan sebagai bahan untuk memperbaiki proseddur pengembangan tes, pemakain tes, dan analisis informasi tes.

Pertimabngan tentang faktor-faktor yang mempengaruhi realiabilitas tes ini buakn saja membantu guru dalam menasirkan kofisien reliabilitass tes standar searalebih baik, melainkan juga membantu kita didalam merumuskan tes yang lebih reliable. Beberapa faktor yang dimaksud secara ringkas dijelaskan sebagai berikut:

a. Panjang Tes (length of test)

Kemunginan cara paling rasional untuk meningkatkan reliabilitas adalah menambah jumlah butiran soal.penambahan butiran soal akan memperbaiki sampel ranah perilaku yang diujikan, perbaikan sampel ranah perilaku itu akan menghasilkan validitas lebih tinggi dan mengurangi faktor kebetulan seperti tekanan.

Walaupun sampel perilaku itu banyak dan dapat menjaddikan butir soal semakn banyak pula,namun perlu diperhatiakan adalah butiran soal itu jangan terlalau banyak sehinnga waktu yang disediakan untuk ujian tidak cukup untuk siswa yang mengerjakannya. Pendeknya, semakin banyak butir soal yang ada pada suatu tes maka semakin baik sampel perilaku yang diukur didalam tes tersebut.

b. Sebaran skor (spread of scores)

Metode korelasi untuk mmengestimasi reliabilitas memerlukan sebaran sekor. Jika sebaran sekor itu sempit, maka koefisien reliabilitas akan menjadi randah.begitu pula jika sebaran skor itu luas, maka koefisien reliabiltas akan menjadi tinggi.

Sebaran skor yang diperoleh siswa pada suatu tes adalah tergantung pada tingkat kesulitan butir soal yang disajikan dan kemampuan siswa dalam mengerjakan soal.

c. Keobjektivan skor (score objectivity)

Tes objektif merupakan tes yang mampu mengurangi subjektivitas penskoran, artinya: setiap orang yang menskor hassil tes akan menemukan skor yang sama pada siswa yang sama. Untuk meningkatkan objektivitas, proses pensekoran harus dilakuakan seobjektif mungkin dan mengurangi pengaruh guru dalam menskor hassil ujian siswa.

4. Aspek-aspek Reliabilitas

a. Keekuivalenan (inter-rater reliabilitas)

Sejak awal peneliti harus sudah menyusun dua perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang disusun berdasarkan satu buah kisi-kisi. Setiap butir soal dari instrument yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson).

b. Stabilitas (test-retest)

Menggunakan sebuah instrument, namun dites dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas.Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson.

Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besat derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda.

Metode pengujian reliabilitas stabilitas yang paling umum dipakai adalah metode pengujian tes-kembali (test-retest). Metode test-retest menggunakan ukuran atau “test” yang sama untuk variable tertentu pada satu saat pengukuran yang diulang lagi pada saat yang lain. Cara lain untuk menunjukkan reliabilitas stabilitas, bila kita menggunakan survai, adalah memasukkan pertanyaan yang sama di dua bagian yang berbeda dari kuesioner atau wawancara. Misalnya the Minnesota Multiphasic Personality Inventory (MPPI) mengecek reliabilitas test-retest dalam satu kuesionernya dengan mengulang pertanyaan tertentu di bagian-bagian yang berbeda dari kuesioner yang panjang.

Kesulitan terbesar untuk menunjukkan reliabilitas stabilitas adalah membuat asumsi bahwa sifat/ variable yang akan diukur memang benar-benar bersifat stabil sepanjang waktu. Karena kemungkinan besar tidak ada ukuran yang andal dan sahih yang tersedia. Satu-satunya faktor yang dapat membuat asumsi-asumsi ini adalah pengalaman, teori dan/atau putusdan terbaik. Dalam setiap kejadian, asumsi ini selalu ditantang dan sulit rasanya mempertahankan asumsi tersebut atas dasar pijakan yang obyektif.

c. Kekonsistenan secara internal (metode belah dua)

Peneliti boleh hanya memiliki seperangkat instrument saja dan hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrument menjadi dua sama besar. Cara yang diambil untuk membelah soal bisa dengan membelah atas dasar nomor ganjil-genap, atas dasar nomor awal-akhir, dan dengan cara undian.

Menurut Saifuddin Azwar, realibilitas ini diukur dengan menentukan hubungan antara skor dua paruh yang ekuivalen suatu tes, yang disajikan kepada seluruh kelompok pada suatu saat. Karena reliabilitas belah dua mewakili reliabilitas hanya separuh tes yang sebenarnya, rumus Spearman-Brown dapat digunakan untuk mengoreksi koefisien yang didapat.

5. Teori Reliabilitas Nominal (Metode Kuder-Richardson /KR-20)

Koefisien Reliabilitas Kuder-Richardson (KR-20) dapat dihitung dengan menggunakan rumus sebagai berikut :

dimana :

n = jumlah item

S2 = Varians total

p = Proporsi dari orang yang menjawab benar pada item ke-i.

1- p = Proporsi dari orang yang menjawab salah pada item = q

Bila koefisien reliabilitas telah dihitung, maka untuk menentukan keeratan hubungan bisa digunakan kriteria Guilford (1956), yaitu :
1. kurang dari 0,20 : Hubungan yang sangat kecil dan bisa diabaikan
2. 0,20 - < 0,40 : Hubungan yang kecil (tidak erat)
3. 0,40 - < 0,70 : Hubungan yang cukup erat
4. 0,70 - < 0,90 : Hubungan yang erat (reliabel)
5. 0,90 - < 1,00 : Hubungan yang sangat erat (sangat reliabel)
6. 1,00 : Hubungan yang sempurna

6. Teori Reliabilitas Ordinal (Metode alfa cronbach)

Teknik perhitungan koefisien reliabilitas yang digunakan disini adalah dengan menggunakan Koefisien Reliabilitas Alpha yang dihitung dengan menggunakan rumus sebagai berikut :

dimana :
k: adalah banyaknya belahan item
Si2: adalah varians dari item ke-i
S2: total adalah total varians dari keseluruhan item

Bila koefisien reliabilitas telah dihitung, maka untuk menentukan keeratan hubungan bisa digunakan kriteria Guilford (1956), yaitu :
1. kurang dari 0,20 : Hubungan yang sangat kecil dan bisa diabaikan
2. 0,20 - < 0,40 : Hubungan yang kecil (tidak erat)
3. 0,40 - < 0,70 : Hubungan yang cukup erat
4. 0,70 - < 0,90 : Hubungan yang erat (reliabel)
5. 0,90 - < 1,00 : Hubungan yang sangat erat (sangat reliabel)
6. 1,00 : Hubungan yang sempurna

EVALUASI PEMBELAJARAN MATEMATIKA

Pages

Daftar Blog Kelompok Evaluasi

Followers

Blog Archive

Validitas dan Reliabilitas

6. Teori Reliabilitas Ordinal (Metode alfa cronbach)

0 komentar:

Post a Comment