VALIDITAS
A. PENGERTIAN
VALIDITAS
Menurut Miller (2009: 70) validitas adalah kecukupan dan kesesuaian
interpretasi dan menggunakan hasil penilaian.
Dalam
beberapa tahun
terakhir,
pemahaman
kita tentang validasi juga mencakup evaluasi kecukupan dan kesesuaian penggunaan dari hasil
penilaian, kemudian diperluaslah pandangan tentang validitas yang mengarah ke fokus pada konsekuensi dari penggunaan hasil penilaian.
Bila
diterapkan pada seperangkat nilai tes, validitas mengacu pada konsistensi (akurasi) dengan skor yang mengukur kemampuan kognitif. Menurut Robert & David (1991)
ada dua aspek validitas, yaitu apa yang diukur dan seberapa konsisten hal tersebut diukur, sedangkan menurut Nitko (2011: 35)
validitas adalah tingkatan interpretasi dan penggunaan hasil penilaian siswa. Untuk
memvalidasi interpretasi dan penggunaan
hasil penilaian
siswa, Anda harus menggabungkan bukti dari berbagai sumber yang menunjukkan
interpretasi dan penggunaan yang tepat. Anda juga harus menunjukkan bahwa siswa tida k
mengalami konsekuensi negatif yang
serius ketika hasilnya
digunak an
sesuai
dengan
keinginan Anda.
Validitas adalah pengukuran seberapa
tepat instrumen atau
alat ukur
yang
digunakan. Validitas instrument test adalah penggunaan item test untuk mengukur apa yang
seharusnya diukur (Allen & Yen, 1979:95).Suatu tes dalam penelitian
dinyatakan valid berdasarkan validitas fakta. Kemudian validitas fakta ini dapat diperoleh melalui validitas
isi, validitas
konkuren dan validitas kontrak (Abel & Frisbie,
1986 : 90). Validitas bukanlah suatu ciri atau sifat yang mutlak dari suatu teknik evaluasi;
ia merupakan suatu ciri yang relatif terhadap tujuan yang hendak dicapai oleh pembuat test.
Teknik yang
sama dapat digunakan untuk beberapa tujuan yang
berbeda, dan validitas yang
dapat berbeda-beda dari yang tinggi kepada yang
rendah, bergantung pada tujuan. Oleh karena itu, validitas harus ditentukan
dalam hubungannya dengan tujuan yang akan dicapai
dengan alat evaluasi itu.Sebuah tes dikatakan valid (sahih) apabila tes tersebut mengukur apa yang hendak
diukur.
B. PRINSIP
VALIDITAS
Menurut
Messick (dalam Nitko, 2011: 35) ada
4 prinsip
validasi yang
akan membantu kita
untuk menentukkan bagaimana tingkat kevalidan suatu hasil penilaian.
Dasar
kevalidan suatu hasil penilaiana harus memenuhi keempat prinsip tersebut, tidak hanya salah
satu dari keempat prinsip tersebut. Keempat macam prinsip tersebut adalah sebagai
berikut :
1.
Interpretasi
(interpretation)
yang kita
berikan terhadap
asesmen
siswa hanya
valid terhadap derajat yang kita arahkan
ke suatu bukti yang mendukung kecocokan
dan kebenarannya.
2.
Kegunaan (use)
yang bisa kita buat dari hasil asesment hanya valid terhadap derajat yang kita
arahkan ke suatu bukti yang mendukung kecocokan dan kebenarannya.
3.
Interpretasi dan
kegunaan dari hasil asesment hanya valid ketika nilai (values) yang dihasilkan sesuai.
4.
Interpretasi dan
kegunaan dari hasil
asesment hanya valid
ketika konsekuensi(consequences)
dari interpretasi dan kegunaan ini konsisten dengan nilai kecocokan.
C. SIFAT-SIFAT VALIDITAS
Menurut
Miller (2009,
72)
saat menggunakan validitas dalam
kaitannya
dengan pengujian dan penilaian, ada beberapa hal yang perlu diperhatikan, yaitu:
1.
Validitas mengacu
pada
ketepatan interpretasi (penafsiran)
dan digunakan
untuk
membuat hasil dari prosedur
penilaian untuk kelompok dari individu tertentu bukan dari
prosedur itu sendiri.
Kita kadang berbicara tentang “validitas dari sebuah tes” untuk
mudahnya tetapi lebih
tepatnya membicarakan validitas interpretasi dan
menggunakannya untuk membuat
sebuah hasil.
2.
Validitas adalah sebuah masalah yang
bertingkat, akibatnya kita harus menghindari memikirkan hasil penilaian yang
valid atau tidak valid. Validitas dianggap sebagai hal yang terbaik dalam hal
menentukan sebuah tingkatan kevalidan, seperti validitas yang tinggi, validitas
sedang dan validitas rendah.
3.
Validitas selalu spesifik untuk beberapa
penggunaan tertentu atau interpretasi untuk populasi tertentu dalam tes. Tidak
ada penilaian yang valid untuk semua tujuannya. Misalnya, hasil dari tes
matematika mungkin mempunyai tingkat validitas yang tinggi untuk menunjukkan
kemampuan komputasi, tingkat validitas yang rendah untuk menunjukkan kemampuan
penalaran matematika, tingkat validitas yang sedang untuk memprediksi
keberhasilan dalam mata pelajaran matematika di masa depan, dan pada dasarnya
tidak ada validitas untuk memprediksi keberhasilan dalam seni atau musik.
Ketika menunjukkan kemampuan komputasi, tes matematika mungkin juga mempunyai
tingkat validitas yang tinggi untuk siswa tingkat tiga dan empat tetapi rendah
untuk siswa tingkat dua atau lima. Dengan demikian, ketika menilai atau
menggambarkan validitas perlu untuk mempertimbangkan interpretasinya. Hasil
penilaian tidak pernah hanya valid, mereka
memiliki tingkat yang
berbeda dari validitas
untuk setiap interpretasi
tertentu yang akan dibuat.
4.
Validitas merupakan satu kesatuan sebuah
konsep. Sifat konseptual validitas biasanya telah digambarkan untuk profesi
pengujian diseperangkat standar yang disiapkan oleh panitia bersama anggota
dari tiga organisasi profesional yang terutama berkaitan dengan pendidikan dan
psikologis dalam pengujian dan penilaian.
5.
Validitas melibatkan
keseluruhan penilaian. Hal
ini tentuya membutuhkan evaluasi, sejauh mana interpretasi dan
penggunaan hasil penilaian dibenarkan oleh bukti pendukung dan konsekusensi
dari interpretasi serta kegunannya.
D. JENIS-JENIS
VALIDITAS
Tiga jenis utama pembuktian validitas menurut Allen dan
Yen (1979: 95)
1.
Validitas Isi
(Content Validity)
Menurut Allen dan Yen (1979:
95) validitas isi ditetapkan melalui analisis rasional isi dan
penentuannya didasarkan pada penilaian subjective individu atau
penilaian ahli (expert judgment). Untuk mengetahui validitas isi
dari sebuah instrumen dapat digunakan lembar validasi instrumen yang
selanjutnya diserahkan kepada para ahli untuk diisi dan diberi masukan.
Ada dua jenis utama validitas isi yaitu validitas tampilan dan validitas logis (Allen
dan Yen, 1979: 95). Tujuan yang dipertimbangkan
dalam validitas
isi adalah untuk menentukan sejauh
mana satu
set penilaian menyediakan sampel yang
relevan dan representatif
(Miller, 2009: 75).
a.
Validitas Tampilan (Face Validity)
Validitas tampilan (face validity) diperoleh ketika seseorang melakukan pemeriksaan
terhadap item-item tes dan menyimpulkan bahwa tes tersebut mengukur aspek yang
relevan. Kesimpulan ini dapat diperoleh oleh siapa saja walaupun
tentu tidak semua
orang
setuju.
Validitas
tampilan
mungkin cukup untuk
membenarkan
penggunaan
beberapa tes.
b.
Validitas Logis
Validitas logis disebut juga sebagai validitas sampling (sampling validity).
Validitas
logis lebih canggih dibandingkan dengan validitas tampilan. Validitas ini melibatkan definisi
yang cermat dari perilaku yang akan diukur dengan tes dan desain logis dari item agar bisa mencakup semua bidang penting dari domain ini. Validitas logis
sangat berguna dalam
pengembangan tes prestasi. Untuk memperoleh validitas logis yang tinggi suatu alat ukur harus dirancang sedemikian
rupa sehingga benar-benar berisi
hanya item yang relevan dan perlu
menjadi bagian alat ukur secara keseluruhan. Suatu objek ukur yang hendak diungkap
oleh alat ukur hendaknya harus dibatasi lebih dahulu kawasan perilakunya secara seksama
dan konkrit. Batasan perilaku yang
kurang jelas akan menyebabkan terikatnya item-item
yang tidak relevan dan tertinggalnya bagian penting dari objek ukur yang
seharusnya masuk
sebagai bagian dari alat ukur yang bersangkutan. Berdasarkan validitas logis, maka suatu instrumen dikatakan valid jika
cakupan item-item dari instrumen merupakan sampel yang reprensentatif
bagi seluruh item yang mungkin dibuat.
2.
Validitas Konstruk (Construct Validity)
Validitas konstruk
merupakan validitas yang
paling baru dikembangkan. Validitas konstruk adalah validitas yang
menunjukkan sejauh mana suatu tes mengukur sifat atau konstruk teoritik yang
hendak di ukur (Allen dan Yen, 1979: 108). Dengan kata lain, validitas konstruk
merujuk pada kualitas alat ukur yang dipergunkan apakah sudah benar-benar
menggambarkan
konstruk teoritis yang digunakan sebagai
dasar
operasional ataukah
belum.
Pengujian validitas konstruk merupakan proses yang
berlangsung
terus-menerus
sejalan dengan perkembangan konsep sifat atau konstruk teoritik yang akan diukur.
Prosedur
validasi konstruk diawali dari suatu identifikasi dan batasan mengenai variabel yang
akan diukur dan dinyatakan dalam
bentuk konstruk
logis berdasarkan
teori
mengenai variabel tersebut. Berdasarkan pada teori mengenai variabel yang diukur,
pengembang tes membuat
prediksi tentang bagaimana skor tes seharusnya
berlaku
dalam berbagai situasi. Prediksi ini kemudian diuji. Jika prediksi yang kita gunakan didukung oleh data yang diperolah, maka validitas konstruknya tinggi. Akan tetapi, jika
prediksi yang
kita
gunakan tidak didukung
oleh data, maka paling sedikit ada tiga alternatif
kesimpulan yang dapat kita
peroleh, yaitu: (a) eksperimen cacat,
(b) teori
salah dan seharusnya direvisi, atau (c) tes tidak dapat mengukur ciri-ciri yang diharapkan.
Meskipun menetapkan validitas konstruk adalah sebuah proses yang tidak berakhir,
pengembang tes dapat
menyajikan validitas
konstruk untuk
suatu tes dalam situasi tertentu.
a.
Multitrait-Multimethod
Pendekatan multitrait-multimethod dapat digunakan bilamana
terdapat dua trait
atau lebih yang diukur
oleh
dua macam metode
atau lebih. Dasar pikiran dalam validasi ini adalah bahwa adanya validitas yang baik diperlihatkan oleh korelasi yang
tinggi antara dua pengukuran terhadap trait yang sama
oleh dua metode yang berbeda, atau korelasi yang rendah antara dua pengukuran
terhadap trait yang berbeda walaupun
menggunakan
metode yang serupa.
Dalam istilah validitas, skala-skala tersebut memperlihatkan adanya validitas konvergen (convergent validity) dan validitas diskriminan (discriminant validity).
b.
Analisis Faktor
Prosedur validasi konstruk juga dapat ditempuh melalui teknik
analisis faktor. Tujuan utama analisis faktor adalah untuk menguji secara empirik huburngan antar butir
soal dan untuk menentukan kelompok soal yang saling
menentukan sebagai suatu faktor/konstruk yang diukur melalui instrument
(Gable,
1986: 85).
Analisis faktor telah dikenal sangat luas di kalangan ilmuwan sosial kuantitatif. Uji ini digunakan untuk memastikan apakah butir-butir tertentu mendukung faktornya dan faktor-faktor mendukung aspek yang diukur. Uji ini menghasilkan sejumlah
faktor yang dapat menjelaskan atau menjadi indikator mengenai suatu aspek yang diukur. Faktor
tersebut
terjadi karena sifat
struktural berada dalam satu
hubungan. Analisis faktor merupakan kumpulan prosedur
matematik yang kompleks guna menganalisis hubungan diantara variabel-variabel dan menjelaskan saling
hubungan tersebut dalam bentuk kelompok variabel yang terbatas yang disebut faktor. Oleh karena
itu
validitas yang ditegakkan melalui prosedur analisis faktor disebut
sebagai validitas faktorial.
3.
Validitas Kriteria (Criterion Validity)
Menurut Allen dan Yen (1979: 97) yang terkait dengan validitas
kriteria adalah seberapa baik tes dapat meramalkan kinerja di masa yang akan
datang. Menurut Gable (1986: 121) ada dua tipe
validitas
kriteria yaitu validitas sewaktu dan validitas
prediktif
a.
Validitas
Prediktif
Validitas ini digunakan
untuk memprediksi atau sebagai prediktor bagi kinerja yang akan datang.
Validitas prediktif melibatkan skor tes untuk memprediksi perilaku masa
depan. Koefisien validitas prediksi diperoleh dengan memberikan tes untuk
semua orang yang relevan, menunggu jumlah waktu yang wajar, mengumpulkan skor
kriteria, dan menghitung koefisien validitas.
Misalnya tes seleksi penerimaan calon mahasiswa baru pada sebuah
perguruan tinggi adalah suatu tes yang diharapkan mampu
meramalkan keberhsilan studi para
calon mahasiswa dalam mengikuti program pendidikan di perguruan tinggi tesebut pada
masa-masa yang
akan datang. Berdasarkan nilai-nilai hasil tes yang tinggi (=baik) yang
berhasil diraih oleh peserta tes seleksi tersebut, maka mereka dinyatakan lulus dan dapat
diterima
sebagai mahasiswa
pada
perguruan tinggi tersebut; sedangkan para peserta tes seleksi yang yang
nilai-nilai hasil tesnya rendah (=jelek), dinyatakan tidak lulus dan kerenanya tidak dapat diterima
sebagai calon mahasiswa baru
di perguruan tinggi yang
bersangkutan.
b.
Validitas Konkuren (Concurrent
Validity)
Validitas konkuren diperoleh
dari korelasi antara alat ukur dan skor kriteria dalam waktu yang bersamaanKoefisien validitas konkuren adalah hubungan antara tes dan kriteria skor
ketika
kedua pengukuran diperoleh pada saat yang sama. Koefisien validitas konkuren lebih sesuai untuk nilai tes yang
digunakan untuk memperkirakan kriteria bersamaan daripada
memprediksi kriteria masa depan.
sebagai
contoh Dalam rangka menguji validitas konkuren, data yang
mencerminkan pengalaman
yang diperoleh pada masa lalu itu, kita bandingkan dengan data hasil tes yang diperoleh sekarang ini. Jika hasil tes yang ada sekarang ini mempunyai hubungan searah dengan
hasil tes berdasar pengalaman yang lalu, maka tes yang memiliki karakteristik seperti itu
dapat
dikatakan telah memiliki
validitas konkuren. Seperti halnya validitas ramalan, maka
untuk mengetahuai ada/tidaknya hubungan yang searah antara tes pertama
dan tes berikutnya, dapat digunakan teknik analisis
korasional product moment
dari
Karl Pearson. Jika korelasi
antara variable
X (tes pertama)
denagn variable
Y (tes berikutnya) adalah positif dan
signifikan,maka
tes tersebut dapat
dinyatakan sebagai
tes yang telah memiliki validitas
bandingan.
E. FAKTOR-FAKTOR
YANG MEMPENGARUHI VALIDITAS
Menurut Miller (2009: 97) ada banyak faktor yang mempengaruhi hasil tes evaluasi tidak valid. Beberapa faktor tersebut secara garis
besar adalah
sebagai berikut.
1.
Faktor yang berasal
dari dalam tes
a. Arahan tes yang
disusun dengan makna
tidak
jelas sehinnga
dapat mengurangi
validitas
tes.
b. Kata-kata yang digunakan dalam struktur
instrumen evaluasi terlalu komplikasi sehingga sulit dipahami.
c. Pernyataan yang memiliki makna ganda atau ambigu dalam penilaian akan
mengakibatkan misinterpretasi dan membingunkan.
d. Waktu yang digunakan untuk menyelesaikan tes tidak mencukupi.
e. Item tes yang digunakan tidak sesuai untuk digunakan sebagai penilaian.
f. Item tes dikonstuksi dengan jelas.
g. Tes terlalu pendek.
h. Pengaturan tingkat kesulitan item tes tidak beraturan.
i.
Jawaban masing-masing item
evaluasi bisa diprediksi siswa.
2.
Faktor yang berasal
dari administrasi dan skor tes
a. Waktu pengerjaan tidak cukup sehingga siswa dalam memberikan jawaban dalam
situasi
tergesa-gesa.
b. Adanya kecurangan dalam tes sehingga tidak
membedakan antara siswa yang belajar dengan melakukan kecurangan.
c. Pemberian petunjuk dari pengawas yang tidak
dapat dilakukan pada semua siswa.
d. Teknik pemberian skor yang tidak konsisten.
e. Siswa tidak dapat mengikuti arahan yang
diberikan dalam tes baku.
f. Adanya joki (orang lain bukan siswa) yang
masuk dalam menjawab item tes yang diberikan.
3.
Faktor yang berasal
dari jawaban
siswa
a.
Beberapa siswa
mungki memiliki
tingkat emosional
yang tidak stabil
sehingga berpengaruh
pada pekerjaan
tugas mereka.
b.
Ada siswa
yang mungkin takut
dengan situasi penilaian
sehingga tidak bisa menyelesaikan tugas dengan baik.
c.
Siswa juga mungkin tidak
termotivasi
untuk
menunjukkan kemampuan
terbaik mereka.
BAB III
PENUTUP
A.
Kesimpulan
Berdasrakan pembahasan di atas,
maka dapar di simpulkan:
1. Menurut
Allen &
Yen (1979: 95) Validitas instrument test adalah
penggunaan item test untuk mengukur apa yang
seharusnya diukur.
2. Menurut
Miller (2009: 70) validitas adalah kecukupan dan kesesuaian interpretasi
dan menggunakan hasil
penilaian.
3. Menurut
Robert & David (1991) ada dua aspek validitas, yaitu apa yang diukur dan
seberapa konsisten hal tersebut diukur,
4. Menurut
Nitko (2011: 35) validitas adalah tingkatan interpretasi dan penggunaan
hasil penilaian siswa.
5. Validitas terdiri dari 3 jenis, yaitu
a.
Validitas Isi
(Content Validity)
b.
Validitas Konstruk (Construct Validity)
c. Validitas
Kriteria (Criterion Validity)
6. Factor-faktor yang mempengaruhi validitas terdiri dari 3,
yaitu
a.
Faktor yang berasal
dari dalam tes
b.
Faktor yang berasal
dari administrasi dan skor tes
c.
Faktor yang berasal
dari jawaban
siswa
Daftar Pustaka
Allen, M.J. & Yan,
W.M. (1979). Introduction to Measurement
Theory. Monterey,
CA.:
Brooks/Cole Publishing Company.
Ebel, Robert L. &
Frisbie, David A. (1986). Essentials of Educational Measurement. Englewoodn Cliffs,
NJ: Prentice-Hall., Inc.
Gable, Robert K. 1986.
Instrument Development in affective Domain. Bostin: Kluwer-Nijhooff Publishing.
Miller, M. David ,
Linn Robert L &Gronlund Norman E (2009). Measurement and Assesment in Teaching.
Nitko, Anthony J
&Brookhart, Susan M. (2011). Educational Assessment of Students. Boston: