VALIDITAS DAN RELIABILITAS
BAB II
PEMBAHASAN
1.
Pengertian Validitas dan Reliabilitas
Uji
keabsahan data dalam penelitian, sering hanya ditekankan pada uji validitas dan
reliabilitas. Dalam penelitian kuantitatif, kriteria utama terhadap data hasil
penelitian adalah valid, reliable, dan obyektif. Validitas merupakan derajad
ketepatan antara data yang terjadi pada obyek penelitian dengan data yang dapat
dilaporkan oleh peneliti.
Validitas
adalah derajad ketepatan suatu alat ukur tentang pokok isi atau arti sebenarnya
yang diukur. Dengan demikian data yang valid adalah data “yang tidak berbeda”
antar data yang dilaporkan oleh peneliti dengan data yang sesungguhnya terjadi
pada obyek penelitian. Kalau dalam obyek penelitian terdapat warna merah, maka
peneliti akan melaporkan warna merah; kalau dalam obyek penelitian para pegawai
bekerja dengan keras, maka peneliti melaporkan bahwa pegawai bekerja dengan
keras. Bila peneliti membuat laporan yang tidak sesuai dengan apa yang terjadi
pada obyek, maka data tersebut dapat dinyatakan tidak valid.
Terdapat
dua macam validitas penelitian, yaitu validitas internal dan validitas
eksternal. Validitas internal berkenaan dengan derajad akurasi desain penelitian
dengan hasil yang dicapai. Jika dalam desain penelitian dirancang untuk
meneliti etos kerja pegawai, maka data yang diperoleh seharusnya adalah data
yang akurat tentang etos kerja pegawai. Penelitian menjadi tidak valid, apabila
yang ditemukan adalah motivasi kerja pegawai.
Validitas
eksternal berkenaan dengan derajad akurasi apakah hasil penelitian dapat
digeneralisasikan atau diterapkan pada populasi dimana sampel tersebut diambil.
Bila sampel penelitian representative, instrument penelitian valid dan
reliable, cara mengumpulkan dan analisis data benar, maka penelitian akan
memiliki validitas eksternal yang tinggi.
Dalam
hal reliabilitas, Susan Stainback (1988) menyakan bahwa; reability is
often defined as the consistency and stability of data or findings. From a
positivistic perspective, reability typically is considered to be synonymous
with the consistency of data produced by observations made by different
researchers (e.g interrater reliability), by the same researcher at different
times (e.g test retest), or by spilling a data set in two parts (split half). Reliabilitas
berekenaan dengan derajad konsitensi dan stabilitas data atau temuan. “Definisi
reliabilitas yang lebih komprehensif adalah derajad ketepatan dan
ketelitian atau akurasi yang ditunjukan oleh instrument pengukuran.
Istilah-istilah lain sehubungan dengan reliabilitas adalah stabilitas,
dapat dipercaya dan dapat diramalkan”.
Dalam
pandangan positivistic (kuantitatif), suatu data dinyatakan reliable apabila
dua atau lebih peneliti dalam obyek yang sama menghasilkan data yang sama, atau
peneliti sama dalam waktu yang berbeda menghasilkan data yang sama, atau
sekelompok data bila dipecah menjadi dua menunjukan data yang tida berbeda.
Kalau peneliti satu menemukan dalam obyek berwarna merah, maka peneliti yang
lain juga demikian. Kalau seorang peneliti dalam obyek kemarin menemukan data
berwarna merah, maka sekarang atau besok akan tetatp berwarna merah. Karena
reliabilitas berkenaan dengan derajad konsistensi, maka bila ada peneliti lain
mengulangi atau mereplikasi dalam penelitian pada obyek yang sam dengan metode
yang sama maka akan menghilangkan data yang sama. Suatu data yang reliable atau
konsisten akan cenderung valid, walaupun belum tentun valid. Orang yang
berbohong secara konsisten akan terlihat valid, walaupun sebenarnya tidak
valid.
Obyektivitas berkenaan
dengan “derajad kesepekatan” atau interpersonal agreement antar
banyak orang terhadap suatu data. Bila dari 100 orang terdapat dari 99 orang
menyatakan bahwa terdapat warna merah dalam obyek penelitian itu, sedangkan
yang satu orang menyatakan warna lain, maka data tersebut adalah data yang
obyektif. Obyektif disini lawannya katanya subyektif. Data yang obyektif akan
cenderung valid, walaupun belum tentu valid. Dapat terjedi suatu data yang
disepakati banyak orang belum tentu valid, tetapi yang disepakati sedikit orang
malah lebih valid. Sebagai contoh terdapat 99 orang menyatakan bahwa si A bukan
pencuri (obyektif), dan satu orang menyatakan bahwa si A pencuri (subyektif).
Ternyata yang betul adalah pernyataan satu orang, karena yang 99 orang tersebut
teman-teman dari si A yang samasama pencuri, sehingga menyatakan si A bukan
pencuri.
Dalam
penelitian kuantitatif, untuk mendapatkan data yang valid, reliable dan
obyektif, maka penelitian dilakukan dengan menggunakan instrument yang valid
dan reliable, dan dilakukan pada sampel yang mendekati jumlah populasi dan
pengumpulan serta analisis data dilakukan dengan cara yang benar. Dalam
penelitian kuantitatif, untuk mendapatkan data yang valid dan reliable yang
diuji validitas dan reliabilitasnya adalah intrumen penelitiannya. Sedangkan
dalam penelitian kualitatif yang diuji adalah datanya. Oleh karena itu Susan
Stainback (1988) menyatakan bahwa penelitian kuantitatif lebih menekankan pada
aspek reliabilitas, sedangkan penelitian kualitatif lebih pada aspek validitas.
“Dalam
penelitian kualitatif, temuan atau data dinyatakan valid apabila tida perbedaan
antara yang dilaporkan peneliti dengan apa yang sesungguhnya terjadi pada obyek
yang diteliti”. Tetapi perlu diketahui kebenaran realitas data menurut
penelitian kualitatif tidak bersifat tunggal, tetapi jamak dan tergantung pada
konstruksi manusia dibentuk dalam diri seseorang sebagai hasil proses mental
tiap individu dengan berbagai latar belakangnya. Oleh karena itu bila terdapat
10 peneliti dengan latar belakang yang berbeda, meneliti pada obyek yang sama,
akan mendapatkan 10 temuan, dan semuanya dinyatakan valid, kalau apa yang
ditemukan itu tidak berbeda dengan kenyataan sesungguhnya yang terjadi pada
obyek yang diteliti. Dalam obyek yang sama peneliti yang berlatar belakang
Pendidikan akan menemukan data yang berbeda dengan peneliti yang berlatar
belakang Manajemen, Antropologi, Sosiologi, Kedokteran, Teknik, dan sebagainya.
Pengertian
reliabiltas dalam penelitian kuantitatif, sangat berbeda dengan reliabilitas
dalam penelitian kualitatif. Hal ini terjadi karena terdapat perbedaan
paradigma dalam melihat relitas. Menurut penelitian kualitatif, suatu realitas
itu bersifat majmuk/ ganda, dinamis/ selalu berubah, sehingga tidak ada yang
konsisten, dan berulang seperti semula. Heraclites dalam Nasution (1988)
menyatakan bahwa “kita tidak bisa dua kali masuk sungai yang sama” air mengalir
terus, waktu terus berubah, situasi senantiasa berubah dan demikian pula
perilaku manusia yang terlibat dalam situasi social. Dengan demikian tidak ada
suatu data yang tetap/ konsisten/ stabil.
Selain
itu, cara melaporkan penelitian ideosyneratic dan indivudualistik, selalu
berbeda dari orang perorang. Tiap peneliti member laporan menurut bahasa dan
jalan pikiran sendiri. Demikian dalam pengumpulan data, pencatatan hasil
observasi dan wawancara terkandung unsure-unsur individualistic. Proses
penelitian sendiri selalu bersifat persolistik dan tidak ada dua peneliti akan
menggunakan dua cara yang persis sama.
2.
Kreteria Keabsahan Data
Untuk menetapkan keabsahan data diperlukan
teknik pemeriksaan (pengujian). Pelaksanaan tekhnik pemeriksaan didasarkan atas
sejumlah kriteria tertentu. Ada empat kriteria yang digunakan yaitu derajat
kepercayaan (credibility), keteralihan (transferability),
kebergantungan (dependability) dan kepastian (confirmability).
1.
PengujianKredibilitas (derajad keterpercayaan)
a. Perpanjangan
Pengamatan
Melalui perpanjangan pengamatan berarti
peneliti kembali ke lapangan, melakukan pengamatan, melakukan wawancara dengan
sumber data, baik yang pernah ditemui maupun yang baru ditemui. Dengan perpanjangan
pengamatan ini, hubungan peneliti dengan narasumber akan semakin terbentuk dan
semakin akrab, semakin terbuka, saling mempercayai sehingga tidak ada informasi
yang disembunyikan lagi. Pada tahap awal memasuki lapangan, peneliti
masih dianggap orang asing, masih dicurigai sehingga informasi yang diberikan
belum lengkap, tidak mendalam, dan mungkin masih banyak yang dirahasiakan.
Dengan perpanjangan pengamatan ini, peneliti mengecek kembali apakah data yang
diberikan selama ini merupakan data yang sudah benar atau tidak. Bila data yang
telah diperoleh selama ini setelah dicek kembali pada sumber data asli atau
sumber data lain tidak benar, peneliti melakukan pengamatan lagi secara lebih
luas dan mendalam sehingga diperoleh data yang pasti kebenarannya. Lamanya
perpanjangan pengamatan ini dilakukan sangat bergantung kepada kedalaman,
keluasan, dan kepastian data.
b. Meningkatkan Ketekunan
Meningkat ketekunan berarti melakukan
pengamatan secara lebih cermat dan berkesinambungan. Dengan cara tersebut,
kepastian data dan urutan peristiwa akan dapat direkam secara pasti dan
sistematis. Meningkatkan ketekunan ibarat mengecek soal-soal atau makalah yang
dikerjakan, ada yang salah atau tidak. Dengan meningkatkan ketekunan itu,
peneliti dapat melakukan pengecekan kembali apakah data yang telah ditemukan
itu salah atau tidak. Selain itu, peneliti juga dapat mendeskripsi data secara
akurat dan sistematis.
Kekurang tekunan pengamatan terletak pada
pengamatan terhadap pokok persoalan yang dilakukan secara terlalu awal. Hal itu
mungkin dapat disebabkan oleh tekanan subyek atau sponsor atau barangkali juga
karena ketidaktoleransian subyek, atau sebaliknya peneliti terlalu cepat
mengarahkan fokus penelitiannya walaupuntampaknya belum patut dilakukan demikian.
Persoalan itu bisa terjadi pada situasi ketika subyek berdusta, menipu, atau
berpura-pura, sedangkan peneliti sudah sejak awal mengarahkan fokusnya, padahal
barangkali belum waktunya berbuat demikian.
c. Triangulasi
Triangulasi dalam pengujian kredibilitas ini diartikan sebagai
pengecekan data dari berbagai sumber dengan berbagai cara dan berbagai waktu.
Dengan demikian, triangulasi terdiri atas
triangulasi sumber, triangulasi teknik, dan triangulasi waktu.
1)
Triangulasi Sumber
Triangulasi sumber dilakukan dengan cara
mengecek data yang diperoleh dari beberapa sumber. Sebagai contoh, untuk
menguji kredibilitas data tentang gaya kepemimpinan seseorang, maka pengumpulan
dan pengujian data yang telah diperoleh dilakukan kebawahan yang dipimpin, ke
atasan yang menugasi, dan keteman kerja yang merupakan kelompok kerjasama. Data
dari tiga sumber tersebut, tidak bisa di rata-ratakan seperti dalam penelitian
kuantitatif, tetapi dideskripsikan, dikategorisasikan, mana pandangan yang sama,
yang berbeda, dan mana yang spesifik dari tiga sumber data tersebut.
Selanjutnya diminta kesepakatan (membercheck) dengan tiga sumber data tersebut
untuk mendapatkan kesimpulan.
2)
Triangulasi Teknik
Triangulasi teknik dilakukan dengan cara
mengecek data pada sumber yang sama dengan teknik yang berbeda.
3)
Triangulasi Waktu
Triangulasi waktu berkaitan dengan keefektifan
waktu. Data yang dikumpulkan dengan teknik wawancara di pagi hari pada saat
narasumber masih segar dan belum banyak masalah akan memberikan data yang valid
sehingga lebih kredibel.
d. Diskusi dengan Teman
Sejawat
Teknik ini dilakukan dengan cara mengekspos
hasil sementara atau hasil yang diperoleh dalam bentuk diskusi analitik denga
rekan-rekan sejawat. Teknik ini mengandung beberapa maksud sebagai salah satu
teknik pemeriksaan keabsahan data. Pertama, untuk membuat agar peneliti tetap
mempertahankan sikap terbuka dan kejujuran. Kedua, diskusi denga sewajat ini
memberikan suatu kesempatan awal yang baik untuk mulai menjajaki dan menguji
hipotesis yang muncul dari pemikiran peneliti.
e. Analisis Kasus Negatif
Kasus negatif adalah kasus yang tidak sesuai
atau berbeda dengan hasil penelitian hingga pada saat tertentu. Peneliti
berusaha mencari data yang berbeda atau bahkan bertentangan dengan data yang
telah ditemukan. Bila tidak ada lagi data yang berbeda atau bertentangan dengan
temuan, berarti data yang ditemukan sudah dapat dipercaya.
f. Menggunakan Bahan
Referensi
Bahan referensi adalah adanya pendukung untuk
membuktikan data yang telah ditemukan oleh peneliti. Bahan referensi ini dapat
berupa foto-foto, rekaman, dan dokumen autentik.
g. Mengadakan Memberchek
Memberchek adalah proses pengecekan data yang
diperoleh peneliti kepada pemberi data. Tujuan memberchek adalah agar informasi
yang diperoleh yang akan digunakan dalam penulisan laporan sesuai dengan apa
yang dimaksud sumber data dan informan.
2.
Pengujian Transferability (keteralihan)
Transferability merupakan validitas
eksternal dalam penelitian kuantitatif. Validitas eksternal menunjukan derajad
ketepatan atau dapat diterapkannya hasil penelitian ke populasi di mana sampel
tersebut diambil.
3.
Pengujian Depenability (kebergantungan)
Depenability dalam penelitian
kuantitatif, dependability disebut reliabilitas. Suatu
penelitian yang reliable adalah apabila orang lain dapat mengulangi/
mereplikasi proses penelitian tersebut. Dalam penelitian kualitatif, ujidepenabilitydilakukan
dengan melakukan audit terhadap keseluruhan proses penelitian. Sering terjadi
peneliti tidak melakukan proses penelitian kelapangan, tetapi bias memberikan
data. Peneliti seperti ini perlu diuji depenabilitynya. Jika proses
penelitian tidak dilakukan tetapi datanya ada, maka penelitian tersebut tida
reliable atau dependable. Bagaimana peneliti mulai menetukan masalah/ focus,
memasuki lapangan, menentukan sumber data, melakukan analisis data, melakukan
uji keabsahan data, sampai membuat kesimpulan harus dapat ditunjukan oleh
peneliti. Jika peneliti tidak mempunyai dan tidak dapat menunjukan jejak
aktivitas lapangannya maka depebilitas penelitiannnya patut diragukan.
4.
Pengujian Konfirmability (kepastian)
Pengujian konfirmability dalam
penelitian kuantitatif disebut dengan uji obyektivitas penelitian. Penelitian
dikatakan obyektif bila hasil penelitian telah disepakati banyak orang.
Dalam penelitian kualitatif, uji konfirmabilitymirip dengan
dependability, sehingga pengujiannya dapat dilakukan secara bersamaan.
Menguji konfirmabilityberarti menguji hasil penelitian dikaikan
dengan proses yang dilakukan. Bila hasil penelitian merupakan fungsi dari
proses penelitian yang dilakukan, maka penelitian tersebut telah memenuhi
standar konfirmability. Dalam penelitian jangan sampai proses
tidak ada, tetapi hasilnya ada.
3.
Tes Tertulis Untuk Prestasi Belajar
1.
Bentuk-bentuk Tes
Dalam hal ini kita bedakan atas dua bentuk
tes, yaitu sebagai berikut :
a.
Tes Subjektif
Tes subjektif yang pada umumnya berbentuk esai (uraian). Tes
bentuk esai adalah sejenis tes kemajuan belajar yang memerlukan jawaban yang
bersifat pembahasan atau uraian kata-kata. Ciri-ciri pertanyaannya didahului
dengan kata-kata seperti : uraikan, jelaskan, mengapa, bagaimana, bandingkan,
simpulkan dan sebagainya.
Soal-soal bentuk esai biasanya jumlahnya tidak banyak, hanya
sekitar 5-10 buah soal dalam waktu kira-kira 90 s.d 120 menit. Soal-soal bentuk
esai ini menuntut kemampuan siswa untuk dapat mengorganisir, menginterprestasi,
menghubungkan pengertian-pengertian yang telah dimiliki. Dengan singkat dapat
dikatakan bahwa tes esai menuntut siswa untuk dapat mengingat-ingat dan
mengenal kembali, dan terutama harus mempunyai daya kreativitas yang tinggi.
b.
Tes Objektif
Tes objektif adalah tes yang dalam pemeriksaannya dapat
dilakukan secara objektif. Hal ini memang dimaksudkan untuk mengatasi
kelemahan-kelemahan dari tes bentuk esai. Dalam penggunaan tes objektif ini
jumlah soal yang diajukan jauh lebih banyak daripada tes esai. Kadang-kadang
untuk tes yang berlangsung selama 60 menit dapat diberikan 30-40 buah soal.
2.
Macam-macam tes objektif
a.
Tes Benar-Salah (True-False)
Soal-soalnya berupa pernyataan-pernyataan (statement). Statement
tersebut ada yang benar dan ada yang salah. Orang-yang ditanya bertugas untuk
menandai masing-masing pernyataan itu dengan melingkari huruf B jika pernyataan
itu betul menurut pendapatnya dan melingkari huruf S jika pernyataannya salah.
b.
Tes Pilihan Ganda (Multiple Choice Test)
Multiple Choice Test terdiri atas suatu keterangan atau
pemberitahuan tentang suatu pengertian yang belum lengkap. Dan untuk
melengkapinya harus memilih satu dari beberapa kemungkinan jawaban yang telah
disediakan. Atau multiple choice test terdiri atas bagian keterangan (stem)
dan bagian kemungkinan jawaban atau alternative (options). Kemungkinan
jawaban (option) terdiri atas satu jawaban yang benar yaitu kunci
jawaban dan beberapa pengecoh (distractor).
c.
Menjodohkan (Matching Test)
Matching Test dapat kita ganti dengan istilah
mempertandingkan, mencocokkan, memasangkan, atau menjodohkan. Matching Test terdiri
atas satu seri pertanyaan dan satu seri jawaban. Masing-masing pertanyaan
mempunyai jawabannya yang tercantum dalam seri jawaban. Tugas pengisi ialah
mencari dan menempatkan jawaban-jawaban sehingga sesuai atau cocok dengan
pertanyaannya.
d.
Tes Isian (Completion Test)
Completion Test biasa kita sebut dengan istilah tes isian, tes
menyempurnakan, atau tes melengkapi. Completion test terdiri atas
kalimat-kalimat yang ada bagian-bagiannya yang dihilangkan. Bagian yang
dihilangkan atau yang harus diisi oleh pengisi ini adalah merupakan pengertian
yang kita minta dari pengisi.
3.
Pengukuran Ranah Afektif
Pengukuran ranah afektif tidaklah semudah mengukur ranah
kognitif. Pengukuran ranah afektif tidak dapat dilakukan setiap saat (dalam
arti pengukuran formal) karena perubahan tingkah laku siswa tidak dapat berubah
sewaktu-waktu. Pengubah sikap seseorang memerlukan waktu yang relative lama.
Demikian juga pengembangan minat dan penghargaan serta nilai-nali.
Di dalam petunjuk Pelaksanaan Penilaian Pendidikan Sejarah
Perjuangan Bangsa (PSPB) disebutkan bahwa penilaian ranah kognitif bertujuan
mengukur pengembangan penalaran, sedangkan tujuan penilaian afektif adalah
sebagai berikut :
a.
Untuk mendapatkan umpan balik (feedback), baik bagi guru
maupun siswa sebagai dasar untuk memperbaiki proses belajar-mengajar dan
mengadakan program perbaikan (remedial program) bagi anak didiknya.
b.
Untuk mengetahui tingkat perubahan tingkah laku anak didik yang
dicapai, yang antara lain diperlukan sebagai ahan untuk perbaikan tingkah laku
anak didik, pemberian laporan kepada orang tua, dan penentuan lulus tidaknya
anak didik.
c.
Untuk menenmpatkan anak didik dalam situasi belajar mengajar
yang tepat, sesuai dengan tingkat pencapaian dan kemampuan serta karakteristik
anak didik.
d.
Untuk mengenal latar belakang kegiatan belajar dan kelainan
tingkah laku anak didik. (Depdikbud, 1983:2)
Sehubungan dengan tujuan penilaiannya ini maka yang menjadi
sasaran penilaian kawasan afektif adalah perilaku anak didik, bukan pengetahuannya.
Sebagai contoh, siswa bukan dituntut
untuk mengetahui sebab –sebab dibentuknya BPUPKI, tetapi bagaimana sikapnya
terhadap pembentukan BPUPKI tersebut.
Pertanyaan afektif tidak menuntut jawaban benar atau salah,
tetapi jawaban yang khusus tentang dirinya mengenai minat, sikap, dan
internalisasi nilai (oleh Cronbach dibedakan antara maximum performance
dengan typical performance attitude) (Cronbach, 1970).
4.
Pengukuran Ranah Psikomotor
Pengukuran ranah psikomotor dilakukan terhadap hasil-hasil
belajar yang berupa penampilan. Namun demikian biasanya pengukuran ranah ini
disatukan atau dimulai dengan pengukuran ranah kognitif sekaligus. Misalnya,
penampilannya dalam menggunakan thermometer diukur mulai dari pengetahuan
mereka mengenai alat tersebut, pemahaman tentang alat dan penggunaannya (aplikasi), kemudian baru
cara menggunakannya dalam bentuk keterampilan. Untuk pengukuran yang terakhir
ini harus diperinci antara lain: cara memegang, cara meletakkan/menyelipkan
kedalam ketiak atau muut, cara membaca angka, cara mengembalikan ketempatnya
dan sebagainya. Ini semua tergantung dari kehendak kita, asal tujuan pengukuran
dapat tercapai.
Instrument yang digunakan mengukur keterampilan biasanya berupa
matriks. Ke bawah menyatakan perperincian aspek (bagian keterampilan) yang akan
diukur, kekanan menunjukkan besarnya skor yang dapat dicapai.
4.
Menganalisis Hasil Test
1.
Menilai Test yang Dibuat Sendiri
Ada 4 cara untuk menilai test, yaitu:
a.
Cara pertama meneliti secara jujur soal – soal yang sudah
disusun, kadang – kadang dapat diperoleh jawaban tentang ketidak jelasan
perintah atau bahasa, taraf kesukaran, dan lain – lain keadaan soal tersebut.
b.
Cara kedua adalah mengadakan analisis soal. Analisi soal adalah
suatu prosedur yang sistematis, yang akan memberikan informasi – informasi yang
sangat khusus terhadap butir test yang kita susun. Analisis soal terutama dapat
dilakukan untuk test objektif. Hal ini tidak berarti bahwa test uraian tidak
dapat dianalisis, akan tetapi memang dalam menganalisis butir test uraian,
belum ada pedoman secara standar.
c.
Cara ketiga adalah mengadakan checking validitas. Validitas yang
paling penting dari test buatan guru adalah validitas kulikuler. Untuk
mengadakan checking validitas kulikuler, kita harus merumuskan tujuan setiap
bagian pelajaran secara khusus dan jelas sehingga setiap soal dapat kita
jodohkan dengan setiap tujuan khusus tersebut.
d.
Cara keempat adalah dengan mengadakan checking reabiitas. Salah
satu indicator untuk test yang mempunyai reabilitas yang tinggi adalah bahwa
kebanyakan dari soal – soal test itu mempunyai daya beda yang tinggi.
2.
Analisis butir soal ( item analysis)
Analisis soal anatara lain bertujuan untuk mengadakan
identifikasi soal – soal yang baik, kurang baik, dan soal yang jelek. Dengan
analisis soal dapat diperoleh informasi tentang kejelekan tentang sebuah soal
dan “ petunjuk” untuk mengadakan perbaikan.
a.
Taraf kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak
terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk
mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan
menyebabkan sisiwa menjadi putus asa dan tidak mempunyai semangat untuk mencoba
lagi karena diluar jangkauan.
Bilangan yang menunjukan sukar dan mudahnya sesuatu soal disebut
indeks kesukaran (difficulty index). Besarnya indeks kesukaran antara 0,00
sampai denga 1,0. Indeks kesukaran ini menunjukan taraf kesukaran soal. Soal
dengan indeks kesukaran 0,0 menunjukan soal itu terlalu sukar, sebaliknya
indeks 1,0 menunjukan soalnya terlalu mudah. Didalam istilah evalusi, indeks
kesukaran ini diberi symbol p (P) singkatan dari kara “Proporsi”, dengan
demikian maka soal dengan P sama dengan 0,70 lebih mudah jika dibandingkan
dengan P=0,20 sebaliknya soal dengan P=0,30 lebih sukar dari pada soal dengan
P=0,80.
Melihat besarnya bilangan indeks ini, maka lebih cocok jikabukan
disebut sebagai indeks kesukaran tetapi indeks kemudahan atau indeks
vasilitas, karena semakin mudah soal itu, semakin besar pula bilangan
indeksnya. Akan tetapi telah disepakati bahwa walaupun semakin tinggi indeksnya
menunjukan soal yang semakin mudah, tetapi tetap disebut indeks kesukaran.
Rumus Mencari P adalah :
P = B
JS
Dimana :
P = indeks kesuakran
B = banyaknya siswa yang menjawab soal itu dengan benar
JS = jumlah seluruh siswa dalam Tes
b.
Daya Pembeda
Daya pembeda soal, adalah kemampuan sesuatu soal untuk
membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang
bodoh (berkemampuan rendah). Angka yang menunjukan besarnya daya pembeda
disebut indeks diskriminasi, disingkat D. seperti halnya indeks kesukaran,
indeks diskriminasi (daya pembeda) ini berkisar antara 0,00 – 1,00. Hanya
bedanya indeks kesukaran tidak mengenal tanda negative (-), tetapi pada indeks
diskriminasi ada tanda negative. Tanda negative pada indeks diskriminasi
digunakan jika sesuatu soal “terbalik” menunjukan kualitas testee. Yaitu anak
pandai disebut bodoh dan anak bodoh disebut pandai.
Cara menentukan daya pembeda (nilai D) :
Untuk ini perlu dibedakan antara kelompok kecil (kurang dari
100) dan kelompok besar (100 orang keatas).
1.
Untuk kelompok kecil
Seluruh kelompok testee dibagi dua sama besar 50% kelompok atas
dan 50% kelompok bawah.
2.
Untuk kelompok Besar
Mengingat biaya dan waktu untuk menganalisis, maka untuk
kelompok besar biasanya hanya diambil kedua kutubnya saja, yaitu 27% skor
teratas sebagai kelompok atas (Ja) dan 27% skor terbawah sebagai
kelompok bawah (Jb).
Ja = jumlah kelompok atas
Jb = Jumlah kelompok Bawah
Rumus mencari D
Rumus untuk menentukan Indeks diskriminasi adalah :
D
= Ba Bb = Pa – Pb
Ja Jb
Keterangan :
J = Jumlah peserta Test
Ja = Banyaknya peserta kelompok atas
Jb = Banyaknya peserta kelompok bawah
Ba = Banyaknya peserta kelompok atas yang menjawab
soal itu dengan benar
Bb = Banyaknya peserta kelompok bawah yang menjawab
soal itu dengan benar
Pa = Proporsi peserta kelompok atas yang menjawab
benar (ingat, P sebagai indeks kesukaran)
Pb = Proporsi peserta kelompok bawah yang menjawab
benar
c.
Pola Jawaban Soal
Yang dimaksud pola jawaban disini adalah distribusi testee dalam
hal menentukan pilihan jawaban pada soal bentuk pilihan ganda. Pola jawaban
soal diperoleh dengan menghitung banyaknya testee yang memilih pilihan jawaban
a,b,c atau d atau yang tidak memilih pilihan manapun (blangko). Dalam istilah
evaluasi disebut Omit, disingkat O.
Dan pola jawaban soal dapat ditentukan apakah pengecoh
(distractor) berfungsi sebagai pengecoh dengan baik atau tidak. Pengecoh yang
tidak dipilih sama sekali oleh testee berarti bahwa pengecoh itu jelek, terlalu
menyolok menyesatkan. Sebaliknya sebuah distractor (pengecoh) dapat dikatakan
berfungsi dengan baik apabila distractor tersebut mempunyai daya tarik yang
besara bagi pengikut-pengikut tes yang kurang memahami konsep atau kurang menguasi
bahan.
Dengan melihat pola jawaban soal, dpaat diketahui :
1.
Taraf Kesukaran Soal
2.
Daya Pembeda Soal
3.
Baik dan Tidaknya Distractor
Sesuatu distractor dapat diperlakukan dengan tiga cara yaitu :
1.
Diterima, karena sudah baik
2.
Ditolak, karena tidak baik, dan
3.
Ditulis kembali, karena kurang baik.
Kekurangannya mungkin
hanya terletak pada rumusan kalimatnya sehingga hanya perlu ditulis kembali
dengan perubahan seperlunya. Menulis soal adalah sesuatu pekerjaan yang sulit,
sehingga apabila masih dapat diperbaiki, sebaiknya diperbaiki saja, tidak
dibuang. Suatu distractor dapat dikatakan berfungsi baik jika paling sedikit dipilih
oleh 5% pengikut test.
BAB III
PENUTUP
A. Kesimpulan
Validitas adalah derajad ketepatan
antara data yang terjadi pada obyek penelitian dengan data yang dapat
dilaporkan oleh peneliti atau derajad ketepatan suatu alat ukur tentang
pokok isi atau arti sebenarnya yang diukur. Data yang valid adalah data yang tidak berbeda
antar data yang dilaporkan oleh peneliti dengan data yang sesungguhnya terjadi
pada obyek penelitian. Sebaliknya data yang tidak valid adalah data yang tidak
sesuai dengan apa yang terjadi pada obyek. Validitas penelitian ada dua, yaitu: Pertama,
validitas internal yakni validitas yang berkenaan dengan derajad akurasi desain
penelitian dengan hasil yang dicapai. Kedua validitas
eksternal yakni berkenaan dengan derajad akurasi apakah hasil penelitian dapat
digeneralisasikan atau diterapkan pada populasi dimana sampel tersebut diambil.
Reliabilitas (stabilitas, dapat
dipercaya dan dapat
diramalkan )adalah derajad ketepatan dan
ketelitian atau akurasi yang ditunjukan oleh instrument pengukuran. Obyektivitas adalah
derajad kesepekatan atau interpersonal agreement antar banyak
orang terhadap suatu data dan atu derajad dimana pengukuran yang dilakukan
bebas dari pendapat dan penilaian subyektif, bebas dari bias dan perasaan
orang-orang yang menggunakan tes. Dalam penelitian kuantitatif, untuk
mendapatkan data yang valid dan reliable yang diuji validitas dan
reliabilitasnya adalah intrumen penelitiannya. Sedangkan dalam penelitian
kualitatif yang diuji adalah datanya. Untuk menetapkan keabsahan
data diperlukan teknik pemeriksaan (pengujian). Ada empat kriteria yang
digunakan yaitu:
1.
Pengujian Kredibilitas (derajad keterpercayaan)
a.
Perpanjangan Pengamatan
b.
Meningkatkan Ketekunan
c.
Triangulasi (sumber, teknik, waktu)
d.
Diskusi dengan Teman Sejawat
e.
Analisis Kasus Negatif
f.
Menggunakan Bahan Referensi
g.
Mengadakan Memberchek
2.
Pengujian Transferability (keteralihan)
3.
Pengujian Depenability (kebergantungan)
4.
Pengujian Konfirmability (kepastian)
evaluasi pembelajaran
PRINSIP EVALUASI
Prinsip-prinsip Evaluasi Evaluasi merupakan kegiatan untuk menilai sesuatu keadaan, gejala, atau kegiatan-kegiatan tertentu dengan ...