VALIDITAS DAN RELIABILITAS



BAB II
PEMBAHASAN

1.     Pengertian Validitas dan Reliabilitas

Uji keabsahan data dalam penelitian, sering hanya ditekankan pada uji validitas dan reliabilitas. Dalam penelitian kuantitatif, kriteria utama terhadap data hasil penelitian adalah valid, reliable, dan obyektif. Validitas merupakan derajad ketepatan antara data yang terjadi pada obyek penelitian dengan data yang dapat dilaporkan oleh peneliti.
Validitas adalah derajad ketepatan suatu alat ukur tentang pokok isi atau arti sebenarnya yang diukur. Dengan demikian data yang valid adalah data “yang tidak berbeda” antar data yang dilaporkan oleh peneliti dengan data yang sesungguhnya terjadi pada obyek penelitian. Kalau dalam obyek penelitian terdapat warna merah, maka peneliti akan melaporkan warna merah; kalau dalam obyek penelitian para pegawai bekerja dengan keras, maka peneliti melaporkan bahwa pegawai bekerja dengan keras. Bila peneliti membuat laporan yang tidak sesuai dengan apa yang terjadi pada obyek, maka data tersebut dapat dinyatakan tidak valid.
Terdapat dua macam validitas penelitian, yaitu validitas internal dan validitas eksternal. Validitas internal berkenaan dengan derajad akurasi desain penelitian dengan hasil yang dicapai. Jika dalam desain penelitian dirancang untuk meneliti etos kerja pegawai, maka data yang diperoleh seharusnya adalah data yang akurat tentang etos kerja pegawai. Penelitian menjadi tidak valid, apabila yang ditemukan adalah motivasi kerja pegawai.
Validitas eksternal berkenaan dengan derajad akurasi apakah hasil penelitian dapat digeneralisasikan atau diterapkan pada populasi dimana sampel tersebut diambil. Bila sampel penelitian representative, instrument penelitian valid dan reliable, cara mengumpulkan dan analisis data benar, maka penelitian akan memiliki validitas eksternal yang tinggi.
Dalam hal reliabilitas, Susan Stainback (1988) menyakan bahwa; reability is often defined as the consistency and stability of data or findings. From a positivistic perspective, reability typically is considered to be synonymous with the consistency of data produced by observations made by different researchers (e.g interrater reliability), by the same researcher at different times (e.g test retest), or by spilling a data set in two parts (split half). Reliabilitas berekenaan dengan derajad konsitensi dan stabilitas data atau temuan. “Definisi reliabilitas yang lebih komprehensif adalah derajad ketepatan dan ketelitian atau akurasi yang ditunjukan oleh instrument pengukuran. Istilah-istilah lain sehubungan dengan reliabilitas adalah stabilitas, dapat dipercaya dan dapat diramalkan”.
Dalam pandangan positivistic (kuantitatif), suatu data dinyatakan reliable apabila dua atau lebih peneliti dalam obyek yang sama menghasilkan data yang sama, atau peneliti sama dalam waktu yang berbeda menghasilkan data yang sama, atau sekelompok data bila dipecah menjadi dua menunjukan data yang tida berbeda. Kalau peneliti satu menemukan dalam obyek berwarna merah, maka peneliti yang lain juga demikian. Kalau seorang peneliti dalam obyek kemarin menemukan data berwarna merah, maka sekarang atau besok akan tetatp berwarna merah. Karena reliabilitas berkenaan dengan derajad konsistensi, maka bila ada peneliti lain mengulangi atau mereplikasi dalam penelitian pada obyek yang sam dengan metode yang sama maka akan menghilangkan data yang sama. Suatu data yang reliable atau konsisten akan cenderung valid, walaupun belum tentun valid. Orang yang berbohong secara konsisten akan terlihat valid, walaupun sebenarnya tidak valid.
Obyektivitas berkenaan dengan “derajad kesepekatan” atau interpersonal agreement antar banyak orang terhadap suatu data. Bila dari 100 orang terdapat dari 99 orang menyatakan bahwa terdapat warna merah dalam obyek penelitian itu, sedangkan yang satu orang menyatakan warna lain, maka data tersebut adalah data yang obyektif. Obyektif disini lawannya katanya subyektif. Data yang obyektif akan cenderung valid, walaupun belum tentu valid. Dapat terjedi suatu data yang disepakati banyak orang belum tentu valid, tetapi yang disepakati sedikit orang malah lebih valid. Sebagai contoh terdapat 99 orang menyatakan bahwa si A bukan pencuri (obyektif), dan satu orang menyatakan bahwa si A pencuri (subyektif). Ternyata yang betul adalah pernyataan satu orang, karena yang 99 orang tersebut teman-teman dari si A yang samasama pencuri, sehingga menyatakan si A bukan pencuri.
Dalam penelitian kuantitatif, untuk mendapatkan data yang valid, reliable dan obyektif, maka penelitian dilakukan dengan menggunakan instrument yang valid dan reliable, dan dilakukan pada sampel yang mendekati jumlah populasi dan pengumpulan serta analisis data dilakukan dengan cara yang benar. Dalam penelitian kuantitatif, untuk mendapatkan data yang valid dan reliable yang diuji validitas dan reliabilitasnya adalah intrumen penelitiannya. Sedangkan dalam penelitian kualitatif yang diuji adalah datanya. Oleh karena itu Susan Stainback (1988) menyatakan bahwa penelitian kuantitatif lebih menekankan pada aspek reliabilitas, sedangkan penelitian kualitatif lebih pada aspek validitas.
“Dalam penelitian kualitatif, temuan atau data dinyatakan valid apabila tida perbedaan antara yang dilaporkan peneliti dengan apa yang sesungguhnya terjadi pada obyek yang diteliti”. Tetapi perlu diketahui kebenaran realitas data menurut penelitian kualitatif tidak bersifat tunggal, tetapi jamak dan tergantung pada konstruksi manusia dibentuk dalam diri seseorang sebagai hasil proses mental tiap individu dengan berbagai latar belakangnya. Oleh karena itu bila terdapat 10 peneliti dengan latar belakang yang berbeda, meneliti pada obyek yang sama, akan mendapatkan 10 temuan, dan semuanya dinyatakan valid, kalau apa yang ditemukan itu tidak berbeda dengan kenyataan sesungguhnya yang terjadi pada obyek yang diteliti. Dalam obyek yang sama peneliti yang berlatar belakang Pendidikan akan menemukan data yang berbeda dengan peneliti yang berlatar belakang Manajemen, Antropologi, Sosiologi, Kedokteran, Teknik, dan sebagainya.
Pengertian reliabiltas dalam penelitian kuantitatif, sangat berbeda dengan reliabilitas dalam penelitian kualitatif. Hal ini terjadi karena terdapat perbedaan paradigma dalam melihat relitas. Menurut penelitian kualitatif, suatu realitas itu bersifat majmuk/ ganda, dinamis/ selalu berubah, sehingga tidak ada yang konsisten, dan berulang seperti semula. Heraclites dalam Nasution (1988) menyatakan bahwa “kita tidak bisa dua kali masuk sungai yang sama” air mengalir terus, waktu terus berubah, situasi senantiasa berubah dan demikian pula perilaku manusia yang terlibat dalam situasi social. Dengan demikian tidak ada suatu data yang tetap/ konsisten/ stabil.
Selain itu, cara melaporkan penelitian ideosyneratic dan indivudualistik, selalu berbeda dari orang perorang. Tiap peneliti member laporan menurut bahasa dan jalan pikiran sendiri. Demikian dalam pengumpulan data, pencatatan hasil observasi dan wawancara terkandung unsure-unsur individualistic. Proses penelitian sendiri selalu bersifat persolistik dan tidak ada dua peneliti akan menggunakan dua cara yang persis sama.
2.     Kreteria Keabsahan Data
Untuk menetapkan keabsahan data diperlukan teknik pemeriksaan (pengujian). Pelaksanaan tekhnik pemeriksaan didasarkan atas sejumlah kriteria tertentu. Ada empat kriteria yang digunakan yaitu derajat kepercayaan (credibility), keteralihan (transferability), kebergantungan (dependability) dan kepastian (confirmability).
1.     PengujianKredibilitas (derajad keterpercayaan)
a.      Perpanjangan Pengamatan
Melalui perpanjangan pengamatan berarti peneliti kembali ke lapangan, melakukan pengamatan, melakukan wawancara dengan sumber data, baik yang pernah ditemui maupun yang baru ditemui. Dengan perpanjangan pengamatan ini, hubungan peneliti dengan narasumber akan semakin terbentuk dan semakin akrab, semakin terbuka, saling mempercayai sehingga tidak ada informasi yang disembunyikan lagi. Pada tahap awal memasuki lapangan,  peneliti masih dianggap orang asing, masih dicurigai sehingga informasi yang diberikan belum lengkap, tidak mendalam, dan mungkin masih banyak yang dirahasiakan. Dengan perpanjangan pengamatan ini, peneliti mengecek kembali apakah data yang diberikan selama ini merupakan data yang sudah benar atau tidak. Bila data yang telah diperoleh selama ini setelah dicek kembali pada sumber data asli atau sumber data lain tidak benar, peneliti melakukan pengamatan lagi secara lebih luas dan mendalam sehingga diperoleh data yang pasti kebenarannya. Lamanya perpanjangan pengamatan ini dilakukan sangat bergantung kepada kedalaman, keluasan, dan kepastian data.

b.     Meningkatkan Ketekunan
Meningkat ketekunan berarti melakukan pengamatan secara lebih cermat dan berkesinambungan. Dengan cara tersebut, kepastian data dan urutan peristiwa akan dapat direkam secara pasti dan sistematis. Meningkatkan ketekunan ibarat mengecek soal-soal atau makalah yang dikerjakan, ada yang salah atau tidak. Dengan meningkatkan ketekunan itu, peneliti dapat melakukan pengecekan kembali apakah data yang telah ditemukan itu salah atau tidak. Selain itu, peneliti juga dapat mendeskripsi data secara akurat dan sistematis.
Kekurang tekunan pengamatan terletak pada pengamatan terhadap pokok persoalan yang dilakukan secara terlalu awal. Hal itu mungkin dapat disebabkan oleh tekanan subyek atau sponsor atau barangkali juga karena ketidaktoleransian subyek, atau sebaliknya peneliti terlalu cepat mengarahkan fokus penelitiannya walaupuntampaknya belum patut dilakukan demikian. Persoalan itu bisa terjadi pada situasi ketika subyek berdusta, menipu, atau berpura-pura, sedangkan peneliti sudah sejak awal mengarahkan fokusnya, padahal barangkali belum waktunya berbuat demikian.
c.      Triangulasi
Triangulasi dalam pengujian kredibilitas ini diartikan sebagai pengecekan data dari berbagai sumber dengan berbagai cara dan berbagai waktu.
Dengan demikian, triangulasi terdiri atas triangulasi sumber, triangulasi teknik,  dan triangulasi waktu.
1)     Triangulasi Sumber
Triangulasi sumber dilakukan dengan cara mengecek data yang diperoleh dari beberapa sumber. Sebagai contoh, untuk menguji kredibilitas data tentang gaya kepemimpinan seseorang, maka pengumpulan dan pengujian data yang telah diperoleh dilakukan kebawahan yang dipimpin, ke atasan yang menugasi, dan keteman kerja yang merupakan kelompok kerjasama. Data dari tiga sumber tersebut, tidak bisa di rata-ratakan seperti dalam penelitian kuantitatif, tetapi dideskripsikan, dikategorisasikan, mana pandangan yang sama, yang berbeda, dan mana yang spesifik dari tiga sumber data tersebut. Selanjutnya diminta kesepakatan (membercheck) dengan tiga sumber data tersebut untuk mendapatkan kesimpulan.
2)     Triangulasi Teknik
Triangulasi teknik dilakukan dengan cara mengecek data pada sumber yang sama dengan teknik yang berbeda.
3)     Triangulasi Waktu
Triangulasi waktu berkaitan dengan keefektifan waktu. Data yang dikumpulkan dengan teknik wawancara di pagi hari pada saat narasumber masih segar dan belum banyak masalah akan memberikan data yang valid sehingga lebih kredibel.
d.     Diskusi dengan Teman Sejawat
Teknik ini dilakukan dengan cara mengekspos hasil sementara atau hasil yang diperoleh dalam bentuk diskusi analitik denga rekan-rekan sejawat. Teknik ini mengandung beberapa maksud sebagai salah satu teknik pemeriksaan keabsahan data. Pertama, untuk membuat agar peneliti tetap mempertahankan sikap terbuka dan kejujuran. Kedua, diskusi denga sewajat ini memberikan suatu kesempatan awal yang baik untuk mulai menjajaki dan menguji hipotesis yang muncul dari pemikiran peneliti.
e.      Analisis Kasus Negatif
Kasus negatif adalah kasus yang tidak sesuai atau berbeda dengan hasil penelitian hingga pada saat tertentu. Peneliti berusaha mencari data yang berbeda atau bahkan bertentangan dengan data yang telah ditemukan. Bila tidak ada lagi data yang berbeda atau bertentangan dengan temuan, berarti data yang ditemukan sudah dapat dipercaya.
f.      Menggunakan Bahan Referensi
Bahan referensi adalah adanya pendukung untuk membuktikan data yang telah ditemukan oleh peneliti. Bahan referensi ini dapat berupa foto-foto, rekaman, dan dokumen autentik. 
g.     Mengadakan Memberchek
Memberchek adalah proses pengecekan data yang diperoleh peneliti kepada pemberi data. Tujuan memberchek adalah agar informasi yang diperoleh yang akan digunakan dalam penulisan laporan sesuai dengan apa yang dimaksud sumber data dan informan.
2.     Pengujian Transferability (keteralihan)
Transferability merupakan validitas eksternal dalam penelitian kuantitatif. Validitas eksternal menunjukan derajad ketepatan atau dapat diterapkannya hasil penelitian ke populasi di mana sampel tersebut diambil.
3.     Pengujian Depenability (kebergantungan)
Depenability dalam penelitian kuantitatif, dependability disebut reliabilitas. Suatu penelitian yang reliable adalah apabila orang lain dapat mengulangi/ mereplikasi proses penelitian tersebut. Dalam penelitian kualitatif, ujidepenabilitydilakukan dengan melakukan audit terhadap keseluruhan proses penelitian. Sering terjadi peneliti tidak melakukan proses penelitian kelapangan, tetapi bias memberikan data. Peneliti seperti ini perlu diuji depenabilitynya. Jika proses penelitian tidak dilakukan tetapi datanya ada, maka penelitian tersebut tida reliable atau dependable. Bagaimana peneliti mulai menetukan masalah/ focus, memasuki lapangan, menentukan sumber data, melakukan analisis data, melakukan uji keabsahan data, sampai membuat kesimpulan harus dapat ditunjukan oleh peneliti. Jika peneliti tidak mempunyai dan tidak dapat menunjukan jejak aktivitas lapangannya maka depebilitas penelitiannnya patut diragukan.
4.     Pengujian Konfirmability (kepastian)
Pengujian konfirmability dalam penelitian kuantitatif disebut dengan uji obyektivitas penelitian. Penelitian dikatakan obyektif  bila hasil penelitian telah disepakati banyak orang. Dalam penelitian kualitatif, uji konfirmabilitymirip dengan dependability, sehingga pengujiannya dapat dilakukan secara bersamaan. Menguji konfirmabilityberarti menguji hasil penelitian dikaikan dengan proses yang dilakukan. Bila hasil penelitian merupakan fungsi dari proses penelitian yang dilakukan, maka penelitian tersebut telah memenuhi standar konfirmability. Dalam penelitian jangan sampai proses tidak ada, tetapi hasilnya ada.
3.     Tes Tertulis Untuk Prestasi Belajar
1.     Bentuk-bentuk Tes
Dalam hal ini kita bedakan atas dua bentuk tes, yaitu sebagai berikut :
a.      Tes Subjektif
Tes subjektif yang pada umumnya berbentuk esai (uraian). Tes bentuk esai adalah sejenis tes kemajuan belajar yang memerlukan jawaban yang bersifat pembahasan atau uraian kata-kata. Ciri-ciri pertanyaannya didahului dengan kata-kata seperti : uraikan, jelaskan, mengapa, bagaimana, bandingkan, simpulkan dan sebagainya.
Soal-soal bentuk esai biasanya jumlahnya tidak banyak, hanya sekitar 5-10 buah soal dalam waktu kira-kira 90 s.d 120 menit. Soal-soal bentuk esai ini menuntut kemampuan siswa untuk dapat mengorganisir, menginterprestasi, menghubungkan pengertian-pengertian yang telah dimiliki. Dengan singkat dapat dikatakan bahwa tes esai menuntut siswa untuk dapat mengingat-ingat dan mengenal kembali, dan terutama harus mempunyai daya kreativitas yang tinggi.
b.     Tes Objektif
Tes objektif adalah tes yang dalam pemeriksaannya dapat dilakukan secara objektif. Hal ini memang dimaksudkan untuk mengatasi kelemahan-kelemahan dari tes bentuk esai. Dalam penggunaan tes objektif ini jumlah soal yang diajukan jauh lebih banyak daripada tes esai. Kadang-kadang untuk tes yang berlangsung selama 60 menit dapat diberikan 30-40 buah soal.
2.     Macam-macam tes objektif
a.     Tes Benar-Salah (True-False)
Soal-soalnya berupa pernyataan-pernyataan (statement). Statement tersebut ada yang benar dan ada yang salah. Orang-yang ditanya bertugas untuk menandai masing-masing pernyataan itu dengan melingkari huruf B jika pernyataan itu betul menurut pendapatnya dan melingkari huruf S jika pernyataannya salah.
b.     Tes Pilihan Ganda (Multiple Choice Test)
Multiple Choice Test terdiri atas suatu keterangan atau pemberitahuan tentang suatu pengertian yang belum lengkap. Dan untuk melengkapinya harus memilih satu dari beberapa kemungkinan jawaban yang telah disediakan. Atau multiple choice test terdiri atas bagian keterangan (stem) dan bagian kemungkinan jawaban atau alternative (options). Kemungkinan jawaban (option) terdiri atas satu jawaban yang benar yaitu kunci jawaban dan beberapa pengecoh (distractor).
c.      Menjodohkan (Matching Test)
Matching Test dapat kita ganti dengan istilah mempertandingkan, mencocokkan, memasangkan, atau menjodohkan. Matching Test terdiri atas satu seri pertanyaan dan satu seri jawaban. Masing-masing pertanyaan mempunyai jawabannya yang tercantum dalam seri jawaban. Tugas pengisi ialah mencari dan menempatkan jawaban-jawaban sehingga sesuai atau cocok dengan pertanyaannya.
d.     Tes Isian (Completion Test)
Completion Test biasa kita sebut dengan istilah tes isian, tes menyempurnakan, atau tes melengkapi. Completion test terdiri atas kalimat-kalimat yang ada bagian-bagiannya yang dihilangkan. Bagian yang dihilangkan atau yang harus diisi oleh pengisi ini adalah merupakan pengertian yang kita minta dari pengisi.

3.     Pengukuran Ranah Afektif
Pengukuran ranah afektif tidaklah semudah mengukur ranah kognitif. Pengukuran ranah afektif tidak dapat dilakukan setiap saat (dalam arti pengukuran formal) karena perubahan tingkah laku siswa tidak dapat berubah sewaktu-waktu. Pengubah sikap seseorang memerlukan waktu yang relative lama. Demikian juga pengembangan minat dan penghargaan serta nilai-nali.
Di dalam petunjuk Pelaksanaan Penilaian Pendidikan Sejarah Perjuangan Bangsa (PSPB) disebutkan bahwa penilaian ranah kognitif bertujuan mengukur pengembangan penalaran, sedangkan tujuan penilaian afektif adalah sebagai berikut :
a.      Untuk mendapatkan umpan balik (feedback), baik bagi guru maupun siswa sebagai dasar untuk memperbaiki proses belajar-mengajar dan mengadakan program perbaikan (remedial program) bagi anak didiknya.
b.     Untuk mengetahui tingkat perubahan tingkah laku anak didik yang dicapai, yang antara lain diperlukan sebagai ahan untuk perbaikan tingkah laku anak didik, pemberian laporan kepada orang tua, dan penentuan lulus tidaknya anak didik.
c.      Untuk menenmpatkan anak didik dalam situasi belajar mengajar yang tepat, sesuai dengan tingkat pencapaian dan kemampuan serta karakteristik anak didik.
d.     Untuk mengenal latar belakang kegiatan belajar dan kelainan tingkah laku anak didik. (Depdikbud, 1983:2)
Sehubungan dengan tujuan penilaiannya ini maka yang menjadi sasaran penilaian kawasan afektif adalah perilaku anak didik, bukan pengetahuannya.  Sebagai contoh, siswa bukan dituntut untuk mengetahui sebab –sebab dibentuknya BPUPKI, tetapi bagaimana sikapnya terhadap pembentukan BPUPKI tersebut.
Pertanyaan afektif tidak menuntut jawaban benar atau salah, tetapi jawaban yang khusus tentang dirinya mengenai minat, sikap, dan internalisasi nilai (oleh Cronbach dibedakan antara maximum performance dengan typical performance attitude) (Cronbach, 1970).

4.     Pengukuran Ranah Psikomotor
Pengukuran ranah psikomotor dilakukan terhadap hasil-hasil belajar yang berupa penampilan. Namun demikian biasanya pengukuran ranah ini disatukan atau dimulai dengan pengukuran ranah kognitif sekaligus. Misalnya, penampilannya dalam menggunakan thermometer diukur mulai dari pengetahuan mereka mengenai alat tersebut, pemahaman tentang alat  dan penggunaannya (aplikasi), kemudian baru cara menggunakannya dalam bentuk keterampilan. Untuk pengukuran yang terakhir ini harus diperinci antara lain: cara memegang, cara meletakkan/menyelipkan kedalam ketiak atau muut, cara membaca angka, cara mengembalikan ketempatnya dan sebagainya. Ini semua tergantung dari kehendak kita, asal tujuan pengukuran dapat tercapai.
Instrument yang digunakan mengukur keterampilan biasanya berupa matriks. Ke bawah menyatakan perperincian aspek (bagian keterampilan) yang akan diukur, kekanan menunjukkan besarnya skor yang dapat dicapai.

4.     Menganalisis Hasil Test
1.     Menilai Test yang Dibuat Sendiri
Ada 4 cara untuk menilai test, yaitu:
a.      Cara pertama meneliti secara jujur soal – soal yang sudah disusun, kadang – kadang dapat diperoleh jawaban tentang ketidak jelasan perintah atau bahasa, taraf kesukaran, dan lain – lain keadaan soal tersebut.
b.     Cara kedua adalah mengadakan analisis soal. Analisi soal adalah suatu prosedur yang sistematis, yang akan memberikan informasi – informasi yang sangat khusus terhadap butir test yang kita susun. Analisis soal terutama dapat dilakukan untuk test objektif. Hal ini tidak berarti bahwa test uraian tidak dapat dianalisis, akan tetapi memang dalam menganalisis butir test uraian, belum ada pedoman secara standar.
c.      Cara ketiga adalah mengadakan checking validitas. Validitas yang paling penting dari test buatan guru adalah validitas kulikuler. Untuk mengadakan checking validitas kulikuler, kita harus merumuskan tujuan setiap bagian pelajaran secara khusus dan jelas sehingga setiap soal dapat kita jodohkan dengan setiap tujuan khusus tersebut.
d.     Cara keempat adalah dengan mengadakan checking reabiitas. Salah satu indicator untuk test yang mempunyai reabilitas yang tinggi adalah bahwa kebanyakan dari soal – soal test itu mempunyai daya beda yang tinggi.
  
2.     Analisis butir soal ( item analysis)
Analisis soal anatara lain bertujuan untuk mengadakan identifikasi soal – soal yang baik, kurang baik, dan soal yang jelek. Dengan analisis soal dapat diperoleh informasi tentang kejelekan tentang sebuah soal dan “ petunjuk” untuk mengadakan perbaikan.
a.     Taraf kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan sisiwa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena diluar jangkauan.
Bilangan yang menunjukan sukar dan mudahnya sesuatu soal disebut indeks kesukaran (difficulty index). Besarnya indeks kesukaran antara 0,00 sampai denga 1,0. Indeks kesukaran ini menunjukan taraf kesukaran soal. Soal dengan indeks kesukaran 0,0 menunjukan soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukan soalnya terlalu mudah. Didalam istilah evalusi, indeks kesukaran ini diberi symbol p (P) singkatan dari kara “Proporsi”, dengan demikian maka soal dengan P sama dengan 0,70 lebih mudah jika dibandingkan dengan P=0,20 sebaliknya soal dengan P=0,30 lebih sukar dari pada soal dengan P=0,80.
Melihat besarnya bilangan indeks ini, maka lebih cocok jikabukan disebut sebagai indeks kesukaran tetapi indeks kemudahan atau indeks vasilitas, karena semakin mudah soal itu, semakin besar pula bilangan indeksnya. Akan tetapi telah disepakati bahwa walaupun semakin tinggi indeksnya menunjukan soal yang semakin mudah, tetapi tetap disebut indeks kesukaran.
Rumus Mencari P  adalah :
P = B
      JS
      Dimana :
P = indeks kesuakran
B = banyaknya siswa yang menjawab soal itu dengan benar
JS = jumlah seluruh siswa dalam Tes

b.     Daya Pembeda
Daya pembeda soal, adalah kemampuan sesuatu soal untuk membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang bodoh (berkemampuan rendah). Angka yang menunjukan besarnya daya pembeda disebut indeks diskriminasi, disingkat D. seperti halnya indeks kesukaran, indeks diskriminasi (daya pembeda) ini berkisar antara 0,00 – 1,00. Hanya bedanya indeks kesukaran tidak mengenal tanda negative (-), tetapi pada indeks diskriminasi ada tanda negative. Tanda negative pada indeks diskriminasi digunakan jika sesuatu soal “terbalik” menunjukan kualitas testee. Yaitu anak pandai disebut bodoh dan anak bodoh disebut pandai.
Cara menentukan daya pembeda (nilai D) :
Untuk ini perlu dibedakan antara kelompok kecil (kurang dari 100) dan kelompok besar (100 orang keatas).
1.     Untuk kelompok kecil
Seluruh kelompok testee dibagi dua sama besar 50% kelompok atas dan 50% kelompok bawah.
2.     Untuk kelompok Besar
Mengingat biaya dan waktu untuk menganalisis, maka untuk kelompok besar biasanya hanya diambil kedua kutubnya saja, yaitu 27% skor teratas sebagai kelompok atas (Ja) dan 27% skor terbawah sebagai kelompok bawah (Jb).
Ja = jumlah kelompok atas
Jb = Jumlah kelompok Bawah

Rumus mencari D
Rumus untuk menentukan Indeks diskriminasi adalah :
D = Ba     Bb  = Pa – Pb
        Ja       Jb                                                                


Keterangan :
J = Jumlah peserta Test
Ja = Banyaknya peserta kelompok atas
Jb = Banyaknya peserta kelompok bawah
Ba = Banyaknya peserta kelompok atas yang menjawab soal itu dengan benar
Bb = Banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar
Pa = Proporsi peserta kelompok atas yang menjawab benar (ingat, P sebagai indeks kesukaran)
Pb = Proporsi peserta kelompok bawah yang menjawab benar

c.      Pola Jawaban Soal
Yang dimaksud pola jawaban disini adalah distribusi testee dalam hal menentukan pilihan jawaban pada soal bentuk pilihan ganda. Pola jawaban soal diperoleh dengan menghitung banyaknya testee yang memilih pilihan jawaban a,b,c atau d atau yang tidak memilih pilihan manapun (blangko). Dalam istilah evaluasi disebut Omit, disingkat O.
Dan pola jawaban soal dapat ditentukan apakah pengecoh (distractor) berfungsi sebagai pengecoh dengan baik atau tidak. Pengecoh yang tidak dipilih sama sekali oleh testee berarti bahwa pengecoh itu jelek, terlalu menyolok menyesatkan. Sebaliknya sebuah distractor (pengecoh) dapat dikatakan berfungsi dengan baik apabila distractor tersebut mempunyai daya tarik yang besara bagi pengikut-pengikut tes yang kurang memahami konsep atau kurang menguasi bahan.
Dengan melihat pola jawaban soal, dpaat diketahui :
1.     Taraf Kesukaran Soal
2.     Daya Pembeda Soal
3.     Baik dan Tidaknya Distractor

Sesuatu distractor dapat diperlakukan dengan tiga cara yaitu :
1.     Diterima, karena sudah baik
2.     Ditolak, karena tidak baik, dan
3.     Ditulis kembali, karena kurang baik.
 Kekurangannya mungkin hanya terletak pada rumusan kalimatnya sehingga hanya perlu ditulis kembali dengan perubahan seperlunya. Menulis soal adalah sesuatu pekerjaan yang sulit, sehingga apabila masih dapat diperbaiki, sebaiknya diperbaiki saja, tidak dibuang. Suatu distractor dapat dikatakan berfungsi baik jika paling sedikit dipilih oleh 5% pengikut test.

BAB III
PENUTUP
A.    Kesimpulan
Validitas adalah derajad ketepatan antara data yang terjadi pada obyek penelitian dengan data yang dapat dilaporkan oleh peneliti atau  derajad ketepatan suatu alat ukur tentang pokok isi atau arti sebenarnya yang diukur. Data yang valid adalah data yang tidak berbeda antar data yang dilaporkan oleh peneliti dengan data yang sesungguhnya terjadi pada obyek penelitian. Sebaliknya data yang tidak valid adalah data yang tidak sesuai dengan apa yang terjadi pada obyek. Validitas penelitian ada dua, yaitu: Pertama, validitas internal yakni validitas yang berkenaan dengan derajad akurasi desain penelitian dengan hasil yang dicapai. Kedua validitas eksternal yakni berkenaan dengan derajad akurasi apakah hasil penelitian dapat digeneralisasikan atau diterapkan pada populasi dimana sampel tersebut diambil.
Reliabilitas (stabilitas, dapat dipercaya dan dapat diramalkan )adalah derajad ketepatan dan ketelitian atau akurasi yang ditunjukan oleh instrument pengukuran. Obyektivitas adalah derajad kesepekatan atau interpersonal agreement antar banyak orang terhadap suatu data dan atu derajad dimana pengukuran yang dilakukan bebas dari pendapat dan penilaian subyektif, bebas dari bias dan perasaan orang-orang yang menggunakan tes. Dalam penelitian kuantitatif, untuk mendapatkan data yang valid dan reliable yang diuji validitas dan reliabilitasnya adalah intrumen penelitiannya. Sedangkan dalam penelitian kualitatif yang diuji adalah datanya.  Untuk menetapkan keabsahan data diperlukan teknik pemeriksaan (pengujian). Ada empat kriteria yang digunakan yaitu:
1.     Pengujian Kredibilitas (derajad keterpercayaan)
a.      Perpanjangan Pengamatan
b.     Meningkatkan Ketekunan
c.      Triangulasi (sumber, teknik, waktu)
d.     Diskusi dengan Teman Sejawat
e.      Analisis Kasus Negatif
f.      Menggunakan Bahan Referensi
g.     Mengadakan Memberchek
2.     Pengujian Transferability (keteralihan)
3.     Pengujian Depenability (kebergantungan)
4.     Pengujian Konfirmability (kepastian)

evaluasi pembelajaran

PRINSIP EVALUASI

Prinsip-prinsip Evaluasi Evaluasi merupakan kegiatan untuk menilai sesuatu keadaan, gejala, atau kegiatan-kegiatan tertentu dengan ...

- Copyright © nonformal education - Blogger Templates - Powered by Blogger - Designed by Johanes Djogan -