Posted by : Unknown
Minggu, 08 April 2018
BAB II
PEMBAHASAN
A.
Masalah
Tes
1. Pengertian
Istilah
tes diambil dari kata testum suatu
pengertian dari bahasa Prancis kuno yang berarti piring untuk menyisihkan
logam-logam mulia. Ada juga yang mengartikan sebagai sebuah piring yang dibuat
dari tanah.
Seorang
ahli bernama James Ms. Cattel, pada tahun 1890 telah memperkenalkan pengertian
tes ini kepada masyarakat melalui bukunya yang berjudul Mental and Test Measurement. Selanjutnya di Amerika Serikat tes ini
berkembang dengan cepat sehingga dalam tempo yang tidak begitu lama masyarakat
mulai menggunakannya.
Banyak
ahli yang mulai mengembangkan tes ini untuk berbagai bidang, namun yang
terkenal adala sebuah tes intelegensi yang disusun oleh seorang Prancis bernama
Binet, yang kemudian dibantu penyempurnaannya oleh Simon, sehingga tes tersebut
dikenal sebagai tes Binet Simon (tahun 1904). Dengan alat ini Binet dan Simon
berusaha untuk membeda-bedakan anak menurut intelegansinya. Dari pekerjaan
Binet dan Simon inilah kemudian kita kenal istilah-istilah: umur kecerdasan (mental age), umur kalender (chronological age), dan indeks
kecerdasan. Intelegensi atau Intelligence
Quotient (IQ).
Sebagai
pengembangannya, Yerkes di Amerika Serikat menyusun tes kelompok yang digunakan
untuk menyeleksi calon militer sebanyak-banyaknya dalam waktu yang singkat
karena diperlukan pada waktu Perang Dunia I. tes ini dikenal dengan nama Army Alpha dan Army Betha.
Didorong
oleh munculnya statistik dalam penganalisisan data dan informasi, maka akhirnya
tes ini digunakan dalam berbagai bidang seperti tes kemampuan dasar, tes
kelelahan perhatian, tes ingatan, tes minat, tes sikap, dan sebagainya. Yang
terkenal penggunaannyadisekolah hanyalah tes prestasi belajar.
Sebelum
sampai kepada uaraian yang lebih jauh, maka akan diterangkan dahulu arti dari
beberapa istilah-istilah yang berhubungan dengan tes ini.
a. Tes
(Sebelum
ada ejaan yang disempurnakan dalam bahasa Indonesia ditulis dengan test).
Merupakan alat atau prosedur yang digunakan untuk mengetahui atau mengukur
sesuatu dalam suasana, dengan cara dan aturan-aturan yang sudah ditentukan.
Untuk mengerjakan tes ini tergantung dari petunjuk yang diberi jawaban
misalnya: melingkari salah satu huruf didepan pilihan jawaban, menerangkan,
mencoret jawaban yang salah, melakukan tugas atau suruhan, menjawab secara
lisan, dan sebagainya.
b. Testing
Testing
merupakan saat pada waktu tes itu dilaksanakan. Dapat juga dikatakan testing
adalah saat pengambilan tes.
c. Testee
(Dalam
istilah Indonesia tercoba) adalah responden yang sedang mengerjakan tes.
Orang-orang
inilah yang akan dinilai atau diukur, baik mengenai kemampuan, minat bakat,
pencapaian, dan sebagainya.
d. Tester
(Dalam
istilah Indonesia pencoba) adalah orang yang diserahi untuk melaksanakan
pengambilan tes terhadap para responden. Dengan kata lain, tester adalah subjek
evaluasi (tetapi adakalanya hanya orang yang ditunjuk oleh subjek evaluasi
untuk melaksanakan tugasnya).
Tugas
tester antara lain:
· Mempersiapkan
ruangan dan perlengkapan yang diperlukan
· Membagikan
lembaran tes dan alat-alat lain untuk mengerjakannya
· Menerangkan
cara mengerjakan tes
· Mengawasi
responden mengerjakan tes
· Memberikan
tanda-tanda waktu
· Mengumpulkan
pekerjaan responden
· Mengisi
berita acara atau laporan yang diperlukan (jika ada)
2. Persyaratan
Tes
Persyaratan
Pada
bagian permulaan buku ini telah disinggung bahwa mengukur panjang sisi meja
dengan menggunakan karet elastis yang diulur-ulur, sama halnya dengan tidak
mengukur. Hasil ukurannya tidak akan dapat dipercaya. Akan tetapi apabila
keadaannya memang terpaksa, yakni apabila kita harus melakukan pengukuran
padahal yang ada di situ hanyalah sehelai tali karet elastis, maka kita dapat
menggunakan tali itu asal menggunakannya mengikuti aturan tertentu, yakni tidak
boleh ditarik-tarik.
Apabila
situasi ini kita pindahkan kepada pelaksanaan evaluasi atau tes, maka dapat
disajikan dalam situasi berikut:
· Seorang
guru yang belum berpengalaman menyusun tes, mengadakan tes Bahasa Indonesia.
Kepada siswa diberikan sebuah bacaan panjang dan beberapa pertanyaan yang
dimaksudkan untuk mengukur kemampuan siswa menangkap isi bacaan tersebut,
tetapi hanya meliputi bagian awal dari bacaan saja. Di samping itu, siswa
diminta untuk mengambil beberapa kata sukar dari bacaan itu dan menerangkan
artinya. Pada waktu tes berlangsung, guru menungguinya dengan teliti dan tidak
memberi kesempatan kepada siswa untuk saling bekerja sama. Tes berjalan dengan
tertib.
B.
Tes
Karakteristik Evaluasi Pembelajaran
Secara
sederhana, Zainal Arifin (2011 : 69) mengemukakan karakteristik instrumen
evaluasi yang baik adalah “valid, reliabel, relevan, representatif, praktis,
deskriminatif, spesifik dan proporsional”.
1. Kevalidan
Valid
artinya suatu alat ukur dapat dikatakan valid jika betul-betul mengukur apa
yang hendak diukur secara tepat. Misalnya, alat ukur matapelajaran Ilmu Fiqih,
maka alat ukur tersebut harus betul-betul dan hanya mengukur kemampuan peserta
didik dalam mempelajari Ilmu Fiqih, tidak boleh dicampuradukkan dengan materi
pelajaran yang lain.
Validitas
suatu alat ukur dapat ditinjau dari berbagai segi, antara lain validitas
ramalan (predictive validity), validitas bandingan (concurent validity), dan
validitas isi (content validity), validitas konstruk (construct validity), dan
lain-lain.
2. Realible
Reliabel artinya suatu
alat ukur dapat dikatakan reliabel atau handal jika ia mempunyai hasil yang
taat asas (consistent). Misalnya, suatu alat ukur diberikan kepada sekelompok
peserta didik saat ini, kemudian diberikan lagi kepada sekelompok peserta didik
yang sama pada saat yang akan datang, dan ternyata hasilnya sama atau mendekati
sama, maka dapat dikatakan alat ukur tersebut mempunyai tingkat reliabilitas
yang tinggi.
3. Relevan
Relevan artinya alat
ukur yang digunakan harus sesuai dengan standar kompetensi, kompetensi dasar,
dan indikator yang telah ditetapkan. Alat ukur juga harus sesuai dengan domain
hasil belajar, seperti domain kognitif, afektif, dan psikomotor. Jangan sampai
ingin mengukur domain kognitif menggunakan alat ukur non-tes. Hal ini tentu
tidak relevan.
4. Representatif
Representatif artinya
materi alat ukur harus betul-betul mewakili dari seluruh materi yang
disampaikan. Hal ini dapat dilakukan bila guru menggunakan silabus sebagai
acuan pemilihan materi tes. Guru juga harus memperhatikan proses seleksi
materi, mana materi yang bersifat aplikatif dan mana yang tidak, mana yang
penting dan mana yang tidak.
5. Praktis
Praktis artinya mudah
digunakan. Jika alat ukur itu sudah memenuhi syarat tetapi sukar digunakan,
berarti tidak praktis. Kepraktisan ini bukan hanya dilihat dari pembuat alat
ukur (guru), tetapi juga bagi orang lain yang ingin menggunakan alat ukur
tersebut.
6. Deskriminatif
Deskriminatif artinya
adalah alat ukur itu harus disusun sedemikian rupa, sehingga dapat menunjukkan
perbedaan-perbedaan yang sekecil apapun. Semakin baik suatu alat ukur, maka
semakin mampu alat ukur tersebut menunjukkan perbedaan secara teliti. Untuk
mengetahui apakah suatu alat ukur cukup deskriminatif atau tidak, biasanya
didasarkan atas uji daya pembeda alat ukur tersebut.
7. Spesifik
Spesifik artinya suatu
alat ukur disusun dan digunakan khusus untuk objek yang diukur. Jika alat ukur
tersebut menggunakan tes, maka jawaban tes jangan menimbulkan ambivalensi atau
spekulasi.
8. Proporsional
Proporsional artinya
suatu alat ukur harus memiliki tingkat kesulitan yang proporsional antara
sulit, sedang dan mudah. Begitu juga ketika menentukan jenis alat ukur, baik
tes maupun non-tes.
C.
Persyaratan
Evaluasi Pembelajaran
1. Syarat
evaluasi
Langkah
pertama yang perlu ditempuh guru dalam menilai prestasi belajar siswa adalah
menyusun alat evaluasi(test instrument) yang sesuai dengan kebutuhan, dalam
artian tidak menyimpang dari indicator dan jenis prestasi yang diharapkan.
Persyaratan
pokok penyusunan alat evaluasi yang baik dalam perspektif psikologi belajar
(The Psychology of learning) meliputi dua macam, yakni: Reliabilitas dan Validitas
(Cross, 1974; Barlow, 1985; Butler, 1990).
a) Reliabilitas
Secara sederhana,
reliabilitas (reliability) berarti hal tahan uji atau dapat dipercaya.Sebuah
alat evaluasi dipandang reliable atau tahan uji apabila memiliki konsistensi
atau keajegan hasil.
b) Validitas
Validitas berarti keabsahan atau
kebenaran. Sebuah alat evaluasi dipandang valid atau abash apabila dapat
mengukur apa yang seharusnya diukur.
Syarat-syarat umum yang harus dipenuhi
dalam mengadakan kegiatan evaluasi dalam proses pendidikan menurut Dimyati dan
Mudjiono (2006:194-198) terurai sebagai berikut :
a) Kesahihan
Kesahihan menggantikan
kata validitas (validity) yang dapat diartikan sebagai ketepatan evaluasi mengevaluasi
apa yang seharusnya di evaluasi. untuk memperoleh hasil evaluasi yang sahih,
dibutuhkan insturmen yang memiliki/memenuhi syarat-syarat kesahihan suatu
instrumental evaluasi. Kesahihan instrument evaluasi diperoleh melalui hasil
pemikiran dan hasil pengalaman.
b) Keterandalan
Keterandalan evaluasi
berhubungan dengan masalah kepercayaan, yakni tingkat kepercayaan bahwa suatu
instrument evaluasi mampu memberikan hasil yang tepat. Gronlund dalam Dimyati
dan Mudjiono (2006:196) mengemukakan bahwa, “keterandalan menunjukkan kepada
konsistensi (keajegan) pengukuran yakni bagaimana keajegan skor tes atau hasil
evaluasi lain yang berasal dari pengukuran yang satu ke pengukuran yang lain”.
Dengan kata lain, keterandalan dapat kita artikan sebagai tingakat kepercayaan
keajegan hasil evaluasi yang diperoleh dari suatu instrument evaluasi.
c) Kepraktisan
Kepraktisan evaluasi dapat
diartikan sebagai kemudahan-kemudahan yang ada pada instrument evaluasi baik
dalam mempersiapkan, menggunakan, menginterpretasi/ memperoleh hasil, maupun
kemudahan dalam menyimpanya.
Sementara menurut Arikunto dan Jabar
(2010:8-9) evaluasi memiliki ciri-ciri dan persyaratan sebagai berikut :
a) Proses
kegiatan penelitian tidak menyimpang dari kaidah-kaidah yang berlaku bagi
penelitian pada umumnya.
b) Dalam
melaksanakan evaluasi, peneliti harus berpikir secara sistematis yaitu
memandang program yang diteliti sebagai sebuah kesatuan yang terdiri dari
beberapa komponen atau unsur yang saling berkaitan satu sama lain dalam
menunjang kinerja dari objek yang dievaluasi.
c) Agar
dapat mengetahui secar rinci kondisi dari objek yang dievaluasi, perlu adanya
identifikasi komponen yang berkedudukan sebagai faktor penentu bagi
keberhasilan program.
d) Menggunakan
standar, Kiteria, atau tolak ukur sebagai perbandingan dalam menentukan kondisi
nyata dari data yang diperoleh dan untuk mengambil kesimpulan.
e) Kesimpulan
atau hasil penelitian digunakan sebagai masukan atau rekomendasi bagi sebuah
kebijakan atau rencana program yang telah ditentukan.
f) Agar
informasi yang diperoleh dapat menggambarkan kondisi nyata secara rinci untuk
mengetahui bagian mana dari program yang belum terlaksana, maka perlu ada
identifikasi komponen yang dilanjutkan dengan identifikasi subkomponen, sampai
pada indikator dari program evaluasi.
g) Standar,
kriteria, atau tolak ukur diterapkan pada indicator, yaitu bagian yang paling
kecil dari program agar dapat dengan cermat diketahui letak kelemahan dari
proses kegiatan.
h) Dari
hasil penelitian harus dapat disusun sebuah rekomendasi secara rinci dan akurat
sehingga dapat ditentukan tindak lanjut secara tepat.
BAB III
PENUTUP
A. Kesimpulan
Secara sederhana, Zainal Arifin (2011 : 69)
mengemukakan karakteristik instrumen evaluasi yang baik adalah “valid,
reliabel, relevan, representatif, praktis, deskriminatif, spesifik dan
proporsional”.
Melalui tes yang
dilakukan dalam mengevaluasi hasil pembelajaran maka dapat disimpulkan bahwa
karakteristik tes yang baik itu harus memenuhi syarat syarat evaluasi yang baik
agar hasil evaluasi dapat dinyatakan relevan.
B. Saran
Sebagai salah
seorang calon sarjana PLS, maka kita perlu memperbaiki sistem pembelajaran di
ruang lingkup pendidikan. Termasuk kepada pemilihan jenis tes dalam
mengevaluasi hasil belajar warga belajar. Hal ini penting agar evaluasi yang
dilakukan dapat bersifat relevan dengan tujuan pembelajaran.
evaluasi pembelajaran
PRINSIP EVALUASI
Prinsip-prinsip Evaluasi Evaluasi merupakan kegiatan untuk menilai sesuatu keadaan, gejala, atau kegiatan-kegiatan tertentu dengan ...