A. Definisi Evaluasi Belajar
Evaluasi memiliki
makna penilaian terhadap tingkat keberhasilan siswa dalam mencapai tujuan yang
telah ditetapkan dalam sebuah program. Padanan kata evaluasi adalah assessment yang menurut Tardif et al
(1989), berarti proses penilaian untuk menggambarkan prestasi yang dicapai
seorang siswa sesuai dengan criteria yang telah ditetapkan. Selain kata
evaluasi dan assessment ada pula kata lain yang searti dan relatif lebih
dikenal dalam dunia pendidikan, yakni tes, ujian, dan ulangan.
Menurut Kamus Besar
Bahasa Indonesia, evaluasi berarti penilaian (KBBI, 1996:272). Nurgiyantoro
(1988:5) menyebutkan bahwa evaluasi adalah proses untuk mengukur kadar
pencapaian tujuan. Ia lebih lanjut menjelaskan bahwa evaluasi yang bersinonim
dengan penilaian tidak sama konsepnya dengan pengukuran dan tes
meskipun ketiga konsep ini sering didapatkan ketika masalah evaluasi pendidikan
dibicarakan. Dikatakannya bahwa penilaian berkaitan dengan aspek
kuantitatif dan kualitatif, pengukuran berkaitan dengan aspek kuantitatif,
sedangkan tes hanya merupakan salah satu instrumen penilaian. Meskipun berbeda,
ketiga konsep ini merupakan satu kesatuan dan saling memerlukan. Hal senada
juga disampaikan oleh Nurgiyantoro (1988) dan Sudijono (2006). Sementara itu,
istilah evaluasi juga biasanya digunakan untuk menilai hasil belajar para siswa
pada akhir jenjang pendidikan tertentu, seperti Evaluasi Belajar Tahap Akhir
Nasional (EBTANAS) yang kini disebut Ujian Akhir Nasional (UAN).
Evaluasi hasil belajar adalah suatu proses
perubahan tingkah laku individu melaului interaksi dengan lingkungan. chaplin
membatasi belajar dengan dua rumusan ,rumusan pertama berbunyi belajar adalah
perubahan perolehan tingkah laku yang relative menetap sebagai akibat latihan
dan pengalaman .adapun rumusan keduanya adalah proses memperoleh respon –respon
sebagai akibat adanya latihan khusus. oleh karena belajar adalah merupakan
suatu proses maka sudah barang tentu ada yang di proses dan hasil dari
pemprosesan untuk mengetahui hal itu maka kita perlu adanya evaluasi hasil
belajar adapun Evaluasi secara etimologi berasal dari bahasa ingris yaitu
evaluation yang artinya penilaian .sedangkan secara istilah menurut Edwind Dan
Geralde Evaluasi adalah suatu tindakan atau suatu proses untuk menentukan nilai
dari sesuatu Menurut muhibbin syah Evaluasi adalah penilaian terhadap tingkat
keberhasilan siswa mencapai tujuan yang telah di tetapkan dalam sebuah program.
. adapun hasil menurut tim media dalam kamus lengkap bahasa indonesia adalah
sesuatu yang didapat dari jerih payah. Jadi hasil belajar adalah merupakan
kemampuan yang diperoleh anak setelah melalui kegiatan belajar Sedangkan
menurut A.J. Romozouskijadi hasil belajar merupakan keluaran (output) dari
suatu sistem pemrosesan masukan (input). Masukan dari sistem tersebut berupa
bermacam-macam informasi sedangkan keluarannya adalah merupakan perbuatan atau
kinerja (performance).
Benjamin S. Bloon berpendapat bahwa hasil belajar dapat di kelompokkan kedalam dua macam yaitu pengetahuan dan keterampilan.
Benjamin S. Bloon berpendapat bahwa hasil belajar dapat di kelompokkan kedalam dua macam yaitu pengetahuan dan keterampilan.
Pengetahuan terdiri dari empat kategori, yaitu:
1). Pengetahuan tentang fakta;
2). Pengetahuan tentang prosedural;
3). Pengetahuan tentang konsep;
4). Pengeyajuan tentang prinsip;
1). Pengetahuan tentang fakta;
2). Pengetahuan tentang prosedural;
3). Pengetahuan tentang konsep;
4). Pengeyajuan tentang prinsip;
Keterampilan juga terdiri dari empat kategori, yaitu:
1). Keterampilan untuk berfikir atau keterampilan kognitif;
2). Keterampilan untuk bertindak atau keterampilan motorik;
3). Keterampilan bereaksi atau bersikap;
4). Keterampilan berinteraksi.
Dari beberapa pendapat diatas dapat penulis
simpulkan bahwa hasil belajar adalah merupakan pencapaian bentuk perubahan
prilaku yang cenderung menetap baik di lihat dari unsur segi kognitif, afektif, dan psikomotorik
dari proses belajar yang di lakukan dalam waktu tertentu, yang dihasilkan dari
usaha yang dilakukan dengan cara latihan dan pengalaman belajar. Untuk memperoleh hasil belajar, diperlukan
penilaian atau di lakukan evaluasi pada siswa atau terdidik yang merupakan tindak lanjut atau cara yang dilakukan
untuk mengukur tingkat penguasaan siswa atau terdidik dalam proses pembelajaran
yang telah di lakukannya, sehingga dengan evaluasi pendidik juga dapat dapat
mengukur tentang perubahan tingkah laku siswa secara nyata setelah dilakukan
peroses belajar mengajar yang sesuai dengan tujuan pengajaran. Jadi penilaian
atau evaluasi hasil belajar adalah proses pemberian nilai terhadap hasil-hasil belajar yang dicapai siswa dengan
kriteria tertentu.
B. Tujuan dan
Fungsi Evaluasi Belajar dalam Dunia Pendidikan
a.
Tujuan Evaluasi Belajar
Adapun tujuan dari
pelaksanaan evaluasi hasil belajar siswa dalam dunia pendidikan, meliputi :
1.
Untuk mengetahui tingkat kemajuan yang telah dicapai
siswa dalam suatu kurun waktu proses belajar tertentu. Hal ini berarti, dengan
evaluasi guru dapat mengetahui kemajuan perubahan tingkah laku siswa sebagai
hasil proses belajar dan mengajar yang melibatkan dirinya selaku pembimbing dan
pembantu kegiatan belajar siswa tersebut.
2.
Untuk mengetahui posisi atau kedudukan seorang siswa
dalam kelompok kelasnya. Dengan demikian, hasil evaluasi dapat dijadikan guru
sebagai alat penetap apakah siswa tersebut termasuk kategori cepat, sedang,
atau lambat dalam arti mutu kemampuan belajarnya.
3.
Untuk mengetahui tingkat usaha yang dilakukan siswa
dalam belajar. Hal ini berarti bahwa dengan evaluasi, guru akan dapat
mengetahui gambaran tingkat usaha siswa. Hasil yang baik pada umumnya
menunjukkan adanya tingkat usaha yang efisien, sedangkan hasil yang buruk
adalah cerminan usaha yang tidak efisien.
4.
Untuk mengetahui hingga sejauh mana siswa telah
mendayagunakan kapasitas kognitifnya (kemampuan kecerdasan yang dimilikinya) untuk
keperluan belajar. Jadi, hasil evaluasi itu dapat dijadikan guru sebagai
gambaran realisasi pemanfaatan kecerdasan siswa.
5.
Untuk mengetahui tingkat daya guna dan hasil guna
metode mengajar yang telah digunakan guru dalam proses mengajar belajar (PMB).
Dengan demikian, apabila sebuah metode yang digunakan guru tidak mendorong
munculnya prestasi belajar siswa yang memuaskan, guru dianjurkan mengganti
metode tersebut atau mengombinasikan dengan metode lain yang serasi.
Selain itu berdasarkan
Undang-Undang Sisdiknas No. 20 Tahun 2003 Pasal 58 (1) evaluasi hasil belajar
peserta didik dilakukan untuk memantau proses, kemajuan, dan perbaikan hasil
belajar peserta didik, secara kesinambungan. Dengan demikian, maka evaluasi
elajar harus dilakukan guru secara kontinyu, bukan hanya pada musim-musim
ulangan terjadwal atau ujian semata.
b.
Fungsi Evaluasi Belajar
Disamping memiliki tujuan,
evaluasi belajar juga memiliki fungsi-fungsi sebagaimana tersebut di bawah ini
:
1.
Fungsi administratif untuk penyusunan daftar nilai
dan pengisian buku rapor.
2.
Fungsi promosi untuk menentapkan kenaikan atau
kelulusan.
3.
Fungsi diagnostik untuk mengidentifikasikan
kesulitan belajar siswa dan merencanakan program remedial teaching (pengajaran perbaikan).
4.
Sebagai sumber data BP yang dapat memasok data siswa
tertentu yang memerlukan bimbingan dan penyuluhan (BP)
5.
Sebagai bahan pertimbangan pengembangan pada masa
yang akan datang yang meliputi, pengembangan kurikulum, metode dan alat-alat
untuk proses PMB.
Disamping itu, evaluasi
prestasi belajar sudah tentu juga berfungsi melaksanakan ketentuan
konstitusional yang termaktub dalam Undang-Undang Sisdiknas No. 20/2003 Bab XVI
Pasal 57 (1) yang berbunyi : “Evaluasi pendidikan dilakukan dalam rangka
pengendalian mutu pendidikan secara nasional sebagai bentuk akuntabilitas
penyelenggaraan pendidikan kepada pihak-pihak yang berkepentingan. “
C. Ragam Evaluasi
Belajar
Pada prinsipnya, evaluasi
hasil belajar merupakan kegiatan berencana dan berkesinambungan. Oleh karena
itu, ragamnya pun bany, mulai yang paling sederhana sampai yang paling
kompleks.
a. Pre Test dan Post Test
Kegiatan Pre test dilakukan
guru secara rutin pada setiap akan memulai penyajian materi baru. Tujuannya
ialah untuk mengidentifikasi taraf pengetahuan siswa mengenai bahan yang akan
disajikan. Evaluasi seperti ini berlangsung singkat dan sering tidak memerlukan
instrument tertulis.
Post test adalah kebalikan dari
pre test, yakni kegiatan evaluasi yang dilakukan guru pada setiap akhir
penyajian materi. Tujuannya adalah untuk mengetahui taraf penguasaan siswa atas
materi yang telah diajarkan. Evaluasi ini juga berlangsung singkat dan cukup
dengan menggunakan instrument sederhana yang berisi item-item yang jumlahnya
sangat terbatas.
b. Evaluasi Prasyarat
Evaluasi ini sejenis dengan pre
test. Tujuannya adalah untuk mengidentifikasi penguasaan siswa atas materi lama
yang mendasari materi baru yang akan diajarkan. Contoh : evaluasi penguasaan
penjumlahan bilangan sebelum memulai pelajaran perkalian bilangan, karena
penjumlahan merupakan prasyarat atau dasar perkalian.
c. Evaluasi Diagnostik
Evaluasi ini dilakukan setelah selesai
penyajian sebuah satuan pelajaran dengan tujuan mengidentifikasi bagian-bagian
tertentu yang belum dikuasai oleh siswa . instrument evaluasi jenis ini dititikberatkan
pada bahasan tertentu yang dipandang telah membuat siswa mendapatkan kesulitan.
d. Evaluasi Formatif
Evaluasi jenis ini dapat dipandang sebagai
“ulangan” yang dilakukan pada setiap akhir penyajian satuan pelajaran atau
modul. Tujuannya ialah untuk memperoleh umpan balik yang mirip dengan evaluasi diagnostik,
yakni untuk mendiagnosis (mengetahui kesulitan/penyakit) kesulitan belajar
siswa. Hasil diagnosis kesulitan belajar tersebut digunakan sebagai bahan
pertimbangan rekayasa pengajaran remedial (perbaikan).
e. Evaluasi Sumatif
Ragam penilaian sumatif dapat dianggap
sebagai “ulangan umum” yang dilakukan untuk mengukur kinerja akademik atau
prestasi belajar siswa pada akhir periode pelaksanaan program pengajaran. Evaluasi ini lazim
dilakukan pada setiap akhir semester atau akhir tahun ajaran. Hasilnya
dijadikan bahan laporan resmi mengenai kinerja akademik siswa dan bahan penentu
naik atau tidaknya siswa ke kelas yang lebih tinggi.
f. Ujian Akhir Nasional (UAN)
Ujian Akhir Nasional (UAN) yang
dulu disebut EBTANAS (Evaluasi Belajar Tahap Akhir Nasional) pada prinsipnya
sama dengan evaluasi sumatif dalam arti sebagai alat penentu kenaikan status
siswa. Namun, UAN yang diberlakukan mulai tahun 2002 itu dirancang untuk siswa
yang telah menduduki kelas tertinggi pada suatu jenjang pendidikan tertentu,
seperti jenjang SD, SMP, dan sekolah-sekolah menengah yakni SMA dan sebagainya.
D. Ragam Alat
Evaluasi Belajar
Secara garis besar, ragam
alat evaluasi terdiri atas dua macam bentuk, yakni :
1)
Bentuk Objektif
Bentuk ini lazim juga
disebut tes objektif, yakni tes jawabannya dapat diberi skor nilai secara lugas
(seadanya) menurut pedoman yang ditentukan sebelumnya. Ada lima macam tes yang
termasuk dalam evaluasi ragam objektif ini.
a)
Tes Benar-Salah
Tes ini merupakan alat
evaluasi yang paling bersahaja baik dalam hal susunan item-itemnya maupun dalam
hal cara menjawabnya. Soal-soal dalam tes ini berbentuk pernyataan yang
pilihannya hanya dua macam, yakni “B” jika pernyataan tersebut benar dan “S”
jika salah. Apabila soal=soalnya disusun dalm bentuk pertanyaan, biasanya
alternatif jawabannya yang harus dipilih ialah “ya” atau “tidak”. Dalam dunia pendidikan modern, tes ini sudah
lama ditinggalkan karena dua alasan, yakni :
ª Tes “B-S” tidak menghargai
kreativitas akal siswa karena mererka hanya didorong untuk memilih sekenanya
salh satu dari dua alternatif yang ada.
ª Tes “B-S” dalam beberap
segi tertentu dianggap sangat rendah tingkat reliabilitasnya.
b)
Tes Pilihan Berganda
Item-item dalam tes
pilihan berganda (multiple choice) biasanya berupa pertanyaan atau pernyataan
yang dapat dijawab dengan memilih salah satu dari empat atau lima alternatif
jawaban yang mengiringi soal tersebut. Cara yang sangat lazim dlakukan ialah
menyilang (X) salah satu huruf a, b, c, d, atau e yang menandai alternatif
jawaban yang benar.
Kelebihan tes bentuk multiple choice, antara
lain :
1.
Waktu yang
dibutuhkan untuk mengerjakan soal relative lebih singkat . sehingga butir –
butir soal dapat dibuat dalam jumlah banyak, dengan jumlah soal yang banyak
lingkup bahan ajar yang diungkap bisa memiliki cakupan yang luas.
2.
Panjang
pendeknya suatu tes (banyak - sedikitnya jumlah butir soal) bisa berpengaruh
terhadap kadar reliabilitas. Suatu tes yang memiliki butir soal yang banyak akan cenderung lebih reliable
dibandingkan dengan tes yang berjumlah sedikit. Serta tes ini dapat disusun dalam jumlah banyak. Disamping itu pula tes bentuk multiple
choice ini proses penyetoran tes ini dapat dilakukan secara tepat.
3.
Adanya
kemungkinan variasi dalam jawaban dan penyekoran yang dapat mengurangi kadar
reliabilitas suatu tes. Dengan
demikian mudah dipahami, sebuah
tes yang dibuat dalam jumlah banyak akan memungkinkan untuk memiliki kadar reliabilitas
yang lebih tinggi,
4.
Proses
penyekoran dapat dilakukan secara mudah, karena kunci jawaban dapat dibuat
secara pasti, bahkan pemeriksaan oleh orang lain pun dapat dilakukan secara
akurat.
5.
Proses
penilaian dapat dilakukan secara objektif, karena jawaban dan kunci jawaban
sudah dapat ditentukan secara pasti.
Kelemahan tes bentuk multiple choice, antara lain :
1. Terdapat kemungkinan untuk menebak jawaban
dengan tepat, kecuali dalam tes jawaban singkat / isian. Dalam tes bentuk multiple choice pada umumnya
kemungkinan jawaban itu sudah disediakan, dan testee tinggal memilih alternative
jawaban yang tepat, dalam keadaan seperti ini, meskipun testee tidak tidak
mengetahui jawaban yang benar terhadap suatu soal, masih ada kesempatan bagi
yang bersangkutan untuk menjawab soal dengan benar, yaitu dengan cara menebak.
2. Tidak mengetahui jalan pikiran testee dalam menjawab suatu persoalan. dalam
kaitan ini penguji hanya mengetahui jawabannya, sedangkan bagaimana cara dan
prosedur testee menjawab tidak diketahui
3. Membatasi kreatifitas siswa dalam menyusun jawaban
sendiri, karena jawaban-jawaban terhadap persoalan sudah di sediakan.
4.
Bahan ajar yang diungkap dengan tes bentuk multiple choice, pada umumnya
lebih terbatas pada hal – hal yang faktual. Pengungkapan ke
dalam perilaku dengan tes bentuk multiple choice ini tidak seleluasa seperti dengan
tes uraian.
Pada zaman modern sekarang
ini, dunia pendidikan khususnya di barat sudah mulai meninggalkan tes pilihan
berganda kecuali untuk keperluan-keperluan di luar pengukuran prestasi belajar.
Alasan ditinggalkannya jenis tes ini, karena:
·
Kurang mendorong kreativitas ranah cipta dan karsa
siswa, karena hanya merasa disiruh berspekulasi, yakni menebak dan menyilang
secara untung-untungan;
·
Sering terdapat dua jawaban (diantara empat atau
lima aalternatif) yang identik atau sangat mirip, sehingga terkesan kurang
diskriminatif;
·
Sering terdapat satu jawaban yang sangat mencolok
kebenarannya, sehingga jawaban-jawaban lainnya terlalu mudah untuk
ditinggalkan.
Namun demikian, tes
pilihan berganda ini sampai batas tertentu masih dapat dipakai untuk
mengevaluasi prestasi belajar siswa dengan catatan, penyususnanya dilakukan
secara ekstra cermat.
c)
Tes Pencocokan (Menjodohkan)
Tes pencocokan (matching
test) disusun dalam dua daftar yang masing-masing memuat kata, istilah, atau
kalimat yang diletakkan bersebelahan. Tugas siswa dalam menjawab item-item soal
adalah mencari pasangan yang selaras antara kalimat atau istilah yang ada pada
daftar A (berisi item-item yang ditandai dengan nomor urut 1 sampai 10 dan
seterusnya menurut kebutuhan) dengan daftar B terdiri atas item-item yang
ditandai huruf a, b, c, dan seterusnya.
Untuk menjaga mutu
reliabilitas dan validitasnya, salah satu daftar instrument evaluasi di atas
sebaiknya ditambahkan 10% sampai 20%. Dengan demikian, kemungkinan siswa
menebak sekenanya pada saat menegerjakan satu atau dua soal yang terakhir dapat
dihindari.
d) Tes Isian
Alat tes isian biasanya
berbentuk cerita atau karangan pendek, yang ada bagian-bagian yang memuat
istilah, atau nama tertentu dikosongkan. Tugas siswa dalam hal ini berpikir
untuk menemukan kata-kata yang relevan dengan karangan tersebut. Lalu kata-kata
itu dituliskan pada titik-titik atau ruang kosong yang terdapat pada bagan
karangan tadi.
e) Tes Pelengkapan
(Melengkapi)
Cara menyelesaikan tes
melengkapi pada dasarnya sama dengan cara menyelesaikan tes isian. Perbedaannya
terletak pada kalimat-kalimat yang digunakan sebagai instrument. Dalam tes
melengkapi, kalimat-kalimat itu tersusun dalam bentuk karangan atau cerita
pendek tetapi dalam bentuk yang masing-masing berdiri sendiri.
2)
Bentuk Subjektif
Alat evaluasi yang
berbentuk tes subjektif adalah alat pengukur prestasi belajar siswa yang
jawabanya tidak dinilai dengan skor atau angka pasti, seperti yang digunakan
untuk evaluasi objektif. Hal ini disebabkan banyaknya ragam gaya jawaban yang
diberikan siswa. Instrument evaluasi mengambil bentuk essay examination, yakni
soal ujian yang mengharuskan siswa menjawab setiap pertanyaan dengan cara
menguraikan atau dalam bentuk karangan bebas.
Banyak ahli menganggap
evaluasi subjektif sukar sekali dipercaya reliabilitas dan validitasnya, karena
subjektivitas guru penilaiannya lebih menonjol (suryabrata, 1984). Contoh
sebuah esai jawaban yang hari inidiberi nilai 70, mungkin dua minggu yang akan
datang, jikadiperiksa kembali akan diberi nilai 60 atau 80. Alasan ini konon
berdasarkan hasil penilaian yang dilakukan lebih dari setengah abad yang alalu,
antara lain oleh E.W. Tiegs (1939) dan Strach & Elliof (1939).
Namun demikian,
menghindari pemakaian tes subjektif (essay test) hanya karena alasan subjektivitas
guru adalah suatu tindakan yang berlawanan dengan perkembangan modernisasi
pendidikan. Ada beberapa keunggulan tes
esai yang secar implisit diakui juga oleh Suryabrata (1984), yakni bahwa :
Ø Tes esai tidak hanya mampu
mengungkapkan materi hasil jawaban siswa tetapi juga cara atau jalan yang
ditempuh untuk memperoleh jawaban tersebut.
Ø Tes esai dapat mendorong
siswa untuk berpikir kreatif, kritis, bebas, mandiri, tetapi tanpa melupakan
tanggung jawab.
Kelebihan dari tes essay adalah sebagai berikut:
1.
Dapat
mengungkap aspek – aspek pengetahuan atau perilaku yang komplek secara
leluasa.
2.
Menuntut
siswa untuk mengintegrasikan pengetahuan dalam menjawab persoalan.
3.
Menuntut
kreativitas siswa untuk mengorganisasikan sendiri jawabannya.
4.
Dapat
melihat jalan pemikiran siswa dalam menjawab persoalan .
5.
Tidak
memberi kesempatan kepada siswa untuk menebak jawaban.
6.
Peserta
didik dapat mengorganisasikan jawaban dengan pendapatnya sendiri.
7.
Murid
tidak dapat menerka – nerka jawaban soal
8.
Tes
ini sangat cocok untuk mengukur dan mengevaluasi hasil suatu proses belajar
yang kompleks yang sukar diukur dengan mempergunakan tes objektif
9.
Derajat
ketepatan dan kebenaran murid dapat dilihat dari kalimat – kalimatnya.
10. Jawaban diungkapkan dalam kata – kata dan
kalimat sendiri sehingga tes ini dapat digunakan untuk melatih penyusunan
kalimat dengan bahasa yang baik, benar, dan cepat.
11. Tes ini digunakan dapat melatih peserta
didik untuk memilih fakta yang relevan dengan persoalan , dan
mengorganisasikannya sehingga dapat mengungkapkan satu hasil pemikiran yang
terintegrasi secara utuh.
Kelemahan
dari tes essay adalah sebagai
berikut:
1.
Ruang
lingkup yang diungkap sangat terbatas
2.
Menimbulkan
timbulnya keragaman dalam memberikan jawaban, sehingga tidak ada rumusan
jawaban yang pasti.
3.
Lebih
memberikan peluang untuk bersifat subyektif dan kurang reliable dalam proses
penyekoran
4.
Proses
penyekoran sering terganggu
oleh faktor – faktor lain diluar maksud pengukuran:
misalnya keindahan dan kerapian tulisan.
5.
Sukar
dinilai secara tepat,
6.
Bahan
yang diukur terlalu sedikit sehingga agak sulit untuk mengukur penguasaan siswa
terhadap keseluruhan kurikulum,
7.
Sulit
mendapatkan soal yang memiliki standar nasional maupun internasional;
8. Membutuhkan waktu untuk memeriksa
hasilnya.
E. Syarat Alat
Evaluasi Belajar
Langkah pertama yang peril
ditempuh guru dalam menilai prestasi belajar siswa adalah menyususn alat
evaluasi (test instrument) yang
sesuai dengan kebutuhan, dalam artian tidak menyimpang dari indicator dan jenis
prestasi yang diharapkan. Persyaratan pokok penyusunan alat evaluasi yang baik
dalam perspektif psikologi belajar (The
psychology of learning) meliputi :
a)
Reliabilitas
Secara sederhana,
reliabilitas (reliability) berarti
hal tahan uji atau dapat dipercaya. Sebuah alat evaluasi dipandang reliable (reliable) atau tahan uji, apabila
memiliki konsistensi atau keajegan hasil. Artinya, apabila alat itu diujikan
kepada kelompok siswa pada waktu tertentu menghasilkan prestasi “X”, maka
prestasi yang sama atau hamper sama dengan “X” itu dapat pula dicapai kelompok
siswa tersebut setelah diuji ulang dengan alat yang sama pada waktu yang
berbeda.
b)
Validitas (Cross, 1974; Barlow, 1985; Butler, 1990)
Pada prinsipnya, validitas
(validity) berarti keabsahan atau
kebenaran. Sebuah alat evaluasi dipandang valid (absah) apabila dapat mengukur
apa yang seharusnya diukur. Contohnya, apabila sebuah alat evaluasi bertujuan
mengukur prestasi belajar matematika, maka item-item (butir-butir soal) dalam
alat itu hendaknya hanya direkayasa untuk mengukur kemampuan matematis siswa.
Kemampuan-kemapuan lainnya yang tidka relevan, seperti kemampuan dalam bidang
bahasa, IPA, dan sebagainya tidak perlu diukur dengan instrument evaluasi
matematika tersebut.
F. Prinsip-prinsip Dasar Evaluasi Hasil Belajar
Evaluasi hasil
belajar dikatakan terlaksana dengan baik apabila dalam pelaksanaannya
senantiasa berpegang pada tiga prinsip dasar berikut ini.
1) Prinsip
Keseluruhan (Conprehensive)
Yang dimaksud dengan
evaluasi yang berprinsip keseluruhan atau menyeluruh atau komprehensif adalah
evaluasi tersebut dilaksanakan secara bulat, utuh, menyeluruh. Maksud dari
pernyataan ini adalah bahwa dalam pelaksanaannya evaluasi tidak dapat
dilaksanakan secara terpisah, tetapi mencakup berbagai aspek yang dapat
menggambarkan perkembangan atau perubahan tingkah laku yang terjadi pada diri
peserta didik sebagai makhluk hidup dan bukan benda mati.
Dalam hubungan ini,
evaluasi diharapkan tidak hanya menggambarkan aspek kognitif, tetapi juga aspek
psikomotor dan afektif pun diharapkan terangkum dalam evaluasi. Jika dikaitkan
dengan mata pelajaran Bahasa dan Sastra Indonesia, penilaian bukan hanya
menggambarkan pemahaman siswa terhadap materi ini, melainkan juga harus dapat
mengungkapkan sudah sejauh mana peserta didik dapat menghayati dan mengimplementasikan
materi tersebut dalam kehidupannya.
Jika prinsip
evaluasi yang pertama ini dilaksanakan, akan diperoleh bahan-bahan keterangan
dan informasi yang lengkap mengenai keadaan dan perkembangan subjek subjek
didik yang sedang dijadikan sasaran evaluasi.
2) Prinsip
Kesinambungan
Istilah lain dari
prinsip ini adalah kontinuitas. Penilaian yang berkesinambungan ini artinya
adalah penilaian yang dilakukan secara terus menerus, sambung-menyambung dari
waktu ke waktu. Penilaian secara berkesinambungan ini akan memungkinkan si
penilai memperoleh informasi yang dapat memberikan gambaran mengenai kemajuan
atau perkembangan peserta didik sejak awal mengikuti program pendidikan sampai
dengan saat-saat mereka mengakhiri program-program pendidikan yang mereka tempuh.
3) Prinsip
Objektivitas (Objective)
Prinsip objektivitas
mengandung makna bahwa evaluasi hasil belajar terlepas dari faktor-faktor yang
sifatnya subjektif. Orang juga sering menyebut prinsip objektif ini dengan
sebutan “apa adanya”. Istilah apa adanya ini mengandung pengertian bahwa materi
evaluasi tersebut bersumber dari materi atau bahan ajar yang akan diberikan
sesuai atau sejalan dengan tujuan instruksional khusus pembelajaran. Ditilik
dari pemberian skor dalam evaluasi, istilah apa adanya itu mengandung
pengertian bahwa pekerjaan koreksi, pemberian skor, dan penentuan nilai
terhindar dari unsur-unsur subjektivitas yang melekat pada diri tester.
Di sini tester harus dapat mengeliminasi sejauh mungkin
kemungkinan-kemungkinan “hallo effect” yaitu jawaban soal dengan
tulisan yang baik mendapat skor lebih tinggi daripada jawaban soal yang
tulisannya lebih jelek padahal jawaban tersebut sama. Demikian pula “kesan masa
lalu” dan lain-lain harus disingkirkan jauh-jauh sehingga evaluasi nantinya
menghasilkan nilai-nilai yang objektif.
Dengan kata lain, tester
harus senantiasa berpikir dan bertindak wajar menurut keadaan yang
senyatanya, tidak dicampuri oleh kepentingan-kepentingan yang sifatnya
subjektif. Prinsip ini sangat penting sebab apabila dalam melakukan evaluasi,
subjektivitas menyelinap masuk dalam suatu evaluasi, kemurnian pekerjaan
evaluasi itu sendiri akan ternoda.
Sebenarnya bukan
hanya tiga prinsip di atas yang menjadi ukuran dalam untuk melakukan evaluasi.
Dimyati dan Mujiono (2006:194-199) menyebutkan bahwa evaluasi yang akan
dilakukan juga harus mengikuti prinsip kesahihan (valid), keterandalan
(reliabilitas), dan praktis.
4) Kesahihan
Sebuah evaluasi
dikatakan valid jika evaluasi tersebut secara tepat, benar, dan sahih telah
mengungkapkan atau mengukur apa yang seharusnya diukur. Agar diperoleh hasil
evaluasi yang sahih, dibutuhkan instrumen yang memiliki/memenuhi syarat
kesahihan suatu instrumen evaluasi.
Contoh berikut dapat
dijadikan sarana untuk memahami pengertian valid. Contoh yang dimaksud adalah
berupa barometer dan termometer. Barometer adalah alat ukur yang
dipandang tepat untuk mengukur tekanan udara. Jadi, kita dapat mengatakan bahwa
barometer tanpa diragukan lagi adalah alat pengukur yang valid untuk mengukur
tekanan udara. Dengan kata lain, apa seseorang melakukan pengukuran terhadap
tekanan udara dengan menggunakan alat pengukur berupa barometer hasil
pengukuran yang diperoleh itu dipandang tepat dan dapat dipercaya. Demikian
pula halnya denga termometer. Termometer adalah alat pengukur yang dipandang
tepat, benar, sahih, dan abash untuk mengukur tinggi rendahnya suhu udara. Jadi
dapat dikatakan bahwa termometer adalah adalah alat pengukur yang valid untuk
mengukur suhu udara (Sudijono, 2006:96).
Sahih atau tidaknya
evaluasi tersebut ditentukan oleh faktor-faktor instrumen evaluasi itu sendiri,
administrasi evaluasi dan penskoran, respon-respon siswa (Gronlund, dalam
Dimyati dan Mujiono (2006:195). Kesahihan instrumen evaluasi diperoleh melalui
hasil pemikiran dan pengalaman. Dari dua cara tersebut, diperoleh empat macam
kesahihan yanga terdiri atas kesahihan isi (content validation), kesahihan
konstruksi (contruction validity), kesahihan ada sekarang (concurrent
validity), dan kesahihan prediksi (prediction validity)
(Arikunto, 1990:64).
5) Keterandalan
Keterandalan
evaluasi berhubungan dengan masalah kepercayaan yaitu tingkat kepercayaan bahwa
suatu evaluasi mampu memberikan hasil yang tepat. Maksud dari pernyataan ini
adalah jika suatu eveluasi dilakukan pada subjek yang sama evaluasi senantiasa
menunjukkan hasil evaluasi yang sama atau sifatnya ajeg dan stabil. Dengan
demikian suatu ujian, misalnya, dikatakan telah memiliki reliabilitas apabila
skor-skor atau nilai-nilai yang diperoleh para peserta ujian untuk pekerjaan
ujiannya adalah stabil, kapan saja, dimana saja ujian itu dilaksanakan, dan
oleh siapa saja pelaksananya.
Keterandalan
dipengaruhi oleh beberapa faktor, yaitu:
a) Panjang
tes (length of tes). Panjang tes berhubungan dengan banyaknya butir
tes. Pada umumnya lebih banyak butir tes, lebih tinggi keterandalan evaluasi.
Hal ini terjadi karena makin banyak soal tes, makin banyak sampel yang diukur.
b) Sebaran
skor (spread of scores). Besarnya sebaran skor akan membuat
kemungkinan perkiraan keterandalan lebih tinggi menjadi kenyataan.
c) Tingkat
kesulitan tes (difficulty of tes). Tes yang paling mudah atau paling
sukar untuk anggota-anggota kelompok yang mengerjakan cenderung menghasilkan
skor tes keterandalan yang lebih rendah. Hal ini disebabkan antara hasil tes
yang mudah dan sulit keduanya salam suatu sebaran skor yang terbatas.
d) Objektivitas
(objektivity). Objektivitas suatu tes menunjuk kepada tingkat skor
kemampuan yang sama (yang dimiliki oleh para siswa) dan memperoleh hasil yang
sama dalam mengerjakan tes.
6) Kepraktisan
Kepraktisan
suatu evaluasi bermakna bahwa kemudahan-kemudahan yang ada pada instrumen
evaluasi baik dalam mempersiapkan, menggunakan, menginterpretasi, memperoleh
hasil maupun kemudahan dalam menyimpan.
Faktor-faktor yang mempengaruhi kepraktisan
instrumen evaluasi meliputi:
a.
Kemudahan mengadministrasi;
b.
Waktu yang disediakan untuk melancarkan kegiatan
evaluasi;
c.
Kemudahan menskor;
d.
Kemudahan interpretasi dan aplikasi;
e.
Tersedianya bentuk instrumen evaluasi yang ekuivalen
atau sebanding.
G. Evaluasi Berbagai Ranah Psikologi
Pada
bagian ini akan dibahas alternatif pengukuran keberhasilan belajar baik yang
berdimensi ranah cipta, ranah rasa, maupun karsa.
a)
Evaluasi Prestasi Kognitif
Mengukur
keberhasilan siswa berdimensi kognitif (ranah cipta) dapat dilakukan dengan
berbagai cara, baik dengan tes tertulis maupun tes lisan dan perbuatan. Karena
semakin membengkaknya jumlah siswa di sekolah-sekolah, tes lisan dan perbuatan
saat ini semakin jarang digunakan. Alasan lain mengapa tes lisan khususnya
kurang mendapat perhatian ialah karena pelaksanaannya yang face to face (berhadapan langsung). Cara ini, konon dapat mendorong
penguji untuk bersikap kurang fair
terhadap si teruji atau peserta didik tertentu.
Dampak
negatif yang terkadang muncul dalam tes yang face to face itu ialah, sikap dan perlakuan penguji yang subjektif
dan kurang adil, sehingga soal yang diajukan pun tingkat kesukarannya berbeda
antara satu dengan yang lainnya. Disatu puhak ada siswa yang diberi soal yang
mudah dan terarah (sesuai dengan topik) sedangkan dipihak lain ada pula siswa
yang ditanyai masalah yang sukar bahkan terkadang tidak relevan dengan topik
b)
Evaluasi Prestasi Afektif
Dalam
merencanakan penyusunan instrument tes prestasi, siswa yang berdimensi afektif
(ranah rasa) jenis-jenis prestasi internalisasi dan karakterisasi seyogyanya
mendapat perhatian khusus. Alasannya karena kedua jenis prestasi ranah rasa
itulah yang lebih banyak mengendalikan sikap dan perbuatan siswa.
Salah
satu bentuk tes ranah rasa yang populer adalah “Skala Likert” (Likert Scale) yang tujuannya untuk
mengidentifikasi kecenderungan atau sikap orang (Reber, 1988). Bentuk skala ini
menampung pendapat yang mencerminkan sikap yang sangat setuju, setuju,
ragu-ragu, tidak setuju, dan sangat tidak setuju. Rentang skal ini diberi skor
1 sampai 5 atau 1 sampai 7 tergantung kebutuhan dengan catatan skor-skor itu
dapat mencerminkan sikap-sikap mulai sangat “Ya” sampai sangat “Tidak”. Perlu
pula dicatat, untuk memudahkan identifikasi jenis kecenderungan afektif siswa
yang representative item-item skala sikap sebaiknya dilengkapi dengan label
atau identitas sikap yang meliputi :
v
Doktrin, yakni pendirian
v
Komitmen, yakni ikrar setia untuk melakukan atau
meninggalkan suatu perbuatan
v
Penghayatan, yakni pengalaman batin
v
Wawasan, yakni pandangan atau cara memandang
sesuatu.
c)
Evaluasi Prestasi Psikomotor
Cara
yang dipandang tepat untuk mengevaluasi keberhasilan belajar yang berdimensi
ranah psikomotor (ranah karsa) adalah observasi. Observasi, dalam hal ini,
dapat diartikan sebagai sejenis tes mengenais peristiwa, tingkah laku, atau
fenomena lain, dengan pengamatan langsung. Namun, observasi harus dibedakan
dari eksperiment karena eksperiment pada umumnya dipandang sebagai salah satu
cara observasi (Reber, 1988).
Guru
yang hendak melakukan observasi perilaku psikomotor siswa-siswanya seyogyanya
mempersiapkan langkah-langkah yang cermat dan sistematis menurut pedoman yang
terdapat dalam lembar format observasi yang sebelumnya telah disediakan baik
oleh sekolah maupun guru itu sendiri.
DAFTAR
PUSTAKA
Anas
sudijono, Prof. Drs. 1996.
Pengantar Evaluasi Pendidikan.
Jakarta:PT Raja Grafindo Persada
Balai
Pustaka. 1996. Kamus Besar Bahasa Indonesia. Jakarta:Balai Pustaka.
Dimyati
dan Mujiono. 2006. Belajar dan Pembelajaran. Jakarta:Rineka Cipta.
Nurgiyantoro,
Burhan. 1988. Penilaian dalam Pengajaran Bahasa dan Sastra. BPFE: Yogyakarta.
Sudijono,
Anas. 2006. Pengantar Evaluasi Pendidikan. Jakarta:PT Raja Grafindo.
Syah,
Muhibbin. 2010. Psikologi Belajar.
Jakarta:PT Raja Grafindo Persada.
http://abyfarhan7.blogspot.com/2011/12/penilaian-proses-dan-hasil-belajar.html
(diakses tanggal 5 Mei 2012)
(diakses
tanggal 5 Mei 2012)
Tidak ada komentar:
Posting Komentar