Dengan Belajar Kau Bisa Mengajar, Dengan Mengajar Kau Bisa Paham

Translate

Selasa, 06 November 2012

EVALUASI HASIL BELAJAR SISWA



A. Definisi Evaluasi Belajar

Evaluasi memiliki makna penilaian terhadap tingkat keberhasilan siswa dalam mencapai tujuan yang telah ditetapkan dalam sebuah program. Padanan kata evaluasi adalah assessment yang menurut Tardif et al (1989), berarti proses penilaian untuk menggambarkan prestasi yang dicapai seorang siswa sesuai dengan criteria yang telah ditetapkan. Selain kata evaluasi dan assessment ada pula kata lain yang searti dan relatif lebih dikenal dalam dunia pendidikan, yakni tes, ujian, dan ulangan.

Menurut Kamus Besar Bahasa Indonesia, evaluasi berarti penilaian (KBBI, 1996:272). Nurgiyantoro (1988:5) menyebutkan bahwa evaluasi adalah proses untuk mengukur kadar pencapaian tujuan. Ia lebih lanjut menjelaskan bahwa evaluasi yang bersinonim dengan penilaian tidak sama konsepnya dengan pengukuran dan tes meskipun ketiga konsep ini sering didapatkan ketika masalah evaluasi pendidikan dibicarakan. Dikatakannya bahwa penilaian berkaitan dengan aspek kuantitatif dan kualitatif, pengukuran berkaitan dengan aspek kuantitatif, sedangkan tes hanya merupakan salah satu instrumen penilaian. Meskipun berbeda, ketiga konsep ini merupakan satu kesatuan dan saling memerlukan. Hal senada juga disampaikan oleh Nurgiyantoro (1988) dan Sudijono (2006). Sementara itu, istilah evaluasi juga biasanya digunakan untuk menilai hasil belajar para siswa pada akhir jenjang pendidikan tertentu, seperti Evaluasi Belajar Tahap Akhir Nasional (EBTANAS) yang kini disebut Ujian Akhir Nasional (UAN).

Evaluasi hasil belajar adalah suatu proses perubahan tingkah laku individu melaului interaksi dengan lingkungan. chaplin membatasi belajar dengan dua rumusan ,rumusan pertama berbunyi belajar adalah perubahan perolehan tingkah laku yang relative menetap sebagai akibat latihan dan pengalaman .adapun rumusan keduanya adalah proses memperoleh respon –respon sebagai akibat adanya latihan khusus. oleh karena belajar adalah merupakan suatu proses maka sudah barang tentu ada yang di proses dan hasil dari pemprosesan untuk mengetahui hal itu maka kita perlu adanya evaluasi hasil belajar adapun Evaluasi secara etimologi berasal dari bahasa ingris yaitu evaluation yang artinya penilaian .sedangkan secara istilah menurut Edwind Dan Geralde Evaluasi adalah suatu tindakan atau suatu proses untuk menentukan nilai dari sesuatu Menurut muhibbin syah Evaluasi adalah penilaian terhadap tingkat keberhasilan siswa mencapai tujuan yang telah di tetapkan dalam sebuah program. . adapun hasil menurut tim media dalam kamus lengkap bahasa indonesia adalah sesuatu yang didapat dari jerih payah. Jadi hasil belajar adalah merupakan kemampuan yang diperoleh anak setelah melalui kegiatan belajar Sedangkan menurut A.J. Romozouskijadi hasil belajar merupakan keluaran (output) dari suatu sistem pemrosesan masukan (input). Masukan dari sistem tersebut berupa bermacam-macam informasi sedangkan keluarannya adalah merupakan perbuatan atau kinerja (performance).
Benjamin S. Bloon berpendapat bahwa hasil belajar dapat di kelompokkan kedalam dua macam yaitu pengetahuan dan keterampilan.
Pengetahuan terdiri dari empat kategori, yaitu:
1). Pengetahuan tentang fakta;
2). Pengetahuan tentang prosedural;
3). Pengetahuan tentang konsep;
4). Pengeyajuan tentang prinsip;

Keterampilan juga terdiri dari empat kategori, yaitu:
1). Keterampilan untuk berfikir atau keterampilan kognitif;
2). Keterampilan untuk bertindak atau keterampilan motorik;
3). Keterampilan bereaksi atau bersikap;
4). Keterampilan berinteraksi.

Dari beberapa pendapat diatas dapat penulis simpulkan bahwa hasil belajar adalah merupakan pencapaian bentuk perubahan prilaku yang cenderung menetap baik di lihat dari unsur segi kognitif, afektif, dan psikomotorik dari proses belajar yang di lakukan dalam waktu tertentu, yang dihasilkan dari usaha yang dilakukan dengan cara latihan dan pengalaman belajar. Untuk memperoleh hasil belajar, diperlukan penilaian atau di lakukan evaluasi pada siswa atau terdidik yang merupakan tindak lanjut atau cara yang dilakukan untuk mengukur tingkat penguasaan siswa atau terdidik dalam proses pembelajaran yang telah di lakukannya, sehingga dengan evaluasi pendidik juga dapat dapat mengukur tentang perubahan tingkah laku siswa secara nyata setelah dilakukan peroses belajar mengajar yang sesuai dengan tujuan pengajaran. Jadi penilaian atau evaluasi hasil belajar adalah proses pemberian nilai terhadap hasil-hasil belajar yang dicapai siswa dengan kriteria tertentu.  

B. Tujuan dan Fungsi Evaluasi Belajar dalam Dunia Pendidikan
a.       Tujuan Evaluasi Belajar
Adapun tujuan dari pelaksanaan evaluasi hasil belajar siswa dalam dunia pendidikan, meliputi :
1.      Untuk mengetahui tingkat kemajuan yang telah dicapai siswa dalam suatu kurun waktu proses belajar tertentu. Hal ini berarti, dengan evaluasi guru dapat mengetahui kemajuan perubahan tingkah laku siswa sebagai hasil proses belajar dan mengajar yang melibatkan dirinya selaku pembimbing dan pembantu kegiatan belajar siswa tersebut.
2.      Untuk mengetahui posisi atau kedudukan seorang siswa dalam kelompok kelasnya. Dengan demikian, hasil evaluasi dapat dijadikan guru sebagai alat penetap apakah siswa tersebut termasuk kategori cepat, sedang, atau lambat dalam arti mutu kemampuan belajarnya.
3.      Untuk mengetahui tingkat usaha yang dilakukan siswa dalam belajar. Hal ini berarti bahwa dengan evaluasi, guru akan dapat mengetahui gambaran tingkat usaha siswa. Hasil yang baik pada umumnya menunjukkan adanya tingkat usaha yang efisien, sedangkan hasil yang buruk adalah cerminan usaha yang tidak efisien.
4.      Untuk mengetahui hingga sejauh mana siswa telah mendayagunakan kapasitas kognitifnya (kemampuan kecerdasan yang dimilikinya) untuk keperluan belajar. Jadi, hasil evaluasi itu dapat dijadikan guru sebagai gambaran realisasi pemanfaatan kecerdasan siswa.
5.      Untuk mengetahui tingkat daya guna dan hasil guna metode mengajar yang telah digunakan guru dalam proses mengajar belajar (PMB). Dengan demikian, apabila sebuah metode yang digunakan guru tidak mendorong munculnya prestasi belajar siswa yang memuaskan, guru dianjurkan mengganti metode tersebut atau mengombinasikan dengan metode lain yang serasi.
Selain itu berdasarkan Undang-Undang Sisdiknas No. 20 Tahun 2003 Pasal 58 (1) evaluasi hasil belajar peserta didik dilakukan untuk memantau proses, kemajuan, dan perbaikan hasil belajar peserta didik, secara kesinambungan. Dengan demikian, maka evaluasi elajar harus dilakukan guru secara kontinyu, bukan hanya pada musim-musim ulangan terjadwal atau ujian semata.

b.      Fungsi Evaluasi Belajar
Disamping memiliki tujuan, evaluasi belajar juga memiliki fungsi-fungsi sebagaimana tersebut di bawah ini :
1.      Fungsi administratif untuk penyusunan daftar nilai dan pengisian buku rapor.
2.      Fungsi promosi untuk menentapkan kenaikan atau kelulusan.
3.      Fungsi diagnostik untuk mengidentifikasikan kesulitan belajar siswa dan merencanakan program remedial teaching (pengajaran perbaikan).
4.      Sebagai sumber data BP yang dapat memasok data siswa tertentu yang memerlukan bimbingan dan penyuluhan (BP)
5.      Sebagai bahan pertimbangan pengembangan pada masa yang akan datang yang meliputi, pengembangan kurikulum, metode dan alat-alat untuk proses PMB.
Disamping itu, evaluasi prestasi belajar sudah tentu juga berfungsi melaksanakan ketentuan konstitusional yang termaktub dalam Undang-Undang Sisdiknas No. 20/2003 Bab XVI Pasal 57 (1) yang berbunyi : “Evaluasi pendidikan dilakukan dalam rangka pengendalian mutu pendidikan secara nasional sebagai bentuk akuntabilitas penyelenggaraan pendidikan kepada pihak-pihak yang berkepentingan. “

C. Ragam Evaluasi Belajar
Pada prinsipnya, evaluasi hasil belajar merupakan kegiatan berencana dan berkesinambungan. Oleh karena itu, ragamnya pun bany, mulai yang paling sederhana sampai yang paling kompleks.
a.    Pre Test dan Post Test
     Kegiatan Pre test dilakukan guru secara rutin pada setiap akan memulai penyajian materi baru. Tujuannya ialah untuk mengidentifikasi taraf pengetahuan siswa mengenai bahan yang akan disajikan. Evaluasi seperti ini berlangsung singkat dan sering tidak memerlukan instrument tertulis.
     Post test adalah kebalikan dari pre test, yakni kegiatan evaluasi yang dilakukan guru pada setiap akhir penyajian materi. Tujuannya adalah untuk mengetahui taraf penguasaan siswa atas materi yang telah diajarkan. Evaluasi ini juga berlangsung singkat dan cukup dengan menggunakan instrument sederhana yang berisi item-item yang jumlahnya sangat terbatas.
b.   Evaluasi Prasyarat
     Evaluasi ini sejenis dengan pre test. Tujuannya adalah untuk mengidentifikasi penguasaan siswa atas materi lama yang mendasari materi baru yang akan diajarkan. Contoh : evaluasi penguasaan penjumlahan bilangan sebelum memulai pelajaran perkalian bilangan, karena penjumlahan merupakan prasyarat atau dasar perkalian.
c.    Evaluasi Diagnostik
     Evaluasi ini dilakukan setelah selesai penyajian sebuah satuan pelajaran dengan tujuan mengidentifikasi bagian-bagian tertentu yang belum dikuasai oleh siswa . instrument evaluasi jenis ini dititikberatkan pada bahasan tertentu yang dipandang telah membuat siswa mendapatkan kesulitan.
d.   Evaluasi Formatif
     Evaluasi jenis ini dapat dipandang sebagai “ulangan” yang dilakukan pada setiap akhir penyajian satuan pelajaran atau modul. Tujuannya ialah untuk memperoleh umpan balik yang mirip dengan evaluasi diagnostik, yakni untuk mendiagnosis (mengetahui kesulitan/penyakit) kesulitan belajar siswa. Hasil diagnosis kesulitan belajar tersebut digunakan sebagai bahan pertimbangan rekayasa pengajaran remedial (perbaikan).
e.    Evaluasi Sumatif
     Ragam penilaian sumatif dapat dianggap sebagai “ulangan umum” yang dilakukan untuk mengukur kinerja akademik atau prestasi belajar siswa pada akhir periode pelaksanaan program pengajaran. Evaluasi ini lazim dilakukan pada setiap akhir semester atau akhir tahun ajaran. Hasilnya dijadikan bahan laporan resmi mengenai kinerja akademik siswa dan bahan penentu naik atau tidaknya siswa ke kelas yang lebih tinggi.

f.    Ujian Akhir Nasional (UAN)
     Ujian Akhir Nasional (UAN) yang dulu disebut EBTANAS (Evaluasi Belajar Tahap Akhir Nasional) pada prinsipnya sama dengan evaluasi sumatif dalam arti sebagai alat penentu kenaikan status siswa. Namun, UAN yang diberlakukan mulai tahun 2002 itu dirancang untuk siswa yang telah menduduki kelas tertinggi pada suatu jenjang pendidikan tertentu, seperti jenjang SD, SMP, dan sekolah-sekolah menengah yakni SMA dan sebagainya.

D. Ragam Alat Evaluasi Belajar
Secara garis besar, ragam alat evaluasi terdiri atas dua macam bentuk, yakni :
1)      Bentuk Objektif
Bentuk ini lazim juga disebut tes objektif, yakni tes jawabannya dapat diberi skor nilai secara lugas (seadanya) menurut pedoman yang ditentukan sebelumnya. Ada lima macam tes yang termasuk dalam evaluasi ragam objektif ini.
a)      Tes Benar-Salah
Tes ini merupakan alat evaluasi yang paling bersahaja baik dalam hal susunan item-itemnya maupun dalam hal cara menjawabnya. Soal-soal dalam tes ini berbentuk pernyataan yang pilihannya hanya dua macam, yakni “B” jika pernyataan tersebut benar dan “S” jika salah. Apabila soal=soalnya disusun dalm bentuk pertanyaan, biasanya alternatif jawabannya yang harus dipilih ialah “ya” atau “tidak”.  Dalam dunia pendidikan modern, tes ini sudah lama ditinggalkan karena dua alasan, yakni :
ª  Tes “B-S” tidak menghargai kreativitas akal siswa karena mererka hanya didorong untuk memilih sekenanya salh satu dari dua alternatif yang ada.
ª  Tes “B-S” dalam beberap segi tertentu dianggap sangat rendah tingkat reliabilitasnya.
b)      Tes Pilihan Berganda
Item-item dalam tes pilihan berganda (multiple choice) biasanya berupa pertanyaan atau pernyataan yang dapat dijawab dengan memilih salah satu dari empat atau lima alternatif jawaban yang mengiringi soal tersebut. Cara yang sangat lazim dlakukan ialah menyilang (X) salah satu huruf a, b, c, d, atau e yang menandai alternatif jawaban yang benar.
Kelebihan tes bentuk multiple choice, antara lain :

1.      Waktu yang dibutuhkan untuk mengerjakan soal relative lebih singkat . sehingga butir – butir soal dapat dibuat dalam jumlah banyak, dengan jumlah soal yang banyak lingkup bahan ajar yang diungkap bisa memiliki cakupan yang luas. 
2.      Panjang pendeknya suatu tes (banyak - sedikitnya jumlah butir soal) bisa berpengaruh terhadap kadar reliabilitas. Suatu tes yang memiliki butir soal yang banyak akan cenderung lebih reliable dibandingkan dengan tes yang berjumlah sedikit. Serta tes ini dapat disusun dalam jumlah banyak. Disamping itu pula tes bentuk multiple choice ini proses penyetoran tes ini dapat dilakukan secara tepat.
3.      Adanya kemungkinan variasi dalam jawaban dan penyekoran yang dapat mengurangi kadar reliabilitas suatu tes. Dengan demikian mudah dipahami, sebuah tes yang dibuat dalam jumlah banyak akan memungkinkan untuk memiliki kadar reliabilitas yang lebih tinggi,
4.      Proses penyekoran dapat dilakukan secara mudah, karena kunci jawaban dapat dibuat secara pasti, bahkan pemeriksaan oleh orang lain pun dapat dilakukan secara akurat.
5.      Proses penilaian dapat dilakukan secara objektif, karena jawaban dan kunci jawaban sudah dapat ditentukan secara pasti.  

Kelemahan tes bentuk multiple choice, antara lain :

1.      Terdapat kemungkinan untuk menebak jawaban dengan tepat, kecuali dalam tes jawaban singkat / isian. Dalam tes bentuk multiple choice pada umumnya kemungkinan jawaban itu sudah disediakan, dan testee tinggal memilih alternative jawaban yang tepat, dalam keadaan seperti ini, meskipun testee tidak tidak mengetahui jawaban yang benar terhadap suatu soal, masih ada kesempatan bagi yang bersangkutan untuk menjawab soal dengan benar, yaitu dengan cara menebak. 
2.      Tidak mengetahui jalan pikiran testee dalam menjawab suatu persoalan. dalam kaitan ini penguji hanya mengetahui jawabannya, sedangkan bagaimana cara dan prosedur testee menjawab tidak diketahui
3.      Membatasi kreatifitas siswa dalam menyusun jawaban sendiri, karena jawaban-jawaban terhadap persoalan sudah di sediakan.
4.      Bahan ajar yang diungkap dengan tes bentuk multiple choice, pada umumnya lebih terbatas pada hal – hal yang faktual. Pengungkapan ke dalam perilaku dengan tes bentuk multiple choice ini tidak seleluasa seperti dengan tes uraian.

Pada zaman modern sekarang ini, dunia pendidikan khususnya di barat sudah mulai meninggalkan tes pilihan berganda kecuali untuk keperluan-keperluan di luar pengukuran prestasi belajar. Alasan ditinggalkannya jenis tes ini, karena:
·         Kurang mendorong kreativitas ranah cipta dan karsa siswa, karena hanya merasa disiruh berspekulasi, yakni menebak dan menyilang secara untung-untungan;
·         Sering terdapat dua jawaban (diantara empat atau lima aalternatif) yang identik atau sangat mirip, sehingga terkesan kurang diskriminatif;
·         Sering terdapat satu jawaban yang sangat mencolok kebenarannya, sehingga jawaban-jawaban lainnya terlalu mudah untuk ditinggalkan.
Namun demikian, tes pilihan berganda ini sampai batas tertentu masih dapat dipakai untuk mengevaluasi prestasi belajar siswa dengan catatan, penyususnanya dilakukan secara ekstra cermat.

c)      Tes Pencocokan (Menjodohkan)
Tes pencocokan (matching test) disusun dalam dua daftar yang masing-masing memuat kata, istilah, atau kalimat yang diletakkan bersebelahan. Tugas siswa dalam menjawab item-item soal adalah mencari pasangan yang selaras antara kalimat atau istilah yang ada pada daftar A (berisi item-item yang ditandai dengan nomor urut 1 sampai 10 dan seterusnya menurut kebutuhan) dengan daftar B terdiri atas item-item yang ditandai huruf a, b, c, dan seterusnya.

Untuk menjaga mutu reliabilitas dan validitasnya, salah satu daftar instrument evaluasi di atas sebaiknya ditambahkan 10% sampai 20%. Dengan demikian, kemungkinan siswa menebak sekenanya pada saat menegerjakan satu atau dua soal yang terakhir dapat dihindari.

d)     Tes Isian
Alat tes isian biasanya berbentuk cerita atau karangan pendek, yang ada bagian-bagian yang memuat istilah, atau nama tertentu dikosongkan. Tugas siswa dalam hal ini berpikir untuk menemukan kata-kata yang relevan dengan karangan tersebut. Lalu kata-kata itu dituliskan pada titik-titik atau ruang kosong yang terdapat pada bagan karangan tadi.

e)      Tes Pelengkapan (Melengkapi)
Cara menyelesaikan tes melengkapi pada dasarnya sama dengan cara menyelesaikan tes isian. Perbedaannya terletak pada kalimat-kalimat yang digunakan sebagai instrument. Dalam tes melengkapi, kalimat-kalimat itu tersusun dalam bentuk karangan atau cerita pendek tetapi dalam bentuk yang masing-masing berdiri sendiri.

2)      Bentuk Subjektif
Alat evaluasi yang berbentuk tes subjektif adalah alat pengukur prestasi belajar siswa yang jawabanya tidak dinilai dengan skor atau angka pasti, seperti yang digunakan untuk evaluasi objektif. Hal ini disebabkan banyaknya ragam gaya jawaban yang diberikan siswa. Instrument evaluasi mengambil bentuk essay examination, yakni soal ujian yang mengharuskan siswa menjawab setiap pertanyaan dengan cara menguraikan atau dalam bentuk karangan bebas.

Banyak ahli menganggap evaluasi subjektif sukar sekali dipercaya reliabilitas dan validitasnya, karena subjektivitas guru penilaiannya lebih menonjol (suryabrata, 1984). Contoh sebuah esai jawaban yang hari inidiberi nilai 70, mungkin dua minggu yang akan datang, jikadiperiksa kembali akan diberi nilai 60 atau 80. Alasan ini konon berdasarkan hasil penilaian yang dilakukan lebih dari setengah abad yang alalu, antara lain oleh E.W. Tiegs (1939) dan Strach & Elliof (1939).

Namun demikian, menghindari pemakaian tes subjektif (essay test) hanya karena alasan subjektivitas guru adalah suatu tindakan yang berlawanan dengan perkembangan modernisasi pendidikan.  Ada beberapa keunggulan tes esai yang secar implisit diakui juga oleh Suryabrata (1984), yakni bahwa :
Ø  Tes esai tidak hanya mampu mengungkapkan materi hasil jawaban siswa tetapi juga cara atau jalan yang ditempuh untuk memperoleh jawaban tersebut.
Ø  Tes esai dapat mendorong siswa untuk berpikir kreatif, kritis, bebas, mandiri, tetapi tanpa melupakan tanggung jawab.

            Kelebihan dari tes essay adalah sebagai berikut: 
1.      Dapat mengungkap aspek – aspek pengetahuan atau perilaku yang komplek secara leluasa. 
2.      Menuntut siswa untuk mengintegrasikan pengetahuan dalam menjawab persoalan. 
3.      Menuntut kreativitas siswa untuk mengorganisasikan sendiri jawabannya.
4.      Dapat melihat jalan pemikiran siswa dalam menjawab persoalan .
5.      Tidak memberi kesempatan kepada siswa untuk menebak jawaban.
6.      Peserta didik dapat mengorganisasikan jawaban dengan pendapatnya sendiri.
7.      Murid tidak dapat menerka – nerka jawaban soal 
8.      Tes ini sangat cocok untuk mengukur dan mengevaluasi hasil suatu proses belajar yang kompleks yang sukar diukur dengan mempergunakan tes objektif
9.      Derajat ketepatan dan kebenaran murid dapat dilihat dari kalimat – kalimatnya. 
10.  Jawaban diungkapkan dalam kata – kata dan kalimat sendiri sehingga tes ini dapat digunakan untuk melatih penyusunan kalimat dengan bahasa yang baik, benar, dan cepat.
11.  Tes ini digunakan dapat melatih peserta didik untuk memilih fakta yang relevan dengan persoalan , dan mengorganisasikannya sehingga dapat mengungkapkan satu hasil pemikiran yang terintegrasi secara utuh.  

Kelemahan dari tes essay adalah sebagai berikut: 
1.      Ruang lingkup yang diungkap sangat terbatas 
2.      Menimbulkan timbulnya keragaman dalam memberikan jawaban, sehingga tidak ada rumusan jawaban yang pasti. 
3.      Lebih memberikan peluang untuk bersifat subyektif dan kurang reliable dalam proses penyekoran 
4.      Proses penyekoran sering terganggu oleh faktor – faktor lain diluar maksud pengukuran: misalnya keindahan dan kerapian tulisan.
5.      Sukar dinilai secara tepat,
6.      Bahan yang diukur terlalu sedikit sehingga agak sulit untuk mengukur penguasaan siswa terhadap keseluruhan kurikulum,
7.      Sulit mendapatkan soal yang memiliki standar nasional maupun internasional;
8.      Membutuhkan waktu untuk memeriksa hasilnya.  

E. Syarat Alat Evaluasi Belajar
Langkah pertama yang peril ditempuh guru dalam menilai prestasi belajar siswa adalah menyususn alat evaluasi (test instrument) yang sesuai dengan kebutuhan, dalam artian tidak menyimpang dari indicator dan jenis prestasi yang diharapkan. Persyaratan pokok penyusunan alat evaluasi yang baik dalam perspektif psikologi belajar (The psychology of learning) meliputi :
a)      Reliabilitas
Secara sederhana, reliabilitas (reliability) berarti hal tahan uji atau dapat dipercaya. Sebuah alat evaluasi dipandang reliable (reliable) atau tahan uji, apabila memiliki konsistensi atau keajegan hasil. Artinya, apabila alat itu diujikan kepada kelompok siswa pada waktu tertentu menghasilkan prestasi “X”, maka prestasi yang sama atau hamper sama dengan “X” itu dapat pula dicapai kelompok siswa tersebut setelah diuji ulang dengan alat yang sama pada waktu yang berbeda.
b)      Validitas (Cross, 1974; Barlow, 1985; Butler, 1990)
Pada prinsipnya, validitas (validity) berarti keabsahan atau kebenaran. Sebuah alat evaluasi dipandang valid (absah) apabila dapat mengukur apa yang seharusnya diukur. Contohnya, apabila sebuah alat evaluasi bertujuan mengukur prestasi belajar matematika, maka item-item (butir-butir soal) dalam alat itu hendaknya hanya direkayasa untuk mengukur kemampuan matematis siswa. Kemampuan-kemapuan lainnya yang tidka relevan, seperti kemampuan dalam bidang bahasa, IPA, dan sebagainya tidak perlu diukur dengan instrument evaluasi matematika tersebut.

F. Prinsip-prinsip Dasar Evaluasi Hasil Belajar
Evaluasi hasil belajar dikatakan terlaksana dengan baik apabila dalam pelaksanaannya senantiasa berpegang pada tiga prinsip dasar berikut ini.
1)      Prinsip Keseluruhan (Conprehensive)
Yang dimaksud dengan evaluasi yang berprinsip keseluruhan atau menyeluruh atau komprehensif adalah evaluasi tersebut dilaksanakan secara bulat, utuh, menyeluruh. Maksud dari pernyataan ini adalah bahwa dalam pelaksanaannya evaluasi tidak dapat dilaksanakan secara terpisah, tetapi mencakup berbagai aspek yang dapat menggambarkan perkembangan atau perubahan tingkah laku yang terjadi pada diri peserta didik sebagai makhluk hidup dan bukan benda mati.

Dalam hubungan ini, evaluasi diharapkan tidak hanya menggambarkan aspek kognitif, tetapi juga aspek psikomotor dan afektif pun diharapkan terangkum dalam evaluasi. Jika dikaitkan dengan mata pelajaran Bahasa dan Sastra Indonesia, penilaian bukan hanya menggambarkan pemahaman siswa terhadap materi ini, melainkan juga harus dapat mengungkapkan sudah sejauh mana peserta didik dapat menghayati dan mengimplementasikan materi tersebut dalam kehidupannya.

Jika prinsip evaluasi yang pertama ini dilaksanakan, akan diperoleh bahan-bahan keterangan dan informasi yang lengkap mengenai keadaan dan perkembangan subjek subjek didik yang sedang dijadikan sasaran evaluasi.
2)      Prinsip Kesinambungan
Istilah lain dari prinsip ini adalah kontinuitas. Penilaian yang berkesinambungan ini artinya adalah penilaian yang dilakukan secara terus menerus, sambung-menyambung dari waktu ke waktu. Penilaian secara berkesinambungan ini akan memungkinkan si penilai memperoleh informasi yang dapat memberikan gambaran mengenai kemajuan atau perkembangan peserta didik sejak awal mengikuti program pendidikan sampai dengan saat-saat mereka mengakhiri program-program pendidikan yang mereka tempuh.
3)      Prinsip Objektivitas (Objective)
Prinsip objektivitas mengandung makna bahwa evaluasi hasil belajar terlepas dari faktor-faktor yang sifatnya subjektif. Orang juga sering menyebut prinsip objektif ini dengan sebutan “apa adanya”. Istilah apa adanya ini mengandung pengertian bahwa materi evaluasi tersebut bersumber dari materi atau bahan ajar yang akan diberikan sesuai atau sejalan dengan tujuan instruksional khusus pembelajaran. Ditilik dari pemberian skor dalam evaluasi, istilah apa adanya itu mengandung pengertian bahwa pekerjaan koreksi, pemberian skor, dan penentuan nilai terhindar dari unsur-unsur subjektivitas yang melekat pada diri tester. Di sini tester harus dapat mengeliminasi sejauh mungkin kemungkinan-kemungkinan “hallo effect” yaitu jawaban soal dengan tulisan yang baik mendapat skor lebih tinggi daripada jawaban soal yang tulisannya lebih jelek padahal jawaban tersebut sama. Demikian pula “kesan masa lalu” dan lain-lain harus disingkirkan jauh-jauh sehingga evaluasi nantinya menghasilkan nilai-nilai yang objektif.

Dengan kata lain, tester harus senantiasa berpikir dan bertindak wajar menurut keadaan yang senyatanya, tidak dicampuri oleh kepentingan-kepentingan yang sifatnya subjektif. Prinsip ini sangat penting sebab apabila dalam melakukan evaluasi, subjektivitas menyelinap masuk dalam suatu evaluasi, kemurnian pekerjaan evaluasi itu sendiri akan ternoda.

Sebenarnya bukan hanya tiga prinsip di atas yang menjadi ukuran dalam untuk melakukan evaluasi. Dimyati dan Mujiono (2006:194-199) menyebutkan bahwa evaluasi yang akan dilakukan juga harus mengikuti prinsip kesahihan (valid), keterandalan (reliabilitas), dan praktis.
4)      Kesahihan
Sebuah evaluasi dikatakan valid jika evaluasi tersebut secara tepat, benar, dan sahih telah mengungkapkan atau mengukur apa yang seharusnya diukur. Agar diperoleh hasil evaluasi yang sahih, dibutuhkan instrumen yang memiliki/memenuhi syarat kesahihan suatu instrumen evaluasi.

Contoh berikut dapat dijadikan sarana untuk memahami pengertian valid. Contoh yang dimaksud adalah berupa  barometer dan termometer. Barometer adalah alat ukur yang dipandang tepat untuk mengukur tekanan udara. Jadi, kita dapat mengatakan bahwa barometer tanpa diragukan lagi adalah alat pengukur yang valid untuk mengukur tekanan udara. Dengan kata lain, apa seseorang melakukan pengukuran terhadap tekanan udara dengan menggunakan alat pengukur berupa barometer hasil pengukuran yang diperoleh itu dipandang tepat dan dapat dipercaya. Demikian pula halnya denga termometer. Termometer adalah alat pengukur yang dipandang tepat, benar, sahih, dan abash untuk mengukur tinggi rendahnya suhu udara. Jadi dapat dikatakan bahwa termometer adalah adalah alat pengukur yang valid untuk mengukur suhu udara (Sudijono, 2006:96).

Sahih atau tidaknya evaluasi tersebut ditentukan oleh faktor-faktor instrumen evaluasi itu sendiri, administrasi evaluasi dan penskoran, respon-respon siswa (Gronlund, dalam Dimyati dan Mujiono (2006:195). Kesahihan instrumen evaluasi diperoleh melalui hasil pemikiran dan pengalaman. Dari dua cara tersebut, diperoleh empat macam kesahihan yanga terdiri atas kesahihan isi (content validation), kesahihan konstruksi (contruction validity), kesahihan ada sekarang (concurrent validity), dan kesahihan prediksi (prediction validity) (Arikunto, 1990:64).
5)      Keterandalan
Keterandalan evaluasi berhubungan dengan masalah kepercayaan yaitu tingkat kepercayaan bahwa suatu evaluasi mampu memberikan hasil yang tepat. Maksud dari pernyataan ini adalah jika suatu eveluasi dilakukan pada subjek yang sama evaluasi senantiasa menunjukkan hasil evaluasi yang sama atau sifatnya ajeg dan stabil. Dengan demikian suatu ujian, misalnya, dikatakan telah memiliki reliabilitas apabila skor-skor atau nilai-nilai yang diperoleh para peserta ujian untuk pekerjaan ujiannya adalah stabil, kapan saja, dimana saja ujian itu dilaksanakan, dan oleh siapa saja pelaksananya.
Keterandalan dipengaruhi oleh beberapa faktor, yaitu:
a)      Panjang tes (length of tes). Panjang tes berhubungan dengan banyaknya butir tes. Pada umumnya lebih banyak butir tes, lebih tinggi keterandalan evaluasi. Hal ini terjadi karena makin banyak soal tes, makin banyak sampel yang diukur.
b)      Sebaran skor (spread of scores). Besarnya sebaran skor akan membuat kemungkinan perkiraan keterandalan lebih tinggi menjadi kenyataan.
c)      Tingkat kesulitan tes (difficulty of tes). Tes yang paling mudah atau paling sukar untuk anggota-anggota kelompok yang mengerjakan cenderung menghasilkan skor tes keterandalan yang lebih rendah. Hal ini disebabkan antara hasil tes yang mudah dan sulit keduanya salam suatu sebaran skor yang terbatas.
d)     Objektivitas (objektivity). Objektivitas suatu tes menunjuk kepada tingkat skor kemampuan yang sama (yang dimiliki oleh para siswa) dan memperoleh hasil yang sama dalam mengerjakan tes.
6)      Kepraktisan
Kepraktisan suatu evaluasi bermakna bahwa kemudahan-kemudahan yang ada pada instrumen evaluasi baik dalam mempersiapkan, menggunakan, menginterpretasi, memperoleh hasil maupun kemudahan dalam menyimpan.

Faktor-faktor yang mempengaruhi kepraktisan instrumen evaluasi meliputi:
a.    Kemudahan mengadministrasi;
b.   Waktu yang disediakan untuk melancarkan kegiatan evaluasi;
c.    Kemudahan menskor;
d.   Kemudahan interpretasi dan aplikasi;
e.    Tersedianya bentuk instrumen evaluasi yang ekuivalen atau sebanding.

G.  Evaluasi Berbagai Ranah Psikologi
Pada bagian ini akan dibahas alternatif pengukuran keberhasilan belajar baik yang berdimensi ranah cipta, ranah rasa, maupun karsa.
a)      Evaluasi Prestasi Kognitif
Mengukur keberhasilan siswa berdimensi kognitif (ranah cipta) dapat dilakukan dengan berbagai cara, baik dengan tes tertulis maupun tes lisan dan perbuatan. Karena semakin membengkaknya jumlah siswa di sekolah-sekolah, tes lisan dan perbuatan saat ini semakin jarang digunakan. Alasan lain mengapa tes lisan khususnya kurang mendapat perhatian ialah karena pelaksanaannya yang face to face (berhadapan langsung). Cara ini, konon dapat mendorong penguji untuk bersikap kurang fair terhadap si teruji atau peserta didik tertentu.

Dampak negatif yang terkadang muncul dalam tes yang face to face itu ialah, sikap dan perlakuan penguji yang subjektif dan kurang adil, sehingga soal yang diajukan pun tingkat kesukarannya berbeda antara satu dengan yang lainnya. Disatu puhak ada siswa yang diberi soal yang mudah dan terarah (sesuai dengan topik) sedangkan dipihak lain ada pula siswa yang ditanyai masalah yang sukar bahkan terkadang tidak relevan dengan topik
b)      Evaluasi Prestasi Afektif
Dalam merencanakan penyusunan instrument tes prestasi, siswa yang berdimensi afektif (ranah rasa) jenis-jenis prestasi internalisasi dan karakterisasi seyogyanya mendapat perhatian khusus. Alasannya karena kedua jenis prestasi ranah rasa itulah yang lebih banyak mengendalikan sikap dan perbuatan siswa.

Salah satu bentuk tes ranah rasa yang populer adalah “Skala Likert” (Likert Scale) yang tujuannya untuk mengidentifikasi kecenderungan atau sikap orang (Reber, 1988). Bentuk skala ini menampung pendapat yang mencerminkan sikap yang sangat setuju, setuju, ragu-ragu, tidak setuju, dan sangat tidak setuju. Rentang skal ini diberi skor 1 sampai 5 atau 1 sampai 7 tergantung kebutuhan dengan catatan skor-skor itu dapat mencerminkan sikap-sikap mulai sangat “Ya” sampai sangat “Tidak”. Perlu pula dicatat, untuk memudahkan identifikasi jenis kecenderungan afektif siswa yang representative item-item skala sikap sebaiknya dilengkapi dengan label atau identitas sikap yang meliputi :
v Doktrin, yakni pendirian
v Komitmen, yakni ikrar setia untuk melakukan atau meninggalkan suatu perbuatan
v Penghayatan, yakni pengalaman batin
v Wawasan, yakni pandangan atau cara memandang sesuatu.

c)      Evaluasi Prestasi Psikomotor
Cara yang dipandang tepat untuk mengevaluasi keberhasilan belajar yang berdimensi ranah psikomotor (ranah karsa) adalah observasi. Observasi, dalam hal ini, dapat diartikan sebagai sejenis tes mengenais peristiwa, tingkah laku, atau fenomena lain, dengan pengamatan langsung. Namun, observasi harus dibedakan dari eksperiment karena eksperiment pada umumnya dipandang sebagai salah satu cara observasi (Reber, 1988).

Guru yang hendak melakukan observasi perilaku psikomotor siswa-siswanya seyogyanya mempersiapkan langkah-langkah yang cermat dan sistematis menurut pedoman yang terdapat dalam lembar format observasi yang sebelumnya telah disediakan baik oleh sekolah maupun guru itu sendiri.


DAFTAR PUSTAKA
Anas sudijono, Prof. Drs. 1996. Pengantar Evaluasi Pendidikan. Jakarta:PT Raja   Grafindo Persada
Balai Pustaka. 1996. Kamus Besar Bahasa Indonesia. Jakarta:Balai Pustaka.
Dimyati dan Mujiono. 2006. Belajar dan Pembelajaran. Jakarta:Rineka Cipta.
Nurgiyantoro, Burhan. 1988. Penilaian dalam Pengajaran Bahasa dan Sastra.            BPFE: Yogyakarta.
Sudijono, Anas. 2006. Pengantar Evaluasi Pendidikan. Jakarta:PT Raja Grafindo.
Syah, Muhibbin. 2010. Psikologi Belajar. Jakarta:PT Raja Grafindo Persada.
(diakses tanggal 5 Mei 2012)