Modul 5 Evaluasi Pembelajaran di SD | Resume/Ringkasan/ Rangkuman Modul PGSD BI UT PDGK 4301
- Dapatkan link
- X
- Aplikasi Lainnya
MODUL 5
KEGIATAN
BELAJAR I
KUALITAS ALAT UKUR (INSTRUMEN)
PENDAHULUAN
Untuk mengetahui perkembangan dan kemajuan
belajar siswa, perlu dilakukan suatu penilaian dengan menggunakan berbagai
teknik yang tepat. Penilaian dalam pembelajaran dilakukan tidak hanya untuk
menilai hasil belajar siswa melainkan juga menilai proses belajar siswa. Dalam
melakukan penilaian pembelajaran, ada beberapa hal yang harus diperhatikan
guru, terutama yang berhubungan dengan jenis kompetensi yang akan dinilai,
tujuan penilaian yang dilakukan, teknik – teknik penilaian yang digunakan, dan
jenis penilaian yang akan digunakan. Dengan demikian kegiatan penilaian yang
dilakukan menjadi tepet sasaran, terarah, dan terencana.
Secara teoritis terdapat hubungan timbal balik
antara tujuan pembelajaran, proses pembelajaran, dan penilaian hasil belajar.
Jika tujuan pembembelajaran yang dirumuskan sudah tepat dan proses pembelajaran
yang dilakukan sudah maksimal maka salah satu hal yang perlu kita cermati
adalah alat penilaian hasil belajar. pengukuran memiliki dua karakteristik
utama yaitu pertama penggunaan angka atau skala tertentu, dan kedua menurut
suatu aturan atau formula tertentu. Contoh kegiatan pengukuran adalah ketika
kita mengukur tinggi atau berat badan seseorang. Kita akan mengetahui berapa
tingginya atau beratnya. Atribut atau karakteristik yang kita cari dari contoh
pengukuran tersebut yaitu tinggi atau berat, kemudian hasil pengukuran tersebut
kita akan memperoleh angka, misalkan tinggi 1,75 meter atau beratnya 70
kilogram.
-benar mampu mengukur kemampuan siswa.
apakah alat ukur yang anda gunakan ( dalam hal
ini tes yang anda susun atau instrumen lain yang anda gunakan ) mempunyai
kualitas yang baik sehingga dapat digunakan untuk mengukur tujuan pembelajaran
yang telah anda tetapkan ?.
Untuk menjawab permasalahan tersebut, kita akan
diajak untuk mempelajari lebih rinci berbagai cara yang dapat ditempuh untuk
meningkatkan kualitas alat ukur atau instrumen yang anda gunakan agar benar –
benar dapat mengukur apa yang ingin anda ukur. Dalam pembahasan ini akan
dibahas mengenai pengujian kualitas alat ukur atau instrumen yang akan membahas
tentang validitas dan reliabilitas hasil pengukuran dan tentang bagaimana cara
menganalisis butir soal dan bagaimana cara meningkatkan kualitas butir soal
berdasarkan hasil analisis serta bagaimana meningkatkan kualitas alat ukur
non-tes.
Validitas dan Reliabilitas Hasil Pengukuran
Untuk mengukur sesuatu kita harus dapat memilih
alat ukur yang sesuai agar kita dapat memperoleh hasil pengukuran yang tepat.
Sebagai contoh, seorang pemanah akan dinyatakan sebagai pemenang jika hasil
bidikannya dapat dengan tepat mengenai sasaran yaitu daerah lingkaran yang
paling dalam atau yang paling mendekati lingkaran yang paling dalam. Jika hasil
bidikan peserta didik dapat mengenai daerah di lingkaran paling dalam maka ia
akan memperoleh skor tertinggi dan perolehan skor tersebut semakin berkurang
jika hasil bidikannya jauh dari sasaran. Karena anak panah yang harus
dilepaskan tidak hanya satu maka pemanah dituntut untuk tetap dapat melepaskan
anak panahnya tepat mengenai sasaran.
Hasil bidikan dari peserta bisa tepat mengenai
sasaran atau juga melesat dari sasaran. Hasil yang sama dapat terjadi pada saat
anda mengukur hasil belajar siswa. Jika alat ukur yang anda gunakan tidak anda
persiapkan dengan cermat maka skor yang anda peroleh tidak dapat menggambarkan
dengan tepat tingkat kemampuan siswa.Dari penjelasan tersebut terdapat dua
masalah pokok yang harus diperhatikan dalam menyusun alat ukur hasil belajar
yang baik yaitu masalah yang berhubungan dengan ketepatan hasil
pengukuran dan ketetapan hasil pengukuran.Masalah yang
berhubungan dengan ketepatan hasil pengukuran inilah yang dikenal dengan
istilah validitas sedangkan maslah – masalah yang berhubungan dengan ketetapan
hasil pengukuran dikenal dengan istilah reliabilitas.
A. Validitas
Alat ukur yang baik adalah alat ukur yang dapat
dengan tepat mengukur apa yang ingin diukur. Jika kita ingin mengukur panjang
sebuah meja maka kita harus dapat memilih alat ukur yang tepat untuk mengukur
panjang meja tersebut.Untuk menghitung waktu tempuh pelari cepat dalam
perlombaan lari cepat 100 meter maka kita juga harus dapat memilih alat ukur
yang tepat untuk digunakan. Demikian juga jika kita ingin mengukur hasil
belajar siswa maka kita juga dituntut untuk menggunakan alat ukur ( dalam hal
ini tes ) yang dapat dengan tepat mengukur hasil belajar yang kita harapkan.
Pengertian validitas mengacu pada ketepatan interpretasi
yang dibuat dari hasil pengukuran atau evaluasi ( Gronlund dan Linn, 1990).
Secra umum validitas ada tiga jenis :
a. Validitas isi (
concent validity ).
b. Validitas konstrak (
construct validity ).
c. Validitas yang
dikaitkan dengan kriteria tertentu ( criterion related validity ).
Validitas isi diperlukan untuk menjawab
pertanyaan “ sejauh mana item – item yang ada dalam tes dapat mengukur
keseluruhan materi yang telah diajarkan “. Tinggi rendahnya validitas isi dapat
ditetapkan berdasarkan analisis rasional atau pertimbangan ahli terhadap isi
tes tersebut.Hal ini merupakan tuntutan yang harus dipenuhi oleh tes hasil
belajar. Tinggi rendahnya validitas isi suatu tes dapat dilihat pada
perencanaan atau kisi – kisi tes. Semakin representatif materi yang dapat
ditanyakan dalam tes tersebut menunjukkan semakin tinggi validitas isinya.
Validitas konstrak mengacu pada sejauh mana alat
ukur tersebut dapat mengungkap keseluruhan konstrak yang digunakan sebagai
dasar dalam penyusunan tes tersebut.Yang dimaksud dengan konstrak disini adalah
konsep hipotesis (hipotetical concept) yang digunakan sebagai
dasar dalam penyusunan alat ukur.Validitas konstrak ini banyak digunakan
terutama dalam pengukuran – pengukuran psikologi seperti pengukuran sikap,
minat, tingkah laku dan sebagainya.Campbell dan Fiske (Demari Mardapi, 2004)
mengembangkan satu pendekatan untuk menentukan validitas konstrak dengan
menggunakan teknik multi trait-multi method.Validasi dengan multi
trait – multi method dilakukan dengan menggunakan lebih dari satu metode untuk
mengukur lebih dari satu acam trait ( sifat ). Dengan
menggunakan matrik korelasi sehingga interkorelasi antara trait dan metode
dapat dilihat dengan jelas.
Jika suatu tes dimaksudkan untuk memprediksi
keberhasilan seseorang di masa yang akan datang atau dimaksudkan untuk
mengetahui kesesuaian anatar pengetahuan dengan keterampilan yang dimiliki maka
alat ukur yang digunakan harus mempunyai criterion related validity yang
tinggi.
B.. Reliabilitas
Hasil – hasil pengukuran yang berhubungan dengan
aspek – aspek fisik seperti mengukur panjang meja, tinggi almari, berat badan
dan tinggi badan biasanya menghasilkan reliabilitas yang sangat tinggi.Artinya
walaupun pengukuran dilakukan lebih dari sekali tetapi tetap memberikan hasil
yang ridak jauh berbeda. Hasil pengukuran yenag berbeda akan sering kita
temukan jika kita melakukan pengukuran terhadap hal – hal yang berhubungan
dengan aspek – aspek psikologi dan sosial seperti dalam pengukuran mewakili
intelegensi, sikap, dan konsep diri. Aspek – aspek sosial-psikologi seperti itu
tidak dapat diukur dengan ketepatan dan konsistensi yang tinggi.Hal ini
disebabkan karena hasil pengukuran yang diperoleh tidak dapat lepas dari
pengaruh hal - hal diluar maksud pengukuran tersebut misalnya alat ukur itu
sendiri bukan merupakan alat ukur yang tepat untuk mengukur aspek yang
diinginkan. Disamping itu karena subjek pengukurannya adalah manusia maka cara
– cara penyajian tes, emosi, motivasi. Kondisi fisik dan keadaan ruangan tes
akan mempengaruhi hasil pengukuran walaupun sebenarnya aspek – aspek yang ingin
kita ukur tersebut tidak berubah. Dengan demikian hasil pengukuran yang
diperoleh menjadi kurang reliabel.
Pengertian reliabilitas mengacu pada ketetapan hasil
yang diperoleh dari suatu Pengukuran ( Grondlund dan Linn, 1990 ). Salah satu
cara untuk mengetahui ketetapan atau reliabilitas suatu pengukuran, dapat
diperoleh dengan cara melakukan pengukuran dua kali. Hasil pengukuran dikatakan
mempunyai reliabilitas yang tinggi jika hasil pengukuran pertama hampir sama
dengan hasil pengukuran kedua. Dan sebaliknya hasil pengukuran dikatakan
mempunyai reliabilitas yang rendah jika hasil pengukuran pertama jauh berbeda
dengan hasil pengukuran kedua. Hubungan antar skor yang diperoleh pada
pengukuran pertama dengan kedua akan menghasilkan angka korelasi bergerak
antara -1 sampai dengan +1. Semakin tinggi angka koefisien reliabilitas
(mendekati 1) maka semakin tinggi reliabilitas tersebut. Suatu perangkat tes
dinyatakan cukup reliabel jika mempunyai reliabilitas lebih besar 0,5
(Fernandes, 1984).
Konsep reliabilitas dalam arti equivalent tes
dimaksudkan untuk mengetahui apakah dua set tes yang digunakan paralel atau
tidak. Keparalelan dua set tes ini diperoleh dengan cara mengembangkan dua set
tes yang paralel dari kisi - kisi tes yang sama kemudian masing - masing tes
tersebut diujikan pada dua kelas yang mempunyai tingkat kemampuan yang sama.
Hasil kedua tes tersebut dikorelasikan, jika hasil korelasinya tinggi, hal ini
menunjukan kedua tes paralel.koefisien korelasinya dapat dihitung dengan
menggunakan formula product-moment.
konsep reliabilitas dalam arti konsistensi
internal dimaksudkan untuk mengetahui apakah kumpulan butir soal yang ada dalam
satu set tes tersebut mengukur dimensi hasil belajar yang sama atau tidak.
Konsep reliabilitas dalam asrti konsistensi dapat dihitung menggunakan formula
Kuder-Richardson (KR-20 atau KR-21). Jika hasil korelasinya tinggi, hal ni
menunjukan bahwa antara butir soal dalam satu set tes tersebut adalah konsisten
dengan yang lain.
C. Hubungan
antara validitas dan reliabilitas
Ketepatan hasil pengukuran ( validitas ) sangat
diperlukan untuk memperoleh alat ukur yang dapat memberikan hasil pengukuran
yang tepat ( valid ). Walaupun demikian alat ukur yang mempunyai reliabilitas
tinggi belum tentu secara otomatis mempunyai validitas yang tinggi. Karena
tingginya reliabilitas yang dihasilkan oleh suatu alat ukur jika tidak
dibarengi dengan tingginya validitas dapat memberikan informasi yang salah tentang
apa yang ingin kita ukur.
D.
Meningkatkan Reliabilitas Tes
Reliabilitas suatu tes dapat ditingkatkan dengan
menambah jumlah butir kedalam tes tersebut. Penambahan butir soal pada tes akan
meningkatkan reliabilitas jika butir soal yang ditambahkan adalah butir soal
yang homogen dengan butir soal – soal yang ada.
KEGIATAN BELAJAR 2
ANALISIS DAN PERBAIKAN INSTRUMEN
A.ANALISIS BUTIR SOAL
Menurut Nitko (1983), analisis butir soal
menggambarkan suatu proses pengambilan data dan penggunaan informasi tentang
tiap - tiap butir soal terutama tentang respon siswa terhadap setiap butir
soal. Lebih Lnjut dikatakan bahwa arti penting penggunaan analisis butir soal
adalah sebagai berikut :
1. Untuk mengetahui apakah
butir soal – butir soal yang disusun sudah berfungsi sesuai dengan apa yang
dikehendaki oleh penyusun soal. Untuk menentukan apakah soal – soal yang kita
susun telah berfungsi sebagaimana seharusnya maka kita harus memperhatikan hal
– hal sebagai berikut :
a. Apakah
soal – soal yang disusun sudah sesuai untuk mengukur perubahan tingkah laku
seperti telah dirumuskan dalam tujuan instruksional khusus ?
b. Apakah tingkat kesukaran
sudah kita perhatikan ?
c. Apakah soal tersebut
sudah mampu membedakan antara siswa yang pandai dengan siswa yang kurang pandai
?
d. Apakah kunci soal yang kita
buat sudah benar sesuai dengan maksud soa ?
e. Jika menggunakan tes
pilihan berganda, apakah pengecoh yang kita pilih sudah berfungsi dengan baik ?
f. Apakah soal tersebut
dapat ditafsirkan ganda atau tidak ?
2. Sebagai umpan balik bagi
siswa untuk mengetahui kemampuan mereka dalam menguasai suatu materi.
3. Sebagai umpan balik bagi
guru untuk mengetahui kesulitan – kesulitan yang dialami siswa dalam memahami
suatu materi.
4. Sebagai acuan untuk merevisi
soal.
5. Untuk memperbaiki kemapuan
kita dalam menulis soal.
Pada saat kita engujikan suatu set soal untuk mengambil keputusan
penting tentang hasil belajar siswa maka idealnya kita harus yakin bahwa set
soal tersebut adalah valid dan reliabel. Validitas set soal dapat diketahui
dari kisi – kisi soal sedangkan reliabelitas soala baru dapat diketahui setelah
uji coba. Dalam rangka memperoleh reliabilitas set soal inilah analisis butir
soal dilakukan. Dalam menganalisis butir soal paling tidak ada dua
karakteristik butir soal yang perlu diperhatikan yaitu tingkat kesukaran dan
daya beda butir – butir soal.
B. KAPAN ANALISIS BUTIR SOAL DILAKUKAN ?
1) Tingkat kesukaran butir soal
Besarnya tingkat kesukaran butir soal, dapat
dihitung dengan memperhatikan proporsi peserta tes yang menjawab benar terhadap
setiap butir soal. Secara matematis tingkat kesukaran butir soal dapat dihitung
dengan rumus :
P =
Keterangan :
P adalah indeks kesukaran butir soal
B adalah jumlah peserta tes yang menjawab benar
N adalah jumlah peserta tes
Menurut Fernandes (1984), kategori kesukaran butir
soal adalah sebagai berikut :
P > 0,75 : mudah
0,25 ≤ P ≤ 0,75 : sedang
P < 0,24 : sukar
Butir soal yang baik adalah butir soal yang
memiliki tingkat kesukaran dalam kategori sedang.
2) Daya beda
Daya beda butir soal memiliki pengertian
seberapa jauh butir soal tersebut dapat membedakan kemampuan individu peserta
tes. Daya beda butir soal dapat dihitung dengan menggunakan rumus :
D=PA – PB
dimana,
D = indeks daya beda butir soal
PA = proporsi kelompok atas yang menjawab
benar
PB = proporsi kelompok bawah yang menjawab
salah
Secara teoritis indeks beda soal (D) = 1 akan
tercapai apabila semua siswa dalam kelompok atas menjawab benar dan semua siswa
dalam kelompok bawah menjawab salah. Indeks daya beda soal (D) = -1 jika semua
sisa dalam kelompok atas menjawab salah dan semua siswa dalam kelopok bawah
justru menjawab benar. Sedangkan indeks daya beda soal (D) = 0 apabila proporsi
siswa yang menjawab benar dalam kelompok atas dan kelompok bawah adalah sama.
Menurut Fernandes (1984) kategori indeks daya beda butir soal adalah :
D ≥ 0,40 = sangat baik
0,30 ≤ D ≤ 0,40 = baik
0,20 ≤ D < 0,30 = sedang
D < 0,20 = tidak baik
Butir soal yang perlu diperbaiki adalah butir
soal yang terlalu sukar atau terlalu mudah dan butir soal yang pengecohnya
mempunyai daya beda positif atau kuncinya mempunyai daya beda negatif.
Perbaikan butir soal dapat dilakukan pada pokok soal atau pada alternatif
jawaban.
C. Menganalisis Tes Uraian
Cara menganalisis tes uraian menurut Whitney dan
Sabers (Mehrens dan Lehmann, 1984) adalah : (1) tentukan jumlah siswa yang
termasuk kelompok atas (25%) dan kelompok bawah (25%), (2) hitung jumlah skor
kelompok atas dan jumlah skor kelompok bawah, dan (3) hitung tingkat kesukaran
dan daya beda setiap butir soal dengan rumus berikut :
Dimana
SA
: jumlah skor kelompok atas
SB
: jumlah skor kelompok bawah
N
: 25%
peserta didik
Skor maks : skor maksimal tiap
buti tes
Skor min
: skor minimal tiap butir tes
D. Memperbaiki Butir Soal
Beberapa hal yang perlu diperhatikan dalam memperbaiki butir soal
antara lain : a) perhatikan tingkat kesukaran soal. Butir soal dianggap baik
jika mempunyai tingkat kesukaran (P) antara 0,25 sampai dengan 0,75 atau
mendekati angka tersebut, b) perhatikan daya beda butir soal. Butir soal
dianggap baik jika kunci atau jawabannya dianggap benar mempunyai beda positif
tinggi dan pengecohnya mempunyai daya beda negatif.
E. Memperbaiki Non-Tes
Prosedur memperbaiki instrument non-tes sama dengan prosedur
memperbaiki tes. Penyempurnaan butir yang lemah dapat dilaksanakan dengan
memperbaiki butir yang kurang baik atau mengganti butir yang lama dengan butir
yang baru. Penyebab butir soal kurang baik, antara lain: a) penggunaan bahasa
kurang komunikatif, b) kalimat dapat ditafsirkan ambiguous (dapat ditafsirkan
ganda), c) pertanyaan / pernyataan yang dibuat menyimpang dari indikator, dan
d) pertanyaan / pernyataan tidak mengukur tarif (sifat) yang akan diukur.
- Dapatkan link
- X
- Aplikasi Lainnya
Komentar
Posting Komentar