Minggu, 26 Juni 2011

TES STANDAR, TES BUATAN GURU, DAN ANALISIS HASIL TES


MAKALAH
TES STANDAR, TES BUATAN GURU, DAN ANALISIS HASIL TES
Disusun untuk memenuhi tugas
Mata Kuliah                 : Evaluasi Pendidikan
Dosen Pengampu          : Ahmad Afroni, M.Ag


 









Disusun oleh :
KELOMPOK 4
Ikhsan Setia Pujiono              202109387
Munadhiroh                            232108210
Sri Mutmainah                       232108211

KELAS F

JURUSAN TARBIYAH
SEKOLAH TINGGI AGAMA ISLAM NEGERI
(STAIN) PEKALONGAN
2011



BAB I
PENDAHULUAN
A.     Latar Belakang
Tes adalah salah satu bentuk instrumen evaluasi untuk mengukur seberapa besar kemampuan siswa dalam memahami dan menguasai pokok-pokok materi yang sudah diajarkan. Tes ada yang dibuat oleh seorang guru yang kemudian disebut tes buatan guru dan ada tes yang sudah memenuhi standar suatu satuan pendidikan maupun lembaga pendidikan yang kemudian disebut tes terstandar.
Dalam menilai, baik tes terstandar maupun tes buatan guru ada beberapa hal yang perlu diperhatikan yang berkaitan dengan analisis hasil tes tersebut. Dalam makalah ini akan diuraikan tentang banyak hal yang berkaitan dengan tes standar dan tes buatan guru. Serta dijelaskan juga tentang analisis hasil tes.
B.     Permasalahan
1.      Apa yang dimaksud tes standar dan tes buatan guru itu?
2.      Bagaimana perbandingan antara tes standar dengan tes buatan guru?
3.      Apa saja kegunaan kedua tes tersebut?
4.      Kelengkapan apa saja yang harus ada pada tes standar?
5.      Bagaimana cara menilai tes yang dibuat sendiri?
6.      Bagaimana cara menganalisis hasil tes?
C.     Tujuan
1.      Untuk mengetahui tentang hal-hal yang berkaitan dengan tes standar dan tes buatan guru.
2.      Untuk mengetahui tentang cara menganalisis hasil tes.











BAB II
PEMBAHASAN
“TES STANDAR, TES BUATAN GURU, DAN ANALISIS HASIL TES”
A.     Tes Standar dan  Tes Buatan Guru
  1. Pengertian Tes Standar, Tes Prestasi Standar
Pengertian tes standar secara sempit adalah tes yang disusun oleh satu tim ahli, atau disusun oleh lembaga yang khusus menyelenggarakan secara professional. Tes tersebut diketahui memenuhi syarat sebagai tes yang baik. Tes ini dapat digunakan dalam waktu yang relatif lama, dapat diterapkan pada beberapa obyek mencakup wilayah yang luas. Untuk mengukur validitas dan reliabilitasnya telah diuji-cobakan beberapa kali sehingga hasilnya dapat dipertanggungjawabkan.[1]
Di antara tes prestasi yang digunakan di sekolah ada yang dinamakan tes prestasi standar. Dalam salah satu  kamus, arti kata ”standar” adalah:
A degree of level of requirement, excellence, or attainment
Standar untuk siswa dapat dimaksudkan sebagai suatu tingkat kemampuan yang harus dimiliki bagi suatu program tertentu. Mungkin standar bagi suatu kursus A berbeda dengan B. Jadi standar ini dapat dibuat “keras” maupun “lunak” tergantung dari yang mempunyai  kebijaksanaan.
Suatu tes standar dengan demikian berbeda dengan tes prestasi biasa.
Prosedur yang digunakan untuk menyusun tes standar untuk tes prestasi melalui cara langsung yang ditumbuhkan dari tes yang digunakan di kelas. Sedangkan spesifikasi yang digunakan untuk menentukan isi dalam tes bakat biasanya didasarkan atas analisis job (jabatan) atau analisis tugas yang merupakan tuntutan calon pekerjaannya. Disamping itu juga mempertimbangkan sifat-sifat yang ada pada manusia. Analisis jabatan analisis tugas yang dilakukan biasanya tidak tidak didasarkan atas satu kurikulum, tetapi diambil dari masyarakat.
Istilah “standar” dalam tes dimaksudkan bahwa semua siswa menjawab pertanyaan-pertanyaan yang sama dari sejumlah besar pertanyaan dikerjakan dengan menggunakan petunjuk yang sama dan dalam batasan waktu yang sama pula. Dengan demikian maka seolah-olah ada suatu standar atau ukuran sehingga diperoleh suatu standar penampilan (performance) dan penampilan kelompok lain dapat dibandingkan dengan penampilan kelompok standar tersebut.
Istilah “standar” tidak mengandung arti bahwa tes tersebut mengukur apa yang harus dan dapat diajarkan pada suatu tingkat tertentu atau bahwa tes itu menyiapkan suatu standar prestasi dimana siswa harus dan dapat mencapai suatu tingkat tertentu. Sekali lagi, tes standar dipolakan untuk penampilan prestasi sekarang (yang ada) yang dilaksanakan secara seragam, diusahakan dalam kondisi yang seragam, baik itu diberikan kepada siswa dalam pelaksanaan perseorangan maupun siswa sebagai anggota dari suatu kelompok.[2]
  1. Perbandingan Tes Standar dan Tes Buatan Guru.
Tes standar disusun dalam tipe-tipe soal yang sama yang meliputi bahan atau pengetahuan yang sama banyak dengan bahan atau pengetahuan yang dicakup oleh tes buatan guru. Lalu apakah perbedaan antara tes standar dengan tes buatan guru, atau apakah keburukan dan keuntungan tes standar?
Pertama, marilah kita tinjau perbedaan antara tes standar dengan tes buatan guru. Perbedaannya adalah sebagai berikut:
Tes Standar
Tes Buatan Guru
a. Didasarkan atas bahan dan tujuan umum dari sekolah-sekolah di seluruh Negara.
b. Mencakup aspek yang luas dan pengetahuan atau keterampilan dengan hanya sedikit butir tes untuk setiap keterampilan atau topik.
c. Disusun dengan kelengkapan staf profesor, pembahas, dan editor butir tes.
d. Menggunakan butir tes yang sudah diujicobakan (try out), dianalisis dan direvisi sebelum menjadi sebuah tes.
e. Mempunyai reliabilitas yang tinggi.
f. Dimungkinkan menggunakan norma untuk seluruh Negara.
a. Didasarkan atas bahan dan tujuan khusus yang dirumuskan oleh guru untuk kelasnya sendiri.
b. Dapat terjadi hanya mencakup pengetahuan atau keterampilan yang sempit.
c. Biasanya disusun sendiri oleh guru dengan sedikit atau tanpa bantuan orang lain/tenaga ahli.
d. Jarang menggunakan butir tes yang sudah diujicobakan, dianalisis dan direvisi.
e. Mempunyai reliabilitas sedang atau rendah.
f. Norma kelompok terbatas kelas tertentu.
Kedua, untuk menyusun tes standar, diutuhkan waktu yang lama. Seperti disebutkan ahwa untuk memperoleh sebuah tes standar melalui prosedur:
o       Penyusunan;
o       Uji coba;
o       Analisa;
o       Revisi;
o       Edit.
Kelima kegiatan ini membutuhkan waktu lama.[3]
  1. Kegunaan Tes Standar dan Tes Buatan Guru.
a.       Kegunaan Tes Standar
Secara singkat dapat dikemukakan bahwa kegunaan tes standar adalah:
a)      Jika ingin membuat perbandingan,
b)      Jika banyak orang yang akan memasuki suatu sekolah tetapi tidak tersedia data tentang calon ini.
Secara garis besar kegunaan tes standar adalah:
                                       i.      Membandingkan prestasi belajar dengan pembawaan individu atau kelompok.
                                     ii.      Membandingkan tingkat prestasi siswa dalam keterampilan di berbagai bidang studi untuk individu atau kelompok.
                                    iii.      Membandingkan prestasi siswa antara berbagai sekolah atau kelas.
                                   iv.      Mempelajari perkembangan siswa dalam suatu periode waktu tertentu.
b.      Kegunaan Tes Buatan Guru
Secara singkat dapat dikemukakan bahwa kegunaan tes buatan guru adalah:
                                       i.      Untuk menentukan seberapa baik siswa telah menguasai bahan pelajaran yang diberikan dalam waktu tertentu.
                                     ii.      Untuk menentukan apakah sesuatu tujuan telah tercapai.
                                    iii.      Untuk memperoleh suatu nilai.
Selanjutnya baik tes standar dan tes buatan guru dianjurkan dipakai jika hasilnya akan digunakan untuk:
a)      Mengadakan diagnosis terhadap ketidakmampuan siswa.
b)      Menentukan tempat siswa dalam suatu kelas atau kelompok.
c)      Memberikan bimbingan kepada siswa dalam pendidikan dan pemilihan jurusan.
d)      Memilih siswa untuk program-program khusus.[4]
  1. Kelengkapan Tes Standar
Sebuah tes yang sudah distandardisasikan dan sudah dapat disebut sebagai tes standar, biasanya dilengkapi dengan sebuah manual. Manual ini memuat keterangan-keterangan atau petunjuk-petunjuk yang perlu terutama yang menjelaskan tentang pelaksanaan, menskor, dan mengadakan interpretasi.
Secara garis besar manual tes standar ini memuat:
a.      Ciri-ciri mengenai tes, misalnya menyebutkan tingkat validitas, tingkat reliabilitas dan sebagainya.
b.      Tujuan serta keuntungan-keuntungan dari tes
Misalnya yang disebutkan untuk siapa tes tersebut diberikan dan untuk tujuan apa.
c.       Proses standardisasi tes
Misalnya mengenai hal-hal yang berhubungan dengan sampel.
- Besarnya sampel,
- Teknik sampling,
- Kelompok mana yang diambil sebagai sampel (sifat sampel).
Juga mengenai taraf kepercayaan yang diambil dan bagaimana kaitannya dengan hasil tes.


d.      Petunjuk-petunjuk tentang cara melaksanakan tes
Misalnya: dilaksanakan dengan lisan atau tertulis, waktu yang digunakan untuk mengerjakan setiap bagian, boleh tidaknya tercoba keluar jika sudah selesai mengerjakan soal itu dan sebagainya.
e.       Petunjuk-petunjuk bagaimana cara menskor
Misalnya: untuk beberapa skor tiap-tiap soal/unit, menggunakan sistem hukuman atau tidak, bagaimana cara menghitung nilai akhir dan sebagainya.
f.        Petunjuk-petunjuk untuk menginterpretasikan hasil
Misalnya:
- Betul nomor sekian sampai sekian cocok untuk jabatan kepala seksi,
- Betul nomor sekian saja, cocok untuk jabatan guru dan sebagainya.
g.      Saran-saran lain
Misalnya: siapa harus menjadi pengawas, bagaimana seandainya tidak ada calon yang mencapai skor tertentu dan sebagainya.[5]
B.     Menganalisis Hasil Tes
1.      Menilai Tes yang Dibuat Sendiri/Guru
Ada 4 cara untuk menilai tes yaitu :
a.       Cara pertama meneliti secara jujur soal-soal yang sudah disusun, kadang-kadang dapat diperoleh jawaban tentang ketidakjelasan perintah atau bahasa, taraf kesukaran, dan lain-lain keadaan soal tersebut.
Pertanyaan-pertanyaan tersebut, antara lain:
·              Apakah banyaknya soal untuk tiap topik sudah seimbang?
·              Apakah semua soal menanyakan bahan yang telah diajarkan?
·              Apakah soal yang kita susun tidak merupakan pertanyaan yang membingungkan?
·              Apakah soal itu tidak sukar untuk dimengerti?
·              Apakah soal itu tidak dapat dikerjakan oleh sebagian siswa?
b.      Cara kedua adalah mengadakan analisis soal (item analysis). Analisis soal adalah suatu prosedur yang sistematis, yang akan memberikan informasi-informasi yang sangat khusus terhadap butir tes yang kita susun.
Faedah mengadakan analisis soal:
·              Membantu kita dalam mengidentifikasi butir-butir soal yang jelek.
·              Memperoleh informasi yang akan dapat digunakan untuk menyempurnakan soal-soal untuk kepentingan lebih lanjut.
·              Memperoleh gambaran secara selintas tentang keadaan yang kita susun.
c.       Cara ketiga adalah mengadakan checking validitas. Validitas yang paling penting dari tes buatan guru adalah validitas kurikuler. Untuk mengadakan checking validitas kurikuler, kita harus merumuskan tujuan setiap bagian pelajaran secara khusus dan jelas sehingga setiap soal dapat kita jodohkan dengan setiap tujuan khusus tersebut.
Dalam hal ini Terry D. Ten Brink, mengemukakan pendapatnya demikian:
·              Untuk tes yang dirancang akan menggunakan norm-referenced tidak harus menuliskan setiap tujuan khusus, tetapi cukup dengan tujuan-tujuan yang esensial saja.
·              Untuk tes yang dirancang akan menggunakan criterion referenced, maka setiap tujuan khusus harus dicantumkan dalam tabek spesifikasi.
d.      Cara keempat adalah dengan mengadakan checking reliabilitas.
Salah satu indikator untuk tes yang mempunyai reliabilitas yang tinggi adalah bahwa kebanyakan dari soal-soal tes itu mempunyai daya pembeda yang tinggi.[6]
2.      Analisis Butir Soal
Analisis soal antara lain bertujuan untuk mengadakan identifikasi soal-soal yang baik, kurang baik, soal yang jelek. Dengan analisis soal dapat diperoleh informasi tentang kejelekan sebuah soal dan petunjuk untuk mengadakan perbaikan.
a.      Taraf  Kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah dan tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya.
Bilangan yang menunjukkan sukar dan mudahnya suatu soal disebut indeks kesukaran (difficulty index). Besarnya indeks kesukaran antara 0,00 sampai dengan 1,00. Indeks kesukaran  ini menunjukkan taraf kesukaran soal. Soal dengan indeks kesukaran 0,00 menunjukkan bahwa soal itu terlalu sukar, sebaliknya indeks 1,00 menunjukkan bahwa soalnya terlalu mudah.
0,00--------------------------1,00
Sukar                           Mudah
Di dalam istilah evaluasi, indeks kesukaran diberi simbol P (p besar), singkatan dari kata ”proporsi”. Dengan demikian maka soal dengan P=0,70 lebih mudah dibandingkan dengan P=0,20, begitu juga sebaliknya.
Rumus mencari P adalah:
                  Di mana:
P = indeks kesukaran
B = banyaknya siswa yang menjawab soal itu dengan benar
JS = jumlah seluruh siswa peserta tes
Contoh penggunaan:
Misalnya jumlah siswa peserta tes dalam suatu kelas ada 40 orang. Dari 40 orang siswa tersebut 12 orang dapat mengerjakan soal nomor 1 dengan benar. Maka indeks kesukarannya adalah:
            Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai berikut:
§         Soal dengan P 0,00 sampai 0,30 adalah soal sukar
§         Soal dengan P 0,30 sampai 0,70 adalah soal sedang
§         Soal dengan P 0,70 sampai 1,00 adalah soal mudah
            Walaupun demikian ada yang berpendapat bahwa soal-soal yang dianggap baik, yaitu soal-soal sedang, adalah soal-soal yang mempunyai indeks kesukaran 0,30 sampai dengan 0,70.[7]

b.      Daya Pembeda
Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang bodoh (berkemampuan rendah).
Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi, disingkat D (d besar). Seperti halnya indeks kesukaran, indeks diskriminasi (daya pembeda) ini berkisar antara 0,00 sampai 1,00. hanya bedanya, indeks kesukaran tidak mengenal tanda negatif (-), tetapi pada indeks diskriminasi ada tanda negatif. Tanda negatif pada indeks diskriminasi digunakan jika suatu soal ”terbalik” menunjukkan kualitas testee. Yaitu anak yang pandai disebut bodoh dan anak yang bodoh disebut pandai.
Dengan demikian ada tiga titik pada daya pembeda yaitu :
-1,00                                        0,00                                         1,00
                        -1,00 = daya pembeda negatif
                        0,00 = daya pembeda rendah
                        1,00 = daya pembeda tinggi (positif)
Seluruh pengikut tes dikelompokkan menjadi 2 kelompok, yaitu kelompok pandai atau kelompok atas (upper group) dan kelompok bodoh atau kelompok bawah (lower group).
Jika seluruh kelompok atas dapat menjawab soal tersebut dengan benar, sedang seluruh kelompok bawah menjawab salah, maka soal tersebut mempunyai D paling besar, yaitu 1,00. sebaliknya jika semua kelompok atas menjawab salah, tetapi semua kelompok bawah menjawab betul, maka nilai D-nya -1,00. Tetapi jika siswa kelompok atas dan kelompok bawah sama-sama menjawab benar atau sama-sama menjawab salah, maka soal tersebut mempunyai nilai D 0,00. Karena tidak mempunyai daya pembeda sama sekali.
Cara menentukan Daya Pembeda (nilai D)
a)      Untuk kelompok kecil
Seluruh kelompok testee dibagi dua sama besar, 50% kelompok atas dan 50% kelompok bawah.
Contoh:
                 
Siswa
Skor
A
9
B
Kelompok Atas (Ja)
 
8
C
7
D
7
E
6
F
5
G
Kelompok Bawah (Jb)
 
5
H
4
I
4
J
3
Seluruh pengikut tes, dideretkan mulai dari skor teratas sampai terbawah, lalu dibagi 2.
b)      Untuk kelompok besar
Untuk kelompok besar biasanya hanya diambil kedua kutubnya saja, yaitu 27% skor teratas sebagai kelompok atas (Ja) dan 27% skor terbawah sebagai kelompok bawah (Jb)
Contoh :
9
9
8
8
8                27% sebagai Ja
.
.
.
-
.
.
-
.
.
.
2                27% sebagai Jb
1
1
1
0
   Rumus mencari D
Rumus untuk menentukan indeks diskriminasi adalah:
Di mana:
J = jumlah peserta tes
Ja = banyaknya peserta kelompok atas
Jb = banyaknya peserta kelompok bawah
Ba = banyaknya peserta kelompok atas yang menjawab soal itu dengan benar.
Bb = banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar.
Pa = Proporsi peserta kelompok atas yang menjawab benar
Pb = Proporsi peserta kelompok bawah yang menjawab benar
Klasifikasi Daya Pembeda
D : 0,00 – 0,20 : jelek (poor)
D : 0,20 – 0,40 : cukup (satisfactory)
D : 0,40 – 0,70 : baik (good)
D : 0,70 – 1,00 : baik sekali (excellent)
D : negatif, semuanya tidak baik, jadi semua butir soal yang mempunyai nilai D negatif sebaiknya dibuang saja.
Hubungan antara P dan D
Untuk melihat hubungan antara P dengan D, perlu kita telaah kembali rumus-rumus untuk menentukannya.
………………….(1)
……………………………….(2)
Dari indeks kesukaran (P) dan indeks diskriminasi (D) dapat diperoleh hubungan sebagai berikut:
Dmax = 2P...(3)

Sebagai contoh:
Soal dengan P = 0,20 akan
memberikan Dmax = 0,40
Soal dengan P = 0,80 akan
 memberikan Dmax yang sama.
Dari grafik terlihat bahwa soal-soal dengan nilai P = 0,50 memunkinkan untuk mendapat daya pembeda paling tinggi.[8]
c.       Pola Jawaban Soal
Yang dimaksud pola jawaban soal disini adalah distribusi tes tersebut dalam hal menentukan pilihan jawaban pada soal bentuk pilihan ganda. Pola jawaban soal diperoleh dengan menghitung banyaknya tes tersebut yang memilih pilihan jawaban a, b, c atau d atau yang tidak memilih pilihan manapun (blangko). Dalam istilah evaluasi disebut omit disingkat O.
Dengan melihat pola jawaban soal, dapat diketahui :
1. Taraf kesukaran soal
2. Daya pembeda soal
3. Baik dan tidaknya distraktor
Sesuatu distroktor dapat diperlakukan dengan 3 cara :
a. Diterima, karena sudah baik
b. Ditolak, karena tidak baik
c. Ditulis kembali karena kurang baik
Menulis soal adalah suatu pekerjaan yang sulit, sehingga apabila masih dapat diperbaiki sebaiknya diperbaiki saja, tidak dibilang suatu distroktor dapat dikatakan berfungsi baik jika paling sedikit dipilih 5 % pengikut tes.
Contoh Perhitungan:
Dari analisis sebuah item, polanya diketahui sebagai berikut:
Pilihan Jawab
a
b
c*
d
O
Jumlah
Kelompok Atas
5
7
15
3
0
30
Kelompok Bawah
8
8
6
5
3
30
Jumlah
13
15
21
8
3
60


Dari pola jawaban soal dapat dicari:
1)     
2)     
3)      Distraktor: semua distraktornya sudah berfungsi dengan baik karena sudah dipilih oleh lebih dari 5% pengikut tes.
4)      Dilihat dari segi omit (kolom pilihan paling kanan) adalah baik. Sebuah item dikatakan baik jika omitnya tidak lebih dari 10% pengikut tes.
(5% dari pengikut tes = 5% x 60 orang = 3 orang)[9]






















BAB III
PENUTUP
A. Kesimpulan
Tes standar adalah tes yang disusun oleh satu tim ahli, atau disusun oleh lembaga yang khusus menyelenggarakan secara professional. Baik tes standar maupun tes buatan guru mempunyai kegunaan masing-masing dan saling melengkapi satu sama lain dalam proses evaluasi. Sebuah tes yang sudah distandardisasikan dan sudah dapat disebut sebagai tes standar, biasanya dilengkapi dengan sebuah manual.
Analisis soal antara lain bertujuan untuk mengadakan identifikasi soal-soal yang baik, kurang baik, soal yang jelek. Dengan analisis soal dapat diperoleh informasi tentang kejelekan sebuah soal dan petunjuk untuk mengadakan perbaikan. Dalam analisis soal ada beberapa hal yang penting yaitu mencari taraf kesukaran, daya pembeda, dan pola jawaban soal.


DAFTAR PUSTAKA

Arikunto, Suharsimi. 2009. Dasar-dasar Evaluasi Pendidikan. Jakarta : Bumi Aksara.




[2] Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta : Bumi Aksara, 2009), hlm. 145-146
[3] Ibid, hlm. 146-147
[4] Ibid, hlm. 147-149
[5] Ibid, hlm. 149-150
[6] Ibid, hlm. 205-206
[7] Ibid, hlm. 207-210
[8] Ibid, hlm. 211-219
[9] Ibid, hlm. 219-221

1 komentar:

  1. Terima Kasih.. semoga dapat membantu saya tuk belajar sebelum UAS

    BalasHapus