IKHSAN JAYA: TES STANDAR, TES BUATAN GURU, DAN ANALISIS HASIL TES

MAKALAH

TES STANDAR, TES BUATAN GURU, DAN ANALISIS HASIL TES

Disusun untuk memenuhi tugas

Mata Kuliah : Evaluasi Pendidikan

Dosen Pengampu : Ahmad Afroni, M.Ag

Disusun oleh :

KELOMPOK 4

Ikhsan Setia Pujiono 202109387

Munadhiroh 232108210

Sri Mutmainah 232108211

KELAS F

JURUSAN TARBIYAH

SEKOLAH TINGGI AGAMA ISLAM NEGERI

(STAIN) PEKALONGAN

2011

BAB I

PENDAHULUAN

A. Latar Belakang

Tes adalah salah satu bentuk instrumen evaluasi untuk mengukur seberapa besar kemampuan siswa dalam memahami dan menguasai pokok-pokok materi yang sudah diajarkan. Tes ada yang dibuat oleh seorang guru yang kemudian disebut tes buatan guru dan ada tes yang sudah memenuhi standar suatu satuan pendidikan maupun lembaga pendidikan yang kemudian disebut tes terstandar.

Dalam menilai, baik tes terstandar maupun tes buatan guru ada beberapa hal yang perlu diperhatikan yang berkaitan dengan analisis hasil tes tersebut. Dalam makalah ini akan diuraikan tentang banyak hal yang berkaitan dengan tes standar dan tes buatan guru. Serta dijelaskan juga tentang analisis hasil tes.

B. Permasalahan

1. Apa yang dimaksud tes standar dan tes buatan guru itu?

2. Bagaimana perbandingan antara tes standar dengan tes buatan guru?

3. Apa saja kegunaan kedua tes tersebut?

4. Kelengkapan apa saja yang harus ada pada tes standar?

5. Bagaimana cara menilai tes yang dibuat sendiri?

6. Bagaimana cara menganalisis hasil tes?

C. Tujuan

1. Untuk mengetahui tentang hal-hal yang berkaitan dengan tes standar dan tes buatan guru.

2. Untuk mengetahui tentang cara menganalisis hasil tes.

BAB II

PEMBAHASAN

“TES STANDAR, TES BUATAN GURU, DAN ANALISIS HASIL TES”

A. Tes Standar dan Tes Buatan Guru

Pengertian Tes Standar, Tes Prestasi Standar

Pengertian tes standar secara sempit adalah tes yang disusun oleh satu tim ahli, atau disusun oleh lembaga yang khusus menyelenggarakan secara professional. Tes tersebut diketahui memenuhi syarat sebagai tes yang baik. Tes ini dapat digunakan dalam waktu yang relatif lama, dapat diterapkan pada beberapa obyek mencakup wilayah yang luas. Untuk mengukur validitas dan reliabilitasnya telah diuji-cobakan beberapa kali sehingga hasilnya dapat dipertanggungjawabkan.[1]

Di antara tes prestasi yang digunakan di sekolah ada yang dinamakan tes prestasi standar. Dalam salah satu kamus, arti kata ”standar” adalah:

A degree of level of requirement, excellence, or attainment

Standar untuk siswa dapat dimaksudkan sebagai suatu tingkat kemampuan yang harus dimiliki bagi suatu program tertentu. Mungkin standar bagi suatu kursus A berbeda dengan B. Jadi standar ini dapat dibuat “keras” maupun “lunak” tergantung dari yang mempunyai kebijaksanaan.

Suatu tes standar dengan demikian berbeda dengan tes prestasi biasa.

Prosedur yang digunakan untuk menyusun tes standar untuk tes prestasi melalui cara langsung yang ditumbuhkan dari tes yang digunakan di kelas. Sedangkan spesifikasi yang digunakan untuk menentukan isi dalam tes bakat biasanya didasarkan atas analisis job (jabatan) atau analisis tugas yang merupakan tuntutan calon pekerjaannya. Disamping itu juga mempertimbangkan sifat-sifat yang ada pada manusia. Analisis jabatan analisis tugas yang dilakukan biasanya tidak tidak didasarkan atas satu kurikulum, tetapi diambil dari masyarakat.

Istilah “standar” dalam tes dimaksudkan bahwa semua siswa menjawab pertanyaan-pertanyaan yang sama dari sejumlah besar pertanyaan dikerjakan dengan menggunakan petunjuk yang sama dan dalam batasan waktu yang sama pula. Dengan demikian maka seolah-olah ada suatu standar atau ukuran sehingga diperoleh suatu standar penampilan (performance) dan penampilan kelompok lain dapat dibandingkan dengan penampilan kelompok standar tersebut.

Istilah “standar” tidak mengandung arti bahwa tes tersebut mengukur apa yang harus dan dapat diajarkan pada suatu tingkat tertentu atau bahwa tes itu menyiapkan suatu standar prestasi dimana siswa harus dan dapat mencapai suatu tingkat tertentu. Sekali lagi, tes standar dipolakan untuk penampilan prestasi sekarang (yang ada) yang dilaksanakan secara seragam, diusahakan dalam kondisi yang seragam, baik itu diberikan kepada siswa dalam pelaksanaan perseorangan maupun siswa sebagai anggota dari suatu kelompok.[2]

Perbandingan Tes Standar dan Tes Buatan Guru.

Tes standar disusun dalam tipe-tipe soal yang sama yang meliputi bahan atau pengetahuan yang sama banyak dengan bahan atau pengetahuan yang dicakup oleh tes buatan guru. Lalu apakah perbedaan antara tes standar dengan tes buatan guru, atau apakah keburukan dan keuntungan tes standar?

Pertama, marilah kita tinjau perbedaan antara tes standar dengan tes buatan guru. Perbedaannya adalah sebagai berikut:

Tes Standar

Tes Buatan Guru

a. Didasarkan atas bahan dan tujuan umum dari sekolah-sekolah di seluruh Negara.

b. Mencakup aspek yang luas dan pengetahuan atau keterampilan dengan hanya sedikit butir tes untuk setiap keterampilan atau topik.

c. Disusun dengan kelengkapan staf profesor, pembahas, dan editor butir tes.

d. Menggunakan butir tes yang sudah diujicobakan (try out), dianalisis dan direvisi sebelum menjadi sebuah tes.

e. Mempunyai reliabilitas yang tinggi.

f. Dimungkinkan menggunakan norma untuk seluruh Negara.

a. Didasarkan atas bahan dan tujuan khusus yang dirumuskan oleh guru untuk kelasnya sendiri.

b. Dapat terjadi hanya mencakup pengetahuan atau keterampilan yang sempit.

c. Biasanya disusun sendiri oleh guru dengan sedikit atau tanpa bantuan orang lain/tenaga ahli.

d. Jarang menggunakan butir tes yang sudah diujicobakan, dianalisis dan direvisi.

e. Mempunyai reliabilitas sedang atau rendah.

f. Norma kelompok terbatas kelas tertentu.

Kedua, untuk menyusun tes standar, diutuhkan waktu yang lama. Seperti disebutkan ahwa untuk memperoleh sebuah tes standar melalui prosedur:

o Penyusunan;

o Uji coba;

o Analisa;

o Revisi;

o Edit.

Kelima kegiatan ini membutuhkan waktu lama.[3]

Kegunaan Tes Standar dan Tes Buatan Guru.

a. Kegunaan Tes Standar

Secara singkat dapat dikemukakan bahwa kegunaan tes standar adalah:

a) Jika ingin membuat perbandingan,

b) Jika banyak orang yang akan memasuki suatu sekolah tetapi tidak tersedia data tentang calon ini.

Secara garis besar kegunaan tes standar adalah:

i. Membandingkan prestasi belajar dengan pembawaan individu atau kelompok.

ii. Membandingkan tingkat prestasi siswa dalam keterampilan di berbagai bidang studi untuk individu atau kelompok.

iii. Membandingkan prestasi siswa antara berbagai sekolah atau kelas.

iv. Mempelajari perkembangan siswa dalam suatu periode waktu tertentu.

b. Kegunaan Tes Buatan Guru

Secara singkat dapat dikemukakan bahwa kegunaan tes buatan guru adalah:

i. Untuk menentukan seberapa baik siswa telah menguasai bahan pelajaran yang diberikan dalam waktu tertentu.

ii. Untuk menentukan apakah sesuatu tujuan telah tercapai.

iii. Untuk memperoleh suatu nilai.

Selanjutnya baik tes standar dan tes buatan guru dianjurkan dipakai jika hasilnya akan digunakan untuk:

a) Mengadakan diagnosis terhadap ketidakmampuan siswa.

b) Menentukan tempat siswa dalam suatu kelas atau kelompok.

c) Memberikan bimbingan kepada siswa dalam pendidikan dan pemilihan jurusan.

d) Memilih siswa untuk program-program khusus.[4]

Kelengkapan Tes Standar

Sebuah tes yang sudah distandardisasikan dan sudah dapat disebut sebagai tes standar, biasanya dilengkapi dengan sebuah manual. Manual ini memuat keterangan-keterangan atau petunjuk-petunjuk yang perlu terutama yang menjelaskan tentang pelaksanaan, menskor, dan mengadakan interpretasi.

Secara garis besar manual tes standar ini memuat:

a. Ciri-ciri mengenai tes, misalnya menyebutkan tingkat validitas, tingkat reliabilitas dan sebagainya.

b. Tujuan serta keuntungan-keuntungan dari tes

Misalnya yang disebutkan untuk siapa tes tersebut diberikan dan untuk tujuan apa.

c. Proses standardisasi tes

Misalnya mengenai hal-hal yang berhubungan dengan sampel.

- Besarnya sampel,

- Teknik sampling,

- Kelompok mana yang diambil sebagai sampel (sifat sampel).

Juga mengenai taraf kepercayaan yang diambil dan bagaimana kaitannya dengan hasil tes.

d. Petunjuk-petunjuk tentang cara melaksanakan tes

Misalnya: dilaksanakan dengan lisan atau tertulis, waktu yang digunakan untuk mengerjakan setiap bagian, boleh tidaknya tercoba keluar jika sudah selesai mengerjakan soal itu dan sebagainya.

e. Petunjuk-petunjuk bagaimana cara menskor

Misalnya: untuk beberapa skor tiap-tiap soal/unit, menggunakan sistem hukuman atau tidak, bagaimana cara menghitung nilai akhir dan sebagainya.

f. Petunjuk-petunjuk untuk menginterpretasikan hasil

Misalnya:

- Betul nomor sekian sampai sekian cocok untuk jabatan kepala seksi,

- Betul nomor sekian saja, cocok untuk jabatan guru dan sebagainya.

g. Saran-saran lain

Misalnya: siapa harus menjadi pengawas, bagaimana seandainya tidak ada calon yang mencapai skor tertentu dan sebagainya.[5]

B. Menganalisis Hasil Tes

1. Menilai Tes yang Dibuat Sendiri/Guru

Ada 4 cara untuk menilai tes yaitu :

a. Cara pertama meneliti secara jujur soal-soal yang sudah disusun, kadang-kadang dapat diperoleh jawaban tentang ketidakjelasan perintah atau bahasa, taraf kesukaran, dan lain-lain keadaan soal tersebut.

Pertanyaan-pertanyaan tersebut, antara lain:

· Apakah banyaknya soal untuk tiap topik sudah seimbang?

· Apakah semua soal menanyakan bahan yang telah diajarkan?

· Apakah soal yang kita susun tidak merupakan pertanyaan yang membingungkan?

· Apakah soal itu tidak sukar untuk dimengerti?

· Apakah soal itu tidak dapat dikerjakan oleh sebagian siswa?

b. Cara kedua adalah mengadakan analisis soal (item analysis). Analisis soal adalah suatu prosedur yang sistematis, yang akan memberikan informasi-informasi yang sangat khusus terhadap butir tes yang kita susun.

Faedah mengadakan analisis soal:

· Membantu kita dalam mengidentifikasi butir-butir soal yang jelek.

· Memperoleh informasi yang akan dapat digunakan untuk menyempurnakan soal-soal untuk kepentingan lebih lanjut.

· Memperoleh gambaran secara selintas tentang keadaan yang kita susun.

c. Cara ketiga adalah mengadakan checking validitas. Validitas yang paling penting dari tes buatan guru adalah validitas kurikuler. Untuk mengadakan checking validitas kurikuler, kita harus merumuskan tujuan setiap bagian pelajaran secara khusus dan jelas sehingga setiap soal dapat kita jodohkan dengan setiap tujuan khusus tersebut.

Dalam hal ini Terry D. Ten Brink, mengemukakan pendapatnya demikian:

· Untuk tes yang dirancang akan menggunakan norm-referenced tidak harus menuliskan setiap tujuan khusus, tetapi cukup dengan tujuan-tujuan yang esensial saja.

· Untuk tes yang dirancang akan menggunakan criterion referenced, maka setiap tujuan khusus harus dicantumkan dalam tabek spesifikasi.

d. Cara keempat adalah dengan mengadakan checking reliabilitas.

Salah satu indikator untuk tes yang mempunyai reliabilitas yang tinggi adalah bahwa kebanyakan dari soal-soal tes itu mempunyai daya pembeda yang tinggi.[6]

2. Analisis Butir Soal

a. Taraf Kesukaran

Soal yang baik adalah soal yang tidak terlalu mudah dan tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya.

Bilangan yang menunjukkan sukar dan mudahnya suatu soal disebut indeks kesukaran (difficulty index). Besarnya indeks kesukaran antara 0,00 sampai dengan 1,00. Indeks kesukaran ini menunjukkan taraf kesukaran soal. Soal dengan indeks kesukaran 0,00 menunjukkan bahwa soal itu terlalu sukar, sebaliknya indeks 1,00 menunjukkan bahwa soalnya terlalu mudah.

0,00--------------------------1,00

Sukar Mudah

Di dalam istilah evaluasi, indeks kesukaran diberi simbol P (p besar), singkatan dari kata ”proporsi”. Dengan demikian maka soal dengan P=0,70 lebih mudah dibandingkan dengan P=0,20, begitu juga sebaliknya.

Rumus mencari P adalah:

Di mana:

P = indeks kesukaran

B = banyaknya siswa yang menjawab soal itu dengan benar

JS = jumlah seluruh siswa peserta tes

Contoh penggunaan:

Misalnya jumlah siswa peserta tes dalam suatu kelas ada 40 orang. Dari 40 orang siswa tersebut 12 orang dapat mengerjakan soal nomor 1 dengan benar. Maka indeks kesukarannya adalah:

Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai berikut:

§ Soal dengan P 0,00 sampai 0,30 adalah soal sukar

§ Soal dengan P 0,30 sampai 0,70 adalah soal sedang

§ Soal dengan P 0,70 sampai 1,00 adalah soal mudah

Walaupun demikian ada yang berpendapat bahwa soal-soal yang dianggap baik, yaitu soal-soal sedang, adalah soal-soal yang mempunyai indeks kesukaran 0,30 sampai dengan 0,70.[7]

b. Daya Pembeda

Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang bodoh (berkemampuan rendah).

Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi, disingkat D (d besar). Seperti halnya indeks kesukaran, indeks diskriminasi (daya pembeda) ini berkisar antara 0,00 sampai 1,00. hanya bedanya, indeks kesukaran tidak mengenal tanda negatif (-), tetapi pada indeks diskriminasi ada tanda negatif. Tanda negatif pada indeks diskriminasi digunakan jika suatu soal ”terbalik” menunjukkan kualitas testee. Yaitu anak yang pandai disebut bodoh dan anak yang bodoh disebut pandai.

Dengan demikian ada tiga titik pada daya pembeda yaitu :

-1,00 0,00 1,00

-1,00 = daya pembeda negatif

0,00 = daya pembeda rendah

1,00 = daya pembeda tinggi (positif)

Seluruh pengikut tes dikelompokkan menjadi 2 kelompok, yaitu kelompok pandai atau kelompok atas (upper group) dan kelompok bodoh atau kelompok bawah (lower group).

Jika seluruh kelompok atas dapat menjawab soal tersebut dengan benar, sedang seluruh kelompok bawah menjawab salah, maka soal tersebut mempunyai D paling besar, yaitu 1,00. sebaliknya jika semua kelompok atas menjawab salah, tetapi semua kelompok bawah menjawab betul, maka nilai D-nya -1,00. Tetapi jika siswa kelompok atas dan kelompok bawah sama-sama menjawab benar atau sama-sama menjawab salah, maka soal tersebut mempunyai nilai D 0,00. Karena tidak mempunyai daya pembeda sama sekali.

Cara menentukan Daya Pembeda (nilai D)

a) Untuk kelompok kecil

Seluruh kelompok testee dibagi dua sama besar, 50% kelompok atas dan 50% kelompok bawah.

Contoh:

Siswa

Skor

Kelompok Atas (Ja)

Kelompok Bawah (Jb)

Seluruh pengikut tes, dideretkan mulai dari skor teratas sampai terbawah, lalu dibagi 2.

b) Untuk kelompok besar

Untuk kelompok besar biasanya hanya diambil kedua kutubnya saja, yaitu 27% skor teratas sebagai kelompok atas (Ja) dan 27% skor terbawah sebagai kelompok bawah (Jb)

Contoh :

8 27% sebagai Ja

2 27% sebagai Jb

Rumus mencari D

Rumus untuk menentukan indeks diskriminasi adalah:

Di mana:

J = jumlah peserta tes

Ja = banyaknya peserta kelompok atas

Jb = banyaknya peserta kelompok bawah

Ba = banyaknya peserta kelompok atas yang menjawab soal itu dengan benar.

Bb = banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar.

Pa = Proporsi peserta kelompok atas yang menjawab benar

Pb = Proporsi peserta kelompok bawah yang menjawab benar

Klasifikasi Daya Pembeda

D : 0,00 – 0,20 : jelek (poor)

D : 0,20 – 0,40 : cukup (satisfactory)

D : 0,40 – 0,70 : baik (good)

D : 0,70 – 1,00 : baik sekali (excellent)

D : negatif, semuanya tidak baik, jadi semua butir soal yang mempunyai nilai D negatif sebaiknya dibuang saja.

Hubungan antara P dan D

Untuk melihat hubungan antara P dengan D, perlu kita telaah kembali rumus-rumus untuk menentukannya.

………………….(1)

……………………………….(2)

Dari indeks kesukaran (P) dan indeks diskriminasi (D) dapat diperoleh hubungan sebagai berikut:

Dmax = 2P...(3)

Sebagai contoh:

Soal dengan P = 0,20 akan

memberikan Dmax = 0,40

Soal dengan P = 0,80 akan

memberikan Dmax yang sama.

Dari grafik terlihat bahwa soal-soal dengan nilai P = 0,50 memunkinkan untuk mendapat daya pembeda paling tinggi.[8]

c. Pola Jawaban Soal

Yang dimaksud pola jawaban soal disini adalah distribusi tes tersebut dalam hal menentukan pilihan jawaban pada soal bentuk pilihan ganda. Pola jawaban soal diperoleh dengan menghitung banyaknya tes tersebut yang memilih pilihan jawaban a, b, c atau d atau yang tidak memilih pilihan manapun (blangko). Dalam istilah evaluasi disebut omit disingkat O.

Dengan melihat pola jawaban soal, dapat diketahui :

1. Taraf kesukaran soal

2. Daya pembeda soal

3. Baik dan tidaknya distraktor

Sesuatu distroktor dapat diperlakukan dengan 3 cara :

a. Diterima, karena sudah baik

b. Ditolak, karena tidak baik

c. Ditulis kembali karena kurang baik

Menulis soal adalah suatu pekerjaan yang sulit, sehingga apabila masih dapat diperbaiki sebaiknya diperbaiki saja, tidak dibilang suatu distroktor dapat dikatakan berfungsi baik jika paling sedikit dipilih 5 % pengikut tes.

Contoh Perhitungan:

Dari analisis sebuah item, polanya diketahui sebagai berikut:

Pilihan Jawab	a	b	c*	d	O	Jumlah
Kelompok Atas	5	7	15	3	0	30
Kelompok Bawah	8	8	6	5	3	30
Jumlah	13	15	21	8	3	60

Dari pola jawaban soal dapat dicari:

3) Distraktor: semua distraktornya sudah berfungsi dengan baik karena sudah dipilih oleh lebih dari 5% pengikut tes.

4) Dilihat dari segi omit (kolom pilihan paling kanan) adalah baik. Sebuah item dikatakan baik jika omitnya tidak lebih dari 10% pengikut tes.

(5% dari pengikut tes = 5% x 60 orang = 3 orang)[9]

BAB III

PENUTUP

A. Kesimpulan

Tes standar adalah tes yang disusun oleh satu tim ahli, atau disusun oleh lembaga yang khusus menyelenggarakan secara professional. Baik tes standar maupun tes buatan guru mempunyai kegunaan masing-masing dan saling melengkapi satu sama lain dalam proses evaluasi. Sebuah tes yang sudah distandardisasikan dan sudah dapat disebut sebagai tes standar, biasanya dilengkapi dengan sebuah manual.

Analisis soal antara lain bertujuan untuk mengadakan identifikasi soal-soal yang baik, kurang baik, soal yang jelek. Dengan analisis soal dapat diperoleh informasi tentang kejelekan sebuah soal dan petunjuk untuk mengadakan perbaikan. Dalam analisis soal ada beberapa hal yang penting yaitu mencari taraf kesukaran, daya pembeda, dan pola jawaban soal.

DAFTAR PUSTAKA

Arikunto, Suharsimi. 2009. Dasar-dasar Evaluasi Pendidikan. Jakarta : Bumi Aksara.

http://yudhy91handsomemale.blogspot.com/2010/07/tes-terstandar-dan-tes-non-standar.html

[1]http://yudhy91handsomemale.blogspot.com/2010/07/tes-terstandar-dan-tes-non-standar.html

[2] Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta : Bumi Aksara, 2009), hlm. 145-146

[3] Ibid, hlm. 146-147

[4] Ibid, hlm. 147-149

[5] Ibid, hlm. 149-150

[6] Ibid, hlm. 205-206

[7] Ibid, hlm. 207-210

[8] Ibid, hlm. 211-219

[9] Ibid, hlm. 219-221

IKHSAN JAYA

Minggu, 26 Juni 2011

TES STANDAR, TES BUATAN GURU, DAN ANALISIS HASIL TES

1 komentar: