Berawal sekitar tahun 1973, bidang evaluasi mulai mengkristal dan muncul sebagai profesi nyata yang berhubungan dengan (namun tetap berbeda) nenek- moyangnya, yaitu riset dan testing. Meskipun bidang evaluasi sebagai satu profesi telah mengalami kemajuan pesat, namun pentinglah untuk tetap mempertimbangkan perkembangan konteks bidang ini di dalam periode sebelumnya.
Pada saat itu, evaluator menghadapi krisis identitas. Mereka tak yakin harus mencoba menjadi apa, menjadi peneliti, tester, administrator, pendidik, atau filsuf. Tak jelas, kualifikasi khusus apa yang harus mereka miliki. Belum ada organisasi profesional yang mengabdikan dirinya untuk evaluasi sebagai satu bidang, juga belum ada jurnal khusus tempat evaluator mempertukarkan informasi mengenai pekerjaannya. Pada dasarnya tak ada pustaka mengenai evaluasi program kecuali makalah tak diterbitkan yang sirkulasinya melalui jaringan praktisi bawah tanah. Terdapat jeda peluang pelatihan pre-service dan in-service dalam evaluasi. Keterkaitan standar praktik yang benar terbatas hanya pada tes pendidikan dan psikologi. Bidang evaluasi tak berbentuk (amorphous) dan ter-fragmentasi – banyak evaluasi dilaksanakan oleh personalia tak-terlatih; lainnya dilakukan oleh para ahli metodologi riset yang gagal menyesuaikan metodenya dengan evaluasi program. Kajian evaluasi penuh dengan kebingungan, kecemasan, dan animosity. Evaluasi sebagai satu bidang, memiliki pengaruh yang kecil dan tanpa kekuasaan politis.
Dengan latar belakang ini, kemajuan yang dicapai oleh para evaluator pendidikan untuk meningkatkan profesonalisme bidangnya selama tahun 1970-an benar-benar luar-biasa. Dimulai dengan sejumlah jurnal yang meliputi
Educational Evaluation and Policy Analysis, Studies in Evaluation,
CEDR Quarterly, Evaluation Review, New Directions for Program
Evaluation, Evaluation and Program Planning, dan Evaluations
News; dan jurnal-jurnal ini terbukti menjadi sarana yang luar biasa untuk mencatat dan menyebarkan informasi mengenai berbagai segi evaluasi program. Tidak seperti belasan tahun yang lalu, sekarang ada banyak buku dan monograf yang secara eksklusif membahas evaluasi. Sebenarnya, persoalan masa sekarang bukanlah upaya untuk mendapatkan pustaka evaluasi, melainkan menyelesaikanya. Kelompok 12 Mei , Divisi
H-AERA, Jaringan Evaluasi, dan the Evaluation Research Society
pertukaran profesional di antara berbagai pihak yang tertarik dengan evaluasi pendidikan dan program layanan manusiawi lainnya.
Banyak universitas mulai menawarkan sekurang- kurangnya satu matakuliah dalam metodologi evaluasi (yang dibedakan dari metodologi riset); sejumlah kecil universitas seperti University of Illinois, Stanford University, Boston College,
UCLA, the University of Minnesota, dan Western Michigan
University – telah mengembangkan program sarjana di bidang
evaluasi. Mungkin Nova University–lah yang pertama-tama memberikan mata kuliah evaluasi dalam program doktoralnya. Selama tujuh tahun, Kantor Pendidikan AS mensponsori program nasional pelatihan in-service di bidang evaluasi bagi para pendidik khusus, dan beberapa organisasi profesional telah menawarkan workshop dan lokakarya dengan berbagai topik evaluasi. Telah dibangun berbagai pusat riset
dan pengembangan yang berhubungan dengan evaluasi, pusat
ini mencakup unit evaluasi Northwest Regional Educational
Laboratory, Pusat Kajian Evaluasi UCLA, Konsorsium Evaluasi
Stanford, the Center for Instructional Research and Curriculum
Evaluation di University of Illinois, Pusat Evaluasi di Western
Michigan University, dan Pusat Kajian Testing, Evaluasi, dan
Kebijakan Pendidikan di Boston College, Institut Evaluasi
University of San Francisco memperluas evaluasi sehingga
mencakup bidang produk dan pribadi. Negara bagian Lousiana telah membentuk kebijakan dan program pensertifikatan evaluator. Baru-baru ini Dick Johnson (1980)9
menerbitkan draft pertama untuk direktori evaluator dan badan-badan evaluasi.
Secara berangsur-angsur bidang itu mulai merambah meta
evaluasi sebagai sarana untuk menjamin dan mengecek kualitas
evaluasi. Komite bersama yang ditunjuk oleh 12 organisasi profesional, telah menerbitkan serangkaian standar komprehensif untuk mempertimbangkan evaluasi program
9 Johnson, D. (1980). Directory of evaluators and and evaluation agencies. New
pendidikan dan program serta membentuk mekanisme untuk meninjau dan merevisi Standar dan membantu bidang itu agar dapat menggunakan Standar tersebut. Selain itu, beberapa rangkaian standar lain yang relevan dengan evaluasi pendidikan telah diterbitkan.
Selama periode ini, para evaluator kian sadar bahwa berbagai teknik evaluasi harus mencapai hasil yang sebelumnya dianggap sebagai hasil pinggiran riset serius; harus melayani kebutuhan informasi klien evaluasi, mengajukan berbagai isu nilai sentral; mengetahui realitas situasi; memenuhi persyaratan kejujuran; dan memenuhi kebutuhan akan ketelitian. Sementara bidang ini masih harus mengembangkan metodologi fungsional yang memenuhi semua persyaratan tersebut, terdapat semacam perkembangan yang memberi harapan, yang mencakup: goal-free evaluation;
adversary-advocate teams; advocate teams; meta analysis;
responsive evaluation; dan evaluasi naturalistik. Banyak penulis
telah meneliti aplikabilitas berbagai teknik investigasi yang berjangkauan luas yang diambil dari berbagai bidang evaluasi dan mahasiswanya telah menyelidiki dan mengembangkan teknik untuk menerapkan berbagai teknik yang digunakan oleh para pengritik dalam mengevaluasi bidang seni, dan lain- lain. Akhirnya telah dilakukan banyak upaya untuk mendorong penggunaan tes acuan tujuan (objectives-referenced
tests) dalam berbagai kajian evaluasi. Penerapan teknik yang
terakhir ini secara khusus sangat bermanfaat, hal ini dapat dilihat di dalam curriculum embeded evaluation yang memungkinkan pengajar dan mahasiswa melakukan penilaian capaian secara terus menerus sehubungan dengan urutan tujuan kurikulum.
Tak diragukan perkembangan profesional yang luas dalam evaluasi ini menelurkan hasil bauran. Pertama, meskipun terdapat komunikasi yang lebih intens & baik di bidang itu, namun banyak juga omong-kosongnya (Cronbach, 1980).10
10 Cronbach, L.J. (1980). Toward reform of program evaluation. San Fransisco:
Kedua, meskipun telah ditunjukkan kemajuan dalam meningkatkan pelatihan dan sertifikasi evaluator untuk menjamin bahwa institusi tersebut memperoleh layanan dari orang-orang yang kompeten, namun beberapa pengamat khawatir bahwa perkembangan ini bisa mendorong munculnya kelompok sempit yang bersifat eksklusif (Stake, 1981).11 Ketiga, kerjasama di antara organisasi profesional yang
terlibat dalam evaluasi pendidikan dan yang ditumbuh- kembangkan oleh Joint committee on Standards for Educational
Evaluation, merupakan tatanan yang menjanjikan namun
rentan untuk dapat mempromosikan etika dan penggunaan usaha evaluasi yang berkualitas. Akhirnya, meskipun pembentukan organisasi profesional baru telah meningkatkan komunikasi dan mengurangi fragmentasi di bidang evaluasi, namun sayangnya, masih terdapat perbedaan yang cukup tajam.
Walaupun telah terjadi peningkatan komunikasi di antara penganut pendekatan positivistik/kuantitatif dengan pendukung pendekatan fenomenologi/kualitatif pada evaluasi, namun masih ada bahaya polarisasi yang mengintai dan berkembang di antara kedua kubu tersebut. Akar polarisasi ini terutama tidak bersifat metodologis, namun lebih mencerminkan perbedaan ideologis. Madaus & McDonagh (1982)12 memaparkan bahaya polarisasi ini:
Pada kedua kasus, seorang evaluator, jika tidak cermat dapat tergelincir ke dalam golongan pendeta yang, memberi pernyataan dan nasihat, namun tak pernah melaksanakannya, golongan yang berpraktik di satu pihak atas nama sains dan di pihak lain atas nama kepribadian kharismatik.
Akhirnya, kendati perkembangan upaya pencarian metode yang layak, peningkatan komunikasi, dan kesaling-
11 Stake, R.E. (1981). Settings standards for educational evaluators. Evaluation
News. No. 2.2. Hlm. 148-52.
12 Madaus, G.F. & McDonach, J.T. (1982). “As I roved out: folksong collecting
as a metaphor for evaluation.” Dalam N.L. Smith (ed). Communicating in evaluation:
pahaman di antara para ahli metodologi terkemuka, dan perkembangan berbagai teknik baru, namun praktik evaluasi sebenarnya hanya mengalami perubahan kecil pada sebagian besar bidang. Jelas, ada kebutuhan mengenai perluasan upaya untuk mendidik evaluator yang disebabkan karena tersedianya banyak teknik baru, kebutuhan untuk menguji-coba dan melaporkan hasil dengan menggunakan teknik baru, dan untuk mengembangkan teknik tambahan. Pada dasarnya penekanan harus ada pada penyusunan metodologi yang sesuai dengan kebutuhan masyarakat, institusinya, dan warga- negaranya, dari pada sebaliknya.
Para evaluator perlu menjadi semakin sadar tentang aspek kontemporer maupun historis dari kemunculan profesi – yang mencakup penopang filosofis dan orientasi konsepsinya. Tanpa latar belakang ini, evaluator pasti akan mengulangi kesalahannya dan, yang juga sama-sama melemahkan, akan mengalami kegagalan dalam mempertahankan dan meningkatkan keberhasilan masa lampau.
Madaus, Stufflebeam dan Scriven telah melukiskan evaluasi program sebagai satu profesi dinamis namun tidak matang. Meskipun profesi ini masih belum matang, namun tidak diragukan lagi bahwa profesi ini telah menjadi komponen yang kian mudah dikenal dari pembangunan pendidikan, kesehatan dan kesejahteraan, yang lebih luas dan bersifat pemerintahan serta profesional. Prediksi yang umum terdengar di tahun 1960-an adalah bahwa evaluasi program formal merupakan satu keisengan (fad) sementara dan akan segera lenyap, ternyata keliru, dan terdapat indikasi kuat bahwa bidang ini akan terus tumbuh dan kian penting, kian canggih, dan juga semakin terhormat. Capaian selama belasan tahun terakhir sangat mengesankan, namun ada banyak cacat yang mencolok, dan mereka masih kekurangan bukti mengenai dampak evaluasi pada pendidikan dan layanan kemanusiaan. Ada kebutuhan untuk meningkatkan riset, pelatihan, dan dukungan dana untuk evaluasi program. Orang terkemuka di bidang profesi evaluasi harus menjamin bahwa upaya
untuk meningkatkan profesinya disesuaikan dengan kebutuhan layanan kliennya, tidak sekadar didesain untuk melayani kebutuhan pribadi atau perusahaannya. Akhirnya nilai evaluasi program harus dipertimbangkan menurut kontribusi aktual dan potensialnya untuk meningkatkan pembelajaran, pengajaran dan administrasi, kesehatan dan perawatan kesehatan, dan kualitas hidup masyarakat pada umumnya. Semua di antara yang berkecimpung dalam evaluasi program harus melakukan sesuatu yang baik untuk mengingat dan menggunakan prinsip dasar ini guna mengarahkan dan memeriksa pekerjaannya.