BAB II KAJIAN TEORITIS. Dalam ilmu matematika komputer, pengindeksan merupakan proses. pembuatan indeks yang berguna dalam menelusur informasi.

(1)

BAB II

KAJIAN TEORITIS

2.1 Pengindeksan Subjek

Dalam ilmu matematika komputer, pengindeksan merupakan proses pembuatan indeks yang berguna dalam menelusur informasi. Dalam ilmu perpustakaan indeks memiliki arti yang lebih luas. ada dua unsur penting dalam kegiatan pengindeksan, yakni orang yang membuat indeks (Indexer) dan objek yang di indeks. Objek yang di indeks meliputi buku, artikel, jurnal, atau laporan. Indeks yang dihasilkan diharapkan berguna sebagai sarana penelusuran informasi yang dibutuhkan. Indeks subjek memiliki karekteristik yaitu indeks subjek tunggal (pra-koordinasi) dan indeks subjek majemuk (pasca(pra-koordinasi).

Menurut Clevelend (2001: 97), “Indexing is the process identyfying information in a knowledge record (text or nontext) an organizing the pointers to that information in to searchable file”. Pendapat tersebut dapat diterjemahkan bahwa pengindeksan adalah proses identifikasi informasi dalam sebuah catatan pengetahuan baik teks ataupun non-teks dan pengorganisasian nilai-nilai informasi untuk pencarian

file.

Selain pendapat di atas Konfhage dalam Andriaty (2002 : 1), menyatakan “indeks merupakan hasil utama dari proses analisis dokumen, dibuat untuk keperluan temu kembali informasi dalam suatu pangkalan data atau dalam majalah sekunder tercetak. Suatu indeks harus memberikan kemungkinan bagi pengguna untuk dapat mengakses suatu dokumen, maupun sekumpulan secara efesien”.

Pengindeksan adalah kegiatan deksripsi isi dokumen dengan memilih istilah paling tepat yang mampu memwakili isi dokumen. Isitilah yang dipilih ini berasal dari kosakata bahasa documenter dan di tata untuk memudahkan penyusunan berkas untuk keperluan penelusuran (Sulistyo-Basuki, 1992: 93). Dari ketiga pendapat di atas maka dapat diambil kesimpulan bahwa pengindeksan adalah proses identifikasi dan analisa dokumen dalam pengorganisasian

(2)

nilai-nilai informasi dalam suatu pangkalan data untuk keperluan penelusuran informasi. Pengindeksan subjek menghasilkan deskripsi indeks yang merupakan wakil ringkas untuk isi dokumen.

Ada dua cara pengindeksan subjek yaitu : 1. Pengindeksan subjek secara manual 2. Pengindeksan secara otomatis

Pengindeksan Subjek Secara Manual

Kegiatan pengindeksan secara manual meliputi pekerjaan yaitu analisis subjek dan penerjemahan. Pengindeksan secara manual menggunakan pengetahuan indexer untuk menganalisis topic sebuah karya.

Human indexer use their knowledge to find the “aboutness” of the writing they are analyzing and find concept within the writing. Human indexing tends to “focus on larger documentary units, such as complete periodical articles, complete chapter in collection, or even complete monographs”. Human indexers are inconsistent. (Anderson dan Perez dalam Shield, 2005: 1)

Defenisi di atas dapat diartikan bahwa pengindeks (indekser) menemukan konsep dalam tulisan dan kemudian menggunakan istilah dalam pencarian sebuah karya. Pengindeksan secara manual cenderung fokus dalam unit dokumentasi yang besar, seperti artikel terbitan berkala yang lengkap, koleksi per bab atau koleksi monograf yang lengkap. Pengindeksan secara manual cenderung tidak konsisten.

Pengindeksan secara manual dilakukan dengan beberapa langkah. Menurut Sulistyo-Basuki (1992: 95), pelaksanaan pengindeksan sama dengan pelaksanaan deskripsi isi, mencakup langkah-langkah sebagai berikut:

1. Pengamatan awal terhadap dokumen 2. identifikasi subjek utama

3. identifikasi elemen yang dideskripsikan dan ekstrasi istilah berkaitan. 4. verifikasi relevansi istilah-istilah tersebut.

5. konversi istilah dari bahasa sehari-hari ke bahasa dokumenter (bilamana diperlukan).

(3)

6. verifikasi relevansi deskripsi

7. pengaturan deksripsi sesuai dengan ketentuan formal yang dianut oleh sistem informasi bersangkutan.

Pengindeksan mendalam atau pengindeksan berdasarkan kriteria sangat spesifik, hanya dapat dilakukan berdasarkan dokumen asli, tidak melalui abstrak.

Langkah pertama pengindeksan adalah melihat sekilas dokumen untuk menentukan sifat atau tujuannya.

Langkah berikutnya memeriksa dokumen dan menyesuaikan tingkat analisis dengan tingkat pengindeksan yang diinginkan.

Langkah ketiga ekstrasi istilah penting hendaknya memperhatikan struktur dokumen serta merekam pentingnya dokumen tersebut terhadap berbagai subjek. Tujuan ialah pengindeksan merupakan citra sedekat mungkin dengan dokumen asli.

Langkah keempat setelah pemilihan istilah penting, tingkat berikutnya adalah pemilihan isitilah penting.

Langkah berikutnya, isitilah yang dipilih harus diterjemahkan kedalam bahasa dokumenter, paling sedikit untuk pengindeksan dalam unit informasi.

Langkah keenam tahap verifikasi menjamin bahwa pengindeksan telah dilakukan sesuai dengan ketentuan yang berlaku. Pengindeks dan penyelis harus memeriksa ulang hasil pengindeksan.

Berdasarkan pendapat di atas, bahwa pengindeksan secara manual merupakan suatu proses penentuan konsep sebuah karya yang dilakukan oleh indekser. pengindeksan secara manual diawali dengan tahap pengamatan awal terhadap dokumen sampai kepada pengaturan deskripsi sesuai dengan ketentuan formal yang dianut sistem informasi bersangkutan. Hasil pengindeksan subjek secara manual adalah deskripsi indeks, yakni wakil ringkas isi dokumen.

Pengindeksan Subjek Secara Automatis

Pengindeksan subjek secara otomatis identik dengan penggunaan komputer. Pengindeksan subjek secara otomatis dapat memperkecil beban kerja indekser.Dalam hal ini, indekser dituntut memiliki keahlian di bidang komputer.

Menurut Anderson dan Perez dalam Shield (2005: 1); automatic indexing often refers to indexing done by computer algorithms. Obviously, humans are involved with creating the programs for the computers, and in setting the parameters, but the work is done by computers. Indexing is based solely on the text stored and is completely immune to the particular group of users and their queries.

(4)

Maka dapat diartikan pengindeksan subjek secara otomatis sering mengacu kepada algoritma atau statistika komputer. Secara jelas, manusia dilibatkan dalam penciptaan program komputer, dan pengaturan tolak ukur, tetapi pekerjaan diselesaikan komputer. Pengindeksan subjek secara otomatis didasarkan pada teks yang tersimpan dan dilengkapi kekebalan untuk kelompok pengguna khusus dan

query mereka.

Pengindeksan otomatis dibagi ke dalam 4 pendekatan yaitu: statistik, sintaksis, sistem semantik, dan dasar ilmu pengetahuan. (Clevleand and Clevleand dalam Shield, 2005: 1). Menurut Diakoft (2004: 85), pengindeksan secara otomatis memiliki ciri-ciri sebagai berikut:

• Lebih canggih

• Sangat baik untuk materi yang sama • Sangat murah

• Mampu untuk menyaring istilah sperti halnya pengelompokan kata. Berdasarkan uraian di atas, maka dapat disimpulkan bahwa pengindeksan subjek secara otomatis diselesaikan dengan komputer serta penerapan algoritma dan statistika komputer. Pengindeksan secara automatis dapat memiliki ciri-ciri, lebih canggih, sangat baik untuk materi yang sama, sangat murah serta mampu untuk menyaring istilah seperti halnya pengelompokan kata.

Bahasa Indeks

Pengindeksan secara manual maupun pengindeksan secara automatis akan menghasilkan bahasa indeks. Bahasa indeks ada dua macam yaitu bahasa alamiah (natural languages) dan bahas terkendali (control vocabulary).

(5)

2.2.1 Bahasa Alamiah (Uncontrol Vocabulary)

Bahasa alamiah memiliki variasi dalam sistem temu balik informasi. Variasi yang dimaksud berupa kelemahan dan kunggulan yang komplek. Kelemahan dan keunggulan dapat dilihat sebagai berikut:

1. Kelemahan dari bahasa alamiah

a. Tidak ringkas (Meadow , 1992: 37-38). Penelusuran cenderung akan menggunakan kata-kata yang sering digunakan atau kata-kata yang familiar, yang sering kali berbeda dengan kata-kata indeks subjek tertentu yang standar. Sebagai contoh, seorang penelusur mungkin akan menggunakan kata kunci kesusastraan dalam penelusuran informasi mengenai dunia sastra, yang bisa jadi tidak akan menghasilkan dokumen yang diinginkan karena dalam dokumen tersebut tidak ada kata kesutraan, yang hanya adalah sastra.

b. Memiliki ambiguitas (ambiguity) yang cukup tinggi (Meadow, 1992: 37, 38; Mudamalle, 1998: 881). Karena ada lebih dari satu kata yang mempunyai arti yang sama, penggunaan kata sinonim memungkinkan menjadi penghambat dalam proses penelusuran. Demikian juga apabila ada kata-kata yang penulisnya sama tetapi memiliki arti yang berbeda, bisa menjadi masalah dalam penelusuran, karena bisa mengarahkan pada dokumen yang berbeda. Selain itu, bahasa alamiah lebih cenderung untuk mudah menangkap konsep tunggal dibandingkan dengan konsep umum. Penelusuran dengan konsep tunggal memberikan hasil yang lebih baik dibandingkan dengan konsep umum (Fugman, 1985 dalam Lancester, 1998: 231).

c. Kesulitan bagi komputer untuk menginterpretasikan (Meadow, 1992: 37-38). Karena kedekatan bahasa alami dalam sistem temu kembali dengan bahasa yang kita gunakan sehari-hari, maka komputer akan mengalami kesulitan untuk menangkap nuansa yang terkandung di balik kata-kata atau istilah yang digunakan oleh user.

d. Diperlukan penilaian (jugdement) dalam penelusuran apabila kata-kata atau istilah yang digunakan tidak bisa menemukan kembali dokumen atau informasi yang dikehendaki (Meadow, 1992: 129). Penilaian ini bisa bersifat mencoba-coba, sedemikian rupa sampai ada kesesuaian antara sistem temu kembali yang digunakan dengan penelusuran informasi. (Murniati, 2001: 46).

2. Keunggulan atau kelebihan dari bahasa alamiah adalah:

a. Bisa dimengerti oleh pengguna tanpa memerlukan pelatihan tertentu., sehingga memudahkan bagi pengguna atau penelusur atau mengadakan penelusuran secara lebih efektif. Bagi praktisi dan ilmuwan, hal ini juga memberi keuntungan karena istilah yang mereka gunakan kurang lebih sama dengan istilah yang terdapat dalam dokumen.

(6)

b. Bisa mengungkapkan nuansa makna dengan lebih leluasa (Meadow, 1992: 37-38), sesuai dengan pemahaman yang dimiliki oleh penelusur informasi.

c. Memiliki spesifikasi yang tinggi (Lancaster, 1977: 23) sehingga memudahkan penelusuran untuk memperoleh ketepatan yang tinggi. Pengindeksan yang dilakukan secara otomatis oleh komputer akan menghasilkan kata-kata indeks yang memiliki tingkat kedalam (exhaustivity) yang tinggi, karena komputer akan mengindeks kata-kata yang paling sering muncul, setelah kata-kata-kata-kata yang tidak bermakna (stopwords) dihilangkan. Ini menguntungkan bagi pengguna karena dokumen yang ditelusur akan mungkin memberikan nilai perolehan (recall) dan ketepatan (precision) yang relatif tinggi. (Murniati, 2001: 46).

2.2.2. Bahasa Terkontrol (Control Vocabulary)

Banyak keunggulan dari penggunaan kosa kata terkendali/terkontrol dalam sistem temu kembali informasi. Selain keunggulan, bahasa terkontrol juga memiliki kelemahan dalam sistem temu kembali informasi. Kelemahan dan keunggulan bahasa terkendali dapat dilihat sebagai berikut:

1. Kelemahan bahasa terkontrol

a. Karena perkembangan dalam pengetahuan, bahasa terkontrol harus selalu diperbaharui. Seperti misalnya dalam pembuatan tesaurus suatu subjek tertentu, setiap periode tertentu tesaurus tersebut harus diperbaharui untuk menyesuaikan dengan perkembangan dalam subjek tersebut (Muddamalle, 1998: 881). Pembaharuan ini secara ekonomis memerlukan biaya yang relatif tinggi bila dibandingkan dengan bahasa alamiah yang tidak memerlukan pembaharuan.

b. Bahasa terkontrol dihadapkan pada ketidakcocokan (incompatibility) antara satu basis data dengan basis data yang lain di bidang yang sama (Lancaster, 1986: 159). Hal ini akan menyulitkan bagi penelusur apabila mereka menelusur dokumen atau informasi tidak hanya dari satu basis data saja.

c. Proses pembuatan indeks yang menggunakan bahasa terkontrol dilakukan oleh pengindeks (indexer) yang dianggap cukup menguasai suatu subjek tertentu. Proses ini melibatkan kemampuan intelectualitas dari pengindeks. Namun demikian, muncul kemungkinan subjektivitas dari pengindeks untuk menentukan kata atau istilah apa yang dianggap bisa cukup mewakili statu dokumen atau informasi. Di lain pihak, apabila pembuatan indeks dengan bahasa terkontrol ini tidak melalui kesepakatan bersama antara pihak-pihak yang berkepentingan, ada kemungkinan muncul indeks dengan kata-kata atau istilah berbeda

(7)

antara satu pengindeks dengan pengindeks yang lain dalam satu bidang yang sama. (Murniati, 2001: 46)

2. Kelebihan bahasa terkendali

a. Konsistensi. Penggunaan kata-kata atau istilah dalam pengindeks dokumen untuk mendapatkan representasi data adalah konsistensi. Konsistensi ini baik pada proses input sistem, yakni pada saat pemilihan kata-kata yang dianggap bisa mewakili dokumen atau informasi yang indeks, maupun pada saat penelusuran dilakukan. Sehingga terdapat kesesuaian antara pengindeks dengan penelusur informasi dalam menggunakan kata-kata indeks sebagai akses poin dalam penelusuran.

b. Tidak bersifat ambigu, karena kata-kata atau isitilah yang dipilih sudah disesuaikan dengan standar tertentu untuk suatu subjek. Demikian juga dalam sistem temu kembali yang menggunakan pangkalan data dengan komputer, kata-kata atau istilah dalam bahasa terkontrol ini sudah disesuaikan untuk bisa dimengerti oleh komputer. Meadow (1992: 129) menyatakan bahwa penggunaan bahas terkontrol dalam temu kembali informasi tidak memerlukan penilaian (judgement). (Murniati, 2001: 46)

Dari pendapat di atas dapat ditarik kesimpulan bahwa bahasa alamiah dan terkontrol memiliki kelebihan dan kelemahan. Kelebihan dari alamiah dapat dilihat dari kemudahan pengguna untuk mengerti dan menggunakan dalam menelusur, pengungkapan makna yang lebih leluasa, serta spesifikasi yang tinggi. Sedangkan kelemahan bahasa alamiah yaitu, tidak ringkas, ambiguitas yang tinggi, kesulitan komputer menginpretasikan dan memerlukan penilaian dalam penelusuran. Kelebihan dari bahasa terkontrol adalah konsistensi, serta tidak bersifat ambigu. Sedangkan kelemahan bahasa terkontrol yaitu perlu pembaharuan bahasa setiap saat, adanya ketidakcocokan antara basis data yang satu dengan yang lain, dan perlunya indexer yang cukup menguasai subjek tertentu.

Pengindeksan Subjek Secara Manual Versus Pengindeksan Subjek Secara Automatis

Pengindeksan secara manual dan pengindeksan secara automatis memiliki keuntungan dan kerugian dari setiap pengindeksan dapat dilihat dri beberapa variable, yakni; Cost (biaya), Time (waktu), Extent Indexable Matter (Tingkat kemampuan

(8)

mengindeks), Exhaustivity (kelengkapan), Specifity (kelengkapan), Browsable and displayed Indeks (kemampuan menampilkan indeks saat menelusur), Searching Syntax (Pencarian dan penampilan sintaksis), Vocabulary management (manajement kosakata), dan Surrogation (penggantian).

Cost, Human Indexing-Expensive per unit Idexed because it Is labor-Intensive. Automatic Indexing-Inexpensive per unit Idexed,

Who’wins’? depends on what you are seeking, Anderson dan Perez dalam Shield (2005: 5)

Maka dapat diuraikan, dilihat/ditinjau dari variable biaya, maka biaya pengideksan manual per unit mahal diakibatkan oleh tenaga kerja yang susah. Sedangkan biaya pengindeksan otomatis tidak mahal. Keunggulan dari setiap pengindeksan tergantung apa yang dicari oleh penelusur.

Time, Human Indexing-Involues more time per unit indexed. can indexing large amounts of material in short amount of time.

Who wins? once again, it depends on what the needs are, Anderson dan Perez dalam Shield (2005: 5)

Dapat diuraikan, bahwa dilihat dari variable waktu, proses pengindeksan manual membutuhkan waktu yang lama. Sedangkan biaya pengindeksan otomatis, proses pengindeksan sejumlah materi dapat dilakukan dalam waktu yang singkat. Pengindeksan yang unggul juga tergantung oleh materi yang dicarioleh penelusur.

Extent Of Indexable Matter, Human Indexing may be limited to abstract or summarization of text.

Automatic Indexing routinely based on complete text

Who Wins? automatic indexing can index more of the indexable matter, Anderson dan Perez dalam Shield (2005: 5)

Dapat diuraikan bahwa, proses pengindeksan dilihat dari tingkat kemampuan mengindeksnya, kemampuan pengindeksan manual hanya terbatas untuk abstrak atau rangkuman teks. Sedangkan pengindeksan otomatis dapat mengindeks teks lengkap secara terus menerus. Dalam hal ini, pengindeksan yang lebih unggul adalah pengndeksan otomatis. Karena memiliki kemampuan yang lebihdalam mengindeks.

(9)

Exhaustifity, Human Indexing, tends to be more selective

Automatic Indexing, considers most of the words in indexible material.

Who wins? automatic indexing is by nature more exhaustive, Anderson dan Perez dalam Shield (2005: 5)

Dapat diuraikan bahwa, dilihat dari variabel kelengkapan, pengindeksan manual lebih cenderung untuk selektif. Sedangkan pengindeksan otomatis membutuhkan banyak pertimbangan mengenai kata-kata dalam pengindeksan materi. Dalam hal ini, pengindeksan automatis jauh lebih unggul dibandingkan pengindeksan manual karena jauh lebih lengkap.

Specificity, Human Indexing use more generic terminology, smaller vocabulary.

Automatic Indexing uses very specific terminology, larger vocabulary.

Who wins? automatic indexing has a higher specificity, Anderson dan Perez dalam Shield (2005: 5)

Dapat diuraikan bahwa, dilihat dari kekhususannya, pengindeksan manual menggunakan istilah-istilah umum dan kosakata yang lebih sempit (khusus). Sedangkan pengindeksan otomatis menggunakan istilah-istilah umum dan kosakata yang luas . Dalam hal kekhusussan, pengindeksan otomatis memiliki kekhususan yang lebih tinggi karena menggunakan kosa kata umum dan istilah-istilah yang luas.

Browsable displayed indexes, Human Indexing use multi-term context-providing headings.

Automatic Indexing limited use of term combinations.

Who wins? depends on what you are seeking, Anderson dan Perez dalam Shield (2005: 5)

Dapat diuraikan bahwa, dilihat dari kemampuan memnampilkan indeks saat menelusur, pengindeksan manual menggunakan multi term/multi istilah konteks dan menyediakan tujuan. Sedangkan dalam pengindeksan otomatis membatasi penggunaan kombinasi istilah gabungan .dari penentuan jenis pengindeksan. Mana yang lebih unggul? tergantung apa yang ditelusur.

Searching and display syntax, Human Indexing use wide-range of syntactic patterns and can adapt quickly to include newer terminology, as well as older subject headings

(10)

Automatic Indexing becoming more sophisticated, and is selecting, combining, manipulating, and weighing terms. Usually limited to key-words in, out of, or along-side context.

Who wins? human indexing has an advantage here, Anderson dan Perez dalam Shield (2005: 5)

Dapat diuraikan bahwa, dilihat dari pencarian dan penampilan sintaks, pengindeksan manual menggunakan pola sintaksis yang luas dan dapat menyesuaikan dengan cepat untuk memasukkan istilah-istilah baru, seperti tajuk subjek yang lama. Sedangkan pengindeksan otomatis jauh lebih canggih dalam penyeleksian, pengkombinasian dan penimbangan istilah selalu terbatas. Dalam hal pencarian dan penampilan sintaksis, pengindeksan manual jauh lebih unggul dibandingkan dengan pengideksan secara automatis.

Vocabulary Management,Human Indexing can cross-reference, link synonyms or like terms, point to related terms easily.

Automatic Indexing being experimented with.

Who wins? human indexing currently has batter vocabulary management, Anderson dan Perez dalam Shield (2005: 5)

Dapat diuraikan bahwa dilihat dari manajemen kosakatanya, dalam pengindeksan manual dapat dibuat cross refrens, menghubungkan sinonim/istilah yang sama, dan dapat menunjukkan istilah-istilah dengan mudah. Sedangkan dalam pengindeksan automatis, manajemen kosa kata dilakukan dengan melakukan uji coba. Dalam hal manajemen kosakata, pengindeksan manual jauh lebih baik.

Surrogation, Human Indexing not often used by human indexing.

Automatic Indexing being used frequently – often as visual display, such as icons or graphs.

Who wins? automatic indexing often uses surrogation, while human indexing does not, Anderson dan Perez dalam Shield (2005: 5)

Dapat diuraikan bahwa dilihat dari variabel surrogation (penggantian), dalam pengindeksan manual surrogation (penggantian) tidak sering digunakan, sedangkan dalam pengindeksan otomatis surrogation (penggantian) sering digunakan sebagai penampilan secara visual, seperti ikon dan grafik. Dalam hal ini penggantian

(11)

(surrogation), pengindeksan otomatis jauh lebih unggul. Karena lebih sering menggunakan penggantian(surrogation).

Dari pernyataan di atas bahwa pengindeksan otomatis memiliki lebih banyak keuntungan dari pada pengindeksan manual. Keuntungan itu dapat dilihat dari berbagai aspek antara lain, biaya, waktu, kemampuan mengindeks, kelengkapan, kekhususan (spefication), kemampuan menentukan indeks saat menelusur, pencarian sintaksis, penampilan sintaksis, dan penggantian (surrogation).

2.4 Teknik Pengindeksan Subjek pada Artikel Ilmiah

Artikel ilmiah merupakan karya tulis yang banyak dimanfaatkan kalangan sivitas akademik untuk bahan rujukan dalam melakukan penelitian. Dalam sebuah artikel indeks subjek sangat dibutuhkan dalam rangka memperkecil waktu pencarian serta memaksimalkan keberhasilan penelusuran artikel.

Menurut Cortez (2007: 3), ada beberapa langkah-langkah dalam pengindeksan subjek pada artikel. Adapun langkah-langkah tersebut adalah:

1. Pengindeksan

Pilih jurnal elektronik yang akan di indeks subjeknya. Pilih 1 atau 2 tesaurus atau daftar kontrol vacabulary yang spesifik (misalnya: ERIC atau Medical Subject Heading) untuk topik jurnal dan 1 lagi tesaurus yang umum (misalnya: Library of Congres Subject Headings). Kebijakan-kebijakan yang perlu diperhatikan dalam pengindeksan meliputi:

a. Siapa pengguna indeks?

b. Azas apa yang dipilih dalam pengindeksan artikel? c. Bagaimana kelengkapan yang akan di indeks? d. Apakah ada deskriptor minor atau mayor?

e. Apakah konsep baru itu dimasukkan sebagai pengindentifikasian? f. Lengakapi sitasi dari setiap artikel.

g. Analisis proses pengindeksan, yang meliputi kelemahan dan kelebihan sebuah tesaurus dan bagaimana memanfaatkan dalam kegiatan pengindeksan.

(12)

2.5 Kajian Bibliometrika

Bibliometrika merupakan salah satu topik penelitian informasi dalam bidang perpustakaan. Objek kajian adalah literatur atau dokumen dengan menerapkan metode matematika dan statistika. Bibliometrika adalah aplikasi metode statistika dan matematika terhadap buku serta media komunikasi lainnya. (Pritchard dalam Glanzel, 2006:1). The British Standard Institution dalam Sulistyo-Basuki (2002:2-3), memberikan defenisi ”bibliometrika sebagai kajian penggunaan dokumen dan pola publikasi dengan menerapkan metode matematika dan fisika”. Sedangkan Putu (2008: 1) menyatkan ” bibliometrika adalah salah satu cabang ilmu paling tua dari ilmu perpustakaan. Sebagai kajian ilmiah, cabang ini berkembang karena segelintir ilmuan pada awal abad 20 yang tertarik dengan dinamika ilmu pengetahuan sebagaimana tercermin dalam produksi literatur ilmiah”. Dari ketiga pendapat tersebut dapat disimpulkan bahwa bibliometrika adalah kajian terhadap suatu dokumen dengan menerapkan metode statistika dan matematika dan merupakan cabang ilmu paling tua dalam ilmu perpustakaan.

Bibliometrika merupakan suatu kajian kuantitatif terhadap informasi terekam yang bersifat tekstual pada bidang bibliografi atau kepustakaan. Hal ini sesuai dengan yang dinyatakan oleh Sulistyo-Basuki dalam Handayani, 2007: 5 bahwa:

Dalam bibliometrika yang dikaji adalah informasi terekam khususnya dalam bentuk grafis, dengan demikian objeknya mungkin buku, majalah, laporan penelitian, disertasi dan sebagainya. Namun sampai saat ini, kajian bibliometrika lebih banyak ditujukan kepada majalah ilmiah karena dianggap menduduki peran terpenting dalam komunikasi ilmiah.

Kajian bibliometrika lebih diutamakan pada majalah ilmiah karena majalah tersebut dianggap informasi terekam yang paling utama dan populer dalam

(13)

berkomunikasi secara ilmiah. Sehingga dapat dinyatakan bahwa bibliomerika merupakan penggunaan metode statistika dan matematika yang mengkaji mengenai informasi terekam yang bersifat ilmiah yang digunakan dalam proses komunikasi ilmiah.

Metode penelitian ini dibuat untuk mengidentifikasi dan temu balik informasi terutama dalam menghasilkan indeks subjek atau keyword (kata kunci) sebagai representasi dokumen. Metode ini merupakan fungsi utama dari sistem temu balik informasi (retrieval information ).

Ada tiga jenis materi yang dikaji melalui bibliometrika yaitu:

1. Dokumen primer; data numerik, statistikal, tekstual dan tabel-tabel, 2. Dokumen skunder, abstrak, indeks, bibliografi,

3. Dokumen tersier; bibliografi dari bibliografi. ( Hartinah, 2002: 2)

Walaupun bibliometrika mengkaji ketiga jenis literatur di atas, dalam kenyataan yang menjadi objek utama adalah majalah atau jurnal. Hal ini dikarenakan bibliometrika menganggap majalah sebagai media paling penting dalam komunikasi ilmiah, merupakan pengetahuan publik serta arsip umum yang dapat dibaca oleh siapa saja setiap saat.

Majalah atau jurnal sebagai objek kajian memiliki parameter yang tidak dapat dilepaskan dari ciri majalah. Adapun parameter majalah ialah:

1. Pengarang 2. Judul artikel 3. Judul majalah 4. Tahun terbit

5. Referensi ialah acuan atau daftar kepustakaan, lazimnya tercetak pada bagian bawah setiap halaman sering disebut catatan kaki atau pun pada bagian akhir sebuah artikel.

6. Sitiran ialah informasi literatur yang dimuat dalam referensi.

7. Deskriptor yaitu istilah yang digunakan untuk memeriksa isi artikel ilmiah (Sulistyo-Basuki, 2002: 6 ).

(14)

Dari pendapat di atas dapat ditarik kesimpulan bahwa objek yang dikaji sebagai parameter dari sebuah majalah adalah pengarang, judul artikel, judul majalah, tahun terbit, referensi, sitiran serta deskriptor.

2.5.1 Tujuan dan Manfaat Bibliometrika

Bibliometrika memegang peranan penting dalam proses analisis dokumen, analisis bibliometrika memberikan manfaat yang besar bagi perpustakaan. Brokes dalam Hasugian (1999: 9) menyatakan bahwa ”bibliometrika adalah kegiatan analisis secara kuantitatif dan kualitatif, dimana analisis secara kauantitatif (angka) dapat dihitung secara numerik atau angka sedangkan analisis secara kualitatif biasanya dinyatakan dalam bentuk statement ataupun pernyataan”. Selain itu Sulistyo-Basuki (2002: 3) menyatakan bahwa tujuan bibliometrika adalah ”menjelaskan proses komunikasi tertulis dan sifat serta arah pengembangan sarana deskriptif penghitungan dan analisis berbagai faset komunikasi”. Dari kedua pendapat tersebut dapat disimpulkan bahwa tujuan bibliometrika adalah menjelaskan komunikasi tertulis dan kegiatan analisis secara kuantitatif dan kualitatif.

Manfaat analisis bibliometrika bagi perpustakaan antara lain (Ishak, 2005: 18): 1. Mengidentifikasi majalah inti dalam berbagai disiplin ilmu.

2. Identifikasi arah dan gejala penelitian dan pertumbuhan pengetahuan pada berbagai disiplin ilmu

3. Menduga keluasan literature sekunder 4. Mengenali pemakai berbagai subjek

5. Mengenali kepengarangan dan arah gejalanya pada dokumen berbagai subjek

6. Mengukur manfaat jasa SDI ad-hoc dan retrospektif

7. Meramalkan arah gejala perkembangan masa lalu, sekarang dan mendatang

8. Mengukur arus masuk informasi dan komunikasi 9. Mengkaji keusangan dan penyebaran literature ilmiah

10. Meramalkan produktifitas penerbit, pengarang, organisasi, Negara atau seluruh disiplin ilmu.

(15)

Dari pendapat di atas dapat ditarik kesimpulan bahwa manfaat analisis bibliometrika adalah untuk mengidentifikasi majalah inti sampai kepada memperediksi produktifitas penerbit, pengarang, organisasi bagi seluruh disiplin ilmu.

2.5.2 Dalil Bibliometrika

Dalil (hukum dasar) untuk bibliometrika ada tiga jenis yaitu (Hartinah, 2003: 1):

1. Dalil Bradford (Bradford’s Law)

Dalil ini dikenalkan pertama sekali oleh S.C. Bradford. Dalil ini dapat digunakan untuk merencanakan kegiatan pengindeksan atau pembuatan abstrak atau untuk pengembangan koleksi.

2. Dalil Lokta (Lokta’s Law)

Dalil ini dapat digunakan untuk menduga frekwensi kemunculan seorang penulis tertentu dalam pangkalan data katalog perpustakaan.

3. Dalil Zipf (Zipf’s Law)

Dalil ini dikenalkan pertama sekali oleh George Kingsley Zipf. Dalil ini dapat digunakan untuk menentukan subjek dokumen dengan cara menghitung peringkat kata.

Ketiga dalil (hukum dasar) untuk bibliometrika di atas dapat digunakan untuk mengkaji dokumen primer, skunder, dan tersier.

2.5.2.1 Pengertian dan Sejarah Zipf’s

Dalil zipf’s memiliki peranan penting dalam pengindeksan subjek. Menurut (Hasugian, 1999: 1), dalil zipf’s digunakan untuk mengetahui subjek suatu dokumen dengan memberi peringkat kata dalam literatur, distribusi frekwensi kata dengan peringkat kata (word frequency). Dari pernyataan di atas dapat ditarik pengertian bahwa dalil zipf’s digunakan untuk mengetahui indeks subjek suatu dokumen dengan melihat frekwensi kata.

Dalil Zipf diperkenalkan pertama sekali oleh George Kingsley Zipf, disingkat Zipf. Biodata singkat Zipf adalah sebagai berikut:

(16)

George Kingsley Zipf lahir di Freeport, Illiones pada tanggal 7 Januari 1902, lulus Summa Cum Lalude dari Harvard College tahun 1924, melanjutkan sekolah di Bonn dan Berlin, kembali melanjutkan studi di Harvard College dan lulus PhD dengan disertasinya Comparative Philology tahun 1929, menjadi instruktur di German sampai dengan tahun 1935 dan menjadi dosen sampai meninggalnya pada tanggal 25 September 1950 karena penyakit kanker, meninggalkan seorang istri dan empat orang anak, (Hartinah, 2002: 2). Zipf mulai terkenal dalam bidang bibliometrika setelah karyanya yang berjudul “The Psycho-biology of language”, terbit pada tahun 1935. Zipf melalui karya tersebut membawa studi bahasa ke dalam suatu kondisi ilmu eksakta dengan memakai prinsip-prinsip statistik. Empat belas tahun kemudian, Zipf semakin terkenal dengan bukunya yang berjudul, “Human Behavior and Principle of Least Effort” yang terbit pada tahun 1949. Karya tersebut menyatakan bahwa seseorang lebih mudah untuk memilih dan menggunakan kata umum, yang lebih familiar dari pada kata-kata yang tidak dikenalnya, dengan demikian kemungkinan pemunculan kata-kata-kata-kata umum yang lebih femiliar dalam suatu karya biasanya lebih tinggi dari pada kata-kata yang tidak dikenalnya. Sekalipun Zipf adalah seorang ahli bahasa dan filsafat, namun ia tertarik untuk melakukan teknik pengukuran (matrics) terhadap dokumen atau literatur dengan memakai pendekatan statistik.

Zipf berhasil melakukan observasi atau pemeriksaan terhadap sebuah novel yang berjudul “Ulysses”, karangan James Joice yang pada saat itu merupakan salah satu pemegang hadiah nobel. Hasil observasinya menyatakan bahwa terdapat 29.899 kata yang berlainan dalam karya tersebut, sedangkan jumlah kata seluruhnya adalah 260.430. Dalam hasil pemeriksaan atau observasinya, Zipf juga menemukan beberapa kata yang berkali-kali digunakan (di ulang), dan kata-kata yang penggunaanya rendah, bahkan ada kata yang hanya digunakan sekali. Kata yang dimaksudkannya adalah kumpulan huruf yang diapit oleh dua spasi. Kata bergaris hubung dianggap satu kata, dan tanda kutip dianggap bagian dari satu kata. Semua kata fonetik yang dianggap

(17)

kata berbeda, kata sandang (stopword) tidak dipergunakan dan diabaikan oleh Zipf. Kemudian Zipf membuat perhitungan peringkat kata. Perhitungan peringkat kata ini yang akhirnya dikenal dengan sebutan dalil Zipf’s.

2.5.2.2 Perubahan dan Aplikasi Dalil Zipf’s

Peringkat kata yang diperkenalkan oleh George Kingsley Zipf ini bersifat konsisten dan lebih di kenal dengan sebutan dalil Zipf yang pertama. Adapun isi dari dalil Zipf yang pertama ini adalah sebagai berikut:

Bila jumlah pengulangan setiap kata yang berlainan yang terdapat pada sebuah teks dihitung serta hasilnya dituangkan kedalam sebuah tabel, dengan peringkat I merupakan kata yang memiliki frekuensi pengulangan paling tinggi dan demikian seterusnya dan bila peringkat susunan jajaran itu disebut ranking (r) dan jumlah pengulangan kata disebut frekuensi (f) maka r x f = K (konstanta). (Guo, 2008: 5).

Dapat disimpulkan dalil di atas menyatakan bahwa dalil Zipf’s I digunakan hanya untuk kata-kata yang muncul dengan frekuensi tinggi. Perhitungan setiap kata yang berbeda cara menulisnya dianggap kata berbeda dan frekuensi pengulangan yang sama memperoleh peringkat yang berbeda pula.

Satu lagi rumus Zipf’s tentang kata yang memiliki frekuensi pengulangan yang rendah, rumus ini disebut sebagai Dalil Zipf’s II. Dalil Zipf’s II ini sama sekali tidak memiliki hubungan dengan dalil Zipf’s I. Karena dalil kedua ini hanya berlaku bagi kata-kata yang muncul dengan frekuensi rendah. Dalil kedua ini telah diperbaiki oleh Booth dengan rumus sebagai berikut:

Ii / In = n (n-1)/ 2

Dimana Ii adalah kata yang diulang 1 (satu) kali sedangkan In adalah kata yang diulang n kali. Rumus Booth juga menyebutkan adanya titik frekuensi antara kata yang berfrekuensi tinggi dengan kata yang berfrekuensi rendah. Titik frekuensi

(18)

ini terjadi pada saat peralihan dari kata yang memiliki frekuensi khusus ke kata yang memiliki frekuensi pengulangan yang sama.

Selanjutnya Goffman memperkenalkan model transisi, yang merupakan Zipf’s I (berlaku hanya untuk kata yang memiliki frekuensi pengulangan yang tinggi) dan dalil Zipf’s II (berlaku untuk kata yang memiliki frekuensi pengulangan yang rendah). Kata yang memiliki frekuensi pengulangan yang tinggi biasanya adalah kata sandang dan kata sambung serta awalan yang tidak sesuai sebagai istilah indeks. Dalam pengindeksan, istilah ini disebut stopword dan selalu dibuang dikerenakan kata sandang (stopword) tidak diperhitungkan sebagai kosa kata indeks. Sedangkan kata yang memiliki frekuensi pengulangan yang rendah adalah kata yang menunjukkan ciri khas dari seorang pengarang. Kata ini tidak dipergunakan dalam pengindeksan.

Model transisi yang ditawarkan Goffman memberikan suatu penjelasan yang lebih rasional dan pasti, dengan memperkenalkan cara untuk mengulangi kelemahan tersebut, dengan maksud untuk mencari titik transisi, yaitu nilai batas antara kata yang berfrekuensi rendah. Hal ini dapat diduga bahwa titik transisi tersebut merupakan daerah yang memuat kata-kata yang menunjukkan isi dokumen.

Untuk menentukan titik ini dipakai rumus ABC, yang merupakan pengembangan dari dalil Zipf’s II yaitu:

n = 2 4ac b b+ +− − Dimana: a = 1, b = 1 dan c = - 2 Ii

Pao dalam Hasugian (1999:9) menyatakan bahwa “setelah diperoleh titik transisi ( dari nilai n di atas), dengan mengambil jumlah kata yang sama dia atas dan di bawah titik tersebut, maka diperoleh daerah transisi. Kata-kata yang berada pada daerah transisi setelah dikurangi dengan kata-kata buangan (stopword), merupakan istilah indeks dokumen”.

(19)

2.5.2.3 Penentuan Indeks Subjek dengan Menggunakan Dalil Zipf

Ada beberapa langkah yang harus ditempuh untuk menentukan indeks subjek suatu artikel dengan menggunakan dalil ini yaitu:

1. Memilih dokumen

Dalam memilih dokumen peneliti biasanya memilih dokumen elektronik. Karena informasi lebih bersifat akurat.

2. Menghitung jumlah dan frekuensi kata

Menghitung jumlah frekuensi kata yang terdapat dalam dokumen, digunakan bantuan bantuan komputer, dengan memakai program aplikasi

Microsoft Word. Caranya adalah semua kata yang terdapat pada artikel

tersebut diblok (short), dengan menggunakan perintah convert table to text dari menu table, kemudian number colums diisi dengan angka satu (1), lalu di-click kemudian di – ascending, hasilnya ialah bahwa semua kata akan tampil berurut dengan frekuensi pemunculannya, selanjutnya frekuensi kata tersebut dihitung secara manual dan hasil angka frekuensi yang diperoleh diketik disamping setipa kata (mulai dari frekuensi kata tertinggi sampai ke frekuensi rendah).

3. Menentukan titik transisi dari suatu dokumen

Untuk menentukan titik transisi, dipergunakan rumus dari dalil Zipf II yang sudah dikembangkan yaitu rumus ABC yaitu:

n = 2 8 1 1+ + li −

4. Penentuan daerah transisi

Dilakukan dengan cara mengambil 10 kata diatas dan 10 kata di bawah titik transisi.

5. Penentuan indeks dokumen

Kata-kata yang terdapat pada daerah transisi, setelah kata buangan (stopword) dihilangkan selanjutnya dijadikan menjadi indeks dokumen. 6. Interpretasi terhadap indeks dokumen

Setelah indeks dokumen diperoleh, maka selanjutnya diinterpretasikan atau dinilai apakah indeks tersebut benar-benar dapat menggambarkan isi atau subjek dari artikel atau dokumen yang sebenarnya, (Hasugian, 1999: 11)

Dari uraian di atas dapat ditarik kesimpulan bahwa langkah penentuan indeks subjek sebuah artikel dengan menggunakan dalil zipf’s di mulai dari memilih dokumen, menghitung jumlah frekwensi sampai kepada interpretasi terhada indeks dokumen.

(20)

2.6. Masa Depan Pengindeksan Subjek

Kemajuan teknologi akan berdampak kepada aspek kerja manusia. Hal ini juga berdampak kepada kegiatan perpustakaan termasuk pengindeksan.

Menurut Shield (2005: 4), ”revolusi pengideksan di masa yang akan datang dapat diibaratkan seperti revolusi industri. Dengan adanya revolusi industri, barang-barang yang dahulunya diciptakan dengan menggunakan tangan secara perlahan diciptakan dengan cepat dan mudah oleh manusia dengan menggunakan mesin. Saat ini kegiatan industri melakukan sejumlah pekerjaan dengan menggunakan mesin sedangkan manusia hanya pengontrol mesin. Hal ini juga terjadi dalam kegiatan pengindeksan. Kegiatan pengindeksan dimasa yang akan datang didominasi oleh komputer sedangkan indekser hanya sebagai pemandu dan pengontrol.”

Dari pendapat di atas dapat disimpulkan bahwa pengindeksan subjek akan terus berkembang seiring perkembangan teknologi. Namun dalam hal ini campur tangan indekser tidak dapat diabaikan karena indekser sebagai pengontrol. Untuk itu seorang pustakawan atau indekser dituntut memiliki kompetensi dibidang informasi teknologi (IT).

Dengan perkembangan teknolgi informasi yang cepat, kegiatan pengindeksan juga membutuhkan sistem pengindeksan otomatis yang tidak mahal untuk mempercepat kegiatan pengindeksan sejumlah sumber-sumber informasi elektronik seperti jurnal dan buku. Revolusi pengindeksan subjek menyebabkan biaya dan waktu penindeksan berkurang.