Pengertian dan Sejarah Zipf - TINJAUAN LITERATUR

BAB II TINJAUAN LITERATUR

2.3. Bibliometrika

2.3.3. Pengertian dan Sejarah Zipf

Menurut Hasugian (2020: 54) bahwa, “Dalil Zipf digunakan untuk pengindeksan berdasarkan kepada rangking atau peringkat kata atau istilah yang termuat dalam sebuah dokumen dan dihitung berdasarkan frekuensi kata atau istilah tertinggi”. Dari penjelasan tersebut dapat disimpulkan bahwa dalil Zipf dapat digunakan dalam proses pengindeksaan dengan cara memanfaatkan hasil frekuensi kemunculan kata.

Hukum ini adalah hasil karya dari George Kingsley Zipf (1902-1950) atau biasa disebut dengan panggilan Zipf. Zipf lahir di kota Illinois Freeport pada tanggal 7 Januari 1902 dengan lulusan predikat summa cum laude dari Harvard College pada tahun 1924, selanjutnya ia melanjutkan pendidikannya di Bonn Berlin kemudian kembali ke Harvard College dan melanjutkan studinya dan

lullus PhD (doktor) dengan disertasi Comparative Philology pada tahun 1929.

Kemudian ia menjadi seorang instruktur dan dosen pengajar linguistik di Harvard College pada tahun 1939 sampai ia meninggal pada tanggal 25 September 1950 dengan usia 48 tahun dikarenakan penyakit kanker yang dialaminya dan dia meninggalkan satu orang istri serta empat orang anak.

Pada masa hidupnya Zipf sangat tertarik dengan fenomena kuantitatif dan perilaku manusia yang cenderung untuk meminimalkan tindakannya dalam kehidupan sehari-hari seperti menghemat kata dalam berkomunikasi, sehingga dia menyusun sebuah hipotesis “kata” yang digunakan dalam dokumen sebagai media komunikasi baik yang ilmiah maupun non-ilmiah.

Zipf mulai terkenal dalam bidang ilmu bibliometrika setelah karyanya yang berjudul “Psycho-Biology Of Language” terbit pada tahun 1935. Melalui karyanya tersebut telah membawa studi bahasa ke dalam kondisi ilmu eksak dengan memakai prinsip-prinsip statistik.

Pada tahun 1949 buku Zipf yang berjudul “Human Behavior and Principle of Least Effort” membawa namanya semakin terkenal di mata dunia, karyanya tersebut berisi tentang seseorang yang lebih mudah memunculkan kata-kata umum yang familiar dalam berkomunikasi dari pada kata-kata yang tidak dikenalnya. Sehingga memungkinkan pemunculan kata dalam penyusunan sebuah karya ilmiah berasal dari kata-kata umum bukan dari kata-kata yang tidak dikenal oleh penulis. Karena ketertarikannya pada perhitungan frekuensi kata membuat dia melakukan observasi atau pemeriksaan terhadap sebuah novel yang berjudul “Ulysses” Karangan James Joyce.

Pada pengamatan Zipf ia menyatakan bahwa 29.899 kata yang berbeda dalam karya tersebut, sedangkan seluruh kata berjumlah 260.430. dalam observasinya ia menemukan beberapa kata yang berkali-kali diulang, banyak kata yang tingkat frekuensinya rendah, perkalian antara peringkat kata dengan frekuensi nya bersifat konsisten, dan nilai rata-rata simpangan baku dapat digunakan sebagai tolak ukur keserasian.

Ciri-ciri kata yang termasuk dalam batasan Zipf, yaitu sebagai berikut:

a. Kata adalah kumpulan huruf yang dipisah oleh dua spasi;

b. Kata yang bergaris hubung dianggap menjadi satu kata;

c. Kata yang memiliki Tanda kutip dianggap menjadi bagian dari satu kata;

d. Semua kata fonetik yang berbeda dianggap kata berbeda;

e. Kata-kata gelar, nama, jabatan, afiliasi, dan sebagainya dianggap diabaikan.

2.3.4. Perkembangan Dalil Zipf

Dalil atau hukum Zipf dikenal dengan perhitungan kata tertinggi sebagai istilah kata yang digunakan sebgai istilah atau kata yang digunakan dalaam penentuan indeks subyek atau indeks kata kunci sebuah dokumen yang di indeks.

Hukum pertama dalil Zipf adalah sebagai berikut:

“Hasil dari perhitungan sejumlah kata kemudian dituangkan kedalam sebuah tabel dengan menempatkan kata yang memiliki frekuensi pengulangan tertinggi sebagai peringkat pertama, kemudian diikuti peringkat lainnya yang lebih rendah frekuensi pengulangannya secara berturut. Susunan jajaran kata berdasarkan frekuensi pengulangan yang terurut tersebut dinamai peringkat atau rangking, yang diberi symbol “r”, sedangkan jumlah pengulangannya disebut frekuensi atau“f”, maka f×r =k (Konstan)” (Hasugian, 2009: 44)

Berdasarkan pendapat di atas bahwa, hukum pertama Zipf hanya berlaku pada kata-kata frekuensi tinggi. Sedangkan, untuk kata-kata dengan frekuensi rendah Zipf mengajukan rumus:

(𝑓² − 1⁄4) = 𝑘

yang di mana n adalah kata yang muncul, f adalah frekuensi dan k adalah bilangan konstanta. Setelah diperbaharui oleh Boyce dengan rumus, yaitu sebagai berikut:

In = jumlah kata yang berbeda dengan frekuensi kemunculan n, 𝐼₁= jumlah kata yang berbeda dengan frekuensi kemunculan 1 kali.

2.3.5. Titik Transisi dan Daerah Transisi Goffman

Goffman adalah seorang peminat Hukum Zipf yang mengembangkan teori penentuan subyek atau isi dokumen berdasarkan hukum Zipf. Goffman

menemukan sebuah fenomena yang disebut sebagai “titik transisi”. Titik transisi adalah titik yang terjadi perubahan dari frekuensi tinggi ke frekuensi rendah yang diduga memuat kata-kata yang menunjukkan subyek dokumen.

Titik transisi Goffman adalah titik transisi yang dapat ditarik ke daerah atas dan bawah dengan jarak yang sama sehingga menghasilkan daerah transisi. Di daerah transisi terdapat kata-kata yang menunjukan isi dari suatu dokumen setelah kita menghilangkan kata-kata abai atau kata tidak bermakna yang tidak digunakan dalam pengindeksan (stopwords). Stopwords atau kata abai adalah kata yang berupa kata bantu seperti atau, dari, maka, untuk, dan lain sebagainya.

Kata yang digunakan dalam pengindeksan adalah jenis kata “content words”

yaitu kata yang mempunyai makna.

Goffman menawarkan:

Rumus-1:

𝑛 = (−1 + √1 + 8I₁)/2 Di mana:

n = Titik transisi

I₁ = Jumlah kata yang berbeda dengan frekuensi kemunculan 1 kali Rumus-2:

𝑛_1.2 = 1 2⁄ (−𝑏 ± √(𝑏²− 4𝑎𝑐)) Atau

𝑛₁₂ = 1/2{−𝑏 ± √(𝑏²− 4𝑎𝑐)}

Di mana:

𝑛₁₂ = titik transisi yang akan dicari a = 1 (Konstanta)

b = 1 (Konstanta) c = -2 I₁

I₁ = jumlah kata yang berbeda dengan frekuensi kemunculan 1 kali.

BAB III

METODE PENELITIAN 3.1. Jenis Penelitian

Dalam penelitian ini, penulis menggunakan metode penelitian kuantitatif.

Penelitian Kuantitatif menurut Bryman (dalam Pendit, 2003:195) merupakan penelitian yang bertujuan untuk mengumpulkan data numeric dan menggunakan logika dalam pengembangan dan pengujian teori. Jenis penelitian yang digunakan dalam penelitian ini adalah deskriptif yang mendeskripsikan obyek penelitian berdasarkan fakta dan data yang ada. Menurut Arikunto (2000: 309)

“Penelitian deskriptif merupakan suatu penelitian yang dimaksudkan untuk mengumpulkan informasi mengenai status suatu gejala yang ada, yaitu keadaan gejala menurut apa adanya pada saat penelitian dilakukan”.

3.2. Unit Analisis

Unit analisis adalah satuan tertentu yang dijadikan sebagai subjek penelitian yang mengandung perilaku, karakteristik, dan informasi yang ingin diketahui. Menurut Rahmat (2009), Unit analisis diartikan sebagai sesuatu yang berkaitan dengan komponen yang diteliti. Unit analisis ini dilakukan oleh peneliti agar validitas dan reabilitas penelitian dapat terjaga.

Berdasarkan pendapat di atas maka penulis menentukan unit analisis penelitian ini adalah artikel yang dimuat dalam Jurnal Library Management Vol.

36 issue 8/9 tahun 2015 yang dimuat dalam bentuk online dan bersifat gratis (free). Jurnal ini terbit lima kali dalam satu tahun. Dari hasil observasi yang dilakukan oleh penulis, didapat data bahwa yang menjadi unit analisis penelitian ini adalah sebanyak 11 artikel. Karena unit analisis yang tidak terlalu besar maka penulis menjadikan semua artikel sebagai sampel. Teknik Pengambilan sampel yang digunakan pada penelitian ini adalah teknik sampel jenuh yaitu seluruh anggota populasi dijadikan sebagai sampel penelitian.

3.3. Instrumen Penelitian

Instrument penelitian adalah alat-alat yang diperlukan atau yang dipergunakan untuk mengumpulkan data. Instrument yang digunakan dalam penelitian ini adalah program aplikasi seperti; Microsoft Word, Microsoft Excel yang digunakan sebagai mesin proses perhitungan atau penjumlahan dan Mozilla

Firefox sebagai mesin pencari.

3.4. Teknik Pengumpulan Data

Metode yang digunakan dalam pengumpulan data pada penelitian ini adalah metode dokumentasi. Metode dokumentasi yaitu mencari data mengenai hal-hal atau variable yang berupa catatan, transkip, buku, surat kabar, majalah, prasasti, notulen rapat, lengger, agenda, dan sebagainya (Siyoto, S. & Ali S.

2015: 77-78) untuk mengumpulkan semua data. Maka, diperlukan proses

browsing pada situs dibawah ini

http://www.emerald.com/insight/publication/issn/0143-5124/vol/36/iss/8/9.

Selanjutnya artikel tersebut di download dan di konversi ke format word, kemudian file yang telah di dapat kemudian di cari indeksnya dengan menggunakan Dalil Zipf.

3.5. Teknik Analisis Data

Dalam proses menganalisis terlebih dahulu diperlukan data yang tepat, sehingga menghindari kemungkinan terjadinya kesalahan pada hasil akhir pengolahan data. Analisis data bertujuan untuk menata, menyusun dan memberikan makna dari kumpulan data. Hal penting yang sangat berkaitan dengan proses pengumpulan data adalah rasionalitas, deskripsi, ilustrasi, dan pendukung. Setelah data diperoleh maka langkah selanjutnya adalah mengolah data tersebut agar pertanyaan-pertanyaan dari penelitian dapat terjawab.

Analis data pada penelitian ini denagn menggunakan rumus dalil Zipf dan Transisi Goffman. Rumus dalil Zipf yang digunakan untuk pemeringkatan kata yaitu:

𝑐 = 𝑟 × 𝑓 Keterangan:

r = Peringkat kata;

f = Frekuensi kemunculan kata c = Konstanta

Sedangkan Rumus transisi Goffman yang digunakan untuk menentukan titik transisi yaitu:

n = (−1 + √1 + 8I₁)/2

Keterangan:

n = titik transisi

Ii = Jumlah kata yang memiliki frekuensi kemunculan satu kali

Analisis hasil indeks menggunakan Dalil Zipf (machine indexer) dengan hasil indeks atau keyword dari pengarang pada artikel itu sendiri. Tingakt Relevansi Hasil pengindeksan pada dalil Zipf adalah sebagai berikut:

a. Relevan, apabila indeks yang dihasilkan dari dalil Zipf dengan kata kunci pada artikel jurnal benar-benar dan sama persis.

Indeks Dalil Zipf = Kata Kunci Artikel

b. Relevan marginal, apabila indeks yang dihasilkan memiliki kemiripan/

kesamaan.

Indeks Dalil Zipf < 𝐾𝑎𝑡𝑎 𝐾𝑢𝑛𝑐𝑖 𝐴𝑟𝑡𝑖𝑘𝑒𝑙

c. Tidak Relevan, apabila indeks yang dihasilkan sama sekali tidak memiliki kemiripan/ kesamaan.

Indeks Dalil Zipf ≠ Kata Kunci Artikel

BAB IV

HASIL DAN PEMBAHASAN 4.1 Identitas Jurnal Library Management

Jurnal Library Management adalah jurnal penelitian terbaru yang dilakukan di institusi akademis, pemerintah dan perusahaan dengan melaporkan pemikiran kontemporer, sambil mengeksplorasi implikasi praktis bagi mereka yang terlibat dalam penelitian tersebut. Jurnal ini diterbitkan oleh Emerald Publishing Limited dengan periode terbit sembilan kali dalam satu tahun.

Jurnal Library Management mengangkat tema terkait penelitian tentang management strategis, HRM/HRO, Keragaman budaya, penggunaan informasi, manajemen kualitas dan perubahan, masalah manajemen, pemasaran, outsourcing, otomatisasi, keuangan perpustakaan, pengukuran kinerja, serta perlindungan data dan hak cipta. Metode Informasi ini sangat berguna untuk manajer perpustakaan senior dan akademisi.

4.2 Kode Untuk Masing-Masing Artikel

Artikel dimuat dalam jurnal Library Management Vol. 36 issue 8/9 tahun 2015 berjumlah 11 artikel. Kode Artikel berfungsi sebagai wakil dari judul dokumen tersebut. Adapun Kode artikel adalah sebagai berikut:

Tabel-1: Kode Artikel dalam Dokumen Uji

No Judul Artikel Kode community culture in co-creating academic library learning spaces.

A02

3. Choice of Library and Information Science in a rapidly changing information landscape A systematic literature review

A03

4. The odyssey of Flemish public libraries facing opportunities and threats when becoming strategic partners in urban development

A04

5. Evidence based organizational change: people surveys, strategies and structures

A05 6. Decision-making experiences of public library CEOs A06

A study exploring the roles of interpersonal influence and evidence in everyday practice

7. Trust me: the keys to success in cooperative collections ventures

A07 8. Factors affecting empowerment of female librarians,

views of female managers of Tehran public libraries

A08

Setiap artikel memiliki kata kunci berbeda-beda yang berasal dari pengarang atau penulis artikel itu sendiri. Berikut data kata kunci Artikel pada dokumen uji yang dimuat di jurnal Library Management Vol. 36 issue 8/9 tahun 2015 adalah sebagai berikut:

Tabel-2: Daftar Kata Kunci Artikel Dalam Dokumen Uji No Kode Artikel Kata Kunci Pada Artikel

1. A01 Library Management, Library spaces, Information commons

2. A02 Academic libraries, Co-creation in library construction, Librarians and architects, Library buildings, Library learning commons, Sensemaking in library construction

3. A03 Literature review, Library and Information Science, Systematic review, Career change, LIS career choice, LIS career motivations

4. A04 Flanders, Urban development, Public libraries, Strategic management,

Case-study research

5. A05 Library Management, Human relations,

ClimateQUAL, Library strategy, Library structures, Staff surveys

6. A06 Managers, Canada, Public libraries, Interpersonal influence, Evidence-based practice, Decision-making practices

7. A07 Collaboration, Collections, Consortia, Conspectus, RLG, TRLN

8. A08 Women, Management, Empowerment, Public libraries, Female librarian, Spreitzer’s model

9. A09 Public library, Public library directors, Public library managers, Municipalities, Local politicians,

Multinominal logistic regression analysis

10. A10 Collaboration, Medical libraries, Collection policy, Learning environment, Library space, National repositories

11. A11 Hong Kong, Collaboration, University libraries, Access services, Library card, Personal data privacy

Berdasarkan tabel diatas dapat diketahui bahwa jurnal Library Management Vol. 36 issue 8/9 tahun 2015 memiliki 11 artikel dengan kata kunci yang berbeda-beda dari segi kata maupun jumlah. 1 artikel memiliki 8 kata kunci yaitu artikel 9.

2 artikel memiliki 7 kata kunci yaitu artikel 4 dan artikel 8. 6 artikel memiliki 6 kata kunci yaitu artikel 2, artikel 5, artikel 6, artikel 7, artikel 10,dan artikel 11.

Serta 1 artikel yang memiliki 3 kata kunci yaitu artikel 1.

4.4. Pengindekasan Menggunakan Dalil Zipf

Dalil Zipf adalah salah satu metode dalam pengindeksan subjek otomatis dengan cara memanfaatkan hasil frekuensi kemunculan kata kemudian diurutkan berdasarkan peringkat kata mulai dari kata yang memiliki peringkat tertinggi sampai ke peringkat terendah.

Langkah-langkah yang dilakukan peneliti dalam menganalisis data adalah sebagai berikut:

1. Proses Dokumen

Terlebih dahulu proses masing-masing artikel menggunakan program Microsoft Word untuk mempermudah pengelompokan kata dalam bentuk tabel. Caranya adalah sebagai berikut:

a. Artikel yang digunakan harus dalam bentuk word. Jika, ada dalam bentuk pdf maka convert lah file pdf menjadi bentuk word.

Gambar 1: Proses Convert file

b. Hapus keyword atau kata kunci dan daftar pustaka pada artikel.

Gambar 2: Proses Convert file

c. Blok seluruh kata kemudian Cari menu home klik fitur replace, kemudian akan muncul jendela find replace, pada find what tekan spasi dan pada replace input tanda koma (,) dan selanjutnya tekan replace all.

Gambar 3: Proses pemisahan kata secara otomatis

d. Blok seluruh teks, lalu buka menu insert dan pilih tabel>kemudian klik convert text to tabel selanjutnya isi jumlah kolom dengan angka 1 dan pilih separate text at dan pilih other dan input tanda koma (,) terakhir klik ok.

Gambar 4: Proses pemisahan kata kedalam bentuk tabel e. Blok seluruh tabel lalu klik home kemudian klik short, kemudian pilih

text and ascending, selanjutnya klik ok.

Gambar 5: Proses pengurutan berdasarkan abjad

f. Buang karakter kosong karena spasi, tanda-tanda, kutipan dan buang angka (bukan kata).

Gambar 6: Proses penghapusan karakter kosong sehingga pada awal tabel berisi kata “a”

2. Hitung Jumlah dan Frekuensi Kata dalam Dokumen

Setelah kata pada tabel didapatkan, maka kita memerlukan bantuan

Microsoft Excel untuk mempermudah dan mempercepat proses perhitungan kata.

Caranya adalah sebagai berikut:

a. Copy seluruh tabel yang berisi urutan kata yang sesuai pada langkah pertama, kemudian paste pada tabel atau cel yang ada di Ms.excel sesuai dengan jumlah atau banyaknya kata dengan cara klik kanan tekan paste special > klik text > kemudian ok.

Gambar 7: Proses salin data dari Microsoft Word ke Microsoft Excel b. Untuk proses perhitungan kata yang sama masukkan rumus dibawah ini

pada cel kosong

= countif (range; ""kriteria")

Gambar 8: Proses Input rumus perhitungan jumlah kata yang sama c. Masukkan rumus tersebut pada setiap cel yang ingin diketahui jumlah

katanya, setelah jumlah seluruh kata yang sama telah di dapatkan.

Selanjutnya kita copy seluruh data yang telah didapat di excel ke word.

Gambar 9: Proses salin data dari Ms. Excel ke Ms. Word

d. Kemudian blok tabel yang berisi angka-angka, kemudian klik short, pilih text and descending dan klik ok. Hapus kata-kata yang tidak memiliki keterangan jumlah kata.

Gambar 10: Proses sortir data yang memiliki keterangan angka

e. Kemudian blok tabel angka untuk di urutkan kembali, kemudian klik short, pilih text and descending dan klik ok.

Gambar 11: Proses mengurutkan data dari angka terbesar sampai terkecil

f. Setelah kata yang berisi keterangan jumlah di urutkan, kemudian tambahkan dua kolom disampingnya dan isi setiap kolom dengan keterangan Peringkat(r), Frekuensi(f), r×f, dan kata. Sehingga menghasilkan contoh tabel seperti di bawah ini.

Gambar 12: Proses menambah 2 kolom dan keterangannya

g. Copy seluruh data frekuensi dari Ms.word ke Ms.excel, kemudian Berikan peringkat dengan cara input angka 1 pada cel A1 kemudian input rumus (=A1+1) pada cel A2. Setelah itu tinggal tarik kursor ke bawah sehingga hasil peringkat telah didapatkan, kemudian hitung hasil perkalian antara peringkat dan frekuensi untuk mengisi pada kolom r×f dengan cara blok semua data ke Ms.excel kemudian masukkan rumus perkalian (=A1*B1) kemudian enter. Setelah itu tinggal tarik kursor ke bawah sehingga hasil perkalian telah didapatkan.

Gambar 13: Proses memberikan peringkat (r) serta perhitungan antara peringkat (r) × Frekuensi (f)

h. Blok hasil perkalian pada ms.excel dan pindahkan ke word serta masukkan data pada kolom r×f.

Gambar 14: Proses Salin dari excel ke word 3. Menentukan titik transisi

Cara menghitung titik transisi adalah sebagai berikut:

a. Hitung semua jumlah kata yang ada dalam dokumen (N)

Dengan cara hitung seluruh jumlah frekuensi menggunakan rumus

=SUM(B1:B1528) pada akhir cel B b. Hitung jumlah kata berbeda (In)

c. Hitung kata yang muncul satu kali atau frekuensi satu kali (I₁)

Gambar 15: Proses Menentukan titik transisi 4. Menentukan Daerah Transisi

Masukkan ke Rumus:

n = (−1 + √1 + 8I₁)/2

Setelah diperoleh angka transisi, maka tepatkan angka tersebut pada peringkat susunan kata. Dalam menentukan daerah transisi ambil 10 kata keatasnya dan 10 kata kebawahnya sesuai dengan angka transisi pada peringkat susunan kata.

𝒏 = (−𝟏 + √𝟏 + 𝟖𝐈_𝟏)/𝟐 𝒏 = (−𝟏 + √𝟏 + 𝟖 × 𝟖𝟓𝟏)/𝟐 𝒏 = (−𝟏 + √𝟏 + 𝟔𝟖𝟎𝟖)/𝟐 𝒏 = (−𝟏 + √𝟔𝟖𝟎𝟗)/𝟐 𝒏 = (−𝟏 + 𝟖𝟐, 𝟓𝟏)/𝟐 𝒏 = (𝟖𝟏, 𝟓𝟏)/𝟐

𝑛 = 40,75 𝑝𝑒𝑚𝑏𝑢𝑙𝑎𝑡𝑎𝑛 𝑘𝑒 𝑎𝑡𝑎𝑠 = 41

Gambar 15: Proses Menentukan titik transisi 5. Menentukan Indeks Dokumen

Buang kata-kata tak bermakna (stopword) pada daerah transisi sehingga meninggalkan beberapa kata yang akan menjadi indeks dokumen.

Gambar 16: Proses Penentuan Indeks Dokumen 10 Kata diatas Titik Transisi dan 10 Kata dibawah

Titik Transisi

We, At, Access, Have, Not, Group, Study, Was, IC, University, First, Been, Its, Libraries, They,

From, New, Resources, Use, which, while.

We, At, Access, Have, Not,

Group, Study, Was, IC, University, First, Been, Its, Libraries, They, From, New,

Resources, Use, which, while. Access, Group, Study, IC, University, Libraries,

Resources.

Stopword “Function words” adalah kata bantu yang tidak memiliki arti

Interpretasi

6. Interpretasi Terhadap Indeks Dokumen

Setelah indeks dokumen diperoleh, maka selanjutnya diinterpretasikan atau dinilai apakah indeks tersebut benar-benar dapat menggambarkan isi atau subjek dari artikel atau dokumen yang sebenarnya.

Gambar 17: Proses Interpretasi Indeks Dokumen 7. Merelevasi Hasil Pengindeksan

Langkah selanjutnya adalah merelevansi hasil indeks menggunakan Dalil Zipf (machine indexer) dengan hasil indeks atau keyword dari pengarang pada artikel itu sendiri.

Hasil pengindeksan pada dalil Zipf akan diberi penilaian sebagai berikut:

a. Relevan, apabila indeks yang dihasilkan dari dalil Zipf dengan kata kunci pada artikel jurnal benar-benar dan sama persis.

Indeks Dalil Zipf = Kata Kunci Artikel

b. Relevan marginal, apabila indeks yang dihasilkan memiliki kemiripan/

kesamaan.

Indeks Dalil Zipf < 𝐾𝑎𝑡𝑎 𝐾𝑢𝑛𝑐𝑖 𝐴𝑟𝑡𝑖𝑘𝑒𝑙

c. Tidak Relevan, apabila indeks yang dihasilkan sama sekali tidak memiliki kemiripan/ kesamaan.

Indeks Dalil Zipf ≠ Kata Kunci Artikel Kata Kunci Artikel

Study Access dan Accses Libraries resources

Tidak ada dalam kata Kunci Artikel tetapi dapat menggambarkan isi dari artikel

4.5. Jumlah Kata Pada Setiap Dokumen Uji dan Titik Transisinya

Masing-masing artikel memiliki jumlah kata yang berbeda diantaranya adalah sebagai berikut:

1. A01

Total Kata dalam Dokumen (N) = Jumlah seluruh frekuensi = 6105

Jumlah Kata Berbeda (I_n) = Angka terakhir peringkat = 1528

Total kata yang muncul 1 kali (I₁) = Angka terakhir peringkat − total kata yang memiliki frekuensi lebih dari 1

= 1528 − 677

= 851

Titik transisi = (−1 + √1 + 8I₁)/2

= (−1 + √1 + 8 × 851)/2

= (−1 + √1 + 6808)/2

= (−1 + √6809)/2

= (−1 + 82,51)/2

= (81,51)/2

= 40,75 pembulatan ke atas

= 41 2. A02

Total Kata dalam Dokumen (N) = Jumlah seluruh frekuensi

= 5838

Jumlah Kata Berbeda (I_n) = Angka terakhir peringkat = 1654

Total kata yang muncul 1 kali (I₁) = Angka terakhir peringkat − total kata yang memiliki frekuensi lebih dari 1

= 1654 − 677

= 1021

Titik transisi = (−1 + √1 + 8I₁)/2

= (−1 + √1 + 8 × 1023)/2

= (−1 + √1 + 8184)/2

= (−1 + √8185)/2

= (−1 + 90,47)/2

= (89,47)/2

= 44,47 pembulatan ke atas

= 45 3. A03

Total Kata dalam Dokumen (N) = Jumlah seluruh frekuensi = 5995

Jumlah Kata Berbeda (I_n) = Angka terakhir peringkat = 1097

Total kata yang muncul 1 kali (I₁) = Angka terakhir peringkat − total kata yang memiliki frekuensi lebih dari 1

= 1097 − 552

= 545

Titik transisi = (−1 + √1 + 8I₁)/2

= (−1 + √1 + 8 × 545)/2

= (−1 + √1 + 4360)/2

= (−1 + √4361)/2

= (−1 + 66,03)/2

= (65,03)/2

= 32,51 pembulatan ke atas

= 33 4. A04

Total Kata dalam Dokumen (N) = Jumlah seluruh frekuensi = 6262

Jumlah Kata Berbeda (I_n) = Angka terakhir peringkat = 1215

Total kata yang muncul 1 kali (I₁) = Angka terakhir peringkat − total kata yang memiliki frekuensi lebih dari 1 = 1215 − 589

= 626

Titik transisi = (−1 + √1 + 8I₁)/2

= (−1 + √1 + 8 × 626)/2

= (−1 + √1 + 5008)/2

= (−1 + √5009)/2

= (−1 + 70,77)/2

= (69,77)/2

= 34,88 pembulatan ke atas

= 35 5. A05

Total Kata dalam Dokumen (N) = Jumlah seluruh frekuensi = 8348

Jumlah Kata Berbeda (I_n) = Angka terakhir peringkat = 1741

Total kata yang muncul 1 kali (I₁) = Angka terakhir peringkat − total kata yang memiliki frekuensi lebih dari 1 = 1741 − 843

= 898

Titik transisi = (−1 + √1 + 8I₁)/2

= (−1 + √1 + 8 × 898)/2

= (−1 + √1 + 7184)/2

= (−1 + √7185)/2

= (−1 + 84,76)/2

= (83,76)/2

= 41,88 pembulatan ke atas

= 42 6. A06

Total Kata dalam Dokumen (N) = Jumlah seluruh frekuensi = 3192

Jumlah Kata Berbeda (I_n) = Angka terakhir peringkat = 887

Total kata yang muncul 1 kali (I₁) = Angka terakhir peringkat − total kata yang memiliki frekuensi lebih dari 1 = 887 − 406

= 481

Titik transisi = (−1 + √1 + 8I₁)/2

= (−1 + √1 + 8 × 481)/2

= (−1 + √1 + 3848)/2

= (−1 + √3849)/2

= (−1 + 62,04)/2

= (61,04)/2

= 30,52 pembulatan ke atas

= 31 7. A07

Total Kata dalam Dokumen (N) = Jumlah seluruh frekuensi = 4824

Jumlah Kata Berbeda (I_n) = Angka terakhir peringkat = 1344

Total kata yang muncul 1 kali (I₁) = Angka terakhir peringkat − total kata yang memiliki frekuensi lebih dari 1 = 1344 − 553

= 791

Titik transisi = (−1 + √1 + 8I₁)/2

= (−1 + √1 + 8 × 791)/2

= (−1 + √1 + 6328)/2

= (−1 + √6329)/2

= (−1 + 79,55)/2

= (78,55)/2

= 39,27 pembulatan ke atas

= 40 8. A08

Total Kata dalam Dokumen (N) = Jumlah seluruh frekuensi = 2523

Jumlah Kata Berbeda (I_n) = Angka terakhir peringkat = 765

Total kata yang muncul 1 kali (I₁) = Angka terakhir peringkat − total kata yang memiliki frekuensi lebih dari 1 = 765 − 312

= 453

Titik transisi = (−1 + √1 + 8I₁)/2

= (−1 + √1 + 8 × 453)/2

= (−1 + √1 + 3624)/2

= (−1 + √3625)/2

= (−1 + 60,20)/2

= (59,20)/2

= 29,6 pembulatan ke atas

= 30 9. A09

Total Kata dalam Dokumen (N) = Jumlah seluruh frekuensi

= 5085

Jumlah Kata Berbeda (I_n) = Angka terakhir peringkat = 846

Total kata yang muncul 1 kali (I₁) = Angka terakhir peringkat − total kata yang memiliki frekuensi lebih dari 1 = 846 − 423

= 423

Titik transisi = (−1 + √1 + 8I₁)/2

Dalam dokumen UNIVERSITAS SUMATERA UTARA (Halaman 19-0)