• Tidak ada hasil yang ditemukan

BAB 2 TINJAUAN PUSTAKA

N/A
N/A
Protected

Academic year: 2021

Membagikan "BAB 2 TINJAUAN PUSTAKA"

Copied!
14
0
0

Teks penuh

(1)

TINJAUAN PUSTAKA

Analisis jaringan adalah penelitian tentang graf dalam ukuran yang besar. Banyak sistem di dunia yang mengambil bentuk jaringan misalnya internet, World Wide Web(WWW), jaringan sosial atau koneksi antar individu, jaringan organisa-sional dan relasi bisnis antar perusahaan, jaringan neural, jaringan metabolisme, jaringan makanan, jaringan distribusi misalnya pembuluh darah atau rute pe-ngiriman pos, jaringan pengarang karya ilmiah dan lain-lain (Newman, 2003). Penelitian menyangkut jaringan telah banyak diteliti di permulaan abad 20, di-mana paling banyak didominasi oleh ahli matematika dan peneliti ilmu sosial yang telah menuntun kepada perkembangan saat ini dimana subjek yang semakin luas dan berbeda-beda beberapa diantaranya biologi, ekologi, ekonomi, ilmu komputer dan fisika.

Jaringan sosial memegang peranan yang sentral dalam kegiatan sehari-hari, dalam fenomena sosial, dalam kehidupan ekonomi dan politik. Oleh karena itu penting untuk memberikan analisis lengkap dari struktur jaringan sosial dan meneliti pengaruh yang mungkin diberikan pada perilaku manusia.

Dalam analisis jaringan sosial, jaringan dikategorikan oleh sifat dasar dari himpunan aktor dan properti relasi antara aktor-aktor tersebut. Aktor atau en-titas dapat merupakan tipe dari variasi individu, organisasi atau koleksi atau kumpulan dari orang atau organisasi. Koleksi dari orang misalnya grup ma-hasiswa yang menghadiri kuliah yang sama dan kumpulan organisasi misalnya himpunan negara bagian.

Mode dari jaringan didefinisikan sebagai jumlah tipe aktor atau entitas yang variabel strukturalnya (relasi) diukur. Variabel struktural diukur dalam pasangan-pasangan entitas. Jika pasangan entitas adalah himpunan tunggal, jaringan ini disebut dengan relationship atau one-mode network. Jika variabel strukturalnya diukur dalam dua himpunan entitas, disebut sebagai affiliation atau two-mode network. Two-mode network terdiri dari dua himpunan entitas yang berbeda atau himpunan aktor dan himpunan kejadian. Dalam kasus per-tama, jaringan disebut dyadic network dan link antara dua aktor dari himpunan berbeda menyatakan relasi antara kedua aktor (Wasserman dan Faust, 1994).

(2)

2.1 Analisis Jaringan Sosial

Social Networks Analysis (SNA) mulai berkembang sekitar tahun 1920 an dan berfokus pada hubungan antara entitas sosial, misalnya komunikasi antara anggota suatu grup, perdagangan antar negara atau transaksi ekonomi antara perusahaan (Boccaletti, et al. 2005).

Dalam ilmu sosial, analisis jaringan memiliki tradisi yang panjang. Tu-juan utama analisis jaringan sosial adalah mendeteksi dan menginterpretasikan pola dari relasi sosial antara aktor. Namun, akhir-akhir ini bidang ini juga se-makin populer di banyak area penelitian seperti immunulogy, sistem transportasi, biologi molekular, sistem informasi, sistem komputer dan lain-lain. Meskipun do-main dari aplikasi adalah menetapkan bentuk analisis yang tepat, metode yang umum dalam analisis jaringan dapat dibedakan berdasarkan level analisis. Ana-lisis jaringan dapat dilakuakan dalam tiga level yaitu, elemen-level, group-level dan network-level.

Dalam element-level analysis, memberi penekanan pada analisis properti dari individual node atau link. Misalnya dalam mesin pencarian yang mana mencoba halaman penting diantara interlink dalam website. Dalam goup-level analysis, korelasi antara node dianalisis secara khusus, salah satunya menyelidiki tentang properti grup dari node atau link. Dalam network level analysis, pro-perti graf dianalisis secara keseluruhan. Network level analysis digunakan untuk membedakan antara tipe network yang berbeda, dan menetapkan pengertian yang bernilai dan mengimplementasikannya ke dalam algoritma.

Beberapa dekade terakhir muncul penelitian-penelitian tentang complex net-works yakni jaringan dengan struktur yang irreguler, kompleks dan secara dinamis berkembang atas waktu, dengan fokus utama bergerak dari analisis jaringan yang kecil ke sistem dengan ribuan bahkan jutaan node, dan memperbaharui perha-tian kepada properti jaringan yang dinamis. Hal ini tiba-tiba dicetuskan dalam 2 paper yang selanjutnya sangat berkembang oleh Watts dan Strogatz dalam Small-World Networks yang muncul dalam Nature 1998 dan oleh Barabasi dan Albert dalam Scale-Free Networks muncul setahun kemudian dalam Science, telah terli-hat secara fisik komunitas antar aktor, dan secara pasti meningkatkan kekuatan kumputasional yang memungkinkan meneliti banyak properti dari database yang sangat besar dari jaringan nyata (real networks). Diantaranya jaringan

(3)

trans-portasi, jaringan telepon, internet dan World Wide Web, kolaborasi aktor dalam database perfilman, kolaborasi penulisan karya ilmiah (scientific coauthorship) dan lain-lain.

2.2 Representasi Jaringan

Jaringan dapat direpresentasikan dengan dua cara yaitu sebagai matriks dan graf. Didalam matriks baris dan kolom berkorespondensi dengan aktor/entitas, matriks akan bujursangkar untuk one-mode network, dan persegi panjang untuk two-mode network. Entri sel mengandung nilai link hubungan yang menghubung-kan aktor/entitas, jadi sel yang ke(i, j) merepresentasimenghubung-kan hubungan dari aktor i ke aktor j. Matriks ini disebut juga dengan adjacency matrix.

Adjacency matrix merupakan cara yang paling sedehana untuk merepresen-tasikan jaringan. Misalkan diasumsikan terdapat n verteks dalam jaringan, yang terhubung satu sama lain dengan m edge, selanjutnya misalkan edge tidak be-rarah. Dapat dispesifikasikan secara lengkap struktur hubungan dalam jaringan dengan matriks A dengan ordo nxn yang elemen-elemennya:

Aij =

( 1, jika terdapat suatu sisi menghubungkan i, j 0, jika tidak ada

Jaringan biasanya dimodelkan sebagai graf. Suatu graf G = (V, E) adalah suatu objek dimana V menotasikan himpunan verteks(titik), E menyatakan him-punan edge (sisi) yang menghubungkan pasangan verteks . Sisi tak berarah yang menghubungkan titik u, v ∈ V yang dinotasikan dengan (u, v). Dalam ilmu jaring-an verteks biasjaring-anya disebut dengjaring-an node atau aktor sedjaring-angkjaring-an edge disebut link atau relasi.

Suatu graf G0 = (V0, E0) adalah subgraf dari graf G = (V, E) jika V0 ⊆ V

dan E0 ⊆ E. Subgraf disebut induced subgraph jika E0 mengandung semua sisi

e ∈ E yang menghubungkan titik-titik dalam V0.

Relasi dalam suatu jaringan dapat merupakan relasi berarah, misalnya ek-sport/import barang antar negara, panggilan telepon atau pesan email antar in-dividu dan lain-lain. Relasi ini dapat direpresentasikan dengan graf berarah (di-rected graph) yang biasa disebut dengan digraph. Suatu digraph G umumnya didefinisikan sebagai G = (V, A) dimana V adalah himpunan berhingga verteks dan A adalah himpunan arcs yang menghubungkan verteks yang berbeda.

(4)

Gambar 2.1 Tipe jaringan

Himpunan verteks yang disatukan oleh edge adalah tipe sederhana dari jaringan. Jaringan bisa saja lebih kompleks karena verteks itu mungkin saja lebih dari satu tipe berbeda dalam jaringan dan lebih dari satu tipe edge yang berbeda (Gambar 2.1).

Walk dari v1 ke vk dalam graf tak berarah G = (V, E) adalah barisan

alter-nating dari titik-titik dan sisi v1, e1, v2, e2, v3, ..., ek−1, vk, dimana ei = (vi, vi+1),

yang mana setiap titik adalah insiden dengan sisi yang mengikuti dan mendahu-luinya dalam barisan itu. Panjang dari walk ini didefinisikan oleh jumlah sisi dalam barisan itu. Path P adalah walk dimana semua titik dan semua sisi adalah berbeda: ei 6= ej dan vi 6= vj untuk i 6= j. Suatu path p dari u ke v dalam

graf G = (V, E) adalah path terpendek(shortest path) atau geodesic jika bobotnya w(p) adalah bobot terkecil yang mungkin diantara semua path dari u ke v, di-mana w(p) didefinisikan sebagai jumlah semua bobot sisi pada p. Panjang d(u, v) dari path terpendek disebut shortest-path distance atau geodesic distance. Jika tidak ada path terpendek antara dua titik maka jarak antara mereka adalah tak terhingga.

Suatu graf tak berarah G = (V, E) adalah terhubung (connected) jika ter-dapat path yang melalui semua pasangan titik, dengan kata lain setiap titik da-pat dicapai dari setiap titik lain. Graf yang tidak terhubung disebut disconnec-ted. Subgraf yang terhubung dalam graf disebut komponen-komponen (compon-nents). Komponen dalam graf adalah subgraf yang terhubung maksimal. Kom-ponen terhubung (connected comKom-ponent) dari G = (V, E) adalah induced subgraph

(5)

G0 = (V0, E0) yang maksimal yang artinya tidak ada subgraf yang terhubung.

G00 = (V00, E00) dengan V00 ⊃ V0. Dengan perkataan lain, komponen terhubung

adalah suatu subgraf dimana terdapat path antara semua pasangan titik dan tidak ada path antara sisi dalam komponen dan tidak ada titik dalam komponen.

2.3 Properti Jaringan

Peneliti selama beberapa tahun terakhir telah mengidentifikasi properti-properti jaringan yang dapat ditemukan dalam banyak jaringan nyata dari do-main yang beragam. Properti yang mempunyai peranan dalam pencarian pola adalah distribusi derajat(degree distribution) dan diameter kecil(small diameter). Selanjutnya dalam bagian ini akan dikaji juga properti-properti lain dari suatu jaringan yaitu derajat node, derajat rata-rata, densitas, diameter, dan sentralitas.

2.4 Derajat Node dan Derajat Rata-rata (Average Degree)

Properti kunci dari setiap node dalam jaringan adalah derajatnya. Derajat dari node dinotasikan sebagai ki (derajat node ke-i dalam jaringan) adalah

jum-lah link yang insiden dengan node tersebut atau dengan kata lain derajat adajum-lah banyaknya node yang adjacent dengan node itu. Misalkan n adalah jumlah node dalam suatu jaringan tak berarah maka jumlah total dari link L dapat diekspre-sikan sebagai jumlah derajat node-node nya.

L = 1 2 n X i=1 ki (2.1)

Derajat rata-rata node < k > dalam suatu jaringan (average degree) dinyatakan dengan: < k >= 1 n n X i=1 ki = 2L n (2.2)

Di dalam jaringan berarah terdapat in-degree (derajat masuk) kin

i yaitu banyaknya

link yg menuju node tersebut dan out-degree (derajat keluar) kout

i adalah banyaknya

link menuju keluar dari node tersebut. Total link dalam jaringan berarah adalah: L = n X i=1 kin= n X i=1 kout (2.3)

(6)

Pada persamaan (2.3) tidak menggunakan faktor 1/2 seperti persamaan (2.1) karena menghitung derajat masuk dan derajat keluar secara terpisah. Derajat rata-rata jaringan berarah adalah

(kin) = 1 n n X i=1 kiin = kout = 1 n n X i=1 kiout = L n (2.4)

2.5 Jarak, Diameter dan Average Path Length

Dalam sistem fisik komponen dikategorikan berdasarkan jarak (distance) yang jelas, seperti jarak antara dua atom dalam kristal, atau antara dua galaksi dalam jagat raya. Dalam jaringan jarak adalah suatu konsep yang menantang. Apa yang dimaksud engan jarak antara dua halaman web dalam WWW, atau dua individu yang mungkin saling mengenal atau tidak saling mengenal? Jarak fisik tidak relevan disini, dua halaman web terhubung satu sama lain mungkin oleh dua orang yang berada di belahan dunia yang berbeda atau mungkin oleh dua orang yang berada di gedung yang sama tapi tidak saling mengenal satu sama lain. Dalam jaringan jarak fisik digantikan dengan path length (panjang path), dimana panjang path adalah banyaknya link yang dimiliki oleh path tersebut (Barabasi, 2012).

Shortest path atau geodesic path antara node i dan j adalah path dengan jumlah link yang paling sedikit. Shortest path sering juga disebut sebagai jarak (distance) antara node i dan j yang disimbolkan dengan d(i, j) atau dij. Jika

tidak ada path antara node, jarak antara mereka adalah tak terhingga. Konsep ini menuntun kepada karakteristik penting lain dalam jaringan yaitu diameter. Diameter (dmax) adalah shortest path maksimum antara dua node dalam jaringan.

Dengan perkataan lain ketika panjang semua shortest path dari setiap node ke semua node dihitung, diameter adalah shortest path terpanjang.

dmax := max{d(u, v) | u, v ∈ V } (2.5)

Diameter suatu graf penting karena mengukur seberapa jauh terpisah atau jarak dua node tejauh dalam suatu graf. Misalkan dalam jaringan komunikasi dimana link transmisi pesan. Difokuskan pada pengiriman pesan diantara semua pasa-ngan node. Selanjutnya asumsikan pesan selalu mencari rute terpendek (melalui geodesic), dijamin bahwa pesan dapat melalui satu node ke node yang lain, atas path dengan panjang yang tidak lebih dari diameter graf.

(7)

Average path length (rata-rata path) antara node disimbolkan dengan < d > adalah rata-rata jarak antara semua pasangan node dalam jaringan. Untuk jaringan tak berarah dengan n buah node, diberikan oleh:

< d >= 2 n(n − 1)

X

i,j=1,n

di,j (2.6)

2.6 Densitas Graf dan Subgraf

Derajat adalah suatu konsep yang menganggap jumlah sisi yang insiden dengan setiap node dalam graf. Dapat juga dianggap jumlah dan perbandingan dari sisi dalam graf secara keseluruhan. Suatu graf dapat memiliki banyak sisi tapi jumlah maksimum yang mungkin ditentukan oleh jumlah node dalam graf tersebut. Misalkan terdapat n buah node dalam suatu graf (tanpa loop) maka terdapat kemungkinan pasangan tidak terurut node, sehingga n(n − 1)/2 adalah banyak sisi yang mungkin dalam graf tersebut.

Densitas adalah perbandingan dari banyak sisi yang ada pada suatu graf (L) dengan jumlah maksimum yang mungkin sisi dari graf tersebut. Jika densitas dilambangkan dengan 4 maka dapat dihitung sebagai:

4 = L

n(n − 1)/2 = 2L

n(n − 1) (2.7)

densitas bernilai terendah 0 yaitu jika L = 0 dan tertinggi bernilai 1 yaitu jika banyaknya sisi/garis yang ada sama dengan banyaknya maksimum yang mungkin n(n − 1)/2.

Jika setiap sisi ada, maka setiap node disebut adjacent dan graf dikatakan komplit (complete). Suatu graf komplit dengan g buah node biasanya dinotasikan dengan Kn. Graf komplit mengandung semua n(n − 1)/2 sisi yang mungkin,

dengan densitas sama dengan 1, dan semua derajat node sama dengan n − 1. Terdapat hubungan langsung antara densitas graf dan rata-rata derajat node dalam graf. Telah diketahui bahwa jumlah derajat sama dengan 2L sehingga diperoleh:

4 = d

(n − 1) (2.8)

dengan kata lain densitas graf adalah proporsi rata-rata dari insiden garis dengan node.

Densitas dari subgraf dapat juga didefinisikan sebagai jumlah sisi yang ada dalam subgraf tersebut dibagi dengan jumlah garis yang mungkin muncul dalam

(8)

subgraf. Misalkan dinotasikan jumlah node dalam subgraf Gs adalah ns, dan

jumlah sisi dalam subgraf sebagai Ls. Jumlah sisi yang mungkin dalam suatu

subgraf adalah sama dengan ns(ns− 1)/2. Sehingga densitas dari subgraf dapat

dihitung sebagai:

4s =

2Ls

ns(ns− 1)

(2.9) densitas dari subgraf menyatakan proporsi ikatan yang muncul diantara subset aktor dalam suatu jaringan.

2.7 Sentralitas (Centrality) dan Wibawa (Prestige)

Konsep sentralitas menangkap tentang menonjol atau tidaknya suatu node dalam jaringan. Sentralitas adalah ukuran dalam graf yang digunakan dalam ana-lisis jaringan untuk menemukan struktur penting dari node dan edge. Sentralitas umumnya menetapkan pentingnya suatu node hanya berdasarkan struktur graf. Definisi yang paling sederhana dari sentralitas node adalah bahwa node sentral haruslah node yang paling aktif atau node yang memiliki ikatan paling banyak dengan node lain dalam jaringan. Misalkan dalam suatu organisasi seseorang de-ngan hubude-ngan atau komunikasi yang ekstensif dede-ngan banyak orang lain dalam organisasi dinilai lebih penting daripada orang lain dengan kontak yang lebih sedikit. Sentralitas adalah ukuran dalam level node sedangkan sentralisasi adalah ukuran dalam level jaringan.

Ada empat ukuran dalam sentralitas yang digunakan secara luas dalam ana-lisis jaringan yaitu: derajat sentralitas (degree centrality), keantaraan(betweenness), kedekatan(closeness), dan eigenvector centrality.

Derajat sentralitas didefinisikan sebagai jumlah link yang incident atas suatu node (jumlah ikatan yang dimiliki node). Degree centrality CD(v) dari verteks u

dalam graf tak berarh G = (V, E) didefinisikan sebagai: CD(v) = deg(u). Untuk

graf G(V, E) dengan n verteks, derajat sentralitas CD(v) untuk verteks v adalah:

CD(v) =

deg(v)

n − 1 (2.10)

Perhitungan derajat sentralitas diatas membutuhkan waktu kompleksiti O(| E |). Jumlah sentralitas berasal dari definisi dasar dari shortest path antara pasa-ngan verteks. Misalnya Closeness Centrality, terdekat berdasarkan jumlah jarak terpendek terhadap verteks-verteks yang lain. Contoh nyata dalam pemilihan

(9)

lokasi yang cocok untuk mall dalam suatu kota dengan tujuan meminimumkan jarak para konsumen. Oleh karena itu closeness centrality cC(u) untuk verteks u

didefinisikan sebagai: cC(u) = 1 P v∈V d(v, u) (2.11)

Perhitungan closeness centrality menjadi aplikasi sederhana dari algoritma all pairs shortest path (APSP), yang memiliki algoritma standart seperti algoritma Floyd-Warshall yang memiliki waktu kompleksiti O(| V |3) (Floyd, 1962).

Sama halnya dengan Closeness Centrality, Betweennes Centrality menandai pentingnya verteks berdasarkan jumlah shortest path yang melalui nya. Jika ada dua node yang saling berdekatan, yaitu v dan w, ingin berinterkasi dan node u berada pada lintasan hubungan antara v dan w, maka u memiliki kontrol terhadap interaksi keduanya dan betweennes mengukur kontrol tersebut. Jika u berada pada lintasan dari beberapa interaksi maka u adalah sebuah node yang penting atau berpengaruh. Secara matematis betweennes centrality cB(u) dari verteks u adalah

cB(u) = X s∈V X t∈V σst(u) σst (2.12) dimana σst adalah jumlah shortest path antara s dan t dan σst(u) adalah jumlah

shortest path antara s dan t dimana terdapat u didalamnya.

Untuk menghitung betwenees centrality dapat mengikuti modifikasi seder-hana dari algoritma Dijkstra untuk menemukan sumber tunggal shortest path antara pasangan verteks. Proses ini membutuhkan total waktu O(| V |3).

Se-lanjutnya fakta bahwa verteks v berada dalam shortest path antara s dan t jika dan hanya jika d(s, t) = d(s, v) + d(v, t) dan dalam kasus ini jumlah shortest path yang melalui u, diperoleh dari perkalian jumlah shortest path antara s, v dan v, t ekivalen dengan σst = σsvσvt. Fakta ini menyiratkan bahwa menghitung cB(u)∀u

dalam waktu kompleksiti O(| V |3) secara keseluruhan.

Betwennes centrality cB dapat dihitung untuk setiap verteks dalam suatu graf

berbobot G = (V, E) dalam O(| V || E | + | V |2 log | V |)

Prestige(martabat/wibawa) merupakan suatu pengukuran yang lebih halus terhadap peran seorang aktor dibandingkan dengan pengukuran centrality. Mi-salkan dapat bedakan ikatan yang diberikan dan ikatan yang diterima seperti

(10)

relasi berarah. Seorang aktor yang prestige adalah aktor yang memiliki ikatan sebagai penerima (in-links). Perbedaan utama antara centrality dengan prestige adalah centrality fokus pada out-links sementara prestigue fokus pada in-links.

2.8 Distribusi Derajat(Degree Distribution)

Distribusi derjat (pk) adalah probabilitas node yang terpilih secara

ran-dom dalam jaringan dengan derajat k. Karena (pk) adalah probabilitas, maka

P∞

k=1(pk) = 1. Untuk jaringan tetap dengan n node, derajat distribusinya adalah

histogram normalisasi dengan pk = nnk dimana nk adalah jumlah derajat dari k

buah node. Oleh sebab itu jumlah derajat node dapat diperoleh dari distribusi derajat selama nk = npk. Distribusi derajat mempunyai peran sentral dalam teori

jaringan karena banyak perhitungan dalam jaringan yang mengharuskan untuk mengetahui nilai pk. Misalnya derajat rata-rata jaringan dapat ditulis sebagai

< k >= ∞ X k=0 kpk (2.13) 2.9 Clustering

Salah satu cara untuk menemukan himpunan verteks yang saling berkolerasi adalah dengan mempartisi graf. Partisi yang efektif selanjutnya akan menjadikan entitas dalam grup yang sama lebih berkolerasi satu sama lain daripada entitas antar grup yang berbeda. Clustering dapat menyajikan sembarang divisi atau verteks.

Misalkan G = (V, G) adalah graf tak berarah. Suatu cluster Ci ⊆ V

adalah himpunan bagian tak kosong dari verteks-verteks. Suatu clustering ζ = {C1, ..., Ck} dari G adalah partisi dari semua verteks kedalam cluster Ci.

Him-punan E(Ci, Cj) terdiri atas semua sisi yang titik asalnya Ci dan titik

tujuan-nya dalam Cj.E(Ci) adalah himpunan sisi yang memiliki titik asal dan tujuan

dalam Ci. E(ζ) := Ski=1E(Ci) adalah himpunan sisi intra-cluster dan E(ς) :=

E\E(ς)himpunan sisi inter-cluster. Jumlah dari sisi intra-cluster dinotasikan de-ngan m(C) dan jumlah inter-cluster oleh m(C). Suatu cluster Ci diidentifikasi

(11)

Kualitas suatu clustering ditentukan berdasarkan nosi densitas node dalam suatu cluster dan nosi kejarangan anatara cluster yang berbeda. Kualitas ini didefinisikan berdasarkan dua fungsi pembantu. Misal A(G) adalah himpunan dari semua clustering yang mungkin dari G, dan misalkan f dan g adalah fungsi yang mengukur densitas didalam cluster dan kejarangan antara cluster secara berturut-turut sehingga;

f, g : A(G) → R+∪ {0} (2.14)

Selanjutnya indeks kualitas dari clustering ζ didefinisikan sebagai: index(ζ) = f(ζ) + g(ζ)

max{f(ζ0) + g(ζ0) : ζ0 ∈ A(G)} (2.15)

Sebagian besar clustering trivial yakni partisi kedalam himpunan tunggal dan partisi kedalam hanya satu himpunan, akan memaksimumkan fungsi utili-tas. Idealnya akan dicari clustering non trivial yang juga memaksimumkan fungsi utilitas, atau semaksimum mungkin. Beberapa cara memodelkan fungsi f, g dan clustering yang diperoleh.

Cara yang paling dasar untuk membagi graf ke dalam cluster dengan memak-simumkan bobot cluster edge. Coverage κ(ζ) mengukur bobot dari sisi intra-cluster, dibandingkan dengan bobot semua sisi yakni:

f(ζ) = X

e∈E(ζ)

w(e), g ≡ 0 (2.16)

Nilai maksimum dari indeks coverage adalah ketika tidak di cluster sama sekali, atau ketika sisinya intra-cluster. Oleh karena itu nilai kualitas diberikan oleh:

κ(ζ) = P e∈E(ζ)w(e) P e∈Ew(e) (2.17)

Indeks performance mengkombinasikan dua fungsi untuk mengukur densi-tas f dan kejarangan g, mengobservasi semua pasangan node. Suatu pasangan node mungkin meningkatkan densitas cluster jika kedua node tersebut dalam satu cluster dan terhubung oleh sustu sisi(termasuk dalam f) atau meningkatkan ke-jarangan dari sisi inter-cluster jka kedua node terletak dalam cluster yang berbeda dan tidak terhubung oleh suatu sisi(termasuk dalam g). Dalam kedua situasi ini paradigma densitas intra-cluster dan kejarangan inter-cluster dipenuhi.

(12)

f(ζ) := k X i=1 w(E(Ci)) (2.18) dan g(ζ) := (X u,v∈V M.[(u, v) 6∈ E].[u ∈ Ci, v ∈ Cj, i 6= j]) (2.19)

2.10 Koefisien Clustering dan Transitifitas

Dalam banyak jaringan ditemukan bahwa jika verteks A terhubung dengan verteks B dan verteks B dengan verteks C, sehingga mempertinggi probabilitas bahwa verteks A akan terhubung dengan verteks C. Dalam bahasa jaringan sosial, teman dari temanmu kemungkinan akan menjadi temanmu.

Definisi: 2.10 Misalkan suatu node i yang memiliki ki tetangga, dan

terdap-at ni edge diantara tetangga-tetangga nya. Selanjutnya koefisien clustering dari

i didefinisian sebagai: Ci =    ni ki ki > 1 0 ki = 0 atau 1 (2.20)

jadi persamaan diatas mengukur derajat transitifitas suatu graf, semakin tinggi nilainya mengimplikasikan bahwa teman dari teman kemungkinan besar dengan sendirinya akan menjadi teman, hal ini menuntun kepada struktur graf. Sebagai contoh perhatikan Gambar 2.2.

Gambar 2.2 Clustering Coefficient. Node X memiliki kX = 6 tetangga. Terdapat

hanya nX = 5 edge antar tetangga. Sehingga Clustering coefficient

(13)

Dalam istilah topologi jaringan, transitifitas berarti kehadiran segitiga dalam jumlah besar dalam jaringan, himpunan dari 3 verteks yang terhubung satu sama lain. Ini dapat diukur dengan mendefinisikan koefisien clustering C.

C = 3x jumlah segitiga dalam jaringan

jumlah connected triple dari verteks (2.21)

dimana ”connected triple” terdiri dari 3 verteks yang terhubung oleh 2 atau 3 sisi tak berarah. Misalnya, suatu segitiga A, B, C membuat 3 triple ABC, BCA, dan CAB. Sebaliknya rantai dari node A, B, C yang terhubung dimana B terhubung dengan A dan C namun A tidak terhubung dengan C yaitu membentuk triplet tunggal terbuka. Faktor pengali 3 pada pembilang persamaan diatas menunjukkan fakta bahwa setiap segitiga dihitung tiga kali dalam perhitungan triple.

Salah satu teknik clustering adalah melibatkan graf partisi: Graf dipecah menjadi dua partisi atau komunitas yang kemudian dapat mempartisi dirinya sendiri. Beberapa ukuran berbeda dapat dioptimisasikan ketika graf dipartisi.

Clustering data secara umum adalah untuk menemukan grup homogen di-mana kesamaan dalam grup diminimumkan dan kesamaan antar grup dimaksi-malkan. Dalam (Han dan Kamber, 2006) metode clustering untuk data statis di-klasifikasikan kedalam 5 kategori utama, metode partisi, metode hirearki, metode berdasarkan densitas, dan metode berdasarkan grid dan model.

Metode partisi membangun k partisi data. Partisi ini rapuh jika sebagian dan setiap objek dalam dataset diijinkan dalam hanya satu partisi. Namun dalan partisi fuzzy suatu objek dapat menjadi lebih dari satu partisi dengan probabilitas yang beragam.

2.11 Clique

Clique dalam suatu graf tak berarah adalah himpunan bagian dari titik sehingga setiap dua titik dalam suatu subset terhubung oleh sebuah sisi. Misalkan suatu graf tak berarah G = (V, E) dan graf G1 = (V1, E1) disebut suatu subgraf

dari G, jika V1 ⊂ V , E1 ⊂ E dan untuk setiap sisi (vi, vj) ∈ E1, titik-titik

vi, vj ∈ V . Suatu subgraf G1 disebut komplit, jika terdapat suatu sisi untuk setiap

pasangan titik. Faktanya, clique adalah subgraf komplit, yang berarti bahwa di dalam clique, setiap anggotanya mempunyai ikatan langsung satu sama lain atau

(14)

antar titik.

Suatu clique dikatakan maksimal, jika tidak mengandung clique yang lain. Jumlah clique dalam suatu graf sama dengan kardinalitas dari clique terbesar dalam sutu graf G dan diperoleh dengan menyelesaikan maksimum clique dari masalah NP-hard.

Gambar

Gambar 2.1 Tipe jaringan
Gambar 2.2 Clustering Coefficient. Node X memiliki k X = 6 tetangga. Terdapat hanya n X = 5 edge antar tetangga

Referensi

Dokumen terkait

Hasil dari penelitian ini adalah sebuah karya berupa aplikasi yang memuat konten-konten lokal dari Kotamobagu, dimana aplikasi ini memanfaatkan Firebase sebagai

Maka apabila pengkajian sosial-humaniora diatas berkaitan dengan studi dakwah dan pendidikan Islam maka perbedaan mendasar pada penelitian ini adalah merupakan

Berdasarkan realisasi Anggaran Pendapatan dan Belanja Daerah (APBD), menunjukan bahwa kemampuan keuangan yang berasal PAD dalam memberikan kontribusi terhadap APBD

CCCTC-binding factor atau biasa disingkat dengan CTCF adalah protein yang memiliki banyak fungsi, di antaranya adalah sebagai insulator kromatin dan organisasi

Suspensi pati yang telah diasamkan tersebut kemudian dimasukkan ke dalam alat hidrolisis dan dihidrolisis dengan konsentrasi asam dan waktu hidrolisis yang bervariasi Tahap analisis

Berdasarkan latar belakang yang telah diuraikan diatas, peneliti dapat merumuskan masalah sebagai berikut : “Apakah Pendekatan Saintifik Dengan Penggunaan Media

lansia yang depresi lebih banyak memperlihatkan kurangnya semangat dan minat serta lebih memilih untuk berdiam diri di dalam wisma atau panti daripada melakukan kegiatan dan

Bahwa Rekomendasi Panwaslu Kabupaten Jayapura bersifat segera sehingga Termohon menindak lanjutinya dengan Surat Keputusan Komisi Pemilihan Umum Kabupaten Jayapura