You are on page 1of 37

Some Graph Based Models

Problem Solving
 Clustering
 Summarization
 Decision Support System
 Scheduling
 Network Optimization

2
A Data Clustering
 Semakin banyaknya data semakin banyak
pula informasi yang dapat diperoleh.
 Bagaimana cara menggali informasi dari
data.
  Clustering

3
Ilustrasi Sistem
Data
Mentah

data2
data3
cluster1
data1
data4
data5

data10
data6
cluster3 data11
cluster2
data7
data13
data9 data12
data8

 Mengubah data mentah menjadi graf.


 Correlation Coefficient  Threshold.
4
Threshold and Clique
 Coefficient Correlation

XY  X Y
cx, y 
 X  Y
2 2 2 2
X Y

 Maximal clique pada sebuah graf digunakan


algoritma Bron – Kerbosch.

5
Data Mentah

 Jika terdapat sekumpulan data penjualan


(data sampel) pada 5 hari penjualan dan
terdapat 10 buah ITEM :

6
TANGGAL ITEM QT Y SATUAN TOTAL TANGGAL ITEM QT Y SATUAN TOTAL
2006-01-02 JC0000733 18 PCS 8855 159390 2006-01-02 JC0000746 3 PCS 13915 41745
2006-01-03 JC0000733 18 PCS 8855 159390 2006-01-03 JC0000746 3 PCS 13915 41745
2006-01-04 JC0000733 3 PCS 8855 26565 2006-01-04 JC0000746 1 PCS 13915 13915
2006-01-05 JC0000733 30 PCS 8855 265650 2006-01-05 JC0000746 3 PCS 13915 41745
2006-01-06 JC0000733 3 PCS 8855 26565 2006-01-06 JC0000746 13 PCS 13915 180895
2006-01-02 JC0000735 8 PCS 10120 80960 2006-01-02 JC0000748 15 PCS 15180 227700
2006-01-03 JC0000735 8 PCS 10120 80960 2006-01-03 JC0000748 15 PCS 15180 227700
2006-01-04 JC0000735 11 PCS 10120 111320 2006-01-04 JC0000748 33 PCS 15180 500940
2006-01-05 JC0000735 4 PCS 10120 40480 2006-01-05 JC0000748 15 PCS 15180 227700
2006-01-06 JC0000735 4 PCS 10120 40480 2006-01-06 JC0000748 2 PCS 15180 30360
2006-01-02 JC0000738 7 PCS 11385 79695 2006-01-02 JC0000751 1 PCS 16445 16445
2006-01-03 JC0000738 7 PCS 11385 79695 2006-01-03 JC0000751 1 PCS 16445 16445
2006-01-04 JC0000738 4 PCS 11385 45540 2006-01-04 JC0000751 10 PCS 16445 164450
2006-01-05 JC0000738 3 PCS 11385 34155 2006-01-05 JC0000751 9 PCS 16445 148005
2006-01-06 JC0000738 3 PCS 11385 34155 2006-01-06 JC0000751 20 PCS 16445 328900
2006-01-02 JC0000739 1 PCS 11385 11385 2006-01-02 JC0000755 5 PCS 8855 44275
2006-01-03 JC0000739 1 PCS 11385 11385 2006-01-03 JC0000755 5 PCS 8855 44275
2006-01-04 JC0000739 5 PCS 11385 56925 2006-01-04 JC0000755 8 PCS 8855 70840
2006-01-05 JC0000739 6 PCS 11385 68310 2006-01-05 JC0000755 5 PCS 8855 44275
2006-01-06 JC0000739 29 PCS 11385 330165 2006-01-06 JC0000755 42 PCS 8855 371910
2006-01-02 JC0000741 8 PCS 12650 101200 2006-01-02 JC0000757 1 PCS 10120 10120
2006-01-03 JC0000741 8 PCS 12650 101200 2006-01-03 JC0000757 1 PCS 10120 10120
2006-01-04 JC0000741 1 PCS 12650 12650 2006-01-04 JC0000757 18 PCS 10120 182160
2006-01-05 JC0000741 19 PCS 12650 240350 2006-01-05 JC0000757 17 PCS 10120 172040
2006-01-06 JC0000741 5 PCS 12650 63250 2006-01-06 JC0000757 48 PCS 10120 485760
Correlation Coefficient

JC0000733 JC0000735 JC0000738 JC0000739 JC0000741 JC0000746 JC0000748 JC0000751 JC0000755 JC0000757

JC0000733 1.00E+00 -8.88E-01 -2.34E-02 -8.43E-01 9.66E-01 2.46E-01 6.81E-02 -7.00E-01 -8.31E-01 -6.94E-01

JC0000735 -8.88E-01 1 -7.29E-02 6.03E-01 -9.68E-01 -6.00E-01 3.37E-01 7.04E-01 5.06E-01 6.90E-01

JC0000738 -2.34E-02 -7.29E-02 1 -3.42E-01 1.22E-01 6.53E-01 -6.66E-01 -6.96E-01 3.54E-01 -7.04E-01

JC0000739 -8.43E-01 6.03E-01 -3.42E-01 1 -7.81E-01 -1.63E-01 -1.13E-01 8.35E-01 7.56E-01 8.40E-01

JC0000741 9.66E-01 -9.68E-01 1.22E-01 -7.81E-01 1 4.85E-01 -1.90E-01 -7.87E-01 -6.59E-01 -7.77E-01

JC0000746 2.46E-01 -6.00E-01 6.53E-01 -1.63E-01 4.85E-01 1 -9.50E-01 -6.66E-01 3.33E-01 -6.55E-01

JC0000748 6.81E-02 3.37E-01 -6.66E-01 -1.13E-01 -1.90E-01 -9.50E-01 1.00E+00 4.51E-01 -6.10E-01 4.42E-01

JC0000751 -7.00E-01 7.04E-01 -6.96E-01 8.35E-01 -7.87E-01 -6.66E-01 4.51E-01 1 3.28E-01 1.00E+00

JC0000755 -8.31E-01 5.06E-01 3.54E-01 7.56E-01 -6.59E-01 3.33E-01 -6.10E-01 3.28E-01 1 3.28E-01

JC0000757 -6.94E-01 6.90E-01 -7.04E-01 8.40E-01 -7.77E-01 -6.55E-01 4.42E-01 1.00E+00 3.28E-01 1.00E+00
Threshold  Graf
 Menggunakan 9

threshold 0.05 maka 8 10

diperoleh graf di
samping : 2 1

3 5

7 6

9
Threshold Analysis
160
140
Jumlah Klaster

120
100
80 Jumlah Klaster
60
40
20
0
0.1 0.15 0.2 0.3 0.35 0.36 0.4 1
Threshold

 Hasil percobaan perubahan threshold terhadap jumlah


klaster yang dihasilkan
10
Threshold Analysis (2)
16
14
Maximum Clique

12
10
8 Series1

6
4
2
0
0.01 0.05 0.1 0.15 0.2 0.3 0.35 0.36 0.4 0.5 1

Threshold

 Hasil percobaan perubahan threshold terhadap


maximum clique yang dihasilkan
11
Text Summarization
Kebutuhan akan informasi semakin meningkat
Ada kemungkinan orang tidak dapat membaca semua
Data/Berita tersebut

Peringkas Teks
Otomatis

Memperoleh informasi terpenting


yang mewakili isi dari semua
informasi yang ada
Proses Peringkas teks otomatis dengan
menggunakan Timestamped Graph Model
Timestamped graph model

Multi dokumen Pemecahan Tokenisasi Eliminasi


Bangun graf
kalimat kalimat stopword

query Perhitungan skor


kalmat

Hasil ringkasan Ekstraksi menjadi Perangkingan


ordering reranking
ringkasan kalimat
Timestamped Graph Model
 Simpul merepresentasikan kalimat
 Sisi merepresentasikan similarity antar
kalimat
 Graf dibentuk secara bertahap atau per
timestep
Similarity & Topic-sensitive PageRank

uv
cosine _ sim(u, v) 
u v
0.424

Timestep 1
1.1 0.424 2.1

0.424

Timestep 2
1.1 0.424 2.1

0.135 0.191
0.191

1.2 2.2

0.174
16
Timestep 3

0.424

1.1 0.424 2.1

0.135 0.191
0.191

0.365
1.2 2.2
0.365

0.174
0.219
0.219
0.258 0.350

0.350
1.3 2.3

17
Timestep 4

0.424

1.1 0.424 2.1

0.135 0.258 0.191


0.108 0.191

0.365
1.2 0.174 2.2 0.153
0.365

0.174
0.219
0.219
0.258 0.350

0.350
1.3 2.3

0.135

1.4 18
topic-sensitive pagerank tiap kalimat
•Dokumen 2 kalimat 2 (2.2) = 1,060
•Dokumen 2 kalimat 3 (2.3) = 0,722
•Dokumen 1 kalimat 1 (1.1) = 0,658
•Dokumen 1 kalimat 2 (1.2) = 0,652
•Dokumen 2 kalimat 1 (2.1) = 0,541
• dst...

19
Decision Support System

Handling imbalanced data in churn prediction by applying


Weighted Random Forest (WRF)

- Data handling  Sampling Techniques


- Method Handling  Weighted Random Forest (WRF)

20
Churn Prediction

21
Churn Prediction
F-measure DataUS_8to10SMOTE50
1,2

0,8
F-measure

0,6

0,4

0,2

0
3 5 10 20 30 40 50 100
nTree

22
Graph G ( V , E )
Motivasi Pewarnaan-T

 Topologi transmiter menyerupai graf


 Kriteria Pewarnaan-T sesuai dengan
masalah frequency assignment
 Optimasi Pada Perencanaan Alokasi
frekuensi

back
Terminologi
Misalkan T subset dari Z+
Pewarnaan-T pada graf G = (V, E), f : V  Z+ , shg

f x   f  y   T ,untuk setiap xy di E
Optimasi meliputi dua hal :
a. Konstruksi suatu pewarnaan-T pada graf G
sehingga banyaknya warna adalah minimum.
b. Konstruksi f suatu pewarnaan-T pada graf G
sehingga selisih warna adalah minimum
back
Konstruksi suatu pewarnaan-T pada graf G
sehingga banyaknya warna adalah minimum
 Minimum Order  Notasi :  (G)

Konstruksi suatu pewarnaan-T pada graf G


sehingga selisih label warna adalah minimum
 Minimum Span  Notasi : Spt(G)

 ?? C4

back
Pemodelan Sistem
Misalkan T = {0, 1, 4, 5}

Minimum Minimum Span


Order
 K4  W3

 K5  W4

back
Topologi Transmitter

back
Hexagonal Network

back
Tugas
 Bilangan Kromatik dan T-span pada hexagonal network

Jenis Graf: Roda, Hexagonal Network, Graf Lengkap


Batasan : Pilih T = {0,1,2,3} dan T={0, 3, 6, 9}

Problem
• Kaitan Himpunan-T dan T-Span, untuk graf tertentu
• Membangun Algoritma untuk menentukan Bilangan kromatik atau
T-span suatu Graf

back
Pewarnaan-f
Problem

Penentuan minimum waktu yang diperlukan dalam seluruh proses


komputasi pada suatu kluster identik dengan penentuan minimum
banyak warna suatu pewarnaan-f pada G.
Indeks f-Kromatik
Ilustrasi Pewaarnaan-f dengan minimum banyak
warna
Index f-Chromatic
Contoh pewarnaan-f
Contoh pewarnaan-f

You might also like