You are on page 1of 38

3/25/2021

Chương 4:
ĐỘ ĐO TRUNG TÂM (CENTRAILITY MEASURES)

Thời lượng: 6 tiết

MỤC TIÊU
• Centrality là một trong các biện pháp được
nghiên cứu nhiều nhất nhằm xác định tầm quan
trọng tương đối của một đỉnh trong đồ thị.
• Centrality mô tả vị trí tương đối của một tác
nhân trong bối cảnh của mạng xã hội của mình:

1
3/25/2021

NỘI DUNG
Review: Đường đi trong đồ thị
1. Centrality measures
▪ Degree centrality
▪ Betweenness centrality
▪ Closeness centrality
▪ Eigenvector
▪ PageRank
2. Comparison among centrality measures

NỘI DUNG
Review: Đường đi trong đồ thị
1. Centrality measures
▪ Degree centrality
▪ Betweenness centrality
▪ Closeness centrality
▪ Eigenvector
▪ PageRank
2. Comparison among centrality measures
3. Ứng dụng các độ đo Centrality tìm tác nhân có tầm ảnh
hưởng (Key player)

2
3/25/2021

Review: Đường đi trong đồ thị


❖Duyệt đồ thị
✓Duyệt đồ thị theo chiều rộng (Breadth First
Search – BFS)
✓Duyệt đồ thị theo chiều sâu (Depth First Search –
DFS)
❖ Tìm đường đi
✓Đường đi và đường đi ngắn nhất trong mạng
(Paths & shortest paths)
✓Tìm đường đi theo chiều rộng
✓Tìm đường đi theo chiều sâu
✓Tìm đường đi ngắn nhất trong mạng
❖ Kiểm tra tính liên thông 5

NỘI DUNG
Review: Đường đi trong đồ thị
1. Centrality measures
▪ Degree centrality
▪ Betweenness centrality
▪ Closeness centrality
▪ Eigenvector
▪ PageRank
2. Comparison among centrality measures
3. Ứng dụng các độ đo Centrality tìm tác nhân có tầm ảnh
hưởng (Key player)

3
3/25/2021

1. CENTRAILITY MEASURES

1.1. Degree Centrality


❖Cho đồ thị G = (V, E) có n đỉnh.
▪ Degree centrality của một đỉnh chính là tổng số
các liên kết tới đỉnh đó trong đồ thị (tổng số
cạnh kề của một đỉnh).
▪ Trường hợp đồ thị có hướng, degree centrality
được tính bởi 2 giá trị: in-degree va out-degree.
✓In-degree: tổng số liên kết từ các node khác
đến node đang xét.
✓Out-degree: tổng số liên kết từ node đang xét
đến các node khác.
8

4
3/25/2021

1. 1. Degree Centrality
Tóm lại:
▪ Có hướng: bậc In, bậc
Out (số link vào và
link ra của một nodes)
▪ Vô hướng: số nodes có
quan hệ.
▪ Đánh giá những nodes,
actors nào là trọng tâm
khi xét khía cạnh lan
truyền thông tin.

1. 1. Degree Centrality
❖Công thức tính độ đo trung tâm theo bậc của 1 đỉnh:
Hoặc (1.1)
❖Công thức tinh degree centrality theo dạng chuẩn:

C’D (v) = Hoặc C’D (u) = (1.2)

➢ Trong đó: ➢ Trong đó:


▪ v: đỉnh đang xét ▪ u: đỉnh đang xét
▪ deg(v): số các cạnh kề ▪ V tập đỉnh
của đỉnh v ▪ E tập cạnh:
▪ n: số đỉnh của đồ thị ▪ n: số đỉnh của đồ thị 10

10

5
3/25/2021

1. 1. Degree Centrality

❖Nhận xét:
➢ Miền giá trị của độ đo này nằm trong khoảng [0..1].
→Khi giá trị càng tiến gần đến 1 thì tính trung tâm của tác
nhân càng cao, tức là càng nằm ở vị trí trung tâm của
mạng lưới.
➢ Chuẩn hóa thành C’D (u), với n tổng số nodes trong mạng.
→Nếu mạng có hướng, cần tính:
✓ CD+(u) ra khỏi u,
✓ CD-(u) hướng vào u.

11

11

1. 1. Degree Centrality

❖Ví dụ 1: Cho đồ thị gồm 7 đỉnh sau:


Dựa vào công thức (1.1) và (1.2) ta tính được các độ đo
trung tâm theo bậc của từng đỉnh như sau:

12

12

6
3/25/2021

1. 1. Degree Centrality

Nhận xét:
❖Degree centrality được dùng để xác định node
nào có thể lan truyền thông tin nhanh, có khả năng
gây ảnh hưởng trực tiếp đến các node xung quanh.
❖Một thực thể có giá trị degree centrality cao:
▪ Là người hoạt động tich cực hoặc nổi tiếng nhất.
▪ Là một đầu nối quan trọng.
▪ Có một vị trí thuận lợi.
▪ Có tầm ảnh hưởng quan trọng trong mạng
13

13

NỘI DUNG
1. Review: Đường đi trong đồ thị
2. Centrality measures
▪ Degree centrality
▪ Betweenness centrality
▪ Closeness centrality
▪ Eigenvector
▪ PageRank
3. Comparison among centrality measures

14

14

7
3/25/2021

1.2. Độ đo trung tâm dựa trên trung gian


(Betweenness Centrality)
❖Betweenness centrality của một đỉnh được tính
bằng tổng số các đường đi ngắn nhất ngang qua
đỉnh đang xét chia cho tổng số các đường đi ngắn
nhất của toàn mạng.
❖Nói cách khác, Betweenness Centrality là độ đo
dùng để xác định vị tri của tác nhân trong mạng
mà nó có khả năng kết nối đến những cặp tác nhân
hay những nhóm tác nhân khác.

15

15

1.2. Betweenness Centrality


❖Betweeness Centrality của một đỉnh u, ký hiệu là CB(u),
độ đo này dùng để xem xét khả năng chi phối các quan hệ
giữa các nút khác trong mạng.
❖Khả năng u tham gia vào mối liên lạc hay các đường đi
giữa s và t được tính như sau:

(1.3)

Trong đó:
▪ σst(u): số đường đi ngắn nhất giữa s và t có chứa u (s≠u≠ t)
▪ σst : tổng số đường ngắn nhất giữa s và t (s ≠ u ≠ t)
16

16

8
3/25/2021

1.2. Betweenness Centrality


❖Betweeness Centrality của một nút u được định nghĩa là
tổng các đường đi ngắn nhất giữa tất cả các cặp nút mà
chứa u.
❖Công thức tính Betweenness Centrality của đỉnh u:
Cho đồ thị G = (V, E) có n đỉnh:

(1.4)

Trong đó:
: khả năng u tham gia vào mối liên lạc hay các
đường đi giữa s và t
17

17

1.2. Betweenness Centrality


❖Công thức tinh Betweenness Centrality theo dạng chuẩn:

(1.5)

❖Miền giá trị của độ đo này nằm trong khoảng [0..1], node
có giá trị càng lớn thì node đó sẽ có sự ảnh hưởng càng lớn
đến việc phân bô cấu trúc của các cụm hay nhóm trong
mạng càng lớn. Một tác nhân có vai trò trung tâm càng lớn
trong mạng thì sẽ có tầm ảnh hưởng lớn trong việc kiểm
soát mọi thông tin trao đôi giữa các tác nhân khác trong
mạng.
18

18

9
3/25/2021

1.2. Betweenness Centrality


❖Ví dụ 1: Tính betweenness centrality?

19

19

1.2. Betweenness Centrality


❖Ví dụ 1: Tính betweenness centrality?

20

20

10
3/25/2021

1.2. Betweenness Centrality


❖Ví dụ 1: Tính betweenness centrality?

> betweenness(mynetwork)
1 2 3 4 5 6
0.0 1.5 1.0 4.5 3.0 0.0 21

21

1.2. Betweenness Centrality


❖Ví dụ 2: Cho một mạng xã hội có các tác nhân:
v1, v2, v3, v4, v5, v6 và các link: (v1,v2); (v1,v3);
(v2,v4); (v3,v2); (v3,v4); (v4,v5); (v4,v6).
Ta xem mạng xã hội trên như là một đồ thị như sau:

22

22

11
3/25/2021

1.2. Betweenness Centrality


❖Ta thấy công
thức (1.3) có
đề cập tới
đường đi
ngắn nhất từ
đỉnh s tới
đinh t, như
vậy ban đầu B1
ta phải tính
các đường đi
ngắn nhât
của tất cả các
cặp node
trong đồ thị: 23

23

1.2. Betweenness Centrality


❖ Tính được độ đo Betweenness Centrality theo công thức 1.3 của
từng node: Đây là cách tính ngôn ngữ R sử dụng

½ Node 2; ½ Node 3

½ Node 2; ½ Node 3; 1 Node 4

½ Node 2; ½ Node 3; 1 Node 4

1 Node 4
1 Node 4

1 Node 4
1 Node 4
24

24

12
3/25/2021

1.2. Betweenness Centrality (1.4)


Node Result
1 0
2 1,5
3 1,5
4 6
5 0
6 0
v1 v2 v3 v4 v5 v6
0.0 1.5 1.5 6.0 0.0 0.0 25

25

1.2. Betweenness Centrality


❖Như vậy, ta tính được độ đo Betweenness Centrality
theo công thức (1.5) của từng node:
❖(n-1)(n-2)/2 = 5*4/2 = 10
Node Result/10
1 0
2 0,15
3 0,15
4 0,6
5 0
6 0
26

26

13
3/25/2021

1.2. Betweenness Centrality

❖Một node có độ đo Betweenness Centrality càng cao thì:


▪ Giữ một vị trí đặc biệt quan trọng và một tầm ảnh hưởng
rất lớn trong mạng.
▪ Nếu node này bị loại bỏ thì sẽ gây ra sự tan rã cấu trúc
của mạng, tức là các node sẽ không còn có thể trao đôi
thông tin liên lạc với nhau.

27

27

1.2. Betweenness Centrality


❖Đáp án: Tính betweenness centrality cho node 4?

?BTVN: Tính betweenness centrality cho tất cả node?


29

29

14
3/25/2021

NỘI DUNG
1. Review: Đường đi trong đồ thị
2. Centrality measures
▪ Degree centrality
▪ Betweenness centrality
▪ Closeness centrality
▪ Eigenvector
▪ PageRank
3. Comparison among centrality measures
4. Ứng dụng các độ đo Centrality tìm tác nhân có tầm ảnh
hưởng (Key player)

30

30

1.3. Độ đo trung tâm theo sự lân cận


(Closeness Centrality)
❖Cho đồ thị G = (V, E) với n đỉnh
❖Closeness centrality là độ đo khoảng cách từ một đỉnh
đến các đỉnh còn lại trong đồ thị.
❖Công thức tính toán:
▪ Công thức 1:
(1.6)

d(u, v): là đường đi ngắn nhất từ u đến v.


❖Closeness centrality được tính bằng trị nghịch đảo của
tổng số khoảng cách ngắn nhất từ một đỉnh đến tất cả
các đỉnh còn lại của đồ thị 31

31

15
3/25/2021

1.3. Closeness Centrality


▪ Công thức 2:
➢Số quan hệ tối đa có thể có của một nút là (n-1)

(1.7)

➢ Với d(u.v) là khoảng cách ngắn nhất từ đỉnh u đến v


của đồ thị.
➢ Closeness centrality được tính bằng bình quân của
tổng số khoảng cách ngắn nhất từ một đỉnh đến tất
cả các đỉnh còn lại
32

32

1.3. Closeness Centrality


▪ Xét lại Ví dụ 2, ta sử dụng lại Bảng (B1) để tìm
độ đo Closeness Centrality của các đỉnh trong
đồ thị:
▪ Theo công thức 1:
➢Xét đỉnh v1: Độ đo khoảng cách từ đinh v1 đến
các đinh còn lại trong mạng length(v1,t) là 10, ta
có:
= 1/10 =0,1

33

33

16
3/25/2021

B1
B1

34

34

1.3. Closeness Centrality


➢Tương tự ta tìm được các độ đo Closeness Centrality
“đến 1 đỉnh” cho các nodes (mode=“out”):

V 1 2 3 4 5 6 SUM Cc(V)
1 0 1 1 2 3 3 10 1/10
2 Inf 0 Inf 1 2 2 17 1/17
3 Inf 1 0 1 2 2 12 1/12
4 Inf Inf Inf 0 1 1 20 1/20
5 Inf Inf Inf Inf 0 Inf 30 1/30
6 Inf Inf Inf Inf Inf 0 30 1/30

Inf = <độ dài bằng số đỉnh của đồ thị> = 6 35

35

17
3/25/2021

1.3. Closeness Centrality


➢Các độ đo Closeness Centrality “từ 1 đỉnh” các nodes
(mode=“in”):
V 1 2 3 4 5 6 SUM Cc(V)
1 0 Inf Inf Inf Inf Inf 30 1/30
2 1 0 1 Inf Inf Inf 20 1/20
3 1 Inf 0 Inf Inf Inf 25 1/25
4 2 1 1 0 Inf Inf 16 1/16
5 3 2 2 1 0 Inf 14 1/14
6 3 2 2 1 0 0 14 1/14

Inf = <độ dài bằng số đỉnh của đồ thị> = 6 36

36

1.3. Closeness Centrality


➢Các độ đo Closeness Centrality các nodes
(mode=“all”):

V 1 2 3 4 5 6 SUM Cc(V)
1 0 1 1 2 3 3 10 1/10
2 1 0 1 1 2 2 7 1/7
3 1 1 0 1 2 2 7 1/7
4 2 1 1 0 1 1 6 1/6
5 3 2 2 1 0 2 10 1/10
6 3 2 2 1 2 0 10 1/10

37

37

18
3/25/2021

1.3. Closeness Centrality

➢ Như vậy, đỉnh v4 có giá trị Closenness Centrality


cao nhất sẽ là đỉnh có thể truyền đạt, tiếp nhận
thông tin từ các node khác trong mạng một cách
nhanh nhất, ít tốn thời gian nhất.
➢ Một thực thể có giá trị closeness centrality tốt nhất:
▪ Có thể truy xuất nhanh chóng đến các thực thể
khác trong mạng.
▪ Có một đường đi ngắn nhất đến nhiều thực thể
khác.

38

38

1.3. Closeness Centrality

❖Bài tập: Tính Closenness centrality?

Cc(u): Khả năng đi đến các nút khác trong mạng từ nút u.
39

39

19
3/25/2021

1.3. Closeness Centrality


❖Đáp án:

40

40

NỘI DUNG
Review: Đường đi trong đồ thị
1. Centrality measures
▪ Degree centrality
▪ Betweenness centrality
▪ Closeness centrality
▪ Eigenvector
▪ PageRank
2. Comparison among centrality measures
3. Ứng dụng các độ đo Centrality tìm tác nhân có tầm ảnh
hưởng (Key player)

41

41

20
3/25/2021

1.4. Eigenvector centrality for undirected graph

❖A measure of the importance of a node in a


network.
❖It assigns relative scores to all nodes in the
network based on the principle that connections to
nodes having a high score contribute more to the
score of the node in question

42

42

Review
Closeness Centrality: The closeness centrality of a node
is the average length of the shortest path between the
node and all other nodes. The most central the node the
closer it is to all the other nodes.

43

21
3/25/2021

Review
Betweeness Centrality: A node’s betweeness centrality is
the number of times a node acts as a bridge along the
shortest path between two other nodes.

44

1.4. Eigenvector centrality for undirected graph


Eigenvector Centrality: A node’s eigenvector centrality
measures its influence in terms of how connected the
node is to other highly connected nodes.

John Emma

0.36 0.49

Jill
0.54

Liz
0.19 0.49 0.17

Bob Shane

0.17

Allen

45

22
3/25/2021

1.4. Eigenvector centrality for undirected graph

46

46

1.4. Eigenvector centrality for undirected graph

47

47

23
3/25/2021

Example
rm(list=ls()) #remove ALL objects
library(igraph)
#Generate graph object from adjacency matrix: igraph has the
regular meaning
adj<-matrix(
c(0, 1, 0, 1,
1, 0, 1, 1,
0, 1, 0, 1,
1, 1, 1, 0), # the data elements
nrow=4, # number of rows
ncol=4, # number of columns
byrow = TRUE)# fill matrix by rows
g <- graph.adjacency(adj, mode="undirected") # create igrpah
object from adjacency matrix
plot(g) # plot the graph
48

48

Example

49

49

24
3/25/2021

Eigenvector centrality for the Padgett Florentine families

50

50

NỘI DUNG
Review: Đường đi trong đồ thị
1. Network properties
2. Centrality measures
▪ Degree centrality
▪ Betweenness centrality
▪ Closeness centrality
▪ Eigenvector
▪ PageRank
3. Comparison among centrality measures

51

51

25
3/25/2021

1.5. PageRank centrality


❖Page Rank (thứ hạng trang web): Xếp hạng
trang fanpage dựa theo mức độ thường xuyên
của một user nhấp vào một đường dẫn (tự
nhiên) và tới trang fanpage.
❖Trong “Network Overview ”, tìm “PageRank”
và nhấp vào “Run”. Một của sổ hiện ra, chọn
“Directed” và tùy chỉnh các thông số
Probability(p): sử dụng để mô phỏng người
dùng lướt web một cách ngẫu nhiên.
❖Epsilon: giá trị càng cao thì độ hội tụ càng lớn

52

52

1.5. PageRank centrality

53

53

26
3/25/2021

1.5. PageRank centrality

54

54

Example for the basic PageRank

55

55

27
3/25/2021

Example for the basic PageRank

56

56

Scaling PageRank centrality

57

57

28
3/25/2021

Example for the scaling PageRank with


damping factor a = 0.85

58

58

Example for the scaling PageRank with


damping factor a = 0.85

59

59

29
3/25/2021

Why scaling? if you run the basic PageRank for


this modified example...

60

60

Why scaling? if you run the basic PageRank for


this modified example...

61

61

30
3/25/2021

Why scaling? if you run the basic PageRank for


this modified example...

62

62

Why scaling? if you run the basic PageRank for


this modified example...

63

63

31
3/25/2021

Now, run the scaling PageRank for this modified example...

64

64

NỘI DUNG
Review: Đường đi trong đồ thị
1. Centrality measures
▪ Degree centrality
▪ Betweenness centrality
▪ Closeness centrality
▪ Eigenvector
▪ PageRank
2. Comparison among centrality measures

65

65

32
3/25/2021

2. Comparison among centrality measures for the


Padgett Florentine families

66

66

Correlation analysis among centrality measures for


the Padgett Florentine families

67

67

33
3/25/2021

Correlation analysis among centrality measures for


the Padgett Florentine families

68

68

Correlation analysis among centrality measures for


the Padgett Florentine families

69

69

34
3/25/2021

Correlation analysis among centrality measures for


the Padgett Florentine families

70

70

Correlation analysis among centrality measures for


the Padgett Florentine families

71

71

35
3/25/2021

Correlation analysis among centrality measures for


the Padgett Florentine families

72

72

Correlation analysis among centrality measures for


the Padgett Florentine families

73

73

36
3/25/2021

Correlation analysis among centrality measures for


the Padgett Florentine families

74

74

Classification of centrality measures base don the


correlation analysis of the Padgett Florentine families

75

75

37
3/25/2021

Comparing the three most popular centrality measures

76

76

Tài liệu tham khảo


1. Stanley Wasserman & Katherine Faust. Social
Network Analysis: Methods and Applications.
Cambridge University Press, 2009.
2. Matthew O. Jackson, Professor: Social and Economic
Networks: Models and Analysis, Stanford University
(Coursera), https://www.coursera.org/learn/social-
economic-networks
3. Stephen P. Borgatti. (2006), “Identifying sets of key
players in a social network”, Comput Math Organiz
Theor, pp. 21-34.

89

89

38

You might also like