You are on page 1of 22

„I HÅC QUÈC GIA TH€NH PHÈ HÇ CH MINH

TR×ÍNG „I HÅC BCH KHOA

KHOA KHOA HÅC & Kß THUŠT MY TNH

XC SU‡T THÈNG K–

Kh£o s¡t dung l÷ñng bë nhî CPU


thæng qua thæng sè kÿ thuªt v hi»u su§t cõa m¡y t½nh theo thíi gian

GVHD: Phan Thà H÷íng


SV thüc hi»n: Nguy¹n Minh Qu¥n  2212804
Nguy¹n Húu Nh¥n  2212362
Nguy¹n Trung T¥n  2213063
Nguy¹n B£o Tr¥m  2213572
Nguy¹n Quýnh Nh÷  2212472
Lîp: L13 - Nhâm: 23

Tp. Hç Ch½ Minh, Th¡ng 10/2023


Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

PH N CÆNG VI›C L€M

Hå v t¶n MSSV Nhi»m vö T¿ l» âng gâp iºm chia

Nguy¹n Mành Qu¥n 2212804 Kiºm tra v têng hñp nëi dung 20% 0

Nguy¹n Húu Nh¥n 2212362 Xû lþ dú li»u 20% 0

Nguy¹n Trung T¥n 2213063 So¤n cì sð lþ thuy¸t v thèng k¶ suy di¹n 20% 0

Nguy¹n B£o Tr¥m 2213572 Xû lþ dú li»u 20% 0

Nguy¹n Quýnh Nh÷ 2212472 Thüc hi»n ph¦n thèng k¶ t£ v mð rëng 20% 0

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 1/21
Möc löc
1 Têng quan dú li»u 4
1.1 Mæ t£ t»p dú li»u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2 Mæ t£ bi¸n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Ki¸n thùc n·n 5


2.1 Hçi quy tuy¸n t½nh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.1.1 Kh¡i ni»m . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.1.2 Mæ h¼nh hçi quy tuy¸n t½nh ìn . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2 Hçi quy tuy¸n t½nh bëi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2.1 Kh¡i ni»m . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2.2 Sü kh¡c bi»t giúa hçi quy tuy¸n t½nh bëi v ìn . . . . . . . . . . . . . . . . . . . 6

2.3 Ph¥n t½ch t÷ìng quan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.3.1 Kh¡i ni»m . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.3.2 C¡c ph÷ìng ph¡p ph¥n t½ch t÷ìng quan . . . . . . . . . . . . . . . . . . . . . . . . 6

2.3.3 Ùng döng cõa ph¥n t½ch t÷ìng quan . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3 Ti·n xû lþ sè li»u 7
3.1 åc dú li»u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3.2 L m s¤ch dú li»u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3.2.1 Tr½ch ra dú li»u con . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3.2.2 Kiºm tra c¡c dú li»u bà khuy¸t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

3.2.3 Thay th¸ c¡c dú li»u bà khuy¸t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

4 Thèng k¶ t£ 10
5 Thèng k¶ suy di¹n 14
5.1 Gi£ ành . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

5.1.1 Ph¥n phèi chu©n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

5.1.2 Quan h» tuy¸n t½nh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

5.1.3 Kiºm tra a cëng tuy¸n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

5.2 Hçi quy tuy¸n t½nh bëi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

5.2.1 X¥y düng mæ h¼nh hçi quy tuy¸n t½nh bëi . . . . . . . . . . . . . . . . . . . . . . . 16

5.2.2 Hçi quy stepwise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

5.2.3 Ph÷ìng tr¼nh tuy¸n t½nh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

5.2.4 Dü o¡n mæ h¼nh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

6 Th£o luªn v mð rëng 19


6.1 Th£o luªn v· mæ h¼nh hçi quy tuy¸n t½nh . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

6.1.1 ×u iºm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

6.1.2 Nh÷ñc iºm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

6.1.3 Ùng döng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

6.2 Ùng döng mæ h¼nh hçi quy a thùc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

7 Nguçn dú li»u v nguçn code 20

2
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

8 T i li»u tham kh£o 21

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 3/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

1 Têng quan dú li»u


1.1 Mæ t£ t»p dú li»u
ˆ T¶n tªp dú li»u: Intel_CPUs

ˆ Nguçn: https://www.kaggle.com/datasets/iliassekkaf/computerparts/code?datasetId=
2442
ˆ Sè l÷ñng quan tr­c: Intel_CPUs: 2283

ˆ Sè l÷ñng bi¸n: Intel_CPUS: 45

1.2 Mæ t£ bi¸n
Danh s¡ch c¡c bi¸n ch½nh c¦n quan t¥m :

Bi¸n Kiºu dú li»u ìn và Mæ t£


Product_Collection Ph¥n lo¤i ành khæng câ Bë s÷u tªp s£n ph©m
t½nh

Launch_Date {x ∈ R|0.25 ≤ khæng câ Ng y ra m­t


x ≤ 18.50},li¶n
töc

Recommended_Customer_Price {x ∈ R 2.54 ≤ æ la Gi¡ b¡n ÷ñc · nghà cho kh¡ch


x ≤ 13011}, li¶n h ng
töc

nb_of_Cores {x ∈ N 1 ≤ x ≤ nh¥n Thuªt ngú ph¦n cùng mæ t£ sè


72}, li¶n töc l÷ñng ìn và xû lþ trung t¥m ëc
lªp

nb_of_Threads {x ∈ N 1 ≤ x ≤ luçng Luçng (hay luçng thüc thi) l


56}, li¶n töc mët thuªt ngú ph¦n m·m cho
chuéi l»nh cì b£n ÷ñc s­p x¸p
câ thº ÷ñc truy·n v o

Processor_Base_Frequency {x ∈ R 3.2 × Hz Mæ t£ tèc ë âng mð cõa bâng


107 ≤ x ≤ 4.3 × b¡n d¨n trong bë xû lþ.
109 }, li¶n töc
Cache {x ∈ N 8000 ≤ Byte CPU Cache l vòng bë nhî
x ≤ 60000000}, nhanh n¬m tr¶n bë xû lþ.
li¶n töc

Bus_Speed {x ∈ N 0 ≤ x ≤ Hz/s Bus speed l tèc ë dú li»u ÷ñc


9.6 × 109 }, li¶n xû lþ trong mët gi¥y
töc

Max_Memory_Size {x ∈ R 1.00 × Byte Max Memory Size, dòng º biºu


109 ≤ x ≤ thà dung l÷ñng bë nhî tèi a,
4.10×1012 }, li¶n t½nh b¬ng byte, m bë xû lþ câ
töc thº hé trñ ÷ñc

Max_Memory_Bandwidth {x ∈ R 1.6 ≤ GB/s Max Memory Bandwidth (B«ng


x ≤ 352}, li¶n thæng bë nhî) l thuªt ngú ch¿
töc kh£ n«ng truy·n t£i dú li»u tèi
a cõa bë nhî

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 4/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

2 Ki¸n thùc n·n


2.1 Hçi quy tuy¸n t½nh
2.1.1 Kh¡i ni»m
Ph÷ìng ph¡p hçi quy tuy¸n t½nh l mët cæng cö ph¥n t½ch thèng k¶ ÷ñc sû döng º nghi¶n cùu mèi

quan h» giúa bi¸n ëc lªp v bi¸n phö thuëc. Nâ gióp chóng ta hiºu rã c¡ch bi¸n ëc lªp £nh h÷ðng ¸n

bi¸n phö thuëc v dü o¡n gi¡ trà cõa bi¸n phö thuëc düa tr¶n bi¸n ëc lªp. Hçi quy tuy¸n t½nh gi£ ành

r¬ng mèi quan h» giúa c¡c bi¸n l tuy¸n t½nh, tùc l bi¸n phö thuëc bi¸n êi mët c¡ch tuy¸n t½nh düa

tr¶n bi¸n ëc lªp.

2.1.2 Mæ h¼nh hçi quy tuy¸n t½nh ìn


Mët mæ h¼nh thèng k¶ tuy¸n t½nh ìn (Simple linear regression model) li¶n quan ¸n mët bi¸n ng¨u

nhi¶n Y v mët bi¸n gi£i th½ch x l ph÷ìng tr¼nh (1) câ d¤ng

Y = f (x) + ϵ = β0 + β1 x + ϵ

Trong â:

• β0 , β1 l c¡c tham sè ch÷a bi¸t, gåi l c¡c h» sè hçi quy,

• x l bi¸n ëc lªp, gi£i th½ch cho y,


• ϵ l th nh ph¦n sai sè, ϵ ÷ñc gi£ sû câ ph¥n phèi chu©n vîi E(ϵ) = 0 v Var(ϵ) = σ 2 .

Trong mæ h¼nh (1), sü thay êi cõa Y ÷ñc gi£ sû £nh h÷ðng bði 2 y¸u tè:

ˆ Mèi li¶n h» tuy¸n t½nh cõa X v Y :

E[Y |x] = β0 + β1 x,

Trong â, β0 ÷ñc gåi l h» sè ch°n (intercept) v β1 gåi l h» sè gâc (slope).

ˆ T¡c ëng cõa c¡c y¸u tè kh¡c (khæng ph£i X ): th nh ph¦n sai sè ϵ.

Vîi (x1 , y1 ), ..., (xn , yn ) l n c°p gi¡ trà quan tr­c cõa mët m¨u ng¨u nhi¶n cï n, tø (1) ta câ

Yi = β0 + β1 xi + ϵi , i = 1, 2, ..., n

Mët mæ h¼nh hçi quy tuy¸n t½nh ìn c¦n c¡c gi£ ành:

ˆ C¡c th nh ph¦n sai sè ϵi l ëc lªp vîi nhau.

ˆ ϵi ∼ N(0, σ 2 ) ho°c Y ∼ N(β0 + β1 x, σ 2 )

2.2 Hçi quy tuy¸n t½nh bëi


2.2.1 Kh¡i ni»m
Hçi quy tuy¸n t½nh bëi l mët ph÷ìng ph¡p trong thèng k¶ º x¡c ành mèi quan h» giúa mët bi¸n

phö thuëc v hai ho°c nhi·u bi¸n ëc lªp.

Hçi quy tuy¸n t½nh bëi: Sû döng hai ho°c nhi·u bi¸n ëc lªp º dü o¡n bi¸n phö thuëc, Mæ h¼nh

mèi quan h» tuy¸n t½nh giúa nhi·u bi¸n ëc lªp v bi¸n phö thuëc. Mæ h¼nh n y câ thº ÷ñc biºu di¹n

d÷îi d¤ng si¶u ph¯ng (plane) ho°c si¶u khæng gian (hyperplane) trong khæng gian nhi·u chi·u.

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 5/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

Ph÷ìng tr¼nh Mæ h¼nh: y = β0 + β1 x1 + β2 x2 + . . . . + βn xn + e, trong â bi¸n y l bi¸n phö thuëc,


x1 , x2 , x3 , ... l c¡c bi¸n ëc lªp, b0 l h» sè ch°n v β1 , β2 , .., βn l c¡c h» sè gâc t÷ìng ùng.
β0 : ¥y l h¬ng sè hçi quy (h» sè ch®n). H¬ng sè n y l ¤i di»n cõa gi¡ trà Y (bi¸n phö thuëc) khi
t§t c£ c¡c bi¸n ëc lªp ·u còng b¬ng 0. Nâi mët c¡ch d¹ hiºu hìn β0 l k¸t qu£ cõa Y khi c¡c X b¬ng

0. Thæng th÷íng, tr¶n ç thà, β0 ch½nh l iºm n¬m tr¶n tröc Oy . T¤i và tr½ m ÷íng hçi quy giao vîi

tröc Oy .

β1 , β2 , βn : ¥y l h» sè hçi quy (h» sè gâc). Cö thº hìn, h» sè hçi quy l sü ph£n ¡nh mùc thay êi
cõa gi¡ trà Y khi X thay êi. V méi mët sü thay êi cõa bi¸n X s³ t÷ìng ùng vîi mët gi¡ trà Y kh¡c

nhau tr¶n ç thà. Tâm l¤i, β1 , β2 , βn l k¸t qu£ cõa Y khi c¡c bi¸n X t÷ìng ùng thay êi. V h» sè n y

câ thº t«ng, câ thº gi£m tòy thuëc v o sü bi¸n dêi cõa X .

ϵ: l sai sè. ¥y l gi¡ trà biºu hi»n cho sü sai l»ch trong mèi t÷ìng quan giúa hai bi¸n l bi¸n ëc lªp
v bi¸n phö thuëc. Khi gi¡ trà ϵ c ng lîn th¼ kh£ n«ng kiºm ành cõa ph÷ìng ph¡p hçi quy tuy¸n t½nh s³

trð n¶n k²m i. S³ d¨n tîi nhúng sai l»ch nhi·u tr¶n thüc ti¹n. C¡c sai sè n y s³ l ¤i di»n cõa c¡c bi¸n

ëc lªp ngo i mæ h¼nh kiºm ành ho°c l b§t ký sai sè ng¨u nhi¶n n o â trong b i to¡n nghi¶n cùu.

Hçi quy tuy¸n t½nh bëi cung c§p kh£ n«ng mæ h¼nh hâa mèi quan h» phùc t¤p hìn giúa bi¸n ëc lªp

v bi¸n phö thuëc b¬ng c¡ch sû döng nhi·u bi¸n.

2.2.2 Sü kh¡c bi»t giúa hçi quy tuy¸n t½nh bëi v ìn
Hçi quy tuy¸n t½nh bëi v ìn l hai ph÷ìng ph¡p kh¡c nhau trong mæ h¼nh hçi quy, mët ph¦n cõa

thèng k¶ v m¡y håc ÷ñc sû döng º dü o¡n gi¡ trà cõa mët bi¸n phö thuëc düa tr¶n mët ho°c nhi·u

bi¸n ëc lªp.

2.3 Ph¥n t½ch t÷ìng quan


2.3.1 Kh¡i ni»m
Ph¥n t½ch t÷ìng quan (Correlation Analysis) dòng º o ë m¤nh cõa mèi li¶n h» tuy¸n t½nh giúa

hai bi¸n ng¨u nhi¶n. Lo¤i h» sè t÷ìng quan ÷ñc sû döng rëng r¢i nh§t l Pearson r. Ph¥n t½ch n y gi£

ành r¬ng hai bi¸n ang ÷ñc ph¥n t½ch ÷ñc o l÷íng tr¶n ½t nh§t c¡c thang o kho£ng c¡ch , câ ngh¾a

l chóng ÷ñc o l÷íng tr¶n mët ph¤m vi gi¡ trà t«ng d¦n. H» sè ÷ñc t½nh b¬ng c¡ch l§y hi»p ph÷ìng

sai cõa hai bi¸n v chia nâ cho t½ch cõa ë l»ch chu©n cõa chóng .

H» sè t÷ìng quan câ thº n¬m trong kho£ng tø −1.00 ¸n +1.00 trong â gi¡ trà −1.00 ¤i di»n cho

mèi t÷ìng quan ¥m ho n h£o, câ ngh¾a l khi gi¡ trà cõa mët bi¸n t«ng l¶n, bi¸n kia gi£m trong khi gi¡

trà +1.00 ¤i di»n cho mèi quan h» d÷ìng ho n h£o, câ ngh¾a l khi mët bi¸n t«ng gi¡ trà, bi¸n kia công

vªy. C¡c gi¡ trà nh÷ th¸ n y b¡o hi»u mèi quan h» tuy¸n t½nh ho n h£o giúa hai bi¸n, v¼ vªy n¸u b¤n

v³ k¸t qu£ tr¶n biºu ç, nâ s³ t¤o th nh mët ÷íng th¯ng, nh÷ng gi¡ trà 0,00 câ ngh¾a l khæng câ mèi

quan h» n o giúa c¡c bi¸n ang ÷ñc kiºm tra v s³ ÷ñc v³ biºu ç nh÷ c¡c dáng ri¶ng bi»t ho n to n.

V½ dö, n¸u chóng ta muèn bi¸t li»u câ mèi li¶n h» giúa nhi»t ë v sü sinh tr÷ðng chi·u cao cõa thüc

vªt hay khæng, mët h» sè t÷ìng quan câ thº ÷ñc t½nh to¡n º tr£ líi c¥u häi n y.

2.3.2 C¡c ph÷ìng ph¡p ph¥n t½ch t÷ìng quan


Pearson correlation (r) o l÷íng sü phö thuëc tuy¸n t½nh giôa hai bi¸n (x v y ). Cán ÷ñc gåi l

kiºm tra t÷ìng quan tham sè v¼ nâ phö thuëc v o kiºu ph¥n phèi dú li»u. Ch¿ ÷ñc sû döng khi dú li»u

tu¥n theo luªt ph¥n phèi chu©n (normal istribution). ç thà cõa y = f (x) gåi l ÷íng cong hçi quy

tuy¸n t½nh.

Kendall's Tau Spearman Rho


v l c¡c ph÷ìng ph¡p t½nh h» sè t÷ìng quan düa tr¶n thù h¤ng

(phi tham sè)

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 6/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

2.3.3 Ùng döng cõa ph¥n t½ch t÷ìng quan


Gióp chóng ta th§y c¡c xu h÷îng ho°c mæ h¼nh kh¡c nhau trong x¢ hëi câ thº ÷ñc k¸t nèi nh÷ th¸

n o, ch¯ng h¤n nh÷ th§t nghi»p v tëi ph¤m; v hå câ thº l m s¡ng tä c¡ch thùc m nhúng tr£i nghi»m

v °c iºm x¢ hëi ành h¼nh nhúng g¼ x£y ra trong cuëc sèng cõa mët ng÷íi. Ph¥n t½ch t÷ìng quan cho

ph²p chóng ta nâi mët c¡ch tü tin r¬ng mèi quan h» câ ho°c khæng tçn t¤i giúa hai m¨u ho°c bi¸n kh¡c

nhau, i·u n y cho ph²p chóng ta dü o¡n x¡c su§t cõa mët k¸t qu£ trong têng thº ÷ñc nghi¶n cùu.

Mët nghi¶n cùu g¦n ¥y v· hæn nh¥n v gi¡o döc cho th§y mèi t÷ìng quan nghàch giúa tr¼nh ë håc

v§n v t l» ly hæn. Dú li»u tø i·u tra Quèc gia v· T«ng tr÷ðng Gia ¼nh cho th§y khi tr¼nh ë håc v§n

cõa phö nú t«ng l¶n, t l» ly hæn èi vîi c¡c cuëc hæn nh¥n ¦u ti¶n s³ gi£m xuèng.

3 Ti·n xû lþ sè li»u
3.1 åc dú li»u
Dòng l»nh read.csv º åc dú li»u v o bi¸n cpu_df v in ra tr¶n terminal º kiºm tra xem data câ

÷ñc nhªp th nh cæng hay khæng:

H¼nh 1: åc dú li»u cõa file Intel_CPUs.csv v o bi¸n cpu_df v in ra 10 dáng ¦u ti¶n cõa méi cët

3.2 L m s¤ch dú li»u


3.2.1 Tr½ch ra dú li»u con
Ta s³ tr½ch ra dú li»u con bao gçm c¡c bi¸n ch½nh m ta quan t¥m v l÷u v o bi¸n new_cpu_df. Hi»n

thüc b¬ng R:

H¼nh 2: L÷u dú li»u con gçm c¡c bi¸n ch½nh tø bi¸n cpu_df v o bi¸n new_cpu_df

º gi£i th½ch cho vi»c sû döng c¡c bi¸n â, ta câ biºu ç cho t¿ l» khuy¸t cõa tøng bi¸n trong dataset

ban ¦u nh÷ sau:

Tø biºu ç, ta câ thº nh¼n th§y v chån ra c¡c bi¸n câ t¿ l» khuy¸t th§p nh÷ Bus_Speed,

Cache, nb_of_Cores, nb_of_Threads, Launch_Date, Max_Memory_Bandwidth, Max_Memory_Size,

Proccessor_Base_Frequency, Product_Collection, Max_nb_of_Memory_Channels v Recom-

mended_Customer_Price. Ngo i ra, c¡c bi¸n n y cán £nh h÷ðng ¸n Cache ÷ñc chùng minh qua mët

sè t i li»u s¡ch b¡o (nhâm t¡c gi£ s³ tr½ch d¨n nguçn ð ph¦n t i li»u tham kh£o).

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 7/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

H¼nh 3: Biºu ç thº hi»n t¿ l» khuy¸t cõa tøng bi¸n câ trong dataset
3.2.2 Kiºm tra c¡c dú li»u bà khuy¸t
Ta t¼m c¡c gi¡ trà bà khuy¸t trong new_cpu_df.

Hi»n thüc b¬ng R:

H¼nh 4: In ra têng sè gi¡ trà bà khuy¸t trong new_cpu_df

Nhªn x²t: C¡c dú li»u khuy¸t ÷ñc t½nh trong o¤n code tr¶n bao gçm c¡c dú li»u réng, dú li»u

chùa "-", dú li»u null v dú li»u chùa chuéi "Unknown".

3.2.3 Thay th¸ c¡c dú li»u bà khuy¸t


¦u ti¶n, ta s³ thay êi format cõa bi¸n Launch_Date b¬ng c¡ch l§y sè n«m + 1 + sè quþ (quþ 1 =

0.0, quþ 2 = 0.25, quþ 3 = 0.5 v quþ 4 = 0.75)

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 8/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

Ti¸p theo, ta s³ xo¡ bä c¡c h ng mang gi¡ trà réng trong bi¸n Product_Collection, sau â chån ra tø

kho¡ quan trång trong t¶n cõa tøng æ:

H¼nh 5: Xo¡ c¡c æ trèng v thay êi t¶n th nh c¡c tø khoa trong bi¸n Product_Collection

Ti¸p theo, ta s³ t½nh gi¡ trà trung b¼nh cõa bi¸n Recommended_Customer_Price v thay v o c¡c æ

dú li»u bà khuy¸t. L÷u þ ð ¥y s³ câ mët v i gi¡ trà ð d¤ng kho£ng (v½ dö: $70.00 − $77.00) n¶n ta s³ thay
thº c¡c gi¡ trà câ kho£ng b¬ng ch½nh gi¡ trà trung b¼nh cõa nâ v mîi ti¸n h nh t½nh trung b¼nh cõa bi¸n

v thay v o ché dú li»u khuy¸t:

H¼nh 6: V½ dö v· gi¡ trà d¤ng kho£ng ð trong bi¸n Recommended_Customer_Price

H¼nh 7: Gi¡ trà d¤ng kho£ng ð trong bi¸n Recommended_Customer_Price ¢ ÷ñc xû lþ

Ti¸p theo, ta s³ thay êi ìn và cõa bi¸n Processor_Base_Frequency th nh Hz v sau â thay th¸

c¡c dú li»u bà khuy¸t th nh gi¡ trà trung b¼nh cõa bi¸n:

H¼nh 8: Bi¸n Processor_Base_Frequency tr÷îc H¼nh 9: Bi¸n Processor_Base_Frequency sau khi


khi xû lþ xû lþ

Nhªn x²t: bði v¼ gi¡ trà cõa bi¸n Processor_Base_Frequency ph£i luæn d÷ìng n¶n ta s³ khæng thay

th¸ sè 0 v o c¡c æ bà khuy¸t m s³ thay b¬ng gi¡ trà trung b¼nh cõa c¡c æ cán l¤i.

Vîi c¡c bi¸n Cache, Bus_Speed, Max_Memory_Size, Max_Memory_Bandwidth, ta ti¸n h nh êi

ìn và cõa c¡c bi¸n â (Cache quy v· ìn và Byte, Bus_Speed quy v· ìn và Hz/s, Max_Memory_Size

quy v· ìn và Byte v Max_Memory_Bandwidth quy v· ìn và GB/s):

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 9/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

Cuèi còng, vîi c¡c bi¸n ta ch÷a xû lþ dú li»u khuy¸t, ta s³ t½nh to¡n gi¡ trà trung b¼nh cõa tøng bi¸n

â v thay v o æ dú li»u bà khuy¸t thæng qua h m sau :

H¼nh 10: êi ìn và cõa c¡c bi¸n

Sau khi thay th¸ h¸t dú li»u bà khuy¸t, ta ti¸n h nh kiºm tra xem cán dú li»u n o bà khuy¸t khæng :

H¼nh 11: In ra têng sè gi¡ trà bà khuy¸t

Nhªn x²t: Nh÷ vªy khæng cán dú li»u n o trong new_cpu_df bà khuy¸t, ta chuyºn sang b÷îc ti¸p

theo.

4 Thèng k¶ t£
Sau khi l m s¤ch dú li»u, ti¸n h nh thèng k¶ mæ t£ cho c¡c bi¸n ng¨u nhi¶n. K¸t qu£ thu ÷ñc tr£ v·

gi¡ trà nhä nh§t (Min.), iºm ph¥n và thù nh§t (1st Qu.), trung và (Median), gi¡ trà trung b¼nh (Mean),

iºm ph¥n và thù ba (3rd Qu.) v gi¡ trà lîn nh§t (Max.) cõa tøng bi¸n (h¼nh 12):

H¼nh 12: K¸t qu£ thèng k¶ mæ t£ cõa tøng bi¸n ng¨u nhi¶n ¢ chån trong Intel_CPUs

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 10/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

Ti¸p theo, nhâm t¡c gi£ ph¥n t½ch dú li»u cõa bi¸n b¬ng c¡ch trüc quan hâa dú li»u qua hai d¤ng

biºu ç l biºu ç t¦n su§t (histogram) v biºu ç hëp (boxplot) cho c¡c bi¸n li¶n töc. Biºu ç t¦n sè

s³ cho th§y c¡i nh¼n têng quan v· ph¥n phèi cõa bi¸n. Biºu ç hëp gióp biºu di¹n rã r ng c¡c ¤i l÷ñng

quan trång cõa bi¸n nh÷ gi¡ trà lîn nh§t, nhä nh§t, iºm ph¥n và,. . .

H¼nh 13: Launch_Date


H¼nh 14: Recommended_Customer_Price

H¼nh 15: nb_of_Cores H¼nh 16: nb_of_Threads

H¼nh 17: Processor_Base_Frequency H¼nh 18: Cache

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 11/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

H¼nh 19: Bus_Speed H¼nh 20: Max_Memory_Size

H¼nh 21: Max_Memory_Bandwidth


Qua dú li»u thu ÷ñc v h¼nh £nh tø biºu ç, nhâm t¡c gi£ ÷a ra c¡c nhªn x²t nh÷ sau:

ˆ Launch_Date: Thíi iºm ra m­t CPU rìi v o kho£ng tø n«m 2000 ¸n n«m 2018, v trong nûa

¦u n«m 2013 câ l÷ñng CPU ÷ñc s£n xu§t ra lîn nh§t vîi kho£ng 500 CPU. Gi¡ trà trung b¼nh

b¬ng gi¡ trà trung và l 13.12 chùng tä bi¸n Launch_Date câ h¼nh d¡ng ph¥n phèi l»ch èi xùng.

ˆ Recommended_Customer_Price: Gi¡ b¡n khuy¸n nghà cõa CPU dao ëng trong kho£ng tø $2.54
¸n $13011, tuy nhi¶n ph¦n lîn CPU câ gi¡ b¡n dao ëng tø $800 ¸n$1000, vîi hìn 1000 CPU

÷ñc · nghà ð mùc gi¡ n y. Gi¡ trà trung b¼nh v trung và ·u b¬ng $850.70, cho th§y r¬ng bi¸n

Recommended_Customer_Price câ h¼nh d¡ng ph¥n phèi l»ch èi xùng.

ˆ nb_of_Cores: Sè l÷ñng core dao ëng tø 1 (nh¥n) ¸n 72 (nh¥n), tªp trung nhi·u nh§t ð kho£ng

tø 2 (nh¥n) trð xuèng vîi g¦n 1300 CPU sû döng sè l÷ñng core n y. Gi¡ trà trung b¼nh l 4,067

(nh¥n) lîn hìn gi¡ trà trung và l 2 (nh¥n) chùng tä h¼nh d¡ng ph¥n phèi cõa bi¸n nb_of_Cores

l»ch ph£i.

ˆ nb_of_Threads: Sè l÷ñng thread n¬m trong ph¤m vi tø 1 (luçng) ¸n 56 (luçng), tuy nhi¶n, nhi·u

nh§t l hìn 800 CPU sû döng 9 (luçng). Gi¡ trà trung b¼nh l 8.83 (luçng) nhä hìn gi¡ trà trung và

l 9 (luçng) chùng tä h¼nh d¡ng ph¥n phèi cõa bi¸n nb_of_Threads l»ch tr¡i.

ˆ Processor_Base_Frequency: Tèc ë dao ëng 3.2 × 107 (Hz) ¸n 4.3 × 109 (Hz), tèc ë ph¥n bè
9 9
tªp trung trong kho£ng 2.2 × 10 - 2.3 × 10 (Hz) vîi hìn 100 CPU. Gi¡ trà trung b¼nh l 2.22 × 109
(Hz) b¬ng gi¡ trà trung và chùng tä h¼nh d¡ng ph¥n phèi cõa bi¸n Processor_Base_Frequency

èi xùng.

ˆ Cache: Dung l÷ñng cõa bë nhî cache dao ëng tø 8000 (byte) ¸n 6 × 107 (byte), tªp trung nhi·u
7
nh§t d÷îi kho£ng 0.1 × 10 (byte) vîi hìn 500 CPU câ dung l÷ñng ð mùc n y. Gi¡ trà trung b¼nh
6
l 7.08 × 10 (byte) lîn hìn gi¡ trà trung và l 3 × 106 (byte) chùng tä h¼nh d¡ng ph¥n phèi cõa

bi¸n Cache l»ch ph£i.

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 12/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

ˆ Bus_Speed: Tèc ë xû lþ dú li»u trong mët gi¥y cõa CPU n¬m trong kho£ng 0 ¸n 9.6×109 (Hz/s),
9
ph¥n bè nhi·u nh§t trong kho£ng d÷îi 0.2 × 10 (Hz/s) vîi g¦n 900 CPU. Gi¡ trà trung b¼nh l
1.55 × 109 (Hz/s) lîn hìn gi¡ trà trung và l 5.33 × 108 (Hz/s) chùng tä h¼nh d¡ng ph¥n phèi cõa
bi¸n Bus_Speed l»ch ph£i.

ˆ Max_Memory_Size: Dung l÷ñng tèi a cõa bë nhî thay êi trong ph¤m và tø 109 (byte) ¸n
12 12
4, 1 × 10 (byte), v tªp trung chõ y¸u d÷îi mùc 0.1 × 10 (byte) vîi x§p x¿ 900 CPU. Gi¡
11
trà trung b¼nh l 2.689 × 10 (byte) b¬ng vîi trung và chùng tä h¼nh d¡ng ph¥n phèi cõa bi¸n

Max_Memory_Size èi xùng.

ˆ Max_Memory_Bandwidth: Dung l÷ñng tèi a cõa b«ng thæng thay êi trong ph¤m và tø 1.6

(GB/s) ¸n 352 (GB/s), v ph¥n bè nhi·u nh§t tø 30 - 40 (GB/s) vîi g¦n 1300 CPU. Gi¡ trà

trung b¼nh l b¬ng vîi gi¡ trà trung và l 35.08 (GB/s) chùng tä h¼nh d¡ng ph¥n phèi cõa bi¸n

Max_Memory_Bandwidth èi xùng.

ˆ Product_Collection: T§t c£ c¡c CPU trong tªp dú li»u ·u n¬m trong 7 bë s÷u tªp s£n ph©m ch½nh

l Atom, Celeron, Core Itanium, Quark v Xeon. Tuy nhi¶n ph¦n lîn c¡c CPU thuëc bë

s÷u tªp Xeon, vîi 711 CPU ð bë s÷u tªp n y.

Ti¸p theo â, nhâm ti¸n h nh v³ biºu ç t÷ìng quan v lªp b£ng h» sè t÷ìng quan giúa c¡c bi¸n

÷ñc chån tø file Intel_CPUs nh¬m trüc quan hâa sü phö thuëc tuy¸n t½nh giúa c¡c bi¸n:

H¼nh 22: Biºu ç t÷ìng quan ùng vîi h» sè t÷ìng quan giúa tøng c°p bi¸n trong file Intel_CPUs

Qua c¡c dú li»u v· t÷ìng quan tuy¸n t½nh nh÷ tr¶n, nhâm ÷a ra nhªn x²t nh÷ sau:

ˆ Launch_Date: Bi¸n Launch_Date câ t÷ìng quan thuªn vîi c¡c bi¸n kh¡c. H¦u h¸t c¡c h» sè

t÷ìng quan vîi c¡c bi¸n kh¡c ·u n¬m trong kho£ng t÷ìng quan r§t y¸u. Do â, câ thº nâi r¬ng

khi bi¸n Launch_Date t«ng s³ khæng t¡c ëng ¡ng kº ¸n c¡c bi¸n cán l¤i.

ˆ Recommeded_Customer_Price: Bi¸n Recommeded_Customer_Price câ t÷ìng quan thuªn vîi

h¦u h¸t c¡c bi¸n cán l¤i. Bi¸n n y câ t÷ìng quan ð mùc y¸u v trung b¼nh vîi c¡c bi¸n, v câ t÷ìng

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 13/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

quan cao nh§t vîi hai bi¸n Cache v nb_of_Threads. Ch½nh v¼ th¸, gi¡ b¡n khuy¸n nghà s³ c ng

cao n¸u CPU câ dung l÷ñng bë nhî cache v tèc ë xû lþ dú li»u c ng lîn.

ˆ nb_of_Cores: Bi¸n nb_of_Cores câ t÷ìng quan thuªn vîi c¡c bi¸n kh¡c. H¦u h¸t sü t÷ìng quan

vîi c¡c bi¸n kh¡c n¬m ð mùc tø y¸u ¸n trung b¼nh. çng thíi, t÷ìng quan tèt nh§t vîi hai bi¸n

Cache v Max_Memory_Bandwidth. Ch½nh v¼ th¸, n¸u sè l÷ñng nh¥n cõa CPU t«ng th¼ dung

l÷ñng cõa bë nhî cache.

ˆ nb_of_Threads: Bi¸n nb_of_Threads t÷ìng quan thuªn vîi c¡c bi¸n cán l¤i trong tªp dú li»u.

H¦u h¸t c¡c h» sè t÷ìng quan vîi c¡c bi¸n kh¡c ·u n¬m trong kho£ng t÷ìng quan trung b¼nh, v

t÷ìng quan m¤nh nh§t vîi bi¸n Cache v Recommeded_Customer_Price. Nh÷ nhâm ¢ tr¼nh

b y ph½a tr¶n, c ng nhi·u luçng th¼ gi¡ b¡n cõa CPU s³ c ng cao, t÷ìng tü vîi bë nhî cache.

ˆ Cache: Bi¸n Cache t÷ìng quan thuªn kh¡ tèt vîi h¦u h¸t c¡c bi¸n cán l¤i. Ngo¤i trø t÷ìng quan

y¸u vîi Launch_Date, th¼ t÷ìng quan vîi c¡c bi¸n cán l¤i ·u n¬m ð mùc trung b¼nh. V¼ vªy, khi

t«ng dung l÷ñng bë nhî cache th¼ g¦n nh÷ c¡c th nh ph¦n cán l¤i cõa CPU công t«ng theo.

ˆ Processor_Base_Frequency: Bi¸n Processor_Base_Frequency g¦n nh÷ khæng t÷ìng quan vîi t§t

c£ c¡c bi¸n cán l¤i. Chùng tä r¬ng n¸u t«ng tèc ë n y, th¼ c¡c th nh ph¦n cán l¤i cõa CPU công

khæng thay êi.

ˆ Bus_Speed: Bi¸n Bus_Speed t÷ìng quan thuªn vîi c¡c bi¸n cán l¤i. Ph¦n lîn bi¸n Bus_Speed

t÷ìng quan vîi c¡c bi¸n kh¡c ð mùc y¸u, vîi bi¸n Cache v Max_Memory_Size l câ t÷ìng

quan tèt nh§t. Nhí vªy, n¸u t«ng tèc ë xû lþ dú li»u l¶n th¼ dung l÷ñng bë nhî cache v k½ch

th÷îc bë nhî ch½nh công t«ng.

ˆ Max_Memory_Size v Max_Memory_Bandwidth: Hai bi¸n n y t÷ìng quan thuªn kh¡ çng ·u

vîi c¡c bi¸n kh¡c. C¡c h» sè t÷ìng quan ·u n¬m ð mùc trung b¼nh y¸u. Do â, khi t«ng dung

l÷ñng tèi a cõa bë nhî v b«ng thæng bë nhî l¶n th¼ c¡c th nh ph¦n kh¡c cõa CPU công t«ng.

Qua nhúng nhªn x²t tr¶n, nhâm t¡c gi£ nhªn th§y bi¸n Cache câ t÷ìng quan tèt nh§t vîi ph¦n lîn c¡c

bi¸n kh¡c trong CPU. Ch½nh v¼ th¸, sü phö thuëc tuy¸n t½nh cõa bë nhî cõa cache vîi c¡c th nh ph¦n

cán l¤i s³ ÷ñc ti¸n h nh kh£o s¡t.

5 Thèng k¶ suy di¹n


5.1 Gi£ ành
5.1.1 Ph¥n phèi chu©n
Ta ti¸n h nh kiºm ành ph¦n d÷ cõa mæ h¼nh :

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 14/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

Nhªn x²t: Tø bèn h¼nh tr¶n, ta suy ra ÷ñc ph¦n d÷ trong mæ h¼nh câ d¤ng ph¥n phèi chu©n. Ta

chuyºn sang b÷îc ti¸p theo.

5.1.2 Quan h» tuy¸n t½nh

H¼nh 23: Sü tuy¸n t½nh giúa c¡c bi¸n

Nhªn x²t: Tø k¸t qu£ tr¶n, ta câ thº th§y R-squared = 0.8811 (kh¡ g¦n 1). i·u â çng ngh¾a vîi

vi»c ph¦n lîn sü phö thuëc cõa bi¸n Cache câ thº ÷ñc gi£i th½ch bði a sè c¡c bi¸n ëc lªp trong mæ

h¼nh.

5.1.3 Kiºm tra a cëng tuy¸n

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 15/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

H¼nh 24: H» sè l¤m ph¡t ph÷ìng sai


Nhªn x²t: a cëng tuy¸n l hi»n t÷ñng c¡c bi¸n ëc lªp trong mæ h¼nh hçi quy phö thuëc tuy¸n

t½nh l¨n nhau. Ta sû döng h» sè l¤m ph¡t ph÷ìng sai (VIF) º kiºm tra t½nh a cëng tuy¸n giúa c¡c

bi¸n. VIF l th÷îc o mùc ë sü bi¸n thi¶n ph÷ìng sai cõa hçi quy tuy¸n t½nh düa v o hi»n t÷ñng a

cëng tuy¸n.

Thæng th÷íng, h» sè l¤m ph¡t lîn hìn 5 cho th§y mùc ë a cëng tuy¸n câ v§n ·. Trong k¸t qu£

tr¶n, khæng câ bi¸n n o câ VIF tr¶n 5 n¶n kh£ n«ng x£y ra a cëng tuy¸n khæng ph£i l v§n · trong

mæ h¼nh.

5.2 Hçi quy tuy¸n t½nh bëi


Trong ph¦n n y, nhâm s³ x¥y düng mæ h¼nh hçi quy tuy¸n t½nh bëi vîi Cache l bi¸n

phö thuëc v Launch_date, Price, Cores, Threads, Frequency, Speed, Max_Memory_size v

Max_Memory_Bandwidth l bi¸n ëc lªp. Möc ti¶u cõa nhâm t¡c gi£ l i·u tra mèi quan h» giúa

Cache v c¡c ëc lªp n y c¡c bi¸n v º ph¡t triºn mët mæ h¼nh dü o¡n ÷îc t½nh ch½nh x¡c Cache düa

tr¶n c¡c bi¸n n y c¡c nh¥n tè. Ph¥n t½ch n y s³ cung c§p nhúng hiºu bi¸t câ gi¡ trà v· c¡c y¸u tè t¡c

ëng ¡ng kº hi»u su§t h» thèng m¡y t½nh v t¤o i·u ki»n tèi ÷u hâa c§u h¼nh h» thèng trong t÷ìng lai.

X¥y düng mæ h¼nh thèng k¶ b¬ng c¡ch sû döng h m Lm trong R. H m lm cho ph²p ÷îc t½nh mèi quan

h» giúa mët bi¸n phö thuëc v mët ho°c nhi·u bi¸n ëc lªp.

5.2.1 X¥y düng mæ h¼nh hçi quy tuy¸n t½nh bëi


Kiºm ành gi£ thuy¸t thèng k¶:

ˆ H0: H» sè hçi quy khæng câ þ ngh¾a thèng k¶

ˆ H1: H» sè hçi quy câ þ ngh¾a thèng k¶

Vîi mùc þ ngh¾a (significance level) l 5%, nh¥n tè n o câ Pr(>t) lîn hìn 0.05 s³ khæng ¤t mùc þ ngh¾a

thèng k¶ v khæng ÷ñc coi l câ £nh h÷ðng ¡ng kº ¸n gi¡ nh . Tø b£ng k¸t qu£ cõa mæ h¼nh hçi quy

tuy¸n t½nh, Pr(>t) cõa condition2 lîn hìn 0.05, v¼ vªy ta ch§p nhªn gi£ thuy¸t H cho nh¥n tè condition2.

Tùc l t§t c£ c¡c nh¥n tè trø nh¥n tè condition2 ÷ñc giú l¤i trong mæ h¼nh v ÷ñc coi l câ £nh h÷ðng

¡ng kº ¸n bë nhî »m.

H¼nh 25: K¸t qu£ mæ h¼nh hçi quy tuy¸n t½nh bëi

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 16/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

Tø k¸t qu£ tr¶n ta câ thº ph¥n t½ch :

ˆ Mæ h¼nh hçi quy tuy¸n t½nh bëi ¢ ÷ñc trang bà v ph¦n d÷ n¬m trong kho£ng tø −14337351 ¸n
27253771 vîi Quartile 1: −2055155, Trung và: −79194 v Quartile 3: 17399865. i·u n y ngö þ r¬ng
câ sü ph¥n t¡n ¡ng kº trong c¡c sai sè dü o¡n, bao gçm mët sè sai sè d÷ìng v ¥m °c bi»t lîn.

ˆ C¡c h» sè ÷îc l÷ñng (ho°c tham sè) cõa mæ h¼nh thº hi»n h÷îng v ë lîn cõa mèi quan h» giúa

c¡c bi¸n ëc lªp (Launch_date, Price, Cores, Threads, Frequency, Speed, Max_Memory_Size,

Max_Memory_Bandwidth) v bi¸n phö thuëc. Trong tr÷íng hñp n y, t§t c£ c¡c bi¸n dü o¡n ·u

câ mèi quan h» d÷ìng vîi bi¸n phö thuëc ùng, trø Max_Memory_Bandwidth câ mèi quan h» ¥m.

Tuy nhi¶n, bi¸n ëc lªp Max_Memory_Bandwidth khæng ¡ng kº (gi¡ trà p = 0,12) v¼ nâ lîn hìn

mët mùc ë thæng th÷íng l 0,05. i·u n y cho th§y r¬ng Max_Memory_Bandwidth khæng câ þ

ngh¾a thèng k¶ trong mæ h¼nh.

ˆ C¡c bi¸n cán l¤i (Launch_date, Price, Cores, Threads, Frequency, Speed, Max_Memory_Size) câ

gi¡ trà p th§p 0,05, cho th§y chóng l c¡c y¸u tè dü b¡o câ þ ngh¾a thèng k¶.

ˆ Sai sè chu©n d÷ (RSE) cõa mæ h¼nh l kho£ng 3193000. Gi¡ trà n y l th÷îc o ch­c ch­n v· ë

l»ch iºn h¼nh cõa gi¡ trà thüc t¸ so vîi gi¡ trà dü o¡n.

ˆ Gi¡ trà R-squared bëi (0,8811) v R-squared i·u ch¿nh (0,8807) gñi þ r¬ng mæ h¼nh gi£i th½ch mët

t l» ¡ng kº v· sü thay êi trong ph£n ùng. ¢ i·u ch¿nh R-squared, xû ph¤t vi»c bê sung c¡c

y¸u tè dü o¡n khæng c¦n thi¸t v o mæ h¼nh, hìi khâ th§p hìn bëi sè R b¼nh ph÷ìng, cho th§y mæ

h¼nh phò hñp tèt.

ˆ Thèng k¶ F têng thº (2106) v gi¡ trà p t÷ìng ùng cõa nâ (nhä hìn 2, 2 × 10−16 ) kiºm tra gi£ thuy¸t
r¬ng ½t nh§t mët trong c¡c y¸u tè dü o¡n câ ½ch trong vi»c gi£i th½ch ph£n ùng. Cho gi¡ trà p r§t

nhä, chóng tæi b¡c bä gi£ thuy¸t khæng, ch¿ ra r¬ng ½t nh§t mët y¸u tè dü o¡n ang âng gâp

¡ng kº v o vi»c dü o¡n ph£n ùng.

5.2.2 Hçi quy stepwise


Tø k¸t qu£ tr¶n, ta ÷a ra hai mæ h¼nh thèng k¶ nh÷ sau:

Mæ h¼nh thù nh§t bao gçm c¡c bi¸n: Launch_date, Price, nb_of_Cores, nb_of_Threads, Frequency,

Speed, Max_Memory_Size, Max_Memory_Bandwidth.

H¼nh 26: K¸t qu£ mæ h¼nh hçi quy tuy¸n t½nh bëi thù nh§t

Mæ h¼nh thù hai bao gçm c¡c bi¸n ban ¦u v ta lo¤i bä bi¸n Max_Memory_Bandwidth v¼ bi¸n â

khæng câ þ ngh¾a thèng k¶:

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 17/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

H¼nh 27: K¸t qu£ mæ h¼nh hçi quy tuy¸n t½nh bëi thù hai
Nh÷ chóng ta câ thº th§y tø k¸t qu£ tr¶n: Khi so s¡nh hai mæ h¼nh, mæ h¼nh vîi gi¡ trà AIC th§p

hìn th¼ ta ÷u ti¶n. N¸u mæ h¼nh mîi (sau khi lo¤i bä mët bi¸n) câ gi¡ trà AIC th§p hìn mæ h¼nh cô,

i·u n y câ thº ÷ñc coi l mët d§u hi»u t½ch cüc v· vi»c lo¤i bä bi¸n â. Nh÷ vªy, sau khi lo¤i bä bi¸n

Max_Memory_Bandwidth, ta nhªn ÷ñc mæ h¼nh câ gi¡ trà AIC cao hìn. V¼ vªy, ta s³ th¶m bi¸n â

v o l¤i mæ h¼nh m°c dò bi¸n â khæng mang þ ngh¾a thèng k¶.

5.2.3 Ph÷ìng tr¼nh tuy¸n t½nh


Sau khi ¡p döng kiºm tra gi£ ành v hçi quy tøng b÷îc, chóng ta câ bëi sè tuy¸n t½nh cuèi

còng mæ h¼nh hçi quy nh÷ ¢ k¸t luªn. C¡c h» sè hçi quy cho tøng bi¸n ëc lªp trong mæ h¼nh nh÷

= −7378000 + 267000 ∗ Launch_date + 1212 ∗ Price + 494600 ∗ nb_of_Cores + 302400 ∗


sau: Cache

nb_of_Thread + 0.001354 ∗ Frequency + 0.001193 ∗ Speed + 0.000002 ∗ Max_Memory_size + (−7177) ∗

Max_Memory_Bandwidth

º k¸t luªn, c¡c mæ h¼nh hçi quy tuy¸n t½nh bëi ÷ñc cung c§p gñi þ r¬ng c¡c bi¸n

bao gçm Launch_date, Price, nb_of_Cores, nb_of_Threads, Frequency, Max_Memory_size v

Max_Memory_Bandwidth .

5.2.4 Dü o¡n mæ h¼nh


Ti¸p theo nhâm kiºm tra ph÷ìng tr¼nh trong h¼nh º dü o¡n c¡c gi¡ trà Cache trong bë dú li»u thû

nghi»m nhâm ¢ chia ð tr¶n.

H¼nh 28: So s¡nh gi¡ trà thû nghi»m v dü o¡n

Mët sè nhªn x²t:

ˆ èi vîi quan s¡t ¦u ti¶n (ch¿ sè 17), Cache l 2 000 000 v mæ h¼nh dü o¡n gi¡ trà 4470947.3

ˆ Trong quan s¡t thù hai (ch¿ sè 24), Cache l 2 000 000 v mæ h¼nh dü o¡n gi¡ trà 4379477.6

ˆ Câ mët sè gi¡ trà dü o¡n ¥m (ch¿ sè 70). i·u n y câ thº l mët v§n · v¼ bi¸n ëc lªp khæng thº

câ gi¡ trà ¥m. C¦n kiºm tra l¤i mæ h¼nh v dú li»u º x¡c ành t¤i sao dü o¡n n y l¤i ¥m.

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 18/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

ˆ Câ thº câ sü bi¸n ëng lîn giúa gi¡ trà dü o¡n trong mët sè tr÷íng hñp ( t¤i ch¿ sè 17, 24, 42).

ˆ Ch¿ sè 50 v ch¿ sè 78 câ sü g¦n gièng ¡ng kº, i·u n y cho th§y mæ h¼nh ho¤t ëng tèt

Tâm l¤i, düa tr¶n thæng tin hiºn thà c¡c gi¡ trà em l¤i sè li»u hi»u qu£ cho th§y mæ h¼nh ho¤t ëng

tèt , mët v i ch¿ sè cõa mæ h¼nh c¦n ÷ñc i·u ch¿nh ho°c c£i thi»n º £m b£o r¬ng nâ ho¤t ëng tèt

tr¶n c¡c gi¡ trà kh¡c, mët v i gi¡ trà em l¤i sè li»u hi»u qu£.

6 Th£o luªn v mð rëng


6.1 Th£o luªn v· mæ h¼nh hçi quy tuy¸n t½nh
6.1.1 ×u iºm
ˆ a sè c¡c v§n · thüc t¸ ái häi ph¥n t½ch cõa nhi·u bi¸n, khæng ch¿ mët bi¸n ìn l´. Hçi quy

tuy¸n t½nh bëi sû döng º ph¥n t½ch mèi quan h» giúa mët bi¸n ph£n hçi vîi nhi·u bi¸n ëc lªp.

ˆ Sû döng hçi quy tuy¸n t½nh bëi cho ph²p ph¥n t½ch £nh h÷ðng cõa nhi·u y¸u tè ¸n bi¸n ph£n hçi

còng mët lóc, gióp ÷a ra k¸t luªn ch½nh x¡c hìn v· mèi quan h» giúa c¡c bi¸n.

ˆ Hçi quy tuy¸n t½nh bëi công cung c§p c¡c thæng tin v· ë m¤nh cõa mèi quan h» giúa bi¸n ph£n

hçi v c¡c bi¸n ëc lªp, gióp ¡nh gi¡ t¡c ëng cõa mët bi¸n ¸n bi¸n phö thuëc khi c¡c bi¸n kh¡c

÷ñc giú ð mùc gi¡ trà khæng êi.

6.1.2 Nh÷ñc iºm


Mæ h¼nh hçi quy tuy¸n t½nh gi£ ành r¬ng mèi quan h» giúa c¡c bi¸n l tuy¸n t½nh, i·u n y câ thº

khæng ph£n ¡nh óng vîi c¡c dú li»u phùc t¤p trong nhi·u t¼nh huèng thüc t¸. Do â, n¸u mèi quan h»

thüc sü khæng tuy¸n t½nh, mæ h¼nh hçi quy tuy¸n t½nh câ thº khæng ph£n ¡nh ch½nh x¡c mùc ë £nh

h÷ðng cõa c¡c bi¸n ëc lªp l¶n bi¸n phö thuëc. C¡c gi¡ trà ngo¤i l» câ thº £nh h÷ðng lîn ¸n mæ h¼nh,

°c bi»t l £nh h÷ðng ¸n c¡c ÷îc l÷ñng cõa c¡c h» sè, nhúng iºm câ thº l m suy gi£m ch½nh x¡c cõa

mæ h¼nh v d¨n ¸n ë ch½nh x¡c th§p.

6.1.3 Ùng döng


ˆ Kinh t¸ håc: Hçi quy tuy¸n t½nh bëi câ thº ÷ñc sû döng º dü o¡n gi¡ cê phi¸u, gi¡ v ng, lñi

nhuªn doanh nghi»p.

ˆ Y håc: Hçi quy tuy¸n t½nh bëi câ thº ÷ñc sû döng º x¡c ành mèi quan h» giúa c¡c y¸u tè £nh

h÷ðng ¸n sùc khäe nh÷ thâi quen «n uèng, vªn ëng, mæi tr÷íng sèng v b»nh.

ˆ Khoa håc x¢ hëi: Hçi quy tuy¸n t½nh bëi câ thº ÷ñc sû döng º x¡c ành mèi quan h» giúa c¡c

y¸u tè t¡c ëng ¸n h¤nh phóc, ch§t l÷ñng cuëc sèng v sü h i láng cõa con ng÷íi.

ˆ Khoa håc tü nhi¶n: Hçi quy tuy¸n t½nh bëi câ thº ÷ñc sû döng º x¡c ành mèi quan h» giúa c¡c

y¸u tè £nh h÷ðng ¸n mæi tr÷íng, kh½ hªu v sü ph¡t triºn cõa ëng thüc vªt.

6.2 Ùng döng mæ h¼nh hçi quy a thùc


Ð ph¦n mð rëng n y, nhâm t¡c gi£ x¥y düng tªp dú li»u tr¶n c¡c mæ h¼nh a thùc bªc n. Cö thº, khi

cho bªc cõa mæ h¼nh ch¤y tø 1 (công l mæ h¼nh gèc) ¸n 10 thu ÷ñc k¸t qu£ nh÷ sau:

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 19/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

Mæ h¼nh hçi Residual stan- Multiple R- Adjusted R- F-statistic p-value


quy a thùc dard error squared squared
bªc n

1 3203000 0.8803 0.8799 2094

2 2588000 0.9222 0.9216 1678

3 2478000 0.9289 0.9281 1229

4 2378000 0.9347 0.9338 1007

5 2339000 0.9371 0.9359 834.7


< 2.2e-16
6 2291000 0.9389 0.9385 727

7 2282000 0.9406 0.9391 628.9

8 2264000 0.9417 0.9400 559.5

9 2223000 0.9440 0.9421 517

10 2203000 0.9452 0.9432 474.5

B£ng 2: K¸t qu£ cõa mæ h¼nh hçi quy a thùc bªc 1 ¸n bªc 10
T§t c£ c¡c mæ h¼nh ð ¥y ·u câ gi¡ trà p-value < 0.05 chùng tä k¸t qu£ câ þ ngh¾a thèng k¶, ngh¾a

l gi£ thuy¸t kiºm ành H0 bà b¡c bä. B¶n c¤nh â, khi bªc cõa a thùc c ng cao th¼ bi¸n Cache ÷ñc

gi£i th½ch c ng nhi·u bði c¡c bi¸n ëc lªp. So vîi mæ h¼nh gèc l 88, 03%, th¼ mæ h¼nh hçi quy a thùc

bªc 10 câ ¸n 94, 52% bi¸n Cache ÷ñc gi£i th½ch bði c¡c bi¸n ëc lªp ¢ chån. Ti¸p theo, dü o¡n gi¡

trà Cache b¬ng mæ h¼nh hçi quy tuy¸n t½nh v mæ h¼nh hçi quy a thùc bªc 10 qua tªp dú li»u Test

(20% cõa tªp dú li»u ban ¦u), ÷ñc k¸t qu£ sau:

H¼nh 29: Dü o¡n 10 gi¡ trà ¦u ti¶n b¬ng hai mæ h¼nh

H¼nh 30: T l» dü o¡n g¦n gi¡ trà quan s¡t hìn cõa hai mæ h¼nh

K¸t qu£ n y in ra gi¡ trà kiºm tra, gi¡ trà dü o¡n, sai sè so vîi gi¡ trà kiºm tra cõa hai mæ h¼nh v

cuèi còng in ra mæ h¼nh n o câ gi¡ trà dü o¡n tèt hìn. Khi dü o¡n gi¡ trà Cache trong tªp dú li»u

Test th¼ t¿ l» m mæ h¼nh hçi quy a thùc bªc 10 cho gi¡ trà dü o¡n g¦n gi¡ trà quan s¡t hìn chi¸m

g¦n 74%. Ch½nh v¼ th¸, câ thº nâi r¬ng mæ h¼nh hçi quy tuy¸n t½nh câ k¸t qu£ dü o¡n ch÷a tèt b¬ng

c¡c mæ h¼nh kh¡c.

7 Nguçn dú li»u v nguçn code


Nguçn file Intel_CPUs: https://www.kaggle.com/datasets/iliassekkaf/computerparts/
Nguçn code: https://drive.google.com/file/d/1igl91hhSkc3IQ9yJRrhEjbRrGBzT9KYX/view?
usp=sharing

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 20/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh

8 T i li»u tham kh£o


ˆ H. Kwak, B. Lee, A. R. Hurson, Suk-Han Yoon and Woo-Jong Hahn, "Effects of multithreading
on cache performance," in IEEE Transactions on Computers, truy cªp t¤i: https://ieeexplore.
ieee.org/document/752659
ˆ Prisaganec, Milco & Mitrevski, Pece, (2016), Reducing Competitive Cache Misses in Modern
Processor Architectures, truy cªp t¤i: https://www.researchgate.net/publication/303895846_
Reducing_Competitive_Cache_Misses_in_Modern_Processor_Architectures
ˆ Green, O., Fox, J., Young, J., Shirako, J., & Bader, D, (2019), Performance Impact of Memory
Channels on Sparse and Irregular Algorithms, truy cªp t¤i: https://arxiv.org/pdf/1910.03679.
pdf
ˆ Patterson, D. A., & Hennessy, J. L. (2004), Computer Organization and Design: The Hard-
ware/Software Interface.

ˆ Algorithmica, RAM & CPU Caches: Memory Bandwidth, truy cªp t¤i: https://en.algorithmica.
org/hpc/cpu-cache/bandwidth/
ˆ Diana Mindrila, Ph.D & Phoebe Balentyne, M.Ed, Scatterplots and Correlation, truy
https://www.westga.edu/academics/research/vrc/assets/docs/scatterplots_and_
cªp t¤i:
correlation_notes.pdf
ˆ Tr÷íng ¤i håc Kinh t¸ - Luªt, HQG, TPHCM, Kh£o s¡t h¼nh d¤ng ph¥n phèi cõa tªp dú li»u,
https://maths.uel.edu.vn/Resources/Docs/SubDomain/maths/TaiLieuHocTap/
truy cªp t¤i:
ToanUngDung/kho_st_hnh_dng_phn_phi_ca_tp_d_liu.html
ˆ ThS. Nguy¹n Ch½ Minh Trung,Hçi quy v t÷ìng quan, truy cªp t¤i: http://www.ctump.edu.vn/
DesktopModules/NEWS/DinhKem/6426_Slide-bai-giang-thuc-tap-SPSS-Buoi-4-ThsTrung.
pdf

B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 21/21

You might also like