Professional Documents
Culture Documents
Nguy¹n Mành Qu¥n 2212804 Kiºm tra v têng hñp nëi dung 20% 0
Nguy¹n Trung T¥n 2213063 So¤n cì sð lþ thuy¸t v thèng k¶ suy di¹n 20% 0
Nguy¹n Quýnh Nh÷ 2212472 Thüc hi»n ph¦n thèng k¶ t£ v mð rëng 20% 0
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 1/21
Möc löc
1 Têng quan dú li»u 4
1.1 Mæ t£ t»p dú li»u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Mæ t£ bi¸n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2.2 Sü kh¡c bi»t giúa hçi quy tuy¸n t½nh bëi v ìn . . . . . . . . . . . . . . . . . . . 6
3 Ti·n xû lþ sè li»u 7
3.1 åc dú li»u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
4 Thèng k¶ t£ 10
5 Thèng k¶ suy di¹n 14
5.1 Gi£ ành . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
6.1.1 ×u iºm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 3/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
Nguçn: https://www.kaggle.com/datasets/iliassekkaf/computerparts/code?datasetId=
2442
Sè l÷ñng quan trc: Intel_CPUs: 2283
1.2 Mæ t£ bi¸n
Danh s¡ch c¡c bi¸n ch½nh c¦n quan t¥m :
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 4/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
quan h» giúa bi¸n ëc lªp v bi¸n phö thuëc. Nâ gióp chóng ta hiºu rã c¡ch bi¸n ëc lªp £nh h÷ðng ¸n
bi¸n phö thuëc v dü o¡n gi¡ trà cõa bi¸n phö thuëc düa tr¶n bi¸n ëc lªp. Hçi quy tuy¸n t½nh gi£ ành
r¬ng mèi quan h» giúa c¡c bi¸n l tuy¸n t½nh, tùc l bi¸n phö thuëc bi¸n êi mët c¡ch tuy¸n t½nh düa
Y = f (x) + ϵ = β0 + β1 x + ϵ
Trong â:
Trong mæ h¼nh (1), sü thay êi cõa Y ÷ñc gi£ sû £nh h÷ðng bði 2 y¸u tè:
E[Y |x] = β0 + β1 x,
T¡c ëng cõa c¡c y¸u tè kh¡c (khæng ph£i X ): th nh ph¦n sai sè ϵ.
Vîi (x1 , y1 ), ..., (xn , yn ) l n c°p gi¡ trà quan trc cõa mët m¨u ng¨u nhi¶n cï n, tø (1) ta câ
Yi = β0 + β1 xi + ϵi , i = 1, 2, ..., n
Mët mæ h¼nh hçi quy tuy¸n t½nh ìn c¦n c¡c gi£ ành:
Hçi quy tuy¸n t½nh bëi: Sû döng hai ho°c nhi·u bi¸n ëc lªp º dü o¡n bi¸n phö thuëc, Mæ h¼nh
mèi quan h» tuy¸n t½nh giúa nhi·u bi¸n ëc lªp v bi¸n phö thuëc. Mæ h¼nh n y câ thº ÷ñc biºu di¹n
d÷îi d¤ng si¶u ph¯ng (plane) ho°c si¶u khæng gian (hyperplane) trong khæng gian nhi·u chi·u.
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 5/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
0. Thæng th÷íng, tr¶n ç thà, β0 ch½nh l iºm n¬m tr¶n tröc Oy . T¤i và tr½ m ÷íng hçi quy giao vîi
tröc Oy .
β1 , β2 , βn : ¥y l h» sè hçi quy (h» sè gâc). Cö thº hìn, h» sè hçi quy l sü ph£n ¡nh mùc thay êi
cõa gi¡ trà Y khi X thay êi. V méi mët sü thay êi cõa bi¸n X s³ t÷ìng ùng vîi mët gi¡ trà Y kh¡c
nhau tr¶n ç thà. Tâm l¤i, β1 , β2 , βn l k¸t qu£ cõa Y khi c¡c bi¸n X t÷ìng ùng thay êi. V h» sè n y
ϵ: l sai sè. ¥y l gi¡ trà biºu hi»n cho sü sai l»ch trong mèi t÷ìng quan giúa hai bi¸n l bi¸n ëc lªp
v bi¸n phö thuëc. Khi gi¡ trà ϵ c ng lîn th¼ kh£ n«ng kiºm ành cõa ph÷ìng ph¡p hçi quy tuy¸n t½nh s³
trð n¶n k²m i. S³ d¨n tîi nhúng sai l»ch nhi·u tr¶n thüc ti¹n. C¡c sai sè n y s³ l ¤i di»n cõa c¡c bi¸n
ëc lªp ngo i mæ h¼nh kiºm ành ho°c l b§t ký sai sè ng¨u nhi¶n n o â trong b i to¡n nghi¶n cùu.
Hçi quy tuy¸n t½nh bëi cung c§p kh£ n«ng mæ h¼nh hâa mèi quan h» phùc t¤p hìn giúa bi¸n ëc lªp
2.2.2 Sü kh¡c bi»t giúa hçi quy tuy¸n t½nh bëi v ìn
Hçi quy tuy¸n t½nh bëi v ìn l hai ph÷ìng ph¡p kh¡c nhau trong mæ h¼nh hçi quy, mët ph¦n cõa
thèng k¶ v m¡y håc ÷ñc sû döng º dü o¡n gi¡ trà cõa mët bi¸n phö thuëc düa tr¶n mët ho°c nhi·u
hai bi¸n ng¨u nhi¶n. Lo¤i h» sè t÷ìng quan ÷ñc sû döng rëng r¢i nh§t l Pearson r. Ph¥n t½ch n y gi£
ành r¬ng hai bi¸n ang ÷ñc ph¥n t½ch ÷ñc o l÷íng tr¶n ½t nh§t c¡c thang o kho£ng c¡ch , câ ngh¾a
l chóng ÷ñc o l÷íng tr¶n mët ph¤m vi gi¡ trà t«ng d¦n. H» sè ÷ñc t½nh b¬ng c¡ch l§y hi»p ph÷ìng
sai cõa hai bi¸n v chia nâ cho t½ch cõa ë l»ch chu©n cõa chóng .
H» sè t÷ìng quan câ thº n¬m trong kho£ng tø −1.00 ¸n +1.00 trong â gi¡ trà −1.00 ¤i di»n cho
mèi t÷ìng quan ¥m ho n h£o, câ ngh¾a l khi gi¡ trà cõa mët bi¸n t«ng l¶n, bi¸n kia gi£m trong khi gi¡
trà +1.00 ¤i di»n cho mèi quan h» d÷ìng ho n h£o, câ ngh¾a l khi mët bi¸n t«ng gi¡ trà, bi¸n kia công
vªy. C¡c gi¡ trà nh÷ th¸ n y b¡o hi»u mèi quan h» tuy¸n t½nh ho n h£o giúa hai bi¸n, v¼ vªy n¸u b¤n
v³ k¸t qu£ tr¶n biºu ç, nâ s³ t¤o th nh mët ÷íng th¯ng, nh÷ng gi¡ trà 0,00 câ ngh¾a l khæng câ mèi
quan h» n o giúa c¡c bi¸n ang ÷ñc kiºm tra v s³ ÷ñc v³ biºu ç nh÷ c¡c dáng ri¶ng bi»t ho n to n.
V½ dö, n¸u chóng ta muèn bi¸t li»u câ mèi li¶n h» giúa nhi»t ë v sü sinh tr÷ðng chi·u cao cõa thüc
vªt hay khæng, mët h» sè t÷ìng quan câ thº ÷ñc t½nh to¡n º tr£ líi c¥u häi n y.
kiºm tra t÷ìng quan tham sè v¼ nâ phö thuëc v o kiºu ph¥n phèi dú li»u. Ch¿ ÷ñc sû döng khi dú li»u
tu¥n theo luªt ph¥n phèi chu©n (normal istribution). ç thà cõa y = f (x) gåi l ÷íng cong hçi quy
tuy¸n t½nh.
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 6/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
n o, ch¯ng h¤n nh÷ th§t nghi»p v tëi ph¤m; v hå câ thº l m s¡ng tä c¡ch thùc m nhúng tr£i nghi»m
v °c iºm x¢ hëi ành h¼nh nhúng g¼ x£y ra trong cuëc sèng cõa mët ng÷íi. Ph¥n t½ch t÷ìng quan cho
ph²p chóng ta nâi mët c¡ch tü tin r¬ng mèi quan h» câ ho°c khæng tçn t¤i giúa hai m¨u ho°c bi¸n kh¡c
nhau, i·u n y cho ph²p chóng ta dü o¡n x¡c su§t cõa mët k¸t qu£ trong têng thº ÷ñc nghi¶n cùu.
Mët nghi¶n cùu g¦n ¥y v· hæn nh¥n v gi¡o döc cho th§y mèi t÷ìng quan nghàch giúa tr¼nh ë håc
v§n v t l» ly hæn. Dú li»u tø i·u tra Quèc gia v· T«ng tr÷ðng Gia ¼nh cho th§y khi tr¼nh ë håc v§n
cõa phö nú t«ng l¶n, t l» ly hæn èi vîi c¡c cuëc hæn nh¥n ¦u ti¶n s³ gi£m xuèng.
3 Ti·n xû lþ sè li»u
3.1 åc dú li»u
Dòng l»nh read.csv º åc dú li»u v o bi¸n cpu_df v in ra tr¶n terminal º kiºm tra xem data câ
H¼nh 1: åc dú li»u cõa file Intel_CPUs.csv v o bi¸n cpu_df v in ra 10 dáng ¦u ti¶n cõa méi cët
thüc b¬ng R:
H¼nh 2: L÷u dú li»u con gçm c¡c bi¸n ch½nh tø bi¸n cpu_df v o bi¸n new_cpu_df
º gi£i th½ch cho vi»c sû döng c¡c bi¸n â, ta câ biºu ç cho t¿ l» khuy¸t cõa tøng bi¸n trong dataset
Tø biºu ç, ta câ thº nh¼n th§y v chån ra c¡c bi¸n câ t¿ l» khuy¸t th§p nh÷ Bus_Speed,
mended_Customer_Price. Ngo i ra, c¡c bi¸n n y cán £nh h÷ðng ¸n Cache ÷ñc chùng minh qua mët
sè t i li»u s¡ch b¡o (nhâm t¡c gi£ s³ tr½ch d¨n nguçn ð ph¦n t i li»u tham kh£o).
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 7/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
H¼nh 3: Biºu ç thº hi»n t¿ l» khuy¸t cõa tøng bi¸n câ trong dataset
3.2.2 Kiºm tra c¡c dú li»u bà khuy¸t
Ta t¼m c¡c gi¡ trà bà khuy¸t trong new_cpu_df.
Nhªn x²t: C¡c dú li»u khuy¸t ÷ñc t½nh trong o¤n code tr¶n bao gçm c¡c dú li»u réng, dú li»u
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 8/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
Ti¸p theo, ta s³ xo¡ bä c¡c h ng mang gi¡ trà réng trong bi¸n Product_Collection, sau â chån ra tø
H¼nh 5: Xo¡ c¡c æ trèng v thay êi t¶n th nh c¡c tø khoa trong bi¸n Product_Collection
Ti¸p theo, ta s³ t½nh gi¡ trà trung b¼nh cõa bi¸n Recommended_Customer_Price v thay v o c¡c æ
dú li»u bà khuy¸t. L÷u þ ð ¥y s³ câ mët v i gi¡ trà ð d¤ng kho£ng (v½ dö: $70.00 − $77.00) n¶n ta s³ thay
thº c¡c gi¡ trà câ kho£ng b¬ng ch½nh gi¡ trà trung b¼nh cõa nâ v mîi ti¸n h nh t½nh trung b¼nh cõa bi¸n
Ti¸p theo, ta s³ thay êi ìn và cõa bi¸n Processor_Base_Frequency th nh Hz v sau â thay th¸
Nhªn x²t: bði v¼ gi¡ trà cõa bi¸n Processor_Base_Frequency ph£i luæn d÷ìng n¶n ta s³ khæng thay
th¸ sè 0 v o c¡c æ bà khuy¸t m s³ thay b¬ng gi¡ trà trung b¼nh cõa c¡c æ cán l¤i.
ìn và cõa c¡c bi¸n â (Cache quy v· ìn và Byte, Bus_Speed quy v· ìn và Hz/s, Max_Memory_Size
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 9/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
Cuèi còng, vîi c¡c bi¸n ta ch÷a xû lþ dú li»u khuy¸t, ta s³ t½nh to¡n gi¡ trà trung b¼nh cõa tøng bi¸n
Sau khi thay th¸ h¸t dú li»u bà khuy¸t, ta ti¸n h nh kiºm tra xem cán dú li»u n o bà khuy¸t khæng :
Nhªn x²t: Nh÷ vªy khæng cán dú li»u n o trong new_cpu_df bà khuy¸t, ta chuyºn sang b÷îc ti¸p
theo.
4 Thèng k¶ t£
Sau khi l m s¤ch dú li»u, ti¸n h nh thèng k¶ mæ t£ cho c¡c bi¸n ng¨u nhi¶n. K¸t qu£ thu ÷ñc tr£ v·
gi¡ trà nhä nh§t (Min.), iºm ph¥n và thù nh§t (1st Qu.), trung và (Median), gi¡ trà trung b¼nh (Mean),
iºm ph¥n và thù ba (3rd Qu.) v gi¡ trà lîn nh§t (Max.) cõa tøng bi¸n (h¼nh 12):
H¼nh 12: K¸t qu£ thèng k¶ mæ t£ cõa tøng bi¸n ng¨u nhi¶n ¢ chån trong Intel_CPUs
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 10/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
Ti¸p theo, nhâm t¡c gi£ ph¥n t½ch dú li»u cõa bi¸n b¬ng c¡ch trüc quan hâa dú li»u qua hai d¤ng
biºu ç l biºu ç t¦n su§t (histogram) v biºu ç hëp (boxplot) cho c¡c bi¸n li¶n töc. Biºu ç t¦n sè
s³ cho th§y c¡i nh¼n têng quan v· ph¥n phèi cõa bi¸n. Biºu ç hëp gióp biºu di¹n rã r ng c¡c ¤i l÷ñng
quan trång cõa bi¸n nh÷ gi¡ trà lîn nh§t, nhä nh§t, iºm ph¥n và,. . .
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 11/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
Launch_Date: Thíi iºm ra mt CPU rìi v o kho£ng tø n«m 2000 ¸n n«m 2018, v trong nûa
¦u n«m 2013 câ l÷ñng CPU ÷ñc s£n xu§t ra lîn nh§t vîi kho£ng 500 CPU. Gi¡ trà trung b¼nh
b¬ng gi¡ trà trung và l 13.12 chùng tä bi¸n Launch_Date câ h¼nh d¡ng ph¥n phèi l»ch èi xùng.
Recommended_Customer_Price: Gi¡ b¡n khuy¸n nghà cõa CPU dao ëng trong kho£ng tø $2.54
¸n $13011, tuy nhi¶n ph¦n lîn CPU câ gi¡ b¡n dao ëng tø $800 ¸n$1000, vîi hìn 1000 CPU
÷ñc · nghà ð mùc gi¡ n y. Gi¡ trà trung b¼nh v trung và ·u b¬ng $850.70, cho th§y r¬ng bi¸n
nb_of_Cores: Sè l÷ñng core dao ëng tø 1 (nh¥n) ¸n 72 (nh¥n), tªp trung nhi·u nh§t ð kho£ng
tø 2 (nh¥n) trð xuèng vîi g¦n 1300 CPU sû döng sè l÷ñng core n y. Gi¡ trà trung b¼nh l 4,067
(nh¥n) lîn hìn gi¡ trà trung và l 2 (nh¥n) chùng tä h¼nh d¡ng ph¥n phèi cõa bi¸n nb_of_Cores
l»ch ph£i.
nb_of_Threads: Sè l÷ñng thread n¬m trong ph¤m vi tø 1 (luçng) ¸n 56 (luçng), tuy nhi¶n, nhi·u
nh§t l hìn 800 CPU sû döng 9 (luçng). Gi¡ trà trung b¼nh l 8.83 (luçng) nhä hìn gi¡ trà trung và
l 9 (luçng) chùng tä h¼nh d¡ng ph¥n phèi cõa bi¸n nb_of_Threads l»ch tr¡i.
Processor_Base_Frequency: Tèc ë dao ëng 3.2 × 107 (Hz) ¸n 4.3 × 109 (Hz), tèc ë ph¥n bè
9 9
tªp trung trong kho£ng 2.2 × 10 - 2.3 × 10 (Hz) vîi hìn 100 CPU. Gi¡ trà trung b¼nh l 2.22 × 109
(Hz) b¬ng gi¡ trà trung và chùng tä h¼nh d¡ng ph¥n phèi cõa bi¸n Processor_Base_Frequency
èi xùng.
Cache: Dung l÷ñng cõa bë nhî cache dao ëng tø 8000 (byte) ¸n 6 × 107 (byte), tªp trung nhi·u
7
nh§t d÷îi kho£ng 0.1 × 10 (byte) vîi hìn 500 CPU câ dung l÷ñng ð mùc n y. Gi¡ trà trung b¼nh
6
l 7.08 × 10 (byte) lîn hìn gi¡ trà trung và l 3 × 106 (byte) chùng tä h¼nh d¡ng ph¥n phèi cõa
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 12/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
Bus_Speed: Tèc ë xû lþ dú li»u trong mët gi¥y cõa CPU n¬m trong kho£ng 0 ¸n 9.6×109 (Hz/s),
9
ph¥n bè nhi·u nh§t trong kho£ng d÷îi 0.2 × 10 (Hz/s) vîi g¦n 900 CPU. Gi¡ trà trung b¼nh l
1.55 × 109 (Hz/s) lîn hìn gi¡ trà trung và l 5.33 × 108 (Hz/s) chùng tä h¼nh d¡ng ph¥n phèi cõa
bi¸n Bus_Speed l»ch ph£i.
Max_Memory_Size: Dung l÷ñng tèi a cõa bë nhî thay êi trong ph¤m và tø 109 (byte) ¸n
12 12
4, 1 × 10 (byte), v tªp trung chõ y¸u d÷îi mùc 0.1 × 10 (byte) vîi x§p x¿ 900 CPU. Gi¡
11
trà trung b¼nh l 2.689 × 10 (byte) b¬ng vîi trung và chùng tä h¼nh d¡ng ph¥n phèi cõa bi¸n
Max_Memory_Bandwidth: Dung l÷ñng tèi a cõa b«ng thæng thay êi trong ph¤m và tø 1.6
(GB/s) ¸n 352 (GB/s), v ph¥n bè nhi·u nh§t tø 30 - 40 (GB/s) vîi g¦n 1300 CPU. Gi¡ trà
trung b¼nh l b¬ng vîi gi¡ trà trung và l 35.08 (GB/s) chùng tä h¼nh d¡ng ph¥n phèi cõa bi¸n
Product_Collection: T§t c£ c¡c CPU trong tªp dú li»u ·u n¬m trong 7 bë s÷u tªp s£n ph©m ch½nh
l Atom, Celeron, Core Itanium, Quark v Xeon. Tuy nhi¶n ph¦n lîn c¡c CPU thuëc bë
Ti¸p theo â, nhâm ti¸n h nh v³ biºu ç t÷ìng quan v lªp b£ng h» sè t÷ìng quan giúa c¡c bi¸n
÷ñc chån tø file Intel_CPUs nh¬m trüc quan hâa sü phö thuëc tuy¸n t½nh giúa c¡c bi¸n:
H¼nh 22: Biºu ç t÷ìng quan ùng vîi h» sè t÷ìng quan giúa tøng c°p bi¸n trong file Intel_CPUs
Qua c¡c dú li»u v· t÷ìng quan tuy¸n t½nh nh÷ tr¶n, nhâm ÷a ra nhªn x²t nh÷ sau:
Launch_Date: Bi¸n Launch_Date câ t÷ìng quan thuªn vîi c¡c bi¸n kh¡c. H¦u h¸t c¡c h» sè
t÷ìng quan vîi c¡c bi¸n kh¡c ·u n¬m trong kho£ng t÷ìng quan r§t y¸u. Do â, câ thº nâi r¬ng
khi bi¸n Launch_Date t«ng s³ khæng t¡c ëng ¡ng kº ¸n c¡c bi¸n cán l¤i.
h¦u h¸t c¡c bi¸n cán l¤i. Bi¸n n y câ t÷ìng quan ð mùc y¸u v trung b¼nh vîi c¡c bi¸n, v câ t÷ìng
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 13/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
quan cao nh§t vîi hai bi¸n Cache v nb_of_Threads. Ch½nh v¼ th¸, gi¡ b¡n khuy¸n nghà s³ c ng
cao n¸u CPU câ dung l÷ñng bë nhî cache v tèc ë xû lþ dú li»u c ng lîn.
nb_of_Cores: Bi¸n nb_of_Cores câ t÷ìng quan thuªn vîi c¡c bi¸n kh¡c. H¦u h¸t sü t÷ìng quan
vîi c¡c bi¸n kh¡c n¬m ð mùc tø y¸u ¸n trung b¼nh. çng thíi, t÷ìng quan tèt nh§t vîi hai bi¸n
Cache v Max_Memory_Bandwidth. Ch½nh v¼ th¸, n¸u sè l÷ñng nh¥n cõa CPU t«ng th¼ dung
nb_of_Threads: Bi¸n nb_of_Threads t÷ìng quan thuªn vîi c¡c bi¸n cán l¤i trong tªp dú li»u.
H¦u h¸t c¡c h» sè t÷ìng quan vîi c¡c bi¸n kh¡c ·u n¬m trong kho£ng t÷ìng quan trung b¼nh, v
t÷ìng quan m¤nh nh§t vîi bi¸n Cache v Recommeded_Customer_Price. Nh÷ nhâm ¢ tr¼nh
b y ph½a tr¶n, c ng nhi·u luçng th¼ gi¡ b¡n cõa CPU s³ c ng cao, t÷ìng tü vîi bë nhî cache.
Cache: Bi¸n Cache t÷ìng quan thuªn kh¡ tèt vîi h¦u h¸t c¡c bi¸n cán l¤i. Ngo¤i trø t÷ìng quan
y¸u vîi Launch_Date, th¼ t÷ìng quan vîi c¡c bi¸n cán l¤i ·u n¬m ð mùc trung b¼nh. V¼ vªy, khi
t«ng dung l÷ñng bë nhî cache th¼ g¦n nh÷ c¡c th nh ph¦n cán l¤i cõa CPU công t«ng theo.
Processor_Base_Frequency: Bi¸n Processor_Base_Frequency g¦n nh÷ khæng t÷ìng quan vîi t§t
c£ c¡c bi¸n cán l¤i. Chùng tä r¬ng n¸u t«ng tèc ë n y, th¼ c¡c th nh ph¦n cán l¤i cõa CPU công
Bus_Speed: Bi¸n Bus_Speed t÷ìng quan thuªn vîi c¡c bi¸n cán l¤i. Ph¦n lîn bi¸n Bus_Speed
t÷ìng quan vîi c¡c bi¸n kh¡c ð mùc y¸u, vîi bi¸n Cache v Max_Memory_Size l câ t÷ìng
quan tèt nh§t. Nhí vªy, n¸u t«ng tèc ë xû lþ dú li»u l¶n th¼ dung l÷ñng bë nhî cache v k½ch
Max_Memory_Size v Max_Memory_Bandwidth: Hai bi¸n n y t÷ìng quan thuªn kh¡ çng ·u
vîi c¡c bi¸n kh¡c. C¡c h» sè t÷ìng quan ·u n¬m ð mùc trung b¼nh y¸u. Do â, khi t«ng dung
l÷ñng tèi a cõa bë nhî v b«ng thæng bë nhî l¶n th¼ c¡c th nh ph¦n kh¡c cõa CPU công t«ng.
Qua nhúng nhªn x²t tr¶n, nhâm t¡c gi£ nhªn th§y bi¸n Cache câ t÷ìng quan tèt nh§t vîi ph¦n lîn c¡c
bi¸n kh¡c trong CPU. Ch½nh v¼ th¸, sü phö thuëc tuy¸n t½nh cõa bë nhî cõa cache vîi c¡c th nh ph¦n
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 14/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
Nhªn x²t: Tø bèn h¼nh tr¶n, ta suy ra ÷ñc ph¦n d÷ trong mæ h¼nh câ d¤ng ph¥n phèi chu©n. Ta
Nhªn x²t: Tø k¸t qu£ tr¶n, ta câ thº th§y R-squared = 0.8811 (kh¡ g¦n 1). i·u â çng ngh¾a vîi
vi»c ph¦n lîn sü phö thuëc cõa bi¸n Cache câ thº ÷ñc gi£i th½ch bði a sè c¡c bi¸n ëc lªp trong mæ
h¼nh.
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 15/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
t½nh l¨n nhau. Ta sû döng h» sè l¤m ph¡t ph÷ìng sai (VIF) º kiºm tra t½nh a cëng tuy¸n giúa c¡c
bi¸n. VIF l th÷îc o mùc ë sü bi¸n thi¶n ph÷ìng sai cõa hçi quy tuy¸n t½nh düa v o hi»n t÷ñng a
cëng tuy¸n.
Thæng th÷íng, h» sè l¤m ph¡t lîn hìn 5 cho th§y mùc ë a cëng tuy¸n câ v§n ·. Trong k¸t qu£
tr¶n, khæng câ bi¸n n o câ VIF tr¶n 5 n¶n kh£ n«ng x£y ra a cëng tuy¸n khæng ph£i l v§n · trong
mæ h¼nh.
Max_Memory_Bandwidth l bi¸n ëc lªp. Möc ti¶u cõa nhâm t¡c gi£ l i·u tra mèi quan h» giúa
Cache v c¡c ëc lªp n y c¡c bi¸n v º ph¡t triºn mët mæ h¼nh dü o¡n ÷îc t½nh ch½nh x¡c Cache düa
tr¶n c¡c bi¸n n y c¡c nh¥n tè. Ph¥n t½ch n y s³ cung c§p nhúng hiºu bi¸t câ gi¡ trà v· c¡c y¸u tè t¡c
ëng ¡ng kº hi»u su§t h» thèng m¡y t½nh v t¤o i·u ki»n tèi ÷u hâa c§u h¼nh h» thèng trong t÷ìng lai.
X¥y düng mæ h¼nh thèng k¶ b¬ng c¡ch sû döng h m Lm trong R. H m lm cho ph²p ÷îc t½nh mèi quan
h» giúa mët bi¸n phö thuëc v mët ho°c nhi·u bi¸n ëc lªp.
Vîi mùc þ ngh¾a (significance level) l 5%, nh¥n tè n o câ Pr(>t) lîn hìn 0.05 s³ khæng ¤t mùc þ ngh¾a
thèng k¶ v khæng ÷ñc coi l câ £nh h÷ðng ¡ng kº ¸n gi¡ nh . Tø b£ng k¸t qu£ cõa mæ h¼nh hçi quy
tuy¸n t½nh, Pr(>t) cõa condition2 lîn hìn 0.05, v¼ vªy ta ch§p nhªn gi£ thuy¸t H cho nh¥n tè condition2.
Tùc l t§t c£ c¡c nh¥n tè trø nh¥n tè condition2 ÷ñc giú l¤i trong mæ h¼nh v ÷ñc coi l câ £nh h÷ðng
H¼nh 25: K¸t qu£ mæ h¼nh hçi quy tuy¸n t½nh bëi
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 16/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
Mæ h¼nh hçi quy tuy¸n t½nh bëi ¢ ÷ñc trang bà v ph¦n d÷ n¬m trong kho£ng tø −14337351 ¸n
27253771 vîi Quartile 1: −2055155, Trung và: −79194 v Quartile 3: 17399865. i·u n y ngö þ r¬ng
câ sü ph¥n t¡n ¡ng kº trong c¡c sai sè dü o¡n, bao gçm mët sè sai sè d÷ìng v ¥m °c bi»t lîn.
C¡c h» sè ÷îc l÷ñng (ho°c tham sè) cõa mæ h¼nh thº hi»n h÷îng v ë lîn cõa mèi quan h» giúa
c¡c bi¸n ëc lªp (Launch_date, Price, Cores, Threads, Frequency, Speed, Max_Memory_Size,
Max_Memory_Bandwidth) v bi¸n phö thuëc. Trong tr÷íng hñp n y, t§t c£ c¡c bi¸n dü o¡n ·u
câ mèi quan h» d÷ìng vîi bi¸n phö thuëc ùng, trø Max_Memory_Bandwidth câ mèi quan h» ¥m.
Tuy nhi¶n, bi¸n ëc lªp Max_Memory_Bandwidth khæng ¡ng kº (gi¡ trà p = 0,12) v¼ nâ lîn hìn
mët mùc ë thæng th÷íng l 0,05. i·u n y cho th§y r¬ng Max_Memory_Bandwidth khæng câ þ
C¡c bi¸n cán l¤i (Launch_date, Price, Cores, Threads, Frequency, Speed, Max_Memory_Size) câ
gi¡ trà p th§p 0,05, cho th§y chóng l c¡c y¸u tè dü b¡o câ þ ngh¾a thèng k¶.
Sai sè chu©n d÷ (RSE) cõa mæ h¼nh l kho£ng 3193000. Gi¡ trà n y l th÷îc o chc chn v· ë
l»ch iºn h¼nh cõa gi¡ trà thüc t¸ so vîi gi¡ trà dü o¡n.
Gi¡ trà R-squared bëi (0,8811) v R-squared i·u ch¿nh (0,8807) gñi þ r¬ng mæ h¼nh gi£i th½ch mët
t l» ¡ng kº v· sü thay êi trong ph£n ùng. ¢ i·u ch¿nh R-squared, xû ph¤t vi»c bê sung c¡c
y¸u tè dü o¡n khæng c¦n thi¸t v o mæ h¼nh, hìi khâ th§p hìn bëi sè R b¼nh ph÷ìng, cho th§y mæ
Thèng k¶ F têng thº (2106) v gi¡ trà p t÷ìng ùng cõa nâ (nhä hìn 2, 2 × 10−16 ) kiºm tra gi£ thuy¸t
r¬ng ½t nh§t mët trong c¡c y¸u tè dü o¡n câ ½ch trong vi»c gi£i th½ch ph£n ùng. Cho gi¡ trà p r§t
nhä, chóng tæi b¡c bä gi£ thuy¸t khæng, ch¿ ra r¬ng ½t nh§t mët y¸u tè dü o¡n ang âng gâp
Mæ h¼nh thù nh§t bao gçm c¡c bi¸n: Launch_date, Price, nb_of_Cores, nb_of_Threads, Frequency,
H¼nh 26: K¸t qu£ mæ h¼nh hçi quy tuy¸n t½nh bëi thù nh§t
Mæ h¼nh thù hai bao gçm c¡c bi¸n ban ¦u v ta lo¤i bä bi¸n Max_Memory_Bandwidth v¼ bi¸n â
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 17/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
H¼nh 27: K¸t qu£ mæ h¼nh hçi quy tuy¸n t½nh bëi thù hai
Nh÷ chóng ta câ thº th§y tø k¸t qu£ tr¶n: Khi so s¡nh hai mæ h¼nh, mæ h¼nh vîi gi¡ trà AIC th§p
hìn th¼ ta ÷u ti¶n. N¸u mæ h¼nh mîi (sau khi lo¤i bä mët bi¸n) câ gi¡ trà AIC th§p hìn mæ h¼nh cô,
i·u n y câ thº ÷ñc coi l mët d§u hi»u t½ch cüc v· vi»c lo¤i bä bi¸n â. Nh÷ vªy, sau khi lo¤i bä bi¸n
Max_Memory_Bandwidth, ta nhªn ÷ñc mæ h¼nh câ gi¡ trà AIC cao hìn. V¼ vªy, ta s³ th¶m bi¸n â
còng mæ h¼nh hçi quy nh÷ ¢ k¸t luªn. C¡c h» sè hçi quy cho tøng bi¸n ëc lªp trong mæ h¼nh nh÷
Max_Memory_Bandwidth
º k¸t luªn, c¡c mæ h¼nh hçi quy tuy¸n t½nh bëi ÷ñc cung c§p gñi þ r¬ng c¡c bi¸n
Max_Memory_Bandwidth .
èi vîi quan s¡t ¦u ti¶n (ch¿ sè 17), Cache l 2 000 000 v mæ h¼nh dü o¡n gi¡ trà 4470947.3
Trong quan s¡t thù hai (ch¿ sè 24), Cache l 2 000 000 v mæ h¼nh dü o¡n gi¡ trà 4379477.6
Câ mët sè gi¡ trà dü o¡n ¥m (ch¿ sè 70). i·u n y câ thº l mët v§n · v¼ bi¸n ëc lªp khæng thº
câ gi¡ trà ¥m. C¦n kiºm tra l¤i mæ h¼nh v dú li»u º x¡c ành t¤i sao dü o¡n n y l¤i ¥m.
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 18/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
Câ thº câ sü bi¸n ëng lîn giúa gi¡ trà dü o¡n trong mët sè tr÷íng hñp ( t¤i ch¿ sè 17, 24, 42).
Ch¿ sè 50 v ch¿ sè 78 câ sü g¦n gièng ¡ng kº, i·u n y cho th§y mæ h¼nh ho¤t ëng tèt
Tâm l¤i, düa tr¶n thæng tin hiºn thà c¡c gi¡ trà em l¤i sè li»u hi»u qu£ cho th§y mæ h¼nh ho¤t ëng
tèt , mët v i ch¿ sè cõa mæ h¼nh c¦n ÷ñc i·u ch¿nh ho°c c£i thi»n º £m b£o r¬ng nâ ho¤t ëng tèt
tr¶n c¡c gi¡ trà kh¡c, mët v i gi¡ trà em l¤i sè li»u hi»u qu£.
tuy¸n t½nh bëi sû döng º ph¥n t½ch mèi quan h» giúa mët bi¸n ph£n hçi vîi nhi·u bi¸n ëc lªp.
Sû döng hçi quy tuy¸n t½nh bëi cho ph²p ph¥n t½ch £nh h÷ðng cõa nhi·u y¸u tè ¸n bi¸n ph£n hçi
còng mët lóc, gióp ÷a ra k¸t luªn ch½nh x¡c hìn v· mèi quan h» giúa c¡c bi¸n.
Hçi quy tuy¸n t½nh bëi công cung c§p c¡c thæng tin v· ë m¤nh cõa mèi quan h» giúa bi¸n ph£n
hçi v c¡c bi¸n ëc lªp, gióp ¡nh gi¡ t¡c ëng cõa mët bi¸n ¸n bi¸n phö thuëc khi c¡c bi¸n kh¡c
khæng ph£n ¡nh óng vîi c¡c dú li»u phùc t¤p trong nhi·u t¼nh huèng thüc t¸. Do â, n¸u mèi quan h»
thüc sü khæng tuy¸n t½nh, mæ h¼nh hçi quy tuy¸n t½nh câ thº khæng ph£n ¡nh ch½nh x¡c mùc ë £nh
h÷ðng cõa c¡c bi¸n ëc lªp l¶n bi¸n phö thuëc. C¡c gi¡ trà ngo¤i l» câ thº £nh h÷ðng lîn ¸n mæ h¼nh,
°c bi»t l £nh h÷ðng ¸n c¡c ÷îc l÷ñng cõa c¡c h» sè, nhúng iºm câ thº l m suy gi£m ch½nh x¡c cõa
Y håc: Hçi quy tuy¸n t½nh bëi câ thº ÷ñc sû döng º x¡c ành mèi quan h» giúa c¡c y¸u tè £nh
h÷ðng ¸n sùc khäe nh÷ thâi quen «n uèng, vªn ëng, mæi tr÷íng sèng v b»nh.
Khoa håc x¢ hëi: Hçi quy tuy¸n t½nh bëi câ thº ÷ñc sû döng º x¡c ành mèi quan h» giúa c¡c
y¸u tè t¡c ëng ¸n h¤nh phóc, ch§t l÷ñng cuëc sèng v sü h i láng cõa con ng÷íi.
Khoa håc tü nhi¶n: Hçi quy tuy¸n t½nh bëi câ thº ÷ñc sû döng º x¡c ành mèi quan h» giúa c¡c
y¸u tè £nh h÷ðng ¸n mæi tr÷íng, kh½ hªu v sü ph¡t triºn cõa ëng thüc vªt.
cho bªc cõa mæ h¼nh ch¤y tø 1 (công l mæ h¼nh gèc) ¸n 10 thu ÷ñc k¸t qu£ nh÷ sau:
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 19/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
B£ng 2: K¸t qu£ cõa mæ h¼nh hçi quy a thùc bªc 1 ¸n bªc 10
T§t c£ c¡c mæ h¼nh ð ¥y ·u câ gi¡ trà p-value < 0.05 chùng tä k¸t qu£ câ þ ngh¾a thèng k¶, ngh¾a
l gi£ thuy¸t kiºm ành H0 bà b¡c bä. B¶n c¤nh â, khi bªc cõa a thùc c ng cao th¼ bi¸n Cache ÷ñc
gi£i th½ch c ng nhi·u bði c¡c bi¸n ëc lªp. So vîi mæ h¼nh gèc l 88, 03%, th¼ mæ h¼nh hçi quy a thùc
bªc 10 câ ¸n 94, 52% bi¸n Cache ÷ñc gi£i th½ch bði c¡c bi¸n ëc lªp ¢ chån. Ti¸p theo, dü o¡n gi¡
trà Cache b¬ng mæ h¼nh hçi quy tuy¸n t½nh v mæ h¼nh hçi quy a thùc bªc 10 qua tªp dú li»u Test
(20% cõa tªp dú li»u ban ¦u), ÷ñc k¸t qu£ sau:
H¼nh 29: Dü o¡n 10 gi¡ trà ¦u ti¶n b¬ng hai mæ h¼nh
H¼nh 30: T l» dü o¡n g¦n gi¡ trà quan s¡t hìn cõa hai mæ h¼nh
K¸t qu£ n y in ra gi¡ trà kiºm tra, gi¡ trà dü o¡n, sai sè so vîi gi¡ trà kiºm tra cõa hai mæ h¼nh v
cuèi còng in ra mæ h¼nh n o câ gi¡ trà dü o¡n tèt hìn. Khi dü o¡n gi¡ trà Cache trong tªp dú li»u
Test th¼ t¿ l» m mæ h¼nh hçi quy a thùc bªc 10 cho gi¡ trà dü o¡n g¦n gi¡ trà quan s¡t hìn chi¸m
g¦n 74%. Ch½nh v¼ th¸, câ thº nâi r¬ng mæ h¼nh hçi quy tuy¸n t½nh câ k¸t qu£ dü o¡n ch÷a tèt b¬ng
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 20/21
Tr÷íng ¤i Håc B¡ch Khoa Tp.Hç Ch½ Minh
Khoa Khoa Håc & Kÿ Thuªt M¡y T½nh
Algorithmica, RAM & CPU Caches: Memory Bandwidth, truy cªp t¤i: https://en.algorithmica.
org/hpc/cpu-cache/bandwidth/
Diana Mindrila, Ph.D & Phoebe Balentyne, M.Ed, Scatterplots and Correlation, truy
https://www.westga.edu/academics/research/vrc/assets/docs/scatterplots_and_
cªp t¤i:
correlation_notes.pdf
Tr÷íng ¤i håc Kinh t¸ - Luªt, HQG, TPHCM, Kh£o s¡t h¼nh d¤ng ph¥n phèi cõa tªp dú li»u,
https://maths.uel.edu.vn/Resources/Docs/SubDomain/maths/TaiLieuHocTap/
truy cªp t¤i:
ToanUngDung/kho_st_hnh_dng_phn_phi_ca_tp_d_liu.html
ThS. Nguy¹n Ch½ Minh Trung,Hçi quy v t÷ìng quan, truy cªp t¤i: http://www.ctump.edu.vn/
DesktopModules/NEWS/DinhKem/6426_Slide-bai-giang-thuc-tap-SPSS-Buoi-4-ThsTrung.
pdf
B¡o c¡o b i tªp lîn mæn X¡c su§t thèng k¶ (MT2013) - Ni¶n khâa 2023 - 2024 Trang 21/21