You are on page 1of 23

TRƯỜNG ĐẠI HỌC BÁCH KHOA - ĐẠI HỌC QUỐC GIA TPHCM

KHOA KHOA HỌC VÀ KỸ THUẬT MÁY TÍNH

BÁO CÁO BÀI TẬP LỚN LỚP L07

MÔN HỌC: XÁC SUẤT - THỐNG KÊ

CHỦ ĐỀ: CPUS VÀ GPUS

NHÓM 16

GIÁO VIÊN HƯỚNG DẪN: THẦY NGUYỄN BÁ THI

Sinh viên thực hiện Mã số sinh viên


Phạm Tuấn Đạt 2210714
Trần Hoàng Phúc Đạt 2210718
Lê Nguyễn Anh Duy 2210505
Nguyễn Thị Hiền Hạnh 2210920
Trương Thị Hòa Hảo 2210914

1
MỤC LỤC
1.1. Đọc dữ liệu "Intel_CPUs.csv"......................................................3
1.2. Trích xuất các tiêu thức quan trọng của dữ liệu.........................4
1.3.Làm sạch dữ liệu (Data cleaning): NA (dữ liệu khuyết)..................5
2. Thống kê mô tả.................................................................................6
2.1 Tính toán các giá trị thống kê mô tả của tổng tất cả tệp dữ liệu
từng tệp dữ liệu.....................................................................................6
2.2 Tính toán các giá trị đặc trưng của Processor_Base_Frequency....8
2.3 Biểu đồ phân bố Processor_Base_Frequency với 4 loại cpu..........9
2.4. Biểu đồ phân bố của Processor_Base_Frequency..........................9
2.5. Biểu đồ phân tán thể hiện sự phụ thuộc của lần lượt là các biến
với Processor_Base_Frequency...........................................................10
3. Thống kê suy diễn...........................................................................13
3.1. Tìm khoảng tin cậy.....................................................................13
3.2. Kiểm định một mẫu.....................................................................13
3.3. Kiểm định hai mẫu......................................................................14
3.4. Phân tích phương sai (ANOVA) hai yếu tố...............................14
3.5. Hồi quy tuyến tính đa biến..........................................................19

2
1.1. Đọc dữ liệu "Intel_CPUs.csv".

Dùng lệnh read.csv() để đọc tập dữ liệu.

Code:

Kết quả:

3
1.2. Trích xuất các tiêu thức quan trọng của dữ liệu
Code:

Kết quả:

Code:

4
Kết quả:

1.3.Làm sạch dữ liệu (Data cleaning): NA (dữ liệu khuyết)


Code:

Kết quả:
Thống kê số lượng dữ liệu bị khuyết (NA) trong từng cột df:

Phần trăm dữ liệu khuyết:

5
Code:

Kết quả:

2. Thống kê mô tả
2.1 Tính toán các giá trị thống kê mô tả của tổng tất cả tệp dữ liệu
từng tệp dữ liệu

Code:

Kết quả:

6
Tổng:

Desktop:

Embedded:

7
Mobile:

Server:

2.2 Tính toán các giá trị đặc trưng của Processor_Base_Frequency

8
 Code:

 Kết quả:

2.3 Biểu đồ phân bố Processor_Base_Frequency với 4 loại cpu

 Code:

Kết quả:

9
2.4. Biểu đồ phân bố của Processor_Base_Frequency
Code:

Kết quả:

2.5. Biểu đồ phân tán thể hiện sự phụ thuộc của lần lượt là các biến
với Processor_Base_Frequency

10
 Code:

11
12
3. Thống kê suy diễn.
3.1. Tìm khoảng tin cậy.
Code

Kết Quả

13
3.2. Kiểm định một mẫu
Code

Kết quả

3.3. Kiểm định hai mẫu


Code

14
Kết Quả

3.4. Phân tích phương sai (ANOVA) hai yếu tố.


.
Kiểm định các giả thuyết cho phân tích ANOVA.

15
Tiến hành phân tích ANOVA.
Code

Kết quả

16
17
18
19
3.5. Hồi quy tuyến tính đa biến
Code

Kết quả

20
b. Kiểm tra giả định của mô hình hồi quy:

21
Dự báo:

22
23

You might also like