You are on page 1of 8

Đầu tiên là biểu đồ cột, cái này thể hiện sự phân bố điểm ở cái file mà t khảo sát.

Từ cột đầu tiên là 0


điểm thì có khoảng 38 đứa được 0 điểm, tương tự tới mấy cột sau. Cái số nằm ở bên trái cột là giá trị
của cột, cho nên là không có cột điểm.

Box- Plot
Cái thứ 2 là BOX PLOT. Ở phía đầu bài t có chia ra các giá trị liên tục và rời rạc (Phần này mình tự phân
loại chứ kh phải nhờ chương trình phân)

do đang muốn khảo sát các yếu tố ảnh hưởng tới kết quả G3 và tụi t NGHĨ LÀ các yếu tố Study time,
failures và higher education ảnh hưởng tới G3 nên tụi t vẽ biểu đồ của G3 với 3 thằng này.
Nhớ là tụi t nghĩ là các yếu tố đó ảnh hưởng, tụi m nghĩ là yếu tố khác thì có thể vẽ G3 với những yếu tố
khác nhưng nhớ là phải so G3 với các yếu tố rời rạc

Box-plot diễn tả 5 vị trí phân bố của dữ liệu, đó là: giá trị nhỏ nhất (min), tứ phân vị thứ nhất (Q1), trung
vị (median), tứ phân vị thứ 3 (Q3) và giá trị lớn nhất (max).

Trong Box Plot có 1 phần lý thuyết ở chương 4 kh thi là quartile Q1,Q2,Q3(sau đây là lý thuyết kh quan
trọng lắm và thuyết trình kh hỏi tới m cần thì đọc) là đại lượng mô tả sự phân bố và sự phân tán của tập
dữ liệu. Số phân tử có 3 giá trị, đó là số phân tử thứ nhất (Q1), thứ nhì (Q2) và thứ ba (Q3). Ba giá trị này
chia một tập hợp dữ liệu (đã sắp xếp dữ liệu theo trật từ bé đến lớn) thành 4 phần có số lượng quan sát
đều nhau. (Nói đơn giản là m có 12 số thì nó chia thành 4 cục, mỗi cục 3 số cho dễ nhìn)

Ví dụ: có 1 dãy số liệu gồm 15 số (122, 126, 133, 149, 150, 157, 162, 166, 175, 177, 177, 183, 188,
199,212)
Với biểu đồ trên m có thể có 1 số nhận xét như:

-Với thời gian học 3 tiếng cho điểm thi G3 có sự dao động (max trừ min) thấp nhất => điểm ổn định nhất
pla pla

Học 4 tiếng thì có điểm max cao nhất trong 4 thời gian học

- median là số đứng ở giữa trong dãy số xếp tang dần hoặc giảm dần, ví dụ (2, 3, 11, 13, 26, 34, 47) thì
median là 13 vì 2 bên nó mỗi bên 3 số.

Từ cái đường median trên biểu đồ, phần diện tích ở nửa trên rộng hơn thì phần đó điểm có sự dao động
nhiều hơn. Ví dụ ở học 3 tiếng, median khoảng 12 và diện tích nửa trên lớn hơn thì m có thể tưởng
tượng cái khoảng điểm của nó như vầy (7, 8, 10, 12, 13,19,19). Phần dao động ở điểm dưới 12 nhỏ (từ 7
tới 10 chỉ 3 đơn vị) => tốt vì điểm sẽ kh quá thấp. Phần dao động ở điểm trên 12 lớn hơn (từ 13 tới 19 là
6 đơn vị) => tốt vì dao động cao sẽ có thể có nhiều đứa nhảy lên được điểm 18 19.

-Q1, Q2, Q3 thì bình thường người ta tính khoảng số phân tử Q3-Q1( là diện tích nguyên cái hình chữ
nhật), nó càng bé thì số liệu càng tập trung nhiều, càng lớn thì số liệu càng phân tán rộng

- Từ biểu đồ trên có thể thấy thời gian học không ảnh hưởng quá nhiều tới kết quả G3 do m thấy các
biểu đồ nó không lệch lên lệch xuống quá nhiều.
Với biểu đồ này, nhìn qua m có thể thấy nghỉ học 1 buổi thì phần lớn điểm sẽ cao, còn nghỉ học 4 buổi
thì ngu luôn. Từ đó có thể thấy số buổi nghỉ có ảnh hưởng nhiều tới kết quả G3 do biểu đồ lệch lên lệch
xuống nhiều. Nếu thầy từ biểu đồ này có nhận xét gì hỏi thì chỉ cần nói sơ sơ như vầy, khi nào ổng hỏi
chi tiết quá thì mới nói giống ở trên

Scatter plot
Là biểu đồ thể hiện sự tương quan giữa 2 biến
Biểu đồ này cho thấy điểm G2 càng cao thì điểm G3 sẽ càng cao

Do đó điểm G2 sẽ ảnh hưởng nhiều tới điểm G3


biểu đồ này cho thấy trong độ tuổi 15 tới 19 thì tuổi tác chả ảnh hưởng gì tới G3

Nhưng khi 19 tuổi trở lên thì điểm nằm ở tầm trung bình , đặc biệt là tuổi 21 22 không thể ngóc đầu lên
khỏi 10 điểm
Biểu đồ này cho thấy khi nghỉ học dưới 10 buổi thì điểm trải đều và vẫn có điểm cao trên 15

Nghỉ 15 tới 25 buổi thì điểm dần ở mức trung bình và ít điểm cao đi

Nghỉ 25 tới 35 buổi thì thôi nghỉ mẹ đi :vvv đéo cao nổi đâu hên lắm thì trên mức trung bình là 10 điểm

You might also like