You are on page 1of 38

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC NGOẠI NGỮ - TIN HỌC


----- ------

TIN HỌC ỨNG DỤNG

NGÀY 02 2023 Giảng viên : TS. ĐINH HÙNG


TỔ CHỨC DỮ LIỆU VÀ VẼ BIỂU ĐỒ

1 : Dữ liệu định tính: Histogram, Pie, Bar

2 : Các biểu đồ Pareto, Time Series, Steam and Leaf

3 : Bài tập

4 : Tóm tắt
Làm thế nào để xác định mức độ đo lường?
Biến dữ liệu cần thu thập

Định tính? Định lượng?

Có thứ bậc giữa các giá trị


Có điểm 0 thực (natural)?
không?

KHÔNG CÓ KHÔNG CÓ

Thang đo Thang đo Thang đo Thang đo


Định danh Thứ bậc Khoảng Tỷ lệ
(Nominal) (Ordinal) (Interval) (Ratio)
TỔ CHỨC DỮ LIỆU & BIỂU ĐỒ 1 : Dữ liệu định tính: Histogram, Pie, Bar 1 -4

Data collected in original form is called raw data.


A frequency distribution is the organization of raw data in table form, using
classes and frequencies.
Nominal- or ordinal-level data that can be placed in categories is organized in
categorical frequency distributions.
Dữ liệu được thu thập dưới dạng nguyên thủy gọi là dữ liệu thô.
Phân phối tần suất là sắp xếp dữ liệu thô dưới dạng bảng, sử dụng các lớp và tần
suất.
Dữ liệu ở mức độ định danh hoặc thứ bậc có thể được phân loại, được tổ chức
trong các phân phối tần suất hạng mục (phân loại). Bảng tần suất này sẽ cho biết
số lượng quan sát hoặc tần suất của mỗi hạng mục hoặc nhóm trong dữ liệu, giúp
làm rõ sự phân phối của dữ liệu ở mức độ danh nghĩa hoặc thứ bậc.
TỔ CHỨC DỮ LIỆU & BIỂU ĐỒ 1 : Dữ liệu định tính: Histogram, Pie, Bar 1 -5

Categorical Frequency Distribution


Nhóm máu A - Sống có trách nhiệm
Nhóm máu B - Có sức hấp dẫn, sáng tạo
Nhóm máu O - Tính phóng khoáng, thích giúp đỡ
Nhóm máu AB - Cá tính mạnh, đột phá
25 students indicates were given a blood test to
determine their blood type.
Raw Data: A,B,B,AB,O O,O,B,AB,B B,B,O,A,O
A,O,O,O,AB AB,A,O,B,A

Construct a frequency distribution for the data.


Categorical Frequency Distribution
Twenty-five army indicates were given a blood test to
determine their blood type.
Raw Data: A,B,B,AB,O O,O,B,AB,B B,B,O,A,O
A,O,O,O,AB AB,A,O,B,A

Class Tally Frequency Percent


A IIII 5 20
B IIII II 7 28
O IIII IIII 9 36
AB IIII 4 16
Histograms
The histogram is a graph that displays the data by using vertical bars of
various heights to represent the frequencies of the classes.

The class boundaries are represented on the horizontal axis.

Biểu đồ histogram là một biểu đồ thể hiện dữ liệu bằng cách sử dụng
các cột dọc có độ cao khác nhau để đại diện cho tần suất của các lớp
(hay còn gọi là phạm vi).
Các ranh giới của các lớp (phạm vi) được biểu diễn trên trục hoành.
Class Tally Frequency Percent
A IIII 5 20
B IIII II 7 28
O IIII IIII 9 36
AB IIII 4 16

Histogram
10
9
8
7
6
5
4
3
2
1
0

A B O AB
9
Class Tally Frequency Percent
A IIII 5 20
B IIII II 7 28
O IIII IIII 9 36
AB IIII 4 16

Pie Chart

16% 20%
A
B
O

36% 28% AB

10
Class Tally Frequency Percent
A IIII 5 20
B IIII II 7 28
O IIII IIII 9 36
AB IIII 4 16

Bar Chart
AB

0 2 4 6 8 10
11
TỔ CHỨC DỮ LIỆU VÀ VẼ BIỂU ĐỒ

1 : Dữ liệu định tính: Histogram, Pie, Bar

2 : Các biểu đồ Pareto, Time Series, Steam and Leaf

3 : Bài tập

4 : Tóm tắt
TỔ CHỨC DỮ LIỆU & BIỂU ĐỒ 2: Các biểu đồ Pareto, Time Series, Steam and Leaf

Other Types of Graphs


Pareto Charts

13
Other Types of Graphs
Time Series Graphs

14
Other Types of Graphs
Stem and Leaf Plots
A stem and leaf plots is a data plot that uses part of a data value as
the stem and part of the data value as the leaf to form groups or
classes.
It has the advantage over grouped frequency distribution of retaining
the actual data while showing them in graphic form.

Biểu đồ thân lá là một biểu đồ dữ liệu sử dụng một phần của giá trị dữ
liệu làm thân và một phần khác làm lá để tạo thành các nhóm hoặc
phân lớp.
Nó có ưu điểm so với phân phối tần suất nhóm vì giữ lại dữ liệu thực tế
trong khi hiển thị chúng dưới dạng đồ họa. 15
At an outpatient testing center, the number of cardiograms performed
each day for 20 days is shown. Construct a stem and leaf plot for the data.
Tại một trung tâm kiểm tra ngoại trú, số lượng điện tâm đồ thực hiện mỗi
ngày trong vòng 20 ngày được hiển thị. Hãy tạo một biểu đồ thân lá cho
dữ liệu này.

25 31 20 32 13
14 43 2 57 23
36 32 33 32 44
32 52 44 51 45

16
Step 1 Arrange the data in order:
02, 13, 14, 20, 23, 25, 31, 32, 32, 32,
32, 33, 36, 43, 44, 44, 45, 51, 52, 57

Step 2 Separate the data according to the first digit, as shown.


02 13, 14 20, 23, 25 31, 32, 32, 32, 32, 33, 36
43, 44, 44, 45 51, 52, 57

Step 3 A display can be made by using the leading digit as the stem and the trailing digit
as the leaf. For example, for the value 32, the leading digit, 3, is the stem and the trailing
digit, 2, is the leaf. For the value 14, the 1 is the stem and the 4 is the leaf.

Bước 3: Một hiển thị có thể được tạo ra bằng cách sử dụng chữ số đầu làm thân và chữ
số cuối làm lá. Ví dụ, đối với giá trị 32, chữ số hàng đầu là 3, làm thân, và chữ số hàng
cuối là 2, làm lá. Đối với giá trị 14, số 1 làm thân và số 4 làm lá.
17
18
The distribution peaks in the center and that there are no gaps in the data. For 7 of the 20
days, the number of patients receiving cardiograms was between 31 and 36. The plot also
shows that the testing center treated from a minimum of 2 patients to a maximum of 57
patients in any one day.

Phân phối đạt đỉnh ở trung tâm và không có khoảng trống trong dữ liệu. Trong 7 trong số
20 ngày, số bệnh nhân nhận điện tâm đồ nằm trong khoảng từ 31 đến 36. Biểu đồ cũng cho
thấy rằng trung tâm kiểm tra đã điều trị từ ít nhất 2 bệnh nhân đến tối đa 57 bệnh nhân
trong bất kỳ một ngày nào.

Stem and Leaf Plot

19
TỔ CHỨC DỮ LIỆU VÀ VẼ BIỂU ĐỒ

1 : Dữ liệu định tính: Histogram, Pie, Bar

2 : Các biểu đồ Pareto, Time Series, Steam and Leaf

3 : Bài tập

4 : Tóm tắt
Bài tập 1 - Trust in Internet Information
A survey was taken on how much trust people place in the information they
read on the Internet. Construct a categorical frequency distribution for the
data. A trust in everything they read, M trust in most of what they read, H
trust in about one-half of what they read, S trust in a small portion of what
they read. (Based on information from the UCLA Internet Report.)
Một cuộc khảo sát được tiến hành về mức độ tin tưởng mà người ta đặt vào thông
tin họ đọc trên Internet. Hãy xây dựng một bảng phân phối tần suất phân loại cho
dữ liệu. Mỗi mức độ tin tưởng được ký hiệu như sau:
•A: Tin tưởng vào mọi điều họ đọc,
•M: Tin tưởng vào hầu hết những gì họ đọc,
•H: Tin tưởng vào khoảng một nửa trong những gì họ đọc,
•S: Tin tưởng vào một phần nhỏ trong những gì họ đọc.
21
Bài tập 1 - Trust in Internet Information
M M M A H M S M H M
S M M M M A M M A M
M M H M M M H M H M
A M M M H M M M M M

22
Bài tập 1 - Trust in Internet Information

23
Bài tập 1 (Giải)

Trust in Internet Information


30

25

20

15

10

0
Frequency

A M H S

24
Bài tập 1 (Giải)

Trust in Internet Information

Frequency

0 5 10 15 20 25 30

S H M A
25
Bài tập 1 (Giải)

Chart Title
S A
5% 10%
H
15%

M
70%

A M H S
26
Bài tập 2 – Tính cách theo tháng sinh
Thu thập số liệu về tháng sinh của các bạn trong lớp, tổ chức dữ liệu
thu được thành bảng phân phối tần số (gom nhóm theo mùa xuân,
hạ, thu, đông), sau đó vẽ các biểu đồ Histogram, Bar và Pie. So sánh
kết quả với số liệu về nhóm máu của 25 sinh viên trong bài giảng.

Class Tally Frequency Percent


Xuân
Hạ
Thu
Đông
27
Bài tập 2

Người sinh mùa xuân nhẹ nhàng, ấm áp, có sự điềm tĩnh và


lạc quan. Họ cũng dành được nhiều tình yêu thương của gia
đình và nhận được nhiều hỗ trợ tinh thần từ những người thân
yêu.

28
Bài tập 2

Người sinh mùa hè giống như ánh nắng rực rỡ của mùa hè sôi
động. Họ nhiệt huyết, bền bỉ và đầy năng lượng tích cực.
Những người sinh mùa hè có một tinh thần tiên phong đáng
nể, họ sẵn sàng với những thử thách và mạo hiểm với nhiều
trải nghiệm mới.
29
Bài tập 2

Mùa thu với nhiều người là mùa đẹp nhất trong năm, không
khí se se lạnh cùng những vạt gió chuyển mùa khiến mọi
người cảm thấy nhẹ nhàng.
Mùa thu mang lại cho những người sinh vào những tháng
năm này một tính cách khoan dung, nồng ấm, thận trọng.
30
Bài tập 2

Ở những người sinh mùa đông, có một sự nghiêm túc, kiên định
nhất định khi đối mặt với cuộc sống, nên đôi khi họ hay bị hiểu lầm
là lạnh lùng. Nhưng ở họ, có sự nhẫn nại và khả năng chịu đựng
cao mà những người sinh mùa khác nên học hỏi.

31
Bài tập 3
Pareto Charts

32
Bài tập 3 (Giải)
Pareto Charts
Phàn nàn của khách hàng Số lần phàn nàn Cumulative % Cumulative
Giá cao 947 947 45.77
Thái độ chưa tốt 746 1693 81.83
Thời gian chờ lâu 131 1824 88.16
Không tư vấn 78 1902 91.93
Bố trí không hợp lý 54 1956 94.54
Sàn nhà ẩm ướt 36 1992 96.28
Ồn ào 33 2025 97.87
Địa điểm xa 18 2043 98.74
Ít khuyến mãi 15 2058 99.47
Lý do khác 11 2069 100
33
34
TỔ CHỨC DỮ LIỆU VÀ VẼ BIỂU ĐỒ

1 : Dữ liệu định tính: Histogram, Pie, Bar

2 : Các biểu đồ Pareto, Time Series, Steam and Leaf

3 : Bài tập

4 : Tóm tắt
TỔ CHỨC DỮ LIỆU & BIỂU ĐỒ 4 : Tóm tắt

Class Tally Frequency Percent


A IIII 5 20
B IIII II 7 28
O IIII IIII 9 36
AB IIII 4 16

Histogram Pie Chart Bar Chart


10
9
AB
8
16% 20%
7
6 A O
5 B
4
3
O B
2 36% 28% AB
1
A
0

A B O AB 0 2 4 6 8 10

36
Summary of Graphs
and Uses of Each

37
Hết NGÀY 02

NGÀY 02

You might also like