You are on page 1of 24

THỐNG KÊ ỨNG DỤNG

TRONG KINH TẾ VÀ KINH DOANH

Anderson Sweeney Williams


Slides by
John Loucks
St. Edward’s University

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 1
or duplicated, or posted to a publicly accessible website, in whole or in part.

Chương 1
Dữ liệu và thống kê
 Thống kê
 Ứng dụng trong kinh tế và kinh doanh
 Dữ liệu
 Nguồn dữ liệu
 Thống kê mô tả
 Suy diễn thống kê
 Máy tính và phân tích thống kê
 Khai thác dữ liệu
 Nguyên tắc đạo đức trong thực hành thống kê

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 2
or duplicated, or posted to a publicly accessible website, in whole or in part.

1
Thống kê

 Thống kê có thể là những con số tính toán từ sự kiện


thực tế như trung bình, trung vị, tần suất và chỉ số, sẽ
giúp ta hiểu về các tình huống trong kinh doanh và
kinh tế.
 Thống kê cũng có thể là nghệ thuật và khoa học của
việc thu thập, phân tích, trình bày và diễn giải dữ liệu.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 3
or duplicated, or posted to a publicly accessible website, in whole or in part.

Ứng dụng trong kinh doanh và kinh tế

 Kế toán
Công ty kiểm toán sử dụng các thủ tục lấy mẫu thống kê
khi tiến hành kiểm toán cho khách hàng
 Kinh tế học
Các nhà kinh tế thường xuyên đưa ra các dự báo về
tương lai của nền kinh tế hoặc về một khía cạnh nào đó
của nền kinh tế.
 Tài chính
Chuyên gia tài chính sử dụng một loạt các thông tin để
hướng dẫn khuyến nghị đầu tư.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 4
or duplicated, or posted to a publicly accessible website, in whole or in part.

2
Ứng dụng trong kinh doanh và kinh tế
 Marketing
Máy quét điện tử tại quầy tính tiền bán lẻ thu thập
dữ liệu cho một loạt các ứng dụng nghiên cứu thị
trường.
 Sản xuất
Một loạt các kiểm soát chất lượng là ứng dụng quan
trọng của thống kê sản xuất.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 5
or duplicated, or posted to a publicly accessible website, in whole or in part.

Dữ liệu và tập dữ liệu

 Dữ liệu là những sự kiện và con số được thu thập,


phân tích và tổng hợp để trình bày và diễn giải.

 Tất cả các dữ liệu thu thập trong một nghiên cứu


cụ thể được gọi là tập dữ liệu nghiên cứu.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 6
or duplicated, or posted to a publicly accessible website, in whole or in part.

3
Phần tử, Biến, Và quan sát

 Phần tử là các thực thể mà từ đó dữ liệu được thu thập.


 Biến là một đặc tính nào đó cần quan tâm của phần tử.
 Tập hợp các số đo thu được trên một phần tử được
gọi là một quan sát.
 Một tập dữ liệu với n phần tử có n quan sát.

 Tổng số các giá trị của dữ liệu trong một tập dữ liệu
hoàn chỉnh là số phần tử nhân với số biến.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 7
or duplicated, or posted to a publicly accessible website, in whole or in part.

Dữ liệu, Tập dữ liệu,


Phần tử, Biến, và Quan sát
Biến
Tên các
phần tử Stock Annual Earn/
Company Exchange Sales($M) Share($)

Dataram NQ 73.10 0.86


EnergySouth N 74.00 1.67
Keystone N 365.70 0.86
LandCare NQ 111.40 0.33
Psychemedics N 17.60 0.13

Tập dữ liệu
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 8
or duplicated, or posted to a publicly accessible website, in whole or in part.

4
Thang đo

Các loại thang đo:


Danh nghĩa Khoảng
Thứ bậc Tỷ lệ

Thang đo xác định lượng thông tin chứa trong dữ


liệu

Thang đo cho biết cách tóm tắt dữ liệu và phân tích


thống kê nào là phù hợp.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 9
or duplicated, or posted to a publicly accessible website, in whole or in part.

Thang đo

 Danh nghĩa

Dữ liệu có nhãn hoặc tên được sử dụng để xác định


một thuộc tính của phần tử.

Nhãn ký tự hoặc mã số có thể được sử dụng.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 10
or duplicated, or posted to a publicly accessible website, in whole or in part.

10

5
Thang đo

 Danh nghĩa

Ví dụ:
Sinh viên đại học được phân loại theo trường, trong
đó chúng ta sử dụng nhãn ký tự như Kinh tế, Nhân
văn, Sư phạm,…
Hoặc mã số được dùng cho biến trường ( ví dụ 1 là
Kinh tế, 2 là Nhân Văn, 3 là Sư phạm,…)

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 11
or duplicated, or posted to a publicly accessible website, in whole or in part.

11

Thang đo

 Thứ bậc

Dữ liệu thể hiện tính chất của dữ liệu danh nghĩa và


thứ tự hoặc xếp hạng của dữ liệu này có ý nghĩa.

Nhãn ký tự hoặc mã số có thể được sử dụng.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 12
or duplicated, or posted to a publicly accessible website, in whole or in part.

12

6
Thang đo

 Thứ bậc

Ví dụ:
Sinh viên của một trường đại học được phân loại
theo niên khóa và chúng ta sử dụng nhãn ký tự như
năm nhất, năm 2, năm 3, năm 4.
Ngoài ra mã số có thể được dùng cho biến niên
khóa học (ví dụ 1 là năm nhất, 2 là năm 2,…).

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 13
or duplicated, or posted to a publicly accessible website, in whole or in part.

13

Thang đo

 Khoảng

Dữ liệu có thuộc tính của dữ liệu thứ bậc và khoảng


cách giữa các giá trị được thể hiện dưới dạng đơn vị
đo lường cố định.

Dữ liệu khoảng luôn là dữ liệu số.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 14
or duplicated, or posted to a publicly accessible website, in whole or in part.

14

7
Thang đo

 Khoảng

Ví dụ:
Melissa có điểm SAT là 1205, Kevin có điểm SAT là
1090. Điểm số của Melissa cao hơn Kevin 115 điểm.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 15
or duplicated, or posted to a publicly accessible website, in whole or in part.

15

Thang đo

 Tỷ lệ

Dữ liệu có đầy đủ tính chất của dữ liệu khoảng và tỷ


lệ giữa 2 giá trị có ý nghĩa.

Các biến như khoảng cách, chiều cao, trọng lượng


và thời gian đều sử dụng thang đo Tỷ lệ.

Thang đo này phải có giá trị 0 chỉ ra rằng không có


gì tồn tại trong biến tại điểm 0.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 16
or duplicated, or posted to a publicly accessible website, in whole or in part.

16

8
Thang đo

 Tỷ lệ

Ví dụ:
Hồ sơ đại học cho biết Melissa tích lũy được 36
tín chỉ, trong khi Kevin tích lũy được 72 tín chỉ.
Kevin tích lũy được số tín chỉ gấp đôi
số tín chỉ của Melissa.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 17
or duplicated, or posted to a publicly accessible website, in whole or in part.

17

Dữ liệu phân loại và Dữ liệu định lượng

Dữ liệu có thể được phân thành 2 loại là phân loại


và định lượng.

Dùng phân tích thống kê nào là phụ thuộc vào dữ


liệu thuộc phân loại hay định lượng.

Nói chung, có nhiều lựa chọn phân tích thống kê


hơn khi dữ liệu là định lượng.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 18
or duplicated, or posted to a publicly accessible website, in whole or in part.

18

9
Dữ liệu phân loại

Nhãn hay tên được dùng để xác định thuộc tính của
mỗi phần tử.

Thường được gọi là dữ liệu định tính

Thường dùng thang đo danh nghĩa hoặc thứ bậc

Có thể là số hoặc không phải là số

Phân tích thống kê thường bị hạn chế

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 19
or duplicated, or posted to a publicly accessible website, in whole or in part.

19

Dữ liệu định lượng

Dữ liệu định lượng là:

rời rạc, nếu là số nguyên

liên tục, nếu là số thực

Dữ liệu định lượng luôn là số.

Những phép tính số học thông thường sử dụng


được với dữ liệu định lượng.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 20
or duplicated, or posted to a publicly accessible website, in whole or in part.

20

10
Thang đo

D liệu
Dữ u

Phân loại Định lượng

Số Không phải số Số

Danh Thứ bậc Danh Thứ bậc Khoảng Tỷ lệ


nghĩa nghĩa

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 21
or duplicated, or posted to a publicly accessible website, in whole or in part.

21

Dữ liệu thời điểm

Dữ liệu thời điểm được thu thập ở cùng hoặc xấp xỉ


vào cùng một thời điểm.
Ví dụ: Dữ liệu chi tiết số lượng giấy phép xây
dựng đã ban hành vào tháng hai năm 2010 của
mỗi quận ở Ohio.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 22
or duplicated, or posted to a publicly accessible website, in whole or in part.

22

11
Dữ liệu chuỗi thời gian

Dữ liệu chuỗi thời gian được thu thập qua nhiều


giai đoạn thời gian.
Ví dụ: Dữ liệu chi tiết số lượng giấy phép xây
dựng được ban hành ở quận Lucas, Ohio trong
36 tháng qua.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 23
or duplicated, or posted to a publicly accessible website, in whole or in part.

23

Dữ liệu chuỗi thời gian


Giá trung bình (USD) trên 1 Gallon
Cho xăng thông thường

Source: Energy Information Administration, U.S. Department of Energy, May 2009.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 24
or duplicated, or posted to a publicly accessible website, in whole or in part.

24

12
Nguồn dữ liệu

 Nguồn có sẵn

Hồ sơ nội bộ công ty – bất kỳ bộ phận nào


Dịch vụ dữ liệu kinh doạnh – Dow Jones & Co.
Tổ chức chính phủ - Bộ Lao Động Mỹ

Hiệp hội ngành nghề – Hiệp hội ngành du lịch nước Mỹ

Tổ chức đặc biệt – Ban liên lạc cựu sinh viên

Mạng Internet – Rất nhiều công ty

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 25
or duplicated, or posted to a publicly accessible website, in whole or in part.

25

Nguồn dữ liệu

 Dữ liệu sẵn có từ Hồ sơ nội bộ công ty


Hồ sơ Một số dữ liệu sẵn có
Hồ sơ nhân viên Tên, địa chỉ, số an sinh xã hội
Hồ sơ sản xuất Số bộ phận, số lượng sản xuất, chi phí
nhân công trực tiếp, chi phí nguyên liệu
Hồ sơ tồn kho Số bộ phận, số lượng tồn kho, mức đặt
hàng lại, số lượng đơn hàng
Hồ sơ bán hàng Số sản phẩm, lượng hàng bán, lượng
hàng bán theo vùng.
Hồ sơ tín dụng Tên khách hàng, hạn mức tín dụng,
khoản phải thu
Hồ sơ khách hàng Tuổi, giới tính, thu nhập, số người trong hộ

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 26
or duplicated, or posted to a publicly accessible website, in whole or in part.

26

13
Nguồn dữ liệu

 Dữ liệu có sẵn từ các cơ quan chính phủ


Cơ quan chính phủ Một số dữ liệu có sẵn
Cục Điều tra Dân số Mỹ Số liệu dân số, số hộ gia đình, thu
www.census.gov nhập hộ
Cục Dự trữ Liên Bang Mỹ Dữ liệu về cung tiền, tỷ giá hối đoái,
www.federalreserve.gov lãi suất chiết khấu.
Cục QL hành chánh và NS
Dữ liệu về thu, chi, nợ chính phủ
www.whitehouse.gov/omb
Bô Thương mại Mỹ Dữ liệu hoạt động kinh doanh, doanh
www.doc.gov số, lợi nhuận ngành công nghiệp.
Cục Thống kê lao động Mỹ Chi tiêu dùng, tỷ lệ thất nghiệp, thu
www.bls.gov nhập theo giờ, an toàn lao động

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 27
or duplicated, or posted to a publicly accessible website, in whole or in part.

27

Nguồn dữ liệu

 Nghiên cứu thống kê – Thử nghiệm

Trong một nghiên cứu thử nghiệm biến quan tâm


được xác định đầu tiên. Sau đó một hoặc nhiều
biến khác được xác định và kiểm soát sao cho dữ
liệu thu được phản ánh cách chúng ảnh hưởng đến
biến quan tâm.

Nghiên cứu thử nghiệm lớn nhất từng được thực


hiện là cuộc thử nghiệm của dịch vụ y tế công cộng
năm 1954 về vắc-xin bại liệt Salk. Gần 2 triệu trẻ em
Mỹ (lớp 1 đến lớp 3) đã được chọn.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 28
or duplicated, or posted to a publicly accessible website, in whole or in part.

28

14
Nguồn dữ liệu

 Nghiên cứu thống kê – Quan sát


Trong nghiên cứu quan sát (phi thực nghiệm)
không cần kiểm soát hay tác động đến biến quan
tâm.
Khảo sát là một ví dụ điển hình

Nghiên cứu về người hút thuốc và không


hút thuốc là nghiên cứu quan sát bởi vì nhà
nghiên cứu không xác định hoặc kiểm soát
ai sẽ hút thuốc, ai sẽ không hút thuốc.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 29
or duplicated, or posted to a publicly accessible website, in whole or in part.

29

Lưu ý khi thu thập dữ liệu

Thời gian yêu cầu


• Tìm kiếm thông tin phải tính đến thời gian.
• Thông tin có thể không mang tính thời sự vì nó có sẵn.

Chi phí thu thập


• Công ty thường phải trả phí cho thông tin ngay cả khi
nó không phải là hoạt động kinh doanh chính của họ.
Dữ liệu lỗi

• Sử dụng bất kỳ dữ liệu có sẵn hay thu thập mà


không cẩn thận đều có thể dẫn đến thông tin sai lệch
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 30
or duplicated, or posted to a publicly accessible website, in whole or in part.

30

15
Thống kê mô tả

 Hầu hết thông tin thống kê trong báo, tạp chí, báo
cáo công ty và các ấn phẩm khác chứa dữ liệu được
tổng hợp và trình bày theo một hình thức dễ dàng
cho người đọc hiểu
Tóm tắt dữ liệu có thể là bảng, đồ họa, hoặc số được
gọi là thống kê mô tả.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 31
or duplicated, or posted to a publicly accessible website, in whole or in part.

31

Ví dụ: Hudson Auto Repair

Quản lý của Hudson Auto muốn biết về chi phí của


các bộ phân liên quan đến điều chỉnh động cơ được
thực hiện trong cửa hàng của cô ấy. Cô ấy kiểm tra 50
hóa đơn của khách hàng có nhu cầu điều chỉnh động
cơ. Chi phí của các bộ phận được làm tròn đến đồng
đô la và được trình bày ở slide kế tiếp.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 32
or duplicated, or posted to a publicly accessible website, in whole or in part.

32

16
Ví dụ: Hudson Auto Repair

 Ví dụ chi phí các bộ phận (đô la) của 50 khách hàng


điều chỉnh động cơ

91 78 93 57 75 52 99 80 97 62
71 69 72 89 66 75 79 75 72 76
104 74 62 68 97 105 77 65 80 109
85 97 88 68 83 68 71 69 67 74
62 82 98 101 79 105 79 69 62 73

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 33
or duplicated, or posted to a publicly accessible website, in whole or in part.

33

Bảng tóm tắt:


Tần số và Tần suất
 Ví dụ: Hudson Auto

Chi phí Tần suất


(đô la) Tần số %
50-59 2 4
60-69 13 26
(2/50)100
70-79 16 32
80-89 7 14
90-99 7 14
100-109 5 10
50 100

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 34
or duplicated, or posted to a publicly accessible website, in whole or in part.

34

17
Đồ thị tóm tắt: Histogram

 Ví dụ: Hudson Auto


18
Chi phí điều chỉnh động cơ
16
14
12
Tần số

10
8
6
4
2
Chi phí
50-59 60-69 70-79 80-89 90-99 100-110 (đô la)
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 35
or duplicated, or posted to a publicly accessible website, in whole or in part.

35

Thống kê mô tả số

 Thống kê mô tả bằng số phổ biến là trung bình


(average hoặc mean).
 Trung bình đo lường khuynh hướng tập trung hoặc vị
trí trung tâm của dữ liệu cho một biến
 Chi phí trung bình các bộ phận của Hudson, trên khảo
sát 50 khách hàng điều chỉnh động cơ là 79 đô la (lấy
tổng của 50 giá trị chi phí chia cho 50 ).

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 36
or duplicated, or posted to a publicly accessible website, in whole or in part.

36

18
Suy diễn thống kê

Tổng thể - Tập hợp tất cả phần tử được quan tâm


trong một nghiên cứu cụ thể
Mẫu - Là tập con của tổng thể

Suy diễn thống kê - Là quá trình sử dụng dữ liệu từ


một mẫu ước lượng và kiểm định
giả thuyết về các đặc tính của một
tổng thể thống kê.
Điều tra toàn bộ - Thu thập dữ liệu trong toàn bộ tổng thể

Điều tra mẫu - Thu thập dữ liệu cho một mẫu

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 37
or duplicated, or posted to a publicly accessible website, in whole or in part.

37

Các bước suy diễn thống kê

1. Tổng thể của tất cả 2. Một mẫu 50


nhu cầu điều chỉnh động cơ đã
động cơ. Chi phí trung điều chỉnh
bình là chưa biết được kiểm tra

4. Trung bình mẫu được 3. Dữ liệu mẫu cho


dùng để ước lượng biết chi phí trung
cho trung bình tổng bình là 79 đô la
thể một động cơ.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 38
or duplicated, or posted to a publicly accessible website, in whole or in part.

38

19
Máy tính và phân tích thống kê

 Các nhà thống kê thường sử dụng các phần mềm máy


tính để tính toán chỉ tiêu thống kê đối với bộ dữ liệu lớn.

 Để thuận lợi cho việc sử dụng máy tính, nhiều bộ dữ


liệu nói đến trong cuốn sách này được để trên website.

 Các tập tin dữ liệu có thể tải về dưới dạng Minitab


hoặc Excel .
 Ngoài ra, công cụ thống kê để thêm vào trong
Excel cũng có thể tải về từ Website.
 Các phụ lục cuối chương hướng dẫn việc sử dụng
Minitab, Excel, và các công cụ thống kê.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 39
or duplicated, or posted to a publicly accessible website, in whole or in part.

39

Kho dữ liệu

 Các tổ chức thu được dữ liệu lớn hàng ngày bằng


các đầu đọc thẻ từ, máy quét mã vạch, các điểm kết
nối bán hàng và màn hình cảm ứng.
 Wal-Mart thu thập dữ liệu dựa trên 20-30 triệu giao
dịch mỗi ngày
 Visa xử lý 6.800 giao dịch thanh toán mỗi giây.
 Thu thập, lưu trữ và duy trì dữ liệu, gọi là kho dữ
liệu, một công việc có ý nghĩa.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 40
or duplicated, or posted to a publicly accessible website, in whole or in part.

40

20
Khai thác dữ liệu

 Phân tích các dữ liệu trong kho dữ liệu có thể giúp


cho việc ra quyết định cho chiến lược mới và mang
lại lợi nhuận cao hơn cho tổ chức.
 Sử dụng kết hợp các thủ tục thống kê, toán học, và
khoa học máy tính, phân tích “mỏ dữ liệu ” để
chuyển đổi nó thành thông tin hữu ích.
 Các hệ thống khai thác dữ liệu hiệu quả nhất sử
dụng các thủ tục tự động để khám phá các mối
quan hệ trong dữ liệu và dự đoán kết quả tương
lai,…thông qua những yêu cầu có vẻ là chung
chung, thậm chí là mơ hồ bởi người dùng.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 41
or duplicated, or posted to a publicly accessible website, in whole or in part.

41

Các ứng dụng khai thác dữ liệu

 Các ứng dụng chính của khai thác dữ liệu đã được


thực hiện ở nhiều công ty chủ yếu là ở mảng khách
hàng như bán lẻ, tài chính, và truyền thông.
 Khai thác dữ liệu được sử dụng để tìm hiểu các sản
phẩm liên quan có khả năng mua cùng khi khách
hàng mua một sản phẩm cụ thể (và sau đó cửa sổ
pop-ups được dùng để thu hút sự chú ý cho những
sản phẩm liên quan) giúp bán được nhiều hàng
hơn.
 Một ví dụ khác, khai thác dữ liệu được sử dụng để
xác định khách hàng nào sẽ nhận được những ưu
đãi đặc biệt dựa trên lịch sử mua hàng trong quá
khứ.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 42
or duplicated, or posted to a publicly accessible website, in whole or in part.

42

21
Những yêu cầu khai thác dữ liệu

 Phương pháp thống kê như hồi quy, hồi quy


logistic, tương quan thường được dùng nhiều.
 Cũng cần đến khoa học máy tính liên quan đến trí
tuệ nhân tạo và học máy.
 Một sự đầu tư đáng kể về thời gian và tiền bạc là
xứng đáng.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 43
or duplicated, or posted to a publicly accessible website, in whole or in part.

43

Mô hình khai thác dữ liệu đáng tin cậy

 Tìm được một mô hình thống kê hiệu quả cho một


mẫu dữ liệu cụ thể không nhất thiết nó sẽ phù hợp,
đáng tin cậy khi áp dụng cho bộ dữ liệu khác.

 Với lượng dữ liệu lớn có sẵn, có thể chia dữ liệu


thành hai tập con, một tập dữ liệu thực hiện (để xây
dựng mô hình) và một tập dữ liệu kiểm tra (để
kiểm tra lại mô hình)
 Tuy nhiên thật nguy hiểm khi dùng mô hình bám
thật sát các điểm dữ liệu có thể dẫn đến gợi ý sai mối
liên hệ.
 Giải thích cẩn thận kết quả và thử nghiệm rộng rãi
là rất quan trọng.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 44
or duplicated, or posted to a publicly accessible website, in whole or in part.

44

22
Nguyên tắc đạo đức trong thực hành thống kê

 Trong nghiên cứu thống kê, hành vi vi phạm đạo


đức bao gồm:
• Lấy mẫu không đúng
• Các phân tích không phù hợp với dữ liệu
• Xây dựng đồ thị gây hiểu lầm
• Sử dụng số liệu tóm tắt thống kê không phù hợp.
• Giải thích sai lệch kết quả thống kê

 Bạn phải luôn cố gắng công bằng, toàn diện, khách quan
và trung lập khi thu thập, phân tích và trình bày dữ liệu.
 Là một người dùng số liệu bạn nên lưu ý những
hành vi vi phạm đạo đức của những người khác.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 45
or duplicated, or posted to a publicly accessible website, in whole or in part.

45

Nguyên tắc đạo đức trong thực hành thống kê

 Hiệp hội thống kê Mỹ phát hành báo cáo “Nguyên


tắc đạo đức trong thực hành thống kê”.

 Báo cáo gồm 67 nguyên tắc chia thành 8 lĩnh vực:


•Tính chuyên nghiệp
•Trách nhiệm nhà tài trợ, khách hàng, nhà tuyển dụng lao động
•Trách nhiệm trong các ấn phẩm và các bằng chứng
•Trách nhiệm của đối tượng nghiên cứu
•Trách nhiệm của các nhóm nghiên cứu.
•Trách nhiệm của các nhà thống kê/học viên
•Trách nhiệm tố giác các hành vi sai trái
•Trách nhiệm của nhà tuyển dụng bao gồm: Tổ chức, cá nhân,
luật sư, khách hàng
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 46
or duplicated, or posted to a publicly accessible website, in whole or in part.

46

23
Kết thúc Chương 1

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide 47
or duplicated, or posted to a publicly accessible website, in whole or in part.

47

24

You might also like