You are on page 1of 32

Chương 3.

HÀM PHÂN BỐ VÀ CHUẨN PHÂN BỐ

Department of Analytical Chemistry

School of Chemical Engineering – Hanoi University of Science and Technology (HUST)


Outline

3.1 Biểu diễn số liệu định lượng

3.2 Phân bố lý thuyết

3.3. Bài tập

2 HUST SCE 10/14/2021


3.1. Biểu diễn số liệu định lượng

Trong phân tích định lượng, số liệu thực nghiệm là các


số liệu thu được khi tiến hành các phép phân tích định
lượng. Để hệ thống hoá những số liệu này nhằm thu
được cái nhìn tổng quát hơn hoặc phục vụ cho những
nghiên cứu tiếp theo, người ta biểu diễn chúng dưới
dạng biểu đồ hoặc đồ thị.

3 HUST SCE
3.1. Biểu diễn số liệu định lượng

Bảng 3.1. Bảng kết quả phép xác định nitrat (µg/mL)
với số lần lặp 50

4 HUST SCE
3.1. Biểu diễn số liệu định lượng

Bảng 3.2. Tần suất của các phép đo xác định nitrat

Nồng độ nitrat (µg/mL) Tần suất


0,46 1
0,47 3
0,48 5
0,49 10
0,50 10
0,51 13
0,52 5
0,53 3

5 HUST SCE
3.1. Biểu diễn số liệu định lượng

Hình 3.1. Biểu đồ dữ liệu nồng độ nitrat

6 HUST SCE
3.1. Biểu diễn số liệu định lượng

Các dạng biểu đồ thường gặp là biểu đồ cột hay biểu đồ


hình chữ nhật (bar chart), biểu đồ hình quạt (pie chart),
biểu đồ tần suất (historgram) hay biểu đồ đường gấp
khúc (pylogon). Nếu cần biểu diễn giá trị thực nghiệm
của các tập số liệu khác nhau, thì sử dụng độ lớn của
các số liệu. Trong trường hợp cần biểu diễn các số liệu
trong cùng tập số liệu thì thường dùng tần suất của giá
trị đó trong tập số liệu.

7 HUST SCE
3.1. Biểu diễn số liệu định lượng

Các giá trị trong tập số liệu được chia thành các nhóm
khác nhau (category) và kiểm tra tần suất của giá trị đó
để biểu diễn kết quả đo dưới dạng điểm riêng biệt trên
trục số (được chia tuyến tính 1 chiều) và nhận định về
mật độ các điểm (trường hợp này gọi là phân bố 1
chiều) hoặc biểu diễn dạng bậc thang (cột) bằng cách
tập hợp các giá trị riêng rẽ thành k cấp có bề rộng d (5
< k < 20) (k  căn bậc hai tổng các giá trị đo được).

8 HUST SCE
3.1. Biểu diễn số liệu định lượng

Từ dạng phân bố tần suất có thể thấy được định tính về


sự xuất hiện sai số ngẫu nhiên. Khi sai số ngẫu nhiên
lớn thì phân bố rộng, sai số ngẫu nhiên nhỏ thì phân bố
hẹp và nhọn, nhưng trong trường hợp này không cho
biết về sai số hệ thống vì sai số hệ thống không làm
thay đổi dạng phân bố.

9 HUST SCE
3.2. Phân bố lý thuyết

Khi hệ thống hoá các giá trị đo và biểu diễn chúng trên
đồ thị bằng cách vẽ tần suất của giá trị nào đó với một
trục là giá trị đó, ta luôn thu được các phân bố dạng
cột, đặc biệt khi chỉ có sai số ngẫu nhiên. Do đó, cho
phép giả thiết có những qui luật toán học làm cơ sở của
những phân bố đó.

10 HUST SCE
3.2. Phân bố lý thuyết
3.2.1. Phân bố chuẩn (Phân bố Gauss)

Nếu một thí nghiệm được lặp đi lặp lại nhiều lần với các
sai số là ngẫu nhiên thì khi đó các kết quả có xu hướng
chụm đối xứng tại giá trị trung bình. Số thí nghiệm
được lặp càng nhiều, các kết quả lại càng gần nhau và
đường cong lý tưởng được gọi là phân bố Gauxơ.

Nói chung, chúng ta không thể làm thí nghiệm với số


lần lặp rất lớn trong phòng thí nghiệm. Chúng ta thường
lặp lại các thí nghiệm từ 3 đến 5 lần hơn là 2000 lần.
Tuy nhiên, chúng ta có thể ước lượng các tính chất
thống kê từ một bộ số liệu với số lần lặp ít.

11 HUST SCE
3.2. Phân bố lý thuyết
3.2.1. Phân bố chuẩn (Phân bố Gauss)

Hình 3.1. Đường cong Gauss mô tả thời gian sống của bóng đèn số lượng
bóng đèn

12 HUST SCE
3.2. Phân bố lý thuyết
3.2.1. Phân bố chuẩn (Phân bố Gauss)

(3-1)

Ở đây e (= 2,71828..) là cơ số
của logarit tự nhiên. Cho một
tập số liệu, chúng ta lấy gần
đúng µ = 𝑥 và σ=s. Trong đó
là µ giá trị thực, x là giá trị thực
nghiệm, σ là độ lệch chuẩn. µ
và σ là các số thực, được gọi là Hình 3.2. Đường cong Gauxơ với σ
tham số phân bố, y là hàm số = 1 và µ = 0
của x và chính là xác suất của
x.

13 HUST SCE
3.2. Phân bố lý thuyết
3.2.1. Phân bố chuẩn (Phân bố Gauss)

Vị trí và dạng đường cong được


xác định bởi  và . Cực đại của
đường cong tại y' = 0, tức là ở
điểm x=. Các điểm uốn là x1=
 – và x2 = +. Nếu cho , 
thì y = f(x). Khi y = 0 thì x=.
Tuy nhiên, trên thực tế có thể bỏ
qua các giá trị của trục tung khi
x ngoài khoảng   3.

Hình 3-3. Phân bố chuẩn với các


giá trị trung bình cộng khác nhau
(a): µ=0, σ2 = 25; (b): µ=0, σ2 =
100; (c): µ=0, σ2 = 400;

14 HUST SCE
3.2. Phân bố lý thuyết
3.2.1. Phân bố chuẩn (Phân bố Gauss)

Đồ thị này rất hữu ích để diễn


đạt các độ lệch từ giá trị đúng,
z, của giá trị độ lệch chuẩn.
Chúng ta có thể chuyển đổi x
thành z thông qua:

(3-2)

Xác suất của việc đo z trong một


miền nhất định là bằng diện tích
của miền này. Ví dụ, xác suất
của việc phát hiện z trong miền Hình 3-4. Biểu diễn hình học của
từ – 2 đến –1 là 0,136. độ lệch chuẩn

15 HUST SCE
3.2. Phân bố lý thuyết
3.2.1. Phân bố chuẩn (Phân bố Gauss)

Ví dụ: Nếu độ lặp lại của một quá trình chuẩn độ được phân bố chuẩn
với giá trị trung bình là 10,15 ml và độ lệch chuẩn là 0,02. Hãy xác
định xác suất của các phép đo nằm giữa 10,12 ml và 10,20 ml.

Tiêu chuẩn hóa giá trị đầu tiên cho z = (10,12 – 10,15) / 0,02 = –1,5.
Từ Bảng A.1 (tra trong phần phụ lục), F (– 1,5) = 0,0668.

Tiêu chuẩn hóa giá trị thứ hai cho z = (10.20 – 10,15) / 0,02 = 2,5.
Từ Bảng A.1, F (2,5) = 0,9938.

Do đó, xác suất của các phép đo nằm giữa 10,12 ml và 10,20 ml
(tương ứng z = – 1,5 đến 2,5) là 0,9938 – 0,0668 = 0,927.

16 HUST SCE
3.2. Phân bố lý thuyết
3.2.1. Phân bố chuẩn (Phân bố Gauss)

Độ lệch chuẩn đo độ rộng của


đường cong Gauxơ. Giá trị σ
càng lớn, đường cong Gauxơ
càng rộng. Trong bất kỳ đường
cong Gauxơ nào, 68,3% diện
tích từ miền µ – 1σ đến µ + 1σ.
Ngoài ra, 95,5% của diện tích
nằm trong phạm vi µ ± 2σ và
99,7% của diện tích nằm trong
miền µ ± 3σ.
Hình 3-4. Biểu diễn hình học của
độ lệch chuẩn

17 HUST SCE
3.2. Phân bố lý thuyết
3.2.1. Phân bố chuẩn (Phân bố Gauss)

Bảng 3.1. Diện tích và các tham số


trong phương trình đường cong sai số
Gauxơ

18 HUST SCE
3.2. Phân bố lý thuyết
3.2.1. Phân bố chuẩn (Phân bố Gauss)

Giả sử nhà sản xuất bóng đèn được sử dụng cho Hình 3-1 cung cấp để thay
thế miễn phí bất kỳ bóng đèn nào bị cháy trong vòng chưa đầy 600 giờ. Nếu
nhà máy dự định bán một triệu bóng đèn, nhà máy nên giữ thêm bao nhiêu
bóng đèn để thay thế?

Hình 3.1. Đường cong Gauss mô tả thời gian sống của bóng đèn số lượng bóng đèn

19 HUST SCE
3.2. Phân bố lý thuyết
3.2.1. Phân bố chuẩn (Phân bố Gauss)

Chúng ta cần biểu thị khoảng mong muốn theo bội số của độ
lệch chuẩn
và sau đó tìm diện tích của khoảng trong Bảng 4-1. Bởi vì 𝑥 =
600−845,2
845,2 và s = 94,2 và z = = –2,60. Vùng bên dưới
94,2
đường cong giữa giá trị trung bình và z = –2,60 là 0,495 3
trong Bảng 3-1. Toàn bộ khu vực từ –∞ đến giá trị trung bình
là 0,500 0, do đó diện tích từ –∞ đến –2,60 phải là 0,500 0 –
0,495 3 = 0,004 7. Vùng diện tích bên trái của 600 giờ trong
Hình 3-1 chỉ là 0,47% toàn bộ khu vực dưới đường cong.

Chỉ 0,47% của các bóng đèn dự kiến lỗi trong ít hơn 600 h.
Nếu nhà sản xuất bán 1 triệu bóng đèn một năm, họ nên làm
thêm 4 700 bóng đèn để đáp ứng nhu cầu thay thế.

20 HUST SCE
3.2. Phân bố lý thuyết
3.2.1. Phân bố chuẩn (Phân bố Gauss)

Số lần thí nghiệm tăng, độ chắc chắn của giá trị trung bình
càng gần với phân bố của giá trị thực, µ càng cao.

Nếu lấy tích phân của hàm phân bố chuẩn từ – đến +


thì toàn bộ phần diện tích giới hạn bởi đường cong biểu
diễn xác suất xuất hiện các giá trị xi. Giá trị xác suất này
gắn liền với độ tin cậy thống kê P. Nói cách khác, phần diện
tích giới hạn bởi đường cong là độ tin cậy thống kê để xuất
hiện xi trong khoảng tích phân.

21 HUST SCE
3.2. Phân bố lý thuyết
3.2.1. Phân bố chuẩn (Phân bố Gauss)

Đối với các tập số liệu có cùng giá trị thực  sẽ có cùng
diện tích đường cong Gauss nhưng nếu  càng nhỏ thì
đường cong càng hẹp và càng nhọn, độ chính xác càng
lớn. Xác suất để giá trị đo nằm ngoài giới hạn trên của tích
phân là  = 1– P. Phần diện tích P cũng được biểu diễn
theo % so với tổng diện tích và gọi là độ tin cậy thống kê.

22 HUST SCE
3.2. Phân bố lý thuyết
3.2.1. Phân bố chuẩn (Phân bố Gauss)

Đa số các kết quả đo trong phương pháp phân tích thông thường đều
tuân theo phân bố chuẩn (trừ các phép đếm). Tuy nhiên, khi xử lý
thống kê, đặc biệt trong các phép phân tích đa biến không được giả
thiết trước là có phân bố chuẩn trong các tập số liệu thu được từ các
phương pháp phân tích (như phân tích lượng vết, phân tích bán định
lượng...) mà phải kiểm tra xem tập số liệu có tuân theo phân bố chuẩn
hay không.

23 HUST SCE
3.2. Phân bố lý thuyết
3.2.1. Phân bố chuẩn (Phân bố Gauss)

Nếu ký hiệu độ tin cậy thống kê để xuất hiện giá trị xi nằm
trong vùng (– , xi) là P(xi). Từ hàm phân bố chuẩn, khi
cho giá trị ui(x) ta tính được độ tin cậy thống kê Pi (ứng với
diện tích Pi và ngược lại. Thay cho tính toán, người ta lập
sẵn bảng số để tra giá trị u khi biết P hoặc ngược lại.

24 HUST SCE
3.2. Phân bố lý thuyết
3.2.1. Phân bố chuẩn (Phân bố Gauss)

Chú ý: -Trong thực nghiệm có những tập số liệu tuân theo phân bố
chuẩn (giá trị trung bình, trung vị và số trội trùng nhau). Tuy nhiên
cũng có một số tập số liệu không theo phân bố này mà theo phân bố
lệch (skewed distribution) (tần xuất của số trội>trung vị>trung bình).
Khi giá trị skewed tiến tới không thì phân bố lệch trở thành phân bố
chuẩn. Những dạng phân bố lệch này có thể đạt được gần phân bố
chuẩn nếu chuyển các kết quả sang dạng logarit rồi tính giá trị trung
bình và độ lệch chuẩn. Phân bố này gọi là phân bố log-chuẩn (log-
normal distribution).

25 HUST SCE
3.2. Phân bố lý thuyết
3.2.1. Phân bố chuẩn (Phân bố Gauss)

Hình 3-5. Sự phân bố gần đúng


(log-chuẩn) của nồng độ chất
miễn dịch globulin trong huyết
thanh của đối tượng nam giới:
(a) Biểu diễn dưới dạng nồng độ
- độ lặp lại
(b) Biểu diễn dưới dạng log(nồng
độ) – độ lặp lại.

26 HUST SCE
3.2. Phân bố lý thuyết
3.2.2. Phân bố Poisson

Trong một số phương pháp phân tích hiện đại, kết quả phép đo là các
đại lượng nguyên rời rạc, như đếm xung vi phân trong Hoá phóng xạ,
đếm lượng tử trong phân tích phổ Rơn ghen…Số liệu thực nghiệm trong
các phương pháp này có đặc điểm như sau:

- Kết quả trong tập số liệu là những số đếm các sự kiện xảy ra trong
một khoảng thời gian.

- Xác suất xảy ra sự kiện trong một đơn vị thời gian là như nhau với các
khoảng thời gian khác nhau.

- Số sự kiện xảy ra trong khoảng thời gian này độc lập với khoảng thời
gian khác.

27 HUST SCE
3.2. Phân bố lý thuyết
3.2.2. Phân bố Poisson

Hình 3.6. Phân bố Poisson với các giá trị khác nhau của
trung bình cộng.

28 HUST SCE
3.2. Phân bố lý thuyết
3.2.2. Phân bố Poisson

Nếu lặp lại nhiều lần cùng một thí nghiệm thì mối quan hệ
giữa giá trị đo và tần xuất được biểu diễn bằng hàm phân
bố xác suất như sau:

 .e x
y .
x!
với x= 0,1, 2, 3… và  là trung bình của số các sự kiện
trong khoảng thời gian xét.

29 HUST SCE
3.2. Phân bố lý thuyết
3.2.2. Phân bố Poisson

Phân bố này được gọi là phân bố Poisson, các đại lượng đặc trưng
thống kê là:

- Giá trị trung bình  = .


- Phương sai 2 = 
-Giữa  và  có quan hệ: = 1/2 với  là số thực và  >0

Phân bố Poisson là phân bố rời rạc. Khi  nhỏ thì phân bố có dạng bất
đối xứng. Sự bất đối xứng giảm nhanh khi tăng  và dạng đường phân
bố tiến tới phân bố chuẩn.
Thực tế khi n >15 thì có thể coi như xấp xỉ phân bố chuẩn. Ứng với
bảng phân bố chuẩn sẽ có 68,3 % các giá trị trong giới hạn  – 1/2 và
 +1/2.

30 HUST SCE
3.2. Bài tập

1, Từ tỉ số của số nguyên tử dạng isotop 69Ga và 71Ga của 08 mẫu được lấy
từ các nguồn khác nhau, được đo nhằm mục đích hiểu được sự khác nhau
giữa khối lượng nguyên tử của gallium. Hãy xác định giá trị trung bình, độ
lệch chuẩn và phương sai

31 HUST SCE
3.2. Bài tập

2. Sử dụng bảng 3-1 cho bài tập này. Giả sử rằng quãng đường mà 10000
bộ phanh ô tô đã bị mòn 80% được ghi lại.
Giá trị trung bình là 62700 dặm, độ lệch chuẩn là 10400 dặm;

(a) Tính phần phanh được dự kiến mòn 80% ở 40860 dặm

(b) Tính phần phanh được dự kiến mòn 80% ở số dặm trong khoảng 57500
và 71020 dặm;

32 HUST SCE

You might also like