Professional Documents
Culture Documents
Tom Tat Luan An
Tom Tat Luan An
HCM
TRƯỜNG ĐH KHOA HỌC TỰ NHIÊN
Họ và tên NCS: Lê Thanh Hoa
TÓM TẮT LUẬN ÁN
1.1 Thống kê Bayes cho ước lượng trung bình của phân phối chuẩn............................................8
1.2 Thống kê Bayes cho ước lượng tỷ lệ của tổng thể .....................................................................9
1.3 Thống kê Bayes cho ước lượng tham số của phân phối Poisson ............................................10
2. Thống kê Bayes một chiều với dữ liệu nhiễu ................................................................................... 11
Phần 1: Tiểu luận tổng quan
y l y (1)
Có một khó khăn là việc áp dụng các dữ liệu trong Tài chính không tuân theo phân phối
chuẩn, mà thường có dạng đuôi nặng, do đó nó thích hợp với phân phối Student cũng
như các phân phối đuôi nặng khác. Vì vậy, tác giả đã sử dụng mô phỏng Gibbs sampler
nhằm ước lượng các đặc trưng cho phân phối hậu nghiệm. Giả sử vector tham số có
hai thành phần là 1 và 2 , với hàm mật độ của phân phối hậu nghiệm lần lượt là
1 2 , y và 2 1, y . Giá trị tiếp theo n của hàm mật độ hậu nghiệm biên là
tổng hợp sử dụng giá trị trước đó n1 theo chu trình sau
1n ~ 1 2n1 , y
(2)
2n ~ 2
1n , y .
Một dạng mô hình khác cũng hay được sử dụng trong Tài chính đó là mô hình tuyến tính
hỗn hợp tổng quát (GLMMs: generalized linear mixed models). Trong [6], tác giả nghiên
cứu về rủi ro tín dụng như là biến phụ thuộc trên dữ liệu Standard & Poor’s Credit Pro
với cơ sở dữ liệu 6.6 bao gồm 5676 người Mỹ từ tất cả 13 lĩnh vực công nghiệp, dạng
chu kỳ 6 tháng, gồm 40 chu kỳ từ tháng 1 năm 1981 đến tháng 12 năm 2000 với lớp các
mô hình tuyến tính hỗn hợp tổng quát (GLMMs: generalized linear mixed models). Với
mô hình này, Thống Kê Bayes được sử dụng thông qua kỹ thuật mô phỏng Gibbs sampler
nhằm ước lượng các tham số hồi quy, cho thấy hiệu quả tốt khi ước lượng. Ngoài ra,
phương pháp Bayes mở ra khả năng sử dụng các nguồn thông tin khác (cũng như các
mối tương quan) để đặt cho phân phối tiên nghiệm. Trong bài báo này, chủ yếu sử dụng
3
trường hợp không có thông tin tiên nghiệm cho các hệ số hồi quy, hệ số chặn và các
tham số của mô hình.
Sử dụng Thống kê Bayes thông qua phương pháp Markov chain Monte Carlo Bayes, Li
và các cộng sự qua bài báo [7] đã phát triển cho suy luận đối với mô hình thời gian liên
tục với biến động ngẫu nhiên và hoạt động vô hạn Lévy jumps. Các nghiên cứu thực
nghiệm trên chỉ số chứng khoán S&P 500 thấy rằng đây là một mô hình rất cần thiết. Và
bài báo [8] cũng tính toán các tham số dựa vào Bayes, cụ thể là sử dụng thuật toán
Markov chain Monte Carlo Metropolis, của mô hình tài chính về giá thị trường, sử dụng
66 giá quyền chọn Châu Âu và chỉ số S&P 500.
Gần đây, các tác giả trong bài báo [9] chỉ ra chìa khóa để xác định các chỉ số phát triển
kinh tế của Iran với dữ liệu theo năm từ 1974 đến 2010. Họ đã sử dụng mô hình BMA
(Bayes Model Averaging). Kết quả chỉ ra rằng doanh thu từ dầu là biến quan trọng nhất
ảnh hưởng đến phát triển của nền kinh tế Iran…
Giả sử các điểm dữ liệu nhiễu x1, x 2 ,...., x n có các hàm membership tương ứng là
x ., x .,...., x . , ước lượng điểm Bayes của các tham số và hàm độ tin cậy là các
1 2 n
số nhiễu có tính nhiễu phụ thuộc vào tính nhiễu của n điểm quan sát. Hàm membership
f x1 , x 2 ,..., x n là khó xác định nên họ đã đề nghị một phương pháp xác định mới là
unimodal cực đại.
Bước 1. Giả sử thay đổi từ 0 đến 1 với kích thước tăng thỏa mãn yêu cầu độ chính
xác.
Bước 2. Với mỗi giá trị cố định của được chọn trong bước 1, tìm giá trị lớn nhất của
hàm f x1, x2 ,...., xn sao cho x , i 1,2,..., n. Ký hiệu giá trị lớn nhất này là
i
f R .
4
Bước 3. Với mỗi giá trị cố định của được chọn trong bước 1, tìm giá trị nhỏ nhất của
hàm f x1, x2 ,...., xn sao cho x , i 1,2,..., n. Ký hiệu giá trị nhỏ nhất này là
i
f L .
Theo đòi hỏi của unimodal của hàm membership, ta có
với 0, t j 0, j 1,2,..., n.
Ước lượng điểm Bayes của tỷ lệ thất bại , được giả định như là biến ngẫu nhiên .
Trong hầu hết các trường hợp sẽ sử dụng hàm phân phối tiên nghiệm cho là phân phối
Gamma 1, 2 , hàm mật độ có dạng
2 1
f 1e (4)
1 2
1
5
với , 1 , 2 0 . Dựa vào công thức (3) và (4) ta có phân phối hậu nghiệm của là
n
phân phối Gamma 1 n, 2 t j . Ước lượng điểm Bayes cho tỷ lệ thất bại là
j1
trung bình của phân phối hậu nghiệm, được xác định như sau:
n 1
n
(5)
2 T j
j1
và lần lượt là
Ước lượng điểm Bayes của
L U
n 1 n 1
L U
L
,
U
, 0,1.
2 T j 2 T j
L n L U n U
j 1 j1
Các công thức tương tự cũng được xây dựng cho phân phối Gamma nghịch đảo, phân
phối Beta.
Sự đa dạng của các tham số nhiễu, các dạng phân phối nhiễu được thể hiện thông qua
các bài báo như [12] cũng chỉ ra ước lượng điểm Bayes với dữ liệu nhiễu cho phân phối
Beta và phân phối Pascal, phân phối Pascal này một lần nữa lại được nghiên cứu trong
bài báo [13], cũng như từ phân phối Gamma chuyển qua phân phối Log-Gamma âm. Bài
báo [14] cũng chỉ ra ước lượng điểm Bayes với dữ liệu nhiễu cho phân phối mũ. Trong
6
[13], tác giả đã chỉ ra các tham số nhiễu được giả định như biến ngẫu nhiên nhiễu với
phân phối tiên nghiệm nhiễu. Phương pháp ước lượng Bayes sẽ chỉ ra ước lượng điểm
Bayes nhiễu trên cơ sở các phân phối mũ. Minh họa bằng công thức phân phối beta.
Trên cơ sở những phân tích như trên, chúng tôi thấy rằng việc áp dụng Thống kê Bayes
đối với các loại dữ liệu, nhất là dữ liệu nhiễu sẽ rất cần thiết và mang tính ứng dụng cao
trong thực tế, đặc biệt trong mảng Kinh tế và Tài chính. Vì vậy, chúng tôi chọn đề tài
“Ứng dụng của Thống kê Bayes trong phân tích Tài chính”, với mục tiêu xây dựng
một phương pháp tính toán mới sử dụng Thống kê Bayes trong phân tích Tài chính.
7
Phần 2: Tóm tắt nội dung luận án
tức là
1
Y1 Y2 Yn
2 2 2
l Y1, Y2 , , Yn | e 2 2
Biến đổi phần trong ngoặc ta có
Thay vào biểu thức ta có
n 1 2 n
y
2
2 2
Y1 Y22 Yn2 ny 2 y
2
Dựa vào công thức ta thấy, likelihood của mẫu ngẫu nhiên có phân phối chuẩn, tỷ lệ
với likelihood của trung bình mẫu, tức là có phân phối chuẩn với trung bình là và
2
phương sai .
n
Giả sử ta có phân phối tiên nghiệm là phân phối chuẩn với trung bình m và phương sai
1
m
2
s , tức là e
2 2 s2 .
8
Ta tính được phân phối hậu nghiệm là
1 1 2 2
2
y s y m2
2 2
1 2
n
m 2 s2
2
2
Y1 , Y2 ,...,Yn e n e 2 s2 e n .
Biến đổi số mũ ta có
2
2
s y m
2
1 n
2
2 2 2 2
2
s y m
2
1 2 s s
n n
2
2 s n
2
n 2 2
2 2
2 s s s
n
Y1 , Y2 ,..., Yn e n e n
2
m s2 y
Do đó, phân phối hậu nghiệm là phân phối chuẩn với trung bình m n và
2
s2
n
2
2
s
phương sai s 2
'2 n .
s 2
n
Thống kê Bayes ước lượng trung bình chính là trung bình của phân phối hậu nghiệm
2 2
s y m 2
s2
B E Y1, Y2 ,..., Yn n y n m.
2
2
2
s
2
s
2
s
2
n n n
1.2 Thống kê Bayes cho ước lượng tỷ lệ của tổng thể
Chúng ta cần tính tổng số lần thành công trong n phép thử độc lập, trong đó mỗi tình
huống chỉ có hai khả năng xảy ra hoặc là thành công, hoặc là thất bại. Trung bình tỷ lệ
thành công trong phép thử thứ i là p , tỷ lệ trong tổng thể sẽ có đặc tính như vậy.
Khi đó ta có hàm hợp lý likelihood là
n y
l y|p Cny p y 1 p ; y 1, 2,, n; 0 p 1.
9
Giả sử phân phối tiên nghiệm cho p là phân phối beta a, b có hàm mật độ là
Phân phối hậu nghiệm là
n y b1 bn y1
p|y l y|p p p y 1 p p a1 1 p p a y1 1 p ,
0 p 1.
Sử dụng ước lượng cho p là trung bình của phân phối hậu nghiệm
p m a y a y
.
B
a y b n y n a b
1.3 Thống kê Bayes cho ước lượng tham số của phân phối Poisson
y e
l y| ,
y!
i 1 i 1
Ta nhận thấy hình dạng của hàm hợp lý likelihood có dạng hàm gamma r ,
v với
n
r Yi 1,
v n .
i 1
Hàm tiên nghiệm cho tham số λ của phân phối Poisson là gamma r ,v có dạng:
10
v r r 1e v
;r ,v .
r
Suy luận Bayesian cho tham số trong phân phối Poisson với hàm tiên nghiệm liên tục,
họ liên hợp cho các quan sát này là họ gamma. Định nghĩa về các phân phối tiên nghiệm
liên hợp, xem trong [15].
tức là hàm phân phối hậu nghiệm có dạng
n
gamma r ,
v gamma r Yi , n v .
i 1
Sử dụng ước lượng cho là trung bình của phân phối hậu nghiệm
n
r Yi
i1
.
nv
A x, A x ; x X ,
11
Trường hợp 2: A x 0 nghĩa là không có bất cứ thành viên nào của phần tử x trong tập
nhiễu A.
x x 2
A x exp ,
h A sup A x .
xX
1, A x ;
A x
0, A x .
b. Số nhiễu
Định nghĩa số nhiễu:
Một số nhiễu là một tập con nhiễu A của sao cho, xem [17]:
i. A x 1 một số chính xác x.
ii.
Hỗ trợ support x : A x 0 của A là bị chặn.
iii. Tập cut của A là khoảng đóng.
c. Tổng và tích các số nhiễu
Mệnh đề:
12
Giả sử hai số thực nhiễu là a và b . Khi đó a b và a b cũng là các số thực nhiễu. Hơn
nữa, khi biểu diễn dưới dạng cut , xem [11] và [12], ta có:
a b a int b
L L L U U L U U
L L L U U L U U
min a b , a b , a b , a b ,max a b , a b , a b , a b .
d. Trung bình và phương sai của các số nhiễu
1 , x 2 ,..., x n .
Giả sử mẫu ngẫu nhiên nhiễu gồm các quan sát x
Trung bình của các số nhiễu, xem [18] và [19], được xác định như sau
x x i
1 n
n i 1
x L , x U 1 n x
, 1n x
L n U
i i
n i 1 i 1
Phương sai mẫu hiệu chỉnh của các số nhiễu, xem [20], được xác định như sau
2
n
x i x
S i 1
2
n 1
13
L U
1 n L 2 n 2
2 L U
n U
S
, S
2
n 1
min
i 1
x i x
i 1 x i x x i x
, i 1
, x i x
,
n L 2 n L U U 2
max x i x , x i x x i x
1 n
n 1 i 1
i 1
, x i x
i 1
2.2 Thống kê Bayes nhiễu cho ước lượng trung bình của phân phối chuẩn
Giả sử rằng mẫu ngẫu nhiên như là các số mờ Y 1 , Y 2 ,..., Y n , trong đó mỗi quan sát độc lập cùng
và phương sai đã biết được giả định là các số mờ.
có phân phối chuẩn với kỳ vọng
2
và
Ước lượng điểm Bayes của được xác định lần lượt như sau:
L U
1
2
L
sU
mL
1 n 1 n 1
2
2 2
2
2 L
sL U s U
n
2
U L
y ,
1 n 1 n 1
2
2 2
2
2 L
sL U s U
1
2
U sL
mU
1 n 1 n 1
2
2 2
2
2 L
sL U s U
n
L 2
U
y , 0;1.
1 n 1 n 1
2
2 2
2
2 L
sL U s U
14
2.3 Thống kê Bayes cho ước lượng tỷ lệ thất bại của phân phối mũ với dữ liệu nhiễu
Dữ liệu ở thành phần thứ j như biến ngẫu nhiên mờ T j với j 1,2,..., n. Ta cũng giả định
rằng T 1 , T 2 ,..., T n là các phân phối độc lập và giống hệt nhau.
và , xem [11] và [19], được xác định lần lượt như sau:
Ước lượng điểm Bayes của
L U
n 1
L
L
;
1 n U n L
T T
U L
2 2
j
2 j
j 1 j 1
n 1
U
U , 0;1
1 n U n L
T T
U L
2 2
j
2 j
j 1 j 1
2.4 Thống kê Bayes nhiễu cho ước lượng xác suất sống sót của phân phối nhị thức
Giả sử xác suất sống sót như biến ngẫu nhiên mờ
p trong phân phối nhị thức B n, p , với giả
định 1 2 như là số của cỡ mẫu và 1 như là số sống sót. Phân phối tiên nghiệm là phân
phối Beta với hai tham số mờ 1 , 2 . Phân phối hậu nghiệm là phân phối Beta
x 1 , n 2 x .
Ước lượng điểm Bayes của
p và p , xem [12] và [19], xác định lần lượt là
L U
x 1
L
L
p
,
1
2n 1
U
2
U
n 1
L
2
L
x 1
U
U
p
, 0;1.
1
2
n 1
U
2
U
n 1
L
2
L
15
3. Thống kê Bayes nhiều chiều với dữ liệu nhiễu
16
[10] H.-Z. Huang, M. J. Zuo, and Z.-Q. Sun, “Bayesian reliability analysis for fuzzy
lifetime data,” Fuzzy Sets Syst., vol. 157, no. 12, pp. 1674–1686, Jun. 2006.
[11] H.-C. Wu, “Fuzzy Bayesian estimation on lifetime data,” Comput. Stat., vol. 19,
no. 4, pp. 613–633, 2004.
[12] H.-C. Wu, “Fuzzy reliability estimation using Bayesian approach,” Comput. Ind.
Eng., vol. 46, no. 3, pp. 467–493, Jun. 2004.
[13] R. Gholizadeh, A. M. Shirazi, B. S. Gildeh, and E. Deiri, “Fuzzy Bayesian system
reliability assessment based on Pascal distribution,” Struct. Multidiscip. Optim.,
vol. 40, no. 1–6, pp. 467–475, 2010.
[14] H.-C. Wu, “Fuzzy Bayesian system reliability assessment based on exponential
distribution,” Appl. Math. Model., vol. 30, no. 6, pp. 509–530, Jun. 2006.
[15] A. Gelman, J. B. Carlin, H. S. Stern, and D. B. Rubin, Bayesian data analysis, vol.
2. Taylor & Francis, 2014.
[16] R. Scherer, Multiple Fuzzy Classification Systems, vol. 288. Berlin, Heidelberg:
Springer Berlin Heidelberg, 2012.
[17] H. T. Nguyen and B. Wu, “Random fuzzy sets,” in Fundamentals of Statistics
with Fuzzy Data, Springer, 2006, pp. 35–43.
[18] H. T. Nguyen, V. Kreinovich, B. Wu, and G. Xiang, “Computing statistics under
interval and fuzzy uncertainty,” Stud. Comput. Intell., vol. 393, 2012.
[19] R. Viertl, Statistical methods for fuzzy data. Chichester, West Sussex: Wiley,
2011.
[20] M. A. Bashar and S. Shirin, “Squares and square roots of continuous fuzzy
numbers,” Dhaka Univ J Sci, vol. 53, no. 2, pp. 131–140, 2005.
17