Tom Tat Luan An

ĐẠI HỌC QUỐC GIA TP.
HCM
TRƯỜNG ĐH KHOA HỌC TỰ NHIÊN

Họ và tên NCS: Lê Thanh Hoa

TÓM TẮT LUẬN ÁN
ỨNG DỤNG CỦA THỐNG KÊ BAYES

TRONG PHÂN TÍCH TÀI CHÍNH

Ngành: Toán Ứng dụng
Mã số ngành: 62460112
Khóa học năm: 2015
Người hướng dẫn khoa học: 1. TS. Phạm Hoàng Uyên
2. TS. Nguyễn Thanh Bình

Tp. HCM, năm 2016
ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐH KHOA HỌC TỰ NHIÊN

Họ và tên NCS: Lê Thanh Hoa

TÓM TẮT LUẬN ÁN
ỨNG DỤNG CỦA THỐNG KÊ BAYES

TRONG PHÂN TÍCH TÀI CHÍNH

Mục lục
Phần 1: Tiểu luận tổng quan ....................................................................................................................... 2
1. Tầm quan trọng của Thống kê Bayes ................................................................................................. 2
2. Ứng dụng của Thống kê Bayes trong Tài chính ............................................................................ 3
3. Thống kê Bayes với dữ liệu nhiễu ................................................................................................... 4
Phần 2: Tóm tắt nội dung luận án .............................................................................................................. 8
1. Thống kê Bayes của một số đặc trưng thống kê ................................................................................ 8
1.1 Thống kê Bayes cho ước lượng trung bình của phân phối chuẩn............................................8
1.2 Thống kê Bayes cho ước lượng tỷ lệ của tổng thể .....................................................................9
1.3 Thống kê Bayes cho ước lượng tham số của phân phối Poisson ............................................10
2. Thống kê Bayes một chiều với dữ liệu nhiễu ................................................................................... 11
2.1 Một số vấn đề về lý thuyết tâp nhiễu ........................................................................................11

2.2 Thống kê Bayes nhiễu cho ước lượng trung bình của phân phối chuẩn ...............................14
2.3 Thống kê Bayes cho ước lượng tỷ lệ thất bại của phân phối mũ với dữ liệu nhiễu ..............15
2.4 Thống kê Bayes nhiễu cho ước lượng xác suất sống sót của phân phối nhị thức .................15
3. Thống kê Bayes nhiều chiều với dữ liệu nhiễu ................................................................................ 16
4. Ứng dụng trong phân tích tài chính .............................................................................................. 16

Phần 1: Tiểu luận tổng quan
1. Tầm quan trọng của Thống kê Bayes

Trong các nghiên cứu chủ yếu sử dụng thống kê tần suất, trong đó các tham số được
giả định như là các hằng số, ví dụ như trung bình  của tổng thể có phân phối chuẩn
được ước lượng bằng trung bình của mẫu ngẫu nhiên. Tuy nhiên, khi ước lượng như
vậy dẫn đến sai lệch nhiều so với thực tế. Để hạn chế bớt sự sai lệch này, người ta giả
định lại tham số  dưới dạng một phân phối. Phương pháp thống kê mà coi các tham
số như là các biến ngẫu nhiên đó chính là thống kê Bayes. Ưu điểm của thống kê
Bayes là kiến thức chuyên gia được thể hiện trong thông tin tiên nghiệm và kết quả sẽ
được kiểm nghiệm lại thông qua dữ liệu. Đối với bài toán ước lượng trung bình  của
tổng thể có phân phối chuẩn ở trên, trong thống kê Bayes người ta sẽ lấy giá trị ước
lượng là trung bình của phân phối hậu nghiệm. Trong trường hợp không có bất cứ
thông tin gì thì chúng ta coi phân phối tiên nghiệm là phân phối đều. Khi đó ước lượng
cho trung bình của tổng thể có phân phối chuẩn theo thống kê tần suất và thống kê
Bayes trùng nhau.
Trong [1], tác giả đã nêu lên hai tình huống liên quan đến xác suất hay gặp trong cuộc
sống. Thứ nhất đó là khi chúng ta tung đồng xu N lần, khi N lớn và thấy có khoảng
N
lần xuất hiện mặt ngửa, thì chúng ta nói rằng xác suất xuất hiện mặt ngửa là 50% khi
2
tung đồng xu. Sự giải thích về xác suất như vậy được gọi là Thống kê Tần suất. Mặt
khác, chúng ta cũng không thể nghe thấy trong bản tin thời tiết buổi tối có phát biểu
“Khả năng trời mưa vào ngày mai là 50%”. Phát biểu đó không thể xảy ra do thời tiết
không phải là một thử nghiệm ngẫu nhiên, do đó không sử dụng tần suất để xác định xác
suất. Hơn nữa, nó chuyển tải một phát biểu của thông tin, đó là cách Thống kê Bayes sử
dụng xác suất.
Tác giả cũng đã chỉ ra rằng Thống kê Bayes được phát triển mạnh mẽ trong những năm
gần đây và có nhiều ứng dụng rộng rãi. Kiến thức về mô hình trước khi sử dụng dữ liệu
trước về thống kê được gọi là thông tin tiên nghiệm. Thông tin tiên nghiệm này kết hợp
với thông tin thu được từ dữ liệu để đưa ra một phân phối thống kê tinh chỉnh hơn, đó
chính là phân phối hậu nghiệm.
Hiệu quả của thống kê Bayes được Arima và các cộng sự chỉ ra rằng với mô phỏng dữ
liệu thì dự báo theo Thống kê Bayes có trung bình bình phương sai số thực nghiệm nhỏ
hơn so với Thống kê Tần suất. Cụ thể [2] đã đề cập đến phương pháp Bayes cho mô hình
khu vực nhỏ (small area) khi thông tin hỗ trợ là độ đo sai số.
Hơn nữa, Thống kê Bayes đã được ứng dụng rộng rãi trong phân tích Tài chính, đặc biệt
là các trường hợp dữ liệu thưa, nếu sử dụng ước lượng theo Thống kê Tần suất sẽ dẫn
2
đến sai số ước lượng lớn. Để khắc phục tình trạng này Kadam và Lenk [3] đã sử dụng
kỹ thuật ước lượng Bayes – Markov chain Monte Carlo phân tích số liệu về tiềm lực tài
chính tại thời điểm cuối năm 2005, theo dữ liệu lịch sử về tỷ lệ của 112 quốc gia và 14
ngành công nghiệp.
2. Ứng dụng của Thống kê Bayes trong Tài chính

Trong [4], tác giả đã thống kê sự phát triển mạnh mẽ của phương pháp Bayes trong thống
kê và ứng dụng trong kinh tế.
Trong Tài chính, người ta thường sử dụng mô hình thống kê, một trong những mô hình
hay được sử dụng nhiều nhất hiện nay là mô hình hồi quy GARCH. Bài báo [5] chỉ ra
rằng suy luận Bayes có thể sử dụng được trong mô hình hồi quy GARCH. Dữ liệu bài
báo sử dụng dữ liệu chỉ số chứng khoán của sàn Brussels. Các tham số cần ước lượng
biểu diễn như một vector các tham số    w, ,  , v . Từ một mẫu gồm T quan sát,
hàm mật độ hậu nghiệm xác định theo công thức
  y       l  y  (1)
Có một khó khăn là việc áp dụng các dữ liệu trong Tài chính không tuân theo phân phối
chuẩn, mà thường có dạng đuôi nặng, do đó nó thích hợp với phân phối Student cũng
như các phân phối đuôi nặng khác. Vì vậy, tác giả đã sử dụng mô phỏng Gibbs sampler
nhằm ước lượng các đặc trưng cho phân phối hậu nghiệm. Giả sử vector tham số  có
hai thành phần là 1 và  2 , với hàm mật độ của phân phối hậu nghiệm lần lượt là
 1 2 , y  và   2 1, y  . Giá trị tiếp theo  n của hàm mật độ hậu nghiệm biên là
tổng hợp sử dụng giá trị trước đó  n1 theo chu trình sau

1n ~  1 2n1 , y 
(2)
2n ~  2 
1n , y .
Một dạng mô hình khác cũng hay được sử dụng trong Tài chính đó là mô hình tuyến tính
hỗn hợp tổng quát (GLMMs: generalized linear mixed models). Trong [6], tác giả nghiên
cứu về rủi ro tín dụng như là biến phụ thuộc trên dữ liệu Standard & Poor’s Credit Pro
với cơ sở dữ liệu 6.6 bao gồm 5676 người Mỹ từ tất cả 13 lĩnh vực công nghiệp, dạng
chu kỳ 6 tháng, gồm 40 chu kỳ từ tháng 1 năm 1981 đến tháng 12 năm 2000 với lớp các
mô hình tuyến tính hỗn hợp tổng quát (GLMMs: generalized linear mixed models). Với
mô hình này, Thống Kê Bayes được sử dụng thông qua kỹ thuật mô phỏng Gibbs sampler
nhằm ước lượng các tham số hồi quy, cho thấy hiệu quả tốt khi ước lượng. Ngoài ra,
phương pháp Bayes mở ra khả năng sử dụng các nguồn thông tin khác (cũng như các
mối tương quan) để đặt cho phân phối tiên nghiệm. Trong bài báo này, chủ yếu sử dụng
3
trường hợp không có thông tin tiên nghiệm cho các hệ số hồi quy, hệ số chặn và các
tham số của mô hình.
Sử dụng Thống kê Bayes thông qua phương pháp Markov chain Monte Carlo Bayes, Li
và các cộng sự qua bài báo [7] đã phát triển cho suy luận đối với mô hình thời gian liên
tục với biến động ngẫu nhiên và hoạt động vô hạn Lévy jumps. Các nghiên cứu thực
nghiệm trên chỉ số chứng khoán S&P 500 thấy rằng đây là một mô hình rất cần thiết. Và
bài báo [8] cũng tính toán các tham số dựa vào Bayes, cụ thể là sử dụng thuật toán
Markov chain Monte Carlo Metropolis, của mô hình tài chính về giá thị trường, sử dụng
66 giá quyền chọn Châu Âu và chỉ số S&P 500.
Gần đây, các tác giả trong bài báo [9] chỉ ra chìa khóa để xác định các chỉ số phát triển
kinh tế của Iran với dữ liệu theo năm từ 1974 đến 2010. Họ đã sử dụng mô hình BMA
(Bayes Model Averaging). Kết quả chỉ ra rằng doanh thu từ dầu là biến quan trọng nhất
ảnh hưởng đến phát triển của nền kinh tế Iran…
3. Thống kê Bayes với dữ liệu nhiễu

Các dữ liệu quan sát thường được giả định là các số thực chính xác. Tuy nhiên, trong
thực tế dữ liệu thường dưới dạng không chính xác, biểu diễn theo dạng số nhiễu. Giải
thích điều này, Huang và các cộng sự trong bài báo [10] đã chỉ ra lý do cần nghiên cứu
các công thức liên quan đến dữ liệu nhiễu. Cần có một phương pháp ước lượng thống kê
tổng quát, áp dụng cho không những số thực mà cả số nhiễu. Ngoài ra, phương pháp
Bayes đã chỉ ra tính hữu dụng ngay cả khi cỡ mẫu nhỏ. Trong bài báo này, họ đã đề nghị
một phương pháp mới xác định hàm membership cho ước lượng các tham số và hàm độ
tin cậy các phân phối của nhiều tham số.
Giả sử các điểm dữ liệu nhiễu x1, x 2 ,...., x n có các hàm membership tương ứng là
x ., x .,...., x . , ước lượng điểm Bayes của các tham số và hàm độ tin cậy là các
1 2 n
số nhiễu có tính nhiễu phụ thuộc vào tính nhiễu của n điểm quan sát. Hàm membership
f x1 , x 2 ,..., x n  là khó xác định nên họ đã đề nghị một phương pháp xác định mới là
unimodal cực đại.
Bước 1. Giả sử  thay đổi từ 0 đến 1 với kích thước tăng thỏa mãn yêu cầu độ chính
xác.
Bước 2. Với mỗi giá trị cố định của  được chọn trong bước 1, tìm giá trị lớn nhất của
hàm f  x1, x2 ,...., xn  sao cho x  , i  1,2,..., n. Ký hiệu giá trị lớn nhất này là
i
f R .
4
Bước 3. Với mỗi giá trị cố định của  được chọn trong bước 1, tìm giá trị nhỏ nhất của
hàm f  x1, x2 ,...., xn  sao cho x  , i  1,2,..., n. Ký hiệu giá trị nhỏ nhất này là
i
f L .
Theo đòi hỏi của unimodal của hàm membership, ta có
 f  f    với f L   f  f R ,
trong đó f L , f R  lần lượt là giá trị cận dưới và cận trên của hàm f tại mức cắt

  cut.
Theo quá trình ở trên, ta đã thu được hàm membership của hàm f x 1, x 2 ,...., x n dưới

 
dạng số. Phần minh họa cho phân tích độ tin cậy Bayes cho dữ liệu nhiễu, sử dụng cho
hai trường hợp là phân phối chuẩn và phân phối Weibull.
Đối với dữ liệu nhiễu, các tham số ước lượng và các phân phối xác suất cũng được biểu
diễn dưới dạng nhiễu. Như Wu trong bài báo [11] đã chỉ ra cách suy luận tham số nhiễu
với giả định như biến ngẫu nhiên nhiễu với phân phối tiên nghiệm nhiễu. Phương pháp
ước lượng được sử dụng là ước lượng điểm Bayes nhiễu.
Người ta giả định rằng có một bộ dữ liệu thực tế của n thành phần. Gọi T1 , T2 ,..., Tn độc
lập và giống hệt nhau có phân phối mũ với tỷ lệ thất bại  chưa biết.
Hàm hợp lý được xác định bởi
n
L     n e  t j (3)
j1
với   0, t j  0, j  1,2,..., n.
Ước lượng điểm Bayes của tỷ lệ thất bại  , được giả định như là biến ngẫu nhiên  .
Trong hầu hết các trường hợp sẽ sử dụng hàm phân phối tiên nghiệm cho  là phân phối
Gamma  1, 2  , hàm mật độ có dạng
2 1
f       1e  (4)
1 2
 1 
5
với  , 1 , 2  0 . Dựa vào công thức (3) và (4) ta có phân phối hậu nghiệm của  là
 n 
phân phối Gamma  1  n, 2   t j  . Ước lượng điểm Bayes cho tỷ lệ thất bại  là
 j1 
trung bình của phân phối hậu nghiệm, được xác định như sau:
 n  1
 n
(5)
2   T j
j1
Từ phân phối Gamma  1, 2  là phân phối tiên nghiệm của tỷ lệ  và kỳ vọng của

1
phân phối Gamma  1, 2  là , tức là 1 là số thất bại trên số các đơn vị thời gian 2 .
2
Như vậy, số các trường hợp không thể ghi được chính xác số các thất bại của con người
hoặc máy móc và thời gian không thể đo lường một cách chính xác trong một số tình
huống bất ngờ. Trong trường hợp đó, ta chỉ có thể nói có khoảng 1 thất bại trong khoảng
1
2 đơn vị thời gian. Cụm “khoảng ” có thể được mô tả như một số nhiễu, tức là tỷ lệ
2
 . Theo đó, ước lượng điểm Bayes, tỷ lệ thất bại được
thất bại  được xem như số nhiễu 
giả định như biến ngẫu nhiên   với hai số thực nhiễu đã biết là  1 và  2 . Do đó, dữ
liệu thực tế cho thành phần thứ j được xem như biến ngẫu nhiên nhiễu T j , với
j  1,2,..., n. Ta vẫn giả định rằng T 1,T 2 ,...,T n là độc lập và có các phân phối giống
hệt nhau.
  và   lần lượt là
Ước lượng điểm Bayes của 
L U
n  1  n  1 
L U
L 
 
, 

U
 

,    0,1.
2    T j   2    T j 
L n L U n U
 j 1   j1 
Các công thức tương tự cũng được xây dựng cho phân phối Gamma nghịch đảo, phân
phối Beta.
Sự đa dạng của các tham số nhiễu, các dạng phân phối nhiễu được thể hiện thông qua
các bài báo như [12] cũng chỉ ra ước lượng điểm Bayes với dữ liệu nhiễu cho phân phối
Beta và phân phối Pascal, phân phối Pascal này một lần nữa lại được nghiên cứu trong
bài báo [13], cũng như từ phân phối Gamma chuyển qua phân phối Log-Gamma âm. Bài
báo [14] cũng chỉ ra ước lượng điểm Bayes với dữ liệu nhiễu cho phân phối mũ. Trong
6
[13], tác giả đã chỉ ra các tham số nhiễu được giả định như biến ngẫu nhiên nhiễu với
phân phối tiên nghiệm nhiễu. Phương pháp ước lượng Bayes sẽ chỉ ra ước lượng điểm
Bayes nhiễu trên cơ sở các phân phối mũ. Minh họa bằng công thức phân phối beta.
Trên cơ sở những phân tích như trên, chúng tôi thấy rằng việc áp dụng Thống kê Bayes
đối với các loại dữ liệu, nhất là dữ liệu nhiễu sẽ rất cần thiết và mang tính ứng dụng cao
trong thực tế, đặc biệt trong mảng Kinh tế và Tài chính. Vì vậy, chúng tôi chọn đề tài
“Ứng dụng của Thống kê Bayes trong phân tích Tài chính”, với mục tiêu xây dựng
một phương pháp tính toán mới sử dụng Thống kê Bayes trong phân tích Tài chính.
7
Phần 2: Tóm tắt nội dung luận án
1. Thống kê Bayes của một số đặc trưng thống kê

1.1 Thống kê Bayes cho ước lượng trung bình của phân phối chuẩn
Với mẫu ngẫu nhiên Y1 , Y2 , , Yn , ta có các quan sát này là độc lập với nhau, nên
likelihood đồng thời của mẫu được xây dựng như sau:
l Y1, Y2 , , Yn |  l Y1|l Y2 |l Yn |
Ta xét trường hợp, phân phỗi của mỗi quan sát Y j | là phân phối chuẩn với trung bình

 và phương sai đã biết  2 . Khi đó theo công thức trên ta có
1 1 1
Y1 Y2  Yn 
2 2 2
  
l Y1, Y2 , , Yn |  e 2 2 e 2 2  e 2 2
tức là
1 
Y1 Y2  Yn  
2 2 2

l Y1, Y2 , , Yn |  e 2 2 
Biến đổi phần trong ngoặc ta có
Y1    Y2    ...  Yn  

2 2 2
 n 2  2 Y1  Y2  ...  Yn   Y12  Y22  ...  Yn2 

 n 2  2n y  Y12  Y22  ...  Yn2 
 n   y   Y12  Y22  ...  Yn2   n y .

2 2
Thay vào biểu thức ta có
n 1  2 n
  y 
2

2 2 
Y1 Y22 Yn2 ny 2    y 
2
l Y1, Y2 , , Yn |  e 2 2 e e 2 2
Dựa vào công thức ta thấy, likelihood của mẫu ngẫu nhiên có phân phối chuẩn, tỷ lệ
với likelihood của trung bình mẫu, tức là có phân phối chuẩn với trung bình là  và
2
phương sai .
n
Giả sử ta có phân phối tiên nghiệm là phân phối chuẩn với trung bình m và phương sai
1
m
2

s , tức là    e
2 2 s2 .
8
Ta tính được phân phối hậu nghiệm là
1 1  2 2 
2
 y  s  y  m2 
2 2
 
 1  2
 n 
m 2 s2 
2
2 
  Y1 , Y2 ,...,Yn   e n e 2 s2 e n .
Biến đổi số mũ ta có
  2 
2
  s y   m 
2
1   n 

 2 
  2   2   2  2 
2
  s y   m 
2
1  2     s   s  
n  n 
2
 2  s     n  
 2   
n  2   2
 2 2
2 s   s   s
n 
  Y1 , Y2 ,..., Yn   e n  e n
2
m s2 y 
Do đó, phân phối hậu nghiệm là phân phối chuẩn với trung bình m  n và
 2
s2 
n
 2
2
s
phương sai s  2
'2 n .

s 2
n
Thống kê Bayes ước lượng trung bình  chính là trung bình của phân phối hậu nghiệm
2 2
s y m 2
 s2
 B  E  Y1, Y2 ,..., Yn   n  y n m.
 2
 2
2
s 
2
s 
2
s 
2
n n n
1.2 Thống kê Bayes cho ước lượng tỷ lệ của tổng thể
Chúng ta cần tính tổng số lần thành công trong n phép thử độc lập, trong đó mỗi tình
huống chỉ có hai khả năng xảy ra hoặc là thành công, hoặc là thất bại. Trung bình tỷ lệ
thành công trong phép thử thứ i là p , tỷ lệ trong tổng thể sẽ có đặc tính như vậy.
Phân phối có điều kiện của lần thành công trong n phép thử khi đã biết tham số p là

phân phối nhị thức B n, p .
Khi đó ta có hàm hợp lý likelihood là
n y
l  y|p   Cny p y 1  p  ; y  1, 2,, n; 0  p  1.
9
Giả sử phân phối tiên nghiệm cho p là phân phối beta  a, b có hàm mật độ là
a  b a1 b1

  p; a, b  p 1  p ; 0  p  1.
a b
Phân phối hậu nghiệm là
n y b1 bn y1
  p|y   l  y|p   p   p y 1  p  p a1 1  p   p a y1 1  p ,
0  p  1.
Phân phối hậu nghiệm có dạng phân phối beta a , b  beta a  y, b  n  y  .
Sử dụng ước lượng cho p là trung bình của phân phối hậu nghiệm
p  m  a y a y
 .
B
a  y  b  n  y n  a  b
1.3 Thống kê Bayes cho ước lượng tham số của phân phối Poisson
Hàm hợp lý likelihood của một quan sát từ phân phối Poisson được xác định như

sau
 y e
l  y|   ,
y!
với y  0,1 ,  và   0 , nên hình dạng của hàm hợp lý likelihood là l |y    y e .
Trường hợp mẫu ngẫu nhiên độc lập có phân phối Poisson   làY1, ,

Y2, Yn , chúng
ta xây dựng hàm hợp lý likelihood có hình dạng:
n
n n
Yi
l Y1, Yn |   l Yi |    e    e n .
Yi
,
Y2 , i 1
i 1 i 1
Ta nhận thấy hình dạng của hàm hợp lý likelihood có dạng hàm gamma r ,
v  với
n
r   Yi  1,
v   n .
i 1
Hàm tiên nghiệm cho tham số λ của phân phối Poisson là gamma r ,v  có dạng:
10
v r r 1e v 
 ;r ,v   .
 r 
Suy luận Bayesian cho tham số trong phân phối Poisson với hàm tiên nghiệm liên tục,
họ liên hợp cho các quan sát này là họ gamma. Định nghĩa về các phân phối tiên nghiệm
liên hợp, xem trong [15].
Nếu  là lớp các phân phối mẫu f  y| và  là lớp các phân phối tiên nghiệm thì lớp

 sẽ là liên hợp với  nếu f |y   với mọi f  y |    và f    .
Hàm hậu nghiệm có dạng

n
r  Yi 1
n v 
 |Y1,
Y2 , Yn   
, i 1
e .
tức là hàm phân phối hậu nghiệm có dạng
 n 

gamma r ,
v    gamma r  Yi , n  v  .
 i 1 
Sử dụng ước lượng cho  là trung bình của phân phối hậu nghiệm
n
r   Yi
i1
 .
nv
2. Thống kê Bayes một chiều với dữ liệu nhiễu

2.1 Một số vấn đề về lý thuyết tâp nhiễu
a. Tập nhiễu, độ cao của tập nhiễu và   cut
Định nghĩa tập nhiễu: Tập nhiễu A khác rỗng trong không gian X , ký hiệu là A  X , là

một tập gồm cặp
A   x,  A  x   ; x  X ,
trong đó  A : X   0,1 là một hàm membership của tập nhiễu A.
Hàm membership xác định với mỗi phần tử x  X , số bậc thành viên của tập nhiễu A, biểu thị

qua ba trường hợp như sau, xem [16]
Trường hợp 1:  A  x   1 nghĩa là tất cả các thành viên của phần tử x trong tập nhiễu A.
11
Trường hợp 2:  A  x   0 nghĩa là không có bất cứ thành viên nào của phần tử x trong tập
nhiễu A.
Trường hợp 3: 0   A  x   1 có nghĩa là một phần thành viên của phần tử x thuộc vào tập

nhiễu A.
Trong bài báo này, chúng tôi sử dụng hàm membership dạng đặc biệt đó là hàm Gaussian
membership, công thức mô tả như sau
  x  x 2 
 A  x   exp     ,
    
trong đó x là điểm giữa và  định nghĩa là độ rộng của đường cong Gaussian.
Định nghĩa độ cao của tập nhiễu: Độ cao của tập nhiễu A , ký hiệu là h  A  được định nghĩa

là
h  A   sup  A  x  .
xX
Định nghĩa   cut :

  cut của tập nhiễu A  X , biểu thị bởi A là một tập không nhiễu như sau
A  x    x  X :  A    ,    0,1 ,
hoặc tập được định nghĩa bởi hàm đặc trưng, xem [16]:
1,  A  x    ;
 A  x   
 0,  A  x    .
b. Số nhiễu
Định nghĩa số nhiễu:
Một số nhiễu là một tập con nhiễu A của  sao cho, xem [17]:
i. A  x   1 một số chính xác x.
ii.  
Hỗ trợ support x : A  x   0 của A là bị chặn.
iii. Tập   cut của A là khoảng đóng.
c. Tổng và tích các số nhiễu
Mệnh đề:
12
Giả sử hai số thực nhiễu là a và b . Khi đó a  b và a  b cũng là các số thực nhiễu. Hơn
nữa, khi biểu diễn dưới dạng   cut , xem [11] và [12], ta có:
 a  b   a  int b   a L  b L , aU  bU 

và
 a  b   a  int b 

 L L L U U L U U
  L L L U U L U U

  min a  b  , a  b  , a  b  , a  b  ,max a  b  , a  b  , a  b  , a  b   .

d. Trung bình và phương sai của các số nhiễu
 1 , x 2 ,..., x n .
Giả sử mẫu ngẫu nhiên nhiễu gồm các quan sát x
Trung bình của các số nhiễu, xem [18] và [19], được xác định như sau
x   x i
1 n
n i 1
Hơn nữa, nếu các quan sát nhiễu x i có   cut là  x  , x   thì trung bình của các số

i
L
i
U
nhiễu cũng có   cut là

 x L , x U    1 n x
  , 1n   x  
L n U
     i i
   n i 1 i 1
Phương sai mẫu hiệu chỉnh của các số nhiễu, xem [20], được xác định như sau
2
n

 x i  x
 
S  i 1
2

n 1
Hơn nữa, nếu các quan sát nhiễu x i có   cut là  x  , x   thì phương sai mẫu hiệu

i
L
i
U
chỉnh của các số nhiễu cũng có   cut là
13
L U
  1  n  L 2 n 2

 2      L    U
 n   U


   
 S

, S
2

 
  n 1
 
min  


i 1 

x i  x 


 

 i 1  x i  x    x i  x
,     i 1 

,   x i  x  

,

 n  L 2 n L U U 2
 
max    x i  x  ,   x i  x   x i  x

1      n   
n 1 i 1 
   i 1 
  
    
,   x i  x
  i 1 
 

 
 
2.2 Thống kê Bayes nhiễu cho ước lượng trung bình của phân phối chuẩn
Giả sử rằng mẫu ngẫu nhiên như là các số mờ Y 1 , Y 2 ,..., Y n , trong đó mỗi quan sát độc lập cùng
 và phương sai đã biết  được giả định là các số mờ.
có phân phối chuẩn với kỳ vọng 
2
 và 
Ước lượng điểm Bayes của   được xác định lần lượt như sau:
L U
 
1
2
L
 

 
sU
 mL

   
1  n 1 n 1 
2
 2 2
 2 
2   L
    sL    U    s  U

     
n
2

 U  L
 y ,
   
1  n 1  n 1 
2
 2 2
 2 
2   L
    sL    U    s  U

     
1
2

 

U   sL
 mU

   
1  n 1 n 1 
2
 2 2
 2 
2   L
    sL    U    s  U

     
n

L 2

   U
 y ,    0;1.
   
1  n 1  n 1 
2
 2 2
 2 
2   L
    sL    U    s  U

     
14
2.3 Thống kê Bayes cho ước lượng tỷ lệ thất bại của phân phối mũ với dữ liệu nhiễu
Dữ liệu ở thành phần thứ j như biến ngẫu nhiên mờ T j với j  1,2,..., n. Ta cũng giả định
rằng T 1 , T 2 ,..., T n là các phân phối độc lập và giống hệt nhau.
  và   , xem [11] và [19], được xác định lần lượt như sau:
Ước lượng điểm Bayes của 
L U
n   1
L
L
  
  ;
1   n   U   n L
    T         T   
U L

2    2
 
 
j
 

2 j
 j 1 j 1 

n   1
U

  
U   ,    0;1
1   n   U   n L
    T         T   
U L

2   2
 
 
j
 

2 j
 j 1 j 1 
2.4 Thống kê Bayes nhiễu cho ước lượng xác suất sống sót của phân phối nhị thức
Giả sử xác suất sống sót như biến ngẫu nhiên mờ 
p trong phân phối nhị thức B n, p , với giả  
định  1   2 như là số của cỡ mẫu và  1 như là số sống sót. Phân phối tiên nghiệm là phân
phối Beta với hai tham số mờ   1 , 2 . Phân phối hậu nghiệm là phân phối Beta
 
 x   1 , n   2  x .
 
Ước lượng điểm Bayes của 
p và p , xem [12] và [19], xác định lần lượt là
L U

x   1
L
L
p 
  ,
1

2n   1    
U
  2
U

 n   1     
L
  2
L 

x   1
U
U
p 
  ,    0;1.
1

2 
n   1    
U
  2
U

 n   1     
L
  2
L 

15
3. Thống kê Bayes nhiều chiều với dữ liệu nhiễu
4. Ứng dụng trong phân tích tài chính

việc ứng dụng Thống kê Bayes để phân tích Tài chính là rất cần thiết, kết quả được chúng
tôi trình bày trong bài báo Phạm Hoàng Uyên, Nguyễn Đình Thiên, Lê Thanh Hoa,
“Thống kê Bayes trong dự báo giá chứng khoán Việt Nam”, Hội nghị Toàn quốc lần thứ
IV về Ứng dụng Toán học, 23-25/12/2015. Trong bài báo này, chúng tôi đã sử dụng
Thống kê Bayes của tất cả các mã cổ phiếu trên cả hai sàn giao dịch của Việt Nam là
HNX và HoSE, từ thời điểm bắt đầu lên sàn đến ngày 16/11/2015. Đánh giá hiệu quả
của dự báo cùng xu hướng với giá thực tế, tức là dự báo giá tăng thì giá thực sự tăng và
dự báo giá giảm thì giá thực sự giảm. Kết quả phân tích chỉ dựa vào giá đóng cửa thì
thấy rằng khả năng dự báo đúng 70% trở lên có 661/684 mã cổ phiếu. Trong trường hợp
giá cả tăng giảm nhanh, thì hầu như là dự báo đúng xu thế.

Tài liệu tham khảo

[1] J. A. Scales and R. Snieder, “To Bayes or not to Bayes?,” Geophysics, vol. 62, no.
4, pp. 1045–1046, 1997.
[2] S. Arima, G. S. Datta, and B. Liseo, “Bayesian estimators for small area models
when auxiliary information is measured with error,” Scand. J. Stat., vol. 42, no. 2,
pp. 518–529, 2015.
[3] A. Kadam and P. Lenk, “Bayesian inference for issuer heterogeneity in credit
ratings migration,” J. Bank. Finance, vol. 32, no. 10, pp. 2267–2274, 2008.
[4] D. J. Poirier and others, “The growth of Bayesian methods in statistics and
economics since 1970,” Bayesian Anal., vol. 1, no. 4, pp. 969–979, 2006.
[5] L. Bauwens and M. Lubrano, “Bayesian Inference on GARCH Models Using the
Gibbs Sampler,” Econom. J., vol. 1, no. 1, pp. 23–46, Jun. 1998.
[6] A. J. McNeil and J. P. Wendin, “Bayesian inference for generalized linear mixed
models of portfolio credit risk,” J. Empir. Finance, vol. 14, no. 2, pp. 131–149,
2007.
[7] H. Li, M. T. Wells, and C. L. Yu, “A Bayesian Analysis of Return Dynamics with
Lévy Jumps,” Rev. Financ. Stud., vol. 21, no. 5, pp. 2345–2378, Sep. 2008.
[8] A. Gupta and C. Reisinger, “Robust calibration of financial models using
Bayesian estimators,” J. Comput. Finance, vol. 17, no. 4, p. 3, 2014.
[9] M. Mehrara and S. Rezaei, “The Determinants of Economic Growth in Iran Based
on Bayesian Model Averaging,” Int. Lett. Soc. Humanist. Sci., vol. 49, pp. 1–11,
Mar. 2015.
16
[10] H.-Z. Huang, M. J. Zuo, and Z.-Q. Sun, “Bayesian reliability analysis for fuzzy
lifetime data,” Fuzzy Sets Syst., vol. 157, no. 12, pp. 1674–1686, Jun. 2006.
[11] H.-C. Wu, “Fuzzy Bayesian estimation on lifetime data,” Comput. Stat., vol. 19,
no. 4, pp. 613–633, 2004.
[12] H.-C. Wu, “Fuzzy reliability estimation using Bayesian approach,” Comput. Ind.
Eng., vol. 46, no. 3, pp. 467–493, Jun. 2004.
[13] R. Gholizadeh, A. M. Shirazi, B. S. Gildeh, and E. Deiri, “Fuzzy Bayesian system
reliability assessment based on Pascal distribution,” Struct. Multidiscip. Optim.,
vol. 40, no. 1–6, pp. 467–475, 2010.
[14] H.-C. Wu, “Fuzzy Bayesian system reliability assessment based on exponential
distribution,” Appl. Math. Model., vol. 30, no. 6, pp. 509–530, Jun. 2006.
[15] A. Gelman, J. B. Carlin, H. S. Stern, and D. B. Rubin, Bayesian data analysis, vol.
2. Taylor & Francis, 2014.
[16] R. Scherer, Multiple Fuzzy Classification Systems, vol. 288. Berlin, Heidelberg:
Springer Berlin Heidelberg, 2012.
[17] H. T. Nguyen and B. Wu, “Random fuzzy sets,” in Fundamentals of Statistics
with Fuzzy Data, Springer, 2006, pp. 35–43.
[18] H. T. Nguyen, V. Kreinovich, B. Wu, and G. Xiang, “Computing statistics under
interval and fuzzy uncertainty,” Stud. Comput. Intell., vol. 393, 2012.
[19] R. Viertl, Statistical methods for fuzzy data. Chichester, West Sussex: Wiley,
2011.
[20] M. A. Bashar and S. Shirin, “Squares and square roots of continuous fuzzy
numbers,” Dhaka Univ J Sci, vol. 53, no. 2, pp. 131–140, 2005.

17

Tom Tat Luan An

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Tom Tat Luan An

Uploaded by

Copyright:

Available Formats

ĐẠI HỌC QUỐC GIA TP.

ỨNG DỤNG CỦA THỐNG KÊ BAYES

ỨNG DỤNG CỦA THỐNG KÊ BAYES

1. Tầm quan trọng của Thống kê Bayes ................................................................................................. 2

2. Ứng dụng của Thống kê Bayes trong Tài chính ............................................................................ 3

3. Thống kê Bayes với dữ liệu nhiễu ................................................................................................... 4

Phần 2: Tóm tắt nội dung luận án .............................................................................................................. 8

1. Thống kê Bayes của một số đặc trưng thống kê ................................................................................ 8

2.1 Một số vấn đề về lý thuyết tâp nhiễu ........................................................................................11

4. Ứng dụng trong phân tích tài chính .............................................................................................. 16

1. Tầm quan trọng của Thống kê Bayes

2. Ứng dụng của Thống kê Bayes trong Tài chính

3. Thống kê Bayes với dữ liệu nhiễu

 f  f    với f L   f  f R ,

trong đó f L , f R  lần lượt là giá trị cận dưới và cận trên của hàm f tại mức cắt

Theo quá trình ở trên, ta đã thu được hàm membership của hàm f x 1, x 2 ,...., x n dưới

Từ phân phối Gamma  1, 2  là phân phối tiên nghiệm của tỷ lệ  và kỳ vọng của

1. Thống kê Bayes của một số đặc trưng thống kê

l Y1, Y2 , , Yn |  l Y1|l Y2 |l Yn |

Ta xét trường hợp, phân phỗi của mỗi quan sát Y j | là phân phối chuẩn với trung bình

Y1    Y2    ...  Yn  

 n 2  2 Y1  Y2  ...  Yn   Y12  Y22  ...  Yn2 

 n   y   Y12  Y22  ...  Yn2   n y .

l Y1, Y2 , , Yn |  e 2 2 e e 2 2

Phân phối có điều kiện của lần thành công trong n phép thử khi đã biết tham số p là

a  b a1 b1

Phân phối hậu nghiệm có dạng phân phối beta a , b  beta a  y, b  n  y  .

Hàm hợp lý likelihood của một quan sát từ phân phối Poisson được xác định như

với y  0,1 ,  và   0 , nên hình dạng của hàm hợp lý likelihood là l |y    y e .

Trường hợp mẫu ngẫu nhiên độc lập có phân phối Poisson   làY1, ,

Nếu  là lớp các phân phối mẫu f  y| và  là lớp các phân phối tiên nghiệm thì lớp

Hàm hậu nghiệm có dạng

2. Thống kê Bayes một chiều với dữ liệu nhiễu

Định nghĩa tập nhiễu: Tập nhiễu A khác rỗng trong không gian X , ký hiệu là A  X , là

trong đó  A : X   0,1 là một hàm membership của tập nhiễu A.

Hàm membership xác định với mỗi phần tử x  X , số bậc thành viên của tập nhiễu A, biểu thị

Trường hợp 1:  A  x   1 nghĩa là tất cả các thành viên của phần tử x trong tập nhiễu A.

Trường hợp 3: 0   A  x   1 có nghĩa là một phần thành viên của phần tử x thuộc vào tập

trong đó x là điểm giữa và  định nghĩa là độ rộng của đường cong Gaussian.

Định nghĩa độ cao của tập nhiễu: Độ cao của tập nhiễu A , ký hiệu là h  A  được định nghĩa

Định nghĩa   cut :

 a  b   a  int b   a L  b L , aU  bU 

Hơn nữa, nếu các quan sát nhiễu x i có   cut là  x  , x   thì trung bình của các số

nhiễu cũng có   cut là

Hơn nữa, nếu các quan sát nhiễu x i có   cut là  x  , x   thì phương sai mẫu hiệu

chỉnh của các số nhiễu cũng có   cut là

4. Ứng dụng trong phân tích tài chính

You might also like