You are on page 1of 19

ĐẠI HỌC QUỐC GIA TP.

HCM 
TRƯỜNG ĐH KHOA HỌC TỰ NHIÊN
 
 
 
 
Họ và tên NCS: Lê Thanh Hoa 
 
 
 
 
 
TÓM TẮT LUẬN ÁN

ỨNG DỤNG CỦA THỐNG KÊ BAYES


TRONG PHÂN TÍCH TÀI CHÍNH
 
 
 
 
Ngành: Toán Ứng dụng 
Mã số ngành: 62460112 
Khóa học năm: 2015 
Người hướng dẫn khoa học:   1. TS. Phạm Hoàng Uyên 
          2. TS. Nguyễn Thanh Bình 
 
 
 
 
Tp. HCM, năm 2016 
ĐẠI HỌC QUỐC GIA TP.HCM 
TRƯỜNG ĐH KHOA HỌC TỰ NHIÊN
 
 
 
 
Họ và tên NCS: Lê Thanh Hoa 
 
 
 
TÓM TẮT LUẬN ÁN 

ỨNG DỤNG CỦA THỐNG KÊ BAYES


TRONG PHÂN TÍCH TÀI CHÍNH
 
 
 
 
 
 
 
   
Mục lục
Phần 1: Tiểu luận tổng quan ....................................................................................................................... 2

1. Tầm quan trọng của Thống kê Bayes ................................................................................................. 2

2. Ứng dụng của Thống kê Bayes trong Tài chính ............................................................................ 3

3. Thống kê Bayes với dữ liệu nhiễu ................................................................................................... 4

Phần 2: Tóm tắt nội dung luận án .............................................................................................................. 8

1. Thống kê Bayes của một số đặc trưng thống kê ................................................................................ 8

1.1 Thống kê Bayes cho ước lượng trung bình của phân phối chuẩn............................................8
1.2 Thống kê Bayes cho ước lượng tỷ lệ của tổng thể .....................................................................9
1.3 Thống kê Bayes cho ước lượng tham số của phân phối Poisson ............................................10
2. Thống kê Bayes một chiều với dữ liệu nhiễu ................................................................................... 11

2.1 Một số vấn đề về lý thuyết tâp nhiễu ........................................................................................11


2.2 Thống kê Bayes nhiễu cho ước lượng trung bình của phân phối chuẩn ...............................14
2.3 Thống kê Bayes cho ước lượng tỷ lệ thất bại của phân phối mũ với dữ liệu nhiễu ..............15
2.4 Thống kê Bayes nhiễu cho ước lượng xác suất sống sót của phân phối nhị thức .................15
3. Thống kê Bayes nhiều chiều với dữ liệu nhiễu ................................................................................ 16

4. Ứng dụng trong phân tích tài chính .............................................................................................. 16

 
 

 
 
Phần 1: Tiểu luận tổng quan

1. Tầm quan trọng của Thống kê Bayes


Trong các nghiên cứu chủ  yếu sử  dụng thống kê tần suất, trong đó các tham số  được 
giả  định như là các hằng số,  ví dụ  như  trung bình    của tổng thể  có phân phối chuẩn  
được  ước  lượng  bằng trung bình của mẫu ngẫu nhiên.  Tuy  nhiên, khi ước lượng như 
vậy dẫn đến sai lệch nhiều so với thực tế. Để hạn chế bớt sự sai lệch này, người ta giả 
định lại tham số    dưới dạng một phân phối. Phương pháp thống kê  mà coi các tham 
số  như là các biến ngẫu nhiên  đó chính là  thống kê Bayes.  Ưu điểm của thống kê 
Bayes  là kiến thức chuyên gia  được thể hiện trong thông tin tiên nghiệm và kết quả sẽ 
được kiểm nghiệm lại thông qua dữ liệu. Đối với bài toán ước lượng trung bình    của 
tổng thể  có phân phối chuẩn  ở  trên, trong thống kê Bayes người ta sẽ  lấy giá trị  ước 
lượng  là    trung  bình  của  phân  phối  hậu  nghiệm.  Trong  trường  hợp  không  có    bất  cứ  
thông tin gì thì chúng ta coi phân phối tiên nghiệm là phân phối đều. Khi đó ước lượng 
cho trung bình của tổng thể  có phân phối  chuẩn theo thống kê tần suất và thống kê 
Bayes trùng nhau. 
Trong [1], tác giả đã nêu lên hai tình huống liên quan đến xác suất hay gặp trong cuộc 
sống. Thứ nhất đó là khi chúng ta tung đồng xu  N  lần, khi  N  lớn và thấy có khoảng 
N
 lần xuất hiện mặt ngửa, thì chúng ta nói rằng xác suất xuất hiện mặt ngửa là 50% khi 
2
tung đồng xu. Sự giải thích về xác suất như vậy được gọi là Thống kê Tần suất. Mặt 
khác, chúng ta cũng không thể nghe thấy trong bản tin thời tiết buổi tối có phát biểu 
“Khả năng trời mưa vào ngày mai là 50%”. Phát biểu đó không thể xảy ra do thời tiết 
không phải là một thử nghiệm ngẫu nhiên, do đó không sử dụng tần suất để xác định xác 
suất. Hơn nữa, nó chuyển tải một phát biểu của thông tin, đó là cách Thống kê Bayes sử 
dụng xác suất.  
Tác giả cũng đã chỉ ra rằng Thống kê Bayes được phát triển mạnh mẽ trong những năm 
gần đây và có nhiều ứng dụng rộng rãi. Kiến thức về mô hình trước khi sử dụng dữ liệu 
trước về thống kê được gọi là thông tin tiên nghiệm. Thông tin tiên nghiệm này kết hợp 
với thông tin thu được từ dữ liệu để đưa ra một phân phối thống kê tinh chỉnh hơn, đó 
chính là phân phối hậu nghiệm.  
Hiệu quả của thống kê Bayes được Arima và các cộng sự chỉ ra rằng với mô phỏng dữ 
liệu thì dự báo theo Thống kê Bayes có trung bình bình phương sai số thực nghiệm nhỏ 
hơn so với Thống kê Tần suất. Cụ thể [2] đã đề cập đến phương pháp Bayes cho mô hình 
khu vực nhỏ (small area) khi thông tin hỗ trợ là độ đo sai số.  
Hơn nữa, Thống kê Bayes đã được ứng dụng rộng rãi trong phân tích Tài chính, đặc biệt 
là các trường hợp dữ liệu thưa, nếu sử dụng ước lượng theo Thống kê Tần suất sẽ dẫn 
2
đến sai số ước lượng lớn. Để khắc phục tình trạng này Kadam và Lenk [3] đã sử dụng 
kỹ thuật ước lượng Bayes – Markov chain Monte Carlo phân tích số liệu về tiềm lực tài 
chính tại thời điểm cuối năm 2005, theo dữ liệu lịch sử về tỷ lệ của 112 quốc gia và 14 
ngành công nghiệp.  

2. Ứng dụng của Thống kê Bayes trong Tài chính  


Trong [4], tác giả đã thống kê sự phát triển mạnh mẽ của phương pháp Bayes trong thống 
kê và ứng dụng trong kinh tế. 
Trong Tài chính, người ta thường sử dụng mô hình thống kê, một trong những mô hình 
hay được sử dụng nhiều nhất hiện nay là mô hình hồi quy GARCH. Bài báo [5] chỉ ra 
rằng suy luận Bayes có thể sử dụng được trong mô hình hồi quy GARCH. Dữ liệu bài 
báo sử dụng dữ liệu chỉ số chứng khoán của sàn Brussels. Các tham số cần ước lượng 
biểu diễn như một vector các tham số     w, ,  , v . Từ một mẫu gồm  T  quan sát, 
hàm mật độ hậu nghiệm xác định theo công thức 

  y       l  y                             (1) 
Có một khó khăn là việc áp dụng các dữ liệu trong Tài chính không tuân theo phân phối 
chuẩn, mà thường có dạng đuôi nặng, do đó nó thích hợp với phân phối Student cũng 
như các phân phối đuôi nặng khác. Vì vậy, tác giả đã sử dụng mô phỏng Gibbs sampler 
nhằm ước lượng các đặc trưng cho phân phối hậu nghiệm. Giả sử vector tham số    có 
hai  thành  phần  là  1   và   2 ,  với  hàm  mật  độ  của  phân  phối  hậu  nghiệm  lần  lượt  là 
 1 2 , y   và    2 1, y  .  Giá trị tiếp theo   n  của hàm mật độ hậu nghiệm biên là 
tổng hợp sử dụng giá trị trước đó   n1  theo chu trình sau 


1n ~  1 2n1 , y 
            (2) 
2n ~  2 
1n , y .

Một dạng mô hình khác cũng hay được sử dụng trong Tài chính đó là mô hình tuyến tính 
hỗn hợp tổng quát (GLMMs: generalized linear mixed models). Trong [6], tác giả nghiên 
cứu về rủi ro tín dụng như là biến phụ thuộc trên dữ liệu Standard & Poor’s Credit Pro 
với cơ sở dữ liệu 6.6 bao gồm 5676 người Mỹ từ tất cả 13 lĩnh vực công nghiệp, dạng 
chu kỳ 6 tháng, gồm 40 chu kỳ từ tháng 1 năm 1981 đến tháng 12 năm 2000 với lớp các 
mô hình tuyến tính hỗn hợp tổng quát (GLMMs: generalized linear mixed models). Với 
mô hình này, Thống Kê Bayes được sử dụng thông qua kỹ thuật mô phỏng Gibbs sampler 
nhằm ước lượng các tham số hồi quy, cho thấy hiệu quả tốt khi ước lượng. Ngoài ra, 
phương pháp Bayes mở ra khả năng sử dụng các nguồn thông tin khác (cũng như các 
mối tương quan) để đặt cho phân phối tiên nghiệm. Trong bài báo này, chủ yếu sử dụng 
3
trường hợp không có thông tin tiên nghiệm cho các hệ số hồi quy, hệ số chặn và các 
tham số của mô hình.  
Sử dụng Thống kê Bayes thông qua phương pháp Markov chain Monte Carlo Bayes, Li 
và các cộng sự qua bài báo [7] đã phát triển  cho suy luận đối với mô hình thời gian liên 
tục với biến động ngẫu nhiên và hoạt động vô hạn Lévy jumps. Các nghiên cứu thực 
nghiệm trên chỉ số chứng khoán S&P 500 thấy rằng đây là một mô hình rất cần thiết. Và 
bài  báo  [8]  cũng  tính  toán  các  tham  số  dựa  vào  Bayes,  cụ  thể  là  sử  dụng  thuật  toán 
Markov chain Monte Carlo Metropolis, của mô hình tài chính về giá thị trường, sử dụng 
66 giá quyền chọn Châu Âu và chỉ số S&P 500.  
Gần đây, các tác giả trong bài báo [9] chỉ ra chìa khóa để xác định các chỉ số phát triển 
kinh tế của Iran với dữ liệu theo năm từ 1974 đến 2010. Họ đã sử dụng mô hình BMA 
(Bayes Model Averaging). Kết quả chỉ ra rằng doanh thu từ dầu là biến quan trọng nhất 
ảnh hưởng đến phát triển của nền kinh tế Iran… 

3. Thống kê Bayes với dữ liệu nhiễu  


Các dữ liệu quan sát thường được giả định là các số thực chính xác. Tuy nhiên, trong 
thực tế dữ liệu thường dưới dạng không chính xác, biểu diễn theo dạng số nhiễu. Giải 
thích điều này, Huang và các cộng sự trong bài báo [10] đã chỉ ra lý do cần nghiên cứu 
các công thức liên quan đến dữ liệu nhiễu. Cần có một phương pháp ước lượng thống kê 
tổng quát, áp dụng cho không những số thực mà cả số nhiễu. Ngoài ra, phương pháp 
Bayes đã chỉ ra tính hữu dụng ngay cả khi cỡ mẫu nhỏ. Trong bài báo này, họ đã đề nghị 
một phương pháp mới xác định hàm membership cho ước lượng các tham số và hàm độ 
tin cậy các phân phối của nhiều tham số.  

Giả  sử  các  điểm  dữ  liệu  nhiễu  x1, x 2 ,...., x n có  các  hàm  membership  tương  ứng  là
x ., x .,...., x . , ước lượng điểm Bayes của các tham số và hàm độ tin cậy là các 
1 2 n

số nhiễu có tính nhiễu phụ thuộc vào tính nhiễu của  n  điểm quan sát. Hàm membership 
f x1 , x 2 ,..., x n   là khó xác định nên họ đã đề nghị một phương pháp xác định mới là 
unimodal cực đại. 
Bước 1. Giả sử    thay đổi từ 0 đến 1 với kích thước tăng thỏa mãn yêu cầu độ chính 
xác. 
Bước 2. Với mỗi giá trị cố định của    được chọn trong bước 1, tìm giá trị lớn nhất của 
hàm  f  x1, x2 ,...., xn   sao cho  x  , i  1,2,..., n.  Ký hiệu giá trị lớn nhất này là 
i

f R .   

4
Bước 3. Với mỗi giá trị cố định của    được chọn trong bước 1, tìm giá trị nhỏ nhất của 
hàm  f  x1, x2 ,...., xn   sao cho  x  , i  1,2,..., n.  Ký hiệu giá trị nhỏ nhất này là 
i

f L .   
Theo đòi hỏi của unimodal của hàm membership, ta có 

 f  f      với  f L   f  f R ,  

trong đó  f L , f R   lần lượt là giá trị cận dưới và cận trên của hàm  f  tại mức cắt 


  cut.   

Theo quá trình ở trên, ta đã thu được hàm membership của hàm  f x 1, x 2 ,...., x n  dưới 


 
dạng số. Phần minh họa cho phân tích độ tin cậy Bayes cho dữ liệu nhiễu, sử dụng cho 
hai trường hợp là phân phối chuẩn và phân phối Weibull.  
Đối với dữ liệu nhiễu, các tham số ước lượng và các phân phối xác suất cũng được biểu 
diễn dưới dạng nhiễu. Như Wu trong bài báo [11] đã chỉ ra cách suy luận tham số nhiễu 
với giả định như biến ngẫu nhiên nhiễu với phân phối tiên nghiệm nhiễu. Phương pháp 
ước lượng được sử dụng là ước lượng điểm Bayes nhiễu. 
Người ta giả định rằng có một bộ dữ liệu thực tế của  n  thành phần. Gọi  T1 , T2 ,..., Tn  độc 
lập và giống hệt nhau có phân phối mũ với tỷ lệ thất bại    chưa biết. 
Hàm hợp lý được xác định bởi 
n
L     n e  t j                   (3) 
j1

với    0, t j  0, j  1,2,..., n.   

Ước lượng điểm Bayes của tỷ lệ thất bại  , được giả định như là biến ngẫu nhiên  . 
Trong hầu hết các trường hợp sẽ sử dụng hàm phân phối tiên nghiệm cho    là phân phối 
Gamma  1, 2  , hàm mật độ có dạng 

2 1

f       1e                        (4) 
1 2

 1 

5
với   , 1 , 2  0 .  Dựa vào công thức (3) và (4) ta có phân phối hậu nghiệm của   là 
 n 
phân phối Gamma  1  n, 2   t j  . Ước lượng điểm Bayes cho tỷ lệ thất bại    là 
 j1 
trung bình của phân phối hậu nghiệm, được xác định như sau: 

 n  1
 n
                 (5) 
2   T j
j1

Từ phân phối Gamma   1, 2   là phân phối tiên nghiệm của tỷ lệ    và kỳ vọng của 


1
phân phối Gamma   1, 2   là , tức là 1  là số thất bại trên số các đơn vị thời gian  2 .  
2
Như vậy, số các trường hợp không thể ghi được chính xác số các thất bại của con người 
hoặc máy móc và thời gian không thể đo lường một cách chính xác trong một số tình 
huống bất ngờ. Trong trường hợp đó, ta chỉ có thể nói có khoảng  1  thất bại trong khoảng 
1
2  đơn vị thời gian. Cụm “khoảng ” có thể được mô tả như một số nhiễu, tức là tỷ lệ 
2
 . Theo đó, ước lượng điểm Bayes, tỷ lệ thất bại được 
thất bại    được xem như số nhiễu 
giả định như biến ngẫu nhiên     với hai số thực nhiễu đã biết là   1  và  2 . Do đó, dữ 
liệu  thực  tế  cho  thành  phần  thứ  j   được  xem  như  biến  ngẫu  nhiên  nhiễu T j ,  với 
j  1,2,..., n.  Ta vẫn giả định rằng  T 1,T 2 ,...,T n  là độc lập và có các phân phối giống 
hệt nhau. 

   và     lần lượt là 
Ước lượng điểm Bayes của  
L U

n  1  n  1 
L U

L 
 
, 

U
 

,    0,1.  
2    T j   2    T j 
L n L U n U

 j 1   j1 

Các công thức tương tự cũng được xây dựng cho phân phối Gamma nghịch đảo, phân 
phối Beta. 
Sự đa dạng của các tham số nhiễu, các dạng phân phối nhiễu được thể hiện thông qua 
các bài báo như [12] cũng chỉ ra ước lượng điểm Bayes với dữ liệu nhiễu cho phân phối 
Beta và phân phối Pascal, phân phối Pascal này một lần nữa lại được nghiên cứu trong 
bài báo [13], cũng như từ phân phối Gamma chuyển qua phân phối Log-Gamma âm. Bài 
báo [14] cũng chỉ ra ước lượng điểm Bayes với dữ liệu nhiễu cho phân phối mũ. Trong 
6
[13], tác giả đã chỉ ra các tham số nhiễu được giả định như biến ngẫu nhiên nhiễu với 
phân phối tiên nghiệm nhiễu. Phương pháp ước lượng Bayes sẽ chỉ ra ước lượng điểm 
Bayes nhiễu trên cơ sở các phân phối mũ. Minh họa bằng công thức phân phối beta. 
Trên cơ sở những phân tích như trên, chúng tôi thấy rằng việc áp dụng Thống kê Bayes 
đối với các loại dữ liệu, nhất là dữ liệu nhiễu sẽ rất cần thiết và mang tính ứng dụng cao 
trong thực tế, đặc biệt trong mảng Kinh tế và Tài chính. Vì vậy, chúng tôi chọn đề tài  
“Ứng dụng của Thống kê Bayes trong phân tích Tài chính”, với mục tiêu xây dựng 
một phương pháp tính toán mới sử dụng Thống kê Bayes trong phân tích Tài chính. 

7
Phần 2: Tóm tắt nội dung luận án

1. Thống kê Bayes của một số đặc trưng thống kê


1.1 Thống kê Bayes cho ước lượng trung bình của phân phối chuẩn
Với  mẫu  ngẫu  nhiên Y1 , Y2 , , Yn ,  ta  có  các  quan  sát  này  là  độc  lập  với  nhau,  nên 
likelihood đồng thời của mẫu được xây dựng như sau: 

  l Y1, Y2 , , Yn |  l Y1|l Y2 |l Yn |  

Ta xét trường hợp, phân phỗi của mỗi quan sát Y j |  là phân phối chuẩn với trung bình 


  và phương sai đã biết  2 . Khi đó theo công thức trên ta có 
1 1 1
Y1 Y2  Yn 
2 2 2
  
l Y1, Y2 , , Yn |  e 2 2 e 2 2  e 2 2  

tức là  
1 
Y1 Y2  Yn  
2 2 2

  l Y1, Y2 , , Yn |  e 2 2   

Biến đổi phần trong ngoặc ta có 

Y1    Y2    ...  Yn  


2 2 2

 n 2  2 Y1  Y2  ...  Yn   Y12  Y22  ...  Yn2 


     
 n 2  2n y  Y12  Y22  ...  Yn2 

 n   y   Y12  Y22  ...  Yn2   n y .


2 2

Thay vào biểu thức ta có 
n 1  2 n
  y 
2

2 2 
Y1 Y22 Yn2 ny 2    y 
2

  l Y1, Y2 , , Yn |  e 2 2 e e 2 2   

Dựa vào công thức ta thấy, likelihood của mẫu ngẫu nhiên có phân phối chuẩn, tỷ lệ 
với likelihood của trung bình mẫu, tức là có phân phối chuẩn với trung bình là    và 
2
phương sai .  
n
Giả sử ta có phân phối tiên nghiệm là phân phối chuẩn với trung bình m  và phương sai
1
m
2

s , tức là     e
2 2 s2 . 

8
Ta tính được phân phối hậu nghiệm là 
1 1  2 2 
2
 y  s  y  m2 
2 2
 
 1  2
 n 
m 2 s2 
2
2 
    Y1 , Y2 ,...,Yn   e n e 2 s2 e n .   

Biến đổi số mũ ta có 
  2 
2

  s y   m 
2

1   n 

 2 
  2   2   2  2 
2

  s y   m 
2

1  2     s   s  
n  n 
2
 2  s     n  
 2   
n  2   2
 2 2
2 s   s   s
n 
  Y1 , Y2 ,..., Yn   e n  e n  

2
m s2 y 
Do đó, phân phối hậu nghiệm là phân phối chuẩn với trung bình  m  n  và 
 2
s2 
n
 2
2
s
phương sai s  2
'2 n . 

s 2
n
Thống kê Bayes ước lượng trung bình    chính là trung bình của phân phối hậu nghiệm 
2 2
s y m 2
 s2
   B  E  Y1, Y2 ,..., Yn   n  y n m.   
 2
 2
2
s 
2
s 
2
s 
2
n n n
1.2 Thống kê Bayes cho ước lượng tỷ lệ của tổng thể
Chúng ta cần tính tổng số lần thành công trong  n  phép thử độc lập, trong đó mỗi tình 
huống chỉ có hai khả năng xảy ra hoặc là thành công, hoặc là thất bại. Trung bình tỷ lệ 
thành công trong phép thử thứ  i  là p , tỷ lệ trong tổng thể sẽ có đặc tính như vậy. 

Phân phối có điều kiện của lần thành công trong  n  phép thử khi đã biết tham số  p  là 


phân phối nhị thức B n, p . 

Khi đó ta có hàm hợp lý likelihood là  
n y
  l  y|p   Cny p y 1  p  ; y  1, 2,, n; 0  p  1.  

9
Giả sử phân phối tiên nghiệm cho  p  là phân phối  beta  a, b có hàm mật độ là 

a  b a1 b1


    p; a, b  p 1  p ; 0  p  1.  
a b

Phân phối hậu nghiệm là  
n y b1 bn y1
    p|y   l  y|p   p   p y 1  p  p a1 1  p   p a y1 1  p , 
0  p  1.  

Phân phối hậu nghiệm có dạng phân phối beta a , b  beta a  y, b  n  y  . 

Sử dụng ước lượng cho  p  là trung bình của phân phối hậu nghiệm 

p  m  a y a y
   . 
B
a  y  b  n  y n  a  b
1.3 Thống kê Bayes cho ước lượng tham số của phân phối Poisson

Hàm hợp lý likelihood của một quan sát từ phân phối  Poisson  được xác định như 


sau 

 y e
l  y|   , 
y!

với  y  0,1 ,   và   0 , nên hình dạng của hàm hợp lý likelihood là  l |y    y e .  

Trường hợp mẫu ngẫu nhiên độc lập có phân phối   Poisson    làY1,  , 


Y2,  Yn , chúng 
ta xây dựng hàm hợp lý likelihood có hình dạng: 
n
n n
Yi
l Y1,  Yn |   l Yi |    e    e n .  
Yi
, 
Y2 ,  i 1

i 1 i 1

Ta  nhận  thấy  hình  dạng  của  hàm  hợp  lý  likelihood  có  dạng  hàm  gamma r , 
v    với 
n
r   Yi  1, 
v   n . 
i 1

Hàm tiên nghiệm cho tham số λ của phân phối Poisson là  gamma r ,v   có dạng: 

10
v r r 1e v 
 ;r ,v   . 
 r 

Suy luận Bayesian cho tham số trong phân phối Poisson với hàm tiên nghiệm liên tục, 
họ liên hợp cho các quan sát này là họ gamma. Định nghĩa về các phân phối tiên nghiệm
liên hợp, xem trong [15]. 

Nếu    là lớp các phân phối mẫu  f  y|  và    là lớp các phân phối tiên nghiệm thì lớp 


  sẽ là liên hợp với    nếu  f |y    với mọi  f  y |     và  f    . 

Hàm hậu nghiệm có dạng 


n
r  Yi 1
n v 
 |Y1, 
Y2 ,  Yn   
,  i 1
e . 

tức là hàm phân phối hậu nghiệm có dạng 
 n 

gamma r , 
v    gamma r  Yi , n  v  .
 i 1 

Sử dụng ước lượng cho     là trung bình của phân phối hậu nghiệm 
n
r   Yi
i1
 . 
nv

2. Thống kê Bayes một chiều với dữ liệu nhiễu


2.1 Một số vấn đề về lý thuyết tâp nhiễu
a. Tập nhiễu, độ cao của tập nhiễu và   cut

Định nghĩa tập nhiễu: Tập nhiễu  A  khác rỗng trong không gian  X , ký hiệu là  A  X , là 


một tập gồm cặp 

A   x,  A  x   ; x  X ,  

trong đó   A : X   0,1  là một hàm membership của tập nhiễu  A.   

Hàm membership xác định với mỗi phần tử  x  X , số bậc thành viên của tập nhiễu  A,  biểu thị 


qua ba trường hợp như sau, xem [16] 

Trường hợp 1:   A  x   1  nghĩa là tất cả các thành viên của phần tử  x  trong tập nhiễu  A.   

11
Trường hợp 2:   A  x   0  nghĩa là không có bất cứ thành viên nào của phần tử  x  trong tập 
nhiễu  A.   

Trường hợp 3:  0   A  x   1  có nghĩa là một phần thành viên của phần tử  x  thuộc vào tập 


nhiễu  A.   
 Trong  bài  báo  này,  chúng  tôi  sử  dụng  hàm  membership  dạng  đặc  biệt  đó  là  hàm  Gaussian 
membership, công thức mô tả như sau 

  x  x 2 
 A  x   exp     ,  
    

trong đó  x  là điểm giữa và    định nghĩa là độ rộng của đường cong Gaussian.   

Định nghĩa độ cao của tập nhiễu: Độ cao của tập nhiễu  A , ký hiệu là  h  A   được định nghĩa 


là 

h  A   sup  A  x  .  
xX

Định nghĩa   cut :  


  cut  của tập nhiễu  A  X , biểu thị bởi  A  là một tập không nhiễu như sau 
A  x    x  X :  A    ,    0,1 ,  
hoặc tập được định nghĩa bởi hàm đặc trưng, xem [16]: 

1,  A  x    ;
 A  x     
 0,  A  x    .

b. Số nhiễu
Định nghĩa số nhiễu:
Một số nhiễu là một tập con nhiễu  A  của    sao cho, xem [17]: 

i. A  x   1  một số chính xác  x.   
ii.  
Hỗ trợ support  x : A  x   0  của  A  là bị chặn. 
iii. Tập    cut  của  A  là khoảng đóng. 
c. Tổng và tích các số nhiễu
Mệnh đề:

12
Giả sử hai số thực nhiễu là a và b . Khi đó a  b và a  b cũng là các số thực nhiễu. Hơn
nữa, khi biểu diễn dưới dạng   cut , xem [11] và [12], ta có:

 a  b   a  int b   a L  b L , aU  bU             


 a  b   a  int b 
        
 L L L U U L U U
  L L L U U L U U

  min a  b  , a  b  , a  b  , a  b  ,max a  b  , a  b  , a  b  , a  b   .

d. Trung bình và phương sai của các số nhiễu
 1 , x 2 ,..., x n .  
Giả sử mẫu ngẫu nhiên nhiễu gồm các quan sát  x

Trung bình của các số nhiễu, xem [18] và [19], được xác định như sau 

x   x i                
1 n
n i 1

Hơn nữa, nếu các quan sát nhiễu  x i  có    cut  là   x  , x    thì trung bình của các số 


i
L
i
U

nhiễu cũng có    cut  là 


 

 x L , x U    1 n x
  , 1n   x                 
L n U
     i i
   n i 1 i 1

Phương sai mẫu hiệu chỉnh của các số nhiễu, xem [20], được xác định như sau 
2
n

 x i  x
 
S  i 1
2
                    
n 1

Hơn nữa, nếu các quan sát nhiễu  x i  có    cut  là   x  , x    thì phương sai mẫu hiệu 


i
L
i
U

chỉnh của các số nhiễu cũng có    cut  là  

13
L U
  1  n  L 2 n 2

 2      L    U
 n   U


   
 S

, S
2


 
  n 1
 
min  


i 1 

x i  x 


 

 i 1  x i  x    x i  x
,     i 1 

,   x i  x  

,

 n  L 2 n L U U 2
 
max    x i  x  ,   x i  x   x i  x

1      n   
n 1 i 1 
   i 1 
  
    
,   x i  x
  i 1 
 

        
 
2.2 Thống kê Bayes nhiễu cho ước lượng trung bình của phân phối chuẩn
Giả sử rằng mẫu ngẫu nhiên như là các số mờ Y 1 , Y 2 ,..., Y n , trong đó mỗi quan sát độc lập cùng 
  và phương sai đã biết    được giả định là các số mờ. 
có phân phối chuẩn với kỳ vọng  
2

  và  
Ước lượng điểm Bayes của    được xác định lần lượt như sau: 
L U
 

1
2
L
 

 
sU
 mL

   
1  n 1 n 1 
2
 2 2
 2 
2   L
    sL    U    s  U

     
n
2


 U  L
 y ,
   
1  n 1  n 1 
2
 2 2
 2 
2   L
    sL    U    s  U

     
1
2

 

U   sL
 mU

   
1  n 1 n 1 
2
 2 2
 2 
2   L
    sL    U    s  U

     
n
 
L 2


   U
 y ,    0;1.
   
1  n 1  n 1 
2
 2 2
 2 
2   L
    sL    U    s  U

     
14
2.3 Thống kê Bayes cho ước lượng tỷ lệ thất bại của phân phối mũ với dữ liệu nhiễu
Dữ liệu ở thành phần thứ  j  như biến ngẫu nhiên mờ  T j  với  j  1,2,..., n.  Ta cũng giả định 
rằng  T 1 , T 2 ,..., T n  là các phân phối độc lập và giống hệt nhau.  

   và    , xem [11] và [19], được xác định lần lượt như sau: 
Ước lượng điểm Bayes của  
L U

n   1
L
L
  
  ;
1   n   U   n L
    T         T   
U L

2    2
 
 
j
 

2 j
 j 1 j 1 
 
n   1
U

  
U   ,    0;1
1   n   U   n L
    T         T   
U L

2   2
 
 
j
 

2 j
 j 1 j 1 
2.4 Thống kê Bayes nhiễu cho ước lượng xác suất sống sót của phân phối nhị thức
Giả sử xác suất sống sót như biến ngẫu nhiên mờ  
p  trong phân phối nhị thức  B n, p , với giả   
định   1   2  như là số của cỡ mẫu và   1  như là số sống sót. Phân phối tiên nghiệm là phân 
phối  Beta  với  hai  tham  số  mờ   1 , 2 .  Phân  phối  hậu  nghiệm  là  phân  phối  Beta
 
 x   1 , n   2  x . 
 
Ước lượng điểm Bayes của  
p  và  p , xem [12] và [19], xác định lần lượt là 
L U

 
 
x   1
L

L
p 
  ,  
1

2n   1    
U
  2
U

 n   1     
L
  2
L 
           

x   1
U  
U
p 
  ,    0;1.  
1

2 
n   1    
U
  2
U

 n   1     
L
  2
L 


15
3. Thống kê Bayes nhiều chiều với dữ liệu nhiễu

4. Ứng dụng trong phân tích tài chính  


việc ứng dụng Thống kê Bayes để phân tích Tài chính là rất cần thiết, kết quả được chúng 
tôi  trình  bày  trong  bài  báo  Phạm  Hoàng  Uyên,  Nguyễn  Đình  Thiên,  Lê  Thanh  Hoa, 
“Thống kê Bayes trong dự báo giá chứng khoán Việt Nam”, Hội nghị Toàn quốc lần thứ
IV về Ứng dụng Toán học,  23-25/12/2015.  Trong  bài  báo  này,  chúng  tôi  đã  sử  dụng 
Thống kê Bayes của tất cả các mã cổ phiếu trên cả hai sàn giao dịch của Việt Nam là 
HNX và HoSE, từ thời điểm bắt đầu lên sàn đến ngày 16/11/2015. Đánh giá hiệu quả 
của dự báo cùng xu hướng với giá thực tế, tức là dự báo giá tăng thì giá thực sự tăng và 
dự báo giá giảm thì giá thực sự giảm. Kết quả phân tích chỉ dựa vào giá đóng cửa thì 
thấy rằng khả năng dự báo đúng 70% trở lên có 661/684 mã cổ phiếu. Trong trường hợp 
giá cả tăng giảm nhanh, thì hầu như là dự báo đúng xu thế.  
 
Tài liệu tham khảo
 
[1]  J. A. Scales and R. Snieder, “To Bayes or not to Bayes?,” Geophysics, vol. 62, no. 
4, pp. 1045–1046, 1997. 
[2]  S. Arima, G. S. Datta, and B. Liseo, “Bayesian estimators for small area models 
when auxiliary information is measured with error,” Scand. J. Stat., vol. 42, no. 2, 
pp. 518–529, 2015. 
[3]  A. Kadam and P. Lenk, “Bayesian inference for issuer heterogeneity in credit 
ratings migration,” J. Bank. Finance, vol. 32, no. 10, pp. 2267–2274, 2008. 
[4]  D. J. Poirier and others, “The growth of Bayesian methods in statistics and 
economics since 1970,” Bayesian Anal., vol. 1, no. 4, pp. 969–979, 2006. 
[5]  L. Bauwens and M. Lubrano, “Bayesian Inference on GARCH Models Using the 
Gibbs Sampler,” Econom. J., vol. 1, no. 1, pp. 23–46, Jun. 1998. 
[6]  A. J. McNeil and J. P. Wendin, “Bayesian inference for generalized linear mixed 
models of portfolio credit risk,” J. Empir. Finance, vol. 14, no. 2, pp. 131–149, 
2007. 
[7]  H. Li, M. T. Wells, and C. L. Yu, “A Bayesian Analysis of Return Dynamics with 
Lévy Jumps,” Rev. Financ. Stud., vol. 21, no. 5, pp. 2345–2378, Sep. 2008. 
[8]  A. Gupta and C. Reisinger, “Robust calibration of financial models using 
Bayesian estimators,” J. Comput. Finance, vol. 17, no. 4, p. 3, 2014. 
[9]  M. Mehrara and S. Rezaei, “The Determinants of Economic Growth in Iran Based 
on Bayesian Model Averaging,” Int. Lett. Soc. Humanist. Sci., vol. 49, pp. 1–11, 
Mar. 2015. 

16
[10] H.-Z. Huang, M. J. Zuo, and Z.-Q. Sun, “Bayesian reliability analysis for fuzzy 
lifetime data,” Fuzzy Sets Syst., vol. 157, no. 12, pp. 1674–1686, Jun. 2006. 
[11] H.-C. Wu, “Fuzzy Bayesian estimation on lifetime data,” Comput. Stat., vol. 19, 
no. 4, pp. 613–633, 2004. 
[12] H.-C. Wu, “Fuzzy reliability estimation using Bayesian approach,” Comput. Ind.
Eng., vol. 46, no. 3, pp. 467–493, Jun. 2004. 
[13] R. Gholizadeh, A. M. Shirazi, B. S. Gildeh, and E. Deiri, “Fuzzy Bayesian system 
reliability assessment based on Pascal distribution,” Struct. Multidiscip. Optim., 
vol. 40, no. 1–6, pp. 467–475, 2010. 
[14] H.-C. Wu, “Fuzzy Bayesian system reliability assessment based on exponential 
distribution,” Appl. Math. Model., vol. 30, no. 6, pp. 509–530, Jun. 2006. 
[15] A. Gelman, J. B. Carlin, H. S. Stern, and D. B. Rubin, Bayesian data analysis, vol. 
2. Taylor & Francis, 2014. 
[16] R. Scherer, Multiple Fuzzy Classification Systems, vol. 288. Berlin, Heidelberg: 
Springer Berlin Heidelberg, 2012. 
[17] H. T. Nguyen and B. Wu, “Random fuzzy sets,” in Fundamentals of Statistics
with Fuzzy Data, Springer, 2006, pp. 35–43. 
[18] H. T. Nguyen, V. Kreinovich, B. Wu, and G. Xiang, “Computing statistics under 
interval and fuzzy uncertainty,” Stud. Comput. Intell., vol. 393, 2012. 
[19] R. Viertl, Statistical methods for fuzzy data. Chichester, West Sussex: Wiley, 
2011. 
[20] M. A. Bashar and S. Shirin, “Squares and square roots of continuous fuzzy 
numbers,” Dhaka Univ J Sci, vol. 53, no. 2, pp. 131–140, 2005. 
 

17

You might also like