You are on page 1of 31

TRÍ TUỆ NHÂN TẠO TRONG

GIAO DỊCH

CHƯƠNG 1 – KIỂM TRA LẠI

TS. – TRUNG TÂM 16/02/2023 1


NỘI DUNG
CH 2.1 Tại sao phải kiểm tra lại
Ư
Ơ
N 2.2 Kiểm tra lại các thành kiến
G
2
2.3 Vấn đề kiểm tra lại

2.4 Chi phí kiểm tra lại

TS. – TRUNG TÂM 16/02/2023 2


2.1 Tại sao phải kiểm tra lại?

Cung cấp kỳ vọng về hiệu suất trong tương lai từ hiệu suất trong
quá khứ
Mỗi giao dịch (ở đây có nghĩa là 'chuyến đi khứ hồi' của hai tín
hiệu) sẽ có

TS. – TRUNG TÂM 16/02/2023 3


2.1 Tại sao phải kiểm tra lại?

Lọc : giai đoạn nghiên cứu ban đầu là thiết lập một hệ thống chiến lược và
sau đó lọc ra bất kỳ chiến lược nào không đáp ứng các tiêu chí nhất định →

Mô hình : thử nghiệm các mô hình mới về một số hiện tượng thị trường nhất
định, chẳng hạn như chi phí giao dịch, định tuyến đơn hàng, độ trễ, tính thanh
khoản hoặc các vấn đề cấu trúc vi mô thị trường khác
TS. – TRUNG TÂM 16/02/2023 4
2.1 Tại sao phải kiểm tra lại?

Tối ưu hóa : tăng hiệu suất của chiến lược bằng cách sửa đổi số lượng tham
số và tính toán lại hiệu suất của chiến lược đó.

Xác minh : các chiến lược thường có nguồn gốc từ bên ngoài → kiểm tra
ngược đảm bảo các chiến lược được triển khai chính xác

TS. – TRUNG TÂM 16/02/2023 5


2.1 Tại sao phải kiểm tra lại?
Cạm bẫy thường gặp :
Thông thường , backtest sẽ tạo ra hiệu suất lịch sử tốt hơn những gì
chúng ta có thể đạt được trong giao dịch thực tế.

TS. – TRUNG TÂM 16/02/2023 6


2.2 Kiểm tra lại các thành kiến

Xu hướng tối ưu hóa (nguy hiểm nhất trong tất cả các thành kiến
backtest):
Tuy nhiên, điều chỉnh các tham số giao dịch dựa trên nhiễu nhất
thời cho đến khi hiệu suất chiến lược trên bộ dữ liệu backtest rất
hấp dẫn,
TS. – TRUNG TÂM 16/02/2023 7
2.2 Kiểm tra lại các thành kiến
Xu hướng tối ưu hóa
+ khó loại bỏ vì chiến lược thuật toán thường liên quan đến nhiều
tham số
+ Có thể giảm thiểu nó bằng cách giữ các tham số ở mức tối thiểu
và tăng số lượng điểm dữ liệu trong tập huấn luyện.

TS. – TRUNG TÂM 16/02/2023 8


2.2 Kiểm tra lại các thành kiến
Xu hướng tối ưu hóa (Khắc phục vấn đề)
lấy dữ liệu trong khoảng thời gian ngắn (để tránh nhiều tham số
đầu vào; thay đổi chế độ) → Bạn càng có ít dữ liệu độc lập,

TS. – TRUNG TÂM 16/02/2023 9


2.2 Kiểm tra lại các thành kiến
Xu hướng tối ưu hóa (Khắc phục vấn đề)
Cỡ mẫu: quy tắc ngón tay cái (số tham số * 252)
Kiểm tra ngoài mẫu: Chia dữ liệu lịch sử thành hai phần → một phần để huấn
luyện (ít nhất 70% tổng số quan sát và tuân theo quy tắc ngón tay cái) & một
phần để kiểm tra (dữ liệu gần đây hơn) → xây dựng mô hình dựa trên phần
đào tạo và xác thực mô hình dựa trên phần kiểm tra với hiệu suất hợp lý.
TS. – TRUNG TÂM 16/02/2023 10
2.2 Kiểm tra lại các thành kiến

Xu hướng tối ưu hóa (Khắc phục vấn đề)


Tiến hành phân tích độ nhạy:
Thay đổi các thông số tăng dần và vẽ một "bề mặt" hiệu suất → bề mặt
nhẵn có nghĩa là các thông số tốt
→ bề mặt hiệu suất rất không ổn định bề mặt nhẵn có nghĩa là các
thông số tốt→ bề mặt hiệu suất rất không ổn định , có nghĩa là
TS. – TRUNG TÂM 16/02/2023 11
2.2 Kiểm tra lại các thành kiến
Xu hướng tối ưu hóa (Khắc phục vấn đề)
Tiến hành phân tích độ nhạy. Làm sao?
thực hiện một số thay đổi nhỏ về chất trong các tính năng của mô
hình và xem hiệu suất thay đổi như thế nào trên cả tập huấn luyện
và tập kiểm tra → Nếu hiệu suất giảm quá mạnh

TS. – TRUNG TÂM 16/02/2023 12


2.2 Kiểm tra lại các thành kiến
Xu hướng nhìn về phía trước
Dữ liệu trong tương lai vô tình được đưa vào tại một thời điểm
trong mô phỏng mà dữ liệu đó thực sự không có sẵn.
tức là: kiểm tra ngược tại thời điểm đạt N, sau đó xảy ra sai lệch
nhìn về phía trước nếu dữ liệu được đưa vào cho bất kỳ điểm N +
k nào, trong đó k > 0.
TS. – TRUNG TÂM 16/02/2023 13
2.2 Kiểm tra lại các thành kiến
Xu hướng nhìn về phía trước
Ví dụ: nếu quy tắc nhập giao dịch của bạn có nội dung: “Mua khi
cổ phiếu nằm trong khoảng 5% mức giá thấp trong ngày”
→ bạn không thể biết được mức giá thấp trong ngày là bao nhiêu

TS. – TRUNG TÂM 16/02/2023 14


2.2 Kiểm tra lại các thành kiến
Lý do thiên vị nhìn về phía trước
+ Lỗi kỹ thuật: vòng lặp không chính xác, bao gồm N+k trong bài
kiểm tra
+ Dữ liệu tương lai: Nếu sử dụng toàn bộ tập dữ liệu (bao gồm cả
dữ liệu tương lai) để tính hệ số hồi quy thì dữ liệu tương lai đang
được hợp nhất và tồn tại sai lệch nhìn về phía trước.
TS. – TRUNG TÂM 16/02/2023 15
2.2 Kiểm tra lại các thành kiến
Xu hướng nhìn về phía trước đã vượt qua
+ Dữ liệu lịch sử bị trễ: như đường trung bình động (chỉ kỳ giao
dịch trước đó)
+ Nếu không, hãy đảm bảo các chuỗi phim đều đứng yên để loại
bỏ tiếng ồn (mùa, xu hướng…)
TS. – TRUNG TÂM 16/02/2023 16
2.2 Kiểm tra lại các thành kiến
Thiên vị sống sót
Các chiến lược được thử nghiệm trên các tập dữ liệu không bao gồm
toàn bộ vũ trụ mà chỉ xem xét những tập dữ liệu đã "sống sót" đến
thời điểm hiện tại .
Ví dụ: chọn dữ liệu mẫu chỉ bao gồm các cổ phiếu “sống sót” sau
khủng hoảng tài chính. Nó không kể toàn bộ câu chuyện lịch sử (một
TS. – TRUNG TÂM 16/02/2023 17
2.2 Kiểm tra lại các thành kiến
Thiên vị sống sót

Lãi&Lỗ = - Lợi nhuận thực Lãi&Lỗ = Sự trở lại hư


tế cấu
42%TS. – TRUNG TÂM
388% 16/02/2023 18
2.2 Kiểm tra lại các thành kiến
Thiên vị sống sót
Khắc phục sự cố
1. bao gồm các đơn vị bị hủy niêm yết (các công ty bị phá sản) → chi
phí
2. Thu thập dữ liệu để sử dụng theo cách thủ công tại thời điểm hiện
tại
TS. – TRUNG TÂM 16/02/2023 19
2.2 Kiểm tra lại các thành kiến
Xu hướng nhận thức
Con người không giữ kỷ luật do quyết định nhận thức.
Ví dụ: chiến lược có thể có mức rút vốn tối đa là 25% và thời gian rút
vốn tối đa là 4 tháng. Tuy nhiên, bạn có thể không khó chịu vì thấy
tiền của mình bị mất → ngừng giao dịch → cuối cùng thua lỗ đáng kể
→ nên tuân theo chiến lược
TS. – TRUNG TÂM 16/02/2023 20
2.3 Vấn đề kiểm tra lại
Vấn đề trao đổi
a. Lệnh thị trường và lệnh giới hạn
Lệnh thị trường: thực hiện giao dịch ngay lập tức mà không cần cân
nhắc về giá

Lệnh giới hạn: xác định mức giá mà giao dịch sẽ được thực hiện.
TS. – TRUNG TÂM 16/02/2023 21
2.3 Vấn đề kiểm tra lại
Vấn đề trao đổi
a. Lệnh thị trường và lệnh giới hạn
Thảo luận: Giá Cao/Thấp và Giá Đóng?

Thảo luận 2: OHLC vs Nến

TS. – TRUNG TÂM 16/02/2023 22


2.3 Vấn đề kiểm tra lại
Vấn đề trao đổi
b. Ràng buộc rút ngắn
Bán khống là gì?
Lưu ý: một số cổ phiếu có thể không có sẵn (do không có sẵn cổ phiếu
đó để vay) hoặc do hạn chế của thị trường
→ hãy cẩn thận với những hạn chế về thanh khoản
TS. – TRUNG TÂM 16/02/2023 23
2.3 Vấn đề kiểm tra lại
Dữ liệu giao dịch
Hãy thử: “dữ liệu tương lai lịch sử miễn phí trong ngày”
Đánh đổi giữa chi phí và chất lượng

TS. – TRUNG TÂM 16/02/2023 24


2.3 Vấn đề kiểm tra lại

Dữ liệu giao dịch

TS. – TRUNG TÂM 16/02/2023 25


2.3 Vấn đề kiểm tra lại
Dữ liệu giao dịch (hãy cẩn thận)
+ Việc chia tách dữ liệu và cổ tức có được điều chỉnh không?
Một số cổ phiếu bị chia tách/điều chỉnh cổ tức → điều chỉnh giá
a) Đối với Data Split: tất cả giá trước T cần được nhân với 1/ N .
b) Đối với cổ tức: tất cả các giá trước T cần được nhân với
(Đóng(T – 1) – d) / Close(T –1), trong đó Close(T – 1) là giá đóng cửa của
ngày giao dịch trước ngày T.
TS. – TRUNG TÂM 16/02/2023 26
2.3 Vấn đề kiểm tra lại
Dữ liệu giao dịch (hãy cẩn thận)
+ Việc chia tách dữ liệu và cổ tức có được điều chỉnh không?
Ví dụ:

TS. – TRUNG TÂM 16/02/2023 27


2.3 Vấn đề kiểm tra lại
Dữ liệu giao dịch (hãy cẩn thận)
+ Xu hướng sống sót dữ liệu có miễn phí không?
Kiểm tra nó ở phần trước

+ Chiến lược của bạn có sử dụng dữ liệu cao và thấp


Hãy kiểm tra nó ở phần trước

TS. – TRUNG TÂM 16/02/2023 28


2.4 Chi phí giao dịch
a. Hoa hồng và phí
Để trao đổi (trực tiếp hoặc môi giới); thanh toán và giải quyết các giao
dịch; thuế…

TS. – TRUNG TÂM 16/02/2023 29


2.4 Chi phí giao dịch
b. Trượt giá
chênh lệch giá giữa thời điểm hệ thống giao dịch giao dịch và thời
điểm giao dịch thực sự được thực hiện. (độ trễ)

TS. – TRUNG TÂM 16/02/2023 30


2.5 Tóm tắt

Có thể phân biệt Backtesting mô phỏng và thực tế (do trang bị quá


mức, làm sạch dữ liệu kém, chi phí giao dịch đầu vào không chính
xác, thay đổi cơ chế thị trường…)

TS. – TRUNG TÂM 16/02/2023 31

You might also like