Professional Documents
Culture Documents
THUATGIAIDITRUYEN
THUATGIAIDITRUYEN
Thuật giải di truyền cung cấp một cách tiếp cận cho việc học dựa vào mô phỏng sự
tiến hóa. Các giả thuyết thường được mô tả bằng các chuỗi bit, việc hiểu các chuỗi bit
này tùy thuộc vào ứng dụng, ý tưởng các giả thuyết cũng có thể được mô tả bằng các
biểu thức kí hiệu hoặc ngay cả các chương trình máy tính. Tìm kiếm giả thuyết thích hợp
bắt đầu với một quần thể, hay một tập hợp có chọn lọc ban đầu của các giả thuyết. Các cá
thể của quần thể hiện tại khởi nguồn cho quần thể thế hệ kế tiếp bằng các hoạt động lai
ghép và đột biến ngẫu nhiên – được lấy mẫu sau các quá trình tiến hóa sinh học. Ở mỗi
bước, các giả thuyết trong quần thể hiện tại được ước lượng liên hệ với đại lượng thích
nghi được cho, với các giả thuyết phù hợp nhất được chọn theo xác suất là các hạt giống
cho việc sản sinh thế hệ kế tiếp. Thuật giải di truyền đã được ứng dụng một cách thành
công cho những tác vụ học khác nhau và cho các vấn đề tối ưu hóa khác. Ví dụ, chúng đã
được dùng để học tập luật điều khiển robot và để tối ưu hóa các thông số học và tôpô cho
mạng nơron nhân tạo.
Động lực
Thuật giải di truyền cung cấp một phương pháp học được thúc đẩy bởi sự tương tự
với sự tiến hóa sinh học. Thay vì tìm kiếm các giả thuyết từ tổng quát đến cụ thể hoặc từ
đơn giản đến phức tạp, GAs tạo ra các giả thuyết kế tiếp bằng cách lặp việc đột biến và
việc tái hợp các phần của giả thuyết được biết hiện tại là tốt nhất Ở mỗi bước, một tập
các giả thuyết được gọi là quần thể hiện tại được cập nhật bằng cách thay thế vài phần
nhỏ quần thể bởi cá thể con của các giả thuyết tốt nhất ở thời điểm hiện tại. Sự phổ biến
của GAs được thúc đẩy bởi các yếu tố sau:
Tiến hóa là một phương pháp mạnh, thành công cho sự thích nghi bên trong các
hệ thống sinh học.
GA có thể tìm kiếm trên các không gian giả thuyết có các phần tương tác phức
tạp, ở đó ảnh hưởng của mỗi phần lên toàn thể độ thích nghi giả thuyết khó có thể
mô hình.
Thuật giải GA có thể được thực hiện song song và có thể tận dụng thành tựu của
phần cứng máy tính mạnh.
• Khởi tạo quần thể: P ß Tạo ngẫu nhiên p cá thể giả thuyết
• Ước lượng: Ứng với mỗi h trong P, tính Fitness(h)
• while [max Fitness(h)] < Fitness_threshold do
Tạo thế hệ mới, PS
1. Chọn cá thể: chọn theo xác suất (1 – r)p cá thể trong quần thể P thêm
vào PS. Xác suất Pr(hi) của giả thuyết hi thuộc P được tính bởi công thức:
Fitness (hi )
Pr( hi ) =
∑
p
j =1
Fitness (h j )
r× p
2. Lai ghép: chọn lọc theo xác suất cặp giả thuyết từ quần thể P, theo
2
Pr(hi) đã tính ở bước trên. Ứng với mỗi cặp <h1, h2>, tạo ra hai con bằng
cách áp dụng toán tử lai ghép. Thêm tất các các con vào PS.
3. Đột biến: Chọn m% cá thể của PS với xác suất cho mỗi cá thể là như nhau.
Ứng với mỗi cá thể biến đổi một bit được chọn ngẫu nhiên trong cách thể
hiện của nó.
4. Cãp nhật: P ß PS.
5. Ước lượng: Ứng với mỗi h trong P, tính Fitness(h)
• Trả về giả thuyết trong P có độ thích nghi cao nhất.
}
Bảng 2.1. Thuật giải di truyền mẫu
Quần thể gồm p cá thể. Ở mỗi lần lặp, quần thể kế tiếp PS được hình thành từ việc
lựa chọn theo xác suất các giả thuyết hiện tại theo độ thích nghi của chúng và bằng cách
thêm vào các giả thuyết mới. Các giả thuyết mới được tạo ra bằng cách áp dụng toán tử
lai ghép cho cặp giả thuyết thích nghi nhất và bằng cách tạo ra các đột biến điểm đơn
trong thế hệ giả thuyết kết quả. Quá trình này được lặp cho đến khi các giả thuyết thích
hợp được phát hiện. Các toán tử lai ghép và đột biến tiêu biểu được định nghĩa trong
bảng kế tiếp.
Một thuật giải di truyền mẫu được mô tả trong bảng 2.1. Các đầu vào cho thuật giải
này bao gồm hàm tính độ thích nghi để tính hạng cho các giả thuyết ứng cử, một giá trị
ngưỡng được định nghĩa cấp độ thích nghi có thể chấp nhận để kết thúc thuật giải, kích
thước quần thể, và các tham số quyết định các quần thể kế tiếp được tạo ra như thế nào:
phần quần thể bị thay thế ở mỗi thế hệ và tỉ lệ đột biến.
Lưu ý trong thuật giải này, ở mỗi bước lặp qua vòng lặp chính tạo ra một thế hệ mới
các giả thuyết dựa vào quần thế hệ hiện tại. Trước tiên, một số giả thuyết được chọn từ
quần thể hiện tại để đưa vào thế hệ kế tiếp. Những giả thuyết này được chọn theo xác
suất, ở đây xác suất của giả thuyết được tính bởi:
Fitness (hi )
Pr( hi ) = (2.1)
∑
p
j =1
Fitness (h j )
Vì vậy, xác suất để giả thuyết được chọn tỉ lệ với độ thích nghi của nó và tỉ lệ
nghịch với độ thích nghi của các giả thuyết cạnh tranh khác trong quần thể hiện tại.
Một khi các cá thể này của thế hệ hiện tại đã được chọn để đưa vào quần thể thế hệ
kế tiếp, các cá thể thêm vào được tạo ra dùng toán tử lai ghép. Lai ghép, được định nghĩa
chi tiết trong phần kế tiếp, lấy hai giả thuyết từ thế hệ hiện tại và tạo ra hai giả thuyết con
bằng cách kết hợp các phần của hai giả thuyết cha. Các giả thuyết cha được chọn theo
xác suất từ quần thể hiện tại, sử dụng hàm xác suất được cho bởi phương trình (2.1). Sau
khi các cá thể mới được tạo ra từ hoạt động lai ghép này, quần thế thế hệ mới bây giờ có
đủ số lượng thành viên mong muốn. Lúc này, một phân số m nào đó các cá thể này được
chọn một cách ngẫu nhiên, và tất cả các đột biến ngẫu nhiên được thực hiện để thay đổi
các cá thể này.