Giải thuật kiến và áp dụng trong việc xác định ma trận trọng số của mạng Neuron

On the Ant Colony Optimization for Training Neural Network
Nguyễn Xuân Tùng

Abstract: The paper presents Ant Colony System (ACS)an Algorithm introduced by Dorigo M.et al(1991).An ACS variant called ACOg,b, τmin is analyzed and show that in some conditions,it converges to global optimum in probability ->1.In part 3 we introduce ACS-framwork for finding weight matric of Neural Networks.

Năm 2002 M.Dorigo và T.Stüzle đã chứng minh được tính hội tụ của hai biến thể quan trọng nhất của Aco – đó là Max – Min Ant System và ASC [12]. Điều này đã khiến cho Aco có một cơ sở lý thuyết vững vàng và mở ra một loạt các nghiên cứu đầy hứa hẹn về các tham số điều khiển trong Aco. Sau đây chúng ta sẽ xem xét phát biểu hình thức của bài toán, giải thuật và tính hội tụ của giải thuật. − Cho 1 bộ (S, f, Ω) trong đó − S: tập hợp các lời giải - ứng cử viên − f: Hàm đánh giá f: S->R − Ω: các điều kiện ràng buộc − Cần tìm lời giải tối ưu S* thoả f(S*) min − Trong Aco bài toán tối ưu tổ hợp (S, f, Ω) được giải quyết qua sơ đồ gồm các thành phần sau: Tập hữu hạn C = {C1, C2 ... CNc}các đỉnh cần duyệt trong quá trình tìm kiếm. Tập hữu hạn X các trạng thái kết quả có thể tìm được của bài toán trong quá trình tìm kiếm x ∈ X = <Ci, Cj, ..., Ck ...> Tập S các lời giải - ứng cử viên là bộ phận của X (S ⊆ X) Tập S* ⊆

I. GIỚI THIỆU ACS VÀ PHÁT BIỂU HÌNH THỨC BÀI TOÁN TỐI ƯU TỔ HỢP Trong vòng 10 năm gần đây, có nhiều bài toán tối ưu tổ hợp được giải quyết bằng họ các thuật toán kiến (Ant Algorithm). Thuật toán kiến mô phỏng hành vi của đàn kiến trong tự nhiên nhằm tìm kiếm đường đi ngắn nhất giữa tổ kiến và nguồn thức ăn dựa trên mật độ mùi(Pheromone) mà các con kiến để lại trên đường đi(xem[1],[2],[3]). Hiệu quả của thuật toán kiến đã được thể hiện khi so sánh với các thuật toán nổi tiếng khác như GA, Simulated Annealing, Tabu-Search. Người ta áp dụng rất thành công các thuật toán kiến trong các bài toán tối ưu như Bài toán người đưa thư,bài toán gán,bài toán tô mầu đồ thị,bài toán lập lịch... Tuy nhiên về mặt lý thuyết, có rất ít các công trình nghiên cứu nhằm đưa ra các đánh giá về hiệu quả của thuật toán. Tình hình này đã được thay đổi khi lần đầu tiên năm 2000 Gutjahz chứng minh được tính hội tụ của một phương án Aco – Graph-Based Ant System (GBAS). W.J Gutjahz chứng minh rằng trong một số điều kiện nhất định GBAS hội tụ đến lời giải tối ưu với xác suất tiệm cận đến 1 với độ chính xác tuỳ ý(xem [7], [8]). Tuy nhiên GBAS chưa có một áp dụng cụ thể nào trên thực tế nên các kết quả này thuần tuý chỉ có ý nghĩa lý thuyết.

% X ⊆ X các trạng thái thoả mãn Ω

S* ≠ ∅: tập các lời giải tối ưu

% X

và S* ⊆ S

Dựa vào các thành phần kể trên, các tác tử - kiến (agents) sẽ xây dựng các lời giải bằng cách thực hiện các di chuyển qua các đỉnh của đồ thị G = (C, L, T) trong đó các đỉnh được gắn các giá trị thuộc C, L là

j) sau bước bất kỳ là g(s*). II. Việc chọn đỉnh trong quá trình di chuyển của kiến phụ thuộc nồng độ Pheromone trên các cung. j): τ(i.ρ)2. j: lim τ (t ) ≤ τ ⋅ g ( s* ) ij max = t →∞ % Trong đó tham số α thoả 0 < α < +∝ và xk+1 ∈ X .τ0 + g(s*). số Pheromone trên một cung luôn nhỏ hơn (1 . T là tập các pheromone trên L. CÁC ĐỊNH LÝ HỘI TỤ CỦA ACOGB τMIN Trong [12] T. j) := τ(i. ρmin kiểm soát mức Pheromone nhỏ nhất trên mỗi Bổ đề 2: Nếu lời giải tối ưu s được tìm ra thì: ∀ (i. τmin ≤ τ0 < +∞ Giải thuật này với việc cập nhật pheromone theo lời giải tối ưu toàn cục tìm được và mức Pheromone trên mỗi cung được duy trì luôn lớn hơn τmin được ký hiệu là ACOgb. và trong bước t ta tìm được lời giải tốt nhất st. Stützle và M.. thủ tục cập nhật ρ Chứng minh: Số lượng Pheromone được tăng trên mỗi cung (i.ρ). j) ∈ S*: t →∞ * limτ ij (t)=τ max = * 1 ρ ⋅ g ( s* ) .ρ). xk) ⎧τ (ck . f (s) < f(s’) ⇒ g(s) ≥ g(s’) – g là hàm nghịch biến với f. mỗi một agents được phân bố ngẫu nhiên trên các đỉnh của G.ứng cử viên được mô tả như sau: ANT_ SOLUTION _CONSTRUCTION cung 0 < g(s) < ∞ là hàm S → R+.τ 0 + ∑ (1-ρ ) t-i . j) := (1 .Lược đồ chứng minh như sau: % While (xk ∈ X and xk ∈ S) do tại mỗi bước sau khi thiết lập xk = <C1. τmin. τ(i. τ(i. Sau khi các agents hoàn thành quá trình di chuyển. j) τ ijmax (t) = (1-ρ )t . quá trình cập nhật pheromone được thực hiện. Thủ tục khởi tạo INITIALIZE % − Tạo một lời giải bất kỳ s’∈ X − ˆ s := s’ − ∀ (i.τ0 + (1 . c)α / ∑ τ (ck . Sau bước 1. Sau bước t ta có: ˆ Pheromone được bắt đầu..ρ) . c ) ∈ J ck C¸c tr−êng hîp kh¸c 1 Bổ đề 1: ∀ τ i. y )α ⎪ y∈C =⎨ ⎪0 ⎩ NÕu (ck .. sau đó chọn một đỉnh nào đó làm đỉnh trong quá trình dịch chuyển. Ck> chọn đỉnh tiếp theo Ck+1 theo biểu thức ngẫu nhiên: P(Ck+1 = C ⏐ T.g(s*) + g(s*) . Khi mọi agents thực hiện xong thủ tục ANT – SOLUTION – CONSTRUCTION. . Một cách hình thức. Tại thời điểm Jck= φ. Tương ứng hai ˆ lời giải này có hai kết quả của hàm đánh giá f( s ) và f (st) dùng trong thủ tục cập nhật Pheromone như sau: PHEROMONE _UPDATE − ∀ (i. Dorigo đã chứng minh tính hội tụ của ACS. j) := τ0 − Đối với mỗi agent Chọn 1 đỉnh bất kỳ c1 làm đỉnh xuất phát k := 1. Sau bước 2. j): τ(i.cung nối các cặp đỉnh (không có đỉnh cô lập). j) := max {τmin. quá trình bao gồm các thủ tục xây dựng các lời giải . Quá trình chấm dứt khi mọi đỉnh đều được duyệt qua.. Khởi đầu... j). j) + g( s ) − ∀ (i. Giả thử s là lời giải tốt nhất tính đến trước thời điểm xảy ra bước t.. kiến sẽ chấm dứt quá trình tìm lời giải và bị loại bỏ. xk = <c1> Trong đó τ0.ứng cử viên thoả mãn các điều kiện ban đầu. giá trị đó < (1 . τ(i. j) ∈ s : τ(i.. Điều kiện Ω được áp dụng bảo đảm các lời giải . j)} − ρ: 0 < ρ < 1 là hệ số giảm Pheromone sau mỗi bước. g(s*) i=1 t ˆ − nếu f (st) < f( s ) thì ˆ s : st Với 0<ρ<1: τijmax tiệm cận đến 1 ⋅ g ( s* ) = τ max ρ ˆ ˆ − ∀ (i. C2.

chúng tôi trình bầy về việc áp dụng Antgb. Với t = ln τ min − ln τ max 1 Trong đó Nc là lực lượng của tập C. Vì chúng ta cần tìm xác xuất tìm được một lời giải tối ưu trong t bước lặp đầu tiên nên ta có: ˆ ˆ p *(t) = 1 – (1 . t > t* + t 0 ρ Sau t0 bước lặp kể từ thời điểm t* tìm được giải . Đó là thiết kế cấu trúc mạng và thiết lập ma trận trọng số cho cấu trúc đó. giải thuật di truyền (GA).τ(i. sau khi tìm được lời giải tối ưu. GA cổ điển thường tìm được lời giải cục bộ nên quá trình tìm các phương án cho phép tìm kiếm tối ưu toàn cục vẫn đang tiếp tục được nghiên cứu. Tuy nhiên giá trị τij(t) ≥ τmin.ε và t →∞ * lim τ ij (t) = τ min lim P* (t ) = 1 Chứng minh: Số lượng Pheromone trên mỗi cung luôn thoả mãn 0 < τmin < τnij ≤ τmax nên xác suất một cung được chọn pmin luôn lớn hơn 0. trong đó ta thay τ0 bằng τ*i. Khi cho t đủ lớn. t0 = 1 − ρ . các agents khi chọn các cung để xây dựng nên S* cần lựa chọn các cung có nồng độ mùi lớn nhất.j) ∈ S*. Chứng minh bổ đề 2 giống như chứng minh bổ đề 1. HUẤN LUYỆN TRỌNG SỐ CỦA MẠNG NEURAL (NN) BẰNG GIẢI THUẬT KIẾN Trong việc thiết kế mạng Neural có hai vấn đề lớn cho các nhà thiết kế. j) ∈ S* ta có t →∞ Định lý 1: Giả sử P (t) là xác xuất để thuật toán tìm được một lời giải tối ưu trong t bước lặp đầu tiên. trong đó nổi bật nhất là thuật toán lan truyền ngược sai số (BP). (i. Cũng như thuật toán đã được trình bầy ở phần 2. ∀ (k. thuật toán giả luyện kim (AS). Khi đó với ε nhỏ tuỳ ý và với t đủ lớn ta có: P*(t) ≥ 1. τij(t) = τmin. nồng độ Pheromone trên các cung thuộc lời giải tối ưu lớn hơn nồng độ tại các cung khác. * * pháp tối ưu đầu tiên. j (t ) = τ min t →∞ ˆ pmin ≥ p min = α τ min α α ( N c − 1)τ m ax + τ min Trên thực tế người ta chứng minh rằng với t’> t* + t1. Việc xác định ma trận trọng số của NN có vai trò vô cùng quan trọng vì mọi phương án thiết kế đều phải sử dụng một thuật toán huấn luyện trọng số để lựa chọn các kết nối trong NN. Sau khi node thành phần của lời giải. ∀ (i.j (t*). j) ∈ s* Chứng minh: Khi một lời giải tối ưu s được tìm ra τ ij(t) ≥ τmin và do việc cập nhật Pheromone theo lời giải tối ưu toàn cục nên τ*ij tăng liên tục. Trong phần này. n là số III. Định lý 3: Sau khi thuật toán tìm được một lời giải tối ưu.kiến (Agents) sẽ di chuyển qua từng nút của NN theo tỷ lệ Pheromone trên từng cung liên kết các nút. Các thuật toán BP. Khi đó tất cả các phương án S’ (có thể bao gồm cả lời giải tối ưu s* ∈ S * ln (1 − ρ ) được tạo ra với xác suất ˆ p≥ ˆn pmin .j) sau mỗi bước.j) không được bổ sung pheromone mà chỉ bay hơi một lượng ρ.ε với ε nhỏ ˆ lim p* (t ) = 1 giải tối ưu ở t bước lặp. Ta luôn có bất đẳng thức: Chứng minh: Nếu (i. Vậy lim τ i .Trong đó τ*ij là số Pheromone trên cung (i. Khi đó tồn tại giá trị t0 thoả mãn τij(t) > τkl(t) ∀ (i. các tác tử .j) ∈ S*. j) ∈ S*. trong đó t* là bước tìm được lời giải tối ưu đầu tiên.τ min để tìm ma trận trọng số. Hiện nay người ta áp dụng rộng rãi một số phương pháp huấn luyện trọng số.Chứng minh chi tiết xem [12] Từ định lý 2 dễ dàng suy ra từ thời điểm t > t* + t0. tuỳ ý và t →∞ Định lý 2: Giả sử lời giải tối ưu đầu tiên được tìm thấy ở bước t* . l) ∈ s*.p )t Trong đó (1 - ˆ p )t là xác xuất không tìm được lời ˆ p *(t) sẽ lớn hơn 1. đối với mọi (i. l) ∈ L ∧ (k.

dự đoán và điều khiển lưu lượng. PherPi = PherPi + Const Error Trong đó Const là hệ số xác định cường độ cập nhật Pheromone và Error = Max Vn − Vexp n =1 K Trong đó K là số mẫu thử. Việc cập nhật tiến hành theo nguyên tắc các tham số thuộc mạng cho kết quả tốt nhất sẽ được tăng Pheromone. Một số bài toán chọn đường trong mạng. Vấn đề đặt ra là: Với một nhóm thông số nhất định đã đo được. 0. tần số của đôi dây. Pher Pj∈WP i cho mỗi thành phần Pj ∈ WPi (1 ≤ i ≤ D). Kết quả này áp dụng tốt để xác định suy hao nếu biết tham số tần số.. − Cho một số lượng M agents lần lượt duyệt qua D tập WPi theo thứ tự mỗi lần chọn một giá trị thuộc WPi theo quy tắc lựa chọn cho trước.8. Số nút ẩn là 50. Sau đó các trọng số tương ứng với sai số nhỏ nhất tìm được sẽ được tăng một Pheromone theo nguyên tắc của thủ tục PHEROMONE-UPDATE. ỨNG DỤNG Mạng Neuron có nhiều ứng dụng trong ngành viễn thông..01.. Các tham số được luyện với 25 kiến với tham số Pher. chẩn đoán độ tắc nghẽn. − Ký hiệu WPi là tập các giá trị có thể của tham số Pi (1 ≤ i ≤ D). 2. 1. Rõ ràng nguyên tắc cập nhật này thoả mãn điều kiện trong thủ tục PHEROMONE – UPDATE tại phần (2): 0 < g(s) < +∝ và f (s) < f(s’) ⇒ g(s) ≥ g (s’) 5.4 sẽ được tiếp tục đến khi các agent chọn được bộ trọng số thích hợp cho mạng Neural. người ta quan tâm đến 11 thông số: Giới hạn SNR. Tuy nhiên không phải máy đo nào cũng đo được đầy đủ các thông số này. tốc độ tải xuống lớn nhất. Sau đây chúng tôi chọn một ứng dụng điển hình: Trong quá trình kiểm tra chất lượng dịch vụ ADSL. suy hao. Bay hơi: Khi tất cả các agents chọn xong các phần WPi tại bước 2. chúng sẽ trở về vị trí ban đầu theo đường đã đi và cho bay hơi một lượng Pheromone nhất định. Sau khi tất cả các phần tử của mọi WPi đã giảm một lượng Evap. 2. Ý tưởng trên được cụ thể hoá như sau: − Giả sử có D trọng số cần phải huấn luyện. Khi tất cả các giá trị Pj∈ WPi được gán. Kết quả sau huấn luyện cho ta phụ thuộc của tham số suy hao của đường dây theo tần số.0 . số bit trên 1 ton. Khởi tạo: Gán số lượng Pheromone mạng NN để tìm hàm sai sô. 0.. mỗi thành phần Pj của mọi WPi được bớt đi một lượng Pj := Pj . tỷ lệ pheromone được cập nhật theo kết quả sai số nhỏ nhất tìm được. Thuật toán trên được mô tả cụ thể như sau: 1. Các bước từ 1 . SNR/ton. Ở đây chúng tôi chọn mạng truyền thẳng 10 nút vào và một nút ra. Vn là giá trị do NN trả về và Vexp là giá trị mẫu cho trước của bộ dữ liệu huấn luyện. chuyển qua thủ tục chọn giá trị.Evap. − Khi mọi Agents đã duyệt xong. 4. có thể giải quyết với sự hỗ trợ của mạng Neuron. làm thế nào để dự báo được thông số suy hao theo đường dây. Evap và Cons tương ứng 1. mọi giá trị được chọn sẽ được đưa vào . Mạng được huấn luyện với bộ dữ liệu 5000 bản ghi trên các đôi cáp khác nhau.các Agents duyệt qua toàn bộ các nút. IV. − Quá trình tìm kiếm sẽ kết thúc khi điều kiện chấm dứt tìm kiếm được thoả mãn ( Sai số của mạng nhỏ hơn một giá trị nào đó cho trước hoặc thuật toán đạt số vòng lặp nhất định. tốc độ tải xuống thực tế. Chọn giá trị: Agent bắt đầu từ chọn phần tử trong mỗi tập WP1 đến WPD WPi theo quy tắc Prob Pj (WPi ) = j∈N ( Pi ) ∑ i Pher Pj (WPi ) Pher Pj (WPi ) Trong đó tham số Pj ∈ WP tử của 3.

[12] T. The Ant System: Optimization by a colony of cooperating agents. TÀI LIỆU THAM KHẢO [1] M. Z. G. ans Cybernetics – Part B. Michalewicz. [8] W. 82(3):145-153. 1991. Future Generation Computer Systems. Information Processing Letters. IEEE Transactions on Systems. [2] M. Vì vậy một hướng cải tiến là lai ghép giải thuật kiến với một thuật toán cho ra kết quả tối ưu cục bộ(Ví dụ GA đơn giản). 1999. pages 309-314. Technical Report 99-09. and X. 2000. [5] M. 1(1):53-66. KẾT LUẬN VÀ CÁC HƯỚNG NGHIÊN CỨU TIẾP THEO Như đã trình bày trong phần II. Colorni. The ant colony optimization metaheuristic: Algorithms. [4] M. In T. The Max-Min Ant System and local search for the traveling salesman problem. London. Dorigo and L. M. NJ. The Ant Colony Optimization meta-heuristic. A generalized convergence result fot the graph-based Ant System metaheuristic. IEEE Press. Gutjahr. 2002. 2002 Ngày nhận bài: 15/09/2005 . IEEE Transactions on Evolutionary Computation. Di Caro. IEEE Transactions on Evolutionary Computation. Colorni. editors. Dorigo and T. 26(1)29-41. Di Caro.XVIII. IRRIDIA. Stütxle. [3] M. Dorigo. Corne. Maniezzo. n 1. New Ideas in Optimization. Tạp chí khoa học-Đại học quốc gia Hà Nội t. and L. 5(2):137 – 172. Austria. and A. M. Italy. Dorigo. Positive feedback as search strategy. [6] M. Politecnio di Milano. Dorigo. giải thuật kiến cho phép ta tìm được lời giải tối ưu với xác suất bằng 1. Ant Colony System: A cooperative learning approach to the travelling salesman problem. Dipartimento di Elettronica. and F. V. Piscataway. and A. [7] W. Technical Report 91-016. 1997. 1996. 1999. McGraw Hill. Maniezzo. University of Vienna. Gambardella. papes 11-32. M.Điều này sẽ làm giảm thời gian tìm kiếm nếu chung ta chỉ sử dụng riêng ACO. 1999. UK. Technical Report IRIDIA/2000-32. Gambardella.2002 pp29-37 [11] T. J.Biểu đồ suy hao tín hiệu 50 45 40 35 30 25 20 15 10 5 Suy hao Tần số(kHz) 0 0 200 400 600 800 1000 1200 1400 Hình 1: Biểu đồ suy hao truyền dẫn V. On the Ant Colony System for Postman problem. 16(8):8733-888. Sơ đồ lai ghép sẽ như sau: HuÊn luyÖn träng sè ACO GA Lêi gi¶i Trao ®æi kÕt qu¶ Lêi gi¶i Hình 2: Sơ đồ lai ghép ACO – GA Như vậy GA sẽ nhanh chóng tìm ra các kết quả tối ưu cục bộ và chuyển kết quả cho ACO tiếp tục xử lý nhằm tìm ra các lời giải tối ưu toàn cục. Université Libre de Bruxelles. [9] W. ACO algorithms with guaranteed convergence to the optimal solution. Gutjahr. Dorigo. A Short convergence proof for a class of ant colony Optimization Algorithms. Hoos. Stützle and H. Artificial Life. Proceedings of the 1997 IEEE International Conference on Evolutionary Computation (ICEC’97). J. editor. Yao. Dorigo and G. In D. Man. chúng ta đều biết những thuật toán như vậy thường có thời gian thực hiện rất lớn. [10] Hoàng Xuân Huấn and Đinh Trung Hoàng. Dorigo. 2000. Belgium. applications and advances.Gutjahr. V. Department of Statistics and Decision Support Systems. A graph-based Ant System and its convergence. Glover. 1997. Bäck. Stützle and M. Ant algorithms for discrete optimiization. Tuy nhiện. H.

SƠ LƯỢC TÁC GIẢ NGUYỄN XUÂN TÙNG Sinh ngày 13/04/1964 Tốt nghiệp đại học Bách khoa Hà nội khoa Điện tử viễn thông năm 1996. Hướng nghiên cứu: Mạng Neural. Bưu điện Hà Nội. Stochastic optimization problems. Email: . Hiện đang công tác tại: Trung tâm Tin học. Kỹ thuật dự báo. Thạc sỹ công nghệ thông tin năm 2003 tại Đại học Quốc gia Hà nội.

Sign up to vote on this title
UsefulNot useful