Professional Documents
Culture Documents
2.1.2 Agent
a. Thế nào là agents.
Agent (tác nhân) là tất cả những gì có thể nhận thức về môi trường của nó
thông qua bộ cảm nhận (sensor) và đưa ra hành động tác động đến môi trường
qua bộ tác động (actuator).
Một toán tử luôn đòi hỏi một lượng trí thông minh nhất định để thực hiện
các nhiệm vụ của mình
Do đó, trên đề cập đến tác tử thông minh
Ở cấp độ cao nhất, ba loại tác tử chính có thể được phân biệt: tác tửcon
người, tác tửphần cứng và tác tửphần mềm
Ví dụ, một đại lý du lịch của con người, robot, taxi tự động
Agent có 3 loại:
- Human agent (agent con người): Agent con người sử dụng Mắt, Mũi,
Lưỡi và các cơ quan cảm giác khác làm cảm biến để cảm nhận thông tin từ môi
trường và sử dụng chân tay và đường thanh âm làm cơ quan truyền động để
thực hiện một hành động dựa trên thông tin
- Robotic agent (agent người máy): Robotics Agent sử dụng máy ảnh và
radar hồng ngoại làm cảm biến để ghi lại thông tin từ Môi trường và nó sử dụng
động cơ phản xạ làm bộ truyền động để đưa đầu ra trở lại môi trường.
- Software agent (agent phần mềm): Tác tửphần mềm sử dụng các thao tác
trên bàn phím, lệnh âm thanh làm cảm biến đầu vào và màn hình hiển thị làm
thiết bị truyền động.
b. Phân loại agent:
- Simple Reflex Agents: Agent phản ứng đơn giản.
- Model Based Reflex Agents: Agent phản xạ dựa trên model
- Goal Based Agents: Agent dựa trên mục tiêu.
- Utility Based Agents: Agent dựa trên tính tiện ích.
2.2. Các agent hợp lý
Đối với mỗi trình tự nhận thức có thể, một tác tửhợp lý nên chọn một
hành động (sử dụng hàm tác nhân) dự kiến sẽ tối đa hóa số đo hiệu suất
của nó, đưa ra bằng chứng được cung cấp bởi trình tự nhận thức và bất kỳ
kiến thức tích hợp nào trước đó mà tác tửcó.
Một chuỗi nhận thức là lịch sử đầy đủ của bất cứ điều gì mà tác tửđã từng
cảm nhận.
Một thước đo hiệu suất là một phương tiện để tính toán mức độ hiệu quả
của tác tửdựa trên trình tự nhận thức mà nó đã nhận được.
Kiến thức trước đây của một đại lý về môi trường là kiến thức mà nhà
thiết kế đại lý đã cung cấp cho đại lý trước khi giới thiệu về môi trường.
Tác tử hợp lí thứ nhất
Tác tử cần phấn đấu để làm đúng việc cần làm ,dựa trên những gì nó nhận
thức (nhận biết) được và dựa trên các hành động mà nó có thể thực hiện
Một hành động đúng (hợp lí) là hành động giúp cho tác tử đạt được thành
công cao nhất đối với mục tiêu đặt ra
Đánh giá hiệu quả hoạt động : là tiêu chuẩn để đánh giá mức độ thành công
hoạt động của một tác tử
Tác tử hợp lí thứ hai
Với mỗi chuỗi nhận thức có được, một tác tử hợp lí cần phải lựa chọn một
hành động giúp cực đại hoá tiêu chí đánh giá hiệu quả hoạt động của tác tử đó
Dựa trên các thông tin được cung cấp vởi chuỗi nhận thức và các tri thức
được sở hữu bởi tác tử đó
Tác tử hợp lí thứ ba
Sự hợp lí khác sự thông suốt mọi thứ. Sự thông suốt mọi thứ nghĩa là biết
tất cả mọi thứ , với tri thức vô hạn. Vì các nhận thức có thể không cung cấp tất
cả các thông tin liên quan.
Các tác tử có thể thực hiện các hành động nhằm thay đổi các nhận thức
trong tương lai, với mục đích thu được các thông tin hữu ích (ví dụ: thu thập
thông tin, khám phá tri thức).
Tác tử tự trị (autonomous agent) là một tác tử mà các hành động của nó
được quyết định vởi chính kinh nghiệm của tác tử đó ( cùng với khả năng học
và thích nghi).
2.3. Thiết lập độ đo, môi trường
2.3.1. Thiệt lập độ đo
Độ đo thực hiện làm tiêu chuẩn cho thành công của hành vi của một agen..
- Khi một agent được thả vào một môi trường, nó phải tạo ra chuỗi tác
động phù hợp với các nhận thức mà nó tiếp nhận
- Không có một độ đo chung cho mọi agent
- Cần có độ đo khách quan đặt ra cho mọi người thiết kế mỗi agent (với
agent hút bụi có thể đo bằng số bụi hút được hoặc diện tích sạch)
- Cần thiết kế độ đo phù hợp với môi trường muốn có hơn là phù hợp với
agent
- Lựa chọn độ đo là vấn đề khó
Khi thiết kế, xây dựng một tác tử, phải xem xét 4 yếu tố:
- Performance measure: hàm đo hiệu năng
- Enviroment: môi trường
- Actuator: bộ kích hoạt
- Sensor: cảm biến
Để thiết kế một tát tử thông minh (hợp lý) trước tiên cần phải xác định
(thiết lập) các giá trị của các thành phần của PEAS
Các tính chất của môi trường liên quan đến hệ thống sensor và lựa chọn
thuật toán cho agent
- Quan sát đầy đủ vs Quan sát một phần: chơi cờ vua vs chơi bài
- Ngẫu nhiên vs Xác định: lái xe tự động vs điều khiển máy hút bụi
- Rời rạc vs Liên tục: chơi cờ vs lái xe tự động
- Đơn tác tử vs Đa tác tử: chuẩn đoán y học vs chơi game trực tuyến
- Phối hợp vs Cạnh tranh: lái xe tự động vs chơi bài
- Tất nhiên tính chất của môi trường cũng quyết định và quyết định bởi
các sensor của agent
PEAS: Đo lường hiệu suất, Môi trường, Bộ truyền động, Cảm biến trước
tiên phải chỉ định cài đặt cho thiết kế tác nhân thông minh .Hãy xem xét, ví
dụ, nhiệm vụ thiết kế một tài xế taxi tự động:
- Thước đo hiệu suất: Chuyến đi an toàn, nhanh chóng, hợp pháp, thoải
mái, tối đa hóa lợi nhuận
- Môi trường: Đường xá, giao thông khác, người đi bộ, khách hàng
- Thiết bị truyền động: Vô lăng, gia tốc, phanh, tín hiệu, còi
- Cảm biến: Máy ảnh, sonar, đồng hồ tốc độ, GPS, công tơ mét, cảm biến
động cơ, bàn phím
- Đại lý: Robot chọn một phần
- Thước đo hiệu suất: Tỷ lệ phần trăm các bộ phận trong thùng chính xác
- Môi trường: Băng tải với các bộ phận, thùng
- Bộ truyền động: Cánh tay và bàn tay nối
- Cảm biến: Camera, cảm biến góc khớp
Đại lý: Gia sư tiếng Anh tương tác
Thước đo hiệu suất: Tối đa hóa điểm số của học sinh trong bài kiểm tra
Môi trường: Tập hợp học sinh
Bộ truyền động: Hiển thị màn hình (bài tập, đề xuất, chỉnh sửa)
Cảm biến: Bàn phím
2.4.1. Môi trường có thể quan sát đầy đủ và quan sát một phần
- Khi một cảm biến tác tử có khả năng cảm nhận hoặc truy cập trạng thái
hoàn chỉnh của tác tử tại mỗi thời điểm, nó được coi là một môi trường
có thể quan sát được hoàn toàn ngược lại nó có thể quan sát được một
phần.
- Duy trì một môi trường có thể quan sát đầy đủ là dễ dàng vì không cần
phải theo dõi lịch sử của xung quanh.
- Một tác tử không có cảm biến trong tất cả các môi trường thì một môi
trường như vậy được gọi là không thể quan sát được.
- Thí dụ:
+ Cờ vua - bàn cờ hoàn toàn có thể quan sát được, nước đi của đối thủ
cũng vậy
+ Lái xe - môi trường có thể quan sát được một phần bởi vì những gì
xung quanh góc không được biết
- Nếu chỉ có một tác tử tham gia vào một môi trường và tự hoạt động
thì môi trường như vậy được gọi là môi trường tác tử đơn lẻ.
- Tuy nhiên, nếu nhiều tác tửcùng hoạt động trong một môi trường, thì
một môi trường như vậy được gọi là môi trường đa tác nhân.
- Các vấn đề thiết kế tác tử trong môi trường đa tác tử khác với môi
trường tác tửđơn lẻ.
- Ví dụ:
+ Đơn tác nhân: Một người bị bỏ lại một mình trong mê cung là một ví
dụ về hệ thống tác tử đơn lẻ.
+ Đa tác nhân: Trò chơi bóng đá có nhiều tác tử vì nó liên quan đến 10
cầu thủ trong mỗi đội.
2.4.5. Môi trường tĩnh và môi trường động
- Nếu môi trường có thể tự thay đổi trong khi tác tử đang cố ý thì môi
trường đó được gọi là môi trường động, còn môi trường khác nó được
gọi là môi trường tĩnh.
- Môi trường tĩnh rất dễ đối phó vì một tác tử không cần tiếp tục nhìn ra
thế giới trong khi quyết định hành động.
- Tuy nhiên, đối với môi trường động, các đại lý cần phải tiếp tục nhìn ra
thế giới trong mỗi hành động.
- Ví dụ:
Môi trường động:
- Lái xe taxi
- Một chuyến đi tàu lượn rất năng động vì nó được thiết lập trong
chuyển động và môi trường luôn thay đổi trong từng khoảnh
khắc.
Môi trường tĩnh:
- Câu đố ô chữ là một ví dụ về môi trường tĩnh.
- Một ngôi nhà trống là tĩnh vì không có thay đổi xung quanh khi
tác tửxâm nhập.
- Đã biết và chưa biết thực ra không phải là một đặc điểm của môi
trường, nhưng nó là trạng thái kiến thức của tác tửđể thực hiện một
hành động.
- Trong một môi trường đã biết, tác tửđã biết kết quả của tất cả các hành
động. Khi ở trong môi trường không xác định, tác tửcần học cách hoạt
động để thực hiện một hành động.
- Rất có thể một môi trường đã biết có thể quan sát được một phần và
một môi trường không xác định có thể quan sát được hoàn toàn.
2.4.8. Môi trường có thể truy cập và môi trường không thể truy cập
- Nếu một tác tửcó thể có được thông tin đầy đủ và chính xác về môi
trường của trạng thái, thì một môi trường như vậy được gọi là môi
trường Có thể truy cập còn môi trường khác được gọi là không thể truy
cập.
- Một căn phòng trống mà trạng thái của nó có thể được xác định bằng
nhiệt độ của nó là một ví dụ về một môi trường dễ tiếp cận.
- Thông tin về một sự kiện trên trái đất là một ví dụ về Môi trường
không thể tiếp cận.
- Là loại đơn giản nhất, hoạt động trên nhận thức hiện tại và bỏ qua phần
còn lại của lịch sử nhận thức. Agent hoạt động trên quy tắc hành động
có điều kiện(ánh xạ trạng thái hiện tại để hoạt đông).VD: chất tẩy rửa
chỉ hoạt động đúng ứng dụng nó phải thực hiện khi có bẩn
- Loại agent này chỉ thành công trong môi trường nhận thức đầy đủ
- Các vấn đề với việc sử dụng tác tử phản xạ đơn giản:
+ Có trí thông minh hạn chế
+ Không có kiến thức về các phần không nhận thức của trạng thái hiện
tại
+ Quá lớn để tạo thành và lưu trữ
+ Không thích nghi với các thay đổi trong môi trường
Sơ đồ hoạt động của agent:
- https://www.javatpoint.com/agent-environment-in-ai#:~:text=An
%20environment%20can%20be%20described,said%20to%20be
%20non%2Dfeministic.
- https://www.tutorialspoint.com/artificial_intelligence/artificial_intellige
nce_agents_and_environments.htm
- https://www.geeksforgeeks.org/types-of-environments-in-
ai/#:~:text=An%20environment%20in%20artificial
%20intelligence,Fully%20Observable%20vs%20Partially
%20Observable