You are on page 1of 9

Công nghệ tri thức và Ứng dụng

-​ KIẾN TRÚC HỆ THỐNG


Inference engine phân tích đề bài và ghi vào working memory, xong thì thực hiện quá
trình suy luận. Trong quá trình suy luận sử dụng tri thức trong knowledge base.
Các thành phần chính”
● Hệ cơ sở tri thức
● Bộ suy diễn
● Explanatory system
● Bộ nhớ hoạt động (working memory)
● Knowledge manager
● Interface

Knowledge Bases contain the knowledge for solving some problems in a specific knowledge
domain. It must be stored in the computer-readable form so that the inference engine can
use it in the procedure of automated deductive reasoning to solve problems stated in
general forms. They can contain concepts and objects, relations, operators and functions,
facts and rules.
The Inference engine will use the knowledge stored in knowledge bases to solve problems,
to search or to answer for the query. It is the "brain" that systems use to reason about the
information in the knowledge base for the ultimate purpose of formulating new conclusions.
It must identify problems and use suitable deductive strategies to find out right rules and
facts for solving the problem. In an IPSE, the inference engine also have to produce solutions
as human reading, thinking, and writing.
The working memory contains the data that is received from the user during operation of
the system. Consequents from rules in the knowledge base may create new values in
working memory, update old values, or remove existing values. It also stores data, facts and
rules in the process of searching and deduction of the inference engine.
The explanation component supports to explain the phases, concepts in the process of
solving the problem. It presents the method by which the system reaches a conclusion may
not be obvious to a human user, and explains the reasoning process that lead to the final
answer of the system.
The knowledge manager aims to support updating knowledge into knowledge base. It also
supports to search the knowledge and test consistence of knowledge.
The user interface is the means of communication between a user and the system
problemsolving processes. An effective interface has to be able to accept the queries,
instructions or
problems in a form that the user enters and translate them into working problems in the
form for the rest of the system. It also has to be able to translate the answers, produced by
the system, into a form that the user can understand. The interface component of the system
is required to have a specification language for communication between the system and
learners, between the system and instructors as well.
- An ontology for knowledge representation And Applications.
- Design Method for Knowledge Base Systems in Education Using COKB-ONT.

Câu 4: Các khái niệm và thành phần chính trong ontology trong biểu diễn tri thức.

Các khái niệm chính:


● Tri thức (knowledge): sự “hiểu biết” của người trong một phạm vi, lĩnh vực nào đó; được
xem xét theo các mục tiêu hay các vấn đề nhất định.
● Suy diễn (reasoning): là quá trình vận dụng kiến thức đã biết trong quá trình lập luận để
giải quyết vấn đề, trong đó quan trọng nhất là các chiến lược/ giải pháp giúp phát sinh
những sự kiện mới từ các sự kiện đã có.
Về mặt cấu trúc, tri thức là một hệ thống phức tạp, đa dạng và trừu tượng bao gồm nhiều thành
tố với những mối liên hệ tác động qua lại như:
● Các khái niệm (concepts)
● Các quan hệ (relations)
● Các toán tử (operators): phép toán, các biểu thức hay công thức
● Các hàm (functions)
● Các luật (rules)
● Sự kiện (facts)
● Các thực thể hay đối tượng, một phần tử cụ thể (objects).

Vấn đề biểu diễn tri thức:


Xây dựng ​mô hình biểu diễn tri thức để đưa tri thức lên máy tổ
chức lưu trữ và xử lý, đặc biệt là cho suy luận giải các vấn đề, các
bài toán.

Vấn đề BDTT

Có: (1) tri thức của một miền tri thức nhất định đang được diễn đạt ở dạng tự nhiên,

(2) mục tiêu hay nhu cầu xử lý g/q vấn đề

Kết quả mong muốn: ​mô hình biểu diễn cho tri thức trên (1) thỏa: (i) tổ chức lưu trữ xử
lý được trên máy, (ii) đáp ứng cho việc suy luận hay suy diễn giải quyết vấn đề (2).
Mô hình tính toán dựa trên cơ sở tri thức (Computational Objects Knowledge Base - COKB)
bao gồm 6 thành phần: (C, H, R, Ops, Funcs, Rules)
● C là tập hợp các khái niệm về các đối tượng tính toán (CObject).
● H là tập hợp các quan hệ thứ bậc (hierarchy relations) trên các khái niệm.
● R là tập các quan hệ (relations) trên các khái niệm.
● Ops là một tập hợp các toán tử (operators).
● Funcs là một tập hợp các hàm (functions).
● Rules là một tập hợp các quy tắc (rules).

Câu 1: Các giai đoạn xây dựng một hệ cơ sở tri thức. Mô tả nội dung từng giai
đoạn.

Quá trình phân tích và thiết kế các thành phần của một hệ cơ sở tri thức bao gồm các giai đoạn
sau:
Giai đoạn 1: Thu thập kiến thức thực tế dựa trên mô hình COKB.
Giai đoạn 2: Phân loại kiến thức trong Giai đoạn 1 để phân tích các yêu cầu.
Giai đoạn 3: Tổ chức hệ cơ sở tri thức dựa trên mô hình COKB và ngôn ngữ đặc tả của nó.
- Tệp OBJECT_KINDS.txt lưu trữ tên của các khái niệm.
- Tệp HIERARCHY.txt lưu trữ thông tin của biểu đồ Hasse đại diện cho thành phần H của
mô hình COKB.
- Các tệp RELATIONS.txt và RELATIONS_DEF.txt lưu trữ đặc tả của các quan hệ (thành
phần R của mô hình COKB).
- Tệp OPERATORS.txt và tệp OPERATORS_DEF.txt lưu trữ đặc điểm kỹ thuật của các
toán tử (Hoạt động thành phần của mô hình COKB).
- Các tệp FUNCTIONS.txt và FUNCTIONS_DEF.txt lưu trữ đặc tả của các hàm (các
Funcs thành phần của mô hình COKB).
- Tệp FACT_KINDS.txt lưu trữ định nghĩa của các loại sự kiện.
- Tệp RULES.txt lưu trữ các quy tắc suy diễn.
- Tệp SOMEOBJECTS.txt lưu trữ các đối tượng nhất định.
Giai đoạn 4: Mô hình hóa vấn đề và thiết kế thuật toán.
Các vấn đề được trình bày bằng cách sử dụng một mô hình được gọi là mạng của C-Objects,
bao gồm 3 tập:
O = {O1, O2, . . ., On},
F = {f1, f2, . . ., fm},
Goal = { g1, g2, . . ., gm }.
O bao gồm các C-object, F là tập hợp các sự thật được cho, và Goal bao gồm các yêu cầu/
mục tiêu của bài toán.
Việc thiết kế các thuật toán suy diễn và thiết kế giao diện hệ thống có thể được phát triển
theo ba bước để mô hình hóa:
- Bước 1: Phân loại bài toán chẳng hạn như bài toán cơ sở, bài toán xác định object hay sự
kiện, bài toán tìm kiếm objects hay sự kiện.
- Bước 2: ​Phân loại sự kiện và trình bày chúng dựa trên các loại sự kiện của mô hình
COKB.
- Bước 3: Mô hình hóa các loại vấn đề từ việc phân loại trong bước 1 và 2.
Giai đoạn 5: Tạo ngôn ngữ truy vấn cho mô hình, giúp người dùng giao tiếp với hệ thống.
Giai đoạn 6: Thiết kế giao diện của phần mềm và lập trình phần mềm.
Giai đoạn 7: Kiểm tra, duy trì và phát triển ứng dụng.
Câu 2: Trình này phương pháp hệ luật dẫn và phép suy diễn tiến. Vận dụng trong
xây dựng ứng dụng sau.

Mô hình Hệ luật dẫn: (Facts, Rules)


- Facts là tập các sự kiện hay tác vụ trong phạm vi tri thức.
- Rules gồm luật dẫn có dạng “if … then …”​, mỗi r thuộc Rules có dạng:
r: GT(r) => KL(r)
GT: Giả thuyết
KL: Kết luận
Suy diễn tiến:
● Là quá trình suy luận đi từ giả thiết đến kết luận thông qua việc áp dụng các định luật,
định lý.
● Xuất phát từ giả thiết để sinh ra những sự kiện mới cho tới khi đạt được mục tiêu hay tới
khi không tìm được luật nào áp dụng được để sinh ra sự kiện mới.
● Quá trình suy luận gồm 1 chuỗi các bước suy diễn mà ở mỗi bước suy diễn có dạng:

Đang biết → Mới


luật
​Thuật giải suy diễn tiến:
Bước 1: Solution = []; Known = GT;
Bước 2: while (KL ⊈​ ​Known​) do
2.1: Tìm luật r​ để áp dụng trên Known ​nhằm sinh ra sự kiện mới:
GT(r) ⊆ Known​ và ​KL(r)​ ​⊈ Known​.
2.2: if (không có​ r​) then dừng: không tìm được lời giải
2.3: Thêm ​r ​vào ​Solution​; thêm ​KL(r)​ vào ​Known​;
End while
Bước 3: Tìm được lời giải sử dụng danh sách luật Solution
Ghi chú: Cần loại bỏ luật thừa trong Solution​.
Khuyết điểm của thuật giải suy diễn tiến:

·​ ​Có những bước giải thừa trong lời giải được tìm thấy, số lượng thừa thường là nhiều.
khắc phục: xây dựng thuật giải để loại bỏ bước thừa.

· ​Lời giải có được (sau khi loại bỏ bước thừa) chưa chắc là tối ưu (số bước giải là thấp
nhất, chi phí tính toán thấp nhất, …)

khắc phục:

C1:Kết hợp tiến và lùi sẽ tìm được lời giải có thể tốt hơn nhưng chưa chắc là tối
ưu.

C2: lượng hóa hay số hóa (các tham số hay các trọng số) các tiêu chí tối ưu, và
trong quá trình tìm lời giải ta phải tính toán trọng số của lời giải, có sự so sánh chọn lựa
để có thể tìm được lời giải tối ưu.

Ví dụ: một phần kiến thức về một tam giác trong hình học
Phần tri thức trên có thể biểu diễn theo mô hình hệ luật dẫn (Facts, Rules) gồm:
Facts = {a, b, c, A, B, C, S, p, R, ha, hb, hc, …}
Rules = {
r1: {A, B} {C};
r2: {A, C} {B};
...
}

Câu 3: Các bạn hãy phân tích, đánh giá phương pháp hệ luật dẫn khi vận dụng có
những ưu nhược điểm gì?

Ưu điểm: Khi kết hợp suy diễn tiến với các yếu tố sau sẽ giúp cho việc suy diễn thông minh,
hiệu quả:
● Kinh nghiệm
● Kỹ năng
● Khả năng trực giác, nhạy bén
● Tận dụng thông tin hữu ích bổ sung đối với vấn đề.
● Ghi nhớ những trường hợp khó hay đặc biệt, phổ biến để vận dụng khi cần thiết

Khuyết điểm của thuật giải suy diễn tiến:


● Có những bước giải thừa trong lời giải được tìm thấy, số lượng thừa thường là nhiều.
Khắc phục: xây dựng thuật giải để loại bỏ bước thừa.
● Lời giải có được (sau khi loại bỏ bước thừa) chưa chắc chắn là tối ưu. Khắc phục:
○ C1: kết hợp suy diễn tiến và suy diễn lùi sẽ tìm được lời giải có thể tốt hơn nhưng
chưa chắc là tối ưu.
○ C2: lượng hóa hay số hóa (các tham số hay các trọng số) các tiêu chí tối ưu, và
trong quá trình tìm lời giải ta phải tính toán trọng số của lời giải, có sự so sánh
chọn lựa để có thể tìm được lời giải tối ưu.
Câu Ontotoly:
An Ontology is a
formal specification --> Executable, Discussable
of a ​shared --> Group ​of persons, computer agents
conceptualization --> ​About ​concepts; abstract class
of a ​domain​ of interest ​--> e.g. an application, a specific area, the “world model”

You might also like