You are on page 1of 16

Translated from English to Vietnamese - www.onlinedoctranslator.

com

___________________________________________________
GIẤY TRẮNG
Thực tiễn tốt nhất về phát triển Ontology
25 Tháng mười, 2016
__________________________________________________

Được soạn bởi:

Ron Rudnicki (CUBRC, Inc.) Tiến sĩ Barry


Smith (Đại học Buffalo) Tanya Malyuta, Tiến sĩ (Đại
học Công nghệ New York)
COL William Mandrick, Tiến sĩ (Viện hỗ trợ quản trị quân sự)

1
Mục lục
Khách quan ................................................. .................................................... .................................................... ..3

Hạn chế ................................................. .................................................... .................................................... 3

Ngôn ngữ Ontology web (OWL) ................................................ .................................................... .................. 3

Ontology chính thức cơ bản như Ontology cấp cao nhất .......................................... ............................................... 4

Chủ nghĩa hiện thực bản thể .............................................................. .................................................... ................................ 5

Nguyên tắc thiết kế ................................................ .................................................... ............................................ 6

Phương pháp tiếp cận kiến trúc đa tầng .................................................. .................................................... ... 6

Mô đun nội dung ............................................................ .................................................... ................................ số 8

Nguyên tắc phát triển ............................................................ .................................................... ............................. 11

Tính nhất quán ................................................. .................................................... ............................................. 11

Nguyên tắc thừa kế duy nhất .................................................. .................................................... ................11

Các định nghĩa................................................. .................................................... ............................................. 11

Giữ nguyên nghĩa của các thuật ngữ Ontology cấp cao hơn ............................................ ......................... 12

Hướng dẫn từng bước để phát triển Ontology ............................................ ................................................... 13

Sơ bộ ............................................................. .................................................... ........................................ 13

Thu thập và chọn thuật ngữ ............................................................ .................................................... .............. 13

Tránh các lỗi Ontological tiêu chuẩn.................................................. .................................................... ..........13

Định dạng và tinh chỉnh thuật ngữ của bạn ................................................ .................................................... ...... 14

Tạo một hệ thống phân cấp ............................................................ .................................................... .................................... 14

Nguyên tắc định nghĩa ............................................................ .................................................... ........................ 15

Thư mục ................................................. .................................................... ................................................... 16

2
Khách quan
Các bản thể luận nằm trong số các khối xây dựng của các chiến lược web ngữ nghĩa để giải quyết vấn đề ống dẫn dữ liệu.
Một vấn đề phát sinh từ việc tạo các mô hình dữ liệu theo những cách không đồng nhất, không phối hợp và dẫn đến việc
tích hợp và tái sử dụng dữ liệu không thành công. Các bản thể luận, khi được thiết kế và phát triển đúng cách, có thể đảm
bảo tính nhất quán và bền bỉ trong việc sử dụng các thuật ngữ – do đó cũng đảm bảo tính bền vững của ý nghĩa – và do đó
chống lại những hậu quả của sự phát triển và những thay đổi thường xuyên trong cơ sở dữ liệu và phần mềm được sử dụng
để lưu trữ và quản lý dữ liệu.

World Wide Web Consortium (W3C) đã xử phạt các ngôn ngữ để xây dựng bản thể luận
(http://www.w3.org/2001/sw/Specs ), trong đó quan trọng nhất là Web Ontology Language (OWL). Đến
lượt chúng, chúng đã sinh ra phần mềm mã nguồn mở mạnh mẽ
(http://www.w3.org/2001/sw/wiki/Tools ) để phát triển và lập luận với các bản thể luận và để truy vấn các kho dữ liệu
phù hợp với các bản thể luận. Thật không may, bản thân sự phổ biến của công nghệ ngữ nghĩa đã dẫn đến một tình
huống trong đó các ontology hiện đang được tạo ra theo những cách không đồng nhất, không phối hợp với nhau, do
đó dẫn đến một vấn đề mới về ống dẫn ngữ nghĩa, và do đó dẫn đến một thất bại mới trong việc tích hợp và tái sử
dụng dữ liệu. Các thực tiễn tốt nhất được mô tả ở đây chống lại xu hướng này bằng cách cung cấp một tập hợp các
nguyên tắc và quy tắc để dẫn đến sự phát triển của các bản thể luận theo một kiểu nhất quán, không dư thừa.

Hạn chế
Chúng tôi bắt đầu bằng cách mô tả bộ công cụ và phương pháp mô hình hóa để phát triển các bản thể luận. Chúng tôi
phân loại những điều này là các ràng buộc vì chúng nằm ngoài quy trình thiết kế và phát triển nhưng chúng giới hạn các
quy trình đó theo những cách quan trọng.

Ngôn ngữ bản thể web (OWL)


Chúng tôi tuân theo khuyến nghị của W3C rằng các bản thể luận được xuất bản để trao đổi dưới dạng tệp OWL (chính
xác hơn: dưới dạng tệp sử dụng Ngôn ngữ bản thể web OWL 2) theo cú pháp RDF/XML
(https://www.w3.org/TR/owl-conformance/). Yêu cầu trao đổi các bản thể luận theo cú pháp này đảm bảo
rằng các công cụ sẽ có thể hoạt động trên chúng mà không cần chuyển đổi (kết quả của RDF/XML là cú pháp
mà bất kỳ công cụ nào cũng phải hỗ trợ để tuân thủ OWL). Các cú pháp OWL khác có sẵn cho các mục đích
khác ngoài trao đổi. (ví dụ: OWL/XML, Rùa hoặc Manchester). Ví dụ, cú pháp Turtle và Manchester thúc đẩy
khả năng đọc.

Việc chúng tôi tuân theo khuyến nghị của W3C liên quan đến việc sử dụng OWL không phải là sự chứng thực cho
ngôn ngữ đó là phù hợp lý tưởng với nhiệm vụ xuất bản các bản thể luận. Thay vào đó, nó là một sự công nhận OWL
là tiêu chuẩn hiện tại và hệ sinh thái các công cụ xung quanh nó làm cho nó trở thành lựa chọn tốt nhất hiện tại. Khi
công nghệ phát triển, các ngôn ngữ khác có thể thay thế vai trò tiêu chuẩn của OWL. Ví dụ: ISO đã xử phạt một ngôn
ngữ bổ sung, Common Logic (CL)
(http://www.iso.org/iso/catalogue_detail.htm?csnumber=39175 ) và việc sử dụng nó để xây dựng
ontology ngày càng tăng (http://stl.mie.utoronto.ca/colore/ontology.html ). CL có sức mạnh biểu cảm
lớn hơn OWL, nhưng thiếu một số tính năng và công cụ tính toán khiến nó kém hấp dẫn hơn OWL.

3
Ontology chính thức cơ bản như Ontology cấp cao nhất
Cácmức độcủa một ontology được xác định bởi mức độ tổng quát của các loại trong thực tế mà nó đại diện. Ví dụ,
đối tượng là một loại rất chung chung; Vật sống và Người là những loại ít chung chung hơn và các loại như Màu mắt
xanh vẫn ít chung chung hơn.

Như sẽ được giải thích đầy đủ hơn trong phần về các nguyên tắc thiết kế bên dưới, chúng tôi đề xuất một kiến
trúc theo tầng của các ontology bắt đầu với một ontology mức cao nhất duy nhất tạo thành cơ sở của tất cả các
ontology khác. Mục đích của ontology mức cao nhất là cung cấp một biểu diễn mức cao, miền trung lập về sự phân
biệt chẳng hạn như giữa các đối tượng và sự kiện, và giữa các đối tượng và thuộc tính của chúng (phẩm chất, vai
trò, v.v.).

chúng tôi đề nghịOntology hình thức cơ bản 2.0 (BFO) là bản thể luận cấp cao nhất (Arp, Smith, & Spear,
2015). BFO là một bản thể luận nhỏ, trừu tượng cao, cấp trên được thiết kế để sử dụngdưới mui xe. Vai trò
của nó là cung cấp một khuôn khổ có thể đóng vai trò là điểm khởi đầu chung để biểu diễn các loại cụ thể hơn
nhằm đảm bảo sự phát triển bản thể luận nhất quán ở các mức thấp hơn theo cách tối đa hóa mức độ tương
tác giữa các bản thể luận được phát triển bởi các nhóm cộng tác khác nhau.

Một lý do cho sự thành công của BFO là nó là một ontology cấp cao nghiêm ngặt. Như vậy, nó là miền trung lập
và không chứa các biểu diễn riêng của nó về các loại thực thể vật lý, hóa học, sinh học, tâm lý, xã hội hoặc các loại
thực thể khác sẽ nằm trong các miền cấp trung bình hoặc cấp thấp hơn. BFO tương ứng là rất nhỏ, với một nhiệm
vụ tập trung hẹp: đó là cung cấp một bản thể luận cấp trên hỗ trợ tích hợp nhiều mô-đun plug and play bản thể
học miền không đồng nhất ở các cấp độ thấp hơn. Hình 1 mô tả một tập hợp các bản thể luận miền dựa trên BFO
mô-đun được tạo ra để mô tả tất cả các khía cạnh của đời sống thực vật

(http://wiki.plantontology.org/index.php/
The_cROP_(Common_Reference_Ontologies_for_Plants)_Initiative).

4
Hình 1: Bộ các mô-đun ontology của CROP Common Reference Ontology for Plants

chủ nghĩa hiện thực bản thể


Để tối đa hóa cả tiện ích và tính ổn định, quá trình mô hình hóa phát triển ontology nên dựa trên cái mà (Smith &
Ceusters, 2010) gọi là 'chủ nghĩa hiện thực ontology', nghĩa là ý tưởng rằng một ontology nên tương tự chứ không
phải mộtmô hình dữ liệu, mà là để mộtmô hình thực tế.Dưới ràng buộc này, các ontology là các biểu diễn không phải
củadữ liệuđược tích hợp, mà là các thực thể mà những dữ liệu đó đề cập đến. Một số ontology thực sự sẽ cần chứa
các thuật ngữ đề cập đến các mục dữ liệu – ví dụ như các loại hình ảnh, hoặc các loại email hoặc các tài liệu văn bản
khác. Bằng cách tuân theo thực tiễn của chủ nghĩa hiện thực bản thể học, các bản thể luận này sẽ coi các mục dữ liệu
này là các thực thể trong thực tế theo quyền riêng của chúng.

Phát triển dưới sự ràng buộc của chủ nghĩa hiện thực bản thể định vị các bản thể kết quả là ứng cử viên tốt nhất để
phục vụ như các mô hình chung của tất cả các nguồn dữ liệu trong một hệ sinh thái thông tin phức tạp. Các bản thể
luận hiện thực phục vụ như một đại diện cho một số phần của thế giới, sử dụng các biểu thức đồng thuận càng nhiều
càng tốt (từ ngôn ngữ tự nhiên, bao gồm cả từ vựng khoa học). Các nguồn dữ liệu là những mô tả về thế giới nhưng
chúng thêm một lớp phối cảnh để phục vụ nhu cầu ứng dụng cụ thể của người dùng. Các bản thể luận hiện thực cho
phép tích hợp dữ liệu trên toàn doanh nghiệp bằng cách loại bỏ lớp phối cảnh này khỏi từng nguồn dữ liệu có liên
quan và do đó đi đến một mô tả về miền có thể đóng vai trò là điểm chuẩn cho sự tích hợp của chúng.

Việc áp dụng phương pháp hiện thực bản thể luận cũng góp phần cải thiện công tác quản trị. Để một bản thể học
tuân thủ cách tiếp cận hiện thực, tất cả các khẳng định của nó phải đúng với thế giới; nếu họ không

5
họ phải được sửa chữa để được như vậy. Sử dụng thế giới làm cơ sở để xác định tính đúng đắn của một
ontology cung cấp một phương pháp luận rõ ràng để phân xử các tranh chấp và cải tiến liên tục nội dung
của ontology; đây là một lợi ích quan trọng cho việc quản lý lâu dài.

Nguyên tắc thiết kế


Các ràng buộc được mô tả ở trên, rằng cú pháp RDF/XML của OWL nên được sử dụng để trao đổi các bản thể luận, rằng
chúng sử dụng BFO làm bản thể luận cấp cao nhất của chúng và rằng chúng được mô hình hóa theo nguyên tắc hiện thực
bản thể học là điểm khởi đầu để xây dựng ontology chất lượng cao. Trong phần này, chúng tôi đưa ra hướng dẫn về cách
thiết kế một mạng lưới các bản thể luận bao gồm nội dung của một doanh nghiệp dữ liệu và có thể mở rộng khi cần thiết để
thích ứng với những thay đổi và tăng trưởng không thể tránh khỏi của doanh nghiệp đó.

Phương pháp tiếp cận kiến trúc đa tầng


Các bản thể luận có thể cho phép khả năng tương tác ngữ nghĩa giữa các nguồn dữ liệu không đồng nhất miễn là chúng
được xây dựng theo một kiến trúc bản thể học chặt chẽ. Một kiến trúc như vậy dựa trên cấu trúc đồ thị bên trong của các
bản thể luận trong đó các nút đại diện cho các loại trong thực tế và các cạnh đại diện cho các mối quan hệ giữa các loại này
(được gọi theo tiêu chuẩn là 'thuộc tính đối tượng' trong tài liệu công nghệ ngữ nghĩa). Tất cả các bản thể luận bao gồm
một hoặc nhiều hệ thống phân cấp xương sống trung tâm trong đó mối quan hệ của kiểu con (còn gọi là is_a) kết nối các
nút. Mỗi hệ thống phân cấp xương sống có một nút gốc duy nhất.

Cấu trúc bên trong này cho phép xây dựng các bản thể luận để tạo ra một mạng nhiều tầng
được kết nối theo các cách sau:

• Một ontology cấp cao nhất, nhỏ, trung lập về miền


• Các ontology cấp trung bao gồm các miền rộng có các nút gốc là con trực tiếp của các lớp từ
ontology cấp cao nhất hoặc của một thuật ngữ được rút ra từ một ontology cấp trung khác trong
mạng
• Các ontology mức thấp hơn đại diện cho các miền chuyên biệt có các nút gốc hoặc là con trực tiếp của
các lớp từ một trong các ontology mức trung bình hoặc của một thuật ngữ được rút ra từ ontology
mức miền khác trong mạng.

Về việc lựa chọn ontology cấp cao nhất, ba lựa chọn thay thế cho BFO đã đạt được một số điều sau: Ontology miền
cho kỹ thuật ngôn ngữ và nhận thức (DOLCE), Ontology trên CyC và Ontology được hợp nhất trên được đề xuất
(SUMO). Trong số này, chỉ BFO và DOLCE có thể tuyên bố là bản thể luận cấp cao nhất thực sự. Như đã mô tả ở trên,
chúng tôi khuyên dùng BFO và với những lý do được trích dẫn, chúng tôi thêm rằng trong số các lựa chọn thay thế,
nó có số lượng người dùng lớn nhất (http://www.ifomis.org/bfo/users ), phần tài liệu người dùng lớn nhất (http://
www.ifomis.org/bfo) và diễn đàn cộng đồng người dùng tích cực nhất
(http://groups.google.com/group/bfo-discuss?pli=1 ). Trên tất cả, BFO là ontology cấp cao nhất được sử dụng lại
rộng rãi nhất và tích cực nhất cho mục đích tạo các bộ mô-đun ontology có thể tương tác với nhau.

Sự phát triển của ontology cấp trung tiến hành bằng cách mở rộng xuống từ ontology cấp cao nhất. Điều này có nghĩa là các
ontology mức trung bình bao gồm các thuật ngữ được tổ chức theo hệ thống phân cấp lớp con chặt chẽ bắt đầu từ nhiều
hơn và tiến tới ít tổng quát hơn; hoặc trong một hệ thống phân cấp như vậy hoặc trong nhiều hệ thống phân cấp riêng biệt
đại diện cho nhiều trục phân loại (chẳng hạn như đối tượng, thuộc tính, quy trình). Mỗi như vậy

6
hệ thống phân cấp có chính xác một nút gốc, đại diện cho loại bao gồm nhiều nhất trong miền có liên quan dọc theo trục
này hoặc trục khác.

Các ontology mức trung bình phục vụ hai mục đích. Đầu tiên, chúng chứa các thuật ngữ mô tả các thực thể được nhiều
người, nếu không muốn nói là tất cả, các nhóm trong hệ thống thông tin doanh nghiệp quan tâm. Thứ hai, chúng cung cấp
một phương tiện để các nhà phát triển ontology mức thấp hơn có thể kết hợp công việc của họ vào kiến trúc ngữ nghĩa
chung – các nút gốc cho mỗi ontology mức thấp hơn là các thuật ngữ hiện có trong ontology mức trung bình thích hợp.
Tương tự như vai trò của ontology mức cao nhất trong việc cung cấp điểm khởi đầu cho các định nghĩa của các thuật ngữ
trong ontology mức trung bình, do đó ontology mức trung bình cung cấp điểm khởi đầu cho các định nghĩa ở mức thấp
hơn, do đó giúp đảm bảo tính nhất quán của sự phát triển ontology mức thấp hơn. Sự phát triển của ontology mức thấp
giúp thúc đẩy sự phát triển ontology mức trung bình, vì các nhu cầu thuật ngữ được xác định ở mức thấp hơn trong một số
trường hợp sẽ cần được đáp ứng bằng cách thêm nội dung vào các bản thể luận mức trung bình, có thể đóng vai trò là
điểm khởi đầu cho dân số đi xuống. Bằng cách này, chúng tôi đảm bảo sự phù hợp gia tăng của các ontology mức thấp hơn
và các ontology mức trung bình đối với kiến trúc chung.

Một ontology mức thấp hơn là một biểu diễn cụ thể tối đa của các thực thể trong một miền duy nhất và do đó giải
quyết nhu cầu thông tin của các nhóm người dùng cụ thể, những người yêu cầu tập hợp các nhóm thuật ngữ cụ
thể trong một ontology. Phạm vi của ontology mức thấp hơn có thể là một hoặc nhiều chiều. Ví dụ về những thứ
trước đây là những thứ giới hạn trong nội dung có trong các nguồn có thẩm quyền, chẳng hạn như Mã nghề
nghiệp ISCO-08
(http://www.ilo.org/public/english/bureau/stat/isco/isco08/), Danh sách Chất độc và Tác nhân Chọn lọc của
NSAR (http://www.selectagents.gov/SelectAgentsandToxinsList.html) và các tài liệu liên quan tài nguyên dữ liệu
dạng danh sách, một chiều tuân theo DoD 8320.2: Nguồn có thẩm quyền. Ví dụ về cái sau là Bản thể học Môi
trường (//bioportal.bioontology.org/ontology/ENVO) hoặc Bản thể học bệnh thần kinh (//
www.ncbi.nlm.nih.gov/pubmed/24314207).

7
Hình 2: Các Ontology cấp cao nhất, cấp trung bình và cấp thấp hơn trong OBO Foundry

Mô-đun nội dung


Hãy xem xét nhiệm vụ mô tả một lĩnh vực rộng lớn chẳng hạn như nông nghiệp. Trong số các lựa chọn
được thực hiện trong quá trình hoàn thành nhiệm vụ sẽ là việc tạo một ontology cấp trung bình lớn duy
nhất hay tạo nhiều ontology nhỏ hơn mà sau đó được kết hợp để cung cấp phạm vi bao trùm của toàn
bộ miền. Các ontology nguyên khối rất lớn mô tả toàn bộ một miền lớn và đa dạng có những nhược
điểm đáng kể. Khi được kết hợp trong một mạng, việc tìm kiếm thông tin trên nhiều ontology lớn là rất
khó, vì chúng sẽ có nhiều phần tử chung. Bản thể luận nông nghiệp danh nghĩa sẽ chia sẻ rất nhiều nội
dung với các bản thể luận khác trong mạng bao gồm các phân đoạn khác của nền kinh tế như nguyên
liệu thô, bán lẻ, sản xuất, chuỗi cung ứng, v.v. Sự trùng lặp nội dung này dẫn đến hậu quả không mong
muốn là việc tìm kiếm tất cả thông tin về một chủ đề đơn lẻ trước tiên sẽ yêu cầu tìm kiếm bên trong mỗi
ontology xem chúng có chứa chủ đề đó hay không và nếu có thì nó được thể hiện như thế nào. Các
ontology lớn cũng khó sửa đổi do số lượng lớn các liên kết giữa các phần tử cần được thay đổi do một lần
thêm hoặc xóa. Họ cũng khó quản lý vì số lượng lớn các bên liên quan trong miền.

Vì những thiếu sót này, chúng tôi khuyên bạn nên phát triển các ontology plug and play nhỏ hơn để thay thế cho các
ontology lớn. Để tạo thuận lợi cho việc thực hiện lời khuyên này, chúng tôi đưa ra các nguyên tắc giới hạn phạm vi theo chiều
ngang của nội dung này. Việc phân chia các ontology thành các mức cao nhất, trung bình và thấp hơn là sự phân chia dọc
theo trục tổng quát – nội dung của các ontology mức cao nhất làtổng quát hơnso với các ontology ở mức thấp hơn. Việc
khoanh vùng phạm vi theo chiều ngang của các ontology yêu cầu các hướng dẫn cho việc phân chia các ontology dọc theo
trục nội dung.

Nhớ lại từ phần Phương pháp tiếp cận kiến trúc đa tầng ở trên rằng các ontology mức trung bình sẽ
bao gồm các phân cấp lớp con có gốc là một phần tử từ ontology mức cao nhất hoặc một

số 8
phần tử được rút ra từ một ontology mức trung bình khác. Việc diễn đạt lại điều này dẫn đến hướng dẫn đầu tiên
để phân định phạm vi nội dung của ontology mức trung bình: Miền của ontology mức trung bình phải được biểu
thị dưới dạng một lớp đơn lẻ hoặc dưới dạng một câu lệnh bao gồm các lớp và một thuộc tính đối tượng bên trong
đó. bản thể học. Hơn nữa, lớp đó hoặc các lớp đó phải ở cấp gốc của bản thể luận. Phần nội dung còn lại của
ontology mức trung bình là những thuật ngữ và quan hệ mô tả đầy đủ các thực thể của chủ thể đó. Chúng tôi tận
dụng nội dung của bản thể luận cấp cao nhất để xây dựng các hướng dẫn của nhiệm vụ này. Ví dụ về một ontology
cấp trung bình của các tạo tác sẽ được sử dụng để tạo thuận lợi cho cuộc thảo luận.

Theo hướng dẫn đầu tiên trong việc tạo một ontology tạo tác, sẽ có một lớp có tên là “Tạo tác” trong
ontology. Nhiệm vụ là thêm nội dung vào ontology để nó có thể mô tả các tạo tác mà không trở nên quá lớn
và khó sử dụng. BFO cung cấp một danh sách kiểm tra ngắn gọn về những thứ mà một hiện vật có thể liên
quan. Chỉ sử dụng các nút lá của hệ thống phân cấp BFO liên tục và xảy ra và bỏ qua các loại phụ của các lớp
ranh giới fiat liên tục, vùng không gian và vùng thời gian để lại 17 loại sự vật (các mục được in đậm trong
Bảng 1) mà một vật phẩm (hoặc bất kỳ thứ gì khác) ) có thể liên quan.

tiếp tục
liên tục độc lập
thực thể vật chất

đối tượng fiat

tổng hợp đối tượng

Sự vật
thực thể phi vật chất

vùng không gian

Địa điểm

ranh giới fiat liên tục


liên tục phụ thuộc cụ thể
thực thể có thể thực hiện được

bố trí
chức năng

Vai trò

chất lượng

chất lượng quan hệ

liên tục phụ thuộc tổng quát


xảy ra
vùng thái dương
vùng không gian thời gian

quá trình

hồ sơ quy trình
lịch sử
ranh giới quá trình
Bảng 1

9
Một vài ví dụ có thể giúp minh họa hướng dẫn trong hành động. Các phần tiếp theo phụ thuộc chung (GDC) là
những thực thể có thể được chuyển từ thực thể này sang thực thể khác trong khi vẫn giữ nguyên danh tính của
chúng. Thông tin vẫn giữ nguyên trong khi được chuyển từ phương tiện này sang phương tiện khác và đó là trường
hợp điển hình của GDC. Vì vậy, việc xác định phạm vi của Artifact Ontology bao gồm việc trả lời câu hỏi: “Loại thông
tin nào, nếu có, có liên quan đến các tạo phẩm?”. Các câu trả lời hợp lý sẽ là các thông số kỹ thuật tạo tác như bản
thiết kế, số nhận dạng như tên và số sê-ri và mô tả như báo cáo thử nghiệm và phép đo. Tiếp tục phương pháp sẽ
dẫn đến việc xác định rằng các thành phần tạo tác liên quan đến các lớp BFO của Đối tượng và Tập hợp đối tượng
thông qua việc chúng được cấu thành và cấu thành bởi các hệ thống, hệ thống con, thành phần và bộ phận. Đồ tạo
tác có các Đặc tính như Kích thước, Khối lượng, Hình dạng và Màu sắc cũng như Bố trí như Độ bền kéo và các Chức
năng như Bay và Chất hoạt động bề mặt. Các Quy trình liên quan đến Đồ tạo tác không chỉ là những quy trình sử
dụng đồ tạo tác mà còn là những quy trình thiết kế, sản xuất, thử nghiệm và bảo trì chúng.

Phải có một ràng buộc về kỹ thuật này để làm cho nó hiệu quả. Như đã nêu hiện tại, nó sẽ dẫn đến vô số thực
thể được bao gồm trong phạm vi của một bản thể luận. Một ràng buộc là chỉ bao gồm những thực thể liên
quan đến loại gốc và không bao gồm các loại khác. Ví dụ: khi xác định có hay không đưa một chất lượng nhất
định vào Bản thể học nhân tạo, hãy trả lời câu hỏi liệu chất lượng đó có áp dụng được cho các loại thực thể
khác hay không. Các đặc tính như khối lượng, hình dạng, màu sắc, chiều dài và kết cấu có thể áp dụng cho bất
kỳ đối tượng vật chất nào và do đó không thuộc về Bản thể học tạo tác. Tiếp tục bằng cách lọc ra khỏi những
thực thể chỉ áp dụng cho nút gốc, những thực thể không áp dụng cho một số lượng lớn các kiểu con của nó.
Như một ví dụ, một chất lượng chẳng hạn như tầm cỡ không phải là thành viên của Bản thể tạo tác phẩm vì nó
không có phạm vi đủ rộng trong miền tạo tác. Thay vào đó, nó sẽ nằm trong một bản thể học miền của các đồ
tạo tác mà nó được áp dụng rộng rãi.

Tóm tắt các cuộc thảo luận trước đây dẫn đến hướng dẫn thứ hai để xác định phạm vi của ontology mức trung bình: Bao
gồm tất cả các kiểu con của các lớp của ontology mức cao nhất chỉ liên quan đến lớp gốc hoặc các lớp của ontology mức
trung bình và có thể áp dụng cho một tỷ lệ phần trăm đáng kể của các trường hợp của nó.

Theo hướng dẫn này, các ví dụ về miền bản thể học cấp trung bình là: thực thể thông tin, chất lượng, vùng không
gian địa lý, vùng thời gian, tác nhân và sự kiện. Tóm lại, hướng dẫn là phạm vi của một ontology mức trung bình nên
bao gồm tất cả các thuật ngữ và quan hệ cần thiết để mô tả – phân định phạm vi của – miền chứ không phải mọi
thuật ngữ và quan hệ kiểu con. Về số lượng kiểu con cần bao gồm, chúng tôi đưa ra quy tắc ngón tay cái rằng không
nên bao gồm quá ba cấp độ kiểu con cho bất kỳ một trong các thuật ngữ hoặc quan hệ chung nào.

Nguyên tắc về phạm vi đối với các ontology mức thấp hơn ('miền') về cơ bản giống như đối với các ontology mức
trung bình. Thuật ngữ gốc của ontology mức thấp hơn nên hoặc là một lớp con trực tiếp của một thuật ngữ từ
ontology cấp trung bình hoặc là một phần tử được rút ra từ một số ontology cấp thấp hơn đã tồn tại. Khi phát triển
các bản thể luận cấp thấp hơn theo hướng dẫn này, chúng trở thành các mô tả về các loại thực thể đặc trưng của
miền liên quan. Ví dụ về các lĩnh vực cho các bản thể luận như vậy bao gồm: nghề nghiệp, dân tộc, đặc điểm địa lý,
đặc điểm thủy văn, hành vi tội phạm, hành vi chính phủ, chức năng tạo tác, tàu thủy và cảm biến.

10
nguyên tắc phát triển
Trong phần này, chúng tôi đưa ra hướng dẫn về cách thực hiện một số nhiệm vụ là một phần của việc tạo phiên bản
OWL của một ontology.

Tính nhất quán


Một ontology nhất quán khi và chỉ khi mọi lớp được biểu thị bằng các thuật ngữ của nó đều có thể có các thể hiện. Ở
dạng đơn giản nhất, một bản thể luận không nhất quán sẽ định nghĩa một lớp sao cho bất kỳ trường hợp nào cũng
cần phải có một tập hợp các đặc điểm không tương thích, X và không phải X. Tất nhiên, các bản thể luận không nhất
quán không được xây dựng một cách có chủ ý. Thông thường, chúng là kết quả của sự giám sát gây ra bởi sự phức
tạp vốn có trong việc chính thức hóa một số lĩnh vực. Khi số lượng thuật ngữ, biểu thức quan hệ và tiên đề trong một
bản thể luận tăng lên, thì khả năng đưa ra sự không nhất quán cũng tăng theo. Khả năng này càng tăng lên khi số
lượng ontology trong doanh nghiệp tăng lên, khi các nhà phát triển ontology được cung cấp nhu cầu và cơ hội để
nhập các thuật ngữ từ nhiều nguồn.

Để kiểm tra tính nhất quán của một ontology, có sẵn một số bộ lập luận tự động có thể lần theo tất cả các mối quan hệ
trong ontology và phát hiện bất kỳ sự không nhất quán nào. Phần lớn những người lập luận này có khả năng thực hiện các
bài kiểm tra tính nhất quán trên các bản thể luận được viết bằng phương ngữ DL của Ngôn ngữ bản thể học web (OWL) của
OWL (OWL 2 DL).

Nguyên tắc kế thừa duy nhất


Nguyên tắc kế thừa đơn quy định rằng mỗi lớp ontology phải là một lớp con của một và chỉ một lớp ontology. Chuỗi
kết quả của sự thừa kế duy nhất hình thành cái được gọi là phân loại được khẳng định. Việc tuân thủ nguyên tắc này
đảm bảo rằng mọi thứ nắm giữ một thuật ngữ cha mẹ cũng nắm giữ (được kế thừa bởi) tất cả các thuật ngữ con
cháu ở các cấp thấp hơn. Điều này có nghĩa là mỗi nguyên tắc phân loại được xác nhận có một nút gốc duy nhất và
mọi bản thể học sẽ chứa một hoặc nhiều nguyên tắc phân loại được xác nhận là các phần thích hợp. Tất cả các điều
khoản không gốc sẽ có chính xác mộtlà mộtcha mẹ và do đó được kết nối bởi chính xác một chuỗilà một quan hệ với
gốc tương ứng.

Nguyên tắc này không cấm sử dụng tiên đề lớp con hoặc lớp tương đương, theo đó một lớp được định nghĩa là
lớp con hoặc lớp tương đương của lớp ẩn danh. Ngôn ngữ OWL cung cấp phương tiện để diễn đạt sự thật về
các thực thể bằng cách sử dụng các mối quan hệ với các thực thể khác. Ví dụ: một dữ kiện chẳng hạn như “Ô tô
has_part some Engine” sử dụnghas_partquan hệ để liên kết mỗi ô tô với ít nhất một động cơ. Ngữ nghĩa của
thực tế này là Ô tô đã được tạo thành một lớp con của lớp ẩn danh "thứ có ít nhất một động cơ là một phần".
Lớp này là ẩn danh vì nó không phải là một phần của phân loại đã được khẳng định. Tập hợp các tiên đề của
lớp con và lớp tương đương tạo thànhphân loại suy luậncủa một ontology. Trong phân loại được suy luận này,
các lớp ẩn danh trước đây trở nên rõ ràng và nguyên tắc thừa kế duy nhất không còn hiệu lực. Để biết thêm chi
tiết, xem: (Smith & Ceusters, 2010)

Các định nghĩa


Mỗi lớp trong một ontology (không phải lớp gốc) phải được cung cấp một định nghĩa liên quan mà con người có thể
đọc được. Theo tiêu chuẩn, đạt được sự liên kết này là bằng cách thêm các thuộc tính chú thích, là phương tiện để
liên kết siêu dữ liệu với các phần tử bản thể luận. Mặc dù việc sử dụng thuộc tính chú thích RDFS 'nhận xét' được
chấp nhận, nhưng tốt hơn là nên tạo một thuộc tính chú thích mới cho mục đích này một cách rõ ràng.

11
Các định nghĩa mà con người có thể đọc được của các lớp (thuật ngữ) được yêu cầu phải luôn ở dạng hai phần:

MỘTS=chắc chắn Mộtgcái màĐ.S

trong đó 'S' (đối với: loài) là thuật ngữ được định nghĩa, 'G' (đối với: chi) là thuật ngữ gốc trực tiếp của 'S' trong bản thể học
liên quan và 'D' (đối với: khác biệt) cung cấp loài -tiêu chuẩn; nghĩa là, nó xác định điều gì về một số G nhất định khiến
chúng trở thành S. Khi các bản thể luận phát triển, người ta mong đợi rằng các định nghĩa mà con người có thể đọc được sẽ
được dịch thành các tiên đề của lớp con hoặc lớp tương đương như được mô tả ở trên trong phần về kế thừa đơn lẻ.

Ví dụ:

- Sự kiện tự nhiên =def. một quá trình không phải do bất kỳ hành động nào của con người gây ra

- Sự kiện địa lý = def. một sự kiện tự nhiên có ảnh hưởng đến một số đặc điểm địa lý

- Lở đất = def. một sự kiện địa lý trong đó có sự sụt giảm nhanh chóng của đất hoặc đá
xuống sườn núi

Khi ngày càng có nhiều thuật ngữ cụ thể được định nghĩa thông qua việc bổ sung các điểm khác biệt ngày càng
chi tiết hơn, các định nghĩa của chúng gói gọn thông tin liên quan đến các liên kết cha-con kết nối từng loại hoàn
toàn trở lại gốc tương ứng. Đồng thời, nhiệm vụ xây dựng các định nghĩa đóng vai trò kiểm tra tính đúng đắn của
các hệ thống phân cấp cấu thành trong các bản thể luận này.

Việc sử dụng cấu trúc định nghĩa hai phần giúp đảm bảo rằng các định nghĩa không vòng vo (khi thuật ngữ
được định nghĩa xuất hiện trong định nghĩa của chính nó) và do đó chúng truyền đạt thông tin có giá trị cho
người dùng – phù hợp với nguyên tắc định nghĩa chỉ nên sử dụng các thuật ngữ dễ hiểu hơn thuật ngữ được
định nghĩa.

Các định nghĩa cũng được yêu cầu đối với các thuộc tính đối tượng (không phải gốc) và hai thuộc tính này phải được xác định càng nhiều càng tốt bằng

cách sử dụng quy tắc hai phần.

Giữ nguyên ý nghĩa của các thuật ngữ Ontology cấp cao hơn
Sử dụng lại các thuật ngữ từ các ontology khác là một nguyên tắc cơ bản của các thực tiễn tốt
nhất được tán thành ở đây, vì nó góp phần vào khả năng tương tác của các mô-đun ontology
và do đó cũng của các hệ thống thông tin mà các mô-đun này hỗ trợ. Tuy nhiên, nếu không
được thực hiện cẩn thận, việc sử dụng lại các thuật ngữ có thể dẫn đến nguy cơ làm thay đổi ý
nghĩa của thuật ngữ được sử dụng lại. Cách phổ biến nhất mà loại vấn đề này xảy ra là khi một
ontology sử dụng lại một thuật ngữ từ ontology cấp cao hơn nhưng thêm vào nội dung của nó
thông qua việc bổ sung một tiên đề. Một ví dụ là sử dụng lại thuật ngữ Tổ chức quân sự nhưng
thêm một tiên đề khẳng định rằng mọi tổ chức như vậy đều có chính xác một người lãnh đạo.
Để phù hợp, người tạo bản thể luận cấp thấp hơn nên yêu cầu người quản lý bản thể luận cấp
cao hơn thêm tiên đề,

12
Hướng dẫn từng bước để phát triển Ontology

sơ bộ
1. Lập nhóm. Đảm bảo rằng nhóm của bạn bao gồm cả SMES quen thuộc với cả chủ đề (các thực thể trong
miền của bạn) và dữ liệu (các tài nguyên thông tin mà bản thể luận sẽ được sử dụng để tích hợp và phân
tích cũng như để có thể khám phá được).
2. Đảm bảo rằng nhóm của bạn bao gồm những người có kinh nghiệm xây dựng ontology. (Cơ sở với
phần mềm bản thể học không ngụ ý khả năng tạo bản thể luận.)
3. Xác định các nhiệm vụ chính mà bản thể luận của bạn sẽ được thiết kế để thực hiện.

4. Xác định miền của bản thể luận của bạn – các loại đối tượng, thuộc tính và quy trình mà
bản thể luận sẽ cần đại diện.
5. Xác định các phần chính của dữ liệu mà bản thể luận của bạn sẽ được sử dụng để chú thích.

6. Lưu ý rằng mục tiêu của bạn là tối đa hóa khả năng của ontology để giải quyết các nhiệm
vụ chính nàynhưng không gây hại chokhả năng của nó để giải quyết việc sử dụng thứ
cấp chưa được xác định. (Kinh nghiệm cho thấy rằng việc sử dụng thứ cấp thường quan
trọng hơn nhiều so với việc sử dụng chính và việc sử dụng thứ cấp hầu như luôn đảm
bảo giá trị lâu dài của một ontology.) các thuật ngữ và định nghĩa trong bản thể luận
của bạn có thể hiểu được và có giá trị rộng rãi (chứ không phải chỉ những cộng tác viên
trực tiếp của bạn mới hiểu được và có giá trị và chỉ khi được sử dụng liên quan đến dữ
liệu hiện có của bạn).

Tập hợp và chọn thuật ngữ


7. Xác định và đánh giá các ontology hiện có với các miền chồng chéo. Tái sử dụng càng nhiều càng tốt nội dung
ontology đáp ứng các nguyên tắc được nêu trong hướng dẫn này.
8. Tạo một danh sách nháp các thuật ngữ bao gồm miền của bạn (ví dụ: 100 thuật ngữ được sử dụng phổ biến nhất
trong các nguồn dữ liệu có thẩm quyền hoặc ấn phẩm giáo lý).
9. Thực hiện theo nguyên tắc theo đó mỗi thuật ngữ 'A' trong danh sách này là cách viết tắt của một thuật ngữ có dạng
'loại A'.) Điều này có nghĩa là danh sách sẽ chỉ chứa các danh từ chung (chẳng hạn như 'vũ khí' hoặc ' xây dựng').

10. Cố gắng đảm bảo sự đồng thuận tối đa với SME và cách sử dụng học thuyết.
11. Xác định các lĩnh vực chồng chéo về nguyên tắc nơi việc sử dụng thuật ngữ không nhất quán và cung cấp các từ đồng

nghĩa nơi các cộng đồng nhỏ SME sử dụng các thuật ngữ thay thế.

12. Tránh các thuật ngữ đại trà (như 'xác thịt', 'nhiên liệu', 'thông tin'...); luôn luôn sử dụng ở vị trí của chúng một
thuật ngữ đếm tương đương thích hợp (có nghĩa là một thuật ngữ có thể đứng trước 'a' và có dạng số nhiều
như trong: 'phần thịt', 'lượng nhiên liệu', 'tạo tác thông tin'.

Tránh các lỗi bản thể tiêu chuẩn


13. Không nhầm lẫn giữa tạo tác thông tin với thực tế mà chúng biểu thị - Phân biệt rõ ràng
giữa từng thực thể thực và thông tin về nó. Tránh nhầm lẫn ví dụ: 'education' và
'education record' hoặc 'việc làm' và 'việc làm'.
14. Giữ lời nói và sự vật tách biệt. – Không nhầm lẫn một thực thể với tên hoặc định danh của nó.

13
15. Đừng nhầm lẫn thực tế với kiến thức của chúng tôi về thực tế- Tránh các thuật ngữ như 'kẻ khủng bố không xác định', 'kẻ khủng

bố đã biết', 'người tham gia không được phân loại', 'người tham gia không được chỉ định khác'. Mô tả những gì tồn tại (những loại

sự vật tồn tại) trong thực tế, chứ không phải những gì đã biết về những gì tồn tại trong thực tế.

Định dạng và tinh chỉnh thuật ngữ của bạn


16. Tất cả các thuật ngữ trong bản thể luận của bạn phải là danh từ và cụm danh từ có số ít. Một lần nữa,
điều này tuân theo quy tắc theo đó mỗi thuật ngữ 'A' trong bản thể luận nên được xem như là cách
viết tắt của một thuật ngữ có dạng 'loại A'.
17. Sử dụng ít từ viết tắt và nếu có, chỉ sử dụng khi chúng là một phần của diễn ngôn thông thường (HQ, IED, WMD).
Các từ viết tắt phù hợp với bản thể luận hoặc thói quen ghi dữ liệu cục bộ nên được ghi lại trong bản thể luận
dưới dạng từ đồng nghĩa.
18. Tránh viết tắt và dấu chấm lửng ngay cả khi ngữ cảnh rõ ràng nghĩa của chúng. Để tối đa hóa việc sử
dụng thứ cấp các thuật ngữ bản thể học của bạn phải có ý nghĩa độc lập với ngữ cảnh.
19. Đảm bảo tính thống nhất của thuật ngữ và biểu thức quan hệ – nghĩa là đảm bảo rằng mỗi thuật ngữ
và mỗi biểu thức quan hệ đều có nghĩa giống nhau trong từng trường hợp sử dụng trong khuôn khổ
ontology.
20. Không sử dụng các thuật ngữ tiêu cực. Không có loại nào là 'không khủng bố', vì bản thân các phần bổ sung của các loại

không phải là loại. Các thuật ngữ như 'không phải động vật có vú', 'không có màng', 'phương tiện hoặc người' không chỉ

định các loại trong thực tế. Tránh các thuật ngữ liên quan đến bổ nghĩa thời gian và không gian. Không bao gồm trong

thuật ngữ các từ ngụ ý hạn chế về thời gian hoặc không gian, ví dụ: 'hiện tại', 'trước đó', 'cục bộ', …

21. Không sử dụng thuật ngữ liên từ hoặc liên từ. Không có loại nào trong thực tếđộng vật có vú hoặc violon; không có
loại trong thực tếquả táo và quả cầu.Thay vào đó, có những loạiđộng vật có vú,đàn vi ô lông,quả táoVà quả cầu.

22. Tránh sử dụng các cách diễn đạt sửa đổi (chẳng hạn như 'đã hủy bỏ', 'vắng mặt' hoặc 'giả mạo') làm mất đi ý
nghĩa của thuật ngữ đã sửa đổi.
23. Nguyên tắc gắn kết thuật ngữ - Đối với bất kỳ biểu thức 'E' nào trong một bản thể luận, 'E' có nghĩa là E. (Quy tắc về
tính nhất thể tuân theo ngay từ nguyên tắc này.) Nguyên tắc này thường được coi là tầm thường và vì lý do chính
đáng. hạn chế đối với tất cả việc sử dụng ngôn ngữ hợp lý; nhưng để biết các ví dụ về vi phạm, hãy xem (Smith,
2006).

Tạo một hệ thống phân cấp

24. Sắp xếp các điều khoản của bạn để tạo thành một xương sốnglà mộtphân cấp, theo đó mỗi nút ở cấp thấp
hơn cấp gốc được kết nối bởi mộtlà mộtliên kết đến nút cha của nó. Do đó, mỗi nút cha tổng quát hơn các
nút con của nó. Điều này có nghĩa là bản thể luận của bạn nên được xây dựng để đảm bảo tính kế thừa đơn
lẻ.
25. Khẳng định mộtlà mộtquan hệ – Alà mộtB - chỉ khi nó có ý nghĩa để khẳng định rằng mọi trường hợp
của loạiMỘTlà một thể hiện của loạib.
26. Hệ thống phân cấp nên đượclà mộthoàn chỉnh theo nghĩa là mỗi thuật ngữ trong bản thể luận được kết nối thông qua một chuỗi

duy nhấtlà mộtliên kết đến nút gốc có liên quan. Thêm các điều khoản bổ sung để lấp đầy khoảng trống trong chuỗi này. Tất cả

các điều khoản trong phân loại sau đó sẽ được truy xuất nguồn gốc thông qualà mộtquan hệ với nút gốc ontology có liên quan.

14
27. Hệ thống phân cấp nên đượclà mộtcũng hoàn thành theo nghĩa là mỗi thuật ngữ con trong bản thể luận - có
nghĩa là mỗi thành phần của các thuật ngữ tổng hợp - phải được kết nối tương tự theo cách này với một nút
gốc có liên quan (có thể là một nút của bản thể luận này hoặc nếu một số bản thể luận bổ sung được xác
định ). (Các thuật ngữ tổng hợp là ví dụ về các dạng: 'Akhông cóBAvới B'.)

28. Tránh 'khác' - Không tạo các thuật ngữ như 'khủng bố khác', 'vũ khí khác',…
29. Cả nhà phát triển và người dùng của một ontology nên tôn trọng giả định thế giới mở, điều đó có nghĩa là
ontology không hàm ý khẳng định rằng nó hoàn thành (và không khẳng định rằng bất kỳ danh sách các
thuật ngữ con nào dưới cha mẹ 'A' là một danh sách đầy đủ các kiểu con của A).

Nguyên tắc định nghĩa


30. Cung cấp tất cả các thuật ngữ không phải từ gốc cùng với định nghĩa

31. Thực hiện theo chiến lược định nghĩa của Aristotle, theo đó mỗi định nghĩa có dạng 'A
=def. a B which Cs', trong đó B là số hạng cha của A trong ontology, và C làphân biệtđánh
dấu những B đó là As.
32. Sử dụng các tính năng thiết yếu trong việc xác định các thuật ngữ, điều đó có nghĩa là sự khác biệt C phải đại diện cho

một cái gì đó thiết yếu đối với As.

33. Tránh vòng vo trong việc xác định thuật ngữ.

34. Đảm bảo tính dễ hiểu của các định nghĩa, bằng cách sử dụng các thuật ngữ trong định nghĩa của bạn đơn giản hơn thuật

ngữ bạn đang định nghĩa.

35. Đảm bảo rằng các định nghĩa của bạn không thể đóng gói được, điều đó có nghĩa là nếu một khẳng định liên
quan đến thuật ngữ bản thể học 'A' có ý nghĩa, thì nó vẫn có ý nghĩa khi bạn thay thế 'A' bằng định nghĩa 'A'
của bạn.

15
Thư mục
Arp, RA, Smith, B., & Spear, AA (2015).Xây dựng Ontology với Ontology hình thức cơ bản.Cambrigde,
MA: Nhà xuất bản MIT.

Grenon, P., & Smith, B. (2004). Conrncopia của quan hệ hình thức-bản thể học.Phép biện chứng, 58:3, 279-
296.

Grenon, P., & Smith, B. (Tháng 3 năm 2004). SNAP và SPAN: Hướng tới bản thể học không gian động.không gian
Nhận thức và Tính toán, 4:1, 69-103.

Imam, FT, Larson, SD, Bandrowski, A., Grethe, JS, Gupta, A., & Martone, ME (2012; 3:111).
Phát triển và sử dụng các bản thể luận bên trong Khung thông tin khoa học thần kinh: Một cách tiếp cận thực tế.
Biên giới trong di truyền học.

Smith, B. (2006). Chống lại sự đặc biệt trong phát triển Ontology. Trong B. Bennett, & C. Fellbaum,Chính thức
Ontology trong hệ thống thông tin(trang 15-26). Amsterdam: Báo chí iOS.

Smith, B. (Tháng 11 năm 2007,). Xưởng đúc OBO: Sự phát triển phối hợp của các bản thể luận để hỗ trợ
Tích hợp dữ liệu y sinh.Công nghệ sinh học tự nhiên 25 (11), 1251-1255.

Smith, B., & Ceusters, W. (2010). Chủ nghĩa hiện thực bản thể như một phương pháp luận cho sự tiến hóa phối hợp của

Ontology khoa học.Ontology ứng dụng 5, 139-188.

16

You might also like