Professional Documents
Culture Documents
Nist Ai Rfi Cubrc - Inc - 002.en - VI
Nist Ai Rfi Cubrc - Inc - 002.en - VI
com
___________________________________________________
GIẤY TRẮNG
Thực tiễn tốt nhất về phát triển Ontology
25 Tháng mười, 2016
__________________________________________________
1
Mục lục
Khách quan ................................................. .................................................... .................................................... ..3
Ontology chính thức cơ bản như Ontology cấp cao nhất .......................................... ............................................... 4
Phương pháp tiếp cận kiến trúc đa tầng .................................................. .................................................... ... 6
Giữ nguyên nghĩa của các thuật ngữ Ontology cấp cao hơn ............................................ ......................... 12
Định dạng và tinh chỉnh thuật ngữ của bạn ................................................ .................................................... ...... 14
2
Khách quan
Các bản thể luận nằm trong số các khối xây dựng của các chiến lược web ngữ nghĩa để giải quyết vấn đề ống dẫn dữ liệu.
Một vấn đề phát sinh từ việc tạo các mô hình dữ liệu theo những cách không đồng nhất, không phối hợp và dẫn đến việc
tích hợp và tái sử dụng dữ liệu không thành công. Các bản thể luận, khi được thiết kế và phát triển đúng cách, có thể đảm
bảo tính nhất quán và bền bỉ trong việc sử dụng các thuật ngữ – do đó cũng đảm bảo tính bền vững của ý nghĩa – và do đó
chống lại những hậu quả của sự phát triển và những thay đổi thường xuyên trong cơ sở dữ liệu và phần mềm được sử dụng
để lưu trữ và quản lý dữ liệu.
World Wide Web Consortium (W3C) đã xử phạt các ngôn ngữ để xây dựng bản thể luận
(http://www.w3.org/2001/sw/Specs ), trong đó quan trọng nhất là Web Ontology Language (OWL). Đến
lượt chúng, chúng đã sinh ra phần mềm mã nguồn mở mạnh mẽ
(http://www.w3.org/2001/sw/wiki/Tools ) để phát triển và lập luận với các bản thể luận và để truy vấn các kho dữ liệu
phù hợp với các bản thể luận. Thật không may, bản thân sự phổ biến của công nghệ ngữ nghĩa đã dẫn đến một tình
huống trong đó các ontology hiện đang được tạo ra theo những cách không đồng nhất, không phối hợp với nhau, do
đó dẫn đến một vấn đề mới về ống dẫn ngữ nghĩa, và do đó dẫn đến một thất bại mới trong việc tích hợp và tái sử
dụng dữ liệu. Các thực tiễn tốt nhất được mô tả ở đây chống lại xu hướng này bằng cách cung cấp một tập hợp các
nguyên tắc và quy tắc để dẫn đến sự phát triển của các bản thể luận theo một kiểu nhất quán, không dư thừa.
Hạn chế
Chúng tôi bắt đầu bằng cách mô tả bộ công cụ và phương pháp mô hình hóa để phát triển các bản thể luận. Chúng tôi
phân loại những điều này là các ràng buộc vì chúng nằm ngoài quy trình thiết kế và phát triển nhưng chúng giới hạn các
quy trình đó theo những cách quan trọng.
Việc chúng tôi tuân theo khuyến nghị của W3C liên quan đến việc sử dụng OWL không phải là sự chứng thực cho
ngôn ngữ đó là phù hợp lý tưởng với nhiệm vụ xuất bản các bản thể luận. Thay vào đó, nó là một sự công nhận OWL
là tiêu chuẩn hiện tại và hệ sinh thái các công cụ xung quanh nó làm cho nó trở thành lựa chọn tốt nhất hiện tại. Khi
công nghệ phát triển, các ngôn ngữ khác có thể thay thế vai trò tiêu chuẩn của OWL. Ví dụ: ISO đã xử phạt một ngôn
ngữ bổ sung, Common Logic (CL)
(http://www.iso.org/iso/catalogue_detail.htm?csnumber=39175 ) và việc sử dụng nó để xây dựng
ontology ngày càng tăng (http://stl.mie.utoronto.ca/colore/ontology.html ). CL có sức mạnh biểu cảm
lớn hơn OWL, nhưng thiếu một số tính năng và công cụ tính toán khiến nó kém hấp dẫn hơn OWL.
3
Ontology chính thức cơ bản như Ontology cấp cao nhất
Cácmức độcủa một ontology được xác định bởi mức độ tổng quát của các loại trong thực tế mà nó đại diện. Ví dụ,
đối tượng là một loại rất chung chung; Vật sống và Người là những loại ít chung chung hơn và các loại như Màu mắt
xanh vẫn ít chung chung hơn.
Như sẽ được giải thích đầy đủ hơn trong phần về các nguyên tắc thiết kế bên dưới, chúng tôi đề xuất một kiến
trúc theo tầng của các ontology bắt đầu với một ontology mức cao nhất duy nhất tạo thành cơ sở của tất cả các
ontology khác. Mục đích của ontology mức cao nhất là cung cấp một biểu diễn mức cao, miền trung lập về sự phân
biệt chẳng hạn như giữa các đối tượng và sự kiện, và giữa các đối tượng và thuộc tính của chúng (phẩm chất, vai
trò, v.v.).
chúng tôi đề nghịOntology hình thức cơ bản 2.0 (BFO) là bản thể luận cấp cao nhất (Arp, Smith, & Spear,
2015). BFO là một bản thể luận nhỏ, trừu tượng cao, cấp trên được thiết kế để sử dụngdưới mui xe. Vai trò
của nó là cung cấp một khuôn khổ có thể đóng vai trò là điểm khởi đầu chung để biểu diễn các loại cụ thể hơn
nhằm đảm bảo sự phát triển bản thể luận nhất quán ở các mức thấp hơn theo cách tối đa hóa mức độ tương
tác giữa các bản thể luận được phát triển bởi các nhóm cộng tác khác nhau.
Một lý do cho sự thành công của BFO là nó là một ontology cấp cao nghiêm ngặt. Như vậy, nó là miền trung lập
và không chứa các biểu diễn riêng của nó về các loại thực thể vật lý, hóa học, sinh học, tâm lý, xã hội hoặc các loại
thực thể khác sẽ nằm trong các miền cấp trung bình hoặc cấp thấp hơn. BFO tương ứng là rất nhỏ, với một nhiệm
vụ tập trung hẹp: đó là cung cấp một bản thể luận cấp trên hỗ trợ tích hợp nhiều mô-đun plug and play bản thể
học miền không đồng nhất ở các cấp độ thấp hơn. Hình 1 mô tả một tập hợp các bản thể luận miền dựa trên BFO
mô-đun được tạo ra để mô tả tất cả các khía cạnh của đời sống thực vật
(http://wiki.plantontology.org/index.php/
The_cROP_(Common_Reference_Ontologies_for_Plants)_Initiative).
4
Hình 1: Bộ các mô-đun ontology của CROP Common Reference Ontology for Plants
Phát triển dưới sự ràng buộc của chủ nghĩa hiện thực bản thể định vị các bản thể kết quả là ứng cử viên tốt nhất để
phục vụ như các mô hình chung của tất cả các nguồn dữ liệu trong một hệ sinh thái thông tin phức tạp. Các bản thể
luận hiện thực phục vụ như một đại diện cho một số phần của thế giới, sử dụng các biểu thức đồng thuận càng nhiều
càng tốt (từ ngôn ngữ tự nhiên, bao gồm cả từ vựng khoa học). Các nguồn dữ liệu là những mô tả về thế giới nhưng
chúng thêm một lớp phối cảnh để phục vụ nhu cầu ứng dụng cụ thể của người dùng. Các bản thể luận hiện thực cho
phép tích hợp dữ liệu trên toàn doanh nghiệp bằng cách loại bỏ lớp phối cảnh này khỏi từng nguồn dữ liệu có liên
quan và do đó đi đến một mô tả về miền có thể đóng vai trò là điểm chuẩn cho sự tích hợp của chúng.
Việc áp dụng phương pháp hiện thực bản thể luận cũng góp phần cải thiện công tác quản trị. Để một bản thể học
tuân thủ cách tiếp cận hiện thực, tất cả các khẳng định của nó phải đúng với thế giới; nếu họ không
5
họ phải được sửa chữa để được như vậy. Sử dụng thế giới làm cơ sở để xác định tính đúng đắn của một
ontology cung cấp một phương pháp luận rõ ràng để phân xử các tranh chấp và cải tiến liên tục nội dung
của ontology; đây là một lợi ích quan trọng cho việc quản lý lâu dài.
Cấu trúc bên trong này cho phép xây dựng các bản thể luận để tạo ra một mạng nhiều tầng
được kết nối theo các cách sau:
Về việc lựa chọn ontology cấp cao nhất, ba lựa chọn thay thế cho BFO đã đạt được một số điều sau: Ontology miền
cho kỹ thuật ngôn ngữ và nhận thức (DOLCE), Ontology trên CyC và Ontology được hợp nhất trên được đề xuất
(SUMO). Trong số này, chỉ BFO và DOLCE có thể tuyên bố là bản thể luận cấp cao nhất thực sự. Như đã mô tả ở trên,
chúng tôi khuyên dùng BFO và với những lý do được trích dẫn, chúng tôi thêm rằng trong số các lựa chọn thay thế,
nó có số lượng người dùng lớn nhất (http://www.ifomis.org/bfo/users ), phần tài liệu người dùng lớn nhất (http://
www.ifomis.org/bfo) và diễn đàn cộng đồng người dùng tích cực nhất
(http://groups.google.com/group/bfo-discuss?pli=1 ). Trên tất cả, BFO là ontology cấp cao nhất được sử dụng lại
rộng rãi nhất và tích cực nhất cho mục đích tạo các bộ mô-đun ontology có thể tương tác với nhau.
Sự phát triển của ontology cấp trung tiến hành bằng cách mở rộng xuống từ ontology cấp cao nhất. Điều này có nghĩa là các
ontology mức trung bình bao gồm các thuật ngữ được tổ chức theo hệ thống phân cấp lớp con chặt chẽ bắt đầu từ nhiều
hơn và tiến tới ít tổng quát hơn; hoặc trong một hệ thống phân cấp như vậy hoặc trong nhiều hệ thống phân cấp riêng biệt
đại diện cho nhiều trục phân loại (chẳng hạn như đối tượng, thuộc tính, quy trình). Mỗi như vậy
6
hệ thống phân cấp có chính xác một nút gốc, đại diện cho loại bao gồm nhiều nhất trong miền có liên quan dọc theo trục
này hoặc trục khác.
Các ontology mức trung bình phục vụ hai mục đích. Đầu tiên, chúng chứa các thuật ngữ mô tả các thực thể được nhiều
người, nếu không muốn nói là tất cả, các nhóm trong hệ thống thông tin doanh nghiệp quan tâm. Thứ hai, chúng cung cấp
một phương tiện để các nhà phát triển ontology mức thấp hơn có thể kết hợp công việc của họ vào kiến trúc ngữ nghĩa
chung – các nút gốc cho mỗi ontology mức thấp hơn là các thuật ngữ hiện có trong ontology mức trung bình thích hợp.
Tương tự như vai trò của ontology mức cao nhất trong việc cung cấp điểm khởi đầu cho các định nghĩa của các thuật ngữ
trong ontology mức trung bình, do đó ontology mức trung bình cung cấp điểm khởi đầu cho các định nghĩa ở mức thấp
hơn, do đó giúp đảm bảo tính nhất quán của sự phát triển ontology mức thấp hơn. Sự phát triển của ontology mức thấp
giúp thúc đẩy sự phát triển ontology mức trung bình, vì các nhu cầu thuật ngữ được xác định ở mức thấp hơn trong một số
trường hợp sẽ cần được đáp ứng bằng cách thêm nội dung vào các bản thể luận mức trung bình, có thể đóng vai trò là
điểm khởi đầu cho dân số đi xuống. Bằng cách này, chúng tôi đảm bảo sự phù hợp gia tăng của các ontology mức thấp hơn
và các ontology mức trung bình đối với kiến trúc chung.
Một ontology mức thấp hơn là một biểu diễn cụ thể tối đa của các thực thể trong một miền duy nhất và do đó giải
quyết nhu cầu thông tin của các nhóm người dùng cụ thể, những người yêu cầu tập hợp các nhóm thuật ngữ cụ
thể trong một ontology. Phạm vi của ontology mức thấp hơn có thể là một hoặc nhiều chiều. Ví dụ về những thứ
trước đây là những thứ giới hạn trong nội dung có trong các nguồn có thẩm quyền, chẳng hạn như Mã nghề
nghiệp ISCO-08
(http://www.ilo.org/public/english/bureau/stat/isco/isco08/), Danh sách Chất độc và Tác nhân Chọn lọc của
NSAR (http://www.selectagents.gov/SelectAgentsandToxinsList.html) và các tài liệu liên quan tài nguyên dữ liệu
dạng danh sách, một chiều tuân theo DoD 8320.2: Nguồn có thẩm quyền. Ví dụ về cái sau là Bản thể học Môi
trường (//bioportal.bioontology.org/ontology/ENVO) hoặc Bản thể học bệnh thần kinh (//
www.ncbi.nlm.nih.gov/pubmed/24314207).
7
Hình 2: Các Ontology cấp cao nhất, cấp trung bình và cấp thấp hơn trong OBO Foundry
Vì những thiếu sót này, chúng tôi khuyên bạn nên phát triển các ontology plug and play nhỏ hơn để thay thế cho các
ontology lớn. Để tạo thuận lợi cho việc thực hiện lời khuyên này, chúng tôi đưa ra các nguyên tắc giới hạn phạm vi theo chiều
ngang của nội dung này. Việc phân chia các ontology thành các mức cao nhất, trung bình và thấp hơn là sự phân chia dọc
theo trục tổng quát – nội dung của các ontology mức cao nhất làtổng quát hơnso với các ontology ở mức thấp hơn. Việc
khoanh vùng phạm vi theo chiều ngang của các ontology yêu cầu các hướng dẫn cho việc phân chia các ontology dọc theo
trục nội dung.
Nhớ lại từ phần Phương pháp tiếp cận kiến trúc đa tầng ở trên rằng các ontology mức trung bình sẽ
bao gồm các phân cấp lớp con có gốc là một phần tử từ ontology mức cao nhất hoặc một
số 8
phần tử được rút ra từ một ontology mức trung bình khác. Việc diễn đạt lại điều này dẫn đến hướng dẫn đầu tiên
để phân định phạm vi nội dung của ontology mức trung bình: Miền của ontology mức trung bình phải được biểu
thị dưới dạng một lớp đơn lẻ hoặc dưới dạng một câu lệnh bao gồm các lớp và một thuộc tính đối tượng bên trong
đó. bản thể học. Hơn nữa, lớp đó hoặc các lớp đó phải ở cấp gốc của bản thể luận. Phần nội dung còn lại của
ontology mức trung bình là những thuật ngữ và quan hệ mô tả đầy đủ các thực thể của chủ thể đó. Chúng tôi tận
dụng nội dung của bản thể luận cấp cao nhất để xây dựng các hướng dẫn của nhiệm vụ này. Ví dụ về một ontology
cấp trung bình của các tạo tác sẽ được sử dụng để tạo thuận lợi cho cuộc thảo luận.
Theo hướng dẫn đầu tiên trong việc tạo một ontology tạo tác, sẽ có một lớp có tên là “Tạo tác” trong
ontology. Nhiệm vụ là thêm nội dung vào ontology để nó có thể mô tả các tạo tác mà không trở nên quá lớn
và khó sử dụng. BFO cung cấp một danh sách kiểm tra ngắn gọn về những thứ mà một hiện vật có thể liên
quan. Chỉ sử dụng các nút lá của hệ thống phân cấp BFO liên tục và xảy ra và bỏ qua các loại phụ của các lớp
ranh giới fiat liên tục, vùng không gian và vùng thời gian để lại 17 loại sự vật (các mục được in đậm trong
Bảng 1) mà một vật phẩm (hoặc bất kỳ thứ gì khác) ) có thể liên quan.
tiếp tục
liên tục độc lập
thực thể vật chất
Sự vật
thực thể phi vật chất
Địa điểm
bố trí
chức năng
Vai trò
chất lượng
quá trình
hồ sơ quy trình
lịch sử
ranh giới quá trình
Bảng 1
9
Một vài ví dụ có thể giúp minh họa hướng dẫn trong hành động. Các phần tiếp theo phụ thuộc chung (GDC) là
những thực thể có thể được chuyển từ thực thể này sang thực thể khác trong khi vẫn giữ nguyên danh tính của
chúng. Thông tin vẫn giữ nguyên trong khi được chuyển từ phương tiện này sang phương tiện khác và đó là trường
hợp điển hình của GDC. Vì vậy, việc xác định phạm vi của Artifact Ontology bao gồm việc trả lời câu hỏi: “Loại thông
tin nào, nếu có, có liên quan đến các tạo phẩm?”. Các câu trả lời hợp lý sẽ là các thông số kỹ thuật tạo tác như bản
thiết kế, số nhận dạng như tên và số sê-ri và mô tả như báo cáo thử nghiệm và phép đo. Tiếp tục phương pháp sẽ
dẫn đến việc xác định rằng các thành phần tạo tác liên quan đến các lớp BFO của Đối tượng và Tập hợp đối tượng
thông qua việc chúng được cấu thành và cấu thành bởi các hệ thống, hệ thống con, thành phần và bộ phận. Đồ tạo
tác có các Đặc tính như Kích thước, Khối lượng, Hình dạng và Màu sắc cũng như Bố trí như Độ bền kéo và các Chức
năng như Bay và Chất hoạt động bề mặt. Các Quy trình liên quan đến Đồ tạo tác không chỉ là những quy trình sử
dụng đồ tạo tác mà còn là những quy trình thiết kế, sản xuất, thử nghiệm và bảo trì chúng.
Phải có một ràng buộc về kỹ thuật này để làm cho nó hiệu quả. Như đã nêu hiện tại, nó sẽ dẫn đến vô số thực
thể được bao gồm trong phạm vi của một bản thể luận. Một ràng buộc là chỉ bao gồm những thực thể liên
quan đến loại gốc và không bao gồm các loại khác. Ví dụ: khi xác định có hay không đưa một chất lượng nhất
định vào Bản thể học nhân tạo, hãy trả lời câu hỏi liệu chất lượng đó có áp dụng được cho các loại thực thể
khác hay không. Các đặc tính như khối lượng, hình dạng, màu sắc, chiều dài và kết cấu có thể áp dụng cho bất
kỳ đối tượng vật chất nào và do đó không thuộc về Bản thể học tạo tác. Tiếp tục bằng cách lọc ra khỏi những
thực thể chỉ áp dụng cho nút gốc, những thực thể không áp dụng cho một số lượng lớn các kiểu con của nó.
Như một ví dụ, một chất lượng chẳng hạn như tầm cỡ không phải là thành viên của Bản thể tạo tác phẩm vì nó
không có phạm vi đủ rộng trong miền tạo tác. Thay vào đó, nó sẽ nằm trong một bản thể học miền của các đồ
tạo tác mà nó được áp dụng rộng rãi.
Tóm tắt các cuộc thảo luận trước đây dẫn đến hướng dẫn thứ hai để xác định phạm vi của ontology mức trung bình: Bao
gồm tất cả các kiểu con của các lớp của ontology mức cao nhất chỉ liên quan đến lớp gốc hoặc các lớp của ontology mức
trung bình và có thể áp dụng cho một tỷ lệ phần trăm đáng kể của các trường hợp của nó.
Theo hướng dẫn này, các ví dụ về miền bản thể học cấp trung bình là: thực thể thông tin, chất lượng, vùng không
gian địa lý, vùng thời gian, tác nhân và sự kiện. Tóm lại, hướng dẫn là phạm vi của một ontology mức trung bình nên
bao gồm tất cả các thuật ngữ và quan hệ cần thiết để mô tả – phân định phạm vi của – miền chứ không phải mọi
thuật ngữ và quan hệ kiểu con. Về số lượng kiểu con cần bao gồm, chúng tôi đưa ra quy tắc ngón tay cái rằng không
nên bao gồm quá ba cấp độ kiểu con cho bất kỳ một trong các thuật ngữ hoặc quan hệ chung nào.
Nguyên tắc về phạm vi đối với các ontology mức thấp hơn ('miền') về cơ bản giống như đối với các ontology mức
trung bình. Thuật ngữ gốc của ontology mức thấp hơn nên hoặc là một lớp con trực tiếp của một thuật ngữ từ
ontology cấp trung bình hoặc là một phần tử được rút ra từ một số ontology cấp thấp hơn đã tồn tại. Khi phát triển
các bản thể luận cấp thấp hơn theo hướng dẫn này, chúng trở thành các mô tả về các loại thực thể đặc trưng của
miền liên quan. Ví dụ về các lĩnh vực cho các bản thể luận như vậy bao gồm: nghề nghiệp, dân tộc, đặc điểm địa lý,
đặc điểm thủy văn, hành vi tội phạm, hành vi chính phủ, chức năng tạo tác, tàu thủy và cảm biến.
10
nguyên tắc phát triển
Trong phần này, chúng tôi đưa ra hướng dẫn về cách thực hiện một số nhiệm vụ là một phần của việc tạo phiên bản
OWL của một ontology.
Để kiểm tra tính nhất quán của một ontology, có sẵn một số bộ lập luận tự động có thể lần theo tất cả các mối quan hệ
trong ontology và phát hiện bất kỳ sự không nhất quán nào. Phần lớn những người lập luận này có khả năng thực hiện các
bài kiểm tra tính nhất quán trên các bản thể luận được viết bằng phương ngữ DL của Ngôn ngữ bản thể học web (OWL) của
OWL (OWL 2 DL).
Nguyên tắc này không cấm sử dụng tiên đề lớp con hoặc lớp tương đương, theo đó một lớp được định nghĩa là
lớp con hoặc lớp tương đương của lớp ẩn danh. Ngôn ngữ OWL cung cấp phương tiện để diễn đạt sự thật về
các thực thể bằng cách sử dụng các mối quan hệ với các thực thể khác. Ví dụ: một dữ kiện chẳng hạn như “Ô tô
has_part some Engine” sử dụnghas_partquan hệ để liên kết mỗi ô tô với ít nhất một động cơ. Ngữ nghĩa của
thực tế này là Ô tô đã được tạo thành một lớp con của lớp ẩn danh "thứ có ít nhất một động cơ là một phần".
Lớp này là ẩn danh vì nó không phải là một phần của phân loại đã được khẳng định. Tập hợp các tiên đề của
lớp con và lớp tương đương tạo thànhphân loại suy luậncủa một ontology. Trong phân loại được suy luận này,
các lớp ẩn danh trước đây trở nên rõ ràng và nguyên tắc thừa kế duy nhất không còn hiệu lực. Để biết thêm chi
tiết, xem: (Smith & Ceusters, 2010)
11
Các định nghĩa mà con người có thể đọc được của các lớp (thuật ngữ) được yêu cầu phải luôn ở dạng hai phần:
trong đó 'S' (đối với: loài) là thuật ngữ được định nghĩa, 'G' (đối với: chi) là thuật ngữ gốc trực tiếp của 'S' trong bản thể học
liên quan và 'D' (đối với: khác biệt) cung cấp loài -tiêu chuẩn; nghĩa là, nó xác định điều gì về một số G nhất định khiến
chúng trở thành S. Khi các bản thể luận phát triển, người ta mong đợi rằng các định nghĩa mà con người có thể đọc được sẽ
được dịch thành các tiên đề của lớp con hoặc lớp tương đương như được mô tả ở trên trong phần về kế thừa đơn lẻ.
Ví dụ:
- Sự kiện tự nhiên =def. một quá trình không phải do bất kỳ hành động nào của con người gây ra
- Sự kiện địa lý = def. một sự kiện tự nhiên có ảnh hưởng đến một số đặc điểm địa lý
- Lở đất = def. một sự kiện địa lý trong đó có sự sụt giảm nhanh chóng của đất hoặc đá
xuống sườn núi
Khi ngày càng có nhiều thuật ngữ cụ thể được định nghĩa thông qua việc bổ sung các điểm khác biệt ngày càng
chi tiết hơn, các định nghĩa của chúng gói gọn thông tin liên quan đến các liên kết cha-con kết nối từng loại hoàn
toàn trở lại gốc tương ứng. Đồng thời, nhiệm vụ xây dựng các định nghĩa đóng vai trò kiểm tra tính đúng đắn của
các hệ thống phân cấp cấu thành trong các bản thể luận này.
Việc sử dụng cấu trúc định nghĩa hai phần giúp đảm bảo rằng các định nghĩa không vòng vo (khi thuật ngữ
được định nghĩa xuất hiện trong định nghĩa của chính nó) và do đó chúng truyền đạt thông tin có giá trị cho
người dùng – phù hợp với nguyên tắc định nghĩa chỉ nên sử dụng các thuật ngữ dễ hiểu hơn thuật ngữ được
định nghĩa.
Các định nghĩa cũng được yêu cầu đối với các thuộc tính đối tượng (không phải gốc) và hai thuộc tính này phải được xác định càng nhiều càng tốt bằng
Giữ nguyên ý nghĩa của các thuật ngữ Ontology cấp cao hơn
Sử dụng lại các thuật ngữ từ các ontology khác là một nguyên tắc cơ bản của các thực tiễn tốt
nhất được tán thành ở đây, vì nó góp phần vào khả năng tương tác của các mô-đun ontology
và do đó cũng của các hệ thống thông tin mà các mô-đun này hỗ trợ. Tuy nhiên, nếu không
được thực hiện cẩn thận, việc sử dụng lại các thuật ngữ có thể dẫn đến nguy cơ làm thay đổi ý
nghĩa của thuật ngữ được sử dụng lại. Cách phổ biến nhất mà loại vấn đề này xảy ra là khi một
ontology sử dụng lại một thuật ngữ từ ontology cấp cao hơn nhưng thêm vào nội dung của nó
thông qua việc bổ sung một tiên đề. Một ví dụ là sử dụng lại thuật ngữ Tổ chức quân sự nhưng
thêm một tiên đề khẳng định rằng mọi tổ chức như vậy đều có chính xác một người lãnh đạo.
Để phù hợp, người tạo bản thể luận cấp thấp hơn nên yêu cầu người quản lý bản thể luận cấp
cao hơn thêm tiên đề,
12
Hướng dẫn từng bước để phát triển Ontology
sơ bộ
1. Lập nhóm. Đảm bảo rằng nhóm của bạn bao gồm cả SMES quen thuộc với cả chủ đề (các thực thể trong
miền của bạn) và dữ liệu (các tài nguyên thông tin mà bản thể luận sẽ được sử dụng để tích hợp và phân
tích cũng như để có thể khám phá được).
2. Đảm bảo rằng nhóm của bạn bao gồm những người có kinh nghiệm xây dựng ontology. (Cơ sở với
phần mềm bản thể học không ngụ ý khả năng tạo bản thể luận.)
3. Xác định các nhiệm vụ chính mà bản thể luận của bạn sẽ được thiết kế để thực hiện.
4. Xác định miền của bản thể luận của bạn – các loại đối tượng, thuộc tính và quy trình mà
bản thể luận sẽ cần đại diện.
5. Xác định các phần chính của dữ liệu mà bản thể luận của bạn sẽ được sử dụng để chú thích.
6. Lưu ý rằng mục tiêu của bạn là tối đa hóa khả năng của ontology để giải quyết các nhiệm
vụ chính nàynhưng không gây hại chokhả năng của nó để giải quyết việc sử dụng thứ
cấp chưa được xác định. (Kinh nghiệm cho thấy rằng việc sử dụng thứ cấp thường quan
trọng hơn nhiều so với việc sử dụng chính và việc sử dụng thứ cấp hầu như luôn đảm
bảo giá trị lâu dài của một ontology.) các thuật ngữ và định nghĩa trong bản thể luận
của bạn có thể hiểu được và có giá trị rộng rãi (chứ không phải chỉ những cộng tác viên
trực tiếp của bạn mới hiểu được và có giá trị và chỉ khi được sử dụng liên quan đến dữ
liệu hiện có của bạn).
10. Cố gắng đảm bảo sự đồng thuận tối đa với SME và cách sử dụng học thuyết.
11. Xác định các lĩnh vực chồng chéo về nguyên tắc nơi việc sử dụng thuật ngữ không nhất quán và cung cấp các từ đồng
nghĩa nơi các cộng đồng nhỏ SME sử dụng các thuật ngữ thay thế.
12. Tránh các thuật ngữ đại trà (như 'xác thịt', 'nhiên liệu', 'thông tin'...); luôn luôn sử dụng ở vị trí của chúng một
thuật ngữ đếm tương đương thích hợp (có nghĩa là một thuật ngữ có thể đứng trước 'a' và có dạng số nhiều
như trong: 'phần thịt', 'lượng nhiên liệu', 'tạo tác thông tin'.
13
15. Đừng nhầm lẫn thực tế với kiến thức của chúng tôi về thực tế- Tránh các thuật ngữ như 'kẻ khủng bố không xác định', 'kẻ khủng
bố đã biết', 'người tham gia không được phân loại', 'người tham gia không được chỉ định khác'. Mô tả những gì tồn tại (những loại
sự vật tồn tại) trong thực tế, chứ không phải những gì đã biết về những gì tồn tại trong thực tế.
không phải là loại. Các thuật ngữ như 'không phải động vật có vú', 'không có màng', 'phương tiện hoặc người' không chỉ
định các loại trong thực tế. Tránh các thuật ngữ liên quan đến bổ nghĩa thời gian và không gian. Không bao gồm trong
thuật ngữ các từ ngụ ý hạn chế về thời gian hoặc không gian, ví dụ: 'hiện tại', 'trước đó', 'cục bộ', …
21. Không sử dụng thuật ngữ liên từ hoặc liên từ. Không có loại nào trong thực tếđộng vật có vú hoặc violon; không có
loại trong thực tếquả táo và quả cầu.Thay vào đó, có những loạiđộng vật có vú,đàn vi ô lông,quả táoVà quả cầu.
22. Tránh sử dụng các cách diễn đạt sửa đổi (chẳng hạn như 'đã hủy bỏ', 'vắng mặt' hoặc 'giả mạo') làm mất đi ý
nghĩa của thuật ngữ đã sửa đổi.
23. Nguyên tắc gắn kết thuật ngữ - Đối với bất kỳ biểu thức 'E' nào trong một bản thể luận, 'E' có nghĩa là E. (Quy tắc về
tính nhất thể tuân theo ngay từ nguyên tắc này.) Nguyên tắc này thường được coi là tầm thường và vì lý do chính
đáng. hạn chế đối với tất cả việc sử dụng ngôn ngữ hợp lý; nhưng để biết các ví dụ về vi phạm, hãy xem (Smith,
2006).
24. Sắp xếp các điều khoản của bạn để tạo thành một xương sốnglà mộtphân cấp, theo đó mỗi nút ở cấp thấp
hơn cấp gốc được kết nối bởi mộtlà mộtliên kết đến nút cha của nó. Do đó, mỗi nút cha tổng quát hơn các
nút con của nó. Điều này có nghĩa là bản thể luận của bạn nên được xây dựng để đảm bảo tính kế thừa đơn
lẻ.
25. Khẳng định mộtlà mộtquan hệ – Alà mộtB - chỉ khi nó có ý nghĩa để khẳng định rằng mọi trường hợp
của loạiMỘTlà một thể hiện của loạib.
26. Hệ thống phân cấp nên đượclà mộthoàn chỉnh theo nghĩa là mỗi thuật ngữ trong bản thể luận được kết nối thông qua một chuỗi
duy nhấtlà mộtliên kết đến nút gốc có liên quan. Thêm các điều khoản bổ sung để lấp đầy khoảng trống trong chuỗi này. Tất cả
các điều khoản trong phân loại sau đó sẽ được truy xuất nguồn gốc thông qualà mộtquan hệ với nút gốc ontology có liên quan.
14
27. Hệ thống phân cấp nên đượclà mộtcũng hoàn thành theo nghĩa là mỗi thuật ngữ con trong bản thể luận - có
nghĩa là mỗi thành phần của các thuật ngữ tổng hợp - phải được kết nối tương tự theo cách này với một nút
gốc có liên quan (có thể là một nút của bản thể luận này hoặc nếu một số bản thể luận bổ sung được xác
định ). (Các thuật ngữ tổng hợp là ví dụ về các dạng: 'Akhông cóBAvới B'.)
28. Tránh 'khác' - Không tạo các thuật ngữ như 'khủng bố khác', 'vũ khí khác',…
29. Cả nhà phát triển và người dùng của một ontology nên tôn trọng giả định thế giới mở, điều đó có nghĩa là
ontology không hàm ý khẳng định rằng nó hoàn thành (và không khẳng định rằng bất kỳ danh sách các
thuật ngữ con nào dưới cha mẹ 'A' là một danh sách đầy đủ các kiểu con của A).
31. Thực hiện theo chiến lược định nghĩa của Aristotle, theo đó mỗi định nghĩa có dạng 'A
=def. a B which Cs', trong đó B là số hạng cha của A trong ontology, và C làphân biệtđánh
dấu những B đó là As.
32. Sử dụng các tính năng thiết yếu trong việc xác định các thuật ngữ, điều đó có nghĩa là sự khác biệt C phải đại diện cho
34. Đảm bảo tính dễ hiểu của các định nghĩa, bằng cách sử dụng các thuật ngữ trong định nghĩa của bạn đơn giản hơn thuật
35. Đảm bảo rằng các định nghĩa của bạn không thể đóng gói được, điều đó có nghĩa là nếu một khẳng định liên
quan đến thuật ngữ bản thể học 'A' có ý nghĩa, thì nó vẫn có ý nghĩa khi bạn thay thế 'A' bằng định nghĩa 'A'
của bạn.
15
Thư mục
Arp, RA, Smith, B., & Spear, AA (2015).Xây dựng Ontology với Ontology hình thức cơ bản.Cambrigde,
MA: Nhà xuất bản MIT.
Grenon, P., & Smith, B. (2004). Conrncopia của quan hệ hình thức-bản thể học.Phép biện chứng, 58:3, 279-
296.
Grenon, P., & Smith, B. (Tháng 3 năm 2004). SNAP và SPAN: Hướng tới bản thể học không gian động.không gian
Nhận thức và Tính toán, 4:1, 69-103.
Imam, FT, Larson, SD, Bandrowski, A., Grethe, JS, Gupta, A., & Martone, ME (2012; 3:111).
Phát triển và sử dụng các bản thể luận bên trong Khung thông tin khoa học thần kinh: Một cách tiếp cận thực tế.
Biên giới trong di truyền học.
Smith, B. (2006). Chống lại sự đặc biệt trong phát triển Ontology. Trong B. Bennett, & C. Fellbaum,Chính thức
Ontology trong hệ thống thông tin(trang 15-26). Amsterdam: Báo chí iOS.
Smith, B. (Tháng 11 năm 2007,). Xưởng đúc OBO: Sự phát triển phối hợp của các bản thể luận để hỗ trợ
Tích hợp dữ liệu y sinh.Công nghệ sinh học tự nhiên 25 (11), 1251-1255.
Smith, B., & Ceusters, W. (2010). Chủ nghĩa hiện thực bản thể như một phương pháp luận cho sự tiến hóa phối hợp của
16