HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG KHOA CÔNG NGHỆ THÔNG TIN

Báo cáo:

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

Sinh viên thực hiện:

NHÓM 5 Phan Văn Hải Ngô Lan Hoa Nguyễn Văn Trần Anh Trương Công Hải Lã Đình Tuấn Đỗ Thị Hồng

Giảng viên: Lớp:

P.GS TS. Trần Đình Quế D09CNPM2

2

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

NHÓM 5 – D09CNPM2

Mục lục

2

3

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

NHÓM 5 – D09CNPM2

I. 1.1

Sự phát triển, tiến hóa của web Tổng quan về World Wide Web

Web hay World Wide Web không phải là Internet nhưng là thành phần nổi bật nhất của hệ thống này. Nói cách khác, nhờ có những trang Web mà người ta biết đến sự hiện hữu của Internet và thế giới ảo do nó tạo ra vẫn luôn song hành với thế giới vật lý của hàng tỉ người sử dụng Web. Sự tiến hóa của Web đã bắt đầu ngay từ khi nó xuất hiện. Trải qua 3 thế hệ, từ 1.0 tức loại Web thông tin đến 2.0 tức Web giao tiếp xã hội rồi 3.0 là loại Web có khả năng nhận thức, thì nay đến lượt xuất hiện một thế hệ mới - Web 4.0 mà đi đầu là các nội dung số mang đặc trưng cộng sinh qua lại giữa con người và các sự vật, tức nội dung của trang Web. Công nghệ thông tin luôn tiến hóa và đang tạo ra các nội dung số vừa hữu ích, tiện lợi và hấp dẫn, lại vừa thích đáng và giàu cảm xúc. Từ iTunes đến Amazon, từ Netflix đến New York Times, người ta đã nhận ra đây đó dấu hiệu xuất hiện mỗi ngày một nhiều loại nội dung số 4.0. Và cho dù chúng ta chưa có một định nghĩa thỏa đáng về Web 4.0, hội thảo “tương lai kỹ thuật số” tổ chức vào cuối năm nay không chỉ đề cập đến trung tâm của vấn đề là sự nổi lên của nội dung 4.0 mà còn đưa chúng vào những ứng dụng thiết thực trong đời sống, nghiên cứu, học tập và nhất là vào môi trường kinh doanh mới, nơi khách hàng không chỉ dừng lại ở mức giao tiếp mà còn nhập cuộc vào chính môi trường tạo nên sản phẩm hay dịch vụ mình đang quan tâm. Trên thực tế, sự xuất hiện một thế hệ Web luôn kéo theo những thay đổi trong đời sống xã hội và các hoạt động kinh tế cũng như khoa học kỹ thuật nhờ vào khai thác những ứng dụng của nó. Khi Web 1.0 trở thành thứ tiện ích thông tin thì kéo theo phong trào thành lập các công ty kinh doanh Internet tạo nên hiện tượng bùng nổ dotCom giữa những năm 1997-2000. Web 2.0 chẳng những chi phối cung cách và lề lối giao tiếp xã hội mà còn định hình nên nền tảng thương mại điện tử. Việc điện tử hóa các hoạt động con người, từ y tế điện tử đến chính phủ điện tử và việc mở rộng từ Internet cố định sang Internet di động đã trở thành hiện thực trong giai đoạn này. Web 3.0 với tính năng tự nhận thức đã thúc đẩy việc sản xuất ra các thiết bị thông minh hơn, bao gồm cả các siêu máy tính đủ năng lực để giải quyết những vấn đề toàn cầu và chiến lược kinh doanh của các doanh nghiệp. Chúng ta có thể không nhận ra sự xuất hiện của thế hệ Web 4.0 nếu không điểm lại lịch sử tiến hóa của 3 thế hệ trước.

3

4

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

NHÓM 5 – D09CNPM2

1.2

Web 1.0

1.2.1 Định nghĩa Web 1.0 là một khái niệm chỉ giai đoạn ban đầu trong sự tiến hóa của World Wide Web (www) kéo dài từ năm 1995-2004, tập trung vào phương pháp tiếp cận trên xuống (1 chiều) về sử dụng web cũng như về giao diện người dùng. Xét về mặt kỹ thuật, thông tin trên web là đóng (nội dung tĩnh) và chỉ chỉnh sửa được từ bên ngoài thông qua người quản trị web, do đó không có tính “động”. Công nghệ web 1.0 tập trung vào khía cạnh trình bày, không có khả năng tạo ra từ nội dung có sẵn. 1.2.2 Quá trình phát triển Thế hệ Web 1.0 ra đời năm 1997 bởi chính cha đẻ của World Wide Web (WWW) là Tim Berners-Lee. Năm 1989 Burners-Lee đưa ra ý niệm về một không gian siêu văn bản toàn cầu mà theo đó mỗi một thông tin hay nội dung, thường được gọi là trang web đều có thể tiếp cận thông qua một bộ nhận dạng chung duy nhất. Trang web và công cụ tìm kiếm web đầu tiên ra đời năm 1990, tiếp theo là các cổ máy tìm kiếm mạnh hơn của Worm WWW năm 1993, Yahoo 1994, Web Crawlers 1994, và AltaVista 1995. Berners-Lee định nghĩa Web 1.0 là cấu trúc thông tin chỉ có thể để đọc, tương tự như một không gian để quảng bá những thông tin đến công chúng, và cả những bảng quảng cáo hàng hóa hay dịch vụ đến khách hàng. Với những tính năng ban đầu hạn chế như thế nhưng Web 1.0 đã thực sự tạo nên cơn sốt hình thành vội vã các công ty kinh doanh Internet, tạo nên hiện tượng bùng nổ dotCom. Giá trị các công ty công nghệ tăng lên rất nhanh. Có tuần các quỹ đầu tư mạo hiểm đổ vào Thung lũng Silicon đến cả tỉ đôla. Cisco được định giá cao nhất đến 400 tỉ Mỹ kim nhưng rồi từ tháng 3 đến tháng 11 năm 2000 mất giá thảm hại chỉ còn 210 tỉ. Cùng thời gian đó, cổ phiếu của PriceLine từ 94 USD xuống còn 4 USD, Go.com đánh mất 790 triệu USD, và Boo.com đốt cháy 160 triệu đôla. 1.3 Web 2.0 1.3.1 Định nghĩa Web 2.0 là thế hệ thứ 2 (bắt đầu từ năm 2004) của chuẩn web và các dịch vụ lưu trữ (hosting) với mục đích thuận tiện trong việc chia sẻ, hợp tác và sáng tạo giữa các người dùng. Nó không phải là một dạng nâng cấp kỷ thuật từ web 1.0 mà là một sự thay đổi về cách phát triển phần mềm và về cách sử dụng của người dùng cuối.

4

5

KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

NHÓM 5 – D09CNPM2

1.3.2 Quá trình phá triển Dougherty trong một cuộc hội thảo tổ chức năm 2004. Theo đó, 2.0 là thế hệ Web mới mà người sử dụng vừa có thể đọc các thông tin hay nội dung, vừa có thể viết hay bổ sung vào đó để tạo nên những thông tin hay nội dung mới. Đây là thứ cấu trúc hai chiều tạo nên sự giao tiếp hay tương tác giữa người lập ra trang Web và những người sử dụng, và giữa những người sử dụng với nhau. Ở đỉnh cao Web 2.0 là những trang mạng xã hội, điển hình như Facebook, My Space, Twitter hay Daily Motion, You Tube mà những người ưa thích cùng một chủ đề có thể tìm đến với nhau để trao đổi quan điểm, hình ảnh, đoạn phim hay bổ sung những ý tưởng và lời bình luận. Các nhà thiết kế đã sử dụng 3 giao thức căn bản là AJAX, Flex và Google Web Toolkit để tạo nên sự dễ dàng cho người sử dụng khai thác các kỹ thuật tương tác như blog, RSS, wiki, mashup, tag. Trên thực tế, các nhân tố tạo nên Web 2.0 đã xuất hiện rất sớm; và trải qua cuộc suy thoái thời hậu dotCom thì chỉ những trang web chứa các nhân tố đó như Google, Amazon, eBay mới có thể sống sót và rồi phát triển nhanh chóng. Ngày nay 2.0 là dòng Web phổ biến nhất và mang nhiều ứng dụng nhất trong tất cả các lĩnh vực, từ học tập, nghiên cứu đến thương mại, quản trị và trong việc tạo ra những cộng đồng mạng đa dạng, năng động, tràn đầy sức sống. 1.3.3 Đặc điểm - Web đóng vai trò như một nền tảng, có thể chạy mọi ứng dụng. - Là nơi tập hợp trí tuệ của cộng đồng. - Dữ liệu đóng vai trò then chốt. - Phần mềm được cung cấp dưới dạng dịch vụ web và được nâng cấp không ngừng. - Phát triển ứng dụng dễ dàng và nhanh chóng. - Phần mềm có thể chạy được trên nhiều nền tảng như thiết bị di động, thiết bị cầm tay (PDA). - Giao diện ứng dụng phong phú. Ban đầu, web 2.0 chú trọng tới yếu tố công nghệ, nhấn mạnh tới vai trò nền tảng ứng dụng. Nhưng đến hội thảo Web 2.0 được tổ chức lần thứ 2 vào tháng 2/2005 yếu tố cộng đồng được nhấn mạnh hơn.

5

0 không có một ranh giới cố định mà là một lõi hấp dẫn.0 và Web 2. đã tạo sẵn trước.3. Tự sản sinh.4 Web đóng vai trò như là một nền tảng Giống như nhiều khái niệm quan trọng khác. 1.0 Tĩnh. viết Đồng bộ Web 2.0 là tập các quy tắc và thực hành chặt chẽ để kết hợp các thành phần từ lõi. tự đề xuất không thể thay đổi 6 .4 Web 1.0 Web 1.0 Tổ chức lưu trữ Đối tượng Cung cấp Tương tác Giao tiếp hệ thống Nội dung Tập trung Cá nhân độc quyền Nội dung Chỉ đọc Truyền phát Phân tán Cộng đồng chia sẻ Dịch vụ Đọc. Web 2. web 2.6 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 1.

0 7 .7 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Hình 1 Web 1.0 vs Web 2.

0 vs Web 2.0 8 .8 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Hình 2 Phân loại ứng dụng Web 1.

5. Extensible Markup Language (XML).5. Hầu hết chúng được sử dụng để làm sao máy có thể hiểu được cách trình bày dữ liệu trên web. computer" /> <meta name="description" content="Cheap widgets for sale" /> <meta name="author" content="John Doe" /> Các thành phần nội dung được biểu diễn trong HTML là những câu chữ vô hồn mà máy tính không thể hiểu được về mặt ngữ nghĩa cũng như các quan hệ.HTML). 1. video) và các mẫu tương tác khác.5. HTML có nhiệm vụ mô tả các tài liệu và liên kết chúng.9 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 1. Các thẻ siêu dữ liệu (metada tag) cung cấp phương thức mà máy tính có thể phân loại nội dung của trang web. ví dụ: <meta name="keywords" content="computing. RDF. XML với các ràng buộc của mình có thể mô tả mọi thứ như con người.5 Semantic Web 1. Về phía nhà phát triển cũng không thể xử lý các tài liệu trên phạm vi toàn cầu (các máy tìm kiếm không thỏa mãn hiệu năng). âm thanh.2 Những hạn chế của HTML Hiện nay.3 Giải pháp Web ngữ nghĩa Web ngữ nghĩa được xuất bản dựa trên các ngôn ngữ được thiết kế đặc biệt để mô tả dữ liệu như RDF (Resource Description Framework). Giải pháp để giải quyết vấn đề trên là chỉnh sửa lại tài liệu web bằng cách thêm phần dữ liệu mở rộng với mục đích là cho phép máy có thể hiểu được nghĩa của tài liệu đó. Web Ontology Language (OWL). computer studies. nhằm hướng dẫn cho trình duyệt biểu diễn thông tin như thế nào khi người dùng nhìn thấy. và nền web mới này gọi là web ngữ nghĩa (semantic web). Máy không thể hiểu được cũng như ra những quyết định thông minh với thông tin mà nó đang biểu diễn. hội họp. 1.1 Định nghĩa Các trang web hiện nay được cấu thành bởi các thẻ HTML và những câu chữ tự nhiên. … 9 . là tập quy ước đánh dấu được sử dụng để mã hóa nội dung của văn bản xen kẻ với các đối tượng đa phương tiện (hình ảnh. OWL. WWW chủ yếu dựa trên Hyper Text Markup Language (ngôn ngữ đánh dấu siêu văn bản . Và để làm được điều này ta cần xây dựng các công cụ và các tác tử chạy trên nền web mới này để xử lý tài liệu trên phạm vi toàn cầu. các ràng buộc liên quan đến dữ liệu mà nó đang trình diễn. du lịch.

1. Thế hệ web mới đang tạo cho máy tính khả năng đọc và hiểu các nội dung trong đó.6. chúng ta phải có thông tin mô tả nội dung. do đó kết quả xử lý có ý nghĩa hơn và giúp máy tính tự động trong quá trình thu thập và nghiên cứu thông tin.1 Định nghĩa Theo Tim Berners-Lee. suy luận tương tự như con người. cùng đường phố. Do đó. 15km.2 Quá trình phát triển Giữa lúc Web giao tiếp xã hội 2. nội dung có thể biểu hiện chính bản thân nó giống như là phần dữ liệu được mô tả trong các cơ sở dữ liệu. Nghĩa là để mô tả cấu trúc của tri thức.0. Ví dụ thẻ HTML để biểu diễn dữ liệu trong web thông thường <item>blog</item> Cũng với thông tin trên nhưng được mô tả trong web ngữ nghĩa <item rdf:about="http://techmites. máy tính có thể hiểu “nghỉ hè” có ý nghĩa như thế nào. Khả năng tương tự càng mạnh hơn nơi các cỗ máy tìm kiếm Web như Google Search.6. và rồi liên kết các nội dung tương tự vào lại với nhau. Ý niệm về việc thiết kế kỹ thuật Web giúp cho máy tính có thể đọc và hiểu ý nghĩa trong đó.10 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Các công nghệ này được kết hợp với nhau để cung cấp các mô tả nhằm bổ sung hoặc thay thế nội dung của tài liệu Web.0 1.com/semantic-web-a-meaningful-search-engine/">blog</item> 1. Khi chúng ta đặt câu hỏi “tìm ngôi nhà nghỉ hè gần nice”. cùng sự kiện hay cùng nhân vật.0 đang thời kỳ thịnh hành thì những dấu hiệu của một thế hệ Web mới đã bắt đầu xuất hiện. bằng cách sử dụng các quá trình xử lý như lập luận. Web ngữ nghĩa được mô tả như một thành phần của Web 3. Web ngữ nghĩa đôi khi được sử dụng như là một Web 3. Máy có thể đọc được các mô tả và cho phép quản lý nội dung để thêm ý nghĩa cho nội dung đó. và “gần” đồng nghĩa với ưu tiên khoảng cách từ bán kính nhỏ đến lớn. “nice” là một thành phố ở miền nam nước Pháp. gọi là web 10 .0. Nếu bạn sử dụng một máy ảnh kỹ thuật số có tích hợp GPS để ghi lại các hình ảnh và tải chúng lên mạng xã hội Flickr thì trang Web này sẽ cho bạn thấy cả những hình ảnh tương tự của các tác giả khác chụp cùng ngày.6 Web 3. từ 1. Bằng cách này. hay đánh dấu trong các tài liệu (XHTML) xen kẽ với XML hoặc biểu diễn dữ liệu phân cấp như XML. máy có thể tự xử lý được tri thức. 2 rồi mới đến 10. suy diễn.

Ý niệm căn bản của Web 3. gia tăng thỏa mãn nơi khách hàng và giúp tổ chức cộng tác trong các trang Web xã hội. Web 3. hoặc hàm ẩn có hệ thống trong các nền tảng Web. Điều này tạo ra khả năng cải tiến cách quản lý dữ liệu. hỗ trợ việc truy cập Internet trên các thiết bị di động.0 Cách nay một năm. hoặc rải rác dưới dạng nội dung số 4.11 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 semantic đã được Berners-Lee đưa ra từ trước. cho dù chúng sẽ chạy ngay trong trang Web hay trên hệ thống điện toán đám mây. 11 . Netflix.0 cố gắng kết nối. Sự khác nhau giữa thế hệ Web 2. Nhiều trang Web hiện nay là sự phối hợp ở các chừng mực khác nhau giữa Web 2. Đây chính là môi trường tranh đua công nghệ để chọn ra giải pháp thích ứng nhất. tích hợp.7 Web 4.0 và Web 3.0 và Web 3.0 chỉ có thể xuất hiện sau 5 năm nữa.0 làm cho việc lập trình WebOS trở nên thuận lợi. nhờ đó giảm đáng kể số thao tác và hỗ trợ con người đưa ra các quyết định nhanh chóng và chính xác. khuyến khích toàn cầu hóa.0 như iTunes. mô phỏng hoạt động sáng tạo và cải tiến. chúng ta có thể hình dung thế hệ Web 4. một điều kiện tiên quyết để tạo nên sự thông minh tự tại cho máy tính và các thiết bị di động. Về mặt kỹ thuật. tự động hóa. 1. Ở góc độ semantic (ngữ nghĩa). Web 3. và tái sử dụng trong các ứng dụng khác nhau.0 là một đằng nhắm đến việc sáng tạo ra các nội dung mới bởi người sử dụng và nhà sản xuất. nhiều công ty và viện nghiên cứu đã tiến hành thử nghiệm một dòng nền tảng hay hệ điều hành mới gọi là WebOS. phần lớn chuyên gia và các nhà phân tích công nghệ cho rằng thế hệ Web 4. đằng kia đặt mục tiêu liên kết các bộ dữ liệu.0 là định nghĩa cấu trúc dữ liệu và liên kết chúng lại để dễ bề khám phá phát hiện. Nhằm tạo cho các ứng dụng Web trở nên bẩm sinh (native) ngay trong thiết bị. hợp nhất.0. và phân tích dữ kiện từ những bộ dữ liệu khác nhau để tạo nên dòng thông tin mới. Nhưng dựa trên những dấu hiệu xuất hiện thực tế này.0 mang tính phân tán và tự sinh ngay trên mỗi trang Web chứ không tập trung hay bị kiểm soát bởi các máy chủ. năm 2006 John Marshoff của tờ New York Times đề nghị gọi đó là thế hệ Web 3.0.0 và Web 3.0 có thể thể hiện một sự vật nhờ vào khả năng hiểu biết của máy tính và các thiết bị di động thông minh. và đây lại chính là tiền đề công nghệ để phát triển nên một thế hệ Web mới. Những kinh nghiệm thành công của kỹ thuật Web 2. Nhưng nay nhiều trong số họ tin rằng thế hệ Web mới mà thường được gọi là Web cộng sinh (symbiotic) đã xuất hiện ngay trong năm 2012.

0 đến mục tiêu cộng sinh giữa người và máy tính (thông qua hệ điều hành WebOS) để luôn luôn tạo ra những nội dung mới.Web 1.0 -Web 2. tập Web 2. Web ngữ nghĩa được mô tả như một thành phần của Web 3. 2.12 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Động lực của sự tiến hóa Web gồm hai phần. hợp tác và sáng Web 3. II. Đây chính là điều mà các đại gia công nghệ phải đưa ra một định hướng phát triển vào cuối năm nay. Sau đó là mức độ đáp ứng của các giải pháp công nghệ.0 -Theo Tim Berners-Lee. có một ứng dụng đóng vai trò máy chủ (server) cung cấp các giao diện lập trình ứng dụng (API) có thể truy cập được trên nền web. Trong đó. Các hình thức quảng cáo trực tuyến và xã hội hiện nay có thể trở nên lỗi thời bởi sự nhập cuộc chứ không chỉ giao tiếp của người tiêu dùng. tự động hóa các hoạt động con người có thể trở nên trọn vẹn nhờ sự cộng tác tự nhiên của máy tính. Trong khi thế giới công nghệ đang chuyển mình sang một thế hệ Web mới thì thế giới kinh doanh cũng đang chờ đợi một giai đoạn bùng nổ. và việc điện tử hóa. Trong đó.0 là thế hệ thứ 2 (bắt đầu từ năm 2004) của chuẩn web và các dịch vụ lưu trữ (hosting) với mục đích thuận tiện trong việc chia sẻ.0. Cả hai động lực này đang hướng dẫn thế hệ Web 4. Máy tính có khả năng tương tác ngược lại với con người và với cộng đồng xã hội của người sử dụng nhờ vào khả năng đọc . có một ứng dụng đóng vai trò máy chủ (server) cung cấp các giao Dịch vụ web 12 . Một ứng dụng khác đóng vai trò máy khách (client) sẽ yêu cầu dịch vụ từ máy chủ này.2 Dịch vụ Web và Web Web thông thường Web 1.hành động . Trước hết là nhu cầu và khuynh hướng của người sử dụng.0 Định nghĩa .kiểm soát. 2.0 là một khái niệm chỉ giai đoạn ban đầu trong sự tiến hóa của World Wide Web (www) kéo dài từ năm 1995-2004.hiểu .1 Dịch vụ Web Định nghĩa (Có gì thiếu HOA bổ sung nhá) Dịch vụ Web (Web Service) là một loại ứng dụng Khách – Chủ (Client – Server) phân tán. Web ngữ nghĩa đôi khi được sử dụng như là -Dịch vụ Web (Web Service) là một loại ứng dụng Khách – Chủ (Client – Server) phân tán.

0 dùng. tạo giữa các người một Web 3. Một ứng dụng khác đóng vai trò máy khách (client) sẽ yêu cầu dịch vụ từ máy chủ này.13 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 trung vào phương pháp tiếp cận trên xuống (1 chiều) về sử dụng web cũng như về giao diện người dùng. 13 . Dịch vụ web còn là sự kết hợp các máy tính cá nhân với các thiết bị khác.0 mà là một sự thay đổi về cách phát triển phần mềm và về cách sử dụng của người dùng cuối. diện lập trình ứng dụng (API) có thể truy cập được trên nền web. Nó không phải là một dạng nâng cấp kỷ thuật từ web 1. các cơ sở dữ liệu và các mạng máy tính để tạo thành một cơ cấu tính toán ảo mà người sử dụng có thể làm việc thông qua các trình duyệt mạng.

Điều này xuất hiện từ sự mơ hồ khi người sử dụng truy vấn. Ví dụ.Là sự kết hợp của 14 . thông tin trên web là đóng (nội dung tĩnh) và chỉ chỉnh sửa được từ bên ngoài thông qua người quản trị web. .Phần mềm có thể chạy được trên nhiều nền tảng như thiết bị di động. có thể chạy mọi ứng dụng. ứng dụng vẫn có thể chạy và xử lý bình thường mà không cần thêm yêu cầu đặc biệt để tương thích giữa hai hệ điều hành này. công nghệ hiện tại cũng chưa thể loại bỏ hết tất cả ngữ nghĩa trùng lặp. Bất kỳ hệ thống suy luận tự động nào cũng phải đối mặt với dữ liệu đầu vào thực sự rất lớn.Là nơi tập hợp trí tuệ của cộng đồng.Một Dịch vụ Web bao gồm có nhiều mô-đun và có thể công bố lên mạng Internet. “cao”. .Phát triển ứng dụng dễ dàng và nhanh chóng. . đặt Web server cho ứng dụng trên một máy chủ chạy hệ điều hành Linux trong khi người dùng sử dụng máy tính chạy hệ điều hành Windows. ví dụ như XML. . .Dữ liệu đóng vai trò then chốt. Ban đầu. nhấn mạnh .0 tập trung vào khía cạnh trình bày.Tính rộng lớn: WWW hiện nay có hàng tỷ trang. không có khả năng tạo ra từ nội dung có sẵn. Các nhà cung cấp bộ ontology cũng .0 chú trọng tới yếu tố công nghệ.Dịch vụ Web cho phép client và server tương tác được với nhau ngay cả trong những môi trường khác nhau. .Phần mềm được cung cấp dưới dạng dịch vụ web và được nâng cấp không ngừng. .Phần lớn kĩ thuật của Dịch vụ Web được xây dựng dựa trên mã nguồn mở và được phát triển từ các chuẩn đã được công nhận. .Tính mơ hồ: Đây là những khái niệm không chính xác như là “trẻ”. thiết bị cầm tay (PDA). . Công nghệ web 1. do đó không có tính “động”. Chỉ xét riêng bộ ontology y tế SNOMED CT cũng đã chứa 370000 lớp.14 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Vai trò -Xét về mặt kỹ thuật.Giao diện ứng dụng phong phú. .Web đóng vai trò như một nền tảng. web 2. .

thông thường phương pháp Logic mờ được sử dụng. Để đối phó với sự mô hồ.Net… . những lĩnh vực trong cuộc sống có thể áp dụng và tích hợp dịch vụ Web là khá rộng lớn như dịch vụ chọn lọc và phân loại tin tức (hệ thống thư viện có 15 . Nhưng đến hội thảo Web 2. Kỹ thuật mã việc phát triển theo hướng từng thành phần với những lĩnh vực cụ thể và cơ sở hạ tầng Web.Lừa dối: Là khi nhà cung cấp thông tin cố ý gây hiểu nhầm cho người sử dụng.Sự không thống nhất: Đây là mâu thuẫn chắc chắn sẽ phá sinh trong quá trình phát triển bộ ontology rộng lớn.Một ứng dụng khi được triển khai sẽ hoạt động theo mô hình client-server. . Oracle Application server hay Microsoft.Ngày nay dịch vụ Web đang rất phát triển. . . những nhà cung cấp khác và cả những cá nhân thông qua mạng Internet. và nhất là khi các ontology này được kết hợp từ các nguồn riêng biệt. Nó có thể được triển khai bởi một phần mềm ứng dụng phía server ví dụ như PHP.15 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 tới vai trò nền tảng ứng dụng. cố gắng kết hợp với các kiến thức cơ bản khác để tìm điểm chung nhưng kết quả cuối cùng lại khác nhau. khách hàng.0 được tổ chức lần thứ 2 vào tháng 2/2005 yếu tố cộng đồng được nhấn mạnh hơn. đưa ra những lợi ích cho cả doanh nghiệp.

thông tin về địa điểm…).16 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 hóa thường được dùng để hạn chế mối đe dọa này.Sự không chắc chắn: Đây là những khái niệm rõ ràng với những giá trị không chắc chắn. Kỹ thuật suy luận logic được sử dụng trong trường hợp này. thông tin thuê xe… . đây là cách thức kinh doanh và làm việc 16 . đấu giá qua mạng…hay dịch vụ giao dịch trực tuyến (cho cả B2B và B2C) như đặt vé máy bay. . kết nối đến web portal để tìm kiếm các thông tin cần thiết). thông tin thương mại như giá cả. các đại lý bán hàng qua mạng. ứng dụng cho các dịch vụ du lịch (cung cấp giá vé.Các ứng dụng có tích hợp dịch vụ Web đã không còn là xa lạ. tỷ giá hối đoái. Bất kì một lĩnh vực nào trong cuộc sống cũng có thể tích hợp với dịch vụ Web. đặc biệt trong điều kiện thương mại điện tử đang bùng nổ và phát triển không ngừng cùng với sự lớn mạnh của Internet.

đưa cho khách âm thanh hay hang sử dụng những dữ liệu số Thiết kế đồ hoạ hoặc ở dạng bảng đẹp: Trang Web hoặc ở nhiều hình tĩnh thường thức khác nữa. Trang web web được gửi tới trình . Do vậy. + Sử dụng các giao thức và chuẩn mở.17 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 có hiệu quả bởi thời đại ngày nay là thời đại của truyền thông và trao đổi thông tin qua mạng. Ưu điểm Nội dung thông tin hữ ích thông tin hiển thị được gọi ra từ một cơ sở dữ liệu khi -Người dùng người dùng truy ghé thăm trang vấn tới một trang web. việc phát triển và tích hợp các ứng dụng với dịch vụ Web đang được quan tâm phát triển là điều hoàn toàn dễ hiểu. hình ảnh.Nhà sản xuất duyệt gồm những câu chữ. + Nâng cao khả 17 . Giao thức và định dạng dữ liệu dựa trên văn bản (text). được trình bày Thông tin trên ấn tượng và web luôn luôn cuốn hút hơn mới vì nó dễ dàng trang web động được bạn thường về phần mỹ xuyên cập nhật thuật đồ hoạ vì + Dịch vụ Web cung cấp khả năng hoạt động rộng lớn với các ứng dụng phần mềm khác nhau chạy trên những nền tảng khác nhau. giúp các lập trình viên dễ dàng hiểu được.

Thân thiện hơn với các máy tìm kiếm (search engine) : Bởi vì địa chỉ URL của các . hạ giá thành hoạt động.Tốc độ truy cập nhanh: Tốc độ truy cập của người dùng vào các trang web tĩnh nhanh hơn các trang web động vì không mất thời gian trong việc truy vấn cơ sở dữ liệu như các trang web động. . giảm sự phức tạp của hệ thống. . phát triển hệ thống nhanh và tương tác hiệu quả với hệ thống của các doanh nghiệp khác. Bạn hoàn toàn có thể dễ dàng quản trị nội dung và điều hành website của mình thông qua các năng tái sử dụng.Chi phí đầu tư thấp: Chi phí xây dựng website tĩnh thông qua việc Bạn sử dụng các công cụ cập nhật của các phần mềm quản trị web .…trong trang web tĩnh không chứa dấu chấm hỏi (?) như trong web động.Web có tính tương tác với người sử dụng cao. Vì vậy website được hỗ trợ bởi cơ sở dữ liệu là phương tiện trao đổi thông tin nhanh nhất với người dùng Internet. Thông tin luôn được cập nhật trong một cơ sở dữ liệu và người dùng Internet có thể xem những chỉnh sửa đó ngay lập tức. Điều dễ nhận thấy là những website thường xuyên được cập nhật sẽ thu hút nhiều khách hàng tới thăm hơn những web site ít có sự thay đổi về thông tin. + Tạo mối quan hệ tương tác lẫn nhau và mềm dẻo giữa các thành phần trong hệ thống. dễ dàng cho việc phát triển các ứng dụng phân tán.html. Với web động. . 18 .18 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 chúng ta có thể hoàn toàn tự do trình bày các ý tưởng về đồ hoạ và mỹ thuật trên toàn diện tích từng trang web tĩnh. . + Thúc đẩy hệ thống tích hợp. .htm. + Thúc đẩy đầu tư các hệ thống phần mềm đã tồn tại bằng cách cho phép các tiến trình/chức năng nghiệp vụ đóng gói trong giao diện dịch vụ Web.

lập trình we Nhược điểm Xét về mặt kỹ thuật. 19 . phần mềm hỗ trợ mà không nhất thiết Bạn cần phải có kiến thức nhất định về ngôn ngữ html. thông tin trên web là đóng (nội dung tĩnh) và chỉ chỉnh sửa được từ bên ngoài thông qua người quản trị web.0 tập trung vào khía cạnh trình bày. có thể lỗi nếu một máy khách không được nâng cấp. do đó không có tính “động”. + Phải quan tâm nhiều hơn đến vấn đề an toàn và bảo mật. + Có quá nhiều chuẩn cho dịch vụ Web khiến người dùng khó nắm bắt. không có khả năng tạo ra từ nội dung có sẵn. chi phí yêu cầu hệ điều hành tương thích (nếu có).19 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 thấp hơn nhiều so với website động vì không phải xây dựng các cơ sở dữ liệu. lập trình phần mềm cho website và chi phí cho việc thuê chỗ cho cơ sở dữ liệu. Khó khăn trong + Những thiệt hại lớn sẽ xảy ra vào khoảng thời gian chết của Dịch vụ Web. thiếu các giao thức cho việc vận hành. giao diện không thay đổi. Công nghệ web 1.

20 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 việc thay đổi và cập nhật thông tin: Muốn thay đổi và cập nhật nội dung thông tin của trang website tĩnh Bạn cần phải biết về ngôn ngữ html. sử dụng được các chương trình thiết kế đồ hoạ và thiết kế web cũng như các chương trình cập nhật file lên server.Khó tích hợp. nâng cấp. không thân thiện với người dùng: Do nội dung trên trang web tĩnh được thiết kế cố định nên khi nhu cầu về thông tin của người truy cập tăng cao thì thông tin trên website tĩnh sẽ không đáp ứng được. .Thông tin không có tính linh hoạt. nâng 20 . . mở rộng: Khi muốn mở rộng.

21 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 cấp một website tĩnh hầu như là phải làm mới lại website. 21 .

Khi đó. nó được sử dụng để định nghĩa các thành phần dữ liệu trên trang web và cho những tài liệu B2B. các thẻ có thể được lập trình viên tự tạo ra trên mỗi trang web và được chọn là định dạng thông điệp chuẩn bởi tính phổ biến và hiệu quả mã nguồn mở.1. XML hoàn toàn có cấu trúc thẻ giống như ngôn ngữ HTML nhưng HTML định nghĩa thành phần được hiển thị như thế nào thì XML lại định nghĩa những thành phần đó chứa cái gì.1 XML Là một chuẩn mở do W3C đưa ra cho cách thức mô tả dữ liệu. Các công nghệ dịch vụ Web và Web ngữ nghĩa 3. tất cả dữ liệu sẽ được chuyển sang định dạng thẻ XML.22 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 III. các thông 22 . Do dịch vụ Web là sự kết hợp của nhiều thành phần khác nhau nên nó sử dụng các tính năng và đặc trưng của các thành phần đó để giao tiếp. XML là công cụ chính để giải quyết vấn đề này và là kiến trúc nền tảng cho việc xây dựng một dịch vụ Web. Với XML. Về hình thức.1 Các công nghệ dịch vụ Web Hình 3 Semantic Web architecture stack 3.

.Phần tử gốc .1. thông thường sử dụng giao thức HTTP. Nó được xem là cấu trúc xương sống của các ứng dụng phân tán được xây dựng từ nhiều ngôn ngữ và các hệ điều hành khác nhau. 3.Phần tử đưa ra các thông tin về lỗi -fault.23 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 tin mã hóa sẽ hoàn toàn phù hợp với các thông tin theo chuẩn của SOAP hoặc XMLRPC và có thể tương tác với nhau trong một thể thống nhất. những chứ ký số.body.3 Kiến trúc một thông điệp theo dạng SOAP Thông điệp theo định dạng SOAP là một văn bản XML bình thường bao gồm các phần tử sau: . Header còn có thể mang những dữ liệu chứng thực. SOAP là giao thức thay đổi các thông điệp dựa trên XML qua mạng máy tính. Nói cách khác chúng ta có thể truy xuất đến UDDI registry bằng các lệnh gọi hoàn toàn theo định dạng của SOAP. . 23 . chứa các thông tin yêu cầu và thông tin được phản hồi. cung cấp thông tin lỗi xảy ra trong qúa trình xử lý thông điệp. SOAP là một giao thức giao tiếp có cấu trúc như XML. khai báo văn bản XML như là một thông điệp SOAP. 3. phần tử này không bắt buộc khai báo trong văn bản. thông tin mã hóa hay cài đặt cho các giao dịch khác.envelop: phần tử bao trùm nội dung thông điệp.Phần tử khai báo nội dung chính trong thông điệp . Cả SMTP và HTTP đều là những giao thức ở lớp ứng dụng của SOAP nhưng HTTP được sử dụng và chấp nhận rộng rãi hơn bởi ngày nay nó có thể làm việc rất tốt với cơ sở hạ tầng Internet.2 SOAP Chúng ta đã hiểu cơ bản dịch vụ Web như thế nào nhưng vẫn còn một vấn đề khá quan trọng.1. Một client sẽ gửi thông điệp yêu cầu tới server và ngay lập tức server sẽ gửi những thông điệp trả lời tới client.Phần tử đầu trang – header: chứa các thông tin tiêu đề cho trang. . Đó là làm thế nào để truy xuất dịch vụ khi đã tìm thấy? Câu trả lời là các dịch vụ Web có thể truy xuất bằng một giao thức là Simple Object Access Protocol – SOAP.

24 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Một SOAP đơn giản trong body sẽ lưu các thông tin về tên thông điệp. được sử dụng khi yêu cầu được đáp ứng) và cuối cùng là fault message (thông báo tình trạng lỗi). Kiểu truyền thông: Có 2 kiểu truyền thông . Có 3 kiểu thông báo sẽ được đưa ra khi truyền thông tin: request message(tham số gọi thực thi một thông điệp). . date…) hay những kiều phức tạp hơn như struct. Mã hóa: Giả sử service rquester và service provider được phát triển trong Java.Document: được biết đến như kiểu hướng thông điệp. Nếu một kiểu dữ liệu được sử dụng dưới một dạng mã hóa thì sẽ có một ánh xạ tồn tại trong bộ đăng ký của môi trường thực thi SOAP đó. Hai kiểu truyền thông này cung cấp các định dạng thông điệp. respond message (các tham số trả về. Bất kỳ một môi trường thực thi SOAP nào cũng phải có một bảng chứa thông tin ánh xạ nhằm chuyển đổi từ ngôn ngữ Java sang XML và từ XML sang Java . Cấu trúc dữ liệu: Cung cấp những định dạng và khái niệm cơ bản giống như trong các ngôn ngữ lập trình khác như kiểu dữ liệu (int. nó cung cấp giao tiếp ở mức trừu tượng thấp. tham số. một hoặc nhiều tham số. khi đó mã hóa SOAP là làm thế nào chuyển đổi từ cấu trúc dữ liệu Java sang SOAP XML và ngược lại. lời gọi đến các API khác nhau nên việc sử dụng chúng tùy thuộc vào thời gian và sự phù hợp với dịch vụ Web cần xây dựng. array. 24 .Remote procedure call (RPC): cho phép gọi hàm hoặc thủ tục qua mạng. tham chiếu tới một thể hiện của dịch vụ. Kiểu này được khai thác bởi nhiều dịch vụ Web. bởi vì định dạng cho Web Service chính là XML. vector… Định nghĩa cấu trúc dữ liệu SOAP được đặt trong namespace SOAP-ENC. khó hiểu và yêu cầu lập trình viên mất công sức hơn.bảng đó được gọi là SOAPMappingRegistry. string.

WSDL thường được sử dụng kết hợp với XML schema và SOAP để cung cấp dịch vụ Web qua Internet. Một client khi kết nối tới dịch vụ Web có thể đọc WSDL để xác định những chức năng sẵn có trên server. ghi nhận thông tin về cách sử dụng và biết được đối tượng nào cung cấp dịch vụ. client có thể sử dụng SOAP để lấy ra chức năng chính xác có trong WSDL.Giao thức và kiểu mã hóa sẽ được sử dụng khi gọi các hàm của dịch vụ Web . thông tin nhận dạng… Những thông tin này cho phép các đối tượng khác xác định được dịch vụ.5 UDDI Để có thể sử dụng các dịch vụ. Tên. 3.Tên dịch vụ .1. UDDI định nghĩa một số thành phần cho biết các thông tin này.Loại thông tin: thao tác. 25 . những kiểu dữ liệu (có thể là giao diện của dịch vụ Web cộng với tên cho giao diện này).25 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 3. chẳng hạn tên giao dịch. Sau đó. địa chỉ.4 WSDL WSDL định nghĩa cách mô tả dịch vụ Web theo cú pháp tổng quát của XML.White pages: chứa thông tin liên hệ và các định dạng chính yếu của dịch vụ Web. Cả hai phần này sẽ được lưu trong 2 tập tin XML tương ứng là tập tin giao diện dịch vụ và tập tin thi hành dịch vụ.Cấu trúc UDDI : + Trang trắng . Giao diện của một dịch vụ Web được miêu tả trong phần này đưa ra cách thức làm thế nào để giao tiếp qua dịch vụ Web. bao gồm các thông tin: . . Một WSDL hợp lệ gồm hai phần: phần giao diện (mô tả giao diện và phương thức kết nối) và phần thi hành mô tả thông tin truy xuất CSDL. giao thức liên kết và định dạng thông điệp yêu cầu để tương tác với dịch vụ Web được đưa vào thư mục của WSDL. tham số. trước tiên client phải tìm dịch vụ.1. cho phép các client truy tìm và nhận những thông tin được yêu cầu khi sử dụng dịch vụ Web.

26 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 + Trang vàng . Những thông tin về dịch vụ Web được sử dụng và công bố lên mạng sử dụng giao thức này.Yellow pages: chứa thông tin mô tả dịch vụ Web theo những loại khác nhau.Green pages: chứa thông tin kỹ thuật mô tả các hành vi và các chức năng của dịch vụ Web. + Trang xanh .2 Các công nghệ Web ngữ nghĩa Hình 4 Semantic Web Stack 26 . 3. Những thông tin này cho phép các đối tượng thấy được dịch vụ Web theo từng loại với nó. + Loại dịch vụ .tModel: chứa các thông tin về loại dịch vụ được sử dụng. Nó sẽ kích hoạt các ứng dụng để tìm kiếm thông tin của dịch vụ Web khác nhằm xác định xem dịch vụ nào sẽ cần đến nó.

Web toàn bộ trang web. Một tài nguyên web có thể là một trang Web. SPARQL cho phép 1 truy vấn được bao gồm bộ ba các mẫu. SPARQL là công nghệ chủ chốt của Web ngữ nghĩa. + Object (đối tượng) : nội dung gán cho thuộc tính. RDF có cấu trúc. các liên từ. nghĩa là máy tính có thể hiểu được và có thể đọc được. các phép tuyển. là một “bộ khung” được sử dụng để mô tả các nguồn tài nguyên trên Internet. và tái sử dụng cấu trúc siêu dữ liệu. RDF cung cấp một cơ sở cho việc mã hóa. RDF cung cấp một mô hình dữ liệu. + Predicate (thuộc tính) : xác định tính chất của tài nguyên.2.2. và một cú pháp đơn giản sao cho các hệ thống độc lập có thể trao đổi và sử dụng nó. Các thành phần cơ bản của RDF : Tài nguyên (Resources) là tất cả những gì được mô tả bằng biểu thức RDF Thuộc tính (Properties) : sử dụng để mô tả một số khía cạnh cụ thể. RDF dựa trên cú pháp XML để mô tả thông tin cho một nguồn tài nguyên Web. trao đổi được thông tin trên web. RDF còn có khả năng biểu diễn ngữ nghĩa giữa chúng thông qua các tài nguyên được định danh bằng URI. ví dụ thay đổi. đặc điểm. Nó bao gồm 3 thành phần sau : + Subject (chủ thể) : địa chỉ hay vị trí tài nguyên muốn mô tả.1 RDF RDF (Resource Description Framework) là một ngôn ngữ được đề nghị bởi W3C . thuộc tính. 3. 27 . hoặc mối quan hệ của các nguồn tài nguyên nhất định Phát biểu (Statements) : được sử dụng để mô tả thuộc tính (properties) của tài nguyên.2 SPARQL SPARQL đề cập đến giao thức SPARQL và ngôn ngữ truy vấn RDF là một ngôn ngữ truy vấn RDF để xác định ngôn ngữ truy vấn và giao thức truy nhập dữ liệu chuẩn được sử dụng cho mô hình dữ liệu RDF. SPARQL làm việc với bất cứ nguồn dữ liệu nào có thể ánh xạ thành RDF. hoặc bất kỳ mục trên các trang web có chứa thông tin trong một số form. tuy nhiên XML chỉ mô tả dữ liệu.27 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 3. các mẫu tuỳ chọn.

tích hợp mức doanh nghiệp và để chia sẻ cũng như tái sử dụng dữ liệu trên Web 28 . các thông tin OWL có thể dễ dàng trao đổi giữa các kiểu hệ thống máy tính khác nhau. Mục đích chính của OWL là sẽ cung cấp các chuẩn để tạo ra một nền tảng để quản lý tài sản. các kết quả được trả về trong một định dạng bảng. Truy vấn CONSTRUCT: Sử dụng để trích xuất thông tin từ SPARQL endpoint và chuyển kết quả thành dạng RDF hợp lệ. OWL được thiết kế đặc biệt để cung cấp một cách thức thông dụng trong việc xử lý nội dung thông tin của Web.3 OWL OWL (The Web Ontology Language) là một ngôn ngữ gần như XML dùng để mô tả các hệ cơ sở tri thức. Truy vấn ASK: Sử dụng để cung cấp các kết quả dạng True/False đơn giản cho các truy vấn trên SPARQL endpoint Truy vấn DESCRIBE: Sử dụng để trích xuất một đồ thị RDF từ SPARQL endpoint.28 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Ngôn ngữ SPARQL đặc tả 4 loại truy vấn khác nhau cho các mục đích khác nhau.2.OWL là một ngôn ngữ đánh dấu dùng để xuất bản và chia sẻ dữ liệu trên Internet thông qua những mô hình dữ liệu gọi là “ontology”. sử dụng các hệ điều hành và các ngôn ngữ ứng dụng khác nhau. OWL biểu diễn ý nghĩa của các thuật ngữ trong các từ vựng và mối liên hệ giữa các thuật ngữ này để đảm bảo phù hợp với quá trình xử lý bởi các phần mềm. OWL được xem như là một kỹ thuật trọng yếu để cài đặt cho Semantic Web trong tương lai. Ngôn ngữ này được kỳ vọng rằng sẽ cho phép các hệ thống máy tính có thể đọc được thay thế cho con người OWL được viết bởi XML. các nội dung đó được đưa tới endpoint để quyết định dựa trên những thông tin có ích. Truy vấn SELECT: Sử dụng để trích xuất các giá trị thô từ SPARQL endpoint. Mỗi dạng truy vấn đều dùng khối lệnh bên trong từ khóa WHERE để hạn chế truy vấn mặc dù trường hợp truy vấn DESCRIBE từ khóa WHERE là tùy chọn.Ontology mô tả một lĩnh vực (domain) và diễn tả những đối tượng trong lĩnh vực đó cùng những mối quan hệ giữa các đối tượng này. 3.

RDF và RDFS. Khám phá là một hành động xác định mô tả máy xử lý của một dịch vụ web có thể đã biết từ trước và đáp ứng các tiêu chí chức năng nhất định. 4. và vì OWL ra đời sau các ngôn ngữ này. IV. yêu cầu đại diện của nhà cung cấp hoặc đại diện khác. Hình 3-2: “quá trình khám phá” mở rộng trên hình 1-1: mô tả quá trình việc tham gia một dịch vụ web khi khám phá dịch vụ được sử dụng 29 . nó có khả năng biểu diễn các nội dung mà máy có thể biểu diễn được trên Web. Đó là một hợp lý và có thể được thực hiện bởi đại diện. Mục đích là để tìm thấy một dịch vụ web thích hợp Khám phá dịch vụ là một dịch vụ tạo điều kiện cho quá trình thực hiện ra dịch vụ đó.29 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 OWL được phát triển bởi nó có nhiều tiện lợi để biểu diễn ý nghĩa và ngữ nghĩa hơn so với XML. sau đó là thực thể yêu cầu cần phải “khám phá” một ứng viên thích hợp.1 Khám phá dịch vụ Quá trình khám phá dịch vụ Nếu thực thể yêu cầu mong muốn sự tương tác với đại diện cung cấp dịch vụ và nó không thật sự biết những gì đại diện của nhà cung cấp dịch vụ muốn tham gia.

30 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Hình 1-1: Tổng quát về quá trình tham gia một dịch vụ web Hình 3-2: Quá trình khám phá 30 .

sau đó đơn vị cung cấp có thể chủ động xuất bản mô tả dịch vụ và mô tả chức năng trực tiếp khám phá dịch vụ.31 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Dịch vụ tham gia sử dụng trong quá trình khám phá dịch vụ được tiến hành trong các bước sau: 1. b. Có thể xác định một dịch vụ có một số chức năng theo mong muốn hoặc ngữ nghĩa. Khám phá dịch vụ bằng cách nào đó được cả hai mô tả dịch vụ web(“WSD” trong hình 3-2) và một mô tả liên quan đến chức năng dịch vụ(“FD”). với đơn vị cung cấp không có kiến thức về nó hoặc nếu khám phá dịch vụ được thực hiện như một đăng kí( như UDDI). Kiến trúc này không nêu ra hoặc quan tâm tới cách để khám phá dữ liệu thu được bản mô tả dịch vụ và mô tả chức năng. DAML-S hoặc OWL-S. tuy nhiên có thể xác định “phi chức năng” cần liên quan đến các đại lý của nhà cung cấp. tiêu chuẩn về hiệu năng và độ tin cậy hoặc 31 . chẳng hạn như tên của đơn vị cung cấp. khả năng và đặc điểm tiềm năng khác. việc thu thập bản mô tả dịch vụ ở bất cứ nơi nào nó tìm thấy chúng. Mô tả chức năng(“FD” trong hình 3-2) là một mô tả quá trình xử lý các chức năng( hoặc một ngữ nghĩa) của dịch vụ mà đơn vị cung cấp có cung cấp. Các đối tượng yêu cầu và nhà cung cấp “được biết đến với nhau” a. Ví dụ. Đơn vị yêu cầu cung cấp các tiêu chí khám phá dịch vụ để lực chọn một mô tả dịch vụ web dựa trên bản mô tả chức năng liên quan. Nó có thể đơn giản như một từ của siêu dữ liệu hoặc một URI hoặc có thể phức tạp hơn chẳng hạn như một Tmodel( trong UDDI) hoặc một tập lệnh của RDF. nếu khám phá dữ liệu được thực hiện như một công cụ tìm kiếm sau đó nó có thể thu thập dữ liệu web.

Mặc dù điều này thường có thể đạt được bởi đơn vị cung cấp xác định các ngữ nghĩa và cung cấp cho họ cái mất hoặc cái được cơ bản cho đơn vị yêu cầu và có thể đạt được bằng cách khác.32 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 các tiêu chí liên quan đến đơn vị cung cấp chẳng hạn như đánh giá các đơn vị cung cấp c. Đơn vị yêu cầu và đơn vị cung cấp thông đổi thông điệp SOAP thay mặt cho chủ sở hữu của họ. Bên yêu cầu và đơn vị cung cấp đồng ý về ngữ nghĩa(“Sem” trong hình 3-2) của hợp tác mong muốn. Nếu có nhiều mô tả dịch vụ trả về các đơn vị yêu cầu lựa chọn ra một và có thể sử dụng các tiêu chí bổ sung thêm. Khám phá dịch vụ trả về một hoặc nhiều mô tả dịch vụ web( hoặc những tài liệu tham khảo) đáp ứng các tiêu chuẩn quy định. Tuy nhiên. Theo tự động khám phá. Điều quan trọng là các bên phải đồng ý( theo nghĩa được mô tả trong Sử dụng dịch vụ web) ngữ nghĩa bất kể làm thế nào để đạt được. Bước này cũng yêu cầu các bên đồng ý( theo nghĩa được mô tả trong Sử dụng dịch vụ web) trên mô tả cũng dịch vụ được sử dụng. 2.c có hiệu lực các đối tượng yêu cầu và đơn vị cung cấp đã làm như vậy 3. Theo hướng dẫn khám phá một người yêu cầu sử dụng một dịch vụ khám phá ra để xác định và chọn một mô tả dịch vụ đáp ứng các tiêu chí trức năng và mong muốn. Ví dụ cả hai bên có thể áp dụng một số tiêu chuẩn của dịch vụ ngữ nghĩa được xác định bởi một số cơ quan đưa ra các tiêu chuẩn.2 Hướng dẫn tự động khám phá dịch vụ Quá trình khám phá các mô tả ở đây không cụ thể về một ai đó hay cái gì đó trong đơn vị yêu cầu thực hiện việc khám phá ra. Mô tả dịch vụ và ngữ nghĩa là đầu vào hoặc thể hiện ở trong đơn vị yêu cầu nhà đơn vị cung cấp khi được thích hợp 4. các đơn 32 . kể từ khi đơn vị yêu cầu được mô tả dịch vụ web ở bước 1. 4.

Peer to Peer.1 Phương pháp đăng kí(registry) Là một đăng kí có thẩm quyền. trade-offs) Hiện nay. chỉ số. Trong trường hợp tự khám phá sự cần thiết cho máy móc xử lý ngữ nghĩa được tăng lên rất nhiều Một tình huống mà trong đó sự tự khám phá thường cần thiết khi các đơn vị yêu cầu tương tác với một đại diện cung cấp cụ thể nhưng vì một lý do nào đó cần để thay đổi sự lựa chọn đơn vị cung cấp dịch vụ hoặc các đơn vị cung cấp dịch vụ trước đó không còn nữa hoặc lý do khác. các khó khăn và nhu cầu khác nhau. . Index. Mặc dù các bước tương tự trong cả hai trường hợp.Cần để chuẩn hóa. Chúng ta sẽ tìm hiểu sự khác hay và các phương pháp đó dùng cho mục đích gì là tốt cho từng trường hợp. 4.Tin tưởng: mọi người không nhất thiết là tin tưởng máy móc để thực hiện các quyết định mà có thể có các hậu quả quan trọng. có 3 phương pháp phổ biến để khai phá dịch vụ: đăng kí. 4.3 Các phương pháp khám phá (Registry. trung tâm điều khiển thông tin 33 . Đó là ít cần thiết để tiêu chuẩn hóa một giao diện hoặc giao thức mà con người sử dụng hơn so với những những máy móc được dùng để sử dụng. peer to peer.Yêu cầu giao tiếp: Các yêu cầu cho một cái gì đó là dự định cho sự tương tác của con người là rất khác nhau từ các yêu cầu cho một thứ gì đó là nhằm cho sự tương tác các máy với nhau . chẳng hạn như: .3.33 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 vị yêu cầu thực hiện công việc này hoặc là thời điểm thiết kế hoặc thời gian chạy.

Trong trường hợp của một đăng kí 2. cập nhật hoặc đăng kí.3. Khi mô tả đã được đưa ra.Đưa ra một mô tả dịch vụ yêu cầu phải có một bước tiến tích cực bởi nhà cung cấp dịch vụ được nêu ra một các rõ ràng các thông tin đăng kí trước khi thông tin đó được cung cấp cho những người khác.Chủ sở hữu đăng kí đó có quyền quyết định người nào có quyền để đặt thông tin.Bất cứ ai có thể tạo ra chỉ số riêng cho mình. Người khác không thể đọc lập thay đổi thông tin đó UDDI được xem là một ví dự về phương pháp đăng kí. 34 . ví dụ một công ty X sẽ không thể đăng kí một mô tả chức năng của dịch vụ mà bên công ty B sở hữu. Điều này có nghĩa là. phương pháp chỉ số là một trình biên dịch hay hướng dẫn thông tin tồn tại ở những nơi khác. một bên thứ 3 khác không thể đưa ra một bản mô tả khác của người khác trong đăng kí R. Trong trường hợp này: .Đưa ra bị động: nhà cung câp đưa ra các dịch vụ và mô tả chức năng của nó trên web và những người quan tâm ( người sở hữa chỉ số) thu thập chúng mà không được nhà cung cấp hỗ trợ kĩ thuật. họ có thể khai thác bằng cách sử dụng mạng liên kết và sắp xếp vào chỉ số.34 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 1.2 Phương pháp chỉ số(index) Ngược lại với phương pháp đăng kí. Nhiều tổ chức có thể cùng một chỉ số. . 4. thậm chí nếu mô tả có thể có giá trị với những người khác nhau và tốt hơn trong mô tả của công ty B 3. Mặc dù chủ sở hữu của đăng kí R có thể ủy quyền cho phép cho các đơn vị cung cấp dịch vụ đã được chấp nhận đưa ra bản mô tả dịch vụ của riêng mình. nhưng nó cũng có thể được sử dụng nhưng một chuẩn. Nó không thể quyết định và tập trung kiểm soát thông tin mà nói tham chiếu. Chủ sở hữu đăng kí quyết định thông tin nào được đưa ra trong đăng kí.

Thay vì cho phép các dịch vụ web tự động khám phá lẫn nhau. sự khác nhau chính đó là một sự kiểm soát: ai là người kiểm soát cái gì và làm thế nào để mô tả dịch vụ được khám phá trong phương pháp đăng kí người chủ sở hữu của đăng kí chính là người kiểm soát. Trong phương pháp chỉ số bất kì ai cũng có thể tạo cho mình một chỉ số các thị trường tự do xác định những chỉ số trở nên phổ biến. nó có hiệu quá trong kiểm soát thị trường và làm thế nào để mô tả dịch vụ được khám phá.một số chỉ số đầy đủ một số khác thi đã bị cắt bớt đi .Thông tin chứa trong một chỉ số có thể được ra trong ngày. Tuy nhiên kể từ khi chỉ số chỉ đến thông tin có thẩm quyền. Theo quan điểm này dịch vụ web là một nút trong mạng lưới các cùng tầng có thể hoặc không phải là dịch vụ web. .Những chỉ số có thể bao gồm thông tin của 3 bên .Những chỉ số khác nhau có thể những thông tin khác nhau . một đại diện 35 . Trong thời gian khám phá. Thật vậy UDDI có thể được sử dụng như một phương tiện để thực hiện một chỉ số cá nhân: chỉ cần liên kết web và đặt kết quả vào UDDI đăng kí. Thay vào đó.3 Phương pháp Peer to Peer(P2P) Peer to Peer(P2P) là phương pháp tính toán để cung cấp một sự thay thế mà không dự trên đăng kí tập trung.35 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 .3. Do đó. 4.Các thị trường tự do xác định người đưa ra chỉ số này sử dụng để khám phá ra các thông tin mà họ tìm kiếm Google được coi là một ví dụ của phương pháp chỉ số Điều quan trọng cần lưu ý là sự khác biệt giữa 2 phương pháp này là đăng kí và chỉ số không phải chỉ đơn thuần là sự khác biệt giữa đăng kí với chính nó và chỉ số một các độc lập. thông tin có thể được xác minh khi sử dụng.

Kiến trúc P2P không phải một điểm duy nhất của thất bại. Đăng kí tập trung có thể thích hợp trong môi trường tĩnh hơn hoặc kiểm soát thông tin này không thay đổi thường xuyên.4 Khám phá dịch vụ Trade-Offs Bởi vì những ưu điểm và nhược điểm của phương pháp P2P. kể từ khi bất kì nút sẽ trả lời cho các truy vấn mà nó nhận được. Độ tin cậy của nhà cung cấp được đánh giá bằng các kết nối cao của hệ thống P2P đi kèm với chi phí thực hiện và thiếu sự dự đoán đường đi tuyên truyền. Chỉ số thích hợp trong môi trường cần có quy mô lờn có sự cạnh tranh và sự đa dạng trong các chiến lược lập chỉ số. có nghĩa là hầu hết thời gian nút hoạt động như là một relayer của thông tin có thể không quan tâm đến bản thân các nút. có thể là không đảm bảo rằng một yêu cầu sẽ lan rộng trên toàn bộ mạng. Hơn nữa. Bất khì nút nào trong mạng P2P đã có để cung cấp các nguồn lực cần thiến để đảm bảo những truy vấn và định tuyến đáp ứng. Nếu không mỗi câu lệnh truy vấn các đại diện khác lân cận và lan truyền truy vấn thông qua mạng lưới cho đến khi đạt được một số kết quả hoặc có chỉ tiêu cụ thể để kết thúc. Hệ thống P2P thích hợp hơn trong các môi trường năng động trong đó giới hạn khoảng cách cần thiết của tuyên truyền yêu cầu.3. Kiến trúc Peer to Peer(P2P) không cần một trung tâm đăng kí. 4. Nếu bất kì một trong một các đối tượng tìm kiếm phù hợp với yêu cầu thì sẽ được trả về.36 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 yêu cầu câu lệnh truy vấn các đại diện khác trong việc tìm kiếm một dịch vụ web phù hợp. đăng kí khác nhau trade-offs làm cho những phương pháp thích hợp trong các tình huống khác nhau. do đó không có đảm bảo để tìm các nhà cung cấp dịch vụ. Hơn nữa mỗi nút có thể chứa chỉ mục riêng của mình những dịch vụ web hiện có. 36 . Điều này dẫn đến kém hiệu quả và chi phí lớn đặc biệt là khi các nút trở nên nhiều hơn và tăng kết nối. chẳng hạn như máy tính ở mọi nơi. chỉ số. chẳng hạn như một trung tâm đăng kí.

yêu cầu dịch vụ web cần phải sử dụng một dịch vụ khám phá có thể có được các thông tin nhiều hơn một đăng kí hoặc chỉ số. Một công cụ lập chỉ mục có thể đã bắt gặp một đăng kí và dựa vào thông tin thu được 37 . Ví dụ một đăng kí dành riêng cho một dịch vụ du lịch hàng không có thể biết một đăng kí dàng riêng cho dịch vụ du lịch đường sắt. Nói chung đăng kí dịch vụ đường sắt và đường không có thể chia sẻ dựa trên nguyên tắc phân loại phổ biến để tránh chuyển tiếp truy vấn không phù hợp với đăng kí khác. Kết hợp các khả năng để tạo ra các kết quả của câu truy vấn hơn một đăng kí hay chỉ số duy nhất và làm cho chúng xuất hiện giống như một dịch vụ duy nhất. Việc đăng kí du lịch nói chung có thể đã khám phá dịch vụ du lịch đường sắt bằng cách sử dụng phương phương pháp tiếp cận mạng lưới hoặc chỉ số. Trong trường hợp này chúng ta giả đăng kí dịch vụ nói chung để truy vấn từ bên yêu cầu và do đó sẽ không chuyển các truy vấn đăng kí dịch vụ hàng không. Một tìm kiếm của đăng kí du lịch nói chung có thể trả về để giới thiệu cho người yêu cầu chỉ cho họ để đăng kí du lịch đường sắt.4 Kết hợp các phương pháp khám phá Mặc dùng quan điểm đăng kí là một các tiếp cận tập trung hơn để khám phá ra nhiều hơn so với phương pháp tiếp cận chỉ số sẽ phát sinh tình huống nơi mà tồn tại nhiều đăng kí trên web. Kết hợp các kết quả trong trường hợp này trái ngược với giới thiệu sẽ yêu cầu đăng kí dịch vụ du lịch chung để gửi một câu lệnh truy vấn để đăng kí du lịch đường sắt thay cho người yêu cầu. Việc đăng kí dịch vụ nói chung sao đó sẽ kết hợp với các với các câu lệnh truy vấn để đăng kí dịch vụ đường sắt với các kết quả của một truy vấn để đăng kí riêng của mình. Một đăng kí thứ 3 cho các dịch vụ du lịch nói chung có thể chứa thông tin về một dịch vụ nhưng có thể xem xét để đăng kí cho một số loại dịch vụ khác. Trong môi trường như vậy. Người ta cho rằng nhiều chỉ số cũng sẽ tồn tại.37 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 4. Một đăng kí hoặc chỉ số có thể chứa thông tin về đăng kí hoặc chỉ số khác để hỗ trợ sự kết hợp.

một ngôn ngữ thích hợp để đại diện cho mô tả chức năng ít nhất cũng là: . 4. . nó có thể là thích hợp để sử dụng ngôn ngữ mô tả một vũ đạo.Rõ ràng .5 Các chức năng mô tả và khám phá Yêu cầu khám phá một dịch vụ web đòi hỏi khả năng tìm kiếm các dịch vụ web dựa trên mô tả chức năng(“FD” trong hình 3-2) hoặc tiêu chuẩn khác. Một phương pháp khác sẽ cho đăng ký du lịch đường sắt cho công bố thông tin để đăng ký du lịch nói chung và sử dụng phân loại được chia sẻ có thể phân loại chính nó như là một đăng ký cho các dịch vụ du lịch đường sắt. Bởi vì những mô tả chức năng đòi hỏi các phải có máy xử lý được bằng văn bản do nhiều đơn vị cung cấp dịch vụ và đọc nhiều bởi các đơn vị yêu cầu. Đây là một lĩnh vực cần tiếp tục việc tiêu chuẩn hóa. Lưu ý rằng mỗi đăng ký hoặc chỉ số có thể cung cấp một dịch vụ web để phát hiện.Có khả năng thể hiện các từ vựng và mối quan hệ giữa các chức năng hiện có và mới. do đó. Một trong những lỗ lực đó là OWL-S 38 .Có khả năng thể hiện bất kì chức năng hiện tại hoặc tương lai.38 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 từ lớp đăng kí như là một đăng kí đường sắt.Web thân thiện( dựa trên URIs và khả năng mở rộng trên toàn cầu). . dàn nhạc để mô tả sự trao đổi giữa các dịch vụ cần thiết cho liên kết.

1 Các phương pháp khám phá 5.An Ontology for Semantic Web Services) Dựa theo tài liệu này. -Service discovery: sử dụng các dịch vụ web phù hợp với bước trên để tiến sát hơn các dịch vụ thực tế sau giao diện web. các mô tả dịch vụ . 5. 39 .1. Khám phá dịch vụ Web ngữ nghĩa (Dựa theo tài liệu: Web Service Modeling Ontology (WSMO) . KD không phải là biện pháp tốt cho việc định nghĩa ngữ nghĩa và nó có giới hạn bởi vì nó không tường minh trong ngôn ngữ tự nhiên. Lựa chọn KD khi muốn tìm mối quan hệ giữa các từ khóa được cung cấp bởi người dùng hoặc lấy từ những bản thể học (Ontologies) chứa các mục tiêu/dịch vụ chính thức. Với mục đích đó. tái sử dụng hoặc chính thức hóa các mục tiêu đó.1 Keyword-based Discovery Là một biện pháp ban đầu cho thực hiện khám phá dịch vụ web. chúng ta sẽ làm rõ trên việc biểu hiện ngôn ngữ. nhưng KD vẫn được sử dụng cho việc lọc và sắp xếp nhanh chóng một khối đồ sộ các mục tiêu. Bây giờ chúng ta sẽ chọn một mục tiêu và tập các dịch vụ web để xem xét cho ánh xạ các tiến trình để định nghĩa và sẵn sàng các công cụ khám phá. lí luận chứng minh các công cụ cần cho việc ánh xạ bằng việc giới thiệu các phương pháp khám phá.39 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 V. khung khái niệm được phân biệt rõ ràng 3 bước chính trong việc khám phá: -Goal discovery: Bước này nói về việc trừu tượng hóa các mục tiêu cụ thể của khách hàng để định nghĩa trước. công đoạn cuối cùng kiểm tra việc các dịch vụ có được thực hiệncác mục tiêu của người yêu cầu chúng hay không. Về cơ bảnđược hiểu là ánh xạ từ khóa từ tập các yêu cầu người dùng sang các khái niệm định danh từ các bản thể có sẵn. Để thiết kế một KD tốt thì phải cơ cấu một bộ các câu hỏi đã được trả lời. -Web service discovery:Công đoạn này có sự liên hệ với việc chính thức hóa các mục tiêu và chính thức hóa các dịch vụ web hay là việc chọn lựa dịch vụ web có khả năng thường xuyên được yêu cầu.

Như vậy. b.40 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Một các tiếp cận khác cho KD với thể thức logic. Tuy nhiên. RACER cung cấp hiệu quả sắp xếp các lí luận cho SHIQ với nguyên lí chưa hoàn thiện trong danh sách. chúng ta có thể lợi dụng sự sắp xếp hiệu quả các lí luận như RACER. FACT++. Hướng đi này khá phức tạp khi lựa chọn các định lí thực trong nguyên mẫu hoặc khía cạnh khác cho việc thực thi kiểm tra trách nhiệm. Chúng ta sẽ khép lại cái nhìn với tên của 2 Hệ thống riêng biệt là Vampire và SNARK. Đây là cách tiếp cận các phần biến thể lõi WSML cơ sở. 40 . Trạng thái không hạn chế Chúng ta không phải giới hạn ngôn ngữ mong muốn cho việc định nghĩa các dịch vụ web hay các goal. thuộc tính của chúng hiện sử dụng. Thu hẹp DL Ở phiên bản trên. Pellet. FACT++ cung cấp SHIF(D).2 Discovery Based on Simple Descriptions of Services a. Một cụm các lí luận ứng viên có giá trị có thể được dùng cho Việc thực thi nguyên mẫu. WSML DL (trong WSML đầy đủ) khá tốt. nhiều yêu cầu dùng các định lí chứng minh chính thức đầy đủ trong ngôn ngữ đầu tiên để kiểm tra trách nhiệm thêm vào phụ lục tài liệu. KD nguyên bản mô tả không rõ ràng khi sử dụng logic. 5. Lúc này các từ khóa sẽ xác nhận tốt hơn bởi vì định danh của chúng đã được chọn lưu trữ ngữ nghĩa bởi các tính chất. Mỗi từ khóa tìm kiếm được thể hiện ánh xạ trong các quy định của phương diện người dùng và định danh thuộc tính tình các phương diện khác.1. không giới hạn được phép biểu hiện cho mô tả các mục đích và dịch vụ web. nếu chúng ta giới hạn WSML DL cú pháp của OWL DL. Kết quả là phương pháp này không khả thi với những yêu cầu trên biến thể WSML .

 Sắp xếp mối quan hệ một mục tiêu đã được tinh chế cùng với các dịch vụ được phân loại đã được tính toán cho yêu cầu phân loại (mặc dù ta biết rằng số trang web dự kiến có số lượng lớn hơn nhiều so với số mục tiêu tinh chế). 41 . DBSD được thể hiện trong Semantic web Fred dự án SWF sử dụng Logic Sắp xếp cho việc thiết lập các mô hình tính toán phức tạp. Các thử nghiệm của dự áncho thấy việc đung định lí sắp xếp phát hiện thiết lập trên nguyên tắc bao hàm có thể kiểm tra các dịch vụ có sẵn riêng lẻ. 5. chúng ta cần nắm được thự sực quan hệ giữa các đầu vào và đầu ra/kết quả của thực thi dịch vụ web cho tốt và chính thức hóa ngôn ngữ lệnh đầu tiên.41 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Pellet cung cấp các lí luận mạnh hoàn thiện cho OWL DL ngoài định danh SHIN(D) và OWL ngoài các đặc tính đảo ngược(SHON(D)) và mạnh nhưng không hoàn thiện trong OWL DL đầy đủ (SHOIN(D)). Luật này yêu cầu mô tả những mục tiêu và dịch vụ web xác đinh trước đó .1. Thiết lập dựa trên mô hình Về mô hình thiết lập cơ sở tiếp cận với các dịch vụ web làm giàu mô tả ngữ nghĩa. và nó dc thêm vào WSML-Rule.các dịch vụ web với 2 cách tiếp cận:  Sắp xếp các mối liên hệ và các mục tiêu trước phân loại để phân rã chúng về một mục tiêu được trước nó Việc xác định này dựa vào mục tiêu đã được xác định trước thông qua mgMediator. Điều đó chỉ ra rằng việc dùng DL là một biện pháp hiệu quả để kiểm tra các tập hợp con. chúng ta cần dùng một sắp xếp đầy đủ chính thức đã được đưa trong tài liệu. Logic giao dịch Việc thực hiện nghĩa vụ khác nhau giữa các trang web sử dụng Logic giao dịch theo quy tắc reification. b.3 Discovery Based on Rich Descriptions of Services a. Với những chú thích nghĩa đơn giản không có giới hạn về mô tả dịch vụ hay mục tiêu.

42 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Logic giao dịch được dùng để chứng minh các nghĩa vụ giữa các trang web nhưng không yêu cầu thêm ngôn ngữ mô tả goal hay các dịch vụ web. dựa vào mô tả của bản thể học trong WSML – Core là đủ. Phong phú DBRD Các khái niệm dự kiến cùng cấp đó chính xác Bộ phát hiện phải trả về danh sách là các dịch vụ web toàn bộ hoặc một phần phù hợp cùng với bảng xếp hạng các dịch vụ web như vậy.2.1 Mô tả các mục tiêu và dịch vụ web Loại mô hình: Chúng ta cần một mô tả dịch vụ và một hình thức cụ thể cho việc tiếp cận: vd như nếu chúng ta muốn làm DL mà lại có một bản mô tả tốt dịch vụ bằng trật tự logic thì bằng cách dung DL chúng ta sẽ chích xuất một mô tả trừu tượng trực tiếp từ bản mô tả đó. Điều đó đưa ra dự kiến về phác thảo giao diện cần đáp ứng các mô tả thô sau đây: Mục tiêu chính thức dựa trên từ khóaKD .2 Xếp hạng Xem xét việc kết hợp các phương pháp tiếp cận việc phát hiện các dịch vụ web đòi hỏi không chỉ xếp hạng các dịch vụ web đó phù hợp với sử dụng từ khóa mà còn để xếp hạng các kết quả phù hợp như việc khám phá các giao dịch.2 Tích hợp 5. Thành phần biến thể WSML: Chúng ta sẽ xem xét làm thế nào mà các WSML khác nhau sử dụng cho các loại trang web phát hiện dịch vụ khác nhau có thể được thực hiện tương thích. chúng ta thảo luận về những công cụ phát hiện.2. Việc trừu tượng hoa yêu cầu được chính thức hóa và đo độ hữu dụng của nó bằng thực nghiệm. Vì vậy chúng ta cần giao diện cho phép nhập một mô tả từ khóa của mục tiêu hoặc mục tiêu đơn giản DBSD cùng với danh sách xếp hạng của nó. 42 .3 Giao diện Trong phần V này. Bất kì một loại dịch vụ web nào cũng sẽ phát hiện dựa trên nguyên tắc về tên miền bản thể học. 5. 5. đơn giản DBSD. 5.

Lưu ý: kiến trúc lưu trữ kho dữ liệu cũng là một phần để cho thấy các công cụ phát hiện tích hợp với đăng kí. Message Parser Phân tích cú pháp tin nhắn: Phân tích các tin nhắn và triết xuất các thành phần tin nhắn như: điều kiện gửi.4 Kiến trúc Thành phần: Các thành phần: Quản lí giao tiếp: quản lí các thông tin yêu cầu gửi đến. 43 . Lưu ý: Ở đây có thể thêm một bước dịch thật nhằm biền đổi biểu thức logic chứa trong các tin nhắn WSML đến định dạng mục tiêu của kết quả. bộ phận chúng đến Proof Generator. Quản lí cân bằng tải giữa kết quả và giao thức mạng. các hiệu ứng. The Reasoner Manager : tóm tắt từ các giao diện khác nhau của các kết quả và cung cấp API phổ biến đến Proof Generator.43 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 5. Có trách nhiệm quản lí nguồn gốc các định dạng của các kết quả mục tiêu.

Việc phân tích kho dữ liệu là một phần quan trọng cho phép chúng ta khả năng mở rộng khám phá.1 Khai phá dữ liệu cho khám phá dịch vụ Khai phá dữ liệu và các hoạt động Khai phá dữ liệu là việc tìm kiếm những mô hình dữ liệu khác biệt. nó liên quan đến việc xác định cách dịch vụ web khai phá như thế nào. tiền xử lý dữ liệu. Bước tiền xử lý dữ liệu nhằm loại bỏ độ nhiễu hay sai lệch. Xử lý sự không nhất quán hoặc thiếu dữ liệu để đảm bảo chất lượng cho bộ dữ liệu và biến nó thành dữ liệu có cấu trúc cụ thể. dữ liệu phải sẵn có để khai phá và mục tiêu của người dùng cuối. mô hình hóa dữ liệu và đánh giá mô hình đó. Một khi mục tiêu của việc khai phá dữ liệu đã được xác định.44 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Giả định là mỗi người có một định danh duy nhất khi đăng kí và một API cung cấp đầy đủ các mô tả dịch vụ được dịnh danh. Công việc của khai phá dữ liệu bao gồm xác định vấn đề. Bước mô hình hóa dữ liệu đề cập đến việc áp dụng một hoặc kết hợp nhiều kỹ thuật khai phá cho việc xác định các mẫu từ tập dữ liệu thu 44 . Có một kho dữ liêu lưu trữ cho phép phân loại trước khi trừu tượng hóa tại thời điểm xuất bản và các liên kết dịch vụ trong kho dữ liệu để xác định trước mục tiêu. cũng như xu hướng tồn tại trong trong các bộ dữ liệu rất lớn. 6. Điều này yêu cầu các nhà phân tích phải có sự hiểu biết về miền ứng dụng. nhưng thường ở dưới dạng tiềm năng. Mô hình dữ liệu là kết quả của việc sử dụng các quy tắc suy luận từ tiền xử lý dữ liệu hoặc xây dựng mô hình sao cho phù hợp với tập dữ liệu nhất. bước tiếp theo là chuẩn bị dữ liệu cho việc khai phá. Khi đó các công cụ khám phá chỉ cần lưu một bản sao các bên liên quan trong registry cùng với thông tin nhận diện => đòi hỏi đồng bộ hóa giữ đăng kí và bản sao. chúng ta có thêm một vài thành phần như thành phần đăng kí và Bản thể học (ontologies)… VI. Các yêu cầu thành phần khác Ở cấp giao diện và chức năng. Một cỗ máy khám phá yêu cầu cả việc lưu trữ đăng kí lẫn các mục tiêu. có trước các kiến thức liên quan. Điều đó làm việc khám phá có hiệu quả hơn và lọc nhanh hơn. Bước tiền xử lý là phần quan trọng.

Đếm số lần xuất hiện của hạng mục chẳng hạn như thuật toán Apriori. Demographic. Các hoạt động phân tích liên kết thiết lập các liên kết giữa các đối tượng với nhau bằng cách tìm kiếm các hạng mục sao cho bao hàm sự có mặt của các hạng mục khác trong tập dữ liệu. Phân cụm hay phân đoạn giải quyết vấn đề bằng cách xác định các đối tượng tương tự nhau trong tập dữ liệu. Phân vùng dữ liệu thành các đoạn. Quá trình xử lý này cho phép dự đoán giá trị chưa rõ của biến cần dự đoán được cho bởi giá trị đã biết của một biến khác. hồi quy tuyến tính và phi tuyến tính. Phân tích liên kết. Phân tích độ lệch. Bayes. Các mẫu này phụ thuộc vào các hoạt động trong khai phá dữ liệu được mô tả trong bảng sau: Hoạt động khai phá Mô hình dự đoán (phân lớp.45 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 được. hoặc sự xuất hiện là tương tự nhau trong tập dữ liệu về thời gian. Mô hình dự đoán phân lớp được sử dụng để dự đoán các giá trị rời rạc. Mô hình dự đoán giải quyết vấn đề bằng cách nhìn vào những kinh nghiệm trong quá khứ kết hợp với các câu trả lời đã biết. Phân lớp hoặc phân đoạn. Phân tích liên kết là khám phá chuỗi thời gian tương tự nhau sao cho xác định được sự xuất hiện là tương tự. các hoạt động bất thường. các hoạt động hoặc sự kiện bất thường trong tập dữ liệu được chỉ ra bởi các sai lệch. mạng dựa vào dữ liệu đã có. mạng Neural. Phát hiện các dì thường. Các kỹ thuật thống kê và trực quan hóa. Thiết lập liên kết giữa các hạng mục. hoặc mô hình hồi quy được sử dụng để dự đoán các giá trị liên tục. Việc phân tích này tìm hiểu mối quan hệ thời gian giữa các bộ dữ liệu chuỗi thời gian bằng cách kết hợp các chuỗi dữ liệu tương tự như một chuỗi đã cho. Phân tích độ lệch liên quan đến việc xác định dị thường. Neural. sau đó dự kiến các trường hợp mới dựa trên những đặc trưng cần thiết của dữ liệu. trong khi mô hình dự đoán giá trị. 45 . dự đoán giá trị) Mục tiêu Phương pháp tiếp cận Dự đoán nhu cầu tương lai Cây quyết định. hoặc thành một chuỗi khác.

Việc kết hợp dịch vụ ở mức độ chuỗi xâu duy nhất đồng nghĩa với câu truy vấn mà không trả về tập các dịch vụ giống nhau mặc dầu các dịch vụ có chức năng giống nhau. điều này là vô cùng cần thiết để câu truy vấn có chứa từ trong tên dịch vụ mong muốn. Do đó tên dịch vụ Web rất ngắn. dịch vụ sẽ không được trả về.2 Ứng dụng khai phá dữ liệu trong dịch vụ Web 6. Gồm các hoạt động như lọc. … (xác định duy nhất cho các khái niệm tái sử dụng). Việc kết hợp một truy vấn đến tập các dịch vụ được dựa trên tên dịch vụ. các thuộc tính khác như nhà cung cấp thường sẽ được lựa chọn để phân biệt dịch vụ.1 Ứng dụng doanh nghiệp Các dịch vụ web về chi phí và dự đoán: Giám sát hiệu năng: 6. địa điểm. Tuy nhiên vì người dùng thường quan tâm tới chức năng của dịch vụ nên họ thường bắt đầu gõ tên dịch vụ. doanh nghiệp. Một người dùng có nhu cầu xác định một vị trí cụ thể có thể làm như vậy bằng cách xác định tên dịch vụ cụ thể.2.1 Đặt vấn đề Việc tìm kiếm dịch vụ web bằng cách sử dụng các máy tìm kiếm web dịch vụ như Salcentral hay UDDI bị giới hạn về từ khóa khi kết hợp với tên. luật. tái cấu trúc. người dùng cũng có thể tìm kiếm bởi tên nhà cung cấp dịch vụ hoặc duyệt bộ đăng ký (registry) bằng các lược đồ phân cấp khác nhau mà nó hỗ trợ như NAICS như UNSPSC.46 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Bước cuối cùng liên quan đến việc giải thích nguồn gốc của mô hình. Đây là một trở ngại lớn khi tìm kiếm dịch vụ web bởi vì 46 . trực quan hóa dữ liệu được sử dụng để trích xuất tri thức một cách có ý nghĩa và dễ hiểu cho người dùng.3. thường không quá 5 từ.2.3 Khai phá dữ liệu cho khám phá dữ liệu 6.2 Ứng dụng kỹ thuật Dịch vụ cải tiến: Dịch vụ đề xuất: 6. 6. Truy vấn ở mức độ chuỗi xâu khác nhau nhưng lại có nghĩa giống nhau trả về kết quả không khớp nhau. Với UDDI. Nếu truy vấn không chứa chính xác ít nhất một từ nào trong tên dịch vụ.

thậm chí còn tệ hơn. Vấn đề này có thể được tiếp cận bằng 2 cách: trả về cho người dùng tập kết quả mở rộng hoặc gợi ý cho người dùng các thuật ngữ khác có liên quan. Trong khi các máy tìm kiếm Web trước phương pháp tiếp cận là nắm bắt các mối quan hệ trong nội bộ truy vấn mà bỏ qua các mối quan hệ liên truy vấn tồn tại giữa các câu truy vẫn mà người sử dụng đã gửi trong một phiên tìm kiếm. Các máy tìm kiếm sẽ sử dụng ontology để trả về tập kết quả mở rộng bao gồm các lớp cha. Phương pháp khám phá dịch vụ dựa trên từ khóa cho kết quả trả về thấp khi kết quả có chứa các từ đồng nghĩa hoặc các khái niệm có mức độ trừu tượng cao hơn hoặc thấp hơn để mô tả dịch vụ thường không được trả về. những kết quả mà người sử dụng không quan tâm. ẩn dụ. Vì vậy tập thuật ngữ tìm kiếm được sử dụng liên tục trong một phiên tìm kiếm đã tạo thành lối mòn và đại diện cho nhu cầu dịch vụ của người này. và ontology được sử dụng để mã hóa mối quan hệ giữa các khái niệm. đối với câu truy vấn dài không có sự cải thiện. người dùng sẽ gửi câu tìm kiếm khác mà đồng nghĩa với truy vấn ban đầu. điều này thực hiện được bởi kỹ thuật phân cụm trong khai phá dữ liệu. các điều kiện bắt buộc. Một số phương pháp tiếp cận khác nhau đã được đề xuất nhằm tăng cường tương tự ngữ nghĩa cho việc mở rộng câu truy vấn với đồng nghĩa. Phân cụm dựa trên phiên tìm kiếm thay thế cho tìm kiếm cá thể có thể tận dụng được vấn đề bằng cách tận dụng lợi thế những phát quyết của người dùng ngụ ý trong các truy vấn và nhật ký máy chủ Web để cung cấp các liên kết ngữ 47 . Ví dụ tên dịch vụ là “SMS” sẽ không bao giờ trả về nếu người dùng truy vấn bằng “Mobile Message Service” khi mà 2 khái niệm này giống nhau. lớp con và lớp đồng cấp. Phương pháp tiếp cận thứ 2 là gợi ý cho người dùng các thuật ngữ liên quan đến câu truy vấn vừa nhập vào dựa trên những truy vấn tương tự của người dùng khác. Điều này được giả định rằng nhu cầu của người dùng một dịch vụ là không thay đổi ngay cả khi không thể tìm thấy bất kỳ dịch vụ nào thỏa mãn được. Sự thiếu hụt về ngữ nghĩa đã dẫn tới sự phát triển của ngôn ngữ dựa trên OWL-S và DAML cho dịch vụ mô tả trong WSDL. nơi mà dịch vụ phù hợp với khả năng được dựa trên các yếu tố đầu vào. các ảnh hưởng.47 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 người dùng chỉ quan tâm đến chức năng của dịch vụ. nó vẫn có kết quả nghèo nàn. đầu ra. Mặc dù các phương pháp trên cải thiện được kết quả khi trả về kết quả rất lớn mà vẫn liên quan đến đối tượng tìm kiếm. Khi người dùng không thể tìm thấy dịch vụ Web với các chức năng đã yêu cầu. Điều này chỉ mang lại một số cải thiện nhỏ ở mức độ câu truy vấn ngắn.

2 Phương pháp phân cụm Bước 1: Tiền xử lý dữ liệu 1. Bước 2: Thực hiện phiên tìm kiếm giống nhau 2.3. kết quả phân cụm sẽ có các thuật ngữ tìm kiếm có mức độ đồng nghĩa cao và nó không có ích lợi gì. nếu việc thực hiện phân cụm dựa trên các phiên tìm kiếm.2 Lưu trữ các cụm này trong bộ đăng ký UDDI để cho phép cải thiện tìm kiếm.3 Trích xuất các thực thể có liên quan với nhau từ nhật ký người dùng truy vấn và nhật ký máy chủ Web.2 Tính toán mức độ tương đồng Jaccard độc lập với các từ tìm kiếm và các mô tả dịch vụ giữa mỗi cặp dịch vụ Web.1 2.1 1. Tập mẫu phiên tìm kiếm bằng cách nhóm các thực thể theo địa chỉ IP của máy khách và máy chủ Web. 48 . Nói cách khác.1 Áp dụng phân cấp các cụm từ các mẫu nhóm lấy ra từ ma trận tương đồng. thì các kết quả như là “SMS” và “Mobile Message Service” sẽ được phân nhóm cùng nhau. 6. Tạo một mẫu ma trận tương đồng bằng cách hợp các hệ số tương đồng của 2 thành phần trên.2 1.48 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 nghĩa giữa các từ khóa. 3. Nếu truy vấn được phân cụm độc lập với các truy vấn khác được sử dụng trong cùng một phiên tìm kiếm. Bước 3: Thực hiện phân cụm 3. Tạo các mô tả truy vấn dịch vụ kết hợp bằng cách hợp nhất các thực thể có trong 2 loại nhật ký trên.

3. Các thực thể cùng một địa chỉ IP được nhóm lại với nhau 49 .3 Tiền xử lý dữ liệu Dữ liệu cần thiết cho phân cụm các phiên truy vấn được lấy từ nhật ký người dùng truy vấn và nhật ký máy chủ web. Như vậy ta có kết quả có cấu trúc: Truy vấn {Mô tả dịch vụ} với truy vấn là những từ tìm kiếm đã được sử dụng và tập các mô tả dịch vụ tương ứng mà người dùng đã xem và nó là tập con của các kết quả trả về từ truy vấn. cũng như các trang mô tả dịch vụ theo mỗi truy vấn.4 Phiên tìm kiếm giống nhau Một phiên tìm kiếm được định nghĩa là một tập các truy vấn được gửi theo trình tự bởi người dùng để xác định một dịch vụ cụ thể. Các quan hệ này có thể được nắm bắt được bằng cách kết hợp các truy vấn được ghi lại từ nhật ký truy vấn với các mô tả dịch vụ được ghi lại trong nhật ký máy chủ web.49 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Hình 5 Các truy vấn đã nhóm vào trong các phiên làm việc 6. Một tập các câu truy vấn được xác định bằng cách sử dụng địa chỉ IP cùng với thời gian đã được ghi lại trong nhật ký máy chủ Web. Nó tương tự như một giao dịch hay một phiên máy chủ trong khai phá web. Các thực thể cần thiết từ nhật ký máy chủ web là những thực thể tương ứng với các thực thể trong nhật ký truy vấn. trong khi thời gian để xác định các phiên khác nhau của cùng một người dùng. Địa chỉ IP dùng để xác định người dùng. Nhật ký truy vấn chứa các từ tìm kiếm đi cùng nhau cùng một số thông tin xác định các truy vấn đã gửi như địa chỉ IP của máy gửi và thời gian gửi. 6.3. Mỗi thực thể trong các mẫu nhật ký truy vấn có quan hệ một – nhiều với các thực thể trong nhật ký máy chủ web. Do đó phương pháp tiếp cận để xác định nó là tương tự nhau. Dữ liệu từ 2 nguồn này được củng cố cho việc kết hợp các mô tả dịch vụ truy vấn phù hợp.

Y.50 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 và sắp xếp theo thời gian để có được tất cả các tìm kiếm được thực hiện cùng một người dùng. Các phiên khác nhau được phân biệt dựa trên một ngưỡng thời gian. Phiên tìm kiếm tương tự có thể được tính toán dựa trên sự giống nhau của tập các từ tìm kiếm được sử dụng và tập các mô tả dịch vụ đã được xem giữa 2 phiên tìm kiếm. Y) = (DXY) / (DX + DY + DXY) Txy là số lượng từ tìm kiếm có trong X và Y. Tx. Phương pháp này tính toán độ tương tự dựa trên các thuộc tính cùng xuất hiện trong cả 2 tập dữ liệu so sánh. Y) + similarityservice descriptions (X.Y) = similarity search term (X. Ví dụ các phiên tìm kiếm có chứa nhiều từ khóa giống nhau và có các mô tả dịch vụ giống nhau có lẽ sẽ liên quan đến nhau. Dx. Một cái biểu diễn các truy vấn. Độ tương tự của cặp phiên tìm kiếm là dấu hiệu của sự liên quan đến nhau. Y) = (TXY) / (TX + TY + TXY) similarityservice descriptions (X. Với mỗi phiên tìm kiếm được chuyển thành 2 vector nhị phân. Y. Giá trị 1 thể hiện sự có mặt của truy vấn hoặc mô tả dịch vụ. Dy lần lượt là số lượng mô tả dịch vụ của X. Dxy là số lượng mô tả dịch vụ có trong X và Y. Độ giống nhau giữa 2 phiên tìm kiếm X. Y) Hệ số Jaccard tính toán độ tương tự bằng cách sử dụng tập các từ tìm kiếm và các mô tả dịch vụ X. độ dài của vector tương ứng với tổng các truy vấn khác nhau và tổng các mô tả dịch vụ khác nhau. Y được xác định như sau: similarity (X. một cái biểu diễn các mô tả dịch vụ đã được xem. Y. Độ tương đồng từ tìm kiếm và mô tả dịch vụ đã xem được cho bởi công thức sau: similaritysearch term (X. Ty lần lượt là số lượng từ tìm kiếm có trong X . Một thuộc tính mà không mô tả tập dữ liệu nào thì được coi là không quan trọng. xét phiên tìm kiếm 1 và 2 ta có kết quả sau: Query vector q1 q2 q3 q4 X= 1 Y= 1 SD Vector 1 0 0 1 0 1 ID001 ID002 ID003 ID005 ID007 ID008 ID012 50 . Ví dụ.

do khối lượng truy vấn có thể rất lớn do đó các thuật toán cần được mở rộng.429 similarity (123. Một thuật toán phân cụm thường đòi hỏi một ma trận tương đồng để xác định các cụm trong các phiên tìm kiếm 6. Điều này có nghĩa là phiên tìm kiếm được gán cho một cụm nếu chúng có nhiều truy vấn và mô tả dịch vụ phổ biến. Các trọng số được sử dụng để dự đoán nhu cầu sử dụng dịch vụ của người dùng.456. Thứ hai.890) = 0. thuật toán phải có khả năng chống nhiễu và độ sai lệch. 234. Thứ nhất. Phương pháp này sử dụng chiến lược từ dưới lên bắt đầu bằng cách đặt mỗi trường hợp trong cụm riêng của mình và sau đó tiếp tục hợp nhất các cụm với nhau cho đến khi một tiêu chí thỏa mãn rồi dừng lại. Lý do sử dụng phương pháp này như sau. giá trị ngoại lai có thể có mặt.679 Xây dựng ma trận tương đồng làm đầu vào cho việc phân cụm. độ tương tự của phiên tìm kiếm có được dựa trên số lượng truy vấn phổ biến và mô tả dịch vụ mà họ chia sẻ. Y) = 0. sự hỗ trợ cho mỗi từ tìm kiếm trong mỗi cụm được tính sau đó gán trọng số.51 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 X = 1 Y = 0 similaritysearch term (X. Y) = 0.25 0 1 1 1 1 0 1 1 0 1 1 1 similarityservice descriptions (X. Tùy thuộc vào kích thước và số lượng của từ tìm 51 . Vì người dùng có thể nhập bất kỳ truy vấn tùy tiện nào không liên quan đến các truy vấn khác trong cùng một phiên.5 Phân cụm các phiên tìm kiếm Phương pháp tạo cây phân cấp phân cụm thường được sử dụng trong truy vấn thông tin cho việc phân nhóm các tài liệu tương tự. Sau khi các cụm được hình thành.567. Thứ ba.789.3.

hoặc có thể là tất cả các từ tìm kiếm trong cụm hoặc được giới hạn cho những người từ các phiên tìm kiếm tương tự nhất. 52 .52 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 kiếm mà tạo nên các cụm.

A.w3. & QIAN. U. [5] Yu. [4] Nayak.. K.. [2] http://www.53 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Tài liệu tham khảo [1] Fensel. (2005). L. [3] JUANWANG. & Keller. Introduction Semantic Web & Semantic Web Service. (2005). (2007). (2008).org/TR/ws-arch. 53 . D. WWW or What is Wrong with Web service Discovery. Component Oriented Programming. Data mining in web services discovery and monitoring. R.

Sign up to vote on this title
UsefulNot useful