You are on page 1of 4

Hãy xem xét một câu hỏi khoa học Grand Challenge: "Biến đổi khí hậu sẽ tác

động như thế nào


tính bền vững của các hệ sinh thái trên thế giới ”?

Câu hỏi Thử thách lớn này yêu cầu làm rõ các ảnh hưởng và tương tác trong số một số quy trình
theo truyền thống là trọng tâm của các lĩnh vực riêng biệt: ghép các mô hình phức tạp, đa tỷ lệ từ
trái đất, khí quyển, thủy điện và đại dương các miền đại diện cho các quá trình gần như chắc
chắn có các vòng phản hồi phức tạp; và tích hợp những thứ này với các mô hình và dữ liệu cũng
có yếu tố kích thước con người.

Nguồn dữ liệu đa dạng từ các báo cáo công nghiệp về tiêu thụ năng lượng và phát thải từ việc đốt
nhiên liệu hóa thạch, đến chuỗi thời gian - phạm vi sử dụng đất toàn cầu - từ xa-‐ hình ảnh cảm
nhận; với vô số các phép đo trên mặt đất đại diện cho các quan sát và đo lường từ các nhà nghiên
cứu phân tán, không phối hợp và cảm biến, cũng như các nỗ lực giám sát có hệ thống như NEON
mới ra đời chương trình.

Nguồn dữ liệu đa dạng từ các báo cáo công nghiệp về tiêu thụ năng lượng và phát thải
từ việc đốt nhiên liệu hóa thạch, đến chuỗi thời gian - phạm vi sử dụng đất toàn cầu - từ xa-‐
hình ảnh cảm nhận; với vô số các phép đo trên mặt đất đại diện cho
các quan sát và đo lường từ các nhà nghiên cứu phân tán, không phối hợp và
cảm biến, cũng như các nỗ lực giám sát có hệ thống như NEON mới ra đời
chương trình.

Các thách thức ngữ nghĩa ở đây là rõ ràng và phổ biến. Đầu tiên, thách thức về ngữ nghĩa
hỗ trợ khám phá và tích hợp dữ liệu không đồng nhất cao -‐-‐
đại diện cho một tập hợp vô cùng đa dạng các phép đo cơ bản của trái đất
các tính năng và hiện tượng, được chụp ở nhiều độ phân giải trên nhiều quy mô không gian,
sử dụng nhiều phương pháp luận và được bảo tồn trong nhiều loại tin học
khuôn khổ, từ các bảng tính tương đối không có cấu trúc trên ổ cứng cục bộ
đến cơ sở dữ liệu lớn hơn, được mô hình hóa tốt, tuy nhiên, không cơ sở dữ liệu nào trong số
đó cung cấp
ngữ nghĩa cho khả năng tương tác. Công nghệ ngữ nghĩa có thể giúp chế ngự thuật ngữ
các đặc điểm riêng hiện có rất nhiều trong các lĩnh vực khoa học trái đất -‐-‐ khác nhau, từ
việc sử dụng các thuật ngữ không được tiêu chuẩn hóa thường phụ thuộc vào ngữ cảnh hoặc
phụ thuộc vào kỷ luật, để
các thuật ngữ không chính xác và vô số từ đồng nghĩa, từ siêu nghĩa và từ trái nghĩa được sử
dụng
theo những cách không được phối hợp và không được tham chiếu làm ảnh hưởng nghiêm
trọng đến khả năng
phát hiện, diễn giải và sử dụng lại thông tin với sự chặt chẽ về mặt khoa học. Hiểu biết
các kỹ thuật biểu diễn có thể thúc đẩy sự phát triển và sử dụng các
thuật ngữ cho Khoa học Trái đất, với những ưu điểm rõ ràng là giúp thống nhất
và phân biệt ý định ngữ nghĩa.

Các nhà nghiên cứu Khoa học Trái đất sử dụng một số thống kê và mô hình khác nhau
phương pháp tiếp cận để điều tra và dự đoán một loạt các hiện tượng tự nhiên. KR
các kỹ thuật có thể nâng cao đáng kể khả năng so sánh và tái sử dụng các phân tích, mô hình,
và quy trình công việc, bằng cách làm rõ các thứ nguyên ngữ nghĩa cho các đầu vào thích hợp,
cung cấp giải thích nhiều sắc thái hơn về các kết quả đầu ra và làm rõ cách
các thành phần được liên kết với nhau. Bằng cách triển khai các phương pháp hay nhất trong
xây dựng bản thể học, KR
các kỹ thuật có thể cho phép nhiều hơn là sự hài hòa thuật ngữ đơn giản, thông qua
khả năng suy luận nâng cao có thể thông qua việc sử dụng
các từ vựng được xử lý bởi các nhà lý luận ngày càng mạnh mẽ. Các bản thể học bổ sung
có thể dẫn đến sự hội tụ cộng đồng và khả năng tương tác mạnh mẽ hơn, thông qua
tiêu chuẩn hóa trong việc xây dựng các mô hình, và thông qua việc thúc đẩy
thông số kỹ thuật nghiêm ngặt của đầu vào và đầu ra của mô hình có thể dẫn đến
hiệu quả trong nỗ lực thu thập dữ liệu. Trong ngoài ra, tính biểu đạt hợp lý của hiện đại
Các ngôn ngữ KR, đặc biệt khi được triển khai phù hợp với Web mới nổi
tiêu chuẩn, cho phép thể hiện thông tin xuất xứ chi tiết và các
siêu dữ liệu, ngày càng quan trọng trong việc xác định tính phù hợp để sử dụng -‐-‐ dữ liệu
cũng như các kết quả phân tích hoặc các sản phẩm khác. Cuối cùng bằng cách xây dựng cộng
đồng-‐
dựa trên bản thể học liên ngành, phương pháp KR có thể nâng cao triển vọng chuyển đổi
giao tiếp kỷ luật, bằng cách giảm sự mơ hồ về ngữ nghĩa khi kết quả
được báo cáo trong tài liệu, hoặc khả năng ứng dụng rộng rãi hơn của các phát hiện được thảo
luận hoặc
có khả năng được sử dụng để hỗ trợ chính sách.

Với tốc độ tiếp tục của việc sử dụng năng lượng nhân tạo, chuyển đổi đất, và
các hoạt động khai thác tài nguyên, điều tra khoa học trái đất tổng hợp đang trở thành
quan trọng để thông báo cho xã hội về cách duy trì các nhu cầu cơ bản của con người -‐-‐ cho
đầy đủ
thức ăn, nước uống, nơi ở và không khí sạch -‐-‐ cho chính chúng ta và các thế hệ tương lai. Sinh
vật phù du
cuộc sống dưới đại dương và những khu rừng lớn trên thế giới hấp thụ một lượng lớn các-bon
từ bầu khí quyển và giúp bù đắp lượng khí thải carbon của con người vào
không khí; nhưng các hệ thống này hiện đang trải qua những thay đổi nhanh chóng về chức
năng
và mức độ. Trong thời đại công nghiệp này, chúng ta phải có khả năng hiểu được những tác
động mà
hoạt động của con người có thể và sẽ có trên hệ thống trái đất, và đặc biệt là cách
các hoạt động hiện tại có thể ảnh hưởng đến triển vọng trong tương lai về khả năng tồn tại của
con người và chất lượng của
đời sống. Thêm vào đó là những lo ngại về các mối quan tâm ít dễ định lượng hơn, chẳng hạn
như
bảo tồn đa dạng sinh học phong phú của thế giới, vd. các rạn san hô và các khu vực chưa được
đào tạo rừng, hoặc thậm chí có những nơi có thể tồn tại chim cánh cụt, voi, cá hồi và hổ
trong thế giới hoang dã. Cộng đồng KR&R có thể hỗ trợ các ngành khoa học trái đất vào thời
điểm quan trọng này,
bằng cách giúp lĩnh vực này tổ chức và điều chỉnh tốt hơn các tài nguyên dữ liệu và mô hình
hóa, như
cũng như thông tin liên lạc của nó về kết quả, đến một thông tin kỹ thuật số, được nối mạng
môi trường. Các giải pháp KR sẽ là trợ thủ đắc lực cho các câu hỏi Grand Challenge trong
Khoa học Trái đất, nơi họ sẽ không chỉ thúc đẩy sự hiểu biết của chúng ta về
các hiện tượng phức tạp, liên kết với nhau, nhưng cũng giúp cung cấp thông tin cho các quyết
định chính sách quan trọng
sẽ tác động đến tính bền vững của môi trường trong tương lai.
Use case: Biomedical and pharmaceutical research
Những tiến bộ trong nghiên cứu y sinh và dược phẩm được xây dựng dựa trên kiến thức trước
đó và yêu cầu khả năng truy cập dễ dàng và hiệu quả vào thông tin được chôn trong các ấn
phẩm khoa học hoặc trong các tập dữ liệu nhỏ và lớn được chú thích một phần. Nỗ lực đáng kể
hiện đang được dành để quản lý các bài báo thành các dữ kiện đơn giản cung cấp thông tin chi
tiết về chức năng của thành phần. Tương tự, nhiều công việc đi vào khối dữ liệu từ một tập hợp
các định dạng tùy ý thành một định dạng chung và sau đó làm sạch, tích hợp và hợp nhất dữ
liệu thành thông tin có ý nghĩa. Một khía cạnh chính của quản lý dữ liệu khoa học hiện đại nhằm
tạo ra dữ liệu hữu ích cho việc trả lời và phân tích truy vấn nằm trong việc sử dụng các bản thể
học để tạo ra các biểu diễn tri thức có thể hiểu được bằng máy. Với hàng trăm bản thể học hiện
có sẵn để chú thích ngữ nghĩa và biểu diễn tri thức chính thức, có những cơ hội và thách thức
mới cho nghiên cứu và khám phá y sinh và dược phẩm.

Việc sử dụng bản thể học được công nhận nhiều nhất trong nghiên cứu y sinh là phân tích làm
giàu. Mục tiêu của phân tích làm giàu là tìm một tập hợp các thuộc tính được làm giàu đáng kể
trong một tập hợp mục tiêu trên một số tập hợp nền cũng chia sẻ thuộc tính đó. Với hơn
30.000 thuật ngữ và hàng triệu gen và protein được chú thích về chức năng, bản địa hóa và các
quá trình sinh học, Bản thể học gen đã được sử dụng để mang lại cái nhìn sâu sắc về hàng nghìn
thí nghiệm khoa học. Trong khi nghiên cứu mới mang rất nhiều bản thể học để chú thích tự
động và làm phong phú thêm các mô tả dựa trên văn bản, chẳng hạn như các bài báo khoa học,
các nhà khoa học phát hiện ra các mối liên hệ mới giữa
các thực thể đã hủy liên kết trước đó. Tuy nhiên, trong khi các thí nghiệm như vậy tương đối dễ
thực hiện, một thách thức lớn còn tồn tại nằm ở việc có thể điều hòa các mối liên hệ này với
kiến thức trước đây và thiết lập mức độ mà chúng tôi tự tin về bất kỳ khẳng định nào được tìm
thấy trong một mạng dữ liệu trong đó các tuyên bố khoa học rộng rãi phải thì là ở được đối
chiếu với các dữ kiện thực nghiệm phát sinh từ các phương pháp luận cụ thể được thực hiện
trên các hệ thống mô hình. Rõ ràng là các nghiên cứu nhiều hơn phải được hướng tới việc tích
lũy bằng chứng để cung cấp tính chính đáng, tin cậy và giải thích khi đối mặt với sự không đầy
đủ, không chắc chắn hoặc mâu thuẫn.

Use case: Advancing healthcare

Phân tích dữ liệu liên tục và quy mô lớn sẽ dẫn đến những hiểu biết mới trong nhiều lĩnh vực. Ví
dụ, phân tích hồ sơ y tế được chia sẻ có thể làm sáng tỏ tính an toàn và hiệu quả của thuốc
vượt quá khả năng của các thử nghiệm lâm sàng đắt tiền. Gần đây, trang web HospitalLikeMe
cho phép bệnh nhân mắc chứng xơ cứng teo cơ một bên (ALS) tổ chức một thử nghiệm lâm
sàng tự báo cáo (Wicks và cộng sự, 2011). Chúng tôi sẽ cần KR để tổng hợp thông tin và tự động
đối sánh bệnh nhân và bệnh nhân với các thử nghiệm lâm sàng. Tương tự, chúng tôi sẽ có thể
giải quyết những thách thức của y học cá nhân hóa, sử dụng đại diện tri thức và lý luận để phát
triển các kế hoạch điều trị được cá nhân hóa, xác định các cá nhân mắc các bệnh hiếm gặp
tương tự, tận dụng dữ liệu từ các xét nghiệm, tài liệu và thực hành thông thường. Nhóm IBM
Watson đang đi theo hướng đó đã

You might also like