You are on page 1of 13

Translated from English to Vietnamese - www.onlinedoctranslator.

com

Xem các cuộc thảo luận, số liệu thống kê và hồ sơ tác giả cho ấn phẩm này tại:https://www.researchgate.net/publication/267551043

TIẾN BỘ - Môi trường tiếp cận các dịch vụ tính toán được thực hiện bởi Cluster of
Sun Systems

Bài báo

CÔNG TÁC BÀI ĐỌC

14 72

3 tác giả, bao gồm:

Cezary Mazurek
PoznaNskie Centrum Superkomputerowo-Sieciowe

139CÔNG BỐ544CÔNG TÁC

XEM HỒ SƠ

Một số tác giả của ấn phẩm này cũng đang thực hiện các dự án liên quan này:

ĐÃ CUNG CẤP: Quá trình cải tiến vi phạm liên tục cho Nhân văn kỹ thuật sốXem Kế hoạch

Ghi danh đại trà vào trường họcXem Kế hoạch

Tất cả nội dung theo sau trang này đã được tải lên bởiCezary Mazurekvào ngày 12 tháng 12 năm 2014.

Người dùng đã yêu cầu nâng cao tệp đã tải xuống.


TIẾN TRIỂN -
Tiếp cận môi trường cho các dịch vụ tính toán
Thực hiện bởi Cluster of Sun Systems

Michał Kosiedowski, Cezary Mazurek, Maciej Stroiński 1)

1)Trung tâm mạng và siêu máy tính Poznan


Noskowskiego 10, 61-704 Poznan, Ba Lan

trừu tượng

Dự án PROGRESS nhằm mục đích xây dựng một môi trường truy cập tới các dịch vụ tính toán được thực hiện bởi một nhóm hệ

thống SUN. PROGRESS tích hợp các phần khác nhau của phần mềm trung gian lưới. Việc nộp hồ sơ được xử lý bởi Nhà môi giới lưới.

Dữ liệu cần thiết cho tính toán được quản lý bởi Hệ thống quản lý dữ liệu. Ngoài ra, bất kỳ giao diện người dùng nào cũng có thể sử

dụng Nhà cung cấp Dịch vụ Lưới được phát triển trong dự án. Cổng thông tin điện toán là một ví dụ về giao diện như vậy và được

cung cấp trong dự án. Một ví dụ khác là màn hình di chuyển. Một trong những phần quan trọng nhất của kiến trúc cổng lưới được

thực hiện là bảo mật lưới. Dự án PROGRESS cho phép kiến trúc cổng lưới hoàn chỉnh để triển khai thêm trong các lĩnh vực ứng

dụng hỗ trợ lưới khác nhau. Hiện nay, một vài ứng dụng tính toán tin sinh học được cung cấp để chạy môi trường đã được thử

nghiệm. Toàn bộ kiến trúc phần mềm bao gồm phần mềm trung gian đã có sẵn (ví dụ: Globus, Sun Grid Engine) cũng như các công

cụ và dịch vụ được phát triển trong gói công việc của dự án. Hầu hết các thành phần đó giao tiếp với nhau thông qua các giao diện

dựa trên Dịch vụ Web và được phân phối trong cài đặt thử nghiệm. Việc lắp đặt thử nghiệm bao gồm ba hệ thống Sun Fire 6800 và

hai hệ thống Sun Fire V880 được lắp đặt ở Poznan và Krakow. Tình trạng hiện tại của công việc dự án sẽ được mô tả trên cơ sở cài

đặt thử nghiệm đầu tiên, đã được trình bày trong Triển lãm Siêu máy tính 2002. Sun Grid Engine) cũng như các công cụ và dịch vụ

được phát triển trong các gói công việc của dự án. Hầu hết các thành phần đó giao tiếp với nhau thông qua các giao diện dựa trên

Dịch vụ Web và được phân phối trong cài đặt thử nghiệm. Việc lắp đặt thử nghiệm bao gồm ba hệ thống Sun Fire 6800 và hai hệ

thống Sun Fire V880 được lắp đặt ở Poznan và Krakow. Tình trạng hiện tại của công việc dự án sẽ được mô tả trên cơ sở cài đặt thử

nghiệm đầu tiên, đã được trình bày trong Triển lãm Siêu máy tính 2002. Sun Grid Engine) cũng như các công cụ và dịch vụ được phát

triển trong các gói công việc của dự án. Hầu hết các thành phần đó giao tiếp với nhau thông qua các giao diện dựa trên Dịch vụ Web

và được phân phối trong cài đặt thử nghiệm. Việc lắp đặt thử nghiệm bao gồm ba hệ thống Sun Fire 6800 và hai hệ thống Sun Fire

V880 được lắp đặt ở Poznan và Krakow. Tình trạng hiện tại của công việc dự án sẽ được mô tả trên cơ sở cài đặt thử nghiệm đầu tiên,

đã được trình bày trong Triển lãm Siêu máy tính 2002.

1. Giới thiệu
Lưới và môi trường truy cập lưới gần đây là một trong những vấn đề quan
trọng nhất trong lĩnh vực Máy tính Hiệu suất cao. Có rất nhiều sáng kiến lưới
điện trên khắp thế giới đã thành công trong việc phát triển và triển khai các
thành phần lưới điện khác nhau. Động lực thúc đẩy sự phát triển của cơ sở hạ
tầng điện toán thế hệ tiếp theo là các ứng dụng khoa học. Sự tiến bộ của các môi
trường máy tính đó luôn liên quan đến sự phát triển của ba thành phần cụ thể
của nó: xử lý trong cơ sở hạ tầng lưới, giao tiếp thông qua các mạng tiên tiến và
truy cập vào các dịch vụ tính toán từ các cổng điện toán. Đặc biệt đối với các dịch
vụ xử lý quyền truy cập thông qua các cổng máy tính, rất hữu ích để xác định các
thành phần phổ biến cần thiết và có thể được sử dụng lại bởi
các ứng dụng hướng lưới khác nhau. Sự sẵn có của các thành phần phổ biến và có thể tái
sử dụng sẽ đẩy nhanh và nâng cao sự phát triển của các nỗ lực tương tự trong nhiều lĩnh
vực ứng dụng.
Trung tâm Mạng và Siêu máy tính Poznan, Ba Lan, cùng với Sun
Microsystems, Ba Lan, đã và đang phát triển dự án PROGRESS do chương trình
PIONIER của Ba Lan đồng tài trợ. Các học viên khác của PROGRESS là: Trung tâm
Máy tính Học thuật Cyfronet của Krakow, và Đại học Kỹ thuật Lodz.
CácPIONIERChương trình do Ủy ban Nhà nước về Nghiên cứu Khoa học Ba
Lan ban hành trong các năm 2001 đến 2005, nhằm mục đích phát triển Mạng
Quang học Ba Lan PIONIER [1]. Kiến trúc của dự án PROGRESS [2] dựa trên một
cụm máy chủ Sun Fire 6800 thực sự phân tán được kết nối với mạng này. Một vài
kênh nhanh (1Gb / s hoặc 10 Gb / s), dựa trên λ, dành riêng cho giao tiếp giữa các
nút cụm sẽ được kích hoạt cho thử nghiệm dự án PROGRESS. Các máy chủ của
Sun Fire đã được cài đặt ở Poznan và Krakow.
PROGRESS tích hợp một số phần của phần mềm trung gian lưới và do đó
đảm bảo rằng kiến trúc cổng lưới hoàn chỉnh sẽ được phát triển để triển
khai trong tương lai trong các lĩnh vực ứng dụng hỗ trợ lưới khác nhau. Toàn
bộ kiến trúc bao gồm phần mềm trung gian đã có sẵn (như Globus hoặc
Sun Grid Engine) cũng như các công cụ và dịch vụ được phát triển trong các
gói công việc của dự án và liên quan đến quản lý dịch vụ lưới, bảo mật, quản
lý dữ liệu nội bộ, trực quan hóa và truy cập di động. Hai loại giao diện người
dùng được cung cấp bởi cổng thông tin và ứng dụng máy tính để bàn đang
di chuyển được xây dựng trên đầu lớp Nhà cung cấp dịch vụ. Lớp này cung
cấp xác thực và ủy quyền người dùng, các dịch vụ quản lý cho các ứng dụng
máy tính và các dịch vụ khác,
Mô tả chi tiết về các thành phần cụ thể của môi trường cổng lưới đang được xây
dựng trong PROGRESS được trình bày trong các chương sau.

2 Kiến trúc và Chức năng


Kiến trúc hệ thống chung của môi trường cổng lưới điện của PROGRESS đã được
minh họa trên Hình 1. Mô-đun chính của Cổng thông tin HPC Tiến bộ là nhà cung cấp
dịch vụ lưới điện (GSP). Đây là một lớp mới được giới thiệu với kiến trúc môi trường
lưới cổng thông tin bởi nhóm nghiên cứu của PROGRESS. GSP cho phép người dùng
tạo, gửi và thực hiện các công việc lưới của họ bằng các ứng dụng có sẵn trong nhà
máy ứng dụng PROGRESS. Ngoài ra, TIẾN ĐỘ GSP cung cấp các dịch vụ thông tin
dành cho các cổng web và các dịch vụ quản lý dành cho quản trị viên GSP.

Các dịch vụ GSP của TIẾN BỘ có thể truy cập được thông qua hai giao diện khách:
cổng thông tin điện tử (WP) và mô-đun máy tính để bàn di chuyển (MD). WP cung cấp
chức năng: quản lý công việc lưới, quản lý ứng dụng và nhà cung cấp, đọc và chỉnh
sửa tin tức cổng thông tin cũng như quản lý hệ thống tệp DMS. MD, là một ứng dụng
khách Java riêng biệt, cung cấp giao diện người dùng để quản lý công việc lưới và
quản lý hệ thống tệp DMS.
GSP truyền các định nghĩa về công việc lưới tới nhà môi giới tài nguyên lưới (GRB)
để chạy trong một nhóm ba máy tính Mặt trời. Cụm được quản lý bởi phần mềm Sun
Grid Engine [3] với Globus [4] được triển khai trên đó. GRB chịu trách nhiệm về
môi giới tài nguyên máy tính và kiểm soát thực hiện công việc lưới điện. GRB hợp tác chặt
chẽ với DMS để tải xuống dữ liệu đầu vào của công việc và tải lên kết quả công việc dựa
trên số nhận dạng tệp dữ liệu thu được từ định nghĩa công việc cũng như báo cáo cho GSP
về các sự kiện liên quan đến việc thực hiện công việc (bắt đầu, thất bại hoặc thành công ).

Hình 1 Kiến trúc hệ thống chung của PROGRESS

DMS trong PROGRESS được sử dụng để lưu trữ các tệp đầu vào và đầu ra của
lệnh lưới. Tệp dữ liệu được tham chiếu trong DMS và toàn bộ môi trường
PROGRESS với một mã định danh đối tượng duy nhất. Định danh cho phép lấy
thông tin về vị trí của tệp trong hệ thống phân tán. Mỗi tệp có thể được tải xuống
hoặc tải lên bằng các giao thức khác nhau; WP sử dụng FTP, MD và GRB sử dụng
GridFTP để truyền dữ liệu.

Cấu hình 3 cụm


Liên quan đến cấu hình thử nghiệm, dự án nhằm mục đích xây dựng cụm máy một thực sự

tính phân tán của các hệ thống Mặt trời được trình bày trong Tab. 1.

Chuyển hướng. 1 Cấu hình của cụm PROGRESS cho giường thử nghiệm

PSNC Poznań Cyfronet Kraków


Tin học Sun Fire 6800 (24 proc., 24GB RAM) Sun Fire 6800 (24 proc., 24GB RAM)
may chủ Sun Fire 6800 (24 proc., 24GB RAM)
Dữ liệu Sun Fire V880 (4 proc., RAM 8GB)) Sun Fire V880 (4 proc., RAM 8GB)
Ban quản lý
May chủ
Máy chủ giao diện người dùng Sun Fire 280R (2 proc., RAM 8GB)
Sun StorEdge T3 (9 * 36 GB, RAID5) Sun StorEdge T3 (9 * 36 GB, RAID5)
Kho lưu trữ Sun StorEdge T3 (9 * 36 GB, RAID5) Sun StorEdge T3 (9 * 36 GB, RAID5)
Sun StorEdge T3 + (9 * 36 GB, RAID5)

Cả hai máy chủ tính toán trong Poznan đều được chia thành các miền logic.
Một cái có hai tên miền và cái kia có ba tên miền. Tuy nhiên, ở Krakow, đế
máy chủ tính toán được chia thành hai miền. Hiện tại, theo quan điểm của người
dùng, toàn bộ cài đặt được xem như bốn hệ thống tách biệt (phần còn lại của các
miền được sử dụng làm nền tảng kiểm tra và phát triển mã). Sun Grid Engine (SGE) và
Globus Toolkit 2.0 đã được cài đặt trên tất cả các miền. Cả hai gói này đều tạo nên cơ
sở cho môi trường phát triển và vận hành của dự án.
Hiện tại, tất cả bốn miền đang chạy độc lập, tức là các công việc tính toán có thể được
gửi trực tiếp cho mỗi miền. Nó là một nhà môi giới được phát triển trong dự án này, chịu
trách nhiệm phân bổ nguồn lực. Gói Globus là một giao diện cho mỗi miền. Nó cho phép
thực hiện các công việc tính toán dựa trên các tài nguyên phần cứng có sẵn bằng cách sử
dụng các cơ chế riêng của nó hoặc lên lịch thực hiện các công việc tới SGE. Trong giai đoạn
tiếp theo, một số miền sẽ trở thành một phần của cụm được tạo dựa trên SGE. Sau đó,
trong cấu hình đó và trên một cụm mới được tạo, một cài đặt duy nhất của phần mềm
Globus sẽ hoạt động như một giao diện thực thi công việc trên các miền là một phần của
cụm. Sau đó, tất cả các công việc đã nộp sẽ được chuyển hướng thực hiện và quản lý tới
SGE. Cách tiếp cận này sẽ cho phép sử dụng đầy đủ tiềm năng của SGE và cũng sẽ cung cấp
phương tiện để kiểm tra nhà môi giới được phát triển trong các môi trường khác nhau
(nhóm miền độc lập và nhóm miền độc lập kết hợp với (các) cụm). Công việc về chủ đề này
được lên kế hoạch cho năm 2003.
Hiện tại, nền tảng phát triển bao gồm phần mềm MPICH-G2. Các kế hoạch cho
tương lai bao gồm việc sử dụng MPI, một phần của Sun HPC ClusterTools.
Mạng quang nhanh hoạt động như một nền tảng mà trên đó các hệ
thống tính toán hiệu suất cao có thể được kết nối với nhau. Kiến trúc có thể
mở rộng của nó giúp bạn có thể mở rộng cụm đã tạo để tăng sức mạnh tính
toán. Nhằm đảm bảo chức năng đó, tất cả các kết nối cục bộ giữa các máy
chủ tính toán và hệ thống quản lý dữ liệu được thực hiện dựa trên công nghệ
Gigabit Ethernet ở cả hai địa điểm (tức là Krakow và Poznan). Kết nối giữa các
địa điểm dựa trên một liên kết chuyên dụng POL-622 (NREN của Ba Lan)
được thực hiện trong công nghệ ATM. Trên lớp IP, tất cả hệ thống là một
phần của cụm tính toán đang sử dụng một lớp địa chỉ riêng biệt để đạt được
hình thức phân tách hợp lý trên Internet. Máy chủ front-end được kết nối với
Mạng Khu vực Đô thị Poznan (POZMAN) bằng liên kết Fast Ethernet.

4 Môi trường cổng lưới

4.1 Hệ thống quản lý dịch vụ lưới


Các nhiệm vụ chính của thành phần PROGRESS này là cho phép quản lý hiệu
quả việc thực thi công việc của người dùng và quản lý tài nguyên trong môi
trường lưới phân tán, tiên tiến. Người dùng sẽ có cơ hội xác định tất cả các thuộc
tính bắt buộc và các ràng buộc tài nguyên có thể có cho các ứng dụng của mình.
Hơn nữa, các ràng buộc về mức độ ưu tiên giữa các tác vụ có thể được chỉ định
cung cấp các cơ chế để định nghĩa các thử nghiệm tính toán nâng cao bao gồm
việc giám sát việc thực hiện các tác vụ cụ thể. Để cải thiện hiệu suất của toàn hệ
thống, một hệ thống giám sát tài nguyên dựa trên công nghệ Jini / Jiro đã được
đưa vào. Kiến trúc được thiết kế tuân theo các tiêu chuẩn được xác định bởi
Nhóm làm việc Lập lịch và Quản lý Tài nguyên (SCHED-WG), được thành lập trong Diễn
đàn Lưới [5]. Kiến trúc của hệ thống được trình bày trên Hình 2
Hệ thống cung cấp chức năng của Nhà môi giới tài nguyên lưới bằng hai
chức năng cơ bản:
• submitJob - một chức năng để gửi công việc dựa trên định nghĩa XRSL về các nhiệm
vụ,
• getJobId - trả về định danh công việc.
Nhiệm vụ chính của nhà môi giới là đọc mô tả công việc trong XRSL [6], gọi các
hàm để phân tích cú pháp, kiểm tra tính đúng đắn của nó và đưa ra quyết định liên
quan đến việc phân bổ tài nguyên cho việc thực thi tác vụ cụ thể. Việc thực thi tác vụ
từ xa được xử lý bởi giao thức GRAM từ hệ thống Globus. Các thủ tục và thuật toán
nâng cao để lập lịch và quản lý tài nguyên đã được phát triển và tích hợp trong kiến
trúc nhà môi giới; thông tin thêm có thể được tìm thấy trong [7]. Nhà môi giới đang
hợp tác với hai mô-đun khác: khám phá tài nguyên và quản lý công việc.
Theo dự án PROGRESS, dòng thời gian trong tương lai gần dịch vụ MDS của
Globus hiện đang được sử dụng để khám phá tài nguyên sẽ được thay thế bằng hệ
thống giám sát dựa trên công nghệ Jini / Jiro.
Mô-đun quản lý công việc là phần tiếp theo của hệ thống quản lý dịch vụ lưới
điện. Nó cung cấp các chức năng sau:
• getJobStatus - một hàm trả về trạng thái của công việc;
• jobCancel - một chức năng loại bỏ công việc;
• jobSuspend - một chức năng tạm dừng việc thực hiện công việc;
• jobResume - một chức năng tiếp tục công việc bị tạm ngừng.

Hình 2 Kiến trúc của hệ thống quản lý dịch vụ lưới điện


Trạng thái Công việc mô tả trạng thái hiện tại của công việc trong hệ thống phân phối
tài nguyên. Tại thời điểm tồn tại của dự án hiện tại, nó xác định xem công việc đang được
tính toán hay đã hoàn thành.

4.2 Quản lý bảo mật


Một trong những thành phần bảo mật quan trọng nhất được phát triển trong môi
trường lưới điện tử PROGRESS là Hệ thống phát hiện kẻ xâm nhập VALKYRIE. Tính năng
chính của nó là phát hiện những kẻ xâm nhập theo thời gian thực. VALKYRIE là một hệ
thống kết hợp triển khai các cơ chế và thuật toán tiên tiến của các IDS đã biết cũng như các
cơ chế đơn giản để phản ứng khi phát hiện sự cố. Hệ thống sẽ đảm bảo kiểm soát và giám
sát các hệ thống được chỉ định và đảm bảo tiết lộ ngay lập tức bất kỳ nỗ lực tấn công nào.
Kiến trúc hệ thống tuân theo mô hình CIDF [8]. Mô tả hệ thống hoàn chỉnh có thể được tìm
thấy trong [9]

4.3 Hệ thống quản lý dữ liệu


Hệ thống quản lý dữ liệu chứa ba mô-đun phân biệt hợp lý: Nhà môi giới dữ liệu,
Kho lưu trữ siêu dữ liệu và Trình vận chuyển dữ liệu. Chức năng của các mô-đun đó sẽ
được mô tả bên dưới.
Nhà môi giới dữ liệu(DB) được thiết kế để trở thành điểm truy cập chính tới các tài nguyên và
dịch vụ DMS. Các tác vụ cơ bản mà nó cung cấp như sau:
• phản hồi không đồng bộ các yêu cầu của khách hàng, mà không chặn quyền truy cập vào các dịch vụ
đó đối với các ứng dụng khách khác,
• thực hiện chính sách bảo mật ở cấp phần tử kho lưu trữ (quyền truy cập vào tệp dữ
liệu, thư mục),
• chuyển các yêu cầu của khách hàng đến kho lưu trữ siêu dữ liệu
• thu thập và gửi lại kết quả cho khách hàng
DB là một mô-đun làm trung gian trong luồng của tất cả các yêu cầu được hướng đến DMS.
Không có khả năng ứng dụng bên ngoài chuyển các yêu cầu trực tiếp đến kho lưu trữ hoặc thậm
chí các trình vận chuyển dữ liệu.
Trong phạm vi công việc của DMS, công nghệ giao tiếp giữa DB và các mô-
đun DMS khác đã được thiết kế và khởi xướng. Ý tưởng của cơ chế này có thể
được minh họa dựa trên một mô tả yêu cầu của khách hàng:
• lúc đầu, DB ủy quyền cho khách hàng đã gửi yêu cầu. Về phần cuối này, DB sử dụng mô-
đun ủy quyền từ xa để xác minh rằng người dùng đã cho được ủy quyền để truy cập tài
nguyên cụ thể.
• sau khi quá trình xác minh thành công, DB chuẩn bị một truy vấn thích hợp (dựa
trên yêu cầu của khách hàng) và gửi nó đến kho lưu trữ siêu dữ liệu trung tâm.
• kết quả nhận được sẽ được chuyển cho khách hàng.
Tất cả các hoạt động nêu trên được thực hiện trong môi trường tác nhân
phân tán dựa trên giao thức SOAP để trao đổi thông tin liên lạc (công nghệ
Dịch vụ Web).
Kho lưu trữ siêu dữ liệu(MR) là yếu tố chính của DMS. Ở đây nó lưu trữ các
loại thông tin sau:
• siêu dữ liệu về tài nguyên: tệp dữ liệu, bản địa hóa vật lý của nó và cách có thể để
truy cập chúng,
• siêu dữ liệu về quyền: tất cả thông tin liên quan đến quyền - người dùng, nhóm của
họ, quyền truy cập.
• siêu dữ liệu mô tả các tiêu chuẩn của mô tả tệp, ví dụ:Dublin Core(DC) Quyền truy
cập vào tài nguyên kho lưu trữ là các dịch vụ của mô-đun Quản lý siêu dữ liệu (MM).
Nhiệm vụ chính mà nó thực hiện là thu thập các yêu cầu của nhà môi giới dữ liệu và tạo câu
trả lời theo kiến thức có thể truy cập được (siêu dữ liệu) và cũng dựa trên trạng thái của
người vận chuyển dữ liệu và thông tin từ chúng.
Mô-đun MM qua DB cung cấp các loại dịch vụ sau:
• dịch vụ dựa trên danh mục –Để tạo siêu danh mục, xóa nó hoặc di chuyển đến một
nơi khác trong cấu trúc bên trong tất cả nội dung của nó;
• dịch vụ dựa trên tệp - để thêm, xóa, đổi tên tệp và bổ sung xác định
bản địa hóa vật lý của tệp và truy cập tệp;
• dịch vụ an ninh - để xác định xem người dùng cuối cùng có được hưởng một hoạt động nhất
định trên tài nguyên cụ thể theo thông tin siêu dữ liệu hay không.
Có một phiên bản của mô-đun MM trong DMS. Nó được thúc đẩy bởi thực tế là nó lưu
trữ và quản lý thông tin quan trọng về cấu trúc danh mục siêu thị, dữ liệu người dùng và
chính sách bảo mật cho toàn bộ DMS.
Trình vận chuyển dữ liệumô-đun chịu trách nhiệm cung cấp không gian trên các tài
nguyên lưu trữ nằm trong tầm kiểm soát của nó và quản lý hoạt động đặt các tệp dữ liệu
bên trong các tài nguyên của nó và truy cập chúng từ các tài nguyên đó theo yêu cầu. Các
hoạt động được thực hiện bởi mô-đun này được kết nối với việc đặt trước dữ liệu được lên
kế hoạch đặt trên các tài nguyên vận chuyển, chặn các tệp dữ liệu để truy cập (và cho phép
truy cập tệp dữ liệu) và truy cập thông tin về trạng thái của toàn bộ mô-đun vận chuyển và
tệp dữ liệu riêng biệt nằm trong tầm kiểm soát của nó. Hãy nhớ rằng trình vận chuyển
được thiết kế để cộng tác với các phần tử khác của DMS, nó thực hiện chức năng nội bộ
bằng cách sử dụng các giao diện, cho phép giao tiếp với các mô-đun DMS khác. Các phần
tử được triển khai được tạo sẵn (tương tự như các mô-đun khác của DMS) dưới dạng các
dịch vụ web có thể được gọi với việc sử dụng giao thức SOAP để trao đổi thông tin liên lạc
(trình vận chuyển dữ liệu được điều khiển theo cách đó). Việc truy cập dữ liệu trực tiếp được
đảm bảo bởi các giao thức truyền dữ liệu tiêu chuẩn được sử dụng trong môi trường lưới:
giao thức FTP, giao thức GASS (Grid Access to Secondary Storage) [10] như một phiên bản
tiêu chuẩn và an toàn, giao thức GridFTP [11] (gsiftp - sự cải tiến của giao thức FTP tiêu
chuẩn với Cơ sở hạ tầng bảo mật Globus).

Một phần tử riêng biệt của DMS là cài đặt hệ thống SRS. Hệ thống SRS là một mô-đun môi
trường dữ liệu quan trọng, nó lưu trữ các trình tự sinh học cần thiết cho việc thực thi tính toán?
trên cổng thông tin. Hệ thống sử dụng cài đặt thí điểm ở Poznan và nó được cấu hình với việc sử
dụng các ngân hàng dữ liệu sinh học được lập chỉ mục. Ngoài ra, một bộ tập lệnh đã được chuẩn
bị để giữ cho bản sao dữ liệu sinh học được cập nhật tại địa phương. Giao diện người dùng của
hệ thống SRS có thể truy cập được tạihttp://srs.man.poznan.pl/
Kiến trúc tổng thể của Hệ thống quản lý dữ liệu trong PROGRESS đã được
trình bày trên Hình 3
Hình 3 Kiến trúc hệ thống quản lý dữ liệu

4.4 Nhà cung cấp dịch vụ lưới và Quản lý ứng dụng


Trong phạm vi của Gói công việc quản lý ứng dụng và nhà cung cấp dịch vụ lưới, một
kiến trúc mới cho môi trường cổng lưới đã được đề xuất. Kiến trúc này giả định tách các
chức năng trình bày của cổng thông tin khỏi các chức năng xử lý logic (tức là tách giao diện
người dùng khỏi các dịch vụ cho phép truy cập lưới) và giới thiệu một mục mới - nhà cung
cấp dịch vụ lưới. Nhà cung cấp dịch vụ lưới hoàn toàn độc lập với giao diện người dùng và
hệ thống quản lý tài nguyên lưới (GMS). Nó chỉ cung cấp chức năng cho phép sử dụng tài
nguyên lưới từ cấp độ của nhiều giao diện người dùng và giao tiếp với GMS để thực hiện
các công việc lưới do người dùng gửi. Người dùng có thể chuyển đổi giữa các giao diện truy
cập của nhà cung cấp dịch vụ khác nhau và sử dụng các dịch vụ giống nhau (đặc biệt là dịch
vụ nộp công việc tính toán). Một giải pháp như vậy cho phép quản lý các công việc lưới và
chạy các ứng dụng được thu thập trong một nhà cung cấp dịch vụ từ cấp độ của một hoặc
nhiều giao diện người dùng. Trong PROGRESS, hai giao diện người dùng độc lập như vậy là
cổng thông tin điện tử và máy tính để bàn di chuyển.

Điều đáng nói là các nhóm nghiên cứu xử lý các vấn đề tương tự, quan tâm đến
phạm vi của dự án PROGRESS, cũng đã nhận thấy sự cần thiết của việc tách một lớp
tương tự trong môi trường truy cập hệ thống lưới của họ. Trong hội nghị về Siêu máy
tính năm 2002 ở Baltimore, một ý tưởng về một hệ thống được xây dựng giống như
tiến trình đã được trình bày. Giải pháp này đang được triển khai tại SDSC và Đại học
Indiana [12].
Nhà cung cấp dịch vụ lưới được coi là một tập hợp các dịch vụ có giao diện Dịch vụ Web
cho phép truy cập các chức năng được chuẩn bị trong công nghệ EJB (đặc tả phiên bản 2.0)
[13]. Dữ liệu thu được thông qua việc sử dụng các phương pháp được tích lũy trong GSP
được trình bày trong môi trường cổng thông tin điện tử. Các mô-đun trình bày bổ sung cho
các dịch vụ được thực hiện như nhà cung cấp nội dung cho các kênh của cổng thông tin
được chuẩn bị trong môi trường phần mềm Sun ONE Portal Server [14] (hiện đang sử dụng
phiên bản 6.0).
Hiện tại, nhà cung cấp dịch vụ cho phép sử dụng một trong bốn dịch vụ đã triển khai.
Đó là:
• dịch vụ điện toán trình công việc, cho phép tạo, đệ trình, giám sát quá trình
thực hiện và truy cập kết quả công việc,
• dịch vụ quản lý ứng dụng, cho phép quản lý các ứng dụng máy tính có
sẵn từ nhà máy ứng dụng của nhà cung cấp dịch vụ,
• dịch vụ quản lý nhà cung cấp, cho phép cập nhật thông tin về các dịch
vụ có sẵn trong nhà cung cấp dịch vụ,
• dịch vụ tin nhắn ngắn, là một ví dụ về dịch vụ thông tin dành cho cổng
thông tin điện tử (các ví dụ khác của loại dịch vụ này có thể là thư mục liên
kết hoặc dịch vụ diễn đàn thảo luận).
Tấm thử nghiệm được giới thiệu trong triển lãm Siêu máy tính 2002 ở
Baltimore (Hình 4) bao gồm cổng web (được triển khai trong môi trường Sun
ONE Portal Server 6.0), cho phép sử dụng các dịch vụ: gửi công việc tính toán,
quản lý nhà cung cấp dịch vụ và đọc tin nhắn ngắn và viết cũng như để quản lý
dữ liệu được thu thập trong hệ thống quản lý dữ liệu.

Hình 4 Kiểm tra cổng thông tin PROGRESS trong Siêu máy tính 2002
5 Công việc liên quan

Có một số dự án lớn nhằm mục đích thiết kế và phát triển kiến trúc
gridportal.
Đối tác Quốc gia về Cơ sở Hạ tầng Tính toán Nâng cao (NPACI) đã phát triển
Cổng Điện toán Lưới HotPage [15] đã trực tuyến được vài năm nay. Được thiết kế
ban đầu bởi SDSC, nó là một triển khai của cơ sở hạ tầng GridPort. GridPort [16]
là một tập hợp các mô-đun Perl cung cấp chức năng lưới phụ trợ cho các cổng
web. Cài đặt bộ công cụ cho phép xây dựng một cổng thông tin trên đầu nó. Môi
trường truy cập lưới được tạo theo cách này cho phép truyền tệp, thực thi lệnh và
trình công việc.
Một dự án khác có cổng được thực hiện bằng công nghệ Perl là Legion Grid Portal [17].
Được phát triển tại Đại học Virginia, nó tạo điều kiện tiếp cận với lưới điện. LGP đã được
triển khai để sử dụng mạng lưới Legion trên toàn thế giới. Logic của LGP là một tập lệnh
Perl CGI, được sử dụng để xử lý hầu hết các yêu cầu của người dùng. Vai trò của nó là thay
mặt người dùng đưa ra các lệnh Legion. Tập lệnh cũng sử dụng một số mô-đun PHP, đặc
biệt là những mô-đun truy cập cơ sở dữ liệu kế thừa. LGP có thể được triển khai để tương
tác với bất kỳ cơ sở hạ tầng lưới điện bên dưới nào, ví dụ như Globus.
NASA đang phát triển Lưới điện thông tin [18], nhằm mục đích cung cấp khuôn
khổ cơ bản để chia sẻ và quản lý tài nguyên trên các địa điểm. IPG phiên bản 1.0 bao
gồm cổng điện toán Launchpad v. 1, cung cấp quyền truy cập vào các dịch vụ lưới,
cung cấp quyền truy cập vào IPG cho người dùng không phức tạp và duy trì thông tin
hồ sơ người dùng. Launchpad cho phép gửi các công việc tới các công cụ tính toán
“hàng loạt”, thực hiện các lệnh trên tài nguyên tính toán, chuyển tệp giữa hai hệ
thống, nhận trạng thái trên hệ thống và công việc cũng như sửa đổi môi trường của
người dùng. Cổng IPG được tạo bằng cách sử dụng GPDK [19], đang được phát triển
tại Phòng thí nghiệm Quốc gia Lawrence Berkeley. GPDK bao gồm thư viện các bean
dịch vụ cốt lõi, một servlet trung tâm và một bộ sưu tập các trang web mẫu demo. Các
hạt dịch vụ được triển khai trong công nghệ J2EE và sử dụng bộ công cụ Java
Commodity Grid (CoG), bộ công cụ này cung cấp một API Java thuần túy cho các dịch
vụ Globus. Các trang web mẫu bao gồm HTML và JSP và có thể được tùy chỉnh theo
nhu cầu của một cài đặt cụ thể. GPDK cung cấp các dịch vụ bảo mật, gửi công việc,
chuyển tệp và thông tin.

6. Kết luận
Trong nhiều môi trường cổng lưới có sẵn, một đặc điểm chung có thể dễ dàng xác
định: giao diện người dùng cổng thông tin điện tử thường được tích hợp hoàn toàn
với các cơ chế tương tác cho cơ sở hạ tầng lưới. Giao diện người dùng và dữ liệu được
trình bày trong đó đến từ một và cùng một máy chủ ứng dụng. Kiến trúc như vậy
không đủ linh hoạt, đặc biệt là trong các giải pháp kinh doanh. Do đó, nhóm nghiên
cứu TIẾN ĐỘ đã áp dụng một cách tiếp cận khác được trình bày trong bài báo. Toàn
bộ kiến trúc phần mềm bao gồm phần mềm trung gian đã có sẵn (ví dụ: Globus, Sun
Grid Engine, HPC Cluster Tools) cũng như các công cụ và dịch vụ được phát triển trong
các gói công việc của dự án. Hầu hết các thành phần đó giao tiếp với nhau thông qua
các giao diện dựa trên Dịch vụ Web và được phân phối trong cài đặt thử nghiệm.
Ngoài cách tiếp cận kiến trúc tổng thể, tất cả các thành phần cụ thể của hệ thống đều
rất quan trọng nếu liên quan đến môi trường lưới tiên tiến. Việc nộp hồ sơ được xử lý bởi
Nhà môi giới lưới. Dữ liệu cần thiết cho tính toán được quản lý bởi Hệ thống quản lý dữ liệu.
Ngoài ra, bất kỳ giao diện người dùng nào cũng có thể sử dụng Nhà cung cấp Dịch vụ Lưới
được phát triển trong dự án. Cổng thông tin điện toán là một ví dụ về giao diện như vậy và
được cung cấp trong dự án. Một ví dụ khác là màn hình di chuyển. Và cuối cùng, một trong
những phần quan trọng nhất của kiến trúc cổng lưới được thực hiện là bảo mật lưới.

Cũng cần nhắc lại rằng trước khi kết thúc dự án (tháng 5 năm 2003) tất cả các
phần tử đã phát triển sẽ được thử nghiệm và sử dụng thực tế bằng các ứng dụng tính
toán tin sinh học. Chúng có thể chạy trong lưới được gửi trực tiếp từ cổng tính toán
như nó đã được trình bày trong thử nghiệm SC2002 khi hai trong số chúng có thể
được khởi động từ Baltimore và các phép tính được thực hiện ở Poznan hoặc ở
Krakow.
Ngoài ra còn có một khoản lợi nhuận bổ sung của PROGRESS đã được giả định
trước khi dự án bắt đầu vào tháng 12 năm 2000. Dự án sẽ cho phép môi trường cổng
lưới được tạo cho các ứng dụng nâng cao khác trở thành sản phẩm bán sẵn. Đây là
nhiệm vụ chính cho giai đoạn triển khai sau khi phần R&D kết thúc.
Người giới thiệu

1 Rychlewski, J., Weglarz, J., Starzak, S., Stroinski, M., Nakonieczny, M.: PIONIER:
Internet quang học Ba Lan. Kỷ yếu của ISThmus 2000 Nghiên cứu và Phát triển cho
hội nghị Xã hội Thông tin Poznan Ba Lan (2000), trang 19-28
2 Trang web TIẾN BỘ. Được truy cập từhttp://progress.psnc.pl/
3 http://www.sun.com/software/gridware/
4 http://www.globus.org/
5 http://www.gridforum.org/
6 Định nghĩa công việc lưới XRSL. Được truy cập từhttp://progress.psnc.pl/xrsl/ Kurowski,
7 K., Nabrzyski, J., Pukacki, J.: Đa mục tiêu hướng theo sở thích người dùng
Quản lý tài nguyên trong môi trường lưới. Kỷ yếu hội nghị CCGRID 2001 (2001)
Brisbane Australia
8 S. Staniford-Chen, Khung phát hiện xâm nhập chung, tháng 3 năm 1998,
http://seclab.cs.ucdavis.edu/cidf
9 Chmielewski M., Gowdiak A., Fonrobert S., Meyer N., Ostwald T.: VALIS /
Valkyrie. Được xuất bản trong Kỷ yếu Hội thảo Lưới điện Cracow Ba Lan (2002)
10 Truy cập Toàn cầu và Bộ nhớ Thứ cấp (GASS). Được truy cập từhttp://
wwwfp.globus.org/gass/
11 Giao thức GridFTP và Phần mềm. Được truy cập từhttp://
wwwfp.globus.org/datagrid/gridftp.html
12 Pierce, M., Fox, G., Youn, Ch., Mock, S., Mueller, K., Balsoy, O.: Dịch vụ web
tương thích cho cổng tính toán. Kỷ yếu về Siêu máy tính 2002 Baltimore (2002)

13 Công nghệ JavaBeans dành cho Doanh nghiệp. Được truy cập từhttp://java.sun.com/products/ejb/
14 Môi trường Mạng Mở Mặt trời (Sun ONE). Được truy cập từ http://wwws.sun.com/software/sunone/

15 Cổng điện toán lưới NPACI HotPage. Truy cập tại https://hotpage.npaci.edu/ 16 Thomas,
M., Mock, S., Boisseau, J., Dahan, M., Mueller, K., Sutton, D. .: Kiến trúc bộ công cụ GridPort
cho lưới xây dựng Cổng thông tin. Kỷ yếu của Hội nghị chuyên đề quốc tế IEEE lần thứ mười
về máy tính phân tán hiệu suất cao (2001)
17 Natrajan, A., Nguyen-Tuong, A., Humphrey, MA, Grimshaw, S.: Legion Grid Portal.
Được truy cập từhttp://legion.virginia.edu/papers.html
18 Lưới điện thông tin. Được truy cập từhttp://www.ipg.nasa.gov/
19 Novotny, J.: Bộ công cụ phát triển cổng lưới. Được truy cập từhttp://www.cogkits.org/

Xem số liệu thống kê về xuất bản

You might also like