You are on page 1of 39

ĐẠI HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI

KHOA CÔNG NGHỆ THÔNG TIN


*****

BÀI TIỂU LUẬN


MÔN HỌC: ĐIỆN TOÁN ĐÁM MÂY

ĐỀ TÀI: Công nghệ lưu trữ mạng SAN và chia sẻ dữ liệu đám mây

Sinh viên thực hiện:


1. Phạm Quang Minh(C) 71DCTT22116
2. Phạm Quang Minh 71DCTT22115
3. Nguyễn Đức Phúc Lộc 71DCTT22104
4. Dư Trần Việt

Lớp:71DCTT23
Khóa:71
Giảng viên hướng dẫn: Mạc Văn Quang

HÀ NỘI – 2022

Contents
CHƯƠNG 1: LÝ THUYẾT CHUNG VỀ ĐIỆN TOÁN ĐÁM MÂY....................................................4
I. LỊCH SỬ RA ĐỜI CỦA ĐIỆN TOÁN ĐÁM MÂY........................................................................................4
II. KHÁI NIỆM VỀ ĐIỆN TOÁN ĐÁM MÂY..................................................................................................5
III. CÁC ĐẶC TÍNH CỦA ĐIỆN TOÁN ĐÁM MÂY.........................................................................................6
IV. SƠ LƯỢC CÁC CÔNG NGHỆ ỨNG DỤNG TRONG ĐIỆN TOÁN ĐÁM MÂY............................................7
1. Công nghệ ảo hoá................................................................................................................................7
2. Công nghệ tự động hóa giám sát điều phối tài nguyên (automation, dynamic dynamic
orchestration)......................................................................................................................................8
3. Công nghệ tính toán phân tán, hệ phân tán....................................................................................8
4. Công nghệ Web 2.0..........................................................................................................................9
V. ƯU NHƯỢC ĐIỂM CỦA ĐIỆN TOÁN ĐÁM MÂY....................................................................................9
1. Ưu điểm của điện toán đám mây....................................................................................................9
2. Nhược điểm của điện toán đám mây............................................................................................11
VI. GIỚI THIỆU MỘT SỐ ĐÁM MÂY ĐƯỢC SỬ DỤNG TRIỂN KHAI PHỔ BIẾN HIỆN NAY.........................13
CHƯƠNG 2: CÔNG NGHỆ LƯU TRỮ MẠNG SAN VÀ CHIA SẺ DỮ LIỆU ĐÁM MÂY............14
I. Khái niệm về hệ thống lưu trữ mạng..................................................................................................14
1. Định nghĩa SAN..............................................................................................................................14
2. Lợi ích khi sử dụng SAN..................................................................................................................15
3. Tính năng.......................................................................................................................................16
4. Điều khiển đĩa................................................................................................................................17
5. Các dạng SANs...............................................................................................................................18
6. SAN trong môi trường làm việc.....................................................................................................19
7. SAN trong ứng dụng ngày nay.......................................................................................................19
8. iSCSI SAN là gì ?.............................................................................................................................20
II. Kiến trúc hệ thống lưu trữ đám mây.................................................................................................23
1. Khái Niệm......................................................................................................................................23
2. Các loại lưu trữ đám mây...............................................................................................................23
3. Cách thức hoạt động......................................................................................................................24
4. Ưu nhược điểm.............................................................................................................................26
5. Ví dụ..............................................................................................................................................27
6. Một số nhà cung cấp......................................................................................................................28
III. Hệ thống lưu trữ SAN là gì, ưu điểm hệ thống SAN..........................................................................29
1. Khái niệm.......................................................................................................................................29
2. Ưu điểm hệ thống SAN..................................................................................................................29
IV. Mô hình kết nối tới cụm lưu trữ dữ liệu SAN...................................................................................32
1. Sơ lược vè mô hình kết nối:...........................................................................................................32
2. Mô tả thiết kế:...............................................................................................................................33
V. So sánh hệ thống SAN và NAS...........................................................................................................35
VI. So sánh hệ thống SAN và DAS...........................................................................................................37
VII. Bảo mật dữ liệu trên hệ thống lưu trữ đám mây SAN.....................................................................38
CHƯƠNG 1: LÝ THUYẾT CHUNG VỀ ĐIỆN TOÁN ĐÁM MÂY

I. LỊCH SỬ RA ĐỜI CỦA ĐIỆN TOÁN ĐÁM MÂY

Khái niệm điện toán đám mây ra đời từ những năm 1950 khi máy chủ tính
toán quy mô lớn (large-scale mainframe computers) được triển khai tại một số cơ
sở giáo dục và tập đoàn lớn. Tài nguyên tính toán của các hệ thống máy chủ được
truy cập từ các máy khách cuối (thin clients, terminal computers), từ đó khai sinh
khái niệm “chia sẻ thời gian” (time-sharing) đặc tả việc cho phép nhiều người sử
dụng cùng chia sẻ đồng thời một tài nguyên tính toán chung.
Trong những năm 1960 – 1990, xuất hiện luồng tư tưởng coi máy tính hay
tài nguyên công nghệ thông tin có thể được tổ chức như hạ tầng dịch vụ công cộng
(public utility). Điện toán đám mây hiện tại cung cấp tài nguyên tính toán dưới
dạng dịch vụ và tạo cảm giác cho người dùng về một nguồn cung ứng là vô tận.
Đặc tính này có thể so sánh tới các đặc tính của ngành công nghiệp tiêu dùng dịch
vụ công cộng như điện và nước. Khi sử dụng điện hay nước, người dùng không
cần quan tâm tới tài nguyên đến từ đâu, được xử lý, phân phối như thế nào, họ chỉ
việc sử dụng dịch vụ và trả tiền cho nhà cung cấp theo lượng tiêu dùng của mình.
Những năm 1990, các công ty viễn thông từ chỗ cung ứng kênh truyền dữ liệu
điểm tới điểm (point-to-point data circuits) riêng biệt đã bắt đầu cung ứng các dịch
vụ mạng riêng ảo với giá thấp. Thay đổi này tạo tiền đề để các công ty viễn thông
sử dụng hạ tầng băng thông mạng hiệu quả hơn. Điện toán đám mây mở rộng khái
niệm chia sẻ băng thông mạng này qua việc cho phép chia sẻ cả tài nguyên máy
chủ vật lý bằng việc cung cấp các máy chủ ảo.

Amazon cung cấp nền tảng Amazon Web Services (AWS) vào năm 2006,
đánh dấu việc thương mại hóa điện toán đám mây. Từ đầu năm 2008, Eucalyptus
được giới thiệu là nền tảng điện toán đám mây m~ nguồn mở đầu tiên, tương thích
với API của AWS. Tính tới thời điểm hiện tại, có rất nhiều các sản phẩm điện toán
đám mây được đưa ra như Google App Engine, Microsoft Azure, Nimbus,...

II. KHÁI NIỆM VỀ ĐIỆN TOÁN ĐÁM MÂY

Điện toán đám mây (cloud computing) là một xu hướng công nghệ nổi bật
trên thế giới trong những năm gần đây và đã có những bước phát triển nhảy vọt cả
về chất lượng, quy mô cung cấp và loại hình dịch vụ, với một loạt các nhà cung
cấp nổi tiếng như Google, Amazon, Salesforce, Microsoft,...

Điện toán đám mây là mô hình điện toán mà mọi giải pháp liên quan đến
công nghệ thông tin đều được cung cấp dưới dạng các dịch vụ qua mạng Internet,
giải phóng người sử dụng khỏi việc phải đầu tư nhân lực, công nghệ và hạ tầng để
triển khai hệ thống. Từ đó điện toán đám mây giúp tối giản chi phí và thời gian
triển khai, tạo điều kiện cho người sử dụng nền tảng điện toán đám mây tập trung
được tối đa nguồn lực vào công việc chuyên môn.

Lợi ích của điện toán đám mây mang lại không chỉ gói gọn trong phạm vi
người sử dụng nền tảng điện toán đám mây mà còn từ phía các nhà cung cấp dịch
vụ điện toán. Theo những đánh giá của nhóm IBM CloudBurst năm 2009, trên môi
trường điện toán phân tán có đến 85% tổng năng lực tính toán trong trạng thái nhàn
rỗi, thiết bị lưu trữ tăng 54% mỗi năm, khoảng 70% chi phí được dành cho việc
duy trì các hệ thống thông tin. Công nghiệp phần mềm mất đi 40 tỷ USD hằng năm
vì việc phân phối sản phẩm không hiệu quả, khoảng 33% khách hàng phàn nàn về
các lỗi bảo mật do các công ty cung cấp dịch vụ. Những thống kê này đều chỉ đến
một điểm quan trọng: mô hình hệ thống thông tin hiện tại đã lỗi thời và kém hiệu
quả, cần phải chuyển sang một mô hình điện toán mới – đó là điện toán đám mây.

Theo định nghĩa của Viện Quốc gia Tiêu chuẩn và Công nghệ Mỹ (US
NIST), điện toán đám mây là mô hình cho phép truy cập trên mạng tới các tài
nguyên được chia sẻ (ví dụ: hệ thống mạng, máy chủ, thiết bị lưu trữ, ứng dụng và
các dịch vụ) một cách thuận tiện và theo nhu cầu sử dụng. Những tài nguyên này
có thể được cung cấp một cách nhanh chóng hoặc thu hồi với chi phí quản lý tối
thiểu hoặc tương tác tối thiểu với nhà cung cấp dịch vụ.

III. CÁC ĐẶC TÍNH CỦA ĐIỆN TOÁN ĐÁM MÂY

Định nghĩa của US NIST chứa đựng kiến trúc, an ninh và chiến lược triển
khai của đám mây. Năm đặc tính cốt lõi của điện toán đám mây được thể hiện rõ
như sau:
– Tự phục vụ theo yêu cầu (on-demand self-service): Khách hàng với nhu
cầu tức thời tại những thời điểm thời gian xác định có thể sử dụng các tài nguyên
tính toán (như thời gian CPU, không gian lưu trữ mạng, sử dụng phần mềm,...) một
cách tự động, không cần tương tác với con người để cấp phát.
– Sự truy cập mạng rộng rãi (broad network access): Những tài nguyên
tính toán này được phân phối qua mạng Internet và được các ứng dụng client khác
nhau sử dụng với những nền tảng không đồng nhất (như máy tính, điện thoại di
động, PDA).
– Tập trung tài nguyên: Những tài nguyên tính toán của nhà cung cấp dịch
vụ đám mây được tập trung với mục đích phục vụ đa khách hàng sử dụng mô hình
ảo hóa với những tài nguyên vật lý và tài nguyên ảo được cấp phát động theo yêu
cầu. Động lực của việc xây dựng một mô hình tập trung tài nguyên tính toán nằm
trong hai yếu tố quan trọng: tính quy mô và tính chuyên biệt. Kết quả của mô hình
tập trung tài nguyên là những tài nguyên vật lý trở nên trong suốt với người sử
dụng. Ví dụ, người sử dụng không được biết vị trí lưu trữ cơ sở dữ liệu của họ
trong đám mây.
– Tính mềm dẻo: Đối với người sử dụng, các tài nguyên tính toán được
cung cấp tức thời hơn là liên tục, được cung cấp theo nhu cầu để mở rộng hoặc tiết
giảm không hạn định tại bất kỳ thời điểm nào.
– Khả năng đo lường: Mặc dù tài nguyên được tập trung và có thể chia sẻ
cho nhiều người sử dụng, hạ tầng của đám mây có thể dùng những cơ chế đo lường
thích hợp để đo việc sử dụng những tài nguyên đó cho từng cá nhân.

IV. SƠ LƯỢC CÁC CÔNG NGHỆ ỨNG DỤNG TRONG ĐIỆN TOÁN ĐÁM
MÂY

1. Công nghệ ảo hoá

Công nghệ ảo hóa (virtualization) là công nghệ quan trọng nhất ứng dụng
trong điện toán đám mây. Công nghệ ảo hóa là công nghệ cho phép tạo ra các thực
thể ảo có tính năng tương đương như các thực thể vật lý, ví dụ như thiết bị lưu trữ,
bộ vi xử lý,... Ảo hóa phần cứng (hardware virtualization) tham chiếu tới việc tạo
ra các máy ảo (virtual machine) mà hoạt động với hệ điều hành được cài đặt như
một máy tính vật lý thực. Ví dụ, một máy ảo chạy hệ điều hành Ubuntu có thể
được tạo ra trên một máy tính thực cài hệ điều hành Windows.
Ảo hoà phần cứng cho phép chia nhỏ tài nguyên vật lý để tối ưu hóa hiệu
năng sử dụng. Điều này được thể hiện qua việc có thể khởi tạo nhiều máy ảo với
năng lực tính toán và năng lực lưu trữ bé hơn trên duy nhất một máy chủ vật lý.
Máy chủ vật lý được gọi là host machine còn máy ảo (virtual machine) được gọi là
máy khách (guest machine). Khái niệm "host" và "guest" được sử dụng để phân
biệt phần mềm chạy trên máy tính vật lý hay phần mềm chạy trên máy ảo. Phần
mềm hay firmware tạo máy ảo được gọi là hypervisor hay virtual machine
manager.

2. Công nghệ tự động hóa giám sát điều phối tài nguyên (automation, dynamic
dynamic orchestration)

Công nghệ giám sát điều phối tài nguyên động là nền tảng để điện toán đám
mây thực hiện cam kết chất lượng cung cấp dịch vụ điện toán. Với công nghệ điều
phối tài nguyên động, việc lắp đặt thêm hay giảm bớt các tài nguyên máy chủ vật
lý hoặc máy chủ lưu trữ dữ liệu được thực hiện tự động để hệ thống điện toán luôn
đáp ứng được giao kèo trong hợp đồng dịch vụ đã ký với bên người sử dụng.

3. Công nghệ tính toán phân tán, hệ phân tán

Điện toán đám mây là một dạng hệ phân tán xuất phát từ yêu cầu cung ứng
dịch vụ cho lượng người sử dụng khổng lồ. Tài nguyên tính toán của điện toán
đám mây là tổng thể kết hợp của hạ tầng mạng và hàng nghìn máy chủ vật lý phân
tán trên một hay nhiều trung tâm dữ liệu số (data centers).
4. Công nghệ Web 2.0

Web 2.0 là nền tảng công nghệ phát triển các sản phẩm ứng dụng hướng
dịch vụ trên nền điện toán đám mây. Công nghệ Web 2.0 phát triển cho phép phát
triển giao diện ứng dụng web dễ dàng và nhanh chóng và trên nhiều thiết bị giao
diện khác nhau. Web 2.0 phát triển làm xóa đi khoảng cách về thiết kế giao diện
giữa ứng dụng máy tính thông thường và ứng dụng trên nền web, cho phép chuyển
hóa ứng dụng qua dịch vụ trên nền điện toán đám mây mà không ảnh hưởng đến
thói quen người sử dụng.

V. ƯU NHƯỢC ĐIỂM CỦA ĐIỆN TOÁN ĐÁM MÂY

1. Ưu điểm của điện toán đám mây

Triển khai nhanh chóng: So với phương pháp thông thường triển khai một
ứng dụng trên internet, người dùng phải thực hiện một loạt các công việc như mua
sắm thiết bị (hoặc thuê thiết bị từ bên thứ ba), cài đặt và cấu hình phần mềm, đưa
các ứng dụng vào đám mây, việc sử dụng điện toán đám mây giúp loại bỏ một số
công việc đòi hỏi thời gian lớn, ví dụ người dùng chỉ việc quan tâm phát triển triển
khai các ứng dụng của mình lên “mây” (internet) khi sử dụng các đám mây nền
tảng. Bên cạnh đó, khả năng tăng hoặc giảm sự cung cấp tài nguyên nhanh chóng
theo nhu cầu tiêu dùng của ứng dụng tại các thời điểm khác nhau nhờ công nghệ ảo
hóa của điện toán đám mây cũng là một trong những đặc điểm vượt trội của công
nghệ này, thể hiện khả năng triển khai nhanh đáp ứng đòi hỏi tài nguyên tức thời
của ứng dụng.
Giảm chi phí: Chi phí được giảm đáng kể do chi phí vốn đầu tư được
chuyển sang chi phí duy trì hoạt động. Điều này làm giảm những khó khăn khi
người dùng cần tính toán xử lý các tác vụ trong một lần duy nhất hoặc không
thường xuyên do họ có thể đi thuê cơ sở hạ tầng được cung cấp bởi bên thứ ba.
Đa phương tiện truy cập: Sự độc lập giữa thiết bị và vị trí làm cho người
dùng có thể truy cập hệ thống bằng cách sử dụng trình duyệt web mà không quan
tâm đến vị trí của họ hay thiết bị nào mà họ đang dùng, ví dụ như PC, mobile. Vì
cơ sở hạ tầng off-site (được cung cấp bởi đối tác thứ ba) và được truy cập thông
qua Internet, do đó người dùng có thể kết nối từ bất kỳ nơi nào.
Chia sẻ: Việc cho thuê và chia sẻ tài nguyên giữa các người dùng với nhau
làm giảm chi phí đầu tư hạ tầng tính toán giữa một phạm vi lớn người dùng. Sự
chia sẻ này cũng cho phép tập trung cơ sở hạ tầng để phục vụ các bài toán lớn với
chi phí thấp hơn việc đầu tư hệ thống máy chủ tính toán từ đầu.
Khả năng chịu tải nâng cao: Về lý thuyết, tài nguyên tính toán trên đám
mây là vô hạn. Việc thêm vào năng lực tính toán để chịu tải cao có thể được thực
hiện chỉ bằng các thao tác kích chuột hoặc đ~ được tự động hoá.
Độ tin cậy: Người sử dụng điện toán đám mây được ký hợp đồng sử dụng
với điều khoản chất lượng dịch vụ rất cao ghi sẵn trong hợp đồng. Chất lượng dịch
vụ đám mây đơn giản được đánh giá ổn định hơn hệ thống tự triển khai do nền
tảng đám mây được thiết kế và bảo trì bởi đội ngũ chuyên gia nhiều kinh nghiệm
về hệ thống. Hơn nữa, việc luôn làm việc với hệ thống lớn và gặp nhiều lỗi tương
tự nhau nên quá trình khôi phục hệ thống sau thảm họa thông thường là nhanh
chóng.
Tính co giãn linh động: Tính co giãn thể hiện sự linh động trong việc cung
cấp tài nguyên tính toán theo nhu cầu thực tế của người dùng hoặc các ứng dụng
dịch vụ. Theo đó tài nguyên sẽ được đáp ứng một cách tự động sát với nhu cầu tại
thời gian thực mà không cần người dùng phải có kỹ năng cho quá trình điều khiển
này.
Bảo mật: Tính bảo mật trong điện toán đám mây từ trước đến nay vẫn là
câu hỏi lớn cho người dùng tiềm năng. Tuy nhiên, hiện nay, khả năng bảo mật
trong môi trường đám mây đã được cải thiện đáng kể, nhờ vào một số lý do chính
sau đây: do dữ liệu tập trung trong các đám mây ngày càng lớn nên các nhà cung
cấp luôn chú trọng nâng cao công nghệ và đặt ra những rào cản để tăng tính an
toàn cho dữ liệu. Bên cạnh đó, các nhà cung cấp đám mây có khả năng dành nhiều
nguồn lực cho việc giải quyết các vấn đề bảo mật mà nhiều khách hàng không có
đủ chi phí để thực hiện. Các nhà cung cấp sẽ ghi nhớ các nhật ký truy cập, nhưng
việc truy cập vào chính bản thân các nhật ký truy cập này có thể cũng rất khó khăn
do chính sách của nhà cung cấp đám mây khi người dùng tự mình muốn xác minh
rõ hệ thống của mình có an toàn không. Mặc dù vậy, mối quan tâm lo ngại về việc
mất quyền điều khiển dữ liệu nhạy cảm cũng ngày càng tăng cao.

2. Nhược điểm của điện toán đám mây

Chi phí: Giảm chi phí đầu tư ban đầu là ưu điểm của điện toán đám mây.
Tuy nhiên, nó cũng là một vấn đề phải tranh cãi khi người sử dụng điện toán đám
mây luôn phải duy trì trả phí sử dụng dịch vụ. So với tự chủ đầu tư hạ tầng, người
sử dụng điện toán đám mây không có tài sản sau khấu hao chi phí đầu tư.
Các công cụ giám sát và quản lý: Công cụ giám sát và bảo trì chưa hoàn
thiện và khả năng giao tiếp với các đám mây là có giới hạn, mặc dù thông báo gần
đây của BMC, CA, Novell cho rằng các ứng dụng quản lý trung tâm dữ liệu đang
được cải tiến để cung cấp kiểm soát tốt hơn dữ liệu trong điện toán đám mây
Amazon EC2 và các dịch vụ đám mây.
Chuẩn hóa đám mây: Chuẩn hóa giao tiếp và thiết kế đám mây chưa được
thông qua. Mỗi nền tảng cung cấp các giao diện quản lý và giao tiếp ứng dụng API
khác nhau. Hiện nay, các tổ chức như Distributed Management Task Force, Cloud
Security Alliance và Open Cloud Consortium đang phát triển các tiêu chuẩn về
quản lý tương thích, di chuyển dữ liệu, an ninh và các chức năng khác của điện
toán đám mây.
Tính sẵn sàng: Tính sẵn sàng là ưu điểm của đám mây trong lý thuyết. Tuy
nhiên, trên thực tế với các đám mây hiện thời, tính sẵn sàng đôi khi không được
đảm bảo và cũng là một trở ngại hiện nay, khi chỉ có một số ít nhà cung cấp dịch
vụ cam kết được về sự sẵn sàng và liên tục của dịch vụ, về thời gian sửa chữa và
phục hồi dữ liệu.
Vấn đề tuân thủ hợp đồng cũng trở nên phức tạp: Những nhà cung cấp
dịch vụ điện toán đám mây có thể chuyển dữ liệu tới quốc gia khác có giá điện rẻ
hơn, nhưng luật lỏng lẻo hơn mà người sử dụng dịch vụ điện toán không được
thông tin. Điều này hoàn toàn có thể vì đám mây là trong suốt với người dùng.
Tính riêng tư: Hầu hết các hợp đồng thể hiện giao kèo giữa nhà cung cấp
và người dùng điện toán đám mây hứa hẹn một viễn cảnh trong đó dữ liệu khách
hàng luôn an toàn và riêng tư. Tuy nhiên, tính riêng tư trong điện toán đám mây
cũng là một vấn đề đáng quan tâm vì hạ tầng an toàn thông tin cho đám mây hiện
vẫn đang là một chủ đề nghiên cứu trong giới khoa học.
Cấp độ dịch vụ: Điện toán đám mây cung cấp dịch vụ theo yêu cầu, tuy
nhiên trong thực tế, các gói dịch vụ thường được định nghĩa trước và người sử
dụng căn cứ vào nhu cầu và khả năng để chọn dịch vụ sẵn có. Ví dụ, việc tự cấu
hình chi tiết thông số các máy ảo hiện tại chưa thực hiện được. Như vậy, khả năng
để thích ứng yêu cầu cấp dịch vụ cho các nhu cầu cụ thể của một doanh nghiệp là ít
hơn so với các trung tâm dữ liệu xây dựng riêng với mục đích là để tiếp tục mục
tiêu nâng cao khả năng kinh doanh của công ty.
Khả năng tích hợp với hạ tầng thông tin sẵn có của tổ chức: Việc tích hợp điện
toán đám mây vào hạ tầng sẵn có của khách hàng chưa có mô hình và cách thức
thực hiện cụ thể. Các mô hình kết nối đám mây riêng và đám mây thương mại vẫn
đang được nghiên cứu.
VI. GIỚI THIỆU MỘT SỐ ĐÁM MÂY ĐƯỢC SỬ DỤNG TRIỂN KHAI
PHỔ BIẾN HIỆN NAY

Microsoft Azure: Microsoft Azure là đám mây cung cấp hạ tầng và nền
tảng điện toán xây dựng bởi Microsoft và đưa vào khai thác từ 2010. Về mặt hạ
tầng, Azure cung cấp các máy chủ ảo có thể chạy hệ điều hành Windows hoặc
Unix. Về mặt nền tảng điện toán, Azure hỗ trợ đa ngôn ngữ lập trình cho phép triển
khai trên Azure nhiều ứng dụng phát triển trên các công cụ và framework khác
nhau. Phổ biến là các ứng dụng viết trên nền .Net của Microsoft.
Amazon Web Service (AWS): AWS được đưa ra vào năm 2006 với khởi
đầu là tập lợp các dịch vụ tính toán như dịch vụ máy ảo EC2 và dịch vụ lưu trữ S3.
AWS là nền tảng đám mây thương mại đầu tiên và phổ biến nhất hiện nay. Nhiều
khách hàng lớn sử dụng AWS có thể nói đến như NASA, Pinterest, Netflix.
Nimbus: Nimbus là đám mây m~ nguồn mở cung cấp hạ tầng máy chủ
hướng theo dịch vụ thông qua giao diện kết nối dựa trên chuẩn kết nối của AWS.
Google App Engine (GAE): GAE là nền tảng đám mây mà trên đó Google
cung cấp hỗ trợ cho cơ sở dữ liệu, các thư viện lập trình và các môi trường thực thi
cho các ngôn ngữ lập trình phổ biến. Các ứng dụng trên các ngôn ngữ hỗ trợ sau
khi triển khai trên GAE sẽ chạy trên các máy chủ ảo của Google.
CHƯƠNG 2: CÔNG NGHỆ LƯU TRỮ MẠNG SAN VÀ CHIA SẺ DỮ LIỆU
ĐÁM MÂY

I. Khái niệm về hệ thống lưu trữ mạng

Nếu như NAS không thể thay thế DAS vì chỉ ở mức file-level access, thì
SAN thay thế được DAS vì nó hỗ trợ block-level access, và là phương án mở rộng
cho DAS. Nếu như SCSI là cách truy cập vào DAS, thì iSCSI mở rộng khả năng
của SCSI ra các hệ thống lưu trữ nằm ở xa server (internet SCSI), cũng vẫn là
SCSI nhưng lần này là hoạt động ở môi trường IP của LAN hoặc Internet. Như
vậy, ứng dụng với sự hỗ trợ của iSCSI có thể truy cập và sử dụng 1 ổ cứng SCSI ở
xa như thể ổ cứng đó đang gắn trực tiếp bên trong.
Chi phí triển khai hệ thống SAN là khá đắt, nó đòi hỏi phải dùng các thiết bị
Fiber Chennel Networking, Fiber Channel Swich,…Các ổ đĩa chạy trong hệ thống
lưu trữ SAN thường được dùng : FIBRE CHANNEL , SAS , SATA,….

1. Định nghĩa SAN

Lưu trữ mạng có thể được hiểu như một phương pháp truy cập dữ liệu ứng
dụng trên nền tảng mạng mà quá trình truyền dữ liệu trên mạng tương tự như quá
trình truyền dữ liệu từ các thiết bị quen thuộc trên máy chủ như Disks Drivers như
ATA, SCSI.

Trong một mạng lưu trữ, một máy chủ sử dụng một yêu cầu cho một gói dữ
liệu cụ thể hay một dữ liệu cụ thể, từ một đĩa lưu trữ và các yêu cầu được đáp ứng.
Phương pháp này được biết là block storage. Các thiết bị được làm việc như một
thiết bị lưu trữ bên trong máy chủ và được truy cập một cách bình thường thông
qua các yêu cầu cụ thể và quá trình đáp ứng bằng cách gửi các yêu cầu và nhận
được trên môi trường mạng mà thôi.

Theo truyền thống phương pháp truy cập vào file như SMB/CIFS hay NFS,
một máy chủ sử dụng các yêu cầu cho một file như một thành phần của hệ thống
file trên máy, và được quản lý bình thường với máy chủ. Quá trình điều khiển đó
được quyết định từ tầng vật lý của dữ liệu, truy cập vào nó như một ổ đĩa bên trong
máy chủ và được điều khiển và sử dụng trực tiếp trên máy chủ. Chỉ khác một điều
dữ liệu bình thường thông qua hệ thống bus còn SAN dựa trên nền mạng. Các hệ
thống lưu trữ mạng sử dụng giao thức SCSI cho quá trình truyền dữ liệu từ máy
chủ đến các thiết bị lưu trữ, không thông qua các Bus hệ thống. Cụ thể tầng vật lý
của SAN được sử dụng dựa trên các cổng quang để truyền dữ liệu: 1 Gbit Fiber
Channel, 2Gbit Fiber Channel, 4Gbit Fiber Channel, và 1Gbit iSCSI. Giao thức
SCSI thông tin được vận truyển trên một giao thức thấp dựa trên quá trình mapping
layer. Hầu hết các hệ thống SANs hiện hay đều sử dụng SCSI dựa trên hệ thống
cáp quang để truyền dữ liệu và quá trình chuyển đội (mapping layer) từ SCSI qua
cáp quang và máy chủ vẫn hiểu như SCSI là (SCSI over Fiber Channel) và FCP
được coi là một chuẩn trong quá trình chuyển đổi đó. iSCSI là một dạng truyển đổi
tương tự với phương pháp thiết kế mang các thông tin SCSI trên nền IP

2. Lợi ích khi sử dụng SAN

Dễ dàng chia sẻ lưu trữ và quản lý thông tin, mở rộng lưu trữ dễ dàng thông
qua quá trình thêm các thiết bị lưu trữ vào mạng không cần phải thay đổi các thiết
bị như máy chủ hay các thiết bị lưu trữ hiện có. Ứng dụng cho các hệ thống Data
centrer và các Cluster. Và mỗi thiết bị lưu trữ trong mạng SAN được quản lý bởi
một máy chủ cụ thể. Trong quá trình quản lý của SAN sử dụng Network Attached
Storage (NAS) cho phép nhiều máy tính truy cập vào cùng một file trên một mạng.
Và ngày nay có thể tích hợp giữa SAN và NAS tạo nên một hệ thống lưu trữ thông
tin hoàn thiện.

SANs được thiết kế dễ dàng cho tận dụng các tính năng lưu trữ, cho phép
nhiều máy chủ cùng chia sẻ một thiết bị lưu trữ.

Một ứng dụng khác của SAN là khả năng cho phép máy tính khởi động trực
tiếp từ SAN mà chúng quản lý. Điều này cho phép dễ dàng thay các máy chủ bị lỗi
khi đang sử dụng và có thể cấu hình lại cho phép thay đổi hay nâng cấp máy chủ
một cách dễ dàng và dữ liệu không hề ảnh hưởng khi máy chủ bị lỗi. Và quá trình
đó có thể chỉ cần nửa giờ để có một hệ thống Data Centers. Và được thiết kế với
tốc độ truyền dữ liệu cực lớn và độ an toàn của hệ thống được coi là vấn đề hàng
đầu.

SAN cung cấp giải pháp khôi phục dữ liệu một cách nhanh chóng bằng cách
thêm và các thiết bị lưu trữ và có khả năng khôi phục cực nhanh dữ liệu khi một
thiết bị lưu trữ bị lỗi hay không truy cập được (secondary aray).

Các hệ thống SAN mới hiện nay cho phép (duplication) sao chép hay một
tập tin được ghi tại hai vùng vật lý khác nhau (clone) cho phép khôi phục dữ liêu
cực nhanh.

3. Tính năng

 Lưu trữ được truy cập theo Block qua SCSI


 Khả năng I/O với tốc độ cao
 Tách biệt thiết bị lưu trữ và Server
 Dễ dàng chia sẻ lưu trữ và quản lý thông tin.
 Mở rộng lưu trữ dễ dàng thông qua quá trình thêm các thiết bị lưu trữ
vào mạng không cần phải thay đổi các thiết bị như máy chủ hay các
thiết bị lưu trữ hiện có.
 Cho phép nhiều máy chủ cùng chia sẻ một thiết bị lưu trữ.
 Cho phép thay đổi hay nâng cấp máy chủ một cách dễ dàng và dữ liệu
không hề ảnh hưởng khi máy chủ bị lỗi.

4. Điều khiển đĩa

Quá trình điều khiển cho SAN trong môi trường doanh nghiệp với sự phát
triển nhanh chóng yêu cầu sự đáp ứng về truyền dữ liệu với tốc độ cực cao tới các
ổ đĩa (như các dữ liệu truyền từ các hệ thống mail servers, máy chủ dữ liệu, và các
máy chủ file server). Trong quá trình phát triển trước kia, với mạng doanh nghiệp
dùng hệ thốg lưu trữ với khả năng đáp ứng cao sử dụng lưu trữ SCSI và RAIDs
điều khiển các mảng đĩa cứng được tích hợp trực tiếp trên máy chủ. Và bây giờ với
công nghệ Mạng trên nền tảng IP, và khi các ứng dụng dữ liệu sử dụng hết toàn bộ
các ổ lưu trữ trên các máy chủ và các người dùng cuối yêu cầu phải thay máy chủ
đáp ứng các yêu cầu công việc. Nhưng với SAN việc nâng cấp các thiết bị lưu trữ
là rất đơn giản với việc thêm vào mạng các thiết bị lưu trữ mới.

Điều khiển đĩa sử dụng trong môi trường SAN được thiết kế cung cấp với
tốc độ cao, độ tin cậy lớn “Visual Hard Driver” (hay LUNs). Thêm nữa mô hình
SANs cho phép tích hợp lẫn các thiết bị FC SATA và FC SCSI (FC SATA là thiết
bị lưu trữ sử dụng các ổ đĩa dạng SATA và sử dụng cáp quang để truyền dữ liệu tới
môi trường mạng). SATA làm việc với khả năng thấp, có nhiều lỗi xảy ra nhưng
lưu trữ lớn và giá thành rẻ hơn rất nhiều so với các ổ đĩa SCSI. Nó cho phép các
mạng SANs sử dụng nó để như một thiết bị sao lưu dự phòng khi có lỗi xảy ra. Và
hâu hết các SAN đều dử dụng FC SATA như một thiết bị backup với lưu trữ lớn và
tốc độ nhanh hơn rất nhiều so với tape drivers.

5. Các dạng SANs

SANs được xây dựng với thiết kế dành riêng cho việc lưu trữ và truyền
thông tin. Nó cung cấp khả năng truyền dữ liệu với tốc độ lớn với độ an toàn cao
hơn các giao thức khác như NAS. Hầu hết các công nghệ SAN là mạng cáp quang
(Fiber Channel Networking) với các thiết bị lưu trữ sử dụng các ổ địa SCSI. Một
dạng cụ thể là FiBre Channel SAN được xây dựng bởi Fibre Channel Switch được
kết nối tới các thiết bị thông qua hệ thống cab quang. Ngày nay hầu hết các hệ
thống SAN đều sử dụng giải pháp định tuyến Fibre Channel, và mang lại khả năng
mở rộng lớn cho cấu trúc SAN cho phép kết hợp các hệ thống SAN lại với nhau.
Tuy nhiên hầu hết quá trình đó đều với mục đích dữ liệu tập trung và truyền với tốc
độ cực cao với khoảng cách xa hơn thông tầng vật lý là cáp quang, switch quang.

Một dạng khác của SAN là sử dụng giao thức iSCSI nó sử dụng giao thức
SCSI trên nền tảng TCP/IP. Trong dạng này, các switch tương tự như Ethernet
Switchs. Chuẩn iSCSI được giới thiệu năm 2003 và được triển khai rộng lớn trong
quá trình lưu trữ mạng (lưu trữ không yêu cầu tốc độ lớn) và từ khi ứng dụng cáp
quang trong quá trình truyền dữ liệu mang lại hiệu năng lớn cho iSCSI. Ngày nay
hầu hết các hệ thống isSCSI sử dụng cáp quang trong quá trình truyền dữ liệu và
sử dụng giao thức NAS như CIFS và NFS.

Một dạng khác của iSCSI là ATA-over-Ethernet hay giao thức AoE được
xây dựng sử dụng giao thức ATA trên khung nền tảng Ethernet. Trong khi giao
thức Ethernet như AoE không thể định tuyến và cung cấp các hiệu năng khác nhau.
Kết nối với SAN sẽ có một hay nhiều máy chủ và một hay nhiều các thiết bị
lưu trữ khác nhau. Trong FC SAN máy chủ cũng sử dụng cáp quang để truyền dữ
liệu (host bus adapter and Optical fibre). isSCSI SAN sử dụng giao thức Ethernet
bình thường thông qua card mạng hay TOE card. SAN có hai dạng là: Centralized
storage are networks và distributed storage area network.

6. SAN trong môi trường làm việc

SAN được sử dụng trong môi trường yêu cầu mở rộng nhanh chóng các thiết
bị lưu trữ, và yêu cầu đáp ứng công việc cao (truyền dữ liệu với tốc độ lớn). Nó
cho phép các thiết bị FC disk driver kết nối trực tiếp đến SAN. SAN như các mạng
bình thường của các thiết bị lưu trữ với dung lượng lớn. SAN là giải pháp đắt tiền
với hệ thống Fibre Channel hay các card chuyên dụng cho các máy tính. Côn nghệ
iSCSI SAN là giải pháp đáp ứng được với yêu cầu giá cả của SAN, nhưng không
như công nghệ sử dụng cho mạng doanh nghiệp lớn Data Center. Các máy con có
thể sử dụng giao thức NAS như CIFS hay NFS. Với khả năng truy cập từ xa và
khôi phục dữ liệu nhanh chóng khi xảy ra lỗi. Đáp ứng tốt cho giải pháp Data
Center. Và khả năng của iSCSI đáp ứng với các môi trường ứng dụng không đòi
hỏi khả năng đáp ứng cực lớn. Với FC SAN đáp ứng các yêu cầu khắt khe nhất về
ứng dụng.

7. SAN trong ứng dụng ngày nay

Trong quá trình phát triển nhanh chóng các dữ liệu của doanh nghiệp hay tổ
chức vừa và nhỏ đều yêu cầu có một thiết bị lưu trữ với dung lượng lớn và độ an
toàn thông tin cao và SAN là một giải pháp đáp ứng các yêu cầu khắt khe nhất của
doanh nghiệp.
Với tốc độ truyền dữ liệu từ 300Mbit/s đến 4Gbit/s sẽ đáp ứng được các ứng
dụng về ghi và cung cấp dữ liệu cho nhu cầu hiện nay và trong tương lai

8. iSCSI SAN là gì ?

iSCSI là Internet SCSI ( Small Computer System Interface ) là một chuẩn


công nghiệp phát triển để cho phép truyền tải các lệnh SCSI qua mạng IP hiện có
bằng cách sử dụng giao thức TCP/IP.

Các thiết bị iSCSI SAN (hay IP SAN) là các Server (chạy HĐH nào đó, Win
Storage chẳng hạn) và có cài tính năng hỗ trợ iSCSI ở phía server (gọi là iSCSI
target). Các máy truy cập đến thiết bị IP SAN bằng iSCSI sẽ phải hỗ trợ tính năng
iSCSI client (gọi là iSCSI source). iSCSI source (client) được cài sẵn trong Win
Vista/7 và 2008. Đối với iSCSI target, có nhiều Soft, ví dụ StarWind trên nền Win,
và OpenFiler trên nền Linux.
iSCSI dễ dùng, linh hoạt, dễ mở rộng, vì hoạt động dựa trên nền IP và Ethernet /
Internet, không đòi hỏi phần cứng đặc biệt. Đặc biệt hiệu quả khi mạng Ethernet
10G phổ biến.

Nếu như giao thức iSCSI hoạt động trên nền IP, và từ lớp Internet trở lên, thì
giao thức Fiber Channel (1 loại SAN khác) hoạt động ở mức Physical layer, nên
phụ thuộc nhiều vào phần cứng, cần đến phần cứng riêng biệt, bao gồm các
Switch, NIC (HBA) và thiết bị lưu trữ/cáp hỗ trợ Fiber channel. Vì không hoạt
động trên nền IP nên không linh động và khó mở rộng, so với IP SAN. Dù khó
dùng và đắt tiền, Fiber Channel SAN đã và đang là giải pháp SAN chính của nhiều
hệ thống lớn.
Storage Area Network (SAN) là một mạng được thiết kế cho việc thêm các
thiết bị lưu trữ cho máy chủ một cách dễ dàng như: Disk Aray Controllers, hay
Tape Libraries

Với những ưu điểm nổi chội SANs đã trở thành một giải pháp rất tốt cho lưu trữ
thông tin cho doanh nghiệp hay tổ chức. SAN cho phép kết nối từ xa tới các thiết
bị lưu trữ trên mạng như: Disks và Tape drivers. Các thiết bị lưu trữ trên mạng, hay
các ứng dụng chạy trên đó được thể hiện trên máy chủ như một thiết bị của máy
chủ( as locally attached divices)
Có hai sự khác nhau cơ bản trong các thành phần của SANs

1. Mạng (network) có tác dụng truyền thông tin giữa thiết bị lưu trữ và hệ
thống máy tính. Một SAN bao gồm một cấu trúc truyền tin, nó cung cấp kết nối vật
lý, và quản lý các lớp, tổ chức các kết nối, các thiết bị lưu trữ, và hệ thống máy tính
sao cho dữ liệu truyền trên đó với tốc độ cao và tính bảo mật. Giới hạn của SAN
thường được nhận biết với dịch vụ Block I/O đúng hơn là với dịch vụ File Access.

2. Một hệ thống lưu trữ bao gồm các thiết bị lưu trữ, hệ thống máy tính, hay
các ứng dụng chạy trên nó, và một phần rất quan trọng là các phần mềm điều
khiển, quá trình truyền thông tin qua mạng
II. Kiến trúc hệ thống lưu trữ đám mây

1. Khái Niệm

Cloud Storage (lưu trữ đám mây) – mô hình lưu trữ đám mây cho phép
các cơ sở dữ liệu được lưu trữ bởi hệ thống từ xa thông qua Internet. Loại lưu
trữ này có nhiệm vụ mở rộng, quản lý và sao lưu các tài nguyên dựa trên hệ thống
lưu trữ bên ngoài máy chủ được nhà cung cấp bên thứ 3 quản lý. Nhà cung cấp có
nhiệm vụ tiếp nhận xử lý dung lượng được yêu cầu tăng hoặc giảm của các dữ
liệu trên đám mây.

Đối với người dùng khi sử dụng lưu trữ đám mây sẽ không lựa chọn gói lưu
trữ nội bộ. Vì thế, các nhà cung cấp đã khắc phục bằng cách đưa ra giải pháp giảm
thiểu chi phí lưu trữ xuống mức tối ưu nhất để bổ sung vào các phiên bản nâng cấp
khác.

2. Các loại lưu trữ đám mây

Có ba tùy chọn lưu trữ đám mây chính dựa trên các mô hình truy cập khác
nhau là công cộng, riêng tư và kết hợp.

a) Public Cloud
Public Cloud là dịch vụ trả phí không giới hạn sử dụng lưu trữ và
được mở rộng phạm vi hoạt động trên khắp thế giới. Để sử dụng dịch vụ,
người dùng sẽ phải thanh toán với nhà cung cấp theo mức tiêu thụ định kỳ
hàng tháng. Đám mây công cộng được quản lý bởi S3, Amazon Glacier,
Google Cloud Storage, Google Cloud Storage Nearline và Microsoft Azure

b) Private Cloud
Private Cloud là mô hình triển khai riêng biệt được sử dụng trong lưu
trữ nội bộ kết hợp với dịch vụ đám mây công cộng cho phép người dùng
truy cập và sử dụng các tài nguyên lưu trữ hiệu quả. Dịch vụ này dành cho
các công ty hoặc doanh nghiệp để quản lý truy cập vào các dữ liệu nhất định.

c) Hybird Cloud
Hybird Cloud là sự kết hợp giữa lưu trữ đám mây và đám mây riêng
cho phép hoạt động và khai thác dữ liệu linh hoạt trên cả hai nền tảng. Kiểu
đám mây này có thể được lựa chọn sử dụng rộng rãi trên thị trường công
nghệ.

Ví dụ: Doanh nghiệp lưu trữ dữ liệu trên đám mây lai để quản lý các tài
nguyên và theo dõi lưu lượng hoạt động định kỳ.

Tuy nhiên kiểu đám mây này cũng có nhược điểm. Chi phí kiểu đám
mây này khá tốn kém. Khi sử dụng cũng thường xuyên gặp vấn đề về kỹ
thuật như bảo trì và sửa lỗi.

3. Cách thức hoạt động

Các nhà cung cấp dịch vụ lưu trữ đám mây có mặt hầu như khắp mọi nơi
trên toàn thế giới. Khi khách hàng đăng ký dịch vụ lưu trữ đám mây, các khía cạnh
của bộ lưu trữ sẽ được chuyển hết cho bên nhà cung cấp quản lý. Các ứng dụng
của khách hàng có thể truy cập dữ liệu đám mây được lưu trữ thông qua các giao
thức lưu trữ truyền thống hoặc các chỉ báo lập trình ứng dụng (API) hoặc chúng
cũng có thể được di chuyển lên đám mây.

Gói dịch vụ lưu trữ đám mây bao gồm bảo mật, dung lượng, máy chủ lưu
trữ, tài nguyên, cơ sở dữ liệu và hệ thống mạng.

Có 3 loại lưu trữ đám mây:


1. Lưu trữ khối
Lưu trữ đám mây chia dữ liệu thành các khối nhỏ được gắn mã định
danh và lưu trên hệ thống máy chủ. Chức năng của các khối này là
cung cấp độ trễ, xử lý tài nguyên và công việc với hiệu suất cao.
2. Lưu trữ tệp
Lưu trữ đám mây tích hợp các dữ liệu vào một tệp hoặc thư mục của ổ
cứng máy chủ được kết nối với mạng NAS. Thao tác này cho phép
người dùng sử dụng dữ liệu linh hoạt và hiệu quả như truy cập, truy
xuất và định dạng.
3. Lưu trữ đối tượng
Lưu trữ đối tượng bao gồm dữ liệu, siêu dữ liệu và mã nhận dạng.
RESTful API cho phép lưu trữ các đối tượng dữ liệu và siêu dữ liệu
vào tệp chỉ định được gắn kèm mã nhận dạng ID. ID có chức năng
như một mã bảo mật cho phép người dùng tìm kiếm các nội dung nhất
định.
Lưu trữ đối tượng cho phép hệ thống truy cập và phân tích các dữ liệu
được lưu trữ ở định dạng gốc và có khả năng mở rộng. Tuy nhiên, loại
lưu trữ này có hiệu suất hoạt động tương đối chậm trên hệ thống. Các
nhà cung cấp khắc phục vấn đề bằng cách bổ sung thêm một số tính
năng vào phần mềm và phần cứng của lưu trữ đối tượng.

Ví dụ: Lưu trữ đám mây cung cấp một môi trường tệp để lưu trữ đối tượng cho
phép các ứng dụng dễ dàng truy cập.

Lưu trữ đám mây hoạt động dựa trên hệ thống lưu trữ ổ cứng của các máy
chủ được liên kết với nhau. Ngoài ổ cứng, các SSD cũng có tác dụng tạo ra các lưu
trữ ảo với hiệu suất hoạt động cao trên lưu trữ đám mây.
4. Ưu nhược điểm

a) Ưu điểm

 Thanh toán theo lưu lượng sử dụng: Khi đăng ký gói lưu trữ đám
mây, người dùng chỉ cần trả phí định kỳ cho những lưu trữ mà họ sử
dụng và có thể xoá bỏ những không gian lưu trữ rác. Chi phí này giúp
bạn tiết kiệm một khoản tương đối so với việc duy trì hệ thống nội bộ.
 Thanh toán tiện ích: Tương tự như trên, sử dụng càng ít lưu lượng
thì mức phí phải trả sẽ càng ít. Lưu trữ đám mây được nhà cung cấp
bổ sung thêm lưu lượng so với ban đầu nhằm đảm bảo mức sử dụng
của người dùng và không phát sinh thêm chi phí.
 Tính khả dụng trên toàn cầu: Dịch vụ lưu trữ đám mây hoạt động
trên hầu hết các hệ thống thiết bị công nghệ mọi lúc, mọi nơi.
 Dễ sử dụng: Dịch vụ lưu trữ đám mây cho phép truy cập trên mọi nền
tảng công nghệ hiện tại. Tất cả người dùng từ cá nhân đến các tổ chức
đều có thể tạo và sử dụng lưu trữ đám mây trên thiết bị máy tính của
mình.
 Bảo mật ngoài trang web: Bảo mật ngoài trang web cho phép người
dùng sao lưu các bản dữ liệu giữa các vị trí máy chủ với nhau một
cách an toàn. Để khắc phục vấn đề lưu trữ đám mây nội bộ có dung
lượng lưu trữ giới hạn, các nhà cung cấp kích hoạt tính năng bật, tắt
dung lượng để sử dụng dịch vụ linh hoạt hơn.

b) Nhược điểm

 Bảo mật: Bảo mật dữ liệu là vấn đề được người dùng lựa chọn hàng
đầu khi sử dụng bất cứ dịch vụ công nghệ nào. Điều đáng lo ngại là
một khi dữ liệu rời khỏi cơ sở của một công ty sẽ không còn có quyền
kiểm soát cách dữ liệu được xử lý và lưu trữ.Các nhà cung cấp bổ
sung thêm tính năng cho bảo mật như xác thực đa yếu tố, lưu trữ dữ
liệu đa vị trí, mở rộng bảo mật vật lý,…
 Truy cập dữ liệu: Lưu trữ đám mây có tính năng duy trì quyền truy
cập của người dùng trên các dữ liệu. Điều này sẽ làm tăng thời gian sử
dụng lưu lượng dẫn đến việc phát sinh thêm chi phí.
 Suy giảm hiệu suất: Nếu như có quá nhiều lượt truy cập vào dữ liệu
tại một thời điểm sẽ làm giảm hiệu suất hoạt động của lưu trữ đám
mây.
 Phát sinh chi phí: Sử dụng càng nhiều dung lượng lưu trữ đám mây
thì chi phí càng tăng.

5. Ví dụ

 Lưu trữ đám mây được sử dụng để khắc phục lỗi, lưu trữ và sao lưu
dữ liệu. Việc được sử dụng lưu trữ đám mây cho DevOps không chỉ
giúp tiết kiệm chi phí cho tổ chức và doanh nghiệp mà còn hỗ trợ nhà
cung cấp phát triển và thử nghiệm các dự án.
 Lưu trữ đám mây được sử dụng để lưu trữ các ứng dụng nhằm tăng
hiệu suất hoạt động và bảo mật tốt hơn. Bộ nhớ trên lưu trữ đám mây
giúp các công ty lớn dễ dàng giải quyết vấn đề về khối lượng lớn của
dữ liệu công việc hoặc dự án.
 Lưu trữ đám mây đặc biệt cho phép các doanh nghiệp vừa và nhỏ
đồng bộ hoá, đảm bảo các tệp được lưu trữ cục bộ và chia sẻ các tệp
trên hệ thống.
6. Một số nhà cung cấp

Ngoài một số nhà cung cấp dịch vụ đám mây nổi tiếng như Amazon Web
Services, Google và Microsoft Azure, các nhà cung cấp dịch vụ lưu trữ truyền
thống cũng phát triển về đám mây như Dell EMC, Hewlett Packard
Enterprise, Hitachi Data Systems, IBM và NetApp để cung cấp và giám sát việc
sử dụng.

Ví dụ: Box/Dropbox là dịch vụ lưu trữ đám mây giữa doanh nghiệp với người
dùng B2C, doanh nghiệp với doanh nghiệp B2B.

Nhìn chung những lợi ích mà lưu trữ đám mây đem lại cho cuộc sống công
nghệ 4.0 hiện nay của chúng ra rất nhiều. Lưu trữ đám mây giúp công việc của bạn
trở nên dễ dàng hơn trong việc lưu trữ, sao chép và chia sẻ chúng tới bất cứ đâu mà
bạn muốn.
III. Hệ thống lưu trữ SAN là gì, ưu điểm hệ thống SAN

1. Khái niệm

SAN (Storage Area Networking) hay còn gọi là mạng lưu trữ là một mạng
chuyên dụng, hoàn toàn tách biệt với các mạng LAN và WAN. Nói chung mạng
SAN sẽ nối kết tất cả các tài nguyên liên quan đến lưu trữ trong mạng lại với nhau.
Đặc điểm nổi bật trong cấu trúc SAN là nó thường cho tốc độ kết nối dữ liệu cao
(Gigabit/sec) giữa các thiết bị lưu trữ ngoại vi, đồng thời cho khả năng mở rộng
cao. Mặc dù thường được đề cập đến phần cứng nhiều hơn, SAN còn bao gồm
những phần mềm chuyên biệt dùng cho quản lý, giám sát và cấu hình mạng.

2. Ưu điểm hệ thống SAN

- SAN là hệ thống mạng lưu trữ, thường được sử dụng ở những tập đoàn lớn
nơi lưu trữ nhiều dữ liệu như ngân hàng, các nhà cung cấp dịch vụ viễn
thông,....các dữ liệu cần độ an toàn, dự phòng rất cao và có thể truy xuất nhanh.
- Dễ dàng chia sẻ lưu trữ và quản lý thông tin, mở rộng lưu trữ dễ dàng
thông qua quá trình thêm các thiết bị lưu trữ vào mạng không cần phải thay đổi các
thiết bị như máy chủ hay các thiết bị lưu trữ hiện có. Ứng dụng cho các hệ thống
Data centrer và các Cluster. Và mỗi thiết bị lưu trữ trong mạng SAN được quản lý
bởi một máy chủ cụ thể. Trong quá trình quản lý của SAN sử dụng Network
Attached Storage (NAS) cho phép nhiều máy tính truy cập vào cùng một file trên
một mạng. Và ngày nay có thể tích hợp giữa SAN và NAS tạo nên một hệ thống
lưu trữ thông tin hoàn thiện.- Tốc độ cực kỳ nhanh do sử dụng kênh cáp quang để
trao đổi thông tin

- SAN được thiết kế dễ dàng cho tận dụng các tính năng lưu trữ, cho phép
nhiều máy chủ cùng chia sẻ một thiết bị lưu trữ.- Là mạng lưu trữ riêng biệt sẽ
giảm áp lực cho mạng LAN

- Một ứng dụng khác của SAN là khả năng cho phép máy tính khởi động
trực tiếp từ SAN mà chúng quản lý. Điều này cho phép dễ dàng thay các máy chủ
bị lỗi khi đang sử dụng và có thể cấu hình lại cho phép thay đổi hay nâng cấp máy
chủ một cách dễ dàng và dữ liệu không hề ảnh hưởng khi máy chủ bị lỗi. Và quá
trình đó có thể chỉ cần nửa giờ để có một hệ thống Data Centers. Và được thiết kế
với tốc độ truyền dữ liệu cực lớn và độ an toàn của hệ thống được coi là vấn đề
hàng đầu.

- Có thể phân quyền truy cập theo block

- SAN cung cấp giải pháp khôi phục dữ liệu một cách nhanh chóng bằng
cách thêm và các thiết bị lưu trữ và có khả năng khôi phục cực nhanh dữ liệu khi
một thiết bị lưu trữ bị lỗi hay không truy cập được (secondary aray).
- Các hệ thống SAN mới hiện nay cho phép (duplication) sao chép hay một
tập tin được ghi tại hai vùng vật lý khác nhau (clone) cho phép khôi phục dữ liêu
cực nhanh.
IV. Mô hình kết nối tới cụm lưu trữ dữ liệu SAN

1. Sơ lược vè mô hình kết nối:

Dựa trên yêu cầu sử dụng và phát triển trong cơ sở hạ tầng công nghệ thông
tin của Trung tâm Học liêu (TTHL) với hệ thống hiện tại có hệ thống gồm 13 máy
chủ HP ProLiant Server: 03 máy chủ HP ProLiant Server DL580G5, 02 máy chủ
HP ProLiant Server DL580G4, 01 máy chủ HP ProLiant DL580G3, 06 máy chủ
HP ProLiant DL380G4 và 01 máy chủ HP ProLiant ML370.

Tuy nhiên, do mô hình lưu trữ phân tán hiện nay của TTHL, mỗi máy chủ sở
hữu một hệ thống dữ liệu khác nhau và độc lập, đồng thời các cơ sở dữ liệu của các
ứng dụng lưu trữ độc lập trên máy chủ ứng dụng đó. Việc lưu trữ phân tán dữ liệu
như trên gây khó khăn cho quá trình quản lý, chia sẻ dữ liệu, chia sẻ tài nguyên...

Nhằm khắc phục nhược điểm hiện có trong cơ sở hạ tầng công nghệ thông
tin của TTHL, đòi hỏi phải xây dựng một hệ thống lưu trữ tập trung Storage Area
Network (SAN) hiện đại với khả năng mở rộng, độ tin cậy, hiệu suất hoạt động cao
cùng với chi phí đầu tư ban đầu thấp vẫn đạt hiệu quả cao. Trong hệ thống lưu trữ
tập trung SAN sẽ được xây dựng, tất cả những máy chủ hiện có cũng như những
máy chủ dự kiến tăng cường có nhu cầu về chia sẻ dữ liệu tài nguyên thông tin
cung như các dữ liệu ứng dụng đang hoạt động sẽ được kết nối vào hệ thống mạng
SAN. Việc kết nối này thực hiện qua một hệ thống mạng SAN sử dụng hai thiết bị
chuyển mạch quang chuyên dụng cho mạng SAN như: HP StorageWork 4/16 SAN
Switch. Tất cả máy chủ và thiết bị lưu trữ tập trung sẽ kết nối thông qua các đường
FC vì thế nó hoàn toàn riêng biệt đối với hệ thống mạng LAN hiện tại trong Trung
Tâm Học Liệu Đại Học Cần Thơ. Do đó không ảnh hưởng đến kiến trúc của hệ
thống hiện tại. Sơ đồ kết nối hệ thống lưu trữ SAN dự kiến theo mô hình sau:

2. Mô tả thiết kế:

Dự kiến mỗi máy chủ hiện có (HP ProLiant Server) trong TTHL sẽ được
trang bị tăng cường hai Card HBA (Host Bus Adapter) có tốc độ truyển dẫn tín
hiệu lên đến 4Gbps. Vì lý do định dạng khe cắm mở rộng mà mỗi máy chủ hỗ trợ
khác nhau và các bo mạch HBA được trang bị cho mỗi máy chủ sẽ có chuẩn giao
tiếp mở rộng khác nhau. Đối với các máy chủ HP ProLiant Server DL580G3 và
máy chủ HP ProLiant DL380G4 sẽ được trang bị bo mạch HBA sử dụng giao tiếp
PCI-X, ngược lại đối với các máy chủ HP ProLiant DL580G4 sẽ được trang bị bo
mạch HBA sử dụng giao tiếp PCI-Express. Các máy chủ trên sẽ được kết nối đến
hệ thống lưu trữ trung tâm SAN thông qua bộ giao tiếp HBA tốc độ cao
Mạng lưu trữ SAN sẽ được xây dựng dựa trên 2 SAN switch HP
StorageWork 4/16 SAN Switch có 16 cổng kết nối với nhau. Thiết kế này cho phép
kết nối tối đa 16 máy chủ vào mạng SAN (14 qua SAN switch và 2 kết nối trực
tiếp) đồng thời nâng cao tính sẵn sàng và độ tin cậy của thiết bị cũng như toàn bộ
hệ thống lưu trữ mạng SAN với tính năng dự phòng trong mô hình 2 SAN switch
hoạt động song song. Sử dụng phần mềm quản lý HP StorageWork Command
View EVA Software 7.0
V. So sánh hệ thống SAN và NAS

Đặc tính NAS SAN


Cấu trúc TCP/IP và Ethernet Cáp quang tốc độ cao
Quy mô Cá nhân/gia đình hoặc doanh Doanh nghiệp quy mô lớn
nghiệp vừa và nhỏ
Chi phí Trung bình, không tốn kém để Khá tốn kém khi thiết lập và
thiết lập và duy trì duy trì
Truy cập dữ Dựa trên tệp (file) Dựa trên khối (Block)
liệu
Tốc độ Phụ thuộc vào Ethernet (dao Sử dụng kênh cáp tốc độ cao
động từ 100MB đến 1GB/s) (2GB - 128GB/s)
Giao thức CIFS, NFS, HTTP và SMB SCSI hoặc iSCSI ánh xạ qua
TCP/IP
Khả năng Các NAS cấp thấp không thể Dễ dàng khi hiệu suất truy cập
mở rộng tăng cao
mở rộng
NAS cấp cao hơn có thể mở
rộng

Ảo hóa Không Có
Thay đổi cấu Không Có
hình theo yêu
cầu
Khả năng Thấp vì phụ thuộc nhiều vào Cao
chịu lỗi mạng LAN
Sự cố mạng Rất dễ bị ảnh hưởng nếu mạng Không dễ bị ảnh hưởng vì nó
LAN gặp lỗi sử dụng một mạng chuyên dụng
Các tệp dữ Tài liệu và các tệp có kích Các tệp lớn và yêu cầu thời
liệu phù hợp thước trung bình gian load nhanh như video

VI. So sánh hệ thống SAN và DAS


DAS SAN
1. Là tên viết tắt của Direct Attached 1. SAN là tên viết tắt của Storage Area
Storage. Network.

2. Nó sử dụng các sector để sao lưu 2. Nó sử dụng kỹ thuật sao chép từng
và phục hồi. khối để sao lưu và phục hồi.

3. Thiết bị lưu trữ này sử dụng khá


3. Thiết bị lưu trữ này phức tạp hơn.
đơn giản, không phức tạp.

4. SAN khá khó khăn trong việc cài đặt


4. Dễ dàng thiết lập và cài đặt.
và thiết lập.

5. Giá thiết bị này rẻ hơn nhiều so với


5. SAN có giá thành cao hơn hẳn.
SAN

6. Dung lượng của SAN là hơn 1012


6. Có dung lượng chỉ 109 byte.
byte.
7. Thiết bị lưu trữ này không cho 7. Thiết bị lưu trữ này cho phép người
phép người dùng chia sẻ tệp trên các dùng chia sẻ các tập tin trên các hệ điều
hệ điều hành khác nhau. hành khác nhau.
8. Nó sử dụng IDE / SCSI để truyền 8. Nó sử dụng Giao thức Internet và
dữ liệu. Fibre để truyền dữ liệu.
VII. Bảo mật dữ liệu trên hệ thống lưu trữ đám mây SAN

 Hạn chế lưu trữ dữ liệu quan trọng hoặc nhạy cảm trên đám mây
Mặc dù việc lưu trữ đám mây được khuyên dùng để tiết kiệm chi phí,
thời gian chuẩn bị cho các hệ thống lưu trữ dữ liệu, điều này không có nghĩa
là sự bảo mật dữ liệu đạt đến 100%. Chắc hẳn bạn cũng đã thấy rất nhiều
cuộc tấn công website để truy cập và thay đổi dữ liệu trên trang rồi đúng
không? Vậy nên, để tránh mất hoặc bị lộ các dữ liệu nhạy cảm, hãy sử dụng
ổ cứng, thiết bị lưu trữ vật lý để lưu giữ các dữ liệu quan trọng nhất.

 Tạo ra một mật khẩu mạnh


Một mật khẩu mạnh là điều tối thiểu để bảo vệ dữ liệu của doanh
nghiệp khi lưu trữ dữ liệu trên đám mây. Đừng bao giờ sử dụng một mật
khẩu đơn giản mà nhiều người dùng gán cho các tài khoản quan trọng. Theo
nghiên cứu, hơn 90% mật khẩu có thể bị bẻ trong vài giây. Sử dụng một mật
khẩu yếu là cách bạn tự “giết” doanh nghiệp của mình đấy.

Một mật khẩu an toàn là sự kết hợp của một số chữ cái (cả chữ hoa và
chữ thường), số và ký hiệu, dựa trên cơ sở 79 ký tự. Bạn có thể ngụy trang
các thông tin quan trọng thành mật khẩu bằng cách cộng hoặc trừ các số từ
ban đầu. Cuối cùng, hãy hạn chế chia sẻ những mật khẩu của bạn với người
khác.

 Mã hóa dữ liệu trước khi lưu trữ trên đám mây


Một mẹo để bảo mật dữ liệu khi lưu trữ trên đám mây là hãy mã hóa
trước khi tải nó lên. Nó là một cách hiệu quả để hạn chế khả năng dữ liệu
của bạn bị truy cập một cách trái phép. Quy trình mã hóa dữ liệu để tải lên
đám mây khá đơn giản: Bạn sử dụng một chương trình mã hóa dữ liệu của
bạn ở định dạng không thể đọc được và gán mật khẩu cho tệp đó, sau đó bạn
tải nó lên đám mây. Khi truy cập vào tệp này, bạn chỉ cần nhập mật khẩu để
giải mã.

Cách này hơi mất thời gian một chút nhưng nó sẽ đảm bảo được sự
bảo mật cho dữ liệu của bạn. Hiện nay, bạn có thể tìm thấy các chương trình
mã hóa dữ liệu trên mạng. Tuy nhiên, hãy cân nhắc để có được lựa chọn phù
hợp và tốt nhất.

 Chọn một dịch vụ đám mây được mã hóa


Bên cạnh việc tự mã hóa các tệp dữ liệu, bạn cũng cần lựa chọn những
dịch vụ đám mây cung cấp mã hóa phía máy chủ. Hiện nay, số đơn vị cung
cấp dịch vụ mã hóa phía đám mây không nhiều nhưng nó dự kiến sẽ là một
xu hướng của tương lai. Theo đó, dữ liệu sau khi được tải lên đám mây sẽ
được mã hóa trước khi đưa đến vị trí lưu trữ và giao cho người dùng mật mã
này.

 Chú ý các thỏa thuận người dùng khi đăng ký dịch vụ


Cuối cùng, khi bạn dự định lựa chọn một dịch vụ đám mây để lưu trữ
dữ liệu, hãy đọc kỹ các thỏa thuận của người dùng khi đăng ký. Bởi vì nó
làm sáng tỏ cách dữ liệu của bạn được xử lý, những biến nào đang ảnh
hưởng đến dữ liệu của bạn và khi nào dữ liệu của bạn có thể bị tổn thương
do can thiệp từ bên ngoài. Điều này là cần thiết để bạn chọn được một dịch
vụ đám mây an toàn.

You might also like