You are on page 1of 60

Bìa

MỤC LỤC

2
DANH MỤC HÌNH ẢNH

3
DANH MỤC BẢNG

4
DANH MỤC TỪ VIẾT TẮT

5
LỜI MỞ ĐẦU
Trong thời đại kỹ thuật số hiện nay, dữ liệu đã trở thành một tài nguyên quý báu
và không thể thiếu trong cuộc sống cá nhân và doanh nghiệp. Chúng ta sử dụng dữ
liệu hàng ngày để làm việc, học tập, giải trí, và thậm chí để lưu trữ những ký ức quý
báu. Tuy nhiên, ít ai trong chúng ta thực sự hiểu rõ cách dữ liệu của chúng ta được tổ
chức, quản lý, và lưu trữ trên các thiết bị lưu trữ, đặc biệt là ổ đĩa cứng.
Đề tài "Understanding File System and Hard Disk" (Hiểu về Hệ thống Tệp Tin
và Ổ Đĩa Cứng) sẽ tìm hiểu các khía cạnh quan trọng của việc lưu trữ và quản lý dữ
liệu. Đi sâu vào hệ thống tệp tin, một phần quan trọng của mọi hệ điều hành máy tính,
là nơi dữ liệu của chúng ta được tổ chức và bảo quản. Tìm hiểu về cấu trúc của hệ
thống tệp tin, cách nó hoạt động, và cách nó quản lý các tệp tin và thư mục.
Một phần quan trọng của dự án này sẽ là việc tìm hiểu về ổ đĩa cứng, thiết bị vật
lý nơi dữ liệu của chúng ta thực sự được lưu trữ. Khám phá cấu trúc của ổ đĩa cứng,
cách lưu trữ dữ liệu và cách nó hoạt động. Chúng ta sẽ tìm hiểu về các loại ổ đĩa cứng
khác nhau, bao gồm ổ đĩa HDD (Hard Disk Drive) và ổ đĩa SSD (Solid State Drive),
và hiểu rõ sự khác biệt giữa chúng. Tìm hiểu khái niệm quan trọng như định dạng ổ
đĩa và phân vùng, đồng thời khám phá các hệ thống tệp tin đặc biệt như hệ thống tệp
tin mạng, hệ thống tệp tin đa phương tiện, và hệ thống tệp tin dựa trên cơ sở dữ liệu.
Mục tiêu của đề tài là giúp người đọc có cách nhìn sơ lược tổng quan về dữ liệu
hoạt động và được quản lý trong thế giới số hóa ngày nay. Thông qua việc hiểu rõ hơn
về hệ thống tệp tin và ổ đĩa cứng sẽ trang bị cho mình kiến thức cần thiết để bảo vệ và
quản lý dữ liệu quý báu của mình một cách hiệu quả hơn.

6
CHƯƠNG I: TỔNG QUAN VỀ ĐIỀU TRA SỐ
1.1. Giới thiệu về điều tra số
Điều tra số, còn được gọi là lĩnh vực số học hoặc khoa học dữ liệu, là một lĩnh
vực nghiên cứu và ứng dụng sử dụng số học và dữ liệu để hiểu và giải quyết các vấn
đề thực tế trong nhiều lĩnh vực khác nhau. Điều tra số kết hợp các phương pháp số
học, thống kê, và tính toán máy tính để phân tích và hiểu dữ liệu số, từ đó tạo ra thông
tin có giá trị và đưa ra các quyết định thông minh.
Một số điểm quan trọng về điều tra số:
- Thu thập và Xử lý Dữ liệu: Điều tra số thường bắt đầu bằng việc thu thập dữ
liệu từ các nguồn khác nhau, bao gồm cả dữ liệu số và dữ liệu thực tế. Sau đó, dữ liệu
được xử lý và biến đổi để phù hợp với mục tiêu của cuộc điều tra.
- Thống kê và Phân Tích: Một phần quan trọng của điều tra số là sử dụng các
phương pháp thống kê để mô tả và phân tích dữ liệu. Thống kê giúp xác định các xu
hướng, mối quan hệ, và biểu đồ của dữ liệu.
- Machine Learning và AI: Các phương pháp học máy và trí tuệ nhân tạo (AI)
đang được tích hợp vào điều tra số để dự đoán và phân tích dữ liệu phức tạp. Điều này
có ứng dụng rộng rãi trong việc dự đoán xu hướng, phân loại dữ liệu, và tối ưu hóa
quy trình.
- Ứng Dụng Đa Lĩnh Vực: Điều tra số có thể được áp dụng trong nhiều lĩnh vực,
bao gồm kinh tế học, y học, khoa học xã hội, marketing, tài chính, ngành công nghiệp,
và nhiều lĩnh vực khác. Nó giúp cải thiện quyết định, tối ưu hóa quy trình, và đưa ra
dự đoán.
- Dữ Liệu Lớn (Big Data): Sự phát triển của công nghệ đã dẫn đến việc sản xuất
và lưu trữ lượng lớn dữ liệu số. Điều tra số đóng vai trò quan trọng trong việc xử lý và
trích xuất thông tin từ dữ liệu lớn.
- Tính Bảo Mật Dữ Liệu: Bảo mật dữ liệu là một thách thức quan trọng trong
điều tra số, đặc biệt khi liên quan đến thông tin cá nhân hoặc nhạy cảm. Điều tra số
cũng bao gồm việc xây dựng biện pháp bảo vệ dữ liệu và đảm bảo tính riêng tư.
- Hợp Tác Liên Ngành: Điều tra số thường đòi hỏi sự hợp tác giữa các chuyên
gia từ nhiều lĩnh vực, bao gồm toán học, thống kê, khoa học máy tính, kỹ thuật, và
ngành chuyên sâu của cuộc điều tra.
1.2. Ứng dụng điều tra số
Điều tra số (data analytics) có nhiều ứng dụng quan trọng và đa dạng trong nhiều
lĩnh vực khác nhau.

7
- Kinh Tế Học và Tài Chính: Dự đoán xu hướng thị trường tài chính; Phân tích
rủi ro tài chính và quản lý danh mục đầu tư; Tối ưu hóa chiến lược giá cả và quản lý
chuỗi cung ứng…
- Y Tế và Chăm Sóc Sức Khỏe: Phát hiện các xu hướng bệnh học và dự đoán sự
lan truyền của các dịch bệnh; Tối ưu hóa lịch trình bệnh viện và quản lý dữ liệu bệnh
nhân; Phát triển dự đoán và chuẩn đoán dựa trên dữ liệu lâm sàng…
- Marketing và Quảng Cáo: Tạo các chiến dịch quảng cáo và tiếp thị đích thực
dựa trên hành vi của người tiêu dùng; Phân tích phản hồi của khách hàng và xác định
các mô hình mua sắm; Xác định hiệu quả của chiến dịch tiếp thị và quảng cáo…
- Khoa Học Xã Hội: Nghiên cứu xã hội học và hành vi con người thông qua
phân tích dữ liệu xã hội; Dự đoán sự thay đổi trong các mô hình xã hội và tư duy xã
hội; Giúp quản lý dự án và quyết định chính trị dựa trên dữ liệu bầu cử và thăm dò ý
kiến.
- Ngành Công Nghiệp: Tối ưu hóa quy trình sản xuất và kiểm soát chất lượng;
Dự đoán hỏng hóc và bảo trì máy móc; Theo dõi và quản lý dữ liệu vận hành hệ
thống.
- Dịch Vụ Khách Hàng: Tạo trải nghiệm khách hàng tốt hơn thông qua phân tích
phản hồi và đánh giá khách hàng; Tối ưu hóa hỗ trợ khách hàng và quản lý cuộc gọi;
Dự đoán nhu cầu của khách hàng và cung cấp sản phẩm và dịch vụ phù hợp.
- Giáo Dục: Đánh giá hiệu suất học tập của học sinh và đưa ra phân loại cá nhân
hóa; Phát triển nội dung giảng dạy và tài liệu học dựa trên dữ liệu đánh giá; Tối ưu
hóa quản lý trường học và tài nguyên.
- Truyền Thông và Giải Trí: Phân tích phản hồi từ khán giả và đánh giá hiệu suất
chương trình truyền hình; Tối ưu hóa nội dung truyền thông dựa trên sự phân loại của
người tiêu dùng; Dự đoán xu hướng và khách hàng tiềm năng.
- An Ninh Mạng và Bảo Mật: Dự đoán và phát hiện các hành vi mạng bất thường
và xâm nhập; Phân tích dữ liệu về mối đe dọa và ranh giới; Bảo vệ hệ thống và dữ liệu
khỏi các cuộc tấn công mạng…
1.3. Quy trình thực hiện điều tra số
Một cuộc điều tra số thường bao gồm ba giai đoạn: tiếp nhận (hoặc chụp ảnh)
tang vật, phân tích, và lập báo cáo.
- Tiếp nhận tang vật liên quan đến việc tạo ra một bản sao chính xác của các
phương tiện truyền thông, thường sử dụng một thiết bị cấm ghi đè để ngăn ngừa sự
thay đổi so với bản gốc. Cả bản sao lẫn bản gốc đều được băm (sử dụng SHA-1 hoặc
MD5) để so sánh với nhau nhằm xác minh bản sao là chính xác.
- Trong giai đoạn phân tích, điều tra viên sẽ sử dụng các phương pháp và công
cụ khác nhau. Năm 2002, một bài báo trên Tạp chí Quốc tế về tang chứng kỹ thuật số

8
gọi bước này là “một hệ thống tìm kiếm chuyên sâu về bằng chứng liên quan đến các
kẻ tình nghi”. Năm 2006, nhà nghiên cứu pháp y Brian Carrie mô tả một “thủ tục trực
quan” trong đó bằng chứng rõ ràng sẽ được xác định đầu tiên và sau đó “tìm kiếm
toàn diện được tiến hành để bắt đầu làm đầy các chỗ trống”.
- Quá trình thực tế của phân tích có thể khác nhau giữa các cuộc điều tra,
nhưng các phương pháp thông thường bao gồm tiến hành tìm kiếm từ khóa trên các
phương tiện truyền thông số (trong tập tin cũng như không gian lỏng và chưa phân
bổ), phục hồi các tập tin đã xóa và khai thác các thông tin đăng kí (ví dụ để liệt kê
danh sách tài khoản người dùng, các thiết bị USB kèm theo...).
- Các chứng cứ sau khi phục hồi được phân tích để tái dựng lại hiện trường
hoặc những hành động và đưa ra kết luận, công việc này có thể được thực hiện bởi số
ít những nhân viên chuyên ngành. Khi một cuộc điều tra hoàn tất, các dữ liệu để trình
bày thường được thể hiện dưới hình thức văn bản báo cáo.

9
CHƯƠNG II: Ổ ĐĨA
2.1. Tổng quan về ổ đĩa
Ổ đĩa (Disk Drive) là một thiết bị lưu trữ dữ liệu quan trọng trong máy tính và
các thiết bị điện tử; bên trong ổ đĩa có chứa các thành phần cơ học, điện tử để phục vụ
cho mục đích lưu trữ và truy xuất dữ liệu.
Đĩa bên trong ổ đĩa được sử dụng để lưu trữ dữ liệu bao gồm mọi thứ từ hệ điều
hành (ví dụ: Windows, macOS, hoặc Linux) đến các tệp tài liệu, hình ảnh, video, ứng
dụng và các thành phần khác cần thiết cho hoạt động của máy tính hoặc thiết bị lưu
trữ đó.. Đĩa là thành phần cố định không thể tháo rời, nơi mà thông tin được lưu trữ
dưới dạng mã hóa. Dữ liệu trên đĩa bên trong ổ đĩa được tổ chức thành các phần nhỏ
gọi là sector hoặc block. Mỗi sector hoặc block chứa một lượng nhất định dữ liệu. Khi
bạn ghi dữ liệu vào ổ đĩa, hệ thống sẽ sắp xếp nó vào các sector hoặc block khả dụng.
Khi bạn đọc dữ liệu, đầu đọc của ổ đĩa di chuyển đến vị trí cụ thể trên đĩa để truy cập
và đọc dữ liệu từ sector hoặc block đó.

Hình 2.1: Hình ảnh về ổ đĩa.


Phân loại ổ đĩa theo kiểu lưu trữ: có 2 loại
- Ổ đĩa lưu trữ bên trong (Storage drives): Ổ đĩa lưu trữ chính là nơi lưu trữ tất cả
các tệp tin, ứng dụng, hệ điều hành và dữ liệu khác trên máy tính của người dùng. Đây
là một phần quan trọng của hệ thống máy tính, hiệu suất và dung lượng của nó làm
ảnh hưởng đến khả năng làm việc và các tác vụ khác hoạt động trên máy tính.

10
Hình 2.2: Hình ảnh về ổ đĩa lưu trữ bên trong.
- Ổ đĩa lưu trữ bên ngoài (External storage drives): là các thiết bị lưu trữ dữ liệu
ngoại vi, thường không được tích hợp vào máy tính hoặc thiết bị chính. Các ổ đĩa lưu
trữ ngoại vi thường kết nối với máy tính hoặc thiết bị khác thông qua các cổng như
USB, Thunderbolt, hoặc eSATA. Các ổ đĩa lưu trữ ngoại vi thường được sử dụng để
sao lưu dữ liệu, chia sẻ tệp, hoặc di chuyển dữ liệu giữa các máy tính hoặc thiết bị
khác nhau.

Hình 2.3: Hình ảnh về ổ đĩa lưu trữ bên ngoài.

11
Hình 2.4: Hình ảnh đĩa CD (Compact disc) được dùng để lưu trữ bên ngoài.
2.2. Ổ đĩa cứng (HDD- Hard Disk Drive)
Ổ đĩa cứng là một loại thiết bị lưu trữ dữ liệu phổ biến và quan trọng trong máy
tính và các thiết bị điện tử khác. Đây là một thành phần cố định bên trong máy tính,
laptop, máy chủ, và nhiều thiết bị khác. Đĩa cứng được sử dụng để lưu trữ và truy xuất
dữ liệu số, bao gồm hệ điều hành, ứng dụng, tệp tài liệu, hình ảnh, video, và nhiều loại
dữ liệu.
* Đặc điểm chính của ổ đĩa cứng bao gồm:
- Đĩa Quay (Platters): Đĩa cứng bao gồm một hoặc nhiều đĩa quay (platters) được
làm từ chất liệu từ tính. Các dữ liệu được lưu trữ trên bề mặt của các đĩa quay này.
- Đầu Đọc/Ghi (Read/Write Heads): Để đọc và ghi dữ liệu, đĩa cứng sử dụng các
đầu đọc/ghi cơ học. Các đầu này di chuyển trên bề mặt của đĩa để truy xuất dữ liệu từ
các vị trí khác nhau trên đĩa.
- Sectors và Tracks: Dữ liệu trên đĩa cứng được chia thành các sector và tracks.
Mỗi sector hoặc track chứa một lượng nhất định dữ liệu. Khi bạn đọc hoặc ghi dữ liệu,
đầu đọc/ghi di chuyển đến vị trí cụ thể trên đĩa để truy cập và thao tác với sector hoặc
track đó.
- Lớp Vật Liệu Từ Tính (Magnetic Coating): Các đĩa quay được phủ một lớp vật
liệu từ tính. Thông tin số được mã hóa dưới dạng các điểm từ tính trên bề mặt đĩa, và
các đầu đọc/ghi đọc và ghi dữ liệu bằng cách thay đổi trạng thái từ tính của các điểm
này.
* Cấu trúc vật lý của ổ đĩa HDD:
- Spindle (Trục quay): Spindle là trục tròn chứa các đĩa quay (platters) của ổ đĩa
cứng. Spindle quay vòng liên tục để cho phép đầu đọc/ghi truy cập dữ liệu trên các
đĩa.
- Disk (Đĩa quay - Platters): Disk là các đĩa tròn và mỏng bên trong ổ đĩa cứng.
Dữ liệu được lưu trữ trên bề mặt của các đĩa quay này dưới dạng các điểm từ tính.
- Saved File (Tệp được lưu trữ): HDD lưu trữ dữ liệu trong các tệp tin trên các
đĩa quay. Các tệp này có thể là các tài liệu, ứng dụng, hệ điều hành, hình ảnh, video và
dữ liệu khác.

12
- Actuator (Bộ điều khiển): Actuator là bộ phận cơ học chứa đầu đọc/ghi và cánh
tay cơ học. Nó điều khiển việc di chuyển đầu đọc/ghi trên bề mặt đĩa để truy cập và
thao tác với dữ liệu.
- Power Port (Cổng Nguồn): Power port là nơi cung cấp năng lượng điện cho ổ
đĩa cứng từ nguồn điện của máy tính hoặc thiết bị khác.
- Data Cable Port (Cổng Dữ Liệu): Data cable port là cổng kết nối dữ liệu giữa ổ
đĩa cứng và bo mạch chủ của máy tính hoặc thiết bị lưu trữ khác. Thông qua cổng này,
dữ liệu được truyền đi và đến từ ổ đĩa cứng.
- Drive Configuration Port (Cổng Cấu Hình Ổ Đĩa): Một số ổ đĩa cứng có một
cổng cấu hình ổ đĩa, thông qua đó có thể cấu hình hoặc thiết lập một số tính năng đặc
biệt của ổ đĩa.
- Circuit Board (Bo Mạch Điện Tử): Circuit board là bo mạch điện tử chứa bộ
điều khiển (controller) và các linh kiện điện tử khác để quản lý hoạt động của ổ đĩa
cứng.
- Arm (Cánh Tay): Arm là một bộ phận cơ học chứa đầu đọc/ghi và cho phép nó
di chuyển lên và xuống bề mặt đĩa để truy cập dữ liệu từ các vị trí khác nhau trên đĩa.
- Read/Write Head (Đầu Đọc/Ghi): Đầu đọc/ghi là thành phần chịu trách nhiệm
đọc và ghi dữ liệu trên bề mặt đĩa. Các đầu này thường nằm ở cuối cánh tay và di
chuyển để truy xuất dữ liệu từ các sector và track trên đĩa.

Hình 2.5: Cấu trúc của ổ đĩa HDD (Hard disk drive).
* Cấu trúc cụ thể của đĩa từ bên trong ổ đĩa:
13
- Platter (Đĩa Quay): Platter là các đĩa tròn và mỏng bên trong ổ đĩa cứng.
Thông thường, mỗi ổ đĩa cứng sẽ có nhiều platter được xếp chồng lên nhau trên trục
quay (spindle). Dữ liệu được lưu trữ trên bề mặt của các platter.
- Spindle (Trục Quay): Spindle là trục tròn nằm ở giữa các platter và giữ
chúng cố định. Spindle quay vòng liên tục để cho phép các platter xoay vòng và giúp
đầu đọc/ghi truy cập dữ liệu trên chúng.
- Track (Dải): Track là một dải hoặc vòng tròn ảo trên bề mặt của mỗi platter.
Các track tạo thành các vùng lưu trữ dữ liệu trên platter. Dữ liệu được lưu trữ trên các
track dưới dạng các sector.
- Sector (Phân Đoạn): Sector là đơn vị nhỏ nhất của dữ liệu trên một platter.
Mỗi sector chứa một lượng nhất định dữ liệu số. Khi bạn đọc hoặc ghi dữ liệu, đầu
đọc/ghi sẽ truy cập và thao tác với các sector cụ thể.
- Cylinder (Xoay Tròn - Track Group): Cylinder là một nhóm các track trên
các platter cùng vị trí dọc theo trục quay. Điều này có nghĩa là khi đầu đọc/ghi di
chuyển từ một track lên hoặc xuống, nó đang truy xuất đến các track cùng vị trí trên
tất cả các platter. Cylinder thường được sử dụng để chỉ định vị trí vật lý của dữ liệu
trên ổ đĩa cứng.
- Rotation (Xoay Vòng): Rotation là tốc độ quay của platter, được đo bằng số
vòng quay mỗi phút (RPM). Tốc độ quay thường là một yếu tố quan trọng ảnh hưởng
đến tốc độ truy xuất dữ liệu. Ví dụ, ổ đĩa cứng 7200 RPM sẽ nhanh hơn so với ổ đĩa
cứng 5400 RPM.

Hình 2.6: Phân tích cấu trúc bên trong đĩa từ (platter) của ổ đĩa HDD
Nguyên lý hoạt động cơ bản là có một đĩa tròn làm bằng nhôm (hoặc thủy tinh,
hoặc gốm) được phủ vật liệu từ tính. Giữa ổ đĩa có một động cơ quay để để đọc/ghi dữ
14
liệu, kết hợp với những thiết bị này là những bo mạch điện tử nhằm điều khiển đầu
đọc/ghi đúng vào vị trí của cái đĩa từ lúc nãy khi đang quay để giải mã thông tin.
* Dựa trên các ổ HDD được sử dụng thông thường để phân loại các cổng
của ổ đĩa cứng:
SCSI (Small Computer System Interface):
- Mục Đích: SCSI ban đầu được thiết kế cho các môi trường máy tính và máy
chủ chuyên nghiệp. Nó thường được sử dụng để kết nối các thiết bị lưu trữ, bao gồm ổ
đĩa cứng và thiết bị ngoại vi lưu trữ dữ liệu. SCSI cung cấp hiệu suất cao, khả năng
mở rộng và tính ổn định cao, thích hợp cho các ứng dụng đòi hỏi độ tin cậy và hiệu
suất.
- Tính Năng: SCSI hỗ trợ nhiều thiết bị kết nối với một đường dây bus duy nhất,
hỗ trợ nhiều tốc độ truyền dữ liệu và hệ thống bộ đệm lớn.
- Sự Phù Hợp: SCSI thường được sử dụng trong các môi trường doanh nghiệp,
máy chủ, và hệ thống lưu trữ chuyên nghiệp.

Hình 2.7: Cổng kết nối SCSI trên ổ đĩa


ATA (Advanced Technology Attachment):
- Mục Đích: ATA, bao gồm PATA (Parallel ATA) và SATA (Serial ATA),
thường được sử dụng trong máy tính cá nhân và máy tính xách tay. PATA đã lỗi thời
và thường không được sử dụng nữa. SATA là một giao tiếp thông dụng cho ổ đĩa
cứng và thiết bị lưu trữ, cung cấp tính đơn giản và hiệu suất tốt cho người dùng thông
thường.

15
- Tính Năng: ATA thường được sử dụng với các loại ổ đĩa HDD như IDE
(Integrated Drive Electronics) hoặc EIDE (Enhanced IDE). ATA có thể bao gồm cả
PATA (Parallel ATA) và SATA (Serial ATA) tùy thuộc vào thế hệ và tốc độ.
- Sự Phù Hợp: ATA phù hợp cho người dùng cá nhân và máy tính để bàn thông
thường.

Hình 2.8: Cổng kết nối ATA trên ổ đĩa


USB (Universal Serial Bus):
- Mục Đích: USB là một giao tiếp đa năng và phổ biến, thường được sử dụng để
kết nối ổ đĩa cứng di động, ổ đĩa flash, máy ảnh số, máy in, bàn phím, chuột, và nhiều
thiết bị ngoại vi khác. Nó cung cấp tính năng gắn nóng, tốc độ truyền dữ liệu tương
đối cao và đơn giản trong việc sử dụng.
- Tính Năng: USB là giao tiếp phổ biến, dễ sử dụng và có khả năng gắn kết
nhanh chóng. Có nhiều thế hệ USB với tốc độ truyền dữ liệu khác nhau, bao gồm
USB 2.0, USB 3.0, USB 3.1, và USB 3.2.
- Sự Phù Hợp: USB là lựa chọn phổ biến cho ổ đĩa cứng ngoại và các thiết bị lưu
trữ di động.

16
Hình 2.9: Cổng kết nối USB trên ổ đĩa
Fibre Channel:
- Mục Đích: Fibre Channel thường được sử dụng trong các môi trường doanh
nghiệp và hệ thống lưu trữ lớn. Nó cung cấp tốc độ và hiệu suất cao, khả năng mở
rộng và tính đáng tin cậy cho hệ thống lưu trữ đòi hỏi sự ổn định và sẵn sàng cao.
- Tính Năng: Fibre Channel cung cấp tốc độ truyền dữ liệu rất cao và hỗ trợ kết
nối xa. Nó thường được sử dụng với ổ đĩa cứng và các thiết bị lưu trữ chuyên nghiệp.
- Sự Phù Hợp: Fibre Channel thích hợp cho hệ thống máy chủ và trung tâm dữ
liệu với yêu cầu cao về hiệu suất và khả năng mở rộng.

Hình 2.10: Cổng kết nối Fibre Channel trên ổ đĩa


IDE/EIDE (Integrated Drive Electronics/Enhanced IDE):
- Mục Đích: IDE/EIDE là một giao tiếp đã lỗi thời và thường không được sử
dụng trong máy tính hiện đại. Trước đây, nó được sử dụng để kết nối ổ đĩa cứng và
các thiết bị lưu trữ khác với máy tính cá nhân. SATA đã thay thế nó trong hầu hết các
trường hợp.
- Tính Năng: IDE/EIDE sử dụng các cáp dẹt để kết nối ổ đĩa với bo mạch chủ.
EIDE cải thiện hiệu suất so với IDE thông thường.

17
- Sự Phù Hợp: IDE/EIDE đã bị thay thế bởi SATA trong hầu hết các ứng dụng
máy tính cá nhân. Tuy nhiên, nó vẫn còn trong các hệ thống cũ hoặc thiết bị như ổ đĩa
quang (CD/DVD).

Hình 2.11: Cổng kết nối IDE trên ổ đĩa


* Đĩa từ (disk plattter) trong ổ đĩa cứng:
Disk platter (đĩa từ) trong ổ đĩa cứng (hard disk drive - HDD) là một phần quan
trọng của cấu trúc vật lý của ổ đĩa. Đây là một phần mà dữ liệu được lưu trữ trên bề
mặt từ của đĩa. Dữ liệu trên ổ đĩa cứng được ghi và đọc thông qua đầu đọc/ghi từ mặt
trên của disk platter này. Disk platter thường được làm từ vật liệu từ tính như thép
hoặc hợp kim nhôm, và nó được phủ một lớp vật liệu từ tính (cốt từ) để lưu trữ dữ
liệu. Các đĩa từ này được gắn trên trục chung và quay xung quanh trục đó với tốc độ
quay cố định. Đầu đọc/ghi ở đầu của cánh đĩa tự động di chuyển để truy cập và ghi dữ
liệu trên bề mặt từ của đĩa.

18
Dữ liệu trên ổ đĩa cứng được chia thành các vùng tròn gọi là "track" và các phần
nhỏ hơn gọi là "sector." Mỗi disk platter có nhiều track và sector, và chúng được sử
dụng để tổ chức và lưu trữ dữ liệu theo cách hiệu quả. Tổng cộng, disk platter là một
phần quan trọng trong việc lưu trữ dữ liệu trên ổ đĩa cứng và chúng cùng với các
thành phần khác như đầu đọc/ghi và motor quay đĩa tạo nên cấu trúc hoạt động của

HDD.
Hình 2.12: Hình ảnh đĩa từ trong ổ đĩa
* Tracks, Sector và Cylinder:
"Tracks" là các vùng tròn trên bề mặt từ của disk platter. Mỗi disk platter được
chia thành nhiều track, và các track này chứa dữ liệu. Tracks là một phần quan trọng
của việc tổ chức và lưu trữ dữ liệu trên ổ đĩa cứng. Cụ thể, một track là một vùng dữ
liệu được lưu trữ trên bề mặt từ của disk platter và có hình dạng như một vòng tròn.
Dữ liệu trên một track được ghi và đọc bằng đầu đọc/ghi trên đĩa khi nó quay qua
track đó.
Các track thường được chia thành các phần nhỏ hơn gọi là "sectors" (khu vực).
Mỗi sector chứa một lượng nhất định dữ liệu. Số lượng track và sector trên mỗi disk
platter thường phụ thuộc vào thiết kế cụ thể của ổ đĩa cứng. Các track và sectors giúp
tổ chức và lưu trữ dữ liệu trên ổ đĩa cứng một cách hiệu quả, cho phép hệ thống đọc
và ghi dữ liệu vào các vị trí cụ thể trên đĩa một cách nhanh chóng và chính xác.

19
Một "cylinder" là tập hợp của các track trên tất cả các disk platter cùng vị trí trên
đĩa cứng. Nó bao gồm tất cả các track có cùng vị trí vật lý trên các disk platter, chẳng
hạn như tất cả các track nằm ở vị trí bán kính giống nhau trên từng đĩa. Một cylinder
bao gồm các track từ mặt từ của mỗi disk platter trong ổ đĩa cứng. Mỗi track trong
cylinder tương ứng với một vị trí trên disk platter và có cùng khoảng cách từ trục quay
chung của ổ đĩa.

Hình 2.13: Hình ảnh mô hình về Tracks, Sector và Cylinder


* Tiêu chuẩn AF về Sector (Advanced Format): là một tiêu chuẩn mới cho
việc tổ chức và ghi dữ liệu trên ổ đĩa cứng (hard disk drive - HDD). Advanced Format
thường dự định sử dụng sector có kích thước lớn hơn, thường là 4,096 byte (4K).
Dưới đây là một số điểm quan trọng về Advanced Format sector:
- Kích thước sector: Advanced Format sử dụng sector có kích thước 4K thay vì
512 byte như trong tiêu chuẩn cũ. Việc sử dụng sector lớn hơn giúp tối ưu hóa hiệu
suất đọc/ghi dữ liệu và giảm thiểu overhead khi lưu trữ các thông tin quản lý.
- 512e Emulation: Với việc chuyển từ 512-byte sector sang 4K sector, để hỗ trợ
các ứng dụng và hệ điều hành cũ sử dụng 512-byte sector, các ổ đĩa Advanced Format
thường cung cấp tính năng emulation, được gọi là "512e" (emulated). Điều này cho
phép ổ đĩa 4K sector hoạt động với ứng dụng và hệ điều hành không hỗ trợ 4K sector.
- Tăng hiệu suất và dung lượng: Advanced Format giúp tăng hiệu suất và dung
lượng lưu trữ bằng cách giảm số lượng sector thông tin quản lý, giảm thiểu sự lãng phí
không gian trống trải giữa các sector, và tối ưu hóa cách dữ liệu được lưu trữ trên đĩa.
- Cần hỗ trợ tương thích: Để sử dụng ổ đĩa HDD với Advanced Format, hệ điều
hành và các ứng dụng cần hỗ trợ tiêu chuẩn này. Hầu hết các hệ điều hành hiện đại
như Windows 7 trở lên và các phiên bản gần đây của Linux đã hỗ trợ Advanced
Format.

20
* Cluster (file allocation unit): có vai trò quan trọng trong việc tổ chức và quản
lý dữ liệu trên ổ đĩa.
Các vai trò chính của Cluster:
- Tổ chức Dữ liệu: Cluster là đơn vị nhỏ nhất trong việc tổ chức và lưu trữ dữ
liệu trên ổ đĩa cứng. Thay vì lưu trữ từng byte một, dữ liệu thường được chia thành
các cluster. Cụ thể, mỗi cluster có một kích thước cố định và chứa một lượng dữ liệu
nhất định.
- Quản Lý Không Gian: Sử dụng cluster giúp quản lý không gian trống trên ổ đĩa
một cách hiệu quả. Khi một file được xóa hoặc thay đổi, cluster được sử dụng trước
đó có thể được đánh dấu là trống và có sẵn để sử dụng cho dữ liệu mới.
- Hiệu Suất Đọc/Ghi: Sử dụng cluster giúp tối ưu hóa hiệu suất đọc/ghi dữ liệu.
Thay vì phải quản lý từng byte riêng lẻ, hệ thống có thể đọc và ghi dữ liệu theo đơn vị
cluster, giúp giảm thiểu overhead quản lý và tối ưu hóa hiệu suất ổ đĩa.
- Phòng Tránh Fragmentation: Sử dụng cluster giúp phòng tránh hiện tượng
fragmentation (phân mảnh) trên ổ đĩa. Fragmentation xảy ra khi các phần của một file
được lưu trữ tách biệt và không liền kề nhau trên ổ đĩa, làm cho việc đọc dữ liệu trở
nên chậm hơn. Cluster giúp giảm thiểu hiện tượng fragmentation bằng cách tạo các
phân đoạn lớn hơn cho dữ liệu.
- Quyết Định Kích Thước Cluster: Kích thước cluster có thể được cài đặt khi bạn
định dạng ổ đĩa hoặc tạo phân vùng. Việc lựa chọn kích thước cluster có thể ảnh
hưởng đến cách sử dụng không gian trống và hiệu suất của ổ đĩa. Lựa chọn kích thước
cluster phù hợp có thể giúp tối ưu hóa hiệu suất và quản lý không gian trống.

Hình 2.14: Hình ảnh cấu trúc của đĩa từ bên trong ổ đĩa

21
* Quá trình đọc và ghi dữ liệu của ổ đĩa HDD
Quá trình đọc dữ liệu:
- Khi có yêu cầu đọc dữ liệu từ ổ đĩa HDD, hệ thống máy tính sẽ gửi lệnh đến ổ
đĩa.
- Đầu đọc sẽ di chuyển đến vị trí cần đọc trên đĩa bằng cách điều khiển actuator
arm.
- Khi đầu đọc đến vị trí đúng trên đĩa, nó sẽ đọc dữ liệu từ các định dạng
magnetic trên đĩa.
- Dữ liệu được đọc bởi đầu đọc sau đó được chuyển về hệ thống máy tính qua
giao diện dữ liệu (ví dụ: SATA hoặc IDE).
Quá trình ghi dữ liệu:
- Khi có yêu cầu ghi dữ liệu vào ổ đĩa HDD, hệ thống máy tính sẽ gửi lệnh ghi
đến ổ đĩa.
- Đầu ghi sẽ di chuyển đến vị trí trống trên đĩa tương tự như quá trình đọc.
- Dữ liệu được chuyển từ hệ thống máy tính vào đầu ghi.
- Đầu ghi sẽ thay đổi hướng nam châm trên đĩa để lưu trữ dữ liệu mới.
* "Blank space" trong ổ đĩa cứng (hard disk) đề cập đến không gian trống trên
đĩa mà chưa được sử dụng để lưu trữ dữ liệu. Điều này có thể là không gian trống
trong phân vùng hoặc ổ đĩa cứng chưa được sử dụng hoàn toàn.
Có hai loại blank space chính trên ổ đĩa cứng:
- Unallocated Space (Không gian chưa được cấp phát): Đây là không gian trống
trên ổ đĩa cứng mà chưa được phân vùng hoặc cấp phát cho bất kỳ phân vùng nào.
Unallocated space là một phần của ổ đĩa cứng nhưng không được sử dụng để lưu trữ
dữ liệu. Để sử dụng unallocated space, bạn có thể tạo một phân vùng mới hoặc mở
rộng phân vùng hiện có.
- Free Space (Không gian trống): Đây là không gian trống trong một phân vùng
đã tồn tại. Free space là không gian mà bạn có thể sử dụng để lưu trữ dữ liệu mới hoặc
để mở rộng phân vùng hiện có.
Blank Space trong ổ đĩa HDD:
- Blank space trong HDD có thể do dữ liệu đã được xóa hoặc thay đổi vị trí của
nó trên đĩa cứng. Khi dữ liệu bị xóa hoặc di chuyển, blank space sẽ xuất hiện, và các
phần trống này có thể được sử dụng để lưu trữ dữ liệu mới trong tương lai.

22
- Blank space trên HDD thường không ảnh hưởng đến hiệu suất của ổ đĩa, nhưng
nó có thể được sử dụng để tổ chức và lưu trữ dữ liệu mới.
*Các lỗi thường xảy ra trên ổ đĩa HDD và cách khắc phục:
- Lost clusters (thường xuất hiện trên ổ đĩa HDD) (cụ thể là "lost cluster" hoặc
"lost clusters") là một hiện tượng liên quan đến hệ thống tệp tin và ổ đĩa cứng trong
môi trường Microsoft FAT (File Allocation Table), đặc biệt là trong hệ thống tệp
FAT12 và FAT16. Dưới đây là một giải thích về hiện tượng lost clusters:
+ File Allocation Table (FAT): Trong hệ thống tệp FAT, dữ liệu lưu trữ trên ổ
đĩa cứng được tổ chức thành các cluster (khối dữ liệu có kích thước cố định). Một
phần mục tiêu của FAT là theo dõi việc sử dụng các cluster này.
+ Lost Clusters: Lost clusters xuất hiện khi FAT ghi một liên kết tới một
cluster nhưng không có tệp tin hoặc thư mục nào được gán cho nó. Điều này có thể
xảy ra trong trường hợp lỗi trong quá trình ghi dữ liệu, tắt hệ thống không an toàn
hoặc khi một ứng dụng không hoàn thành một quá trình ghi dữ liệu.
+ Không gian lãng phí: Lost clusters tạo ra không gian lãng phí trên ổ đĩa
cứng vì chúng không được sử dụng cho bất kỳ mục đích cụ thể nào. Không gian này
không thể truy cập trực tiếp từ hệ điều hành hoặc ứng dụng thông qua cơ chế thông
thường.
+ Khả năng gây ra lỗi: Lost clusters có thể gây ra các vấn đề như sự phân
mảnh của dữ liệu trên ổ đĩa cứng, làm giảm hiệu suất, hoặc gây lỗi trong quá trình đọc
và ghi dữ liệu. Nếu bạn phát hiện hiện tượng lost clusters trên ổ đĩa cứng của mình,
bạn nên thử khôi phục chúng hoặc sử dụng các công cụ sửa chữa dữ liệu để giải quyết
vấn đề.
Cách sửa
- Sử dụng công cụ kiểm tra và sửa lỗi của hệ điều hành:
+ Trên Windows, bạn có thể sử dụng lệnh chkdsk (Check Disk) để kiểm tra và
sửa lỗi trên ổ đĩa cứng. Mở cửa sổ Command Prompt (Dòng lệnh) với quyền quản trị
và chạy lệnh chkdsk /f cho phân vùng có vấn đề. Lệnh này sẽ kiểm tra và sửa lỗi trên
ổ đĩa cứng, bao gồm lost clusters.
+ Trên Linux, bạn có thể sử dụng fsck (File System Check) để kiểm tra và sửa
lỗi trên hệ thống tệp của bạn. Ví dụ, fsck /dev/sdX (thay thế /dev/sdX bằng thiết bị ổ
đĩa cần kiểm tra).
- Sử dụng các công cụ bên ngoài:
+ Có nhiều công cụ bên ngoài có thể giúp bạn kiểm tra và sửa lỗi trên ổ đĩa
cứng, bao gồm cả lost clusters. Một số công cụ phổ biến là TestDisk, SpinRite, và
HDD Regenerator. Hãy làm theo hướng dẫn của công cụ cụ thể mà bạn chọn để sử
dụng.

23
- Sao lưu dữ liệu và định dạng lại ổ đĩa:
+ Nếu ổ đĩa cứng của bạn gặp nhiều lỗi và không thể sửa chữa được, bạn có
thể phải sao lưu dữ liệu quan trọng và định dạng lại ổ đĩa. Điều này sẽ xóa tất cả dữ
liệu trên đó, bao gồm cả lost clusters, và bắt đầu từ đầu với một ổ đĩa sạch.
- Sử dụng dịch vụ chuyên nghiệp:
+ Nếu bạn không tự tin trong việc sửa lỗi lost clusters hoặc ổ đĩa cứng của bạn
gặp vấn đề nghiêm trọng, hãy tìm đến dịch vụ chuyên nghiệp trong việc khôi phục dữ
liệu hoặc sửa chữa ổ đĩa cứng.
* Bad sector (khu vực lỗi) là một hiện tượng phổ biến trên ổ đĩa cứng. Nó xuất
hiện khi một phần của ổ đĩa cứng không thể truy cập được hoặc ghi dữ liệu một cách
đáng tin cậy.
Hiện tượng bad sector có thể gây ra những vấn đề sau:
- Lỗi Đọc/Ghi Dữ Liệu: Bad sector làm cho việc đọc hoặc ghi dữ liệu lên ổ đĩa
trở nên khó khăn hoặc thậm chí không thể thực hiện được. Điều này có thể dẫn đến
việc mất dữ liệu hoặc các lỗi khi bạn cố gắng truy cập tệp tin hoặc thư mục nằm trên
bad sector.
- Chậm Hiệu Suất: Khi hệ thống cố gắng đọc dữ liệu từ bad sector, nó phải thực
hiện nhiều cố gắng và thời gian để thử truy cập dữ liệu. Điều này có thể làm giảm hiệu
suất của ổ đĩa cứng và làm cho máy tính hoạt động chậm hơn.
- Rủi Ro Dữ Liệu: Bad sector có thể gây ra rủi ro đối với dữ liệu quan trọng. Nếu
dữ liệu quan trọng được lưu trữ trên bad sector và không được sao lưu, có thể dẫn đến
mất dữ liệu không thể khôi phục được.
- Sự Lan Rộng: Bad sector có thể lan rộng nếu không được quản lý hoặc sửa
chữa kịp thời. Điều này có nghĩa là thêm bad sector có thể xuất hiện theo thời gian,
làm cho tình trạng ổ đĩa cứng trở nên tồi tệ hơn.
Cách xử lý bad sector có thể bao gồm:
- Sử dụng công cụ kiểm tra bad sector: Hệ điều hành và các công cụ bên ngoài
thường cung cấp công cụ kiểm tra bad sector, như chkdsk trên Windows hoặc fsck
trên Linux. Việc chạy công cụ này có thể giúp bạn xác định và sửa chữa bad sector.
- Sử dụng phần mềm sửa chữa bad sector: Có nhiều phần mềm sẵn có để sửa
chữa bad sector. Tuy nhiên, việc sửa chữa bad sector không đảm bảo hoàn toàn và có
thể làm mất dữ liệu.
- Thay thế ổ đĩa cứng: Trong trường hợp bad sector trở nên nghiêm trọng và
không thể sửa chữa được, bạn có thể cần phải thay thế ổ đĩa cứng.
Ngoài 2 lỗi liên quan trực tiếp đến ổ đĩa cứng đó thì còn các lỗi như :

24
- Sự hỏng hóc của các bộ phận cơ học: Các bộ phận cơ học bên trong ổ đĩa cứng,
chẳng hạn như động cơ quay, đầu đọc/ghi, vòng bi, và các bộ phận khác có thể trục
trặc. Điều này có thể dẫn đến sự mất mát dữ liệu hoặc không thể truy cập vào ổ đĩa.
- Lỗi hệ thống tệp tin hoặc phân vùng: Lỗi trong hệ thống tệp tin hoặc bản ghi
phân vùng có thể làm cho dữ liệu trên ổ đĩa trở nên không thể truy cập hoặc gây ra các
vấn đề hoạt động.
- Phân mảnh dữ liệu: Dữ liệu trên ổ đĩa cứng có thể trở nên phân mảnh theo thời
gian, dẫn đến hiệu suất kém và tốn thời gian cho việc truy cập dữ liệu.
- Lỗi logic của ổ đĩa: Lỗi logic trong hệ điều hành hoặc phần mềm có thể gây ra
các vấn đề với ổ đĩa cứng, chẳng hạn như không thể khởi động hệ thống hoặc mất dữ
liệu.
- Lỗi phần mềm: Lỗi trong phần mềm quản lý ổ đĩa cứng, chẳng hạn như BIOS
hoặc firmware, có thể gây ra các vấn đề với ổ đĩa cứng.
* Phân vùng trên ổ đĩa HDD (Hard Disk Drive): là quá trình chia ổ đĩa thành
các phần riêng biệt để quản lý dữ liệu và hệ thống. Các loại phân vùng trên HDD và
cách phân chúng có thể khá đa dạng. Dưới đây là một số loại phân vùng thường gặp
và cách phân chúng:
- Phân vùng hệ thống (System Partition): Đây là phân vùng chứa hệ điều hành và
các tệp tin cần thiết để khởi động máy tính. Trên hệ điều hành Windows, phân vùng
hệ thống thường được gắn nhãn là "C:" và chứa hệ điều hành Windows. Cách phân
vùng hệ thống phụ thuộc vào quá trình cài đặt hệ điều hành.
- Phân vùng dữ liệu (Data Partition): Đây là phân vùng được sử dụng để lưu trữ
dữ liệu cá nhân, tài liệu, ảnh, video, và các tệp tin khác. Cách tạo phân vùng dữ liệu
là:
+ Sử dụng Trình quản lý đĩa trên Windows: Bạn có thể mở Trình quản lý đĩa,
chọn ổ đĩa HDD, và tạo một phân vùng mới sau đó.
+ Sử dụng các công cụ phân vùng bên ngoài như GParted trên Linux hoặc các
ứng dụng phân vùng bên ngoài khác trên Windows.
- Phân vùng mở rộng (Extended Partition): Trên hệ điều hành Windows, phân
vùng mở rộng thường được sử dụng để chứa các phân vùng logic bổ sung. Điều này
cho phép bạn tạo nhiều phân vùng logic bên trong một phân vùng mở rộng duy nhất.
- Phân vùng logic (Logical Partition): Phân vùng logic là các phân vùng bổ sung
nằm bên trong một phân vùng mở rộng. Trên Windows, các phân vùng này thường
được gắn nhãn là "D:", "E:", và cứ tiếp tục.
* Boot ổ đĩa HDD: là quá trình khởi động máy tính bằng cách sử dụng ổ đĩa
cứng (HDD) làm thiết bị lưu trữ chứa hệ điều hành và các tệp tin cần thiết để máy tính
hoạt động. Dưới đây là quá trình cơ bản của việc boot từ ổ đĩa HDD:

25
- Bấm Nút Khởi Động (Power Button): Bạn bắt đầu quá trình bằng việc bấm nút
nguồn trên máy tính của bạn hoặc một thiết bị tương tự (laptop, máy tính để bàn, máy
chủ, v.v.).
- POST (Power-On Self-Test): Máy tính thực hiện một loạt kiểm tra tự kiểm tra
bộ vi xử lý (CPU), RAM, card đồ họa, và các thiết bị phần cứng khác. Nếu bất kỳ lỗi
nào được phát hiện, máy tính có thể phát ra âm thanh cảnh báo hoặc hiển thị thông
báo lỗi.
- BIOS (Basic Input/Output System): Sau khi POST hoàn tất, máy tính tải BIOS,
là một chương trình nhúng trong bo mạch chủ (motherboard). BIOS chứa thông tin về
cấu hình phần cứng và quyết định thiết bị khởi động tiếp theo.
- Ổ Đĩa Khởi Động (Boot Drive): BIOS quyết định ổ đĩa cứng nào (HDD hoặc
SSD) sẽ được sử dụng làm thiết bị khởi động. Nếu bạn muốn boot từ HDD, BIOS sẽ
chỉ định ổ đĩa HDD làm ổ đĩa khởi động.
- Boot Loader (Trình nạp khởi động): Máy tính tìm kiếm và nạp một phần mềm
gọi là boot loader từ ổ đĩa khởi động. Boot loader thường nằm trong một vùng được
gọi là MBR (Master Boot Record) hoặc GPT (GUID Partition Table) tùy thuộc vào
cấu hình của ổ đĩa.
- Hệ Điều Hành:
+ Nếu bạn đang sử dụng hệ điều hành Windows, boot loader sẽ nạp Boot
Manager của Windows, từ đó bạn có thể chọn hệ điều hành cụ thể (nếu bạn cài đặt
nhiều hệ điều hành trên cùng một ổ đĩa).
+Nếu bạn sử dụng một hệ điều hành Linux, boot loader sẽ nạp kernel của
Linux và khởi động hệ điều hành.
- Khởi Động Hệ Thống:
+ Hệ điều hành bắt đầu chạy các dịch vụ và tiến trình cần thiết để hoạt động.
+ Giao diện người dùng xuất hiện và bạn có thể bắt đầu sử dụng máy tính.
2.3. Ổ đĩa SSD
SSD là viết tắt của Soid State Drive là ổ đĩa thể rắn với chức khả năng tương tự
HDD. Ổ đĩa SSD sử dụng các bộ nhớ bán dẫn như SRAM, DRAM hay FLASH để lưu
trữ thay vì cơ học như HDD truyền thống.
* Đặc điểm chính của ổ đĩa SSD:
- Không có bộ phận cơ học: Ổ đĩa SSD không có các thành phần cơ học như đĩa
quay, đầu đọc/ghi, spindle, và actuator arm như ổ đĩa HDD. Thay vào đó, nó sử dụng
bộ nhớ flash để lưu trữ dữ liệu, giúp loại bỏ sự mất mát dữ liệu do các bộ phận cơ học
hỏng.

26
- Tốc độ nhanh: SSD có tốc độ truy cập dữ liệu nhanh hơn rất nhiều so với HDD.
Điều này làm cho hệ thống khởi động nhanh hơn, ứng dụng chạy mượt mà hơn và thời
gian đọc/ghi dữ liệu ngắn hơn.
- Tiêu thụ năng lượng thấp: Ổ đĩa SSD tiêu thụ ít năng lượng hơn so với HDD.
Điều này giúp tiết kiệm năng lượng và kéo dài thời gian sử dụng pin trên các thiết bị
di động như laptop và máy tính bảng.
- Không phát ra tiếng ồn: Vì không có các bộ phận cơ học quay và di chuyển, ổ
đĩa SSD hoạt động hoàn toàn yên tĩnh và không phát ra tiếng ồn.
- Bền và ổn định: SSD không bị ảnh hưởng bởi các va đập và rung động như
HDD, do không có bộ phận cơ học chạy bên trong. Điều này làm cho SSD có tuổi thọ
và độ ổn định cao hơn.
- Kích thước nhỏ gọn: SSD thường nhỏ gọn và nhẹ hơn so với HDD, điều này
làm cho chúng thích hợp cho các thiết bị di động như laptop và máy tính bảng.
- Tuổi thọ và khả năng chống sốc: Một số SSD chất lượng cao có tuổi thọ rất dài
và khả năng chống sốc tốt, giúp bảo vệ dữ liệu trong trường hợp va đập hoặc rung
động.
- Dung lượng đa dạng: SSD có sẵn trong nhiều dung lượng khác nhau, từ vài GB
đến nhiều TB, cho phép người dùng lựa chọn theo nhu cầu của họ.

Hình 2.15: Ổ đĩa SSD


* Dưới đây là cấu trúc vật lý của một ổ đĩa SSD tiêu chuẩn:

27
- Bộ nhớ Flash NAND: Đây là thành phần chính của SSD. Bộ nhớ flash NAND
chia thành các ô nhớ độc lập, mỗi ô nhớ chứa một số lượng bit dữ liệu. Các ô nhớ này
được sắp xếp thành các trang (pages) và khối (blocks).

Hình 2.16: Cấu trúc trên ổ đĩa SSD


+ Cấu trúc: Flash NAND thường được sản xuất và kết hợp thành các ô nhớ độc
lập, trong đó mỗi ô nhớ chứa một số lượng bit dữ liệu. Các ô nhớ này được tổ chức
thành các trang (pages) và khối (blocks). Trong quá trình ghi dữ liệu, dữ liệu được ghi
vào các trang, và khi cần, các trang được ghi đè lên để cập nhật dữ liệu.
+ Loại Flash NAND: Có nhiều loại Flash NAND khác nhau, bao gồm SLC
(Single-Level Cell), MLC (Multi-Level Cell), TLC (Triple-Level Cell), và QLC
(Quad-Level Cell). Loại Flash NAND cơ bản nhất là SLC, có độ bền và tốc độ cao
nhưng giá cả đắt đỏ. MLC, TLC và QLC có thể lưu trữ nhiều bit dữ liệu trên mỗi ô
nhớ, nhưng độ bền và tốc độ có thể giảm xuống theo chiều hướng ngược lại. MLC và
TLC thường được sử dụng trong các SSD cao cấp, trong khi QLC thường được sử
dụng trong các SSD tiết kiệm chi phí.
+ Tuổi thọ: Một trong những ưu điểm của Flash NAND là khả năng chịu được
số lần ghi/xóa dữ liệu (số lần đọc không giới hạn). Số lần ghi/xóa tối đa mà một ô nhớ
có thể chịu được phụ thuộc vào loại Flash NAND. SLC có tuổi thọ cao nhất, sau đó
đến MLC, TLC và QLC.
+ Hiệu suất: Loại Flash NAND và cách tổ chức ổ đĩa SSD có thể ảnh hưởng đến
hiệu suất. SLC và MLC thường có hiệu suất cao hơn so với TLC và QLC. Ngoài ra,
việc sử dụng bộ nhớ cache DRAM cũng có thể cải thiện hiệu suất của SSD.
+ Dung lượng: Flash NAND cho phép ổ đĩa SSD có dung lượng đa dạng, từ vài
GB đến nhiều TB.

28
- Trang (Pages): Các trang là đơn vị nhỏ nhất của dữ liệu trong NAND flash. Dữ
liệu được lưu trữ và truy cập bằng cách ghi hoặc đọc từ các trang này. Trong quá trình
ghi, dữ liệu có thể được ghi đè lên trang đã tồn tại.
- Khối (Blocks): Các trang được tổ chức thành các khối, thường chứa nhiều
trang. Khối là đơn vị của quá trình xóa và ghi dữ liệu. Khi cần ghi dữ liệu vào một
khối đã sử dụng, trước hết phải xóa toàn bộ khối rồi mới ghi dữ liệu vào.

Hình 2.17: Sơ đồ khối Blocks của ổ đĩa SSD


- Controller (Bộ Điều Khiển): Controller là một phần quan trọng của ổ đĩa SSD.
Nó quản lý các hoạt động đọc, ghi, xóa, và quản lý dữ liệu trên bộ nhớ flash NAND.
Controller điều khiển việc truy cập và sắp xếp dữ liệu vào các ô nhớ trên NAND.
+ Khi cần ghi dữ liệu mới vào một trang trong block, SSD không thể ghi trực
tiếp lên trang đó. Thay vào đó, SSD phải sao chép dữ liệu từ trang cũ sang trang mới
trong một block khác. Sau đó, SSD đánh dấu trang cũ như không còn sử dụng và ghi
dữ liệu mới vào trang mới.
+ Khi toàn bộ block đã sử dụng cần phải được xóa (để có các trang trống để ghi
dữ liệu mới), SSD không thể xóa một trang cụ thể. Thay vào đó, toàn bộ block phải
được xóa. Cơ chế này gọi là "garbage collection" (quá trình thu gom rác).
+ Trong quá trình garbage collection, dữ liệu từ các trang có dữ liệu hữu ích
được sao chép sang block khác, và block ban đầu được xóa. Các trang trống sau đó
được đánh dấu sẵn sàng cho việc ghi dữ liệu mới.
+ Để quản lý và thực hiện các hoạt động này, SSD sử dụng một controller thông
minh. Controller quản lý việc ghi, đọc, xóa, và quản lý dữ liệu trên bộ nhớ flash
NAND, đồng thời đảm bảo tính đồng bộ của dữ liệu.

29
- DRAM Cache (Bộ nhớ cache DRAM): Một số ổ đĩa SSD đi kèm với một bộ
nhớ cache DRAM, giúp tăng tốc quá trình đọc và ghi dữ liệu. Cache DRAM lưu trữ
dữ liệu tạm thời để giảm thiểu việc ghi trực tiếp vào NAND.

Hình 2.18: DRAM Cache của ổ đĩa SSD


* Một số điểm quan trọng về DRAM Cache trong SSD:
+ Tăng tốc độ đọc và ghi: DRAM Cache giúp cải thiện hiệu suất của SSD bằng
cách lưu trữ các dữ liệu thường xuyên được truy cập gần đây. Khi máy tính cần truy
cập dữ liệu này, SSD có thể nhanh chóng trả lại dữ liệu từ DRAM Cache thay vì phải
truy cập trực tiếp vào bộ nhớ NAND Flash, điều này giúp giảm thời gian truy cập và
tăng tốc độ làm việc.
+ Cải thiện hiệu năng ngẫu nhiên: DRAM Cache cũng cải thiện khả năng đọc và
ghi dữ liệu ngẫu nhiên, như khi bạn mở ứng dụng hoặc truy cập các tệp tin ngắn gọn.
+ Đảm bảo tính đồng bộ của dữ liệu: DRAM Cache có thể giữ các giao dịch đọc
và ghi đồng bộ, giúp đảm bảo tính nhất quán của dữ liệu. Điều này đặc biệt quan trọng
trong các tình huống mất điện hoặc sự cố hệ thống.
+ Dung lượng và loại DRAM Cache: Dung lượng của DRAM Cache có thể thay
đổi tùy thuộc vào mẫu và dung lượng của ổ đĩa SSD. Một số SSD có DRAM Cache
lớn hơn, trong khi các mẫu SSD tiết kiệm chi phí có thể sử dụng ít hoặc không sử
dụng DRAM Cache.
+ Điều chỉnh hiệu năng: Một số ổ đĩa SSD cho phép người dùng tùy chỉnh cách
sử dụng DRAM Cache để tối ưu hóa hiệu suất hoặc tiết kiệm năng lượng tùy theo mục
đích sử dụng cụ thể.
- Giao diện kết nối: Ổ đĩa SSD thường có một hoặc nhiều cổng kết nối để kết nối
với máy tính hoặc thiết bị khác. Các giao diện phổ biến cho SSD bao gồm SATA,
NVMe (PCIe), và M.2.

30
Hình 2.19: Chuẩn M.2 của ổ đĩa SSD
Hình 2.20: Chuẩn Sata của ổ đĩa SSD
SATA SSD:
+ Hiệu suất: SATA SSDs có hiệu suất ổn định nhưng giới hạn bởi tốc độ truyền
dữ liệu của giao diện SATA III, thường là khoảng 6 Gbps (gigabits mỗi giây).
+ Kích thước: SATA SSDs thường có kích thước và hình dạng tương tự như ổ
đĩa cứng HDD 2.5-inch.
+ Dung lượng: Có sẵn trong nhiều dung lượng từ vài GB đến nhiều TB.

+ Khả năng kết nối: Kết nối qua cổng SATA, phổ biến trên hầu hết các máy tính
để bàn và laptop.
NVMe (PCIe) SSD:
+ Hiệu suất: NVMe SSDs có hiệu suất cao hơn đáng kể so với SATA SSDs, vì
chúng kết nối trực tiếp với các khe cắm PCIe (Peripheral Component Interconnect
Express) trên bo mạch chủ, cung cấp tốc độ truyền dữ liệu cao hơn.
+ Kích thước: NVMe SSDs có thể có nhiều kích thước khác nhau, bao gồm các
card PCIe và các ổ đĩa 2.5-inch.
+ Dung lượng: Có sẵn trong nhiều dung lượng từ vài GB đến nhiều TB.
+ Khả năng kết nối: Kết nối trực tiếp với các khe cắm PCIe trên bo mạch chủ,
thường thông qua các card mở rộng PCIe hoặc các khe cắm M.2 trên bo mạch chủ.
M.2 SSD:

31
+ Hiệu suất: M.2 SSDs có hiệu suất cao và được thiết kế cho các thiết bị mỏng
nhẹ như laptop và máy tính bảng. M.2 hỗ trợ cả SATA và NVMe, vì vậy hiệu suất có
thể thay đổi tùy theo loại M.2 bạn sử dụng.
+ Kích thước: M.2 SSDs có kích thước nhỏ gọn và thường có dạng thanh mỏng.
Chúng được gắn trực tiếp vào các khe cắm M.2 trên bo mạch chủ hoặc sử dụng các
card chuyển đổi để kết nối với các khe cắm PCIe hoặc SATA.
+ Dung lượng: Có sẵn trong nhiều dung lượng từ vài GB đến nhiều TB.
+ Khả năng kết nối: Kết nối trực tiếp vào các khe cắm M.2 trên bo mạch chủ
hoặc sử dụng card chuyển đổi để kết nối với các khe cắm PCIe hoặc SATA.
- Ổ cứng (Housing): Thành phần này bao quanh các phần bên trong và bảo vệ ổ
đĩa SSD khỏi tác động môi trường bên ngoài. Housing thường được làm bằng kim loại
hoặc nhựa cứng.
Ổ cứng SSD Chuẩn giao tiếp Tốc độ đọc ghi Ưu điểm
Dễ nâng cấp từ ổ
SSD 2.5 SATA SATA SATA III 550MB/s
HDD cũ
Cổng giao tiếp thu
SSD mSATA mSATA SATA III 550MB/s
nhỏ
Phù hợp laptop
SSD M2 SATA M2 SATA SATA III 550MB/s
mỏng nhẹ
SSD M2 PCle M2 SATA Plce 3500MB/s Tốc độ nhanh
Bảng 2.1: Các chuẩn SSD thường gặp
* Quá trình đọc và ghi dữ liệu trên ổ đĩa SSD (Solid State Drive): khác biệt
so với ổ đĩa cứng HDD (Hard Disk Drive) vì SSD sử dụng công nghệ bộ nhớ flash
NAND thay vì đĩa quay cơ học. Dưới đây là quá trình cơ bản của đọc và ghi dữ liệu
trên SSD:
Đọc dữ liệu từ ổ đĩa SSD:
- Giao diện kết nối: Khi bạn yêu cầu đọc dữ liệu từ ổ đĩa SSD, hệ thống của bạn
thông qua giao diện kết nối (ví dụ: SATA, NVMe, M.2) gửi yêu cầu đến controller
của SSD.
- Controller: Controller của SSD là bộ điều khiển thông minh quản lý hoạt động
của ổ đĩa. Nó kiểm tra và xác định vị trí của dữ liệu cần đọc.
- Truy cập bộ nhớ NAND: Controller xác định vị trí của dữ liệu trong bộ nhớ
flash NAND, sau đó đọc dữ liệu từ các trang (pages) cụ thể trong NAND. SSD có thể
đọc từ nhiều trang cùng một lúc để tối ưu hóa hiệu suất.
- Đọc và chuyển dữ liệu: Dữ liệu được đọc từ NAND vào DRAM Cache (nếu
có) để tăng tốc độ đọc, sau đó nó được truyền từ DRAM Cache vào bộ nhớ hệ thống
của máy tính.

32
Ghi dữ liệu lên ổ đĩa SSD:
- Giao diện kết nối: Khi bạn yêu cầu ghi dữ liệu lên ổ đĩa SSD, hệ thống của bạn
thông qua giao diện kết nối gửi yêu cầu đến controller của SSD.
- Controller: Controller quản lý việc ghi dữ liệu trên ổ đĩa SSD. Nó kiểm tra vị
trí trống trên NAND Flash để lưu trữ dữ liệu mới.
- Xóa và ghi dữ liệu: Nếu không có trang trống sẵn sàng, controller phải xóa một
block (bao gồm nhiều trang) không còn sử dụng để tạo ra trang trống. Sau đó, dữ liệu
mới được ghi lên trang trống này.
- Cache DRAM (tùy chọn): Dữ liệu có thể được lưu trữ tạm thời trong cache
DRAM trước khi được ghi vào NAND để tối ưu hóa hiệu suất ghi. Cache DRAM giúp
tăng tốc độ ghi dữ liệu và quản lý tốt các hoạt động ghi ngẫu nhiên.
- Ghi và đánh dấu dữ liệu: Dữ liệu mới được ghi vào NAND Flash, và controller
đánh dấu nó như một phần của hệ thống tệp tin. Điều này giúp quản lý dữ liệu và đảm
bảo tính đồng bộ của nó.
* Blank Space trong ổ đĩa SSD:
- Trong SSD, blank space đề cập đến các trang (pages) trống trong bộ nhớ
NAND Flash. Đây là các trang chưa chứa dữ liệu hoặc đã bị xóa.
- Quản lý blank space trong SSD là một phần quan trọng của việc duy trì hiệu
suất và tuổi thọ của ổ đĩa. Khi bạn ghi dữ liệu mới vào SSD, dữ liệu không được ghi
trực tiếp vào blank space mà thay vào đó được sao chép vào các trang trống. Sau đó,
các trang trống ban đầu được xóa để sẵn sàng cho việc ghi dữ liệu mới.
- Blank space trong SSD được quản lý bởi bộ điều khiển của SSD, và việc hiệu
quả quản lý blank space có thể ảnh hưởng đến hiệu suất tổng thể của ổ đĩa.
* Các lỗi thường xảy ra trên ổ đĩa SSD và cách khắc phục
Lỗi Phần Cứng:
- Bad Blocks (Khối dữ liệu hỏng): Bad blocks là các phần của bộ nhớ NAND
trên SSD bị hỏng và không thể ghi hoặc đọc dữ liệu một cách đáng tin cậy.
+ Khắc phục: SSD thường đi kèm với các cơ chế tự điều chỉnh và tái phân
phối dữ liệu để ứng phó với bad blocks. Tuy nhiên, nếu lỗi này quá nghiêm trọng, bạn
nên xem xét thay thế SSD.
- Lỗi Controller: Controller trên SSD có thể gặp vấn đề, dẫn đến mất kết nối
hoặc lỗi trong quá trình truy cập dữ liệu.
+ Khắc phục: Cập nhật firmware cho SSD hoặc xem xét việc thay thế nếu
controller hỏng.
Lỗi Phần Mềm:

33
- File System Corruption (Lỗi Hệ thống Tệp tin): Hệ thống tệp tin trên SSD có
thể bị hỏng do ngắt điện đột ngột hoặc lỗi phần mềm.
+ Khắc phục: Sử dụng các công cụ như chkdsk trên Windows hoặc fsck trên
Linux để kiểm tra và sửa chữa hệ thống tệp tin.
- Lỗi OS Corruption (Lỗi Hệ điều hành): Hệ điều hành có thể bị hỏng hoặc gặp
vấn đề khi sử dụng với SSD.
+ Khắc phục: Cài đặt lại hoặc sửa chữa hệ điều hành. Đảm bảo bạn đã cập
nhật firmware cho SSD và các driver phù hợp.
- Lỗi Phần Mềm Ghi (Write-Related Software Issue): Các lỗi phần mềm có thể
gây ra sự cố khi ghi dữ liệu lên SSD, gây ra dữ liệu bị hỏng hoặc mất.
+ Khắc phục: Đảm bảo bạn sử dụng phần mềm ghi đáng tin cậy và cập nhật
phiên bản mới nhất.
- Lỗi Firmware (Firmware Issue):Firmware trên SSD có thể gặp lỗi hoặc có thể
cần cập nhật.
+ Khắc phục: Kiểm tra xem có bản cập nhật firmware mới nhất cho SSD
không và thực hiện cập nhật nếu cần.
- Lỗi Khi Đọc/Sao Lưu Dữ Liệu (Data Read/Backup Issue): Lỗi khi đọc hoặc sao
lưu dữ liệu từ SSD có thể gây mất dữ liệu hoặc lỗi.
+ Khắc phục: Thường thì việc đảm bảo sao lưu định kỳ và kiểm tra tính toàn
vẹn của dữ liệu có thể giúp đối phó với lỗi này.
Phân vùng trên ổ đĩa SSD (Solid State Drive): tương tự như trên HDD (Hard
Disk Drive) và có các loại và mục đích tương tự. Dưới đây là một số loại phân vùng
thường gặp trên ổ đĩa SSD và mục đích của chúng:
- Phân vùng hệ thống (System Partition): Đây là phân vùng chứa hệ điều hành và
các tệp tin cần thiết để khởi động máy tính. Phân vùng hệ thống thường được gắn
nhãn là "C:" và chứa hệ điều hành của bạn. Trên SSD, phân vùng hệ thống giúp tối ưu
hóa tốc độ boot và khởi động hệ thống.
- Phân vùng dữ liệu (Data Partition): Phân vùng dữ liệu được sử dụng để lưu trữ
các tệp tin cá nhân, tài liệu, ảnh, video, và dữ liệu khác của bạn. Bạn có thể tạo nhiều
phân vùng dữ liệu để tổ chức dữ liệu một cách hiệu quả.
- Phân vùng phục hồi (Recovery Partition): Một số máy tính và hệ điều hành có
thể có một phân vùng phục hồi được sử dụng để khôi phục hệ thống trong trường hợp
gặp sự cố. Phân vùng này thường chứa các tệp tin và công cụ cần thiết để khôi phục
lại hệ thống.

34
- Phân vùng sao lưu (Backup Partition): Bạn có thể tạo một phân vùng để lưu trữ
các bản sao lưu dự phòng của dữ liệu quan trọng. Điều này giúp bảo vệ dữ liệu của
bạn khỏi mất mát do lỗi phần cứng hoặc xóa không cẩn thận.
- Phân vùng ứng dụng (Application Partition): Bạn có thể tạo các phân vùng
riêng biệt cho các ứng dụng hoặc trò chơi để tối ưu hóa hiệu suất và quản lý không
gian lưu trữ.
- Phân vùng ẩn (Hidden Partition): Một số máy tính có thể có các phân vùng ẩn
không hiển thị trong trình quản lý đĩa, được sử dụng cho việc khôi phục hệ thống hoặc
các mục đích khác.
Quá trình boot từ ổ đĩa SSD (Solid State Drive): tương tự như quá trình boot
từ ổ đĩa HDD. Dưới đây là quá trình cơ bản khi bạn khởi động máy tính để boot từ ổ
đĩa SSD:
- Nhấn Nút Khởi Động (Power Button): Bắt đầu quá trình bằng cách nhấn nút
nguồn trên máy tính hoặc thiết bị tương tự.
- POST (Power-On Self-Test): Máy tính thực hiện POST để kiểm tra tình trạng
phần cứng như CPU, RAM, card đồ họa và các thiết bị khác. Nếu có lỗi nào được phát
hiện, máy tính có thể phát ra âm thanh cảnh báo hoặc hiển thị thông báo lỗi.
- BIOS/UEFI (Basic Input/Output System/Unified Extensible Firmware
Interface): BIOS hoặc UEFI là phần mềm nhúng trong bo mạch chủ của máy tính và
quyết định thiết bị khởi động tiếp theo. BIOS hoặc UEFI được cài đặt để chọn SSD
làm thiết bị khởi động.
- Boot Loader (Trình nạp khởi động): Máy tính tìm kiếm và nạp boot loader từ ổ
đĩa SSD. Boot loader thường nằm trong một phần của ổ đĩa gọi là MBR (Master Boot
Record) hoặc GPT (GUID Partition Table).
- Hệ Điều Hành:
+ Nếu sử dụng hệ điều hành Windows, boot loader sẽ nạp Boot Manager của
Windows. Từ đó, ta có thể chọn hệ điều hành cụ thể (nếu bạn cài đặt nhiều hệ điều
hành trên cùng một ổ đĩa).
+ Nếu bạn sử dụng một hệ điều hành Linux, boot loader sẽ nạp kernel của
Linux và khởi động hệ điều hành.
- Khởi Động Hệ Thống:
+ Hệ điều hành bắt đầu chạy các dịch vụ và tiến trình cần thiết để hoạt động.
+ Giao diện người dùng xuất hiện và có thể bắt đầu sử dụng máy tính.
2.4. So sánh ổ đĩa HDD và ổ đĩa SSD
Khía Cạnh Ổ Đĩa SSD Ổ Đĩa HDD

35
Nhanh hơn đáng kể so với
Hiệu suất đọc/Ghi dữ liệu ổ đĩa HDD, có thể đạt tốc Chậm hơn ổ đĩa SSD
độ tối đa
Nhanh, thường trong vài Chậm hơn, mất thời gian
Thời gian khởi động
giây đáng kể
Không tạo tiếng ồn, hoạt Quá trình quay đĩa có thể
Tiếng ồn
động yên tĩnh gây ra tiếng
Nhỏ nhẹ và mỏng, phù Lớn và nặng thường thiết
Kích thước và trọng luọng
hợp cho máy tính xách tay kế cho máy tính để bàn
Tiêu thụ ít năng lượng,
Tiêu hao nhiều năng
Tiết kiệm năng lượng kéo dài thời gian sử dụng
lượng
pin
Ít bị ảnh hưởng bởi va đập
Độ bền Dễ bị hỏng nếu va đập
hoặc chấn động
Có tuổi thọ lâu với số lần
Tuổi thọ Tuổi thọ thấp
đọc/ ghi dữ liệu nhiều
Đắt hơn so với ổ HDD
Giá cả Rẻ hơn ổ SSD
nếu cùng dung lượng
Dung lượng có sẵn đến Dung lượng có sẵn lên
Dung lượng lưu trữ
vài TB đến vài chục TB
Thích hợp các ứng dụng Thích hợp cho lưu trữ dữ
Sử dụng đối với lưu trữ
yêu cầu hiệu suất truy cập liệu lớn, ít đòi hỏi về hiệu
lâu dài
cao và nhanh suất cao
Bảng 2.2: So sánh ổ đĩa SSD và HDD
3. Hệ thống tệp tin (File Systems)
3.1 Giới thiệu chung về hệ thống tệp tin
File system (hệ thống tệp) là một phần mềm hoặc phần của hệ điều hành
(Operating System) được sử dụng để quản lý và tổ chức các tệp tin và thư mục trên
một thiết bị lưu trữ dữ liệu như ổ cứng, ổ đĩa flash, hoặc hệ thống mạng. Hệ thống tệp
đảm bảo rằng dữ liệu có thể lưu trữ, truy cập và quản lý một cách hiệu quả.

Các tính năng chính của hệ thống tệp bao gồm:


- Tạo, Xóa và Đổi Tên Tệp Tin và Thư Mục: Hệ thống tệp cho phép người dùng
tạo mới, xóa bỏ hoặc đổi tên các tệp và thư mục trên thiết bị lưu trữ.
- Quản Lý Quyền Truy Cập: Hệ thống tệp quản lý quyền truy cập vào tệp tin và
thư mục, xác định người dùng nào được phép đọc, ghi hoặc thực hiện các thao tác
khác trên chúng.
- Tổ Chức Dữ Liệu: Nó cho phép dữ liệu được tổ chức thành các thư mục và tệp
để dễ dàng tìm kiếm và quản lý.

36
- Quản Lý Vùng Trống: Hệ thống tệp theo dõi vùng trống trên thiết bị lưu trữ để
có thể lưu trữ dữ liệu mới.
- Xử Lý Đồng Thời: Cho phép nhiều ứng dụng và tiến trình truy cập và sử dụng
dữ liệu trên thiết bị lưu trữ một cách đồng thời.
- Tích Hợp Hệ Thống Bảo Mật: Bao gồm quản lý quyền truy cập và mã hóa dữ
liệu để đảm bảo tính bảo mật của tệp và thư mục.
* Một số kiểu hệ thống tệp tin (file system) phổ biến và các nét đặc trưng :
- Disk File System (Hệ thống Tệp Tin Ổ Đĩa): Đây là loại hệ thống tệp phổ biến
nhất và được sử dụng rộng rãi trên các thiết bị lưu trữ dữ liệu như ổ cứng và ổ đĩa
SSD. Ví dụ bao gồm NTFS (New Technology File System) cho Windows và ext4 cho

Linux.
Hình 3.1: Mối liên hệ giữa Disk và File System
- Special Purpose File System (Hệ thống Tệp Tin Đặc Biệt): Các hệ thống tệp tin
này được thiết kế để phục vụ mục đích cụ thể và không phải là hệ thống tệp thông
thường. Ví dụ, hệ thống tệp tin procfs trên Linux cung cấp truy cập vào thông tin về
tiến trình và tài nguyên hệ thống.
- Tape File System (Hệ thống Tệp Tin Băng Đĩa): Loại hệ thống này dành cho
việc lưu trữ dữ liệu trên băng đĩa. Dữ liệu thường được lưu trữ dưới dạng tuần tự và
có thời gian truy cập chậm hơn so với các hệ thống dựa trên đĩa.
- Flash File System (Hệ thống Tệp Tin Flash): Được sử dụng trên các thiết bị lưu
trữ dựa trên flash memory như USB drive, thẻ nhớ, hoặc ổ đĩa SSD. Mục tiêu là tối ưu
hóa việc ghi và xóa dữ liệu trên bộ nhớ flash để gia tăng tuổi thọ và hiệu suất.
- Database File System (Hệ thống Tệp Tin Cơ Sở Dữ Liệu): Một số hệ thống
quản lý cơ sở dữ liệu (DBMS) có hệ thống tệp riêng biệt để lưu trữ dữ liệu cơ sở dữ
liệu của họ. Ví dụ, Oracle sử dụng hệ thống tệp DBF để lưu trữ dữ liệu.
- Network File System (Hệ thống Tệp Tin Mạng): Cho phép truy cập dữ liệu từ
xa thông qua mạng. NFS (Network File System) là một ví dụ nổi tiếng, cho phép các
máy tính chia sẻ tệp tin và thư mục với nhau qua mạng.
37
- Share Disk File System (Hệ thống Tệp Tin Chia Sẻ Ổ Đĩa): Loại hệ thống tệp
tin này thường được sử dụng trong môi trường mạng để chia sẻ tệp và thư mục giữa
các máy tính. CIFS (Common Internet File System) hoặc SMB (Server Message
Block) là ví dụ phổ biến cho hệ thống tệp tin này.
* Hệ thống tệp tin ổ đĩa (Disk File System)
Hệ thống tệp tin ổ đĩa (Disk File System) là một loại hệ thống tệp tin được sử
dụng để quản lý và tổ chức các tệp tin và thư mục trên ổ đĩa lưu trữ dữ liệu, ổ cứng
hoặc ổ đĩa SSD. Hệ thống tệp tin này cho phép người dùng lưu trữ, truy cập và quản
lý dữ liệu trên thiết bị lưu trữ đó.
Một số hệ thống tệp tin ổ đĩa phổ biến bao gồm:
- NTFS (New Technology File System): Được sử dụng rộng rãi trên hệ điều
hành Windows, NTFS cung cấp nhiều tính năng bảo mật, quản lý dung lượng và phục
hồi dữ liệu.
- Ext4 (Fourth Extended File System): Đây là một hệ thống tệp tin phổ biến trên
hệ điều hành Linux. Ext4 cải thiện hiệu suất và độ tin cậy so với phiên bản trước đó
(ext3).
- FAT32 (File Allocation Table 32-bit): Một hệ thống tệp tin đơn giản được sử
dụng rộng rãi cho các ổ đĩa USB, thẻ nhớ và các thiết bị lưu trữ di động khác. Tuy
nhiên, bị giới hạn về kích thước tệp tin và dung lượng ổ đĩa hạn chế.
- HFS+ (Hierarchical File System Plus): Được sử dụng trên các máy tính Mac
trước khi hệ điều hành macOS chuyển sang hệ thống tệp APFS (Apple File System).
- ExFAT (Extended File Allocation Table): Một phiên bản mở rộng của FAT32,
được sử dụng chủ yếu cho các thiết bị lưu trữ di động và thẻ nhớ với hỗ trợ kích thước
tệp tin lớn hơn.
* Hệ thống tệp tin đặc biệt (Special Purpose File System):
Hệ thống tệp tin đặc biệt (Special Purpose File System) là các hệ thống tệp tin
được thiết kế để phục vụ một mục đích cụ thể hoặc giải quyết một vấn đề cụ thể, thay
vì hoạt động như hệ thống tệp tin tiêu chuẩn. Các loại hệ thống tệp tin đặc biệt này
thường không phải là phần của hệ thống tệp tin chính thống của hệ điều hành mà thay
vào đó được sử dụng bổ sung hoặc kèm theo.
Dưới đây là một số loại hệ thống tệp tin đặc biệt phổ biến:
/proc và /sys trên Linux: Đây là các hệ thống tệp tin ảo được sử dụng để truy cập
thông tin về tiến trình, tài nguyên hệ thống, và cấu hình kernel. Chúng cho phép người
dùng và các tiến trình đọc và thậm chí ghi thông tin về hệ thống.
/dev trên Linux: Thư mục /dev trên Linux chứa các tệp đặc biệt thể hiện các thiết
bị phần cứng như ổ đĩa, bàn phím, chuột và nhiều thiết bị khác dưới dạng tệp.

38
/procfs và /sysfs trên FreeBSD: Tương tự như Linux, FreeBSD cũng sử dụng các
hệ thống tệp tin ảo /procfs và /sysfs để truy cập thông tin hệ thống và cấu hình kernel.
/devfs trên FreeBSD: Giống như /dev trên Linux, /devfs trên FreeBSD dùng để
quản lý các tệp đặc biệt liên quan đến thiết bị phần cứng.
Hệ thống tệp tin /proc trên Windows: Windows cũng có một hệ thống tệp tin đặc
biệt gọi là \Device\PhysicalMemory, cho phép truy cập trực tiếp vào bộ nhớ vật lý của
máy tính.
/dev/random và /dev/urandom trên Unix-like systems: Các tệp này cung cấp truy
cập đến nguồn số ngẫu nhiên trong hệ thống, thường được sử dụng để tạo số ngẫu
nhiên trong ứng dụng mã hóa và bảo mật.
/mnt/ramfs trên Unix-like systems: Ramfs là một hệ thống tệp tin hoàn toàn dựa
trên bộ nhớ RAM và không lưu trữ dữ liệu trên đĩa cứng.
* Hệ thống tệp tin chia sẻ ổ đĩa (Share Disk File System)
Hệ thống tệp tin chia sẻ ổ đĩa (Share Disk File System) là loại hệ thống tệp tin
được sử dụng để chia sẻ tệp và thư mục giữa các máy tính và thiết bị trong một mạng
máy tính. Loại hệ thống tệp tin này cho phép nhiều máy tính truy cập và chia sẻ dữ
liệu một cách đồng thời, từ xa qua mạng, giúp tạo ra môi trường làm việc và chia sẻ
thông tin hiệu quả.
Dưới đây là một số loại hệ thống tệp tin chia sẻ ổ đĩa phổ biến:
- Server Message Block (SMB) / Common Internet File System (CIFS): Đây là
một trong những giao thức chia sẻ tệp tin phổ biến nhất. SMB thường được sử dụng
trong môi trường Windows và được hỗ trợ trên các hệ điều hành khác nhau như Linux
và macOS thông qua CIFS.
- Network File System (NFS): NFS là một giao thức chia sẻ tệp tin phổ biến
trong môi trường Linux và UNIX. Nó cho phép các máy tính chia sẻ tệp tin và thư
mục trong mạng.

- Apple Filing Protocol (AFP): AFP được phát triển bởi Apple và được sử dụng
chủ yếu trong môi trường macOS và OS X để chia sẻ tệp tin và máy chủ in qua mạng.
- Server Network Block Device (NBD): NBD cho phép máy chủ chia sẻ các khối
dữ liệu (block data) với các máy khách qua mạng. Nó thường được sử dụng trong các
môi trường ảo hóa.
- iSCSI (Internet Small Computer System Interface): iSCSI cho phép máy tính
kết nối và sử dụng các ổ đĩa từ xa qua mạng dưới dạng các thiết bị lưu trữ đích thực.

39
- WebDAV (Web-based Distributed Authoring and Versioning): WebDAV là
một giao thức cho phép truy cập và quản lý tệp và thư mục qua mạng, thường được sử
dụng cho việc chia sẻ dữ liệu qua HTTP hoặc HTTPS.
3.2. Hệ thống tệp tin Windows (Windows File Systems)
Windows File Systems là các hệ thống tệp tin được sử dụng trong các phiên bản
hệ điều hành Windows của Microsoft. Windows hỗ trợ một số hệ thống tệp tin khác
nhau theo thời gian, nhưng hai hệ thống tệp tin chính được sử dụng trong các phiên
bản Windows hiện đại là NTFS (New Technology File System) và FAT/FAT32 (File
Allocation Table).
* FAT/FAT32 (File Allocation Table): FAT và FAT32 là hệ thống tệp tin đơn
giản hơn và ít phức tạp hơn. FAT32 là phiên bản mở rộng của FAT16. Chúng thường
được sử dụng trên các thiết bị lưu trữ như thẻ nhớ, USB drive và ổ đĩa cứng di động.
FAT (File Allocation Table):
- FAT16: Đây là phiên bản gốc của FAT và được sử dụng trong các phiên bản
ban đầu của hệ điều hành Windows. FAT16 có giới hạn về kích thước tệp tin và dung
lượng ổ đĩa.
- Định dạng đơn giản: Hệ thống tệp tin FAT sử dụng một bảng (FAT) để theo
dõi các vùng của ổ đĩa và cách chúng được sử dụng bởi các tệp và thư mục.
- Hỗ trợ hạn chế: FAT không hỗ trợ nhiều tính năng bảo mật như quyền truy cập
hoặc mã hóa dữ liệu. Nó cũng không hỗ trợ dung lượng lớn và tệp tin lớn.
FAT32 (File Allocation Table 32):
- Mở rộng của FAT16: FAT32 là một phiên bản cải tiến của FAT16, được phát
triển để giải quyết các hạn chế về kích thước tệp và dung lượng ổ đĩa của FAT16.
- Hỗ trợ dung lượng lớn hơn: FAT32 hỗ trợ ổ đĩa và tệp tin lớn hơn so với
FAT16. Nó cho phép sử dụng ổ đĩa có dung lượng lên đến vài TB và tệp tin có kích
thước tối đa là nhiều GB.
- Khả năng tương thích: FAT32 được hỗ trợ trên nhiều hệ điều hành, bao gồm
Windows, Linux và macOS. Điều này làm cho nó trở thành một lựa chọn tốt để sử
dụng trên các thiết bị lưu trữ di động như thẻ nhớ và USB drive, vì nó có tính tương
thích rộng rãi.
- Đặc điểm: Tương tự như FAT16, FAT32 sử dụng bảng FAT để theo dõi vùng
lưu trữ trên ổ đĩa, nhưng với 32-bit để có thêm không gian để quản lý tệp và dung
lượng ổ đĩa lớn hơn.
Layout của FAT file system bao gồm các thành phần chính sau:
- Boot Sector (Sector 0): Sector đầu tiên của ổ đĩa chứa thông tin cơ bản về hệ
thống tệp và hướng dẫn cách truy cập các phần khác của hệ thống tệp. Thông tin này

40
bao gồm mã đánh dấu hệ thống là FAT12, FAT16 hoặc FAT32, kích thước sector, số
lượng reserved sector, số lượng FATs, và nhiều thông tin khác.
- Reserved Sectors (Reserved Area): Sau boot sector, có một số sector được dành
riêng để chứa các thông tin quan trọng như bản sao boot sector thứ hai và thông tin về
hệ thống.
- File Allocation Table (FAT): Các bảng FAT chứa thông tin về cách các cluster
(đơn vị cơ bản của dữ liệu trong FAT) được sử dụng để lưu trữ các tệp tin và thư mục.
Có ít nhất một bảng FAT trong hệ thống FAT, nhưng có thể có nhiều bảng FAT dự
phòng để đảm bảo tính toàn vẹn dữ liệu.
- Root Directory (FAT12 và FAT16): Root directory chứa thông tin về các tệp
tin và thư mục cấp cao nhất trên ổ đĩa. Trong hệ thống FAT32, root directory được
thay thế bằng một tệp tin đặc biệt được gọi là "dot" (.) nằm ở một thư mục cấp cao
nhất.
- Data Area: Phần này chứa dữ liệu thực sự của các tệp tin và thư mục. Dữ liệu
được chia thành các cluster có kích thước cố định và được liên kết thông qua bảng
FAT để tạo ra các tệp tin và thư mục.
- Cluster: Cluster là đơn vị cơ bản của dữ liệu trong hệ thống FAT. Kích thước
của mỗi cluster được xác định bởi loại FAT (FAT12, FAT16 hoặc FAT32) và kích
thước sector. Mỗi tệp tin và thư mục được cấu thành từ một hoặc nhiều cluster.

Hình 3.2: Hình ảnh Layout của FAT


* Cấu trúc hệ thống tệp tin FAT (File Allocation Table):
Folder structure của hệ thống tệp tin FAT (File Allocation Table) bao gồm các
trường thông tin sau đây cho mỗi tệp tin hoặc thư mục:
- Filename (Tên tệp): Trường này lưu trữ tên của tệp hoặc thư mục.

41
- Extension (Phần mở rộng): Trường phần mở rộng thường chỉ tồn tại trong tên
tệp (không bắt buộc). Nó thường được sử dụng để xác định loại tệp (ví dụ: ".txt" cho
tệp văn bản).
- Attributes (Thuộc tính): Trường này chứa thông tin về thuộc tính của tệp hoặc
thư mục, bao gồm thông tin như chỉ đọc, ẩn, hệ thống, và thư mục.
- Reserved (Trường dành riêng): Trường này dành cho mục đích mở rộng và
không sử dụng trong FAT12 và FAT16. Tuy nhiên, nó có thể chứa thông tin quan
trọng trong phiên bản FAT32 mở rộng.
- Create Time (Thời gian tạo): Trường này chứa thời gian tạo của tệp hoặc thư
mục.
- Create Date (Ngày tạo): Trường này chứa ngày tạo của tệp hoặc thư mục.
- Last Access Date (Ngày truy cập lần cuối): Trường này chứa ngày cuối cùng
mà tệp hoặc thư mục đã được truy cập.
- First Cluster (Cluster đầu tiên): Trường này chứa thông tin về cluster đầu tiên
của tệp hoặc thư mục trong bảng FAT. Nó xác định vị trí bắt đầu của dữ liệu tệp hoặc
thư mục trên ổ đĩa.
- Last Modified Time (Thời gian sửa đổi lần cuối): Trường này chứa thời gian
lần cuối cùng mà nội dung tệp hoặc thư mục đã được sửa đổi.
- Last Modified Date (Ngày sửa đổi lần cuối): Trường này chứa ngày lần cuối
cùng mà nội dung tệp hoặc thư mục đã được sửa đổi.
- File Size (Kích thước tệp): Trường này chứa kích thước của tệp hoặc thư mục,
được tính bằng byte.

42
Hình 3.3: Hình ảnh cấu trúc hệ thống tệp tin của FAT
* Boot sector (sector khởi động) của một phân vùng FAT (File Allocation
Table) là một phần quan trọng của cấu trúc hệ thống tệp tin FAT. Nó chứa thông tin
cơ bản về hệ thống tệp và hướng dẫn cách truy cập các phần khác của hệ thống tệp.
Boot Sector (Sector Khởi Động):
- Vị trí: Boot sector nằm ở sector đầu tiên của một phân vùng FAT. Trong hệ
thống FAT32, sector khởi động này thường được gọi là Sector 0.
- Thông tin cơ bản: Boot sector chứa các thông tin quan trọng như kích thước
sector, số lượng reserved sector, số lượng FATs (bảng FAT), và loại hệ thống tệp FAT
(FAT12, FAT16 hoặc FAT32). Nó cũng chứa mã đánh dấu hệ thống là FAT để xác
định loại hệ thống tệp.
Quá Trình Khởi Động Boot Sector:
- Khởi động máy tính: Khi bật hoặc khởi động lại máy tính, máy tính sẽ thực
hiện một loạt các bước để khởi động hệ điều hành. Một phần của quá trình này bao
gồm việc nạp boot sector từ phân vùng khởi động (thường là ổ đĩa chứa hệ điều hành)
vào bộ nhớ.

43
- Đọc boot sector: Máy tính sẽ đọc sector khởi động từ ổ đĩa và nạp nó vào bộ
nhớ.
- Xác định hệ thống tệp: Boot sector chứa mã đánh dấu hệ thống tệp, cho biết
loại hệ thống tệp (FAT12, FAT16 hoặc FAT32). Hệ điều hành sẽ đọc mã này để xác
định cách truy cập và quản lý tệp tin trên ổ đĩa.
- Tìm hệ thống tệp chính: Sau khi xác định loại hệ thống tệp, hệ điều hành sẽ tìm
và đọc bảng FAT và root directory (đối với FAT12 và FAT16) hoặc tệp tin đặc biệt
(đối với FAT32) để tìm tệp tin chính của hệ thống.
- Khởi động hệ thống tệp: Cuối cùng, hệ điều hành sẽ khởi động hệ thống tệp và
các dịch vụ liên quan để thực hiện các nhiệm vụ của nó, cho phép bạn tương tác với
máy tính.
* NTFS (New Technology File System): NTFS là viết tắt của "New
Technology File System," là một hệ thống tệp tin được phát triển bởi Microsoft và
được sử dụng rộng rãi trên các hệ điều hành Windows hiện đại. NTFS đã thay thế hệ
thống tệp tin FAT (File Allocation Table) gốc và FAT32 trước đây, mang lại nhiều cải
tiến về hiệu suất, tính năng, và bảo mật.
Đặc điểm quan trọng củ hệ thống tệp tin NTFS:
- Hỗ trợ Dung Lượng Lớn: NTFS hỗ trợ ổ đĩa và tệp tin có kích thước lớn hơn so
với các phiên bản trước của hệ thống tệp FAT. Điều này cho phép lưu trữ và quản lý
dữ liệu trên các ổ đĩa có dung lượng lớn hơn, đến vài petabyte.
- Quản Lý Quyền Truy Cập: NTFS cung cấp tính năng quản lý quyền truy cập
mạnh mẽ, cho phép người quản trị hệ thống xác định ai được phép truy cập, đọc, ghi,
hoặc thực hiện các thao tác khác trên tệp và thư mục.
- Mã Hóa Dữ Liệu: NTFS hỗ trợ mã hóa dữ liệu bằng BitLocker, giúp bảo vệ dữ
liệu trên ổ đĩa khỏi truy cập trái phép.
- Phục Hồi Dữ Liệu: NTFS cung cấp khả năng phục hồi dữ liệu từ các tệp tin đã
xóa và hỗ trợ khả năng sao lưu tệp hệ thống.
- Ghi Chú Cấu Trúc Dữ Liệu: NTFS lưu trữ nhiều thông tin về tệp và thư mục,
bao gồm thời gian tạo, thời gian truy cập, thời gian sửa đổi, quyền truy cập và nhiều
thông tin khác.
- Tích Hợp Sự Kiện: NTFS có khả năng tích hợp với sự kiện hệ thống để theo
dõi và ghi lại các hoạt động trên hệ thống tệp.
- Tương Thích: NTFS là một hệ thống tệp tin phổ biến và được hỗ trợ trên các
phiên bản Windows hiện đại, bao gồm Windows NT, 2000, XP, Vista, 7, 8, 10 và các
phiên bản Windows Server tương ứng.

44
* Kiến trúc NTFS (New Technology File System) là cấu trúc bên trong hệ
thống tệp tin NTFS, mô tả cách NTFS tổ chức và quản lý dữ liệu trên ổ đĩa. Dưới đây
là một số khía cạnh quan trọng của kiến trúc NTFS:
- Mã Hóa Mức Độ Tệp: NTFS chia dữ liệu thành các thửa đất, mỗi thửa đất chứa
một hoặc nhiều tệp tin hoặc thư mục. Mỗi tệp tin được chia thành các phần đọc hiện
dấu, và dữ liệu của mỗi phần được mã hóa riêng lẻ. Điều này cho phép NTFS giải
quyết vấn đề mất dữ liệu trong trường hợp một phần của tệp bị hỏng.
- Bảng File Allocation (Bảng FAT): NTFS không sử dụng cấu trúc FAT giống
như các phiên bản FAT trước đây. Thay vào đó, nó sử dụng Bảng File Allocation (File
Allocation Table), nhưng kiến trúc này khá khác biệt và phức tạp hơn so với phiên bản
FAT truyền thống.
- Phân Đoạn: NTFS sử dụng một kiến trúc gọi là phân đoạn để quản lý không
gian đĩa. Các phân đoạn có thể chứa dữ liệu thực sự hoặc dự phòng cho tệp tin và thư
mục. Mỗi phân đoạn được quản lý bằng một bảng phân đoạn.
- Mã Hóa Dữ Liệu: NTFS hỗ trợ mã hóa dữ liệu bằng cách sử dụng BitLocker.
BitLocker cho phép bạn mã hóa toàn bộ ổ đĩa hoặc chỉ một phần của nó để bảo vệ dữ
liệu khỏi truy cập trái phép.
- Quản Lý Quyền Truy Cập: NTFS hỗ trợ quản lý quyền truy cập dựa trên các
quyền đọc, ghi, thực thi và điều khiển. Người quản trị hệ thống có thể xác định ai
được phép truy cập và thực hiện thao tác trên tệp tin và thư mục.
- Ghi Chú Cấu Trúc Dữ Liệu: NTFS ghi chú cấu trúc dữ liệu của mỗi tệp tin và
thư mục, bao gồm thông tin như thời gian tạo, thời gian truy cập, thời gian sửa đổi và
quyền truy cập.
- Phục Hồi Dữ Liệu: NTFS có khả năng phục hồi dữ liệu từ các tệp tin đã xóa và
hỗ trợ khả năng sao lưu tệp hệ thống để khôi phục hệ thống sau sự cố.
* Một số tệp hệ thống quan trọng của NTFS (NTFS System Files): được lưu
trữ trong thư mục gốc (root directory) của phân vùng NTFS hoặc trong các thư mục
con cụ thể.
$AttrDef (Attribute Definitions): Đây là tệp chứa các định nghĩa thuộc tính
(attributes) mà NTFS sử dụng cho các tệp và thư mục.
$BadClus (Bad Cluster File): Tệp này chứa danh sách các cluster trên ổ đĩa bị
hỏng hoặc không thể sử dụng.
$Bitmap (Bitmap File): Tệp này lưu trữ một bản đồ bitmap của tất cả các cluster
trên phân vùng NTFS. Nó thường được sử dụng để theo dõi trạng thái của từng
cluster, xác định cluster trống và đã sử dụng.
$Boot (Boot Sector File): Chứa thông tin cơ bản về boot sector của phân vùng
NTFS, giúp máy tính khởi động hệ điều hành.

45
$LogFile (Log File): Tệp nhật ký chứa thông tin về các hoạt động trên ổ đĩa
NTFS. Nó được sử dụng để đảm bảo tính nhất quán của hệ thống tệp tin trong trường
hợp sự cố.
$MFT (Master File Table): Đây là bảng quản lý tất cả các tệp tin và thư mục trên
phân vùng NTFS. Nó được coi là "bảng điều khiển" cho hệ thống tệp tin NTFS.
$MFTMirr (MFT Mirror): Là một bản sao lưu của MFT, giữ lại thông tin quan
trọng về hệ thống tệp tin. Nó được sử dụng để khôi phục MFT trong trường hợp hỏng
hóc.
$Quota (Quota File): Được sử dụng để theo dõi và quản lý hạn ngạch (quota)
cho người dùng hoặc nhóm người dùng trên phân vùng NTFS.
$UpCase (Upcase Table): Chứa bản sao của bảng chuyển đổi ký tự cho tất cả các
ký tự in thường sang ký tự in hoa và ngược lại.
$Volume (Volume Information): Tệp này chứa thông tin về phân vùng NTFS,
bao gồm tên, dung lượng, số serial, và nhiều thông tin khác.
* NTFS partition boot sector (sector khởi động phân vùng NTFS) là một phần
quan trọng của phân vùng NTFS (New Technology File System) trên ổ đĩa. Nó nằm ở
đầu của mỗi phân vùng NTFS và chứa thông tin cơ bản về hệ thống tệp và hướng dẫn
cách truy cập các phần khác của hệ thống tệp NTFS.
* Master File Table (MFT): là một phần quan trọng của hệ thống tệp tin NTFS
(New Technology File System). Đây là một cấu trúc dữ liệu quan trọng chứa thông tin
về tất cả các tệp tin và thư mục trên phân vùng NTFS.
Một số thông tin chi tiết về Master File Table (MFT):
- Chức Năng Chính: MFT hoạt động như một bảng điều khiển toàn bộ hệ thống
tệp tin NTFS. Nó lưu trữ thông tin về tất cả các tệp tin và thư mục trên ổ đĩa NTFS,
bao gồm cả tệp tin hệ thống quan trọng.
- Mức Độ Quản Lý Chi Tiết: MFT chứa các bản ghi, gọi là MFT entries, cho
mỗi tệp và thư mục. Mỗi MFT entry bao gồm các thông tin như tên tệp, quyền truy
cập, vị trí trên đĩa, kích thước, ngày giờ tạo và sửa đổi, và nhiều thông tin khác.
- Số Thứ Tự (Sequence Number): Mỗi MFT entry được xác định bằng một số
thứ tự duy nhất gọi là MFT reference number (hoặc Record Number). Số thứ tự này là
duy nhất trên toàn bộ phân vùng NTFS.
- Phân Vùng MFT Mirror: NTFS thường duy trì một bản sao gọi là MFT Mirror
(MFTMirr) để bảo đảm tính nhất quán của MFT trong trường hợp hỏng hóc. MFT
Mirror nằm ở một vị trí khác nhau trên đĩa so với MFT, giúp khôi phục MFT nếu cần
thiết.

46
- Kích Thước Động: Kích thước của MFT có thể thay đổi động theo thời gian
khi tệp tin và thư mục mới được tạo hoặc xóa. MFT được quản lý bởi hệ thống và có
khả năng mở rộng khi cần.
- Cấu Trúc Phân Đoạn: MFT thường được chia thành nhiều phân đoạn
(segments) để quản lý dữ liệu một cách hiệu quả. Cấu trúc phân đoạn này giúp NTFS
tối ưu hóa việc quản lý và truy cập dữ liệu trong MFT.
- Dữ Liệu Mặc Định: MFT cũng chứa các thông tin về các tệp tin hệ thống quan
trọng như $MFT và $MFTMirr, làm cho nó trở thành một phần quan trọng của quá
trình khởi động của hệ thống.
* So sánh hệ thống tệp tin NTFS và FAT:
Tính chất FAT NTFS
Hiệu suất tốt hơn, đặc biệt
Hiệu suất Hiệu suất thấp hơn
trên các ổ đĩa và tệp lớn
Hạn chế về kích thước và Hỗ trợ ổ đĩa và tệp tin lớn
Dung lượng tối đa
tệp tin (2TB cho FAT32) (đến vài petabyte)
Hạn chế quản lý quyền Hỗ trợ quản lý quyền truy
Quản Lý Quyền Truy Cập truy cập với quyền chỉ cập chi tiết với nhiều
đọc/ghi quyền khác nhau
Thấp, không hỗ trợ mã Cao, hỗ trợ mã hóa dữ liệu
Bảo Mật
hóa dữ liệu bằng BitLocker
Khả Năng Phục Hồi Dữ Thường khó khăn và Hỗ trợ phục hồi dữ liệu từ
Liệu không tin cậy các tệp tin đã xóa
Hỗ trợ metadata phong
Metadata và Tính Năng Giới hạn metadata và tính
phú và nhiều tính năng
Nâng Cao năng
nâng cao
Tương thích với nhiều hệ
Tương Thích Hệ Thống Tương thích chủ yếu với
điều hành, như Windows,
Đa Nền Windows
macOS, Linux
Tiêu Chuẩn FAT12, FAT16, FAT32 NTFS
Quản lý dung lượng hiệu
Quản Lý Dung Lượng Dễ dàng xảy ra fragment
quả hơn
Bảng 3.1: So sánh hệ thống tệp tin NTFS và FAT
* Mã hóa và giải mã dữ liệu trên FAT/NTFS
- Mã Hóa và Giải Mã Dữ Liệu trên NTFS:
+ BitLocker: BitLocker là một công cụ mã hóa dữ liệu tích hợp trong hệ điều
hành Windows. Nó cho phép bạn mã hóa toàn bộ ổ đĩa hoặc một phần của nó bằng
cách sử dụng mã hóa AES (Advanced Encryption Standard). Khi BitLocker được kích
hoạt, dữ liệu trên ổ đĩa sẽ được mã hóa và chỉ có thể được giải mã bằng cách sử dụng
mật khẩu hoặc một thiết bị USB đặc biệt.

47
+ EFS (Encrypting File System): EFS cho phép bạn mã hóa và giải mã các tệp
tin và thư mục cụ thể trên NTFS. Có thể chọn mã hóa hoặc giải mã tệp tin bằng cách
sử dụng thuộc tính "Encrypt" trong thuộc tính tệp tin. Để giải mã, bạn cần có khóa mã
hóa EFS hoặc chứng chỉ được liên kết với tệp tin đó.
- Mã Hóa và Giải Mã Dữ Liệu trên FAT:
+ Mã Hóa Cấp Độ Hệ Thống: FAT12, FAT16 và FAT32 không hỗ trợ mã hóa
dữ liệu cấp độ hệ thống. Điều này có nghĩa rằng là không thể thực hiện mã hóa toàn
bộ phân vùng FAT trực tiếp từ hệ thống tệp tin.
+ Mã Hóa Cấp Ứng Dụng: Để bảo vệ dữ liệu trên FAT, có thể sử dụng các
phần mềm mã hóa cấp ứng dụng bên ngoài, ví dụ như các công cụ mã hóa tệp tin
riêng biệt. Các công cụ này mã hóa dữ liệu trước khi lưu trữ nó trên ổ đĩa và giải mã
nó khi cần truy cập.
3.3. Hệ thống tệp tin Linux (Linux File Systems)
Linux file system (hệ thống tệp tin Linux) là cách mà hệ điều hành Linux quản lý
và tổ chức dữ liệu trên ổ đĩa và các thiết bị lưu trữ khác. Hệ thống tệp tin Linux được
thiết kế để cung cấp một cách hiệu quả và đáng tin cậy để lưu trữ và quản lý tệp tin và
thư mục. Có nhiều hệ thống tệp tin khác nhau được sử dụng trong các phiên bản Linux
khác nhau, nhưng một số phổ biến bao gồm:
- Ext2 (Extended File System 2) là một hệ thống tệp tin được sử dụng trong các hệ
thống Linux cũ hơn. Nó là phiên bản tiếp theo của Ext (Extended File System), và đã
được thiết kế để cải thiện hiệu suất và tính ổn định so với Ext ban đầu.
- Ext3 (Third Extended File System): Ext3 là một phiên bản trước của Ext4 và vẫn
được sử dụng trong một số hệ thống Linux. Nó cung cấp tính ổn định và khả năng
phục hồi sau sự cố.
- Ext4 (Fourth Extended File System): Ext4 là hệ thống tệp tin mặc định cho nhiều
phiên bản Linux hiện đại. Nó cung cấp hiệu suất tốt, tính bền vững và hỗ trợ tệp tin
lớn và ổ đĩa lớn.
- Btrfs (B-tree File System): Btrfs là một hệ thống tệp tin mới có tích hợp các tính
năng tiên tiến như công cụ snapshot, sao lưu dự phòng, và kiểm tra dữ liệu.
- XFS (X File System): XFS là một hệ thống tệp tin được phát triển ban đầu bởi
Silicon Graphics, Inc. (SGI) và sau đó được tích hợp vào nhiều phiên bản Linux. Nó
thường được sử dụng cho các ổ đĩa lớn và yêu cầu hiệu suất cao.
- ZFS (Zettabyte File System): ZFS là một hệ thống tệp tin mạnh mẽ có tích hợp
khả năng quản lý lưu trữ và kiểm tra dữ liệu.
3.3.1 Ext2, Ext3 và Ext4
* Ext2 (Extended File System 2):

48
- Cấu Trúc:
+ Thư mục gốc: Là thư mục cao nhất trong cây thư mục.
+ Tệp tin: Là dữ liệu được lưu trữ trong các thư mục.
+ Group Descriptor: Một bảng chứa thông tin về các nhóm (group) của các
khối dữ liệu.
+ Inode Table: Bảng chứa thông tin về tất cả các inode (index node) trong hệ
thống tệp tin.
+ Data Blocks: Là các khối dữ liệu thực tế chứa nội dung của tệp tin và thư
mục.
- Phân Loại:
+ Ext2 là một hệ thống tệp tin không journaling, nghĩa là nó không duy trì
một journal để ghi lại các thay đổi trước khi áp dụng chúng. Điều này có thể dẫn đến
mất dữ liệu trong trường hợp máy tính bị tắt đột ngột hoặc sự cố.
* Ext3 (Extended File System 3):
- Cấu Trúc:
+ Ext3 là một phiên bản nâng cấp của Ext2 và sử dụng cùng một cấu trúc cơ
bản.
+ Một tính năng quan trọng của Ext3 là nó bao gồm một journal để ghi lại các
thay đổi trước khi chúng được áp dụng vào hệ thống tệp tin. Điều này làm tăng tính ổn
định và khả năng phục hồi sau sự cố.
- Phân Loại:
+ Ext3 là một hệ thống tệp tin journaling, giúp đảm bảo tính nhất quán của hệ
thống tệp tin trong trường hợp máy tính gặp sự cố.
* Ext4 (Extended File System 4):
- Cấu Trúc:
+ Ext4 là phiên bản tiếp theo của Ext3 và sử dụng một cấu trúc cơ bản tương
tự như Ext2 và Ext3.
+ Đã được cải tiến về hiệu suất và hỗ trợ tối ưu hóa dung lượng lưu trữ lớn
hơn.
- Phân Loại:
+ Ext4 là một hệ thống tệp tin journaling, với các cải tiến về hiệu suất và hỗ
trợ dung lượng lưu trữ lớn hơn. Nó là một lựa chọn phổ biến cho hệ thống Linux hiện
đại.

49
3.3.2. XFS và ZFS
* XFS (X File System):
- Đặc Điểm Quan Trọng:
+ Hiệu Suất Cao: XFS được thiết kế với hiệu suất cao, đặc biệt là trong việc
xử lý các tệp tin lớn và hoạt động I/O tập trung.
+ Khả Năng Mở Rộng: XFS hỗ trợ dung lượng lưu trữ lớn và khả năng mở
rộng trên nhiều ổ đĩa và phân vùng.
+ Journaling: Nó sử dụng journaling để bảo vệ tính nhất quán của hệ thống
tệp tin trong trường hợp sự cố.
+ Khả Năng Phục Hồi: XFS có khả năng phục hồi dữ liệu sau sự cố tốt và có
công cụ xfs_repair để kiểm tra và sửa chữa hệ thống tệp tin.
- Cấu Trúc:
+ Superblock: Chứa thông tin quan trọng về hệ thống tệp tin, như kích thước
khối, số lượng inode, và vị trí journal.
+ Inode: Mỗi inode chứa thông tin về một tệp tin hoặc thư mục cụ thể, bao
gồm quyền truy cập, kích thước, và vị trí dữ liệu.
+ Data Blocks: Là các khối dữ liệu thực tế chứa nội dung của tệp tin và thư
mục.
+ Journal: Là một phần quan trọng của XFS, ghi lại các thay đổi trước khi
chúng được áp dụng vào hệ thống tệp tin. Điều này giúp đảm bảo tính nhất quán và
khả năng phục hồi.
* ZFS (Zettabyte File System):
- Đặc Điểm Quan Trọng:
+ Tích Hợp Quản Lý Dung Lượng Và Mã Hóa: ZFS kết hợp quản lý dung
lượng lưu trữ và mã hóa dữ liệu trong một hệ thống tệp tin duy nhất.
+ Hiệu Suất Cao: Mặc dù ZFS được thiết kế với sự chú trọng vào tính an toàn
và độ tin cậy, nó cũng cung cấp hiệu suất cao cho các tác vụ I/O.
+ Snapshot và Deduplication: ZFS hỗ trợ chức năng snapshot (ảnh chụp) để
sao lưu dữ liệu và deduplication (loại bỏ trùng lặp) để tiết kiệm dung lượng lưu trữ.
- Cấu Trúc:
+ Pool: ZFS sử dụng khái niệm "pool" để quản lý dung lượng lưu trữ. Một
pool có thể bao gồm nhiều ổ đĩa và phân vùng.

50
+ Dataset: Dataset tương đương với thư mục hoặc tệp tin trong các hệ thống
tệp tin khác. Các dataset có thể chứa dữ liệu hoặc các snapshot.
+ Snapshot: Là một bản sao đóng băng của một dataset tại một thời điểm cụ
thể. Snapshot có thể sử dụng để sao lưu và phục hồi dữ liệu.
+ Zvol: Là một loại dataset đặc biệt được sử dụng để tạo thiết bị lưu trữ ảo (ví
dụ: ổ đĩa ảo) cho máy ảo.
3.3.3. Mã hóa dữ liệu của File Systems trên Linux
File system của Linux có thể được mã hóa sử dụng các công nghệ mã hóa dựa
trên các lớp khác nhau của hệ thống, từ cơ bản như mã hóa một phân vùng hoặc thư
mục đến mã hóa toàn bộ hệ thống tệp tin. Dưới đây là một số phương pháp mã hóa
phổ biến cho hệ thống Linux:
- LUKS (Linux Unified Key Setup):
+ LUKS là một tiêu chuẩn mã hóa cho Linux, cho phép bạn tạo các phân vùng
mã hóa và sử dụng mật khẩu hoặc khóa để truy cập chúng.
+ LUKS hoạt động trên cấp phân vùng và cho phép bạn mã hóa toàn bộ phân
vùng hoặc chỉ một thư mục cụ thể nếu bạn muốn.
+ Các tiện ích như "cryptsetup" được sử dụng để quản lý phân vùng được mã
hóa bằng LUKS.
- eCryptFS:
+ eCryptFS là một hệ thống tệp tin mã hóa mức thư mục, cho phép bạn mã
hóa các thư mục cụ thể trên hệ thống tệp tin.
+ Điều này có nghĩa là bạn có thể mã hóa các tệp tin và thư mục cụ thể mà
bạn chọn, mà không cần mã hóa toàn bộ phân vùng.
+ eCryptFS thường được sử dụng để bảo vệ dữ liệu cá nhân hoặc những tệp
quan trọng.
- EncFS:
+ EncFS là một hệ thống tệp tin mã hóa mức thư mục tương tự như eCryptFS.
+ Nó cho phép bạn tạo một thư mục ẩn chứa tệp tin được mã hóa và một thư
mục gốc để truy cập dữ liệu đã giải mã.
+ EncFS có thể được sử dụng để mã hóa dữ liệu trên một ổ đĩa hoặc dự án cụ
thể.
- dm-crypt:
+ dm-crypt là một phần của Dm (Device-mapper) trong Linux, cho phép bạn
mã hóa toàn bộ phân vùng.

51
+ Nó thường được sử dụng để mã hóa phân vùng gốc của hệ thống, bảo vệ
toàn bộ hệ thống tệp tin.
+ Mật khẩu hoặc khóa được sử dụng để mã hóa và giải mã dữ liệu trên phân
vùng này.
- Cryptsetup:
+ Cryptsetup là một tiện ích dòng lệnh cho phép bạn quản lý và thiết lập mã
hóa cho các phân vùng và thiết bị trên Linux.
+ Nó thường được sử dụng để cấu hình và quản lý phân vùng được mã hóa sử
dụng LUKS hoặc dm-crypt.
3.4. Hệ thống tệp tin Mac (Mac OS File Systems)
Hệ thống tệp tin của macOS (trước đây gọi là OS X) đã trải qua một số phiên
bản và cải tiến trong nhiều năm. Các phiên bản quan trọng bao gồm HFS (Hierarchical
File System), HFS+ (Hierarchical File System Plus), và APFS (Apple File System).
3.4.1. HFS (Hierarchical File System):
- Đặc Điểm Quan Trọng:
+ HFS là hệ thống tệp tin gốc của Macintosh từ năm 1985.
+ Hỗ trợ cấu trúc thư mục phân cấp và lưu trữ dữ liệu dưới dạng các khối dữ
liệu liên tiếp.
+ Tên tệp tin có độ dài tối đa 31 ký tự.
+ HFS được sử dụng trong các phiên bản Mac OS trước khi OS X ra đời.
- Hạn Chế:
+ HFS có hạn chế về dung lượng lưu trữ lớn và không có tính năng
journaling, nên nếu máy tính bị tắt đột ngột hoặc xảy ra sự cố, có thể dẫn đến mất dữ
liệu hoặc hỏng hệ thống tệp tin.
3.4.2. HFS+ (Hierarchical File System Plus):
- Đặc Điểm Quan Trọng:
+ HFS+ là phiên bản nâng cấp của HFS, được giới thiệu trong Mac OS 8.1
vào năm 1998.
+ Nó cải thiện đáng kể hiệu suất và khả năng mở rộng so với HFS.
+ HFS+ hỗ trợ tên tệp tin dài hơn (lên đến 255 ký tự), journaling (giúp bảo vệ
dữ liệu trước các sự cố), và khả năng mở rộng dung lượng lưu trữ.
- Ưu Điểm:

52
+ Journaling giúp đảm bảo tính nhất quán của hệ thống tệp tin và khả năng
phục hồi sau sự cố.
+ Hỗ trợ dung lượng lưu trữ lớn hơn so với HFS.
3.4.3. APFS (Apple File System):
- Đặc Điểm Quan Trọng:
+ APFS là hệ thống tệp tin mới được giới thiệu bởi Apple trong macOS High
Sierra vào năm 2017.
+ Nó được thiết kế để đáp ứng các yêu cầu của các thiết bị di động và máy
tính Mac hiện đại, bao gồm tính an toàn, hiệu suất cao, và khả năng mở rộng.
+ APFS hỗ trợ tên tệp tin dài, snapshot (ảnh chụp hệ thống tệp tin), và
deduplication (loại bỏ dữ liệu trùng lặp) để tiết kiệm dung lượng lưu trữ.
- Ưu Điểm:
+ APFS cải thiện hiệu suất, bảo mật, và khả năng quản lý dung lượng so với
HFS+.
+ Nó hỗ trợ mã hóa dữ liệu và tích hợp tốt với các thiết bị iOS và macOS.
Thuộc tính HFS HFS+ APFS
Giới thiệu trong
Gốc của hệ thống Nâng cấp từ HFS
Đặc điểm macOS High Sierra
tệp tin Mac vào năm 1998
vào năm 2017
Hiệu suất và khả
Hạn chế, không Tốt hơn so với
năng mở rộng tốt,
Dung lượng lưu trữ thích hợp cho dung HFS, nhưng vẫn
hỗ trợ dung lượng
lượng lớn còn hạn chế
lớn
Tên tệp tin Tối đa 31 ký tự Lên đến 255 ký tự Tên tệp tin dài hơn
Journaling Không Có Có
Tích hợp mã hóa Không Không Có
Tích hợp
Không Không Có
Deduplication
Ảnh chụp
Không Không Có
(Snapshot)
Tốt hơn so với Tốt, hỗ trợ dung
Khả năng mở rộng Hạn chế
HFS lượng lớn
Thấp hơn so với Tốt hơn so với Tốt hơn so với
Hiệu suất
HFS+ HFS HFS+ và HFS
Hệ thống gốc Có thể là HFS hoặc
Mặc định là HFS Mặc định là APFS
(Root Volume) HFS+
Hệ thông thứ cấp
Không Không Có
(Data Volume)
Bảng 3.2: So sánh chi tiết giữa 3 tệp hệ thống tệp tin HFS, HFS+ và APFS

53
3.5. CD-ROM/DVD File system
CD-ROM (Compact Disc Read-Only Memory) và DVD (Digital Versatile Disc) là
các loại phương tiện lưu trữ dữ liệu quang học. Cả hai đều sử dụng các hệ thống tệp
tin cụ thể để tổ chức và quản lý dữ liệu trên đĩa.
3.5.1. Hệ Thống Tệp Tin cho CD-ROM:
- ISO 9660 (International Standard Organization 9660):
+ ISO 9660 là một hệ thống tệp tin tiêu chuẩn được sử dụng phổ biến trên các
đĩa CD-ROM.
+ Hỗ trợ việc tổ chức dữ liệu thành các thư mục và tệp tin, tương tự như hệ
thống tệp tin trên ổ đĩa cứng.
+ ISO 9660 có thể được đọc bởi hầu hết các hệ thống máy tính và thiết bị đọc
CD.
- Joliet (Extension of ISO 9660):
+ Joliet là một tiện ích mở rộng của ISO 9660, được Microsoft phát triển.
+ Hỗ trợ các tên tệp tin và thư mục dài hơn (lên đến 64 ký tự) và các ký tự
Unicode.
+ Joliet giúp hỗ trợ tiếng Việt và các ngôn ngữ khác có ký tự đặc biệt trên đĩa
CD-ROM.
3.5.2. Hệ Thống Tệp Tin cho DVD:
- UDF (Universal Disk Format):
+ UDF là một hệ thống tệp tin chung được sử dụng cho cả CD và DVD.
+ Hỗ trợ tổ chức dữ liệu thành các thư mục và tệp tin, và có khả năng mã hóa
và nén dữ liệu.
+ UDF được sử dụng rộng rãi trong các đĩa DVD video, đĩa Blu-ray và các
định dạng đĩa quang khác.
- DVD File System Extensions (UDF Bridge):
+ Ngoài UDF, các đĩa DVD cũng có thể chứa hệ thống tệp tin như ISO 9660
hoặc Joliet, giúp đảm bảo tính tương thích với các thiết bị và máy tính cũ hơn.
+ Hệ thống tệp tin UDF Bridge cho phép sử dụng cả hai hệ thống tệp tin trên
cùng một đĩa DVD.
- DVD-Audio File System (DVD-AF):
+ Đối với đĩa DVD-Audio, có một hệ thống tệp tin riêng biệt được gọi là
DVD-Audio File System.

54
+ Được thiết kế đặc biệt để lưu trữ âm thanh cao cấp và metadata liên quan
đến âm nhạc trên đĩa DVD.

55
Thuộc Tính CD-ROM File System DVD File System
DVD sử dụng hệ thống
CD-ROM sử dụng hệ
tệp tin UDF (Universal
thống tệp tin ISO 9660
Loại Đĩa Disk Format) hoặc UDF
hoặc Joliet (mở rộng của
Bridge (UDF mở rộng
ISO 9660)
thêm ISO 9660)
DVD có thể chứa từ 4,7
Giới hạn tối đa khoảng GB (đĩa đơn lớp) đến 8,5
Dung Lượng Lưu Trữ
700 MB cho đĩa CD-ROM GB (đĩa đôi lớp) hoặc cao
hơn tùy loại DVD
Tên tệp tin có độ dài lớn
Tên tệp tin có độ dài tối
hơn (tối đa 255 ký tự) và
Tên Tệp Tin và Thư Mục đa khoảng 8 ký tự và hạn
hỗ trợ nhiều ký tự đặc
chế về ký tự đặc biệt
biệt, bao gồm Unicode
Có hạn chế về tính năng Hỗ trợ mã hóa dữ liệu và
Tính Năng Bảo Mật bảo mật, không hỗ trợ mã chữ ký số cho tính năng
hóa dữ liệu bảo mật cao hơn
Có khả năng chứa dữ liệu
Có thể chứa âm thanh, multimedia phức tạp, bao
Khả Năng Chứa Dữ Liệu
hình ảnh, và video đơn gồm video DVD, âm
Multimedia
giản thanh cao cấp, và dữ liệu
nhiều phương tiện
Hệ thống tệp tin UDF có
tích hợp tốt với hệ thống
Hệ thống tệp tin CD-ROM
tệp tin của Linux và
Tích Hợp Hệ Thống Tệp thường không tương thích
Windows, cho phép tương
Tin Linux/Windows trực tiếp với hệ thống tệp
thích ngược và chia sẻ dữ
tin của Linux và Windows
liệu dễ dàng giữa các hệ
điều hành
Sử dụng phổ biến trong
Sử dụng phổ biến trong việc lưu trữ dữ liệu trên
Sử Dụng Phổ Biến quá trình chia sẻ dữ liệu đĩa DVD, bao gồm đĩa
trên đĩa CD-ROM video DVD và dự án
multimedia khác
Bảng 3.3: So sánh CR-ROM File System và DVD File System
3.6. RAID Storage System
Hệ thống lưu trữ RAID (Redundant Array of Independent Disks) là một công
nghệ được sử dụng để tổ chức và quản lý nhiều ổ đĩa cứng thành một hệ thống lưu trữ
duy nhất với mục tiêu tăng hiệu suất, độ tin cậy, và/hoặc dung lượng lưu trữ. Hệ thống
RAID bao gồm việc kết hợp các ổ đĩa cứng vật lý thành một hoặc nhiều mảng RAID,
và sau đó sử dụng các phương pháp đặc biệt để quản lý dữ liệu trên các ổ đĩa này. Vai
trò của hệ thống RAID đối với hệ thống tệp tin bao gồm:

56
- Tăng Hiệu Suất: Một trong các lợi ích quan trọng của RAID là khả năng tăng
hiệu suất đọc và ghi dữ liệu. Các cấu hình RAID có thể tăng tốc độ truy cập dữ liệu
bằng cách phân tách và phân phối dữ liệu trên nhiều ổ đĩa cứng. Điều này làm giảm tải
công việc cho từng ổ đĩa và cho phép đọc/ghi dữ liệu đồng thời từ nhiều ổ đĩa, cải
thiện hiệu suất tổng thể.
- Dự Phòng Dữ Liệu: Một số cấu hình RAID, chẳng hạn như RAID 1 (gọi là
RAID-1 mirroring), sao lưu dữ liệu tự động bằng cách sao chép dữ liệu từ một ổ đĩa
cứng lên một ổ đĩa khác. Điều này cung cấp tính dự phòng và bảo vệ dữ liệu khỏi sự
hỏng hóc của ổ đĩa cứng.
- Dung Lượng Lưu Trữ: RAID cũng cho phép tạo ra các mảng lớn hơn so với ổ
đĩa cứng đơn lẻ bằng cách kết hợp nhiều ổ đĩa lại với nhau. Các cấu hình như RAID 0
(striping) cho phép tận dụng dung lượng của tất cả các ổ đĩa trong mảng để tạo ra một
không gian lưu trữ lớn hơn.
- Tính Bền Bỉ và Sẵn Sàng: RAID cung cấp tính bền bỉ và sẵn sàng cao hơn cho
hệ thống lưu trữ. Khi một ổ đĩa cứng hỏng, dữ liệu có thể vẫn sẽ có sẵn (tùy thuộc vào
cấu hình RAID) và hệ thống vẫn hoạt động mà không có sự gián đoạn lớn.
Hệ thống RAID có vai trò quan trọng đối với hệ thống tệp tin bằng cách cung
cấp môi trường lưu trữ ổn định và hiệu quả cho hệ thống tệp tin hoạt động. Nhờ vào
khả năng tăng hiệu suất và bảo vệ dữ liệu, RAID giúp đảm bảo tính nhất quán và tin
cậy của hệ thống tệp tin, đặc biệt là trong các môi trường doanh nghiệp và dự án quan
trọng.
3.6.1 RAID Level
Có nhiều cấu hình RAID khác nhau, được gọi là các "RAID level" hoặc "mức
RAID." Mỗi mức RAID có đặc điểm riêng và được sử dụng cho các mục đích khác
nhau.
- RAID 0 (Striping):
+ RAID 0 chia dữ liệu thành các "strip" (phần) và lưu chúng trên nhiều ổ đĩa
cứng.
+ Mục tiêu của RAID 0 là tăng hiệu suất bằng cách cho phép đọc và ghi dữ
liệu đồng thời từ nhiều ổ đĩa.
+ RAID 0 không cung cấp dự phòng dữ liệu và nếu một ổ đĩa hỏng, toàn bộ
dữ liệu trên mảng RAID 0 có thể bị mất.
- RAID 1 (Mirroring):
+ RAID 1 sao chép dữ liệu từ ổ đĩa này sang ổ đĩa khác để tạo một bản sao
chính xác.

57
+ Mục tiêu của RAID 1 là tạo ra một hệ thống dự phòng dữ liệu và tăng tính
sẵn sàng.
+ RAID 1 có khả năng chịu lỗi ổ đĩa và tiếp tục hoạt động nếu một ổ đĩa hỏng.
- RAID 5 (Striping with Parity):
+ RAID 5 chia dữ liệu thành các strip và sử dụng kiểm tra chẵn lẻ (parity) để
bảo vệ dữ liệu.
+ Mục tiêu của RAID 5 là kết hợp tính hiệu suất từ striping và khả năng dự
phòng từ parity.
+ Nếu một ổ đĩa hỏng, dữ liệu vẫn có thể được truy cập và phục hồi từ thông
tin parity.
- RAID 6 (Double Parity):
+ RAID 6 tương tự như RAID 5 nhưng sử dụng hai thông tin kiểm tra chẵn lẻ
(parity).
+ tiêu của RAID 6 là tăng khả năng chịu lỗi so với RAID 5. Nó có thể chịu
được lỗi trên hai ổ đĩa cùng một lúc mà không mất dữ liệu.
- RAID 10 (1+0) (Striping + Mirroring):
+ RAID 10 kết hợp tính hiệu suất của striping và tính dự phòng của mirroring.
+ Mục tiêu của RAID 10 là cung cấp tốc độ cao và khả năng chịu lỗi bằng
cách kết hợp ổ đĩa theo cặp và sau đó striping dữ liệu trên các cặp này.
- RAID 50 (5+0) (Striping + RAID 5):
+ RAID 50 kết hợp tính hiệu suất của striping và khả năng chịu lỗi của RAID
5.
+ Mục tiêu của RAID 50 là cung cấp tốc độ cao và khả năng dự phòng.
- RAID 60 (6+0) (Striping + RAID 6):
+ RAID 60 kết hợp tính hiệu suất của striping và khả năng chịu lỗi của RAID
6.
+ Mục tiêu của RAID 60 là cung cấp tốc độ cao và khả năng dự phòng mạnh
mẽ.

KẾT LUẬN

58
59
TÀI LIỆU THAM KHẢO

60

You might also like