NỘI DUNG

Mô hình tổ chức bộ nhớ ngoài

TỔ CHỨC DỮ LIỆU VẬT LÝ

Tệp băm Tệp chỉ số B−cây

MÔ HÌNH TỔ CHỨC BỘ NHỚ NGOÀI
Bộ nhớ ngoài (bộ nhớ thứ cấp - secondary memory): băng từ, đĩa từ, đĩa quang,… Các khối vật lý có kích cỡ như nhau: 512 - 4.096 byte được đánh địa chỉ khối (địa chỉ tuyệt đối trên đĩa) (29 - 212 byte),

Tổ chức lưu trữ dựa vào hàm băm
Hàm băm Cho k là số nguyên dương, một hàm băm Hk(x) được xác định là: Hk : N → [0..k-1] x ↦ Hk(x) = x mod k

Mỗi tệp dữ liệu lưu trên đĩa chiếm 1 hay nhiều khối. Mỗi khối chứa 1 hay nhiều bản ghi. Địa chỉ của các bản ghi là địa chỉ tuyệt đối của byte đầu tiên của bản ghi hoặc là địa chỉ khối chứa bản ghi đó. Con trỏ: Chỉ dẫn đến địa chỉ của bản ghi (hoặc khối) (được lưu ở 1 tệp hay 1 nơi nào đó)

trỏ tới khối tiếp theo. 1. Mỗi cụm ứng với 1 địa chỉ thuộc tập {0. Mỗi cụm chứa 1 hay nhiều khối.Tổ chức lưu trữ dựa vào hàm băm Tệp băm Các bản ghi được chia thành từng cụm (buckets). Tổ chức lưu trữ dựa vào hàm băm Cấu trúc tệp băm Bảng chỉ dẫn cụm Tổ chức lưu trữ dựa vào hàm băm Ví dụ: Tệp băm với hàm băm H4(x) Tổ chức lưu trữ dựa vào hàm băm Thêm bản ghi khoá 25 Sau khi thêm bản ghi khoá 25. Một tệp gồm một số cụm. gọi là địa chỉ băm. trỏ tới khối đầu tiên trong cụm. k-1}. …. mỗi con trỏ ứng với 1 cụm. khối cuối cùng của cụm chứa con trỏ rỗng. Ở đầu mỗi khối đều có con trỏ. Có một bảng chỉ dẫn cụm (bucket directory) gồm k con trỏ. 33 Tìm kiếm bản ghi khoá x Bổ sung bản ghi khoá x Xoá bản ghi khoá x Sửa chữa bản ghi khoá x .

Tổ chức lưu trữ dựa vào tệp chỉ số Tạo ra một tệp mới từ một tệp đã được sắp xếp (tệp dữ liệu chính) Mục đích: Thực hiện có hiệu quả các thao tác trên tệp dữ liệu chính. i ≤ min (k. Giả thiết: Mỗi bản ghi trong tệp dữ liệu chính đều có một khoá xác định duy nhất các bản ghi. d) sao cho: k ≤ vd . Tệp dữ liệu chính được sắp xếp dựa trên giá trị khoá (theo chiều tăng hoặc giảm). … . Tổ chức lưu trữ dựa vào tệp chỉ số Tệp chỉ số bao gồm các cặp (k. giá trị khoá của cặp (k. y = y1 y2 … yk. Mỗi một khối d trong tệp dữ liệu chính tương ứng với một cặp (k. với ∀ vd là giá trị khoá trong khối d k > vd-1 . d là địa chỉ của khối. Giá trị khoá có thể là số hay xâu kí tự. … . xn = yn Hoặc với ∀i. x2 = y2. x1 x2… xn < y1 y2 … yk nếu: n < k và x1 = y1. Khoá gồm 1 hay nhiều trường có thứ tự và có độ dài cố định. Tổ chức lưu trữ dựa vào tệp chỉ số Thứ tự từ điển trên các xâu kí tự: Với 2 xâu kí tự x = x1 x2 … xn . d) đầu tiên thường được chọn là k = -∞ Tệp chỉ số Tệp dữ liệu chính (Giả sử mỗi khối chứa 5 bản ghi) Các thao tác: Bổ sung bản ghi khoá x Xoá bản ghi khoá x Sửa chữa bản ghi khoá x Tìm kiếm bản ghi khoá x: Tìm kiếm tuần tự và Tìm kiếm nhị phân . xi-1 = yi-1 và xi < yi (xi < yi theo nghĩa mã nhị phân của xi là một số nhỏ hơn mã nhị phân của yi). x2 = y2. n) có: x1 = y1. d) k là giá trị của khoá. được sắp xếp dựa trên giá trị khoá. Để thuận tiện. với ∀vd-1 là giá trị khoá trong khối trước d.

31 Sau khi thêm bản ghi khoá 58 Sau khi thêm bản ghi khoá 52 Secondary index dựa trên khoá duy nhất Secondary Index dựa trên trường không khoá .primary index Sau khi bổ sung bản ghi khoá 19.

n-1 Mọi khoá x trong cây con được trỏ bởi pn đều thoả mãn: x > kn B−cây sau khi thêm bản ghi khoá 32 . pn). Cấu trúc của mỗi nút trong B-cây Mỗi nút trong có dạng (p0. bổ sung nhiều lần?? Mỗi nút. có từ [k/2] đến k con. p1. p2. k2. với k là số bản ghi tối đa có thể có trong nút. Mọi khoá x trong cây con được trỏ bởi p0 đều có x < k1 Mọi khoá x trong cây con được trỏ bởi pi đều thoả mãn: ki ≤ x < ki+1. i = 0. …. 1. kn. n) là con trỏ. Các khoá trong một nút được sắp xếp theo thứ tự tăng dần.…. trỏ tới nút i. trong đó pi (i = 1. Mỗi đường đi từ nút gốc đến một nút lá bất kỳ đều có độ dài như nhau. trừ nút gốc. k1.Multi−level index B−cây Một B-cây cấp k có các tính chất: Gốc của cây hoặc là nút lá. hoặc có ít nhất 2 con Vấn đề sau khi thực hiện xoá. có ki là khoá đầu tiên của nút đó.

B−cây sau khi xóa bản ghi khoá 64 .

Sign up to vote on this title
UsefulNot useful