You are on page 1of 55

Chương 3:

CẤU TRÚC CƠ SỞ DỮ
LIỆU TRONG GIS

Thời gian: 5LT+5TH


GV: Nguyễn Thị Hồng
* Nội dung
1. Cơ sở dữ liệu của GIS
2. Cấu trúc dữ liệu Raster
3. Cấu trúc dữ liệu Vector
4. So sánh các phương pháp raster và vector.
5. Bản đồ chuyên đề
3.1. Cơ sở dữ liệu của GIS

Cơ sở dữ liệu GIS gồm:


▪ Cơ sở dữ liệu không gian
▪ Cơ sở dữ liệu phi không gian hay cơ sở dữ liệu thuộc tính.
▪ Hai loại dữ liệu này gồm các file chứa dữ liệu về vị trí
và dữ liệu về mô tả các đối tượng trên bản đồ.
▪ Người dùng có thể truy cập dữ liệu thông qua bản đồ
hoặc có thể tạo ra được bản đồ thông qua các bảng.
3.1. Cơ sở dữ liệu của GIS

▪ Sau khi nhập dữ liệu không gian ta được các file tọa độ.
Các dữ liệu này phải được cấu trúc lại để biểu diễn đối
tượng địa lý.
▪ Tùy thuộc vào nguồn gốc dữ liệu đầu vào ta dùng hai
mô hình dữ liệu không gian là Vector và Raster để cấu
trúc lại dữ liệu
3.1. Cơ sở dữ liệu của GIS
3.1. Cơ sở dữ liệu của GIS
3.1. Cơ sở dữ liệu của GIS
3.1. Cơ sở dữ liệu của GIS
3.2. Cấu trúc dữ liệu Raster

3.2.1. Khái niệm:


▪ Dữ liệu GIS được lưu trữ dưới dạng lưới các ô (cells)
hay pixel.
▪ Nguồn ảnh viễn thám, ảnh quét (scanner) luôn ở
dạng Raster
▪ Các mô hình dữ liệu Raster rất tốt miêu tả thông tin liên
tục trong tự nhiên như nhiệt độ nơi mà giá trị nhiệt độ có
thể khác với nơi liền kề.
3.2.2. Nguồn ảnh Raster

▪ Ảnh số trực giao (Digital


Orthophotography)
▪ Một ảnh được quét, dùng
các công cụ toán học
sửa, bỏ đi, dịch chuyển
để có các hiệu quả mong
muốn đó là các đối tượng
luôn hiển thị vuông góc
với mặt đất.
▪ Ảnh trực giao cho ta ảnh
giống như thực trạng của
trái đất.
Image
Copyright 1993 Nassau County, NY
Các bản đồ dạng Raster (images)
▪ Thiết lập bởi màu sắc của
các pixel
▪ Cách đơn giản một mảng
các pixel được xếp theo
các hàng và các cột
▪ Các Pixel là được tô màu,
nhưng không miêu tả các
đối tượng một cách rõ ràng
▪ Rasters có thể có giá trị đi
kèm.

Source: Defense Mapping School


National Imagery and Mapping Agency
3.2.3. Đặc điểm của Raster
▪ Trông giống trang bản đồ giấy
▪ Giá thành rẻ và dễ sản xuất
▪ Chạy dễ dàng trên PC
▪ Có sẵn mọi nơi.
▪ Nhược điểm:
▪ Mốc tính toán có hoặc không theo hệ
tọa độ WGS84
▪ Không cho phép tự động loại bỏ chế độ
nền hay sự trợ giúp phân tích của máy
tính.
▪ Lưu trữ không hiệu quả

Source: Defense Mapping School


National Imagery and Mapping Agency
3.2.3. Đặc điểm của Raster
▪ Tập dữ liệu GIS
▪ Về sử dụng đất/Độ bao phủ đất
▪ Các Chỉ số thực vật
▪ Sự ổn định đất
▪ Ảnh số
▪ Ảnh về các tòa nhà
▪ Khung cảnh các tai họa
▪ Sự thiệt hại mùa vụ
▪ Các hình ảnh về sự vận động
▪ Ảnh trực giao
▪ Các ảnh trên không đã được chỉnh sửa
3.2.3. Đặc điểm của Raster
Là một mảng hai chiều các ô (pixel). Mỗi ô có
chiều cao và chiều rộng cố định và cùng kích
thước, trải trên một hình chữ nhật.
* Bảng dữ liệu thuộc tính

▪ Rasters có giá trị số nguyên các ô định (số lượng


các ô cùng giá trị) được ghi trong bảng dữ liệu
thuộc tính. Mỗi bản ghi thuộc tính là duy nhất với
mỗi giá trị của ô.
▪ Có thể thêm các trường tới bảng dữ liệu
Các kiểu dữ liệu miêu tả trong ô
▪ Dữ liệu được lưu trữ trong raster có thể được phân
loại một trong các loại sau:
▪ Dữ liệu tên (Nominal data): dữ liệu được phân loại theo
tên.
▪ Dữ liệu số thứ tự (Ordinal data): dữ liệu được phân loại
theo tên và khoảng giá trị.
▪ Khoảng dữ liệu (Interval data): sắp xếp theo thứ tự số
và có các khoảng khác nhau có ý nghĩa.
▪ Dữ liệu tỷ lệ (Ratio data)
Các kiểu dữ liệu miêu tả trong ô
Các kiểu dữ liệu miêu tả trong ô

▪ Kiểu Nominal và Ordinal


dùng miêu tả theo các
phân loại khác nhau, là
cách tốt nhất miêu tả
các ô dữ liệu kiểu
integer.

▪ Kiểu Interval và Ratio



tả các giá trị liên tiếp,
dùng với các ô dữ liệu là
kiểu real.
3.2.4. Nén dữ liệu của Raster
+ Các file dữ liệu dạng Raster tạo ra thường lớn do
có sự lặp lại của các thông tin giống nhau. Để khắc
phục khi lưu trữ ta dùng 2 kỹ thuật nén file dữ liệu
raster:
- Mã hóa theo dòng
- Mã hóa theo kiểu chia bốn
a. Kỹ thuật Mã hóa theo dòng

▪ Đây là kỹ thuật nén dữ liệu theo một chiều đối


với file dữ liệu raster: Các ô liền nhau có cùng
giá trị trên một dòng được nhóm lại
▪ Giả sử một ảnh có chứa một dòng với các ô
như 44444555556666662222233333
➔ kết quả nén : 54 55 66 52 53
a. Kỹ thuật Mã hóa theo dòng
▪ Xét ví dụ

Cách 1 24A 6B 3A 7B 4D 6B 5D 5B
5D 5C 5D 5C 5D 5C 5D 5C

Cách 2 24A 13B 3A 13B 4D 11B 10D


10C 10D 10C 5D
b. Mã hóa theo kiểu chia bốn

▪ Kỹ thuật mã hóa này thì Không gian được chia


nhỏ thành 4 phần bằng nhau từ khi bắt gặp
vùng không đồng nhất. Việc chia nhỏ được
tiếp tục cho đến các điểm nút cuối
b. Mã hóa theo kiểu chia bốn
▪ Xét ví dụ
3.3. Mô hình dữ liệu Vector
3.3.1. Khái niệm:
▪Dữ liệu GIS Dữ liệu GIS được lưu trữ trong các lớp
riêng biệt như Point, Line, Polygon

© Paul Bolstad, GIS Fundamentals


3.3.2. Đặc điểm dữ liệu Vector
▪ Có mối quan hệ giữa các kiểu dữ liệu vector. Mỗi
kiểu thường độc lập trên một kiểu khác nhau. Khi
miêu tả dữ liệu GIS theo định dạng vector, dữ
liệu phải được lưu trữ:

▪ Points: là các đối tượng vô hướng có vị trí


không gian, miêu tả các đối tượng GIS như vị trí, Point
hoặc cây …
▪ Lines: miêu tả đối tượng một chiều, có vị trí, có
chiều dài như đường, sông. Lines được tạo bởi
việc kết nối các điểm với nhau. Một đường bắt
đầu và kết thúc tại một điểm gọi là nút (node), và Line
các điểm tạo nên đường gọi là đỉnh (Vertices).
▪ Polygons/Area: miêu tả đối tượng hai chiều, có
vị trí, có chiều dài, và có cả chiều rộng như
đường danh giới của cánh đồng, đất đai, hoặc
hồ … Nó được tạo bởi việc kết nối các đường,
điểm bắt đầu của polygon cũng là điểm kết thúc Polygon
Points

▪ Point là đối tượng vô hướng có vị trí và thuộc tính


thông tin nhưng quá nhỏ để được biểu diễn bằng
vùng.
▪ Tỷ lệ bản đồ quyết định một đối tượng là điểm
hay không.
Ứng dụng kiểu điểm

▪ Các mẫu đất


▪ Kiểu
▪ PH
▪ Chất gây ôi nhiễm (Contaminants)
▪ Vị trí các cột đèn
▪ Các vị trí xảy ra tai nạn
▪ Các trung tâm
▪ Khối/Đoạn
▪ Địa chỉ
▪ Chủ sở hữu
Các cột đèn
Các trung tâm
Lines or Arcs

▪ Lines là các đối tượng


một chiều, có vị trí, có
chiều dài nhưng không
có vùng như đường,
sông. Lines được tạo bởi
việc kết nối các điểm với
nhau. Một đường bắt
đầu và kết thúc tại một
điểm gọi là nút (node),
và các điểm tạo nên
đường gọi là đỉnh
(Vertices).
Ứng dụng Lines or Arcs

▪ Đường phố ▪ Sông suối


▪ Street Name ▪ Depth
▪ Address Ranges ▪ Quality
▪ Hệ thống nước ▪ Flow Rate
▪ Pipe size
▪ Pipe Material
▪ Date Installed
Đường phố
Polygons

Polygons là đối tượng


hai chiều, có vị trí, có
chiều dài, và có cả chiều
rộng (hay có diện tích)
Ứng dụng Polygons

▪ Các mảnh đất


▪ Parcel ID Number
▪ Dimensions and Area
▪ Đường danh giới
▪ Type
▪ Permeability
▪ Vùng lũ lụt
Polygons
Polygons
3.3.3. Cấu trúc dữ liệu Vector

Kiểu vị t r í

Điểm 3,2
Đường 1,5; 3,5; 5,7; 8,8; 11,7
Vung 5,3; 6,5; 7,4; 9,5;
11,3; 8,2; 5,3

Điểm: Được thể hiện bằng một cặp toạ độ


Đường: Được thể hiện bằng một chuỗi các cặp toạ độ
Vùng: Được thể hiện bằng một chuỗi các cặp toạ độ và cặp toạ độ đầu
và cặp toạ độ cuối trùng nhau.
* Biểu diễn và quản lý cấu trúc Vector

▪ Các file tọa độ được nhập dạng vector sẽ được


cấu truc lại để biểu diễn và quản lý đối tượng địa
lý. Có ba cấu trúc được dùng:
▪ Cấu trúc toàn vùng
▪ Cấu trúc Spaghetti
▪ Cấu trúc topology
a. Cấu trúc toàn vùng

❑ Phương pháp
▪ Mỗi lớp CSDL được chia thành nhóm vùng, mỗi
vùng được mã hóa thành trật tự các vị trí thành
đường biên của vùng khép kín.
▪ Mỗi đoạn thẳng xác định vùng đều được ghi lại
hai lần
▪ Số điểm tạo nên cạnh cũng được ghi lại nhiều lần
a. Cấu trúc toàn vùng

▪ Minh họa
b. Cấu trúc dữ liệu Spaghetti

▪ Phương pháp: Đối tượng địa lý được mô tả bằng


thực thể hình học riêng lẻ biểu diễn bằng tọa độ
hoặc bằng phương trình tham số
▪ Minh họa:
c. Cấu trúc Topology

❑ Khái niệm:
▪ Topology dùng để ghi lại và xử lý các mối quan hệ
không gian giữa các đối tượng địa lý: liền kề nối
tiếp và chứa đựng
c. Cấu trúc Topology

▪ Minh họa Topology vùng cung- nút


c. Cấu trúc Topology

▪ Topology vùng - cung


3.3.4. SỰ THỂ HIỆN DỮ LIỆU DẠNG VECTOR

Mỗi điểm được thể hiện


bằng 1 cặp tọa độ

Mỗi đường thể hiện bằng


1 chuỗi các cặp tọa độ

Mỗi vùng được thể hiện


bằng 1 chuỗi các cặp tọa
độ, có cặp tọa đầu và
cặp tọa cuối trùng nhau.
❑ Ưu nhược điểm dữ liệu Raster
❑ Ưu nhược điểm dữ liệu Vector
3.6. Bản đồ chuyên đề
▪ Nguyên tắc phân loại bản đồ chuyên đề
▪ Nguyên tắc phân loại bản đồ chuyên đề
▪ Nguyên tắc phân loại bản đồ chuyên đề
▪ Nguyên tắc phân loại bản đồ chuyên đề
▪ Nguyên tắc phân loại bản đồ chuyên đề
❑ Đặc điểm thành lập của bản đồ chuyên đề
❑ Đặc điểm thành lập của bản đồ chuyên đề

You might also like