BCFull TichBui

VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
VIỆN CƠ HỌC
BÁO CÁO ĐỀ TÀI NGHIÊN CỨU KHOA HỌC VÀ CÔNG NGHỆ

CẤP THÀNH PHỐ HÀ NỘI
Đề tài: 01C-07/-1-2016-3
“Ứng dụng Công nghệ thông tin xây dựng mô hình

hỗ trợ công tác dự báo lũ trên sông và cảnh báo
ngập lụt lưu vực sông Tích-sông Bùi”
Đơn vị chủ trì: Viện Cơ học, Viện Hàn lâm KH&CN Việt Nam
Chủ nhiệm: TS. Nguyễn Tiến Cường
Trưởng phòng Thủy động lực và Giảm nhẹ thiên tai
Hà Nội, tháng 12 năm 2018

Viện Cơ học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam
MỤC LỤC
MỤC LỤC ........................................................................................................................................................ 2

CÁC NHÀ KHOA HỌC THỰC HIỆN ĐỀ TÀI ........................................................................................... 4
MỞ ĐẦU .......................................................................................................................................................... 5
PHẦN 1: TỔNG QUAN VỀ SÔNG TÍCH BÙI VÀ GIẢI PHÁP ĐỀ XUẤT CỦA ĐỀ TÀI................... 17
CHƯƠNG 1: TỔNG QUAN VỀ LƯU VỰC SÔNG TÍCH-BÙI ................................................................................ 18
1. Đặc điểm của lưu vực sông Tích-Bùi ................................................................................................ 18
1.1. Ví trí địa lý và đặc điểm tự nhiên của lưu vực........................................................................................... 18
1.2. Đặc điểm về khí tượng thủy văn và thủy hệ ............................................................................................... 19
2. Dự án cải tạo sông Tích-Bùi .............................................................................................................. 22
3. Tính hình lũ lụt của lưu vực sông Tích-Bùi ...................................................................................... 23
CHƯƠNG 2: GIẢI PHÁP ĐỀ XUẤT CỦA ĐỀ TÀI ............................................................................................... 26
1. Mục tiêu của đề tài ............................................................................................................................ 26
2. Giải pháp đề xuất của đề tài .............................................................................................................. 27
3. Phương pháp nghiên cứu ................................................................................................................... 29
CHƯƠNG 3: THU THẬP DỮ LIỆU ................................................................................................................... 30
1. Thu thập dữ liệu địa hình................................................................................................................... 30
2. Thu thập bản đồ hiện trạng sử dụng đất và bản đồ phân loại đất ...................................................... 32
3. Thu thập dữ liệu về lòng dẫn của các sông ........................................................................................ 33
4. Thu thập dữ liệu khí tượng thủy văn và các công trình ven sông ...................................................... 35
PHẦN 2: CÁC MÔ HÌNH TÍNH TOÁN SỐ .............................................................................................. 38
CHƯƠNG 4: MÔ HÌNH THỦY VĂN PHÂN BỐ .................................................................................................. 39
1. Cơ sở khoa học của phần mềm thủy văn phân bố Marine ................................................................. 39
1.1. Mô hình diễn toán dòng chảy trên bề mặt lưu vực .................................................................................... 39
1.2. Mô hình tính tổn thất nước do thấm Green Ampt ...................................................................................... 40
1.3. Cấu trúc dữ liệu của mô hình thủy văn Marine ......................................................................................... 43
2. Thu thập và xử lý số liệu cho mô hình thủy văn ............................................................................... 44
2.1. Số liệu địa hình ......................................................................................................................................... 44
2.2. Bản đồ hiện trạng sử dụng đất .................................................................................................................. 44
2.3. Bản đồ phân loại đất ................................................................................................................................. 46
2.4. Số liệu mưa................................................................................................................................................ 48
3. Kiểm tra độ nhạy của các tham số trong mô hình ............................................................................. 50
3.1. Thử độ nhạy của mô hình với các tham số của bản đồ hiện trạng sử dụng đất......................................... 50
3.2. Thử độ nhạy của mô hình với các tham số của bản đồ phân loại đất........................................................ 51
3.3. Thử độ nhạy của mô hình với hệ số phân bố mưa ..................................................................................... 52
CHƯƠNG 5: MÔ HÌNH THỦY LỰC MỘT CHIỀU MỞ RỘNG ............................................................................... 55
1. Cơ sở khoa học của mô hình thủy lực một chiều mở rộng ................................................................ 55
1.1. Mạng sông ................................................................................................................................................. 55
1.2. Ô ruộng (ô chứa) ....................................................................................................................................... 56
1.3. Mô hình toán học một đoạn sông .............................................................................................................. 56
1.4. Mô hình toán học của một ô ruộng ........................................................................................................... 57
1.5. Lược đồ sai phân ....................................................................................................................................... 57
1.6. Tuyến tính hóa hệ phương trình (5.5), (5.7), (5.8)..................................................................................... 60
2. Mô hình hóa lưu vực sông Tích-Bùi trong IMECH1D mở rộng ....................................................... 61
3. Sơ đồ kết nối giữa thủy văn và thủy lực ............................................................................................ 63
4. Thu thập và xử lý số liệu cho cho lưu vực sông Tích-Bùi ................................................................. 65
4.1. Số liệu về lòng dẫn .................................................................................................................................... 66
4.2. Số liệu về biên ........................................................................................................................................... 72
4.3. Số liệu về ô chứa ....................................................................................................................................... 75
CHƯƠNG 6: MÔ HÌNH HỌC MÁY .................................................................................................................. 77
1. Một số mô hình học máy trong dự báo mực nước ............................................................................. 77
Báo cáo kết quả thực hiện đề tài Trang số 2

1.1. Mô hình hồi quy tuyến tính nhiều biến ...................................................................................................... 77

1.2. Hồi quy LASSO .......................................................................................................................................... 78
1.3. Phương pháp hồi quy k láng giềng ............................................................................................................ 78
1.4. Cây hồi quy ............................................................................................................................................... 78
1.5. Mạng nơ-ron nhân tạo .............................................................................................................................. 79
1.6. Máy véc-tơ hồi quy .................................................................................................................................... 81
1.7. Rừng ngẫu nhiên hồi quy .......................................................................................................................... 82
1.8. Boosting .................................................................................................................................................... 83
2. Thu thập và xử lý dữ liệu .................................................................................................................. 85
2.1. Vùng nghiên cứu ....................................................................................................................................... 85
2.2. Sông Tích-Bùi và các trạm đo ................................................................................................................... 85
2.3. Xử lý dữ liệu .............................................................................................................................................. 87
3. Thực nghiệm để lựa chọn mô hình .................................................................................................... 90
3.1. Mô tả dữ liệu ............................................................................................................................................. 90
3.2. Các độ đo đánh giá ................................................................................................................................... 90
3.3. Các kết quả thực nghiệm ........................................................................................................................... 91
4. Dự báo mực nước tại trạm Ba Thá sử dụng SVR .............................................................................. 93
5. Mô hình mạng Nơ ron hồi tiếp RNN (Recurrent Neural Networks) ................................................. 96
5.1. Mạng RNN ................................................................................................................................................. 96
5.2. Vấn đề của sự phụ thuộc dài hạn .............................................................................................................. 97
5.3. Mạng LSTM............................................................................................................................................... 98
5.4. Kết quả xây dựng mạng RNN .................................................................................................................... 99
PHẦN 3: CÔNG CỤ CẢNH BÁO VÀ DỰ BÁO LŨ LỤT SÔNG TÍCH-BÙI....................................... 100

CHƯƠNG 7: XÂY DỰNG CÔNG CỤ HỖ TRỢ CẢNH BÁO LŨ LỤT .................................................................... 101
1. Xây dựng cơ sở dữ liệu ................................................................................................................... 101
1.1. Lựa chọn công nghệ ................................................................................................................................ 101
1.2. Thiết kế cơ sở dữ liệu .............................................................................................................................. 103
1.3. Thu thập thông tin ................................................................................................................................... 110
1.4. Xử lý nội dung ......................................................................................................................................... 111
1.5. Xây dựng mô đun phần mềm nhập giữa liệu ........................................................................................... 111
1.6. Nhập dữ liệu vào hệ thống ...................................................................................................................... 112
1.7. Các kết quả nhập liệu .............................................................................................................................. 113
2. Xây dựng giao diện người dùng trên nền GIS ................................................................................. 114
2.1. Thiết kế giao diện đồ họa trực quan ........................................................................................................ 114
2.2. Sử dụng liên kết bản đồ GIS .................................................................................................................... 115
3. Song song hóa các mô đun tính toán ............................................................................................... 116
3.1. Kỹ thuật tính toán song song ................................................................................................................... 116
3.2. Một số kết quả ứng dụng song song hóa ................................................................................................. 121
4. Tích hợp các mô đun/phần mềm và đóng gói sản phẩm.................................................................. 125
4.1. Tích hợp các mô đun/phần mềm trên một công cụ thống nhất ................................................................ 125
4.2. Đóng gói và tạo bộ cài đặt ...................................................................................................................... 127
CHƯƠNG 8: MỘT SỐ KẾT QUẢ ỨNG DỤNG.................................................................................................. 132
1. Hiệu chỉnh mô hình bằng số liệu lịch sử ......................................................................................... 132
2. Thử nghiệm dự báo lại .................................................................................................................... 134
3. Kết quả dự báo thực trận lũ năm 2018 ............................................................................................ 136
3.1. Các bản tin dự báo .................................................................................................................................. 136
3.2. Tổng hợp kết quả dự báo của các bản tin ............................................................................................... 141
KẾT LUẬN .................................................................................................................................................. 145

TÀI LIỆU THAM KHẢO........................................................................................................................... 146

CÁC NHÀ KHOA HỌC THỰC HIỆN ĐỀ TÀI
 Các cán bộ và nghiên cứu sinh của Viện Cơ học

1. TS. NCVC. Nguyễn Tiến Cường (Chủ nhiệm)
2. PGS. TS. NCVCC. Trần Thu Hà
3. PGS. TS. NCVC. Hoàng Văn Lai
4. TS. NCV. Nguyễn Chính Kiên
5. TS. NCVC. Nguyễn Văn Thắng
6. TS. NCV. Nguyễn Duy Trọng
7. ThS. NCV. Dương Thị Thanh Hương (Thư ký)
8. ThS. NCV.Nguyễn Hồng Phong (Nghiên cứu sinh)
9. KS. NCV. Nguyễn Tuấn Anh
10. KS. NCV. Nguyễn Văn Thăng
11. ThS. GV. Phan Thị Thu Phương (Nghiên cứu sinh)
12. ThS. NCV. Hà Tiến Vinh
13. KS. NCV. Nguyễn Văn Tùng (Học viên cao học)
14. CN. NCV. Trần Thị Thanh Huyền
15. KS. Nguyễn Thị Hằng (trợ lý nghiên cứu viên)
 Các chuyên gia ngoài Viện Cơ học

1. TS. GVC. Nguyễn Thanh Tùng, Trưởng khoa Công nghệ thông tin, Đại học
Thủy Lợi.
2. PGS. TS. GVCC. Lê Đức Hậu, giảng viên khoa Công nghệ thông tin, Đại
học Thủy Lợi
3. TS. NCVC. Lương Hữu Dũng, Phó giám đốc Trung tâm nghiên cứu Thủy
văn - Hải văn, Viện Khoa học Khí tượng Thủy văn và Biến đổi khí hậu.
4. ThS. NCV. Trần Đức Thiện, Trung tâm nghiên cứu Thủy văn - Hải văn,
Viện Khoa học Khí tượng Thủy văn và Biến đổi khí hậu.

MỞ ĐẦU
Lũ lụt là một trong các hiểm hoạ thiên nhiên có thể gây thiệt hại lớn về người
và tài sản cho các khu vực dân cư sống trong lưu vực của các hệ thống sông. Thí dụ,
ở Trung Quốc trong những năm gần đây tính trung bình thiệt hai do lũ lụt hàng năm
là hơn 200 tỷ Nhân dân tệ (Cheng, C.T. 2004). Trên thế giới vấn đề lũ lụt đã và đang
được nhiều cơ quan quan tâm cho tất cả các lưu vực sông có con người sinh sống. Vì
vậy, nghiên cứu về các biện pháp phòng và chống lũ đã và đang được nhiều cơ quan,
tổ chức thực hiện. Có rất nhiều dự án về phòng và chống lũ đã hoàn thành và nhiều
dự án đang được đầu tư để nghiên cứu và triển khai. Có thể liệt kê một số dự án lớn
trong những năm gần đây về phòng và chống lũ trên thế giới như sau:
Tại châu Âu: Dự án FLOODSITE được tổ chức thực hiện ngay sau khi thực hiện
các Dự án lớn như CADAM, IMPACT. Dự án FLODSITE được bắt đầu tổ chức thực
hiện từ 1/3/2004, thời hạn là 5 năm, kinh phí là 10 triệu Euros, bao gồm 35 nhiệm vụ
với 36 tổ chức và 150 các nhà khoa học và quản lý của 13 nước châu Âu tham gia.
Dự án đặt ra mục tiêu tập hợp các nhà khoa học và quản lý vào việc nghiên cứu và
giải quyết những vấn đề khoa học, công nghệ, chính sách bao gồm các khía cạnh vật
lý, môi trường, sinh thái, kinh tế-xã hội nhằm đề xuất biện pháp quản lý tổng hợp lũ
lụt. Dự án tiếp theo là Dự án NEWATER. Dự án được thực hiện từ 1/2005 đến
12/2008, với 37 tổ chức và khoảng 130 nhà khoa học nghiên cứu các phương pháp
và công cụ để có thể quản lý tổng hợp nguồn nước trong điều kiện bất định, trong đó
có vấn đề quản lý tổng hợp lũ lụt.
Ở Trung Quốc, nhận thức được tầm quan trọng của việc phòng và chống lũ, năm
1998 chính phủ Trung Quốc đã giao cho Cục Phòng chống Lũ lụt và Hạn hán Quốc
gia và 3 trường đại học: Đại học Công nghệ Đại Liên, Đại học Hồ Hải và Đại học
Thuỷ điện Vũ Hán thực hiện dự án: Hệ thống quản lý tích hợp kiểm soát lũ của các
hồ chứa (Integrated Management System for Flood Conrol of Reservoirs). Thời gian
thực hiện dự án là 5 năm 1998-2003. Mục tiêu của dự án là thiết lập hệ thống phần
mềm chuẩn kiểm soát lũ cho hệ thống đa hồ chứa, thu thập và sử lý số liệu tổng thể
theo thời gian thực, phân tích mưa, dự báo lũ, trao đổi dữ liệu trên toàn quốc thông
qua Cơ sở quản lý dữ liệu lớn trên máy tính. Kết quả của dự án là bộ chương trình
phần mềm và bộ cơ sở dữ liệu có thể sử dụng bởi trung tâm điều hành chống lũ và
các hồ chứa đơn lẻ. Kết quả của dự án đã được đăng tải trên nhiều tạp chí Khoa học
quốc tế.
Tại Mỹ: ngay từ năm 1968 Quốc hội Mỹ đã thông qua đạo luật Bảo hiểm lũ lụt
Quốc gia (P.L. 90-448). Các đạo luật tiếp theo liên tục được bổ sung (thí dụ năm 1973
thông qua đạo luật Bảo vệ thiên tai lũ lụt (PL 93-234). Các đạo luật này đã đề ra các
điều kiện bảo vệ người dân và cơ sở hạ tầng với mức lũ tần suất xuất hiện 100 năm.
Việc thực thi các đạo luật đã khuyến khích người dân di trú khỏi vùng ngập lụt nhờ
sự hỗ trợ tài chính của nhà nước và xây dựng các công trình đạt chuẩn đế giảm thiểu
tác hại do lũ gây ra.

Ở Canada có dự án thiết lập cụm công trình kiểm soát lũ để bảo vệ thành phố
Winnipeg bao gồm hồ chứa Shellmouth, kênh dẫn chuyển hướng dòng nước và hành
lang thoát lũ (dài 47 km) qua thành phố với mức lưu lượng tương đương trận lũ lịch
sử năm 1826. Sau trận lũ năm 1997 hành lang thoát lũ này đã được mở rộng để nâng
cao khả năng thoát lũ bảo đảm an toàn cho thành phố Winnipeg.
Tại Malaysia: sau trận mưa lớn và dài, với lượng mưa hàng trăm mm/ngày xảy
ra vào năm 2004, cả Thủ đô Kuala Lumpur từng lâm vào tình trạng ngập lụt nặng,
giao thông đình trệ, thiệt hại lớn. Trước tình hình này, chính quyền thành phố Kuala
Lampur đã cho phép Tập đoàn Gamuda cùng Công ty MMC thực hiện dự án theo
hình thức BOT, với tổng vốn khoảng 700 triệu USD. Đường hầm SMART có chiều
dài 4,7 km (đường hầm xa lộ dài 3km, 1,7 km đường dẫn), cao 13,2 m (2 tầng cho
giao thông, 1 tầng cho thoát nước khi mưa nhỏ) rộng 6,5 m (2 làn xe). Với hệ thống
công nghệ và kỹ thuật hiện đại, mọi thông tin liên lạc bằng di động và sóng radio đảm
bảo tốt trong SMART.
Tại Bangladesh: Là quốc gia thường xuyên đối mặt với lũ lụt do nằm ở vùng thấp
đồng bằng sông Hằng. Diện tích ngập lụt khoảng 25 - 30 % diện tích cả nước khi xảy
ra lũ lụt. Những trận lũ lớn (thí dụ như trận lũ năm 1968) đã làm ngập 2/3 diện tích
nước này. Các giải pháp phòng chống lũ tại Bangladesh bao gồm xây dựng 10.000
km đê, 3.500 km kênh tiêu, với khoảng 5.000 công trình tiêu úng, khoảng 100 trạm
bơm lớn và 1.250 công trình ngăn cửa sông để điều chỉnh nước.
Trong các dự án trên một trong những phương pháp quan trọng đã được sử dụng
là phương pháp mô hình hóa. Các mô hình thủy văn, thủy lực với các độ phức tạp
khác nhau đã được xây dựng. Theo các mô hình, các phần mềm tương ứng đã được
hình thành. Thí dụ như phân tích tổng quan về các mô hình lũ lụt đã và đang được
xây dựng và sử dụng ở các tổ chức tham gia dự án FLOODSITE (Bảng 1).
Nhiều phần mềm đã được các công ty phát triển thành các phần mềm tổng quát
và được phổ biến rộng rãi trên thế giới. Có thể liệt kê ở đây một số phần mềm đa dạng
về thủy văn và thủy lực của các công ty nổi tiếng sau:
 Phần mềm của Công ty DHI (Đan Mạch): Các phần mềm của DHI là các phần
mềm thương mại. Hiện nay các phần mềm của DHI là phần mềm thương mại
được khai thác sử dụng ở nhiều nước trên thế giới trong đó có Việt Nam. Giá
bản quyền của bộ phần mềm MIKE của DHI khá đắt và được chia theo các
option hỗ trợ nên mức giá khác nhau nhiều. Giá mô đun tính toán thủy lực một
chiều (MIKE11) và mô đun thủy văn (MIKE-NAM) được chào bán cho Viện
Cơ học (giữa năm 2018) là khoảng 1.6 tỷ đồng cho một người dùng. Nếu lựa
chọn bản tính toán hai chiều (MIKE21) và mô đun thủy văn (MIKE-NAM) thì
giá chào bán là khoảng 2.4 tỷ đồng. Hiện nay hầu hết các cơ quan nghiên cứu,
đào tạo cũng như tư vấn quy hoạch lũ lụt, thủy lợi đều mua bản quyền sử dụng
của phần mềm MIKE với các lựa chọn phù hợp với điều kiện tài chính và mục
đích sử dụng và tầm chi phí bỏ ra để mua bản quyền sử dụng nằm trong khoảng
từ 800 triệu đồng đến 8 tỷ đồng.

Bảng 1: Các Mô hình Thuỷ lực mô tả và dự báo lũ lụt được xây dựng và sử dụng
trong Dự án FLOODSITE
Comput
Exampl
Met Descripti ation
Application e Inputs Outputs
hod on time (as
Models
of 2006)
DEM Inundation
No
extent and
physical Broad scale Upstream
water depth
laws assessment of ArcGIS water
by
0D included flood extents Delta level Seconds
intersecting
in and flood mapper
Downstre planar water
simulatio depths.
am water surface with
ns.
level DEM
Surveyed
cross Water depth
sections and average
of velocity at
Design scale channel each cross
Solution Mike 11
modelling and section
of the HEC-
which can be floodplai
one- RAS Inundation
of the order n
dimensio SOBEK extent by
1D of 10s to 100s Minutes
nal St -CF Upstream intersecting
of km
Venant Infowor discharge predicted
depending on
equations ks RS hydrogra water depths
catchment
. (ISIS) phs with DEM
size.
Downstre Downstream
am stage outflow
hydrogra hydrograph
phs

Design scale
modelling
which can be
of the order
1D plus a
of 10s to 100s
storage
of km Mike 11
cell
depending on HEC-
approach
catchment RAS As for 1D As for 1D Minutes
1D+ to the
size, also has Infowor models models to hours
simulatio
the potential ks RS
n of
for broad (ISIS)
floodplai
scale
n flow.
application if
used with
sparse cross-
section data.
DEM
2D minus
Broad scale Upstream Inundation
the law of
modelling or discharge extent
conservat
urban hydrogra
ion of LISFLO Water depths
2D- inundation phs Hours
momentu OD-FP
depending on Downstream
m for the Downstre
cell outflow
floodplai am stage
dimensions. hydrograph
n flow. hydrogra
phs
Inundation
Design scale extent
modelling of DEM
Solution TUFLO Water depths
the order of
of the W Mike Upstream
10s km. May Depth-
two- 21 discharge
have the averaged
dimensio TELEM hydrogra
potential for velocities at Hours to
2D nal AC phs
use in broad each days
shallow SOBEK
scale Downstre computationa
wave -OF
modelling if am stage l node
equations Delft-
applied with hydrogra
. FLS Downstream
very course phs
grids. outflow
hydrograph

Predominantl
y coastal DEM
modelling Inundation
Upstream
applications extent
discharge
2D plus a where 3D hydrogra Water depths
solution velocity phs
for profiles are TELEM u, v and w
vertical important. AC 3D Inlet velocities for
2D+ velocity each Days
velocities Has also been Delft-
using applied to distributi computationa
3D
continuity reach scale on l cell
only. river Downstre Downstream
modelling am stage outflow
problems in hydrogra hydrograph
research phs
projects.
DEM
Upstream
discharge Inundation
3D hydrogra extent
solution phs Water depths
of the Local
Inlet u, v and w
three- predictions of
velocity velocities
dimensio three-
and and turbulent
nal dimensional
3D CFX turbulent kinetic energy Days
Reynolds velocity fields
averaged in main kinetic for each
Navier channels and energy computationa
Stokes floodplains. distributi l cell
equations on Downstream
. outflow
Downstre
am stage hydrograph
hydrogra
phs
 Phần mềm HEC-HMS của Công ty HEC (Mỹ): Các phần mềm của HEC là các
phần mềm được cung cấp miễn phí trên Internet. Các phần mềm của HEC có
ưu điểm là dễ sử dụng và miễn phí nên được sử dụng nhiều trong nghiên cứu,
đào tạo và ứng dụng thực tế. Các phần mềm của HEC có cộng đồng người sử
dụng lớn trên thế giới và cả ở Việt Nam. Khả năng tính toán của HEC là khá tốt

nhưng sự tiện dụng đối với người sử dụng thì không cao. Tuy nhiên vì là phần
mềm được miễn phí (trừ một số công cụ - tools phụ trợ phải trả phí) nên cộng
đồng người sử dụng bộ phần mềm HEC là khá đông. Bộ phần mềm HEC về cơ
bản có 4 sản phẩm chính gồm: HEC-HMS là mô hình thủy văn, HEC-RAS là
mô hình thủy lực, HEC-RASSIM là mô hình điều hành hồ chứa, Geo-HEC là
phần mềm hỗ trợ kết nối và hiển thị GIS.
 Phần mềm SOBEK (Úc)
 Các phần mềm của DELL là các phần mềm thương mại
Nhờ sự phát triển mạnh mẽ của công nghệ thông tin, đặc biệt là những tiến bộ
của máy tính điện tử, nhiều phần mềm thủy văn, thủy lực đã được sử dụng như một
công cụ chính trong dự báo và kiểm soát lũ lụt trên các lưu vực sông.
Dự đoán chính xác mực nước và lưu lượng là yêu cầu chủ yếu trong việc xây
dựng thành công một hệ thống quản lý và giảm nhẹ ảnh hưởng của lũ trong một lưu
vực sông. Ví dụ, dự báo chính xác mực nước sẽ làm cho việc quản lý các hồ chứa
hiệu quả hơn, từ đó cũng làm giảm thiểu nguy cơ lũ. Dự báo mực nước cũng cung
cấp các cảnh báo sớm về mức độ thiệt hại của lũ đối với đời sống cũng như tài sản
của người dân trong khu vực.
Nhìn chung, có ba hướng tiếp cập chính đối với việc dự báo lũ. Hướng tiếp cận
đầu tiên là dựa vào các mô hình vật lý, thứ hai là dựa vào cách tiếp cận thống kê và
thứ ba là dựa trên dữ liệu. Trong đó, hướng tiếp cận dựa trên các mô hình vật lý dựa
trên các công thức toán học về sự bảo toàn khối lượng, mô men và năng lượng. Chúng
được gọi chung là các mô hình thủy văn nếu chỉ xem xét bảo toàn khối lượng, và
được xem là mô hình thủy lực nếu như xem xét đến bảo toàn năng lượng. Hệ thống
phân tích thủy lực sông (Hydrologic Engineering Center’s River Analysis System)
phát triển bởi Mỹ (US Army Corps of Engineers) và phần mềm MIKE FLOOD phát
triển bởi Viện thủy lực Đan Mạch (Danish Hydraulic Institute) là các mô hình thủy
lực đã được sử dụng nhiều cho dự báo ngập lụt ở đồng bằng. Nhóm tác giả (Werner,
et al., 2006) đã tổng kết lại các mô hình thủy lực trong dự báo lũ. Ưu điểm của các
mô hình thủy lực đó là chúng biểu diễn được tính chất vật lý của hệ thống mà ta có
thể hiểu được. Những mô hình này cho phép trực quan hóa về lũ cả về mặt thời gian
và không gian và có thể mô hình hóa các quá trình vật lý như ảnh hưởng của lũ theo
các kịch bản vận hành khác nhau. Tuy nhiên, các mô hình thủy lực đòi hỏi một lượng
lớn dữ liệu để có thể mô tả đầy đủ về lưu vực và hệ thống sông vì sự đầy đủ ảnh
hưởng hưởng trực tiếp đến độ chính xác của mô hình dự báo. Trong khi trong nhiều
trường hợp, dữ liệu không đầy đủ và sẵn có. Thêm vào đó, việc hiệu chỉnh các mô
hình vật lý này đòi hỏi nhiều kinh nghiệm thực tiễn và thường cần nhiều thời gian để
tối ưu các tham số của mô hình. Trong hầu hết các trường hợp về dự báo lũ thời gian
thực, việc dự báo chính xác mực nước ở các vùng mục tiêu hoặc ở các trạm đo dọc
sông được quan tâm hơn là các quá trình thủy lực, thủy văn (Plate, 2007).
Bên cạnh việc sử dụng các mô hình thủy lực phục vụ việc dự báo mực nước và

lưu lượng tại các trạm đo hoặc vùng mục tiêu còn có hướng tiếp cận khác là các
phương pháp thống kê. Với hướng tiếp cận này đòi hỏi số liệu quan trắc của vùng
nghiên cứu phải đầy đủ và đủ dài. Ưu điểm của hướng tiếp cận này là quá trình phân
tích dự báo cho kết quả nhanh do quá trình này chỉ đơn thuần là phân tích trên cơ sở
dữ liệu lớn để đưa ra kết quả dự báo cho tương lai dựa trên các quan hệ này đã sảy
trong quá khứ.
Các hướng tiếp cận thống kê này bao gồm các phương pháp phân tích theo chuỗi
thời gian như mô hình trung bình trượt tự hồi quy (ARMA) hoặc mô hình ARMA với
các đầu vào ngoại suy, được giới thiêu bởi (Box and Jenkins, 1976). Các mô hình này
đã được sử dụng cho viêc dự báo mực nước và lưu lượng trên sông (Abrahart and
See, 2000). Tuy nhiên, những mô hình tự hồi quy tuyến tính này không biểu diễn tốt
được các tính chất động và phi tuyến ở mức độ cao trong quá trình lũ và do đó không
hoàn toàn phù hợp (Hsu, et al., 1995). Trong hai thập kỷ qua, các mô hình dựa trên
dữ liệu dựa trên các công cụ tính toán thông minh như mạng nơ ron nhân tạo (ANNs)
và các hệ thống suy luận mờ (FISs) đã được đưa vào sử dụng trong các ứng dụng mô
hình hóa thủy văn. Những công cụ thông minh này có thể học được các mối quan hệ
phi tuyến của các quá trình thủy lực, thủy văn. ANNs được phát minh dựa trên khả
năng học của người. Đó là một quá trình thay đổi các kết nối giữa các nơ ron trong
não người. Và do đó ANNs có thể học các cơ chế quan hệ cơ bản giữa đầu vào và
đầu ra (Dawson and Wilby, 1998). Trong khi đó, FIS là các mô hình định tính được
dựa trên khả năng suy luận của con người trong đó các hoạt động của hệ thống được
mô tả bằng ngôn ngữ tự nhiên (Takagi and Sugeno, 1985). Mô hình này hiện đang
được ứng dụng rộng rãi trong lình vực kỹ thuật tài nguyên nước (See and Openshaw,
1999; See and Openshaw, 2000; Xiong and O'connor, 2002). Gần đây, ANN và FIS
đã được tích hợp chung thành một hệ thông chung gọi là NFIS (neuro-FIS). Hệ thống
NFIS dựa trên mạng thích ứng được gọi là ANFIS được đề xuất bởi (Jang, 1993) là
một phiên bản nổi bật của NFIS. Năm 2005, (Nayak, et al., 2005) đã sử dụng ANFIS
để mô hình hóa quá trình mưa-dòng chảy của lưu vực Kolar (rộng 1350 km2) ở Ấn
độ cho dự báo lũ thời đoạn ngắn (16h). Kết quả của mô hình ANFIS đã cho thấy
tốt hơn so với các mô hình mạng nơ rơn và mờ hoạt động độc lập. Nhóm tác giả
(Chen, et al., 2006) đã phát triển mô hình ANFIS cho việc dự báo mực nước (dự báo
trước 13h) cho lưu vực sông Choshui (rộng 3157 km2) ở Đài Loan. Các tác giả đã
cho thấy rằng mô hình ANFIS tốt hơn mạng nơ ron nhân tạo lan truyền ngược thường
được sử dụng.
Thông thường, các mô hình theo chuỗi thời gian hồi quy tuyến tính như mô hình
tự hồi quy AR (Serban and Askew, 1991; Xiong and O'connor, 2002) hoặc ARMA
(Broersen, 2007) được sử dụng. Với mục đích này, AR hoặc ARMA được hiệu chỉnh
sau khi đã học (offline) sử dụng lỗi đầu ra và sau đó được sử dụng để dự đoán các lỗi
đầu ra của các mô hình dự đoán theo thời gian thực. Các lỗi dự đoán sau đó được
thêm vào các dự đoán ban đầu để đưa ra kết quả đầu ra mới của mô hình. Sự thành
công của quá trình cập nhật AR phụ thuộc chủ yếu vào mức độ tương quan trong lỗi
dự báo theo chuỗi thời gian của mô hình cơ sở (Shamseldin, 1997; Valença and

Ludermir, 2004). Trong các nghiên cứu mở rộng, (Shamseldin and O'CONNOR,
1999) đã sử dụng mô hình AR tuyến tính với đầu vào ngoại suy (ARX) để cập nhật
đầu ra. Trong thủ tục cập nhật của ARX, đầu ra chuỗi thời gian ban đầu được tạo bởi
mô hình cơ sở đóng góp cho các đầu vào ngoại suy, đầu vào này được sử dụng cùng
với các giá trị quan sát được sẵn có trong việc đưa ra kết quả dự báo cập nhật.
(Shamseldin and O'Connor, 2001) và (Shamseldin, 2010) đã sử dụng mô hình mạng
nơ ron, đây có thể được coi là dạng phi tuyến của mô hình ARX, thay cho ARX trong
việc cập nhật đầu ra.
Có rất nhiều các nghiên cứu dựa trên ANN trong việc mô hình hóa thủy văn dựa
trên dữ liệu, trong đó các nghiên cứu sử dụng NFIS cho mục đích này còn tương đối
ít (Maier, et al., 2010). Tuy nhiên, NFIS hứa hẹn là một công cụ hiệu quả bởi vì nó là
một hệ thống lai có được ưu điểm của cả ANN và FIS (Nayak, et al., 2005). Thêm
vào đó, các thủ tục cập nhật đầu ra đã được ứng dụng để cải thiện độ chính xác dự
báo trong nhiều nghiên cứu. Tuy nhiên, các mô hình cập nhật đầu ra đã áp dụng những
thủ tục này là chưa mang tính thích ứng. Điều này có nghĩa việc các tham số của mô
hình đã cập nhật là cố định sau khi đã hiệu chỉnh. Do đó, khi chúng được sử dụng
trong bài toán thời gian thực, các tham số này không thể tự điều chỉnh, thậm chí không
cải thiện được hiệu năng của mô hình.
Lãnh thổ Việt Nam trải dài trên 15 độ vĩ Bắc (từ 8 độ 30 phút đến 23 độ 20 phút)
và 7 độ kinh đông (từ 102 độ 10 phút đến 109 độ 20 phút) nên lũ lụt ở Việt Nam có
những đặc trưng riêng cho miền Bắc, cho miền Trung và cho miền Nam. Chiến lược
phòng tránh lũ lụt cho từng miền cũng khác nhau. Vùng đồng bằng Bắc Bộ và Bắc
Trung Bộ thực hiện phòng, chống lũ triệt để. Phương châm phòng, chống và giảm
nhẹ thiên tai cho vùng đồng bằng ven biển miền Trung và miền Đông Nam Bộ là
"Chủ động phòng, tránh, thích nghi để phát triển". Phương châm phòng, chống và
giảm nhẹ thiên tai cho vùng đồng bằng sông Cửu Long là “Sống chung với lũ” đảm
bảo an toàn để phát triển bền vững.
Đồng bằng Bắc Bộ là trung tâm chính trị, kinh tế, xã hội và văn hóa quan trọng
của nước ta. Trung tâm của đồng bằng Bắc bộ là thành phố Hà Nội, thủ đô của cả
nước với bề dày lịch sử hơn 1000 năm tuổi. Vì vậy, kiểm soát lũ lụt để bảo đảm an
toàn cho đồng bằng Bắc Bộ, an toàn tuyệt đối cho thủ đô Hà Nội, luôn được các cơ
quan liên quan quan tâm.
Đã có rất nhiều chương trình, dự án về phòng chống lũ ở đồng bằng Bắc bộ, đặc
biệt là các dự án điều hành hồ chứa trên thượng du. Có thể liệt kê sau đây một số
chương trình, dự án sau:
Chương trình Phòng chống lũ trên hệ thống sông Hồng của Bộ Nông nghiệp và
Phát triển Nông thôn 1999-2001. Trong dự án này đã tiến hành đo đạc một cách đồng
bộ mặt cắt trên các sông chính của hệ thống sông Hồng - sông Thái Bình.
Dự án "Quy trình vận hành liên hồ chứa trên sông Đà và sông Lô đảm bảo an
toàn chống lũ đồng bằng Bắc Bộ khi có các hồ Thác Bà, Hòa Bình, Tuyên Quang",
Chủ nhiệm dự án GS. TS. Nguyễn Tuấn Anh, Viện Khoa học Thủy lợi 2005-2006.

Dự án đã xây dựng "Quy trình vận hành liên hồ chứa thuỷ điện Hoà Bình, Tuyên
Quang, Thác Bà trong mùa lũ hàng năm". Qui trình đã được Chính phủ phê duyệt
(Quyết định số 80/2007/QĐ-TTg) và ban hành vào ngày 01/6/2007. Theo Quy trình
này các hồ chứa phải vận hành đảm bảo an toàn cho hạ du trong các trận lũ có tần
suất xuất hiện nhỏ hơn hoặc bằng 250 năm
Dự án "Quy trình vận hành liên hồ chứa trên sông Đà và sông Lô đảm bảo an
toàn chống lũ đồng bằng Bắc Bộ khi có các hồ Sơn La, Hòa Bình, Thác Bà và Tuyên
Quang", Chủ nhiệm dự án TS. Nguyễn Thái Lai, Bộ Tài nguyên và Môi trường 2009-
2010. Dự án đã xây dựng "Quy trình vận hành liên hồ chứa thuỷ điện Sơn La, Hoà
Bình, Thác Bà và Tuyên Quang trong mùa lũ hàng năm ". Qui trình đã được Chính
phủ phê duyệt (Quyết định số 198/QĐ-TTg) và ban hành vào ngày 10/02/2011. Theo
Quy trình này các hồ chứa phải vận hành đảm bảo an toàn cho hạ du trong các trận
lũ có tần suất xuất hiện nhỏ hơn hoặc bằng 500 năm.
Sông Đáy là một chi lưu chính của sông Hồng ở phía trên thủ đô Hà Nội. Lũ ở
sông Hồng được chuyển vào sông Đáy qua cụm công trình phân lũ gồm cống Hát
Môn, tràn Hát Môn và Đập Đáy để bảo vệ thủ đô Hà Nội. Theo Quyết định số
92/2007/QĐ-TTg phê duyệt Quy hoạch phòng, chống lũ hệ thống sông Hồng, sông
Thái Bình, ký ngày 21/6/2007, phân lũ là chuyển một phần lưu lượng lũ từ sông Hồng
vào sông Đáy qua cửa đập Đáy; chuyển một phần lưu lượng lũ từ sông Đà vào sông
Tích qua đoạn đê được chủ động phá vỡ bằng mìn tại Lương Phú. Phân lũ nhằm đảm
bảo an toàn cho hạ du. Với các trận lũ có tần suất xuất hiện nhỏ hơn hoặc bằng 200
năm. Với lưu lượng phân vào sông Đáy khoảng 3.200 m3/s, thì mực nước tại trạm
thủy văn Hà Nội không vượt quá 13,25 m.
Hiện nay nhiều hồ chứa lớn trên thượng du sông Hồng (trong đó có hồ Sơn La)
đã xây dựng xong và đi vào hoạt động các khu chậm lũ, trong đó có khu chậm lũ trên
sông Đáy đã được xóa bỏ (Quyết định số 1821/QĐ-TTg ngày 07/10/2014 Phê duyệt
Quy hoạch phòng, chống lũ và đê điều hệ thống sông Đáy). Theo Quyết định này khi
xảy ra lũ lớn cần phân vào sông Đáy tối đa 2.500 m3/s.
Vì sông Đáy có vai trò quan trọng trong phòng chống lũ trên hệ thống sông
Hồng, bảo đảm an toàn cho thủ đô Hà Nội, cho nên có rất nhiều đề tài nghiên cứu về
sử dụng tài nguyên nước trên sông Đáy. Có thể liệt kê ở đây một số đề tài sau:
Đề tài KC.08.12/06-10 “Nghiên cứu, đề xuất giải pháp, công trình khơi thông
dòng chảy, tăng khả năng chịu tải và tự làm sạch của các sông để bảo vệ môi trường
lưu vực sông Đáy, sông Nhuệ”. Chủ nhiệm đề tài: GS. TS Trần Đình Hợi. Cơ quan
chủ trì Viện Khoa học Thủy lợi Việt Nam. Thời gian thực hiện 2007-2010. Phạm vi
nghiên cứu của đề tài: lưu vực sông Đáy, sông Nhuệ. Đề tài đã đề xuất các giải pháp,
công trình khơi thông dòng chảy, tăng khả năng chịu tải và tự làm sạch của các sông
để bảo vệ môi trường sông Nhuệ, sông Đáy.
Đề tài KC.08.13/06-10 “Nghiên cứu cơ sở khoa học cho các giải pháp tổng thể
dự báo phòng tránh lũ lụt ở đồng bằng sông Hồng“ . Chủ nhiệm đề tài: GS. TSKH
Nguyễn Văn Điệp. Cơ quan chủ trì Viện Cơ học (Viện Hàn lâm Khoa học và Công

nghệ Việt Nam). Thời gian thực hiện 2007-2010. Phạm vi nghiên cứu của đề tài: Hệ
thống sông Hồng - sông Thái Bình. Trong mô hình thủy lực của đề tài này, phần sông
Đáy được mô tả chi tiết gồm sông Đáy, cụm công trình phân lũ, các phụ lưu sông
Tích - sông Bùi, sông Hoàng Long và các ô phân chậm lũ.
Đề tài độc lập cấp nhà nước “Nghiên cứu cơ sở khoa học cho việc xóa các khu
chậm lũ sông Hồng, sông Đáy và sông Hoàng Long”. Chủ nhiệm đề tài: GS.TS Hà
Văn Khối. Cơ quan chủ trì: Trường Đại học Thủy lợi. Thời gian thực hiện: 2008-
2009. Đề tài đã nghiên cứu một số giải pháp làm cơ sở khoa học cho việc xóa các khu
chậm lũ, trong đó giải pháp nâng cao hiệu quả cắt lũ của hồ chứa Hòa Bình - Sơn La,
phân lũ vào sông Đáy kết hợp với cải tạo lòng dẫn sông Đáy, sông Hoàng Long và
tạo dòng chảy thường xuyên cho dòng sông Đáy.
Nhiều nghiên cứu về thủy văn, thủy lực cho lưu vực sông Đáy đã được công bố.
Trong các nghiên cứu này, nhiều phần mềm thủy văn, thủy lực đã được áp dụng và
cho các kết quả tốt.
Hình 1: Lưu vực sông Tích - sông Bùi

Sông Tích - sông Bùi là một phụ lưu chính của sông Đáy. Sông Tích - sông Bùi
Bắt nguồn từ núi Tản Viên thuộc dãy núi Ba Vì theo hướng Tây Bắc - Đông Nam có
chiều dài 110 km đổ vào sông Đáy tại Ba Thá. Diện tích lưu vực 1350 km2, phần
phía bờ phải có diện tích 960 km2, phần phía bờ trái có diện tích 390 km2. Lưu vực
dài 75,5 km rộng 17,6 km, độ cao trung bình lưu vực 92 m, độ dốc trung bình lưu
vực 5,8%, mật độ lưới sông 0,66 km/km2. Sông Tích chảy qua nhiều vùng đồi, đất
cứng sức xói yếu. Tuy độ dốc của lòng sông Tích không lớn nhưng độ dốc của các
sông nhánh khá lớn, trung bình 10 ÷ 20 m/km, có suối tới 30 m/km (hình 1).
Ngoài các nghiên cứu kể trên thì hiện nay trên lưu vực sông Tích-sông Bùi cũng
đang triển khai một hệ thống thủy lợi lớn có tên gọi là “Dự án đầu tư tiếp nước, cải
tạo, khôi phục sông Tích”. Dự án cải tạo sông Tích là dự án nhóm A, có quy mô lớn,
phục vụ đa mục tiêu, thời gian thực hiện kéo dài, tổng mức đầu tư lớn, địa bàn triển
khai thực hiện dự án rộng, tính phức tạp cao, có tổng chiều dài trên 110km đi qua 07
huyện và Thị xã của thành Phố Hà Nội. Vì vậy để tạo điều kiện thuận lợi cho công
tác điều hành hoạt động của Ban nhằm thực hiện tốt nhiệm vụ được giao. Ngày
17/6/2011 UBND thành phố Hà Nội ra Quyết định số 2774/QĐ-UBND về việc thành
lập Ban quản lý dự án sông Tích Hà Nội thuộc Sở Nông nghiệp &PNT Hà Nội trên
cơ sở kiện toàn Ban Quản lý dự án đầu tư tiếp nước, cải tạo khôi phục sông Tích từ
Lương Phú, xã Thuần Mỹ, huyện Ba Vì, thành phố Hà Nội. Hệ thống thủy lợi của
Lưu vực song Tích-sông Bùi khá phức tạp do vừa phải đảm bảo việc tưới tiêu lại
phải đảm bảo chống lũ cho khu vực nội Hà Nội. Dự án lại đang trong giai đoạn triển
khai do vậy các số liệu về triển tiến độ công việc đã hoàn thành đến đâu cần phải
được cập nhật liên tục để tránh tình trạng ảnh hưởng của quá trình xây dựng đến việc
phòng chống lũ lụt trên lực vực này.
Tuy lưu vực sông Đáy đã được nghiên cứu nhiều, nhưng phụ lưu sông Tích -
sông Bùi chưa được quan tâm một cách đầy đủ. Một trong những lý do là tỷ lệ đóng
góp tổng lượng lũ cho sông Đáy của sông Tích - sông Bùi thường dduwwocj cho là
tương đối nhỏ.
Sau khi thủ đô Hà Nội được mở rộng, lưu vực sông Tích - sông Bùi là khu vực
hành chính của thành phố Hà Nội. Kinh tế, xã hội ở khu vực này đang thay đổi và
phát triển rất mạnh. Vì vậy, nguồn nước trên lưu vực sông Tích - sông Bùi cần được
bổ sung và bảo vệ phục vụ cho phát triển bền vững. Ngày 18/04/2015 trong chuyến
đi thị sát hiện trạng và các dự án chỉnh trị, giải pháp làm “hồi sinh” các đoạn tuyến
sông phía Nam và Tây Hà Nội, Phó Thủ tướng Hoàng Trung Hải đã có các đánh giá,
chỉ đạo đối với các dự án, giải pháp quan trọng trong bài toán cân bằng nước đối với
Hà Nội. Chính phủ sẽ sớm có các yêu cầu cụ thể đối với vấn đề này, và tinh thần
chính là đôn đốc sớm có nghiên cứu tổng thể, giải pháp hiệu quả và nhất là kết quả
triển khai cụ thể các giải pháp chỉnh trị các con sông trên địa bàn thủ đô, đảm bảo cân
bằng nước trên toàn hệ thống. Việc dự báo lũ sớm và cảnh báo ngập lụt cho lưu vực
sông Tích - sông Bùi là một vấn đề cấp bách nhằm hạn chế thiệt hại do thiên tai lũ lụt
có thể gây ra trong điều kiện phát triển mạnh mẽ của lưu vực.
Sông Tích - sông Bùi ở trên thượng du của sông Đáy, cần xây dựng mô hình

thủy văn, thủy lực chi tiết cho lưu vực này để có được thông tin tốt hơn trong nghiên
cứu và quản lý nguồn nước của sông Đáy. Bên cạnh các mô hình thủy văn và thủy
lực, việc xây dựng các mô hình học máy thống kê để có thể khai thác hiệu quả cơ sở
dữ liệu của lưu vực phục vụ công tác dự báo, cảnh báo lũ lụt trên lưu vực sông này là
cần thiết.

PHẦN 1
TỔNG QUAN VỀ SÔNG TÍCH BÙI VÀ GIẢI PHÁP
ĐỀ XUẤT CỦA ĐỀ TÀI

Chương 1
Tổng quan về lưu vực sông Tích-Bùi
1. Đặc điểm của lưu vực sông Tích-Bùi

1.1. Ví trí địa lý và đặc điểm tự nhiên của lưu vực
Sông Tích-Bùi nằm ở phía Tây của thủ đô Hà Nội, phía bờ hữu sông Đáy, cách
trung tâm thủ đô khoảng 30km. Tổng diện tích tự nhiên toàn khu vực là khoảng
1350km2 thuộc địa phận các huyện Ba Vì, Phúc Thọ, Thạch Thất, Quốc Oai, Chương
Mỹ, Mỹ Đức, Thị xã Sơn Tây, một phần đất của huyện Lương Sơn và một phần (sông
Bùi) thuộc địa phận tỉnh Hòa Bình. Đây là vùng có đặc điểm địa hình núi cao, trung
du và đồng bằng xen kẹp. Điều kiện tự nhiên ở đây rất phức tạp nhưng là khu vực có
tiềm năng cho sự nghiệp phát triển kinh tế không chỉ đối với thành phố Hà Nội mà là
cả vùng Thủ đô. Lưu vực sông Tích-Bùi nghiên cứu trong khuôn khổ đề tài này được
giới hạn bởi (Hình 1.1):
 Phía Bắc giáp tuyến đê hữu sông Hồng
 Phía Tây Bắc giáp tuyến đê hữu sông Đà
 Phía Đông giáp vùng tiêu sông Đáy
 Phía Nam và Tây Nam là gianh giới giữa tỉnh Hòa Bình và thành phố Hà Nội.
Toàn bộ hệ thống sông suối thuộc lưu vực sông Tích-Bùi chỉ có một hướng tiêu
thoát duy nhất là đổ vào sông Tích-Bùi và chảy ra sông Đáy tại Ba Thá. Vào mùa lũ,
khi mưa lớn trong nội đồng gặp mực nước sông Đáy dâng cao thì việc tiêu thoát
nước trên lưu vực bị cản trở khá nhiều. Vào mùa kiệt, do địa hình không bằng phẳng,
nước thất thoát nhiều, nguồn nước thiếu nghiêm trọng. Lưu vực có đặc điểm địa hình
phức tạp, bao gồm cả núi cao, núi thấp như vùng trung du và đồng bằng. Nếu chia ra
hai khu vực tả và hữu sông thì mỗi khu có đặc điểm địa hình khác nhau
 Khu vực vùng hữu sông Tích-Bùi có thể chia ra 3 loại địa hình:
- Khu vực núi cao với đỉnh Ba Vì có cao độ 2196m là nơi tập trung đất rừng
tự nhiên, có cả rừng trồng và đất nông nghiệp, tuy nhiên mức độ phân tán
cao, theo chủ yếu là dọc theo các thung lũng nhỏ và khe suối.
- Khu vực gò đồi, có cao độ từ 5-20m, chủ yếu là đất trống đồi trọc, có trồng
cả lúa và màu, địa hình dốc, độ xói mòn lớn, cây trồng đa dạng nhưng do
tính chất đất nên năng suất thấp.
- Khu vực đồng bằng là vùng ven sông Tích, có cao độ dưới 6m, nhiều vùng
có cao độ từ 2 - 3m, cây trồng chủ yếu là lúa, một số nơi đất cao có trồng
cây ăn quả, màu.

 Khu vực tả sông Tích-Bùi: hầu hết là đồng bằng và bãi sông chạy dọc theo chiều
dài sông Tích, thế dốc từ sông Hồng, sông Đáy vào sông Tích và dốc dần từ
thượng nguồn về cửa ra của sông tại Ba Thá, cao độ đất đai biến đổi từ 11-13m
thuộc Ba Vì đến 2-3m thuộc Chương Mỹ. Khu vực từ đường Quốc lộ 6 trở lên
đã được bao đê chống lũ, từ dưới đường quốc lộ 6 xuống đến Ba Thá chỉ có đê
bao địa phương do dân trong vùng tự đắp để chống lũ nội tại của sông Tích-Bùi
và sông Đáy, đây là khu vực trũng và là khu chậm lũ khi có phân lũ từ sông
Hồng vào sông Đáy.
Hình 1: Phạm vi nghiên cứu của đề tài
1.2. Đặc điểm về khí tượng thủy văn và thủy hệ

 Chế độ khí hậu:
Chế độ khí hậu lưu vực sông Tích-Bùi trên nền khí hậu chung của đồng bằng
o
Bắc Bộ. Nhiệt độ trung bình năm khoảng 23 C. Biên độ thay đổi của nhiệt độ khá
o
lớn. Nhiệt độ trung bình tháng I xuống tới 15,5 C và nhiệt độ trung bình tháng VII
o
lên tới 29 C. Nếu lấy những nhiệt độ cực đoan thì chúng ta lại có những số liệu bất
o
thường hơn: Nhiệt độ cực tiểu tháng I có thể xuống tới 2,7 C (tháng I-1955) và nhiệt
o
độ cực đại lên đến 42,8 C.

Mùa mưa ở đây bắt đầu từ tháng V đến tháng X. Lượng mưa trung bình nhiều năm
khỏang 1900mm, dao động từ 1500 đến 2200mm. Trong lưu vực có tâm mưa lớn
thuộc vùng núi Ba Vì, với lượng mưa trung bình nhiều năm là 2500mm. Đã có một
số trận mưa với cường độ lớn xẩy ra trên lưu vực, như: trận mưa ngày 24/7-1980 tại
Quảng Oai, lượng mưa một ngày lớn nhất đạt tới 724mm, ngày 2/9-1975 tại Minh
Quang (Ba Vì): 701mm. Lượng mưa trong mùa mưa chiếm tới 80-85% lượng mưa
cả năm. Mùa ít mưa bắt đầu từ tháng XI đến cuối tháng IV, lượng mưa chỉ chiếm 15-
20% và mưa ít nhất là vào tháng I và tháng II. Mưa lớn nhất thường tập trung vào 3
tháng VII, IX, X. Lượng mưa 3 tháng này thường chiếm từ 50-55% lượng mưa cả
năm. Lượng bốc hơi trung bình nhiều năm trong lưư vực thay đổi từ 700 đến
1000mm/năm. Lượng bốc hơi lớn nhất vào các tháng mùa hè, do độ ẩm và nhiệt độ
không khí cao. Khả năng bốc hơi thấp nhất vào các tháng I và tháng II trong năm.
 Chế độ thủy văn:
Chế độ thuỷ văn lưu vực sông Tích-Bùi cũng trên nền chế độ thuỷ văn vùng
đồng bằng Bắc Bộ. Mùa lũ thường bắt đầu từ tháng VI,VII và kết thúc vào tháng
X,XI. Lượng dòng chảy mùa lũ thường chiếm từ 75-85% lượng dòng chảy năm.
Tháng có dòng chảy lớn nhất là tháng VII hoặc tháng IX và tháng II là tháng thường
có lượng dòng chảy nhỏ nhất trong năm.
Xét về quan hệ mưa lũ trên hai lưu vực sông Hồng và sông Tích-Bùi cho thấy:
mùa lũ cùng trong thời gian từ tháng VI đến tháng X và mùa mưa từ tháng V đến
tháng X. Song tháng có dòng chảy lớn nhất trên sông Hồng là tháng VIII, nhưng trên
sông Tích-Bùi lại là tháng VII và tháng IX. Tháng VIII trên lưu vực sông Hồng
thường sẩy ra những trận lũ đặc biệt lớn do các hoạt động của các hình thái thời tiết
gây ra trong mùa mưa lũ. Với lưu vực sông Tích-Bùi, vào tháng IX thường có nhiều
bão trực tiếp ảnh hưởng tới vùng núi Hoà Bình và Ba Vì (Hà Nội) gây mưa lớn trên
lưu vực sông này. Lượng mưa bão trong tháng IX ở lưu vực sông Tích-Bùi thường
lớn gấp hơn hai lần so với tháng VIII. Vào tháng VII do dông bão tạo nên tâm mưa
Ba Vì và Hoà Bình, vì vậy cũng thường gây ra mưa lớn trên lưu vực sông Tích-Bùi.
Đối với những trận lũ lớn ở trên hai lưu vực cùng do một trận bão gây nên thì
lũ trên sông Hồng (tại Sơn Tây) thường xuất hiện sau lũ sông Tích-Bùi (tại Ba Thá)
từ 3 đến 5 ngày. Nguyên nhân là do hướng di chuyển của bão từ biển vào lục địa và
thời gian chuyền lũ trên hai sông chênh nhau rất lớn. Và còn do những trận lũ đặc
biệt lớn xẩy ra trên sông Hồng gây nên bởi các hình thái thời tiết phối hợp hoạt động,
cũng lệch pha với lũ lớn xuất hiện trên sông Tích-Bùi. Như vậy trong mọi nguyên
nhân gây nên lũ lớn thì lũ sông Hồng (tại Sơn Tây) và lũ sông Tích-Bùi đều xuất hiện
lệch pha nhau. Vì vậy, khi phân lũ vào sông Tích-Bùi và sông Đáy từ sông Hồng, hầu
như ít gặp lũ nội đồng trong lưu vực hệ thống sông này.

 Hệ thống trạm quan trắc

Trong vùng dự án có khá nhiều trạm khí tượng, thủy văn, đa số là các trạm do
Tổng cục Khí tượng Thủy văn quản lý, thời gian đo dài năm, chất lượng đo đạc đảm
bảo. Bảng 1.1 dưới đây là danh sách các trạm khí tượng và thủy văn trực tiếp liên
quan và thuộc khu vực nghiên cứu của đề tài.
Bảng 1.1: Các trạm Khí tượng, thủy văn có trong lưu vực
TT Tr¹m YÕu tè Thêi gian

X 1956  nay
1 S¬n T©y
T, U, V, Z 1961  nay
X 1960  nay
2 Hµ §«ng
T, U, V, Z 1973  nay
1961  1962
3 Chóc S¬n X
1964  nay
4 Quèc Oai X 1974  nay
5 Th¹ch ThÊt X 1960  nay
6 Suèi Hai X 1973  nay
7 L©m S¬n Q 1970  nay
8 Ba Th¸ H 1960  nay
9 Nam §Þnh H 1959  nay
10 BÕn §Õ H 1961  nay
11 Nh- T©n H 1958  nay
12 Trung Hµ H, Q 1956  nay
13 Hßa B×nh H, Q 1956  nay
14 ChÝ Thñy H 1973  nay
15 L-¬ng S¬n X 1959  nay
16 Ba V× X 1962  nay
Ghi chú:
- T: Nhiệt độ không khí (0C)
- S: Số giờ nắng (giờ)
- U: Độ ẩm không khí (%)
- V: Tốc độ gió (m/s)

- Z: Bốc hơi (mm)

- X: Lượng mưa (mm)
- H: Mực nước (cm)
- Q: Lưu lượng nước (m3/s)
 Thủy hệ
Hệ thống sông Tích-Bùi chủ yếu là một nhánh chính kéo từ cống Lương Phú về
đến Ba Thá và hợp lưu với sông Đáy. Dọc theo tuyến sông có một số sông nhánh,
suối gia nhập vào sông Tích. Đây là các lưu vực có ảnh hưởng đáng kể đến quá trình
tưới tiêu của hệ thống sông chính. Các đặc trưng lưu vực của các nhập lưu được thống
kê trong Bảng 1.2 như sau:
Bảng 1.2: Các tiểu lưu vực chính của lưu vực sông Tích-Bùi
STT Lưu vực Flv(km2) Lc(km) SLn(km) Js(‰) Jd(‰)

1 Hoàng Văn Thụ 113,4 27,5 48,4 3,4 108
2 Tân Tiến 12,7 6,4 7,1 3,2 97,0
3 Lương Sơn 210,4 35,0 188,0 3,1 105
4 Xuân Mai 11,9 9,0 2,3 3,5 102
5 Đội Phú 21,0 7,5 11,0 3,7 108
6 Phú Ban 26,4 13,0 13,4 3,2 116
7 Giã Cát 30,3 15,0 10,2 3,6 102
8 Linh Sơn 56,5 17,0 24,6 3,5 95,0
9 Sông Hang 70,3 15,0 28,0 3,2 118
10 Hồ Đồng Mô 103,4 15,0 35,0 3,7 110
11 Hồ Suối Hai 63,7 11,0 20,0 3,1 103
12 Đầm Long 28,6 6,3 14,0 3,0 106
13 Xuân Khánh 16,1 6,0 6,5 2,9 110
2. Dự án cải tạo sông Tích-Bùi

Để tăng cường khả năng thoát lũ trong mùa mưa và lấy nước sông Đà vào tưới
tiêu cho vùng nông nghiệp phía tây sông Đáy (thuộc lưu vực sông Tích-Bùi) trong
mùa hạn dự án “Tiếp nước, cải tạo khôi phục sông Tích” từ Lương Phú,
xã Thuần Mỹ, huyện Ba Vì-Thành phố Hà Nội đến Ba Thá (hợp lưu với sông Đáy)
đã được phê duyệt thực hiện với tổng kinh phí nhiều nghìn tỷ đồng.
Dự án được chia làm ba đoạn:

- Đoạn 1: Từ cống Lương Phú (lấy nước từ sông Đà) đến Đường Lâm (Sơn Tây).
Với đoạn này hầu như là đào đắp để tạo hình lòng dẫn cho sông và xây dựng
công trình đầu mối tiếp nước từ sông Đà (cống Lương Phú)
- Đoạn 2: Từ Đường lâm đến Cầu Trắng (hết địa phận thị xã Sơn Tây). Đoạn này
chủ yếu nạo vét mở rộng lòng dẫn sông Tích và xây dựng các cầu cống.
- Đoạn 3: Từ Cầu Trắng đến Ba Thá. Đoạn này do lòng dẫn hiện tại của sông khá
rộng nên chủ yếu là nạo vét lòng dẫn chính của sông Tích-Bùi để đảm bảo độ
dốc đều của lòng dẫn và thoát lũ.
Hiện nay mới chỉ có đoạn 1 của dự án đang được thi công còn các đoạn 2 và
đoạn 3 chưa tiến hành. Trong khi đó đoạn một cũng chưa thông tuyến do còn vướng
mắc một số cầu cống và đường bắc ngang. Chính vì vậy việc thoát nước lũ của sông
Tích-Bùi vẫn chưa có sự cải thiện nào từ dự án cải tạo này.
3. Tính hình lũ lụt của lưu vực sông Tích-Bùi
Trong những năm gần đây do ảnh hưởng của tình trạng biến đổi khí hậu toàn
cầu nên diễn biến của lũ lụt trên lưu vực sông Tích-Bùi cũng có những dấu hiệu cực
đoan và gia tăng. Tiêu biểu có thể thấy trong hai năm liên tiếp là 2017 và 2018 đều
sảy ra lũ lớn gây ngập lụt diện rộng trên lưu vực sông này.
Hình 1.2: Đoạn đê bị sạt gây tình trạng ngập lụt năm 2017 (nguồn VOV)

Năm 2017 tình trạng ngập lụt do một đoạn đên bị sạt vì nước tràn qua mặt đê.
Theo báo cáo của Chủ tịch UBND huyện Chương Mỹ Đinh Mạnh Hùng, mưa lớn đã
làm ngập khoảng 92ha lúa mùa chưa kịp thu hoạch; khoảng 842,4ha cây vụ Đông bị
hư hỏng; diện tích cây ăn quả bị ngập khoảng 63,8ha; diện tích thủy sản bị ngập
khoảng 125ha. Trên địa bàn huyện, mưa lũ đã làm chết 178 con gia súc, 9.700 con
gia cầm. Đặc biệt, có 9.900 mét đê bị ngập, bao gồm các địa bàn: Thị trấn Xuân Mai
và các xã: Thủy Xuân Tiên, Tân Tiến, Nam Phương Tiến, Mỹ Lương, Hoàng Văn
Thụ, Tốt Động, Thanh Bình và Đông Sơn… Như vậy có thể thấy ngập lụt năm 2017
là do lượng nước trong sông bị tràn ra và nguồn nước lũ được hình thành từ thượng
nguồn (phía núi Ba Vì đổ về).
Còn năm 2018, do mưa to cả phần thượng nguồn sông Tích (núi Ba Vì) và phần
thượng nguồn sông Bùi (phía Hòa Bình) nên tình trạng ngập lụt đã trở nên rất nặng
nề và kéo dài trong nhiều ngày.
Hình 1.3: Khu vực hữu sông Bùi (của sông Tích-Bùi) ngập diện rộng, đê hữu bị
nằm dưới mực nước lũ (nguồn: internet)
Theo thống kê của thành phố Hà Nội thì diện tích ngập là khá lớn: Tổng diện
tích là 2.006ha sản xuất nông nghiệp bị úng ngập; trong đó, các huyện còn nhiều diện
tích là Chương Mỹ (714ha), Quốc Oai (481ha), Ba Vì (466ha), Sơn Tây (133ha),
Thạch Thất (132ha). Trong khi đó đê tả của sông Tích-Bùi có nhiều đoàn bị tràn (phải
đắp bao cát để nâng cao độ đê) với độ chênh mực nước sông với mặt đê khá lớn.
Nhiều khu vực ngập ghi nhận độ sâu ngập đến hơn 3m.
Do ảnh hưởng của hai trận mưa cách nhau khoảng gần 10 ngày làm cho tình
trạng ngập úng năm 2018 đã kéo dài nhiều ngày gây thiệt hại về kinh tế và ảnh hưởng
nghiêm trọng đến môi trường sống của người dân huyện Chương Mỹ. Nhiều tuyến
giao thông đi qua khu vực này cũng bị gián đoạn nhiều ngày.

Hình 1.4: Đê tả sông Tích-Bùi được gia cố bằng bao cát để chống bị nước tràn
trong trận lũ năm 2018
Có thể thấy tình trạng lũ lụt của lưu vực sông Tích-Bùi đã đến mức nguy hiểm
và cần có các giải pháp về lâu dài để giải quyết vấn đề này. Tuy nhiên, do đặc thù của
khu vực này có nền địa hình thấp chỉ khoảng 3m đến 6m thấp hơn mực nước sông
trong mùa lũ. Hơn thế khu vực Ba Tha có thiết diện lòng sông hẹp lại bị ảnh hưởng
của thủy triều nên khả năng thoát nước chậm.
Để có được giải pháp dài hạn và toàn diện cho bài toán lũ lụt sông Tích-Bùi thì
cần rất nhiều thời gian và kinh phí. Chính vì vậy trước mắt để hạn chế các thiệt hại
do lũ lụt gây ra cũng như hỗ trợ công tác ứng phó sớm với lũ lụt ở khu vực này thì rất
cần các dự báo có độ chính xác cao và sớm tình trạng lũ lụt của khu vực này. Và mục
tiêu của đề tài này cũng nhằm góp phần nhỏ để giải quyết vấn đề đó.

Chương 2
Giải pháp đề xuất của đề tài
1. Mục tiêu của đề tài

Để hỗ trợ công tác phòng chống thiên tai giúp giảm thiểu các thiệt hại về người
và của do lũ lụt gây ra trên lưu vực sông Tích-Bùi, nhóm nghiên cứu của Viện Cơ
học thuộc Viện Hàn lâm Khoa học và Công nghệ Việt Nam thực hiện đề tài cấp thành
phố Hà Nội do Sở Khoa học và Công nghệ Hà Nội quản lý với mục tiêu: “Xây dựng
công nghệ bao gồm: giải pháp, qui trình, phần mềm kết nối các mô hình thủy
văn, thủy lực, các mô hình học máy thống kê tiên tiến cho phép dự báo lũ trên các
sông Tích - sông Bùi và cảnh báo ngập lụt trên lưu vực các sông này phục vụ công
tác phòng chống lụt bão và giảm nhẹ thiên tai cho khu vực phía Tây Nam thành
phố Hà Nội”.
Tuy lưu vực sông Đáy đã được nghiên cứu nhiều, nhưng phụ lưu sông Tích - sông
Bùi chưa được quan tâm một cách đầy đủ. Một trong những lý do là tỷ lệ đóng góp
tổng lượng lũ cho sông Đáy của sông Tích - sông Bùi được cho là tương đối nhỏ.
Sau khi thủ đô Hà Nội được mở rộng, lưu vực sông Tích - sông Bùi là khu vực
hành chính của thành phố Hà Nội. Kinh tế, xã hội ở khu vực này đang thay đổi và
phát triển rất mạnh. Vì vậy, nguồn nước trên lưu vực sông Tích - sông Bùi cần được
bổ sung và bảo vệ phục vụ cho phát triển bền vững. Ngày 18/04/2015 trong chuyến
đi thị sát hiện trạng và các dự án chỉnh trị, giải pháp làm “hồi sinh” các đoạn tuyến
sông phía Nam và Tây Hà Nội, Phó Thủ tướng Hoàng Trung Hải đã có các đánh giá,
chỉ đạo đối với các dự án, giải pháp quan trọng trong bài toán cân bằng nước đối với
Hà Nội. Chính phủ sẽ sớm có các yêu cầu cụ thể đối với vấn đề này, và tinh thần
chính là đôn đốc sớm có nghiên cứu tổng thể, giải pháp hiệu quả và nhất là kết quả
triển khai cụ thể các giải pháp chỉnh trị các con sông trên địa bàn thủ đô, đảm bảo cân
bằng nước trên toàn hệ thống. Việc dự báo lũ sớm và cảnh báo ngập lụt cho lưu vực
sông Tích - sông Bùi là một vấn đề cấp bách nhằm hạn chế thiệt hại do thiên tai lũ lụt
có thể gây ra trong điều kiện phát triển mạnh mẽ của lưu vực.
Sông Tích - sông Bùi ở trên thượng du của sông Đáy, cần xây dựng mô hình thủy
văn, thủy lực chi tiết cho lưu vực này để có được thông tin tốt hơn trong nghiên cứu
và quản lý nguồn nước của sông Đáy. Bên cạnh các mô hình thủy văn và thủy lực,
việc xây dựng các mô hình học máy thống kê để có thể khai thác hiệu quả cơ sở dữ
liệu của lưu vực phục vụ công tác dự báo, cảnh báo lũ lụt trên lưu vực sông này là
cần thiết.
Để có thể dự báo lũ trên sông và cảnh báo ngập lụt trên lưu vực sông Tích –sông
Bùi cần phải thiết lập một mô hình tính toán số cho phép mô phỏng dòng chảy hình

thành từ mưa trên lưu vực và các dòng chảy vào lưu vực (tại khu vực lấy nước trên
sông Đà) và các dòng chảy ra khỏi lưu vực (đổ vào sông Đáy). Mô hình tính toán số
này gồm ba phần chính là:
- Mô hình thủy văn
- Mô hình thủy lực kết nối hệ thống ô chứa (thủy lực một chiều giả hai chiều)
- Mô hình điều khiển dòng chảy qua công trình và các mô đun giao diện, phụ
trợ, …
Mô hình thủy văn phân bố Marine là mô hình phù hợp cho việc thu gom nước mưa
trên phần lưu vực có độ dốc cao và tập trung vào các nhánh sông suối.
Mô hình Thủy lực 1D mở rộng IMech1D sẽ được sử dụng để diễn toán dòng chảy
trong hệ thống sông suối và kênh mương thủy lợi trên lưu vực nghiên cứu. Khu vực
đồng bằng sẽ được phân chia thành hệ thống các ô chứa và kết nối với với mô hình
thủy lực thông qua các công trình như đập tràn, cống, …
Việc điều hành dòng chảy qua các công trình cũng như điều hành các hồ chứa
trong lưu vực sẽ được xử lý trong các mô đun phụ trợ.
Bên cạnh đó để khắc phục tình trạng một số khu vực thiếu số liệu phục vụ việc
tính toán bằng mô hình vật lý nêu trên thì cần thiết phải có các công cụ khác cho phép
dự báo, cảnh báo lũ lụt dựa trên các kinh nghiệm đúc rút được. Đó chính là các mô
hình học máy (Machine Learning). Trong nghiên cứu này, chúng tôi sẽ khảo sát các
phương pháp học máy tiên tiến như ANN, máy véc-tơ hỗ trợ, rừng ngẫu nhiên,
boosting, .. cho bài toán dự báo với dữ liệu theo chuỗi thời gian. Sau đó chúng tôi sẽ
thử nghiệm từng phương pháp cho bài toán dự báo lũ theo các kịch bản khác nhau.
Từ đó, chúng tôi sẽ lựa chọn được mô hình học máy phù hợp nhất với bài toán. Chúng
tôi cũng sẽ phát triển một mô đun phần mềm dựa trên các mô hình đã được lựa chọn.
Kết quả của mô hình được lựa chọn sẽ được so sánh với các kết quả khác để đảm bảo
sự tin cậy của mô hình được chúng tôi phát triển trong khuôn khổ đề tài nghiên cứu
này.
2. Giải pháp đề xuất của đề tài
Để thực hiện các mục tiêu đề ra của đề tài. Nhóm nghiên cứu đã đề xuất một
giải pháp là xây dựng công cụ (phần mềm chuyên dụng) hỗ trợ công tác dự báo và
cảnh báo lũ lụt trên lưu vực sông Tích-Bùi phù hợp với điều kiện số liệu hiện có và
đáp ứng được yêu cầu là cảnh báo và dự báo sớm 6h, 12h, 18h và 24h tình trạng lũ
lụt trên lưu vực sông này.
Để có thể dự báo được trước tình trạng lũ lụt trên lưu vực sông này chúng tôi
đề xuất hai gải pháp. Trong đó một giải pháp chính và một giải pháp thử nghiệm.
Hình 2.1 dưới đây là sơ đồ các thành phần chính của giải pháp mà đề tài đề xuất.
Giải pháp chính là sử dụng các mô hình tính toán dựa trên các mô hình vật lý đó
là sự kết hợp giữa mô hình Thủy văn phân bố và mô hình thủy lực một chiều mở rộng.

Đây là hai mô hình đã và đang được Viện Cơ học nghiên cứu và phát triển. Các mô
hình này cũng đã được cộng đồng khoa học trong nước và ngoài nước đánh giá cao.
Mưa (thực đo và dự báo)
MÔ HÌNH THỦY
MÔ HÌNH
VĂN
HỌC MÁY
(thu gom nước mưa
trên lưu vực và tập (sử dụng số
trung ra đầu /ven các liệu mưa và
số liệu mực
sông suối)
nước tại Ba
Thá
CƠ SỞ
DỮ LIỆU
MÔ HÌNH THỦY
LỰC
(nhận nước từ mô hình
thủy văn và diễn toán
dòng chảy trong sông từ
thượng lưu đến hạ lưu)
DỰ BÁO CẢNH BÁO

Dự báo mực nước trong sông (tại Ba Thá, …)
và cảnh báo ngập lụt khu vực ngoài sông
Hình 2.1: Sơ đồ giải pháp của đề tài

Mô hình thứ hai được sử dụng đó là mô hình học máy. Đây là một mô hình mới
trong dự báo thủy văn thủy lực sử dụng các tiến bộ trong lĩnh vực tin học đó là trí tuệ
nhân tạo (AI). Chính vì là mô hình mới tronh lĩnh vực dự báo thủy văn thủy lực ở
Việt Nam nên nhóm nghiên cứu cũng muốn được đưa vào thử nghiệm đối với hệ
thống sông Tích-Bùi.
Theo sơ đồ giải pháp (Hình 2.1) thì thành phần tính toán chính của công cụ được
xây dựng gồm ba phần mềm tính toán số đó là:
- Mô hình thủy văn
- Mô hình thủy lực
- Mô hình học máy
Ngoài ba phần mềm tính toán chính thì còn một phần mềm quản lý cơ sở dữ
liệu phục vụ cho việc truy vấn sử dụng một số dữ liệu được thu thập, xử lý trong
khuôn khổ đề tài. Cơ sở dữ liệu này cũng được kết nối trực tiếp với các chương trình
tính toán để tính các kịch bản được thiết lập trên cơ sở các số liệu lũ lịch sử.
Để để kết nối các mô này thành một công cụ tiện lợi thì còn nhiều mô đun khác
được xây dựng và tích hợp vào như:
- Quản lý dữ liệu
- Trình diễn kết quả
- Giao diện GIS
- Dòng chảy qua các công trình
Bên cạnh việc xây dựng các mô đun thì nhóm nghiên cứu còn ứng dụng kỹ thuật
tính toán song song để nâng cao hiệu quả sử dụng tài nguyên của thiết bị đồng thời
làm giảm thời gian tính toán nhằm đưa ra kết quả cảnh báo và dự báo một cách nhanh
nhất có thể.
3. Phương pháp nghiên cứu
Để thực hiện mục tiêu và các nhiệm vụ đã đặt ra của đề tài. Nhóm nghiên cứu
thực hiện đề tài sẽ sử dụng một số phương pháp sau đây kết hợp để thực hiện:
- Phương pháp mô hình hóa: Mô hình hóa sự vận động của nước trên bề mặt lưu
vực thành các mô hình toán lý để giải.
- Phương pháp mô phỏng: Mô phỏng lại các quá trình mưa lũ để thấy được bức
tranh toàn cảnh và rõ ràng của sự vật hiện tượng cần nghiên cứu
- Phương pháp thống kê
- Phương pháp tổng hợp và phân tích

Chương 3
Thu thập dữ liệu
1. Thu thập dữ liệu địa hình

Trong khuôn khổ đề tài nghiên cứu này nhóm nghiên cứu đã thực hiện hai lần
thu thập số liệu địa hình.
Lần đầu nhóm nghiên cứu thu thập số liệu địa hình là bản đồ địa hình (dưới
dạng đường bình độ và các điểm độ cao) của khu vực đồi núi với tỷ lệ 1:50 000 và
khu vực đồng bằng với tỷ lệ 1:1 0000. Sau đó xử lý dữ liệu này để thu được mô hình
số độ cao DEM phục vụ cho các việc tiếp theo của các mô hình tính toán
Hình 3.1: Bản đồ địa hình được thu thập ban đầu
Khi sử dụng bản đồ DEM được xây dựng như đã nói ở trên thì mô hình thủy
văn vẫn tính toán tốt. Nhưng nhóm nghiên cứu gặp khó khăn trong việc xử lý số liệu
ô chứa ở khu vực đồng bằng. Chính vì vậy nhóm nghiên cứu đã mua bản đồ số DEM
với độ phân giải 30x30 của toàn bộ khu vực nghiên cứu của Trung tâm thông tin bản

đồ, Bộ Tài nguyên và Môi trường. Bản đồ DEM mới có chất lượng khá tốt, phản ánh
khá trung thực các phần địa hình trên thực tế.
Hình 3.2: Bản đồ địa hình DEM mới có độ phân giải 30x30
Ngoài việc thu thập bản đồ địa hình lưu vực, nhóm nghiên cứu cũng thu thập thêm
nhiều thông tin khác liên quan đến địa mạo và đặc điểm của lưu vực phục vụ cho việc
xử lý số liệu đầu vào cho mô hình tính toán. Ví dụ như các thông tin về một số tiểu
lưu vực bộ phận của khu vực nghiên cứu trong Bảng 3.1 dưới đây:
Bảng 3.1: Đặc trưng hình thái lưu vực
TT Tên lưu vực Flv Lc SLn Js Jd

1 Đầm Long 28,6 6,3 14,0 3,0 106
2 Hồ Suối Hai 63,7 11,0 20 3,1 103
3 Xuân Khánh 16,1 6,0 6,5 2,9 110
4 Sông Hang 70,3 15,0 28 3,2 118
5 Hồ Đồng Mô 103,4 15,0 35 3,7 110
6 Linh Sơn 56,5 17,0 24,64 3,5 95
7 Giã Cát 30,3 15,0 10,17 3,6 102
8 Phú Ban 26,4 13,0 13,41 3,2 116

9 Đội Phú 21 7,53 11 3,7 108

10 Xuân Mai 11,9 9,0 2,3 3,5 102
11 Lương Sơn 210,4 35,0 188 3,1 105
12 Tân Tiến 12,7 6,4 7,1 3,2 97
13 Hoàng Văn Thụ 113,4 27,5 48,4 3,4 108
2. Thu thập bản đồ hiện trạng sử dụng đất và bản đồ phân loại đất
Bản đồ hiện trạng sử dụng đất và bản đồ phân loại đất được thu thập phục vụ
tính toán trong khuôn khổ đề tài nghiên cứu này là:
- Bản đồ hiện trạng sử dụng đất được cung cấp bởi Viện khoa học Khí tượng
Thủy văn và Biến đổi khí hậu. Đây là bản đồ có tỷ lệ 1:50 000
- Bản đồ phân loại đất được cung cấp bởi Viện nghiên cứu Nông hóa thổ nhưỡng
có tỷ lệ 1:50 000
Hình 3.3: Bản đồ hiện trạng sử dụng đất

Cả hai bản đồ này đều đều được xây dựng năm 2015. Trong đó Bản đồ hiện
trạng sử dụng đất được xây dựng có định hướng phát triển đến năm 2025. Vì vậy các
thông tin về hiện trạng sử dụng đất của khu vực nghiên cứu phản ánh được thực trạng
hiện tại và trong những năm tới. Bản đồ phân loại đất của khu vực nghiên cứu hầu
như không có sự biến động vì đây là khu vực mà hiện tượng sói mòn cũng như lắng
đọng (bồi đắp) không sảy ra mạnh nên không làm thay đổi các đặc tính của đất.

Hình 3.4: Bản đồ phân loại đất
3. Thu thập dữ liệu về lòng dẫn của các sông

Để phục vụ tính toán cho mạng sông như đã dự kiến trong giải pháp mà nhóm
nghiên cứu đề tài đề xuất thì toàn bộ các thông tin về lòng dẫn của mạng sông đã
được thu thập cụ thể gồm:
- Lòng dẫn của sông Đáy từ Đập Đáy đến nga ba hợp lưu với sông Tích-Bùi
- Lòng dẫn của sông Đáy từ ngã ba hợp lưu với sông Tích-Bùi tới Phủ Lý
- Lòng dẫn của sông Tích-Bùi.
Riêng lòng dẫn của sông Tích-Bùi được thu thập gồm hai loại đó là lòng dẫn hiện tại
và lòng dẫn được thiết kế trong dự án nâng cấp cải tạo sông Tích. Hệ thống mawth
cắt thiết kế được cung cấp bởi Ban quản lý dự án sông Tích thuộc Sở Nông nghiệp
và Phát triển nông thôn Hà Nội
Các số liệu mặt cắt thu thập bao gồm:
- Trắc dọc
- Trắc ngang
- Cao độ đê theo trắc dọc
- Công trình kết nối qua đê tại đoạn sông theo trắc dọc

Hình 3.5: Mặt cắt của sông Tích-Bùi
Hình 3.6: Mặt cắt của sông Đáy

Các mặt cắt sông Tích-Bùi đã được nhóm nghiên cứu đi đo đạc bổ sung trong
thời gian thực hiện đề tài bằng nguồn kinh phí tự có của cơ quan. Còn mặt cắt sông
Đáy cũng được đo đạc bổ sung trong khuôn khổ một đề tài nghiên cứu khác do Viện
Công nghệ môi trường thuộc Viện Hàn lâm Khoa học và Công nghệ Việt Nam chủ
trì thực hiện.
4. Thu thập dữ liệu khí tượng thủy văn và các công trình ven sông
Để phục vụ tính toán của mô hình số và đảm bảo các dữ liệu có đầy đủ đáp ứng
được yêu cầu sử dụng trong cảnh báo dự báo theo thời gian thực nhóm nghiên cứu đã
lựa chọn các trạm đo khí tượng và thủy văn thuộc mạng lưới quan trắc quốc gia được
cập nhật phục vụ dự báo lũ trên hệ thống dữ liệu quốc gia.
Cụ thể về trạm đo mưa (khí tượng), nhóm nhiên cứu thu thập số liệu của 8 trạm
đo mưa liên quan đến lưu vực bao gồm:
- Trạm Hòa Bình
- Trạm Ba Vì
- Trạm Ba Thá
- Trạm Trung Hà
- Trạm Việt Trì
- Tràm Hoài Đức
- Trạm Sơn Tây (khí tượng)
- Trạm Sơn Tây (thủy văn) .
Hình 3.7: Số liệu mưa của trạm Ba Vì

Hình 3.8: Số liệu mưa của trạm Sơn Tây
Hình 3.9: Số liệu mực nước của trạm thủy văn Ba Thá

Về mực nước (thủy văn) nhóm nghiên cứu thu thập số liệu của hai trạm trong
lưu vực là:
- Trạm Ba Thá
- Trạm Phủ Lý
Các số liệu được thu thập đồng bộ trong mùa lũ (từ 15/06 đến 30/09, một số
năm đến 31/10) của các năm 2014, 2015, 2016, 2017 và 2018
Số liệu về các công trình thủy lợi ven sông cũng đã được nhóm nghiên cứu thu
thập như các trạm bơm, các cống kết nối với sông.

PHẦN 2
CÁC MÔ HÌNH TÍNH TOÁN SỐ

Chương 4
Mô hình thủy văn phân bố
1. Cơ sở khoa học của phần mềm thủy văn phân bố Marine

1.1. Mô hình diễn toán dòng chảy trên bề mặt lưu vực
Mô hình MARINE mô phỏng quá trình hình thành dòng chảy sinh ra bởi mưa
trên lưu vực dựa trên phương trình bảo toàn khối lượng:
V
 u.grad(V )  P0 (4.1)
t
Trong đó: V: là thể tích khối chất lỏng xét.

U: là vận tốc của dòng chảy giữa các ô lưới.
P0: là lượng mưa.
Vì: u.grad(V)  div(V.u)  V.div(u)
Với chất lỏng không nén được ta có div (u)  0 , sử dụng công thức Green-
Ostrogradski
 div(m.u).dS   m.u.n.d
S 
V
Từ (1) suy ra :  t .dS   V.u.n.d   P
S  S
0 (4.2)
Vận tốc của dòng chảy trao đổi giữa các ô được tính theo công thức:
H2/3
u  pente . (4.3)
Km
Vì lưới sử dụng để tính toán là lưới vuông (DEM) nên thay biểu thức vận tốc vào
phương trình tích phân ta thu được:
4 H5j / 3 t
H   . pente .  P0 .t (4.4)
j1 Km x
Trong đó: Pente: độ dốc; Km: hệ số nhám Manning

x: chiều rộng ô lưới; t : Bước thời gian tính

j: Hướng chảy của ô lưới (j =1  4)

H: Độ sâu mực nước của ô lưới tính.
H: Sự thay đổi mực nước của ô lưới tính từ thời điểm t1 đến t2
Đây chính là phương trình tính sự biến thiên mực nước theo thời gian của mỗi ô lưới.
Từ sự biến thiên mực nước H của mỗi ô lưới ta tính được tổng lưu lượng trao
đổi của mỗi ô (bao gồm lưu lượng nhận từ mưa, lưu lượng chảy vào và lưu lượng
chảy ra) tại mỗi bước tính chính bằng sự biến thiên thể tích nước chứa trong ô.
Q=H*dx*dx
Trong đó: dx là kích thước của lưới tính.
Đối với lưu vực kín, lưu vực chỉ có một điểm thoát nước, tại điểm thoát nước
của lưu vực ta luôn có lưu lượng ra khỏi lưu vực là:
q=Q
Đối với lưu vực hở, lưu vực nằm dọc hai bên bờ sông nên có nhiều điểm thoát
nước. Với trường hợp này lưu lượng ra khỏi lưu vực là tổng lưu lượng trao đổi của
các điểm thoát nước:
q=∑Q=∑H*dx*dx
Như vậy kết quả quá trình tính toán của MARINE cho ta lưu lượng ra của các
lưu vực. Đây chính là thành phần ra nhập dòng bên q cần trong mô hình thủy lực
IMECH-1D.
1.2. Mô hình tính tổn thất nước do thấm Green Ampt

Mô hình MARINE tính toán thấm dựa trên lý thuyết thấm Green Ampt từ
phương trình liên tục và định luật Darcy.
Độ sâu thấm tích lũy tiềm năng được tính bằng phương trình Green - Ampt:
 F (t ) 
F (t )  1    kt (4.5)
  
Trong đó: F(t) là độ sâu luỹ tích của nước thấm vào trong đất
: Cột nước mao dẫn của mặt ướt
 = -i với  là độ rỗng của đất , i là độ ẩm của đất
k: Độ dẫn thuỷ lực
Phương trình (4.5) là phương trình phi tuyến, ta có thể giải bằng phương pháp
thay thế liên tiếp, hoặc phương pháp lặp Newton. Trong trường hợp độ sâu lớp nước

đọng ho không thể bỏ qua ta phải thay thế  bằng giá trị  - ho trước khi giải. Sau khi
tìm được độ sâu thấm tích lũy tiềm năng F(t) ta xác định được tốc độ thấm tiềm năng

f  k(  1) (4.6)
F
Theo định luật Darcy ta xác định được lưu lượng thấm của mỗi ô lưới sẽ là:
qthấm = f*dx*dx
Trước khi sinh nước đọng (t < tp) cường độ mưa nhỏ hơn tốc độ thấm tiềm năng
và mặt đất chưa bão hòa. Quá trình nước đọng trên mặt đất bắt đầu xảy ra khi cường
độ mưa vượt quá cường độ thấm tiềm năng (t = tp) lúc đó đất ở trạng thái bão hòa.
Khi quá trình mưa tiếp tục (t > tp), vùng bão hòa trên mặt đất lan dần xuống tầng đất
sâu hơn và dòng chảy trên mặt đất bắt đầu xuất hiện từ lượng nước đọng.
P0 (mưa)
Cấu trúc lưu vực

Thấm - Green Ampt
(độ cao địa hình, đất, thảm phủ)
Liên kết các ô lưới, tính Q Dòng chảy mặt

Lớp nước đọng
trao đổ̉̉̉̉̉̉̉̉ i giữa các ô tại ô lưới
Quá trình Q~t tại cửa ra của lưu Dòng chảy sát mặt
vực hoặc nút đăng ký tại ô lưới
Hình 41: Sơ đồ mô tả mô hình MARINE
Thấm được chia thành 3 thời kỳ:

 Trước khi xuất hiện nước đọng, toàn bộ lượng mưa đều thấm xuống đất (t
< tp). Tốc độ thấm tiềm năng là một hàm của lượng thấm tích lũy F (t = tp).
 Nước đọng xuất hiện khi tốc độ thấm tiềm năng nhỏ hơn hoặc bằng cường
độ mưa i (t > tp).
 Khi t = tp, lượng thấm tích lũy tại thời điểm sinh nước đọng tp được tính bởi
công thức: Fp = i*tp nên f = i

 
Thay vào (6) có: i  k (  1) dẫn tới t p  k (4.7)
it p i(i  K )
Sau khi có nước đọng, lượng thấm tích lũy được tính theo công thức:
   F
F  F p  ln( )  k (t  t p ) (4.8)
   F p
Như vậy, tại mỗi bước thời gian mô đun thấm cho ta lưu lương thấm qthấm của
mỗi ô chứa. Với trường hợp tính toán MARINE có sử dụng mô đun thấm tại mỗi
bước thời gian tổng lưu lượng trao đổi của mỗi ô bao gồm lưu lượng nhận từ mưa,
lưu lương chảy vào, lưu lượng chảy ra và lưu lượng thấm: Q=H*dx*dx - qthấm
Hình 4.2: Sơ đồ cấu trúc số liệu đầu vào của MARINE

1.3. Cấu trúc dữ liệu của mô hình thủy văn Marine

Dữ liệu vào của mô hình được tổ chức theo dạng các lớp thông tin chồng lên
nhau như trong Hình 3.2. Trong đó các lớp thông tin nền hầu như không thay đổi
trong quá trình tính toán còn các thông tin về khí tượng, thủy văn được thay đổi tùy
thuộc vào từng trận lũ và từng thời điểm tính. Các lớp thông tin nền bao gồm:
- Lớp thông tin về độ cao của địa hình lưu vực.
- Lớp thông tin về hiện trạng sử dụng của bề mặt lưu vực.
- Lớp thông tin về phân loại thành phần cấu trúc của đất trên bề mặt lưu vực.
- Lớp thông tin về hệ thống sông suối.
- Lớp thông tin về các trạm quan trắc.
- Lớp thông tin về mưa và phân bố mưa trong lưu vực.
Các lớp thông tin được đưa về cùng một dạng fomat là mã ASCII của dữ liệu
dạng raster. Các lớp thông tin được xác định trên cùng một lưới chiếu, cùng một gốc
tọa độ, giới hạn vùng của các lớp thông tin phải giống nhau. Chỉ có duy nhất là lớp
thông tin về mưa và phân bố mưa có thể khác, nhưng phải đảm bảo phủ trùm 100%
diện tích của các lớp thông tin nền khác.
Hình 4.3: Xác định lưu vực hứng nước của sông Tích-Bùi từ DEM

2. Thu thập và xử lý số liệu cho mô hình thủy văn

Việc xử lý số liệu và thiết lập mô hình tính toán cho một lưu vực là công việc
tốn nhiều thời gian và đòi hỏi nhiều kỹ thuật. Đối với việc tính toán thủy văn cho một
lưu vực thì việc xử lý số liệu và thiết lập mô hình chiếm nhiều thời gian nhất. Tiếp
đến là hiệu chỉnh mô hình. Việc hiệu chỉnh mô hình có thể nhanh hay chậm phụ thuộc
vào sự phán đoán nhạy bén và kinh nghiệm, kiến thức của người hiệu chỉnh để giúp
phân tích định hướng được cách hiệu chỉnh. Đối với một lưu vực sông nhỏ thì chi phí
được hạch toán để thu thập và xử lý số liệu và hiệu chỉnh mô hình thủy văn thường
là khoảng 350 triệu đồng (chi phí này chưa tính phí bản quyền phần mềm và tính toán
các kịch bản).
2.1. Số liệu địa hình
Số liệu địa hình sử dụng để tính toán trong mô hình thủy văn là bản đồ số độ
cao có độ phân giải 30x30 mét được cung cấp bởi trung tâm trắc địa bản đồ của Bộ
Tài nguyên và Môi trường. Bản đồ này được xử lý từ ảnh chụp vệ tinh kết hợp với
các điểm độ cao (thực đo) để hiệu chỉnh. Chính vì vậy số liệu có độ tin cậy cao.
Từ bản đồ số độ cao nhóm nghiên cứu xử lý và tách được lưu vực hứng nước
của sông Tích-Bùi như trong Hình 3.3. Bản đồ nền độ cao của lưu vực được cắt ra và
đưa vào tính trong mô hình thủy văn có chất lượng tốt, Hình 3..4 dưới đây thể hiện
rõ điều này.
Hình 4.4: Mô hình số độ cao của lưu vực đưa vào tính trong mô hình thủy văn
2.2. Bản đồ hiện trạng sử dụng đất

Bản đồ hiện trạng sử dụng đất được thu thập có tỷ lệ 1:50 000 (Hình 4.5) đáp
ứng nhu cầu của mô hình tính toán thủy văn Marine. Bản đồ hiện trạng sử dụng đất
chủ yếu được sử dụng để tính toán độ nhám trên bề mặt lưu vực. Hệ số nhám sẽ trực
tiếp ảnh hưởng đến tốc độ của dòng chảy.

Các khu vực có rừng rậm sẽ có độ nhám lớn và khả năng giữ nước của lưu vực
tốt. Các khu vực này sẽ làm chậm quá trình hình thành dòng chảy làm hạn chế khả
năng phát sinh lũ cực đoan.
Hình 4.5: Bản đồ hiện trạng sử dụng đất của thành phố Hà Nội
Với mỗi hiện trạng sử dụng đất trên bề mặt lưu vực sẽ có những đặc trưng riêng,
các đặc trưng này lại có các mức độ ảnh hưởng đến độ nhám của bề mặt lưu vực khác
nhau. Có nhiều loại hiện trạng sử dụng đất, dưới đây là một số hiện trạng thường gặp
ở Việt Nam:
1. Đồng cỏ.
2. Lúa
3. Hoa màu.
4. Cây bụi rải rác.
5. Cây thân gỗ trồng không thành rừng.
6. Cây bụi trồng không thành rừng.
7. Cây bụi trồng thành rừng.
8. Cây bụi xen lẫn cỏ.
9. Rừng cây bụi.
10. Rừng thưa xen lẫn rừng cây bụi.
11. Rừng thưa.
12. Rừng già cây lá rộng, lá kim, tre nứa
13. Rừng nguyên sinh gồm nhiều tầng cây đan sen dầy đặc.
14. Núi đá.
15. Đất trống đồi núi trọc

16. Khu dân cư.

…
Độ nhám của bề mặt lưu vực trực tiếp ảnh hưởng đến tốc độ dòng chảy (tỷ lệ
nghịch với vận tốc của dòng chảy) do đó độ nhám là một trong những yếu tố có tác
động mạnh nhất đến pha của dòng chảy, nếu vận tốc nhanh hay chậm đều sẽ dẫn đến
hiện tượng lệch pha.
Về cơ bản độ nhám có giá trị trong một phạm vi hẹp đối với một loại hiện trạng
sử dụng đất. Nhưng trong quá trình xử lý số liệu cũng như số liệu bản đồ hiện trạng
sử dụng đất không thể phản ánh được chính xác loại hiện trạng sử dụng đất vì như
vậy sẽ quá chi tiết và yêu cầu phải cập nhật số liệu liên tục. Chính vì vậy để khắc
phục những thiếu sót không thể khắc phục đó cần phải có quá trình hiệu chỉnh để làm
sao có được bộ thông số nhám phù hợp tương ứng với mỗi loại hiện trạng sử dụng
đất của lưu vực. Bản chất của việc hiệu chỉnh độ nhám chính là tìm ra hệ số nhám
trung bình cho mỗi lớp thảm phủ của lưu vực.
2.3. Bản đồ phân loại đất

Bản đồ phân loại đất là bản đồ phân bố các loại đất trên lưu vực. Các loại đất
được phân chia theo tiêu chí của tổ chức Nông lương quốc tế (FAO). Hiệp hội Nông
lương quốc tế có đầy đủ các tham số tương ứng với từng loại đất.
Trong khuôn khổ đề tài này, bản đồ phân loại đất được sử dụng chủ yếu cho mô
hình thủy văn có tỷ lệ 1: 50 000 (Hình 4.6). Các loại đất trực tiếp ảnh hưởng đến quá
trình thấm nước làm giảm khả năng sinh dòng chảy. Các thông số của đất được tập
trung thu vào các tham số chính sử dụng trong mô hình thấm Green-Amp như độ
rỗng hiệu dụng, dẫn xuất thủy lực, độ mao dẫn, ...
Mô đun thấm được tính toán dựa trên lớp thông tin nền là bản đồ phân loại thành
phần cấu trúc của đất. Chính vì vậy việc xử lý dữ liệu cũng như chất lượng của bản
đồ là rất quan trọng. Mỗi nhóm của bản đồ cấu trúc đất đưa vào tính toán trong mô
hình thủy văn gồm bốn thông tin chính không kể các thông tin xác định vị trí đó là:
- Độ rỗng
- Độ rỗng hiệu dụng
- Cột nước mao dẫn của mặt ướt
- Độ dẫn thủy lực
Trong thực tế với mỗi loại đất các thông số như dẫn suất thủy lực, độ sâu cột
nước mao dẫn, độ rỗng của đất đều đã biết (các thông số này đã được xác định bằng
phương pháp thực nghiệm chỉ việc tra bảng kết quả thực nghiệm đã có). Nhưng do
bản đồ phân loại đất không đủ chi tiết vì tỷ lệ bản đồ nhỏ, các dữ liệu không đầy đủ

chính vì vậy cần phải hiệu chỉnh các tham số để tìm ra bộ tham số tương ứng với các
lớp đất sao cho bộ tham số đó là giá trị trung bình của lớp đất.
Hình 3.6: Bản đồ phân loại đất của thành phố Hà Nội
Mức độ tổn thất của dòng chảy chính là kết quả tính toán của mô đun thấm. Quá
trình thấm trực tiếp ảnh hưởng đến giá trị của lưu lượng đầu ra của mô hình. Ngoài
ra diễn biến của quá trình thấm còn làm ảnh hưởng đến thời gian đạt đỉnh của các trận
lũ tính toán. Chính vì vậy cần phải điều chỉnh mô đun thấm sao cho lượng nước tổn
thất hợp lý với thực tế.
Bảng 4.1 là bảng giá trị và phạm vi giá trị của 4 thông số của một số loại đất cơ
bản đã được xác định bằng phương pháp đo đạc trực tiếp:
Bảng 4.1: Các giá trị của bốn thông số chính của một số loại đất
Số Độ rỗng hiệu Cột nước mao dẫn Độ dẫn

Loại đất Độ rỗng
TT dụng của mặt ướt thủy lực
0.437 0.417 49.5
1 Cát 11.78
(0.374-0.500) (0.354-0.480) (0.97-25.36)
2 Mùn Cát 0.437 0.401 61.3 2.99

(0.363-0.506) (0.329-0.473) (1.35-27.94)

0.351 0.412 300.1
3 Cát Mùn 1.09
(0.351-0.555) (0.283-0.541) (2.67-45.47)
0.375 0.434 350
4 Mùn 0.34
(0.375-0.551) (0.334-0.534) (1.33-59.38)
0.42 0.486 600
5 Phù sa Mùn 0.65
(0.420-0.582) (0.394-0.578) (2.92-95.39)
Sét pha cát 0.398 0.33 218.5
6 0.15
Mùn (0.332-0.464) (0.235-0.425) (4.42-108.0)
0.464 0.309 208.8
7 Sét Mùn 0.1
(0.409-0.519) (0.279-0.501) (4.79-91.00)
Sét Phù sa 0.471 0.432 273
8 0.1
Mùn (0.418-0.524) (0.347-0.517) (5.67-131.50)
0.43 0.321 239
9 Sét pha Cát 0.06
(0.370-0.490) (0.207-0.435) (4.08-140.2)
0.479 0.423 292.2
10 Sét Phù sa 0.05
(0.425-0.533) (0.334-0.512) (6.13-139.4)
0.427 0.385 1000
11 Sét 0 .03
(0.427-0.523) (0.269-0.501) (6.39-156.5)
2.4. Số liệu mưa

Trong lưu vực sông Tích-Bùi có nhiều trạm đo mưa nhưng chỉ một số trạm có
mưa tức thời. Trong khi đó để phục vụ công tác dự báo thì cần phải có số liệu đo mưa
tức thời theo ốp thời gian 6 tiếng hoặc dày hơn. Trên cơ sở đó nhóm nghiên cứu đề
xuất sử dụng số liệu mưa của 8 trạm đo mưa cấp quốc gia trực tiếp có ảnh hưởng đến
lưu vực. Điều này sẽ thuận tiện trong việc sử dụng dữ liệu mưa từ cơ sở dữ liệu quốc
gia để dùng dự báo trong mùa lũ. Điều này thuận lợi cho tác nghiệp nhưng sẽ khó
khăn trong quá trình hiệu chỉnh mô hình.
Các trạm đo mưa được sử dụng gồm tám trạm sau:
- Trạm Ba Thá
- Trạm Hòa Bình
- Trạm Hoài Đức
- Trạm Ba Vì
- Trạm Sơn Tây khí tượng

- Trạm Sơn Tây thủy văn

- Trạm Trung Hà
- Trạm Việt Trì.
Số liệu mưa của các trạm này được thu thập trong suốt mùa mưa của các năm
2014, 2015, 2016. 2017 và gần đây nhất là năm 2018. Các số liệu này được tổ chức
lưu trữ trong cơ sở dữ liệu phục vụ cho mô hình học máy và phục vụ việc hiệu chỉnh
và kiểm định mô hình thủy văn.
Hình 4.7: Bản đồ phân vùng ảnh hưởng của các trạm mưa

Phân vùng ảnh hưởng của các trạm mưa đưa vào tính trong mô hình thủy văn
được xác định theo phương pháp đa giác Thiessen như trong Hình 3.7 trên đây.
3. Kiểm tra độ nhạy của các tham số trong mô hình
3.1. Thử độ nhạy của mô hình với các tham số của bản đồ hiện trạng sử dụng đất
Để đánh giá mức độ ảnh hưởng và độ nhạy của hệ số nhám đến kết quả tính của
mô hình thủy văn Marine, xét ba kịch bản tính toán sau:
- Kịch bản hệ số nhám thực của lưu vực.
- Hệ số nhám của lưu vực được cho rất nhỏ trên toàn lưu vực.
- Hệ số nhám của lưu vực được cho rất lớn trên toàn lưu vực.
8,500.00
Nham TB
8,000.00
Nham Be
7,500.00 Nham Lon
7,000.00
6,500.00
6,000.00
5,500.00
Lưu lượng (m3)
5,000.00
4,500.00
4,000.00
3,500.00
3,000.00
2,500.00
2,000.00
1,500.00
1,000.00
500.00
0.00
75 85 95 105 115 125 135 145 155 165 175 185 195 205 215 225 235 245 255 265
Thời gian (giờ)
Hình 4.8: Thử độ nhạy với các tham số của bản đồ thảm phủ
Từ các kết quả tính toán của ba phương án (Hình 3.8) cho thấy: Hệ số nhám có
ảnh hưởng lớn đến kết quả tính toán của mô hình, nhưng ảnh hưởng của hệ số nhám
đến mô hình chủ yếu là về tốc độ dòng chảy tức là về pha của dòng chảy, còn về giá
trị của lưu lượng tính toán có chịu ảnh hưởng của sự biến đổi độ nhám nhưng không
lớn lắm. Như vậy để hiệu chỉnh mô hình trong trường hợp kết quả tính bị lệch pha có
thể sử dụng tham số hiệu chỉnh là hệ số nhám.
Bảng số liệu so sánh của ba phương án tính được trình bày trong phần phụ lục
của báo cáo. Từ đồ thị và bảng số liệu có thể thấy pha của quá trình tính toán có thể

sai khác rất nhiều, phạm vi điều chỉnh pha cho lưu vực có thể lên đến 10 tiếng. trong
khi đó quá trình điều chỉnh pha làm thay đổi giá trị lưu lượng tính toán nhỏ, chưa đến
600 m3/s so với giá trị lưu lượng tại đỉnh là 8000 m3/s.
3.2. Thử độ nhạy của mô hình với các tham số của bản đồ phân loại đất
Để xét ảnh hưởng của mô hình thấm có nhiều tham số có thể hiệu chỉnh. Nhưng
từ công thức tính của phương pháp thấm Green Ampt cho thấy điều chỉnh tham số độ
rỗng hiệu dụng của đất  sẽ hiệu quả nhất. Để điều chỉnh  ta đưa vào tham số
độ ẩm của đất. vì  là hiệu của độ rỗng của đất (có dược từ thực nghiệm) và độ ẩm
của đất. Do độ ẩm của đất là tham số đo đạc (biến đổi theo thời gian) nên để điều
chỉnh  sử dụng tham số này là hoàn toàn hợp lý.
12000 Do am TB
Do am be
11000 Do am lon
10000
9000
8000
Lưu lượng (m3)
7000
6000
5000
4000
3000
2000
1000
0
75 85 95 105 115 125 135 145 155 165 175 185 195 205 215 225 235 245 255 265
Thời gian (giờ)
Hình 4.9: Thử độ nhạy với các tham số của bản đồ phân loại đất
Để nghiên cứu ảnh hưởng của mô đun thấm hay chính là của độ ẩm của đất đến
kết quả tính toán của mô hình thủy văn Marine nhóm nghiên cứu xem xét ba phương
án sau:
- Độ ẩm của đất lấy trung bình hoặc theo số liệu thực đo.
- Độ ẩm của đất cho rất nhỏ.
- Độ ẩm của đất cho lớn.

Ba phương án tính trên đã bao hàm các trường hợp từ trường hợp khoảng không
gian giành cho thấm lớn nhất đến trường hợp khoảng không gian giành cho thấm nhỏ
nhất. Kết quả tính toán của ba phương án được thể hiện trên Hình 3.9.
Các kết quả tính toán theo ba phương án trong hình trên cho thấy khi điều chỉnh
mức độ thấm của mô đun thấm sẽ trực tiếp ảnh hưởng đến giá trị lưu lượng tính toán
của mô hình, còn về pha có chịu ảnh hưởng nhưng là nhỏ. Như vậy điều chỉnh mô
đun thấm hay chính là điều chỉnh độ ẩm của đất là cách nhanh và hiệu quả nhất để
điều chỉnh giá trị của lưu lượng đầu ra của mô hình tính toán.
3.3. Thử độ nhạy của mô hình với hệ số phân bố mưa
Mô hình thủy văn Marine cho phép đưa số liệu mưa vào mô hình tính ở hai dạng
phù hợp với tình hình số liệu của mỗi khu vực tính khác nhau.
Số liệu mưa được xử lý từ ảnh mây vệ tinh hoặc ảnh ra đa: Với loại số liệu này
ảnh chụp từ vệ tinh hoặc ra đa được đưa qua phần mềm xử lý và hiệu chỉnh thông
qua một số trạm hiệu chỉnh mưa thực đo trên mặt đất. Số liệu sau khi xử lý sẽ bao
gồm cả giá trị mưa định lượng và phân bố mưa trên lưu vực. Lưới phân bố mưa tùy
thuộc vào loại ảnh. Với ảnh ra đa độ phân giải của lưới mưa thường là 1000m (1km)
còn với ảnh vệ tinh thì độ phân giải của lưới mưa tùy thuộc vào hệ ảnh. Trên mỗi một
lưới mưa có gá trị mưa khác nhau, chính vì vậy số liệu mưa này rất gần với số liệu
mưa đã rơi thực tế trên lưu vực.
Số liệu mưa đo đạc tại các trạm khí tượng thủy văn: Với các nước hoặc khu vực
điều kiện kinh tế khó khăn như Việt Nam chỉ có số liệu mưa qua trắc tại các trạm khí
tượng thủy văn, thậm trí mạng lưới các trạm quan trắc cũng rất thưa thớt và không
đồng bộ. Với loại số liệu mưa đo đạc tại các trạm ta chỉ có giá trị về mặt định lượng
của mưa tại điểm đo, còn các điểm khác không phải tại vị trí đo, phải sử dụng các
phương pháp phân bố mưa để tìm giá trị mưa. Với số liệu mưa loại này, các trạm đo
phải được chọn vị trí đặt sao cho lượng mưa tại đó là giá trị đại diện của lượng mưa
trong vùng, mạng lưới các trạm cũng cần phải được bố trí sao cho hợp lý để phản ánh
tốt nhất thực trạng mưa.
Các số liệu thu thập của lưu vực hồ Tuyên Quang là các số liệu mưa cục bộ đo
đạc tại các trạm quan trắc. Chính vì thế cần phải chọn một phương pháp phân bố mưa
để xác định mưa trên toàn lưu vực.
Ở đây không đánh giá ảnh hưởng của các phương pháp phân bố mưa đến kết
quả tính của mô hình, mà chỉ đánh giá trọng số của phân bố mưa. Vì với bất cứ
phương pháp phân bố mưa nào cũng đều có trọng số phân bố, đây chính là tham số
điều chỉnh của phương pháp, nên để đi sâu vào chi tiết nhóm nghiên cứu chọn phương
pháp phân bố là phương pháp đa giác Thiessen. Vì phân bố mưa được tạo ra chứ

không phải là thực tế nên nếu số liệu mưa tại trạm đo không phải là giá trị đại diện
mà chỉ là giá trị mưa cục bộ thì phân bố mưa không còn hợp lý. Do đó cần phải điều
chỉnh lại phân bố mưa sao cho tổng giá trị lượng mưa trên lưu vực gần nhất với tổng
giá trị lượng mưa đã rơi trên lưu vực. Để đánh giá ảnh hưởng của tham số điều chỉnh
trong phương pháp phân bố mưa xét ba phương án tính sau:
- Tham số phân bố mưa chuẩn.
- Tham số phân bố mưa nhỏ.
- Tham số phân bố mưa lớn.
Trọng số phân bố mưa chuẩn có giá trị là 1. Đây là giá trị mưa thực của phương
pháp phân bố. Nhưng do mưa của trạm không phải là mưa đại diện nên hệ số này có
thể điều chỉnh lớn hơn hoặc nhỏ hơn 1 để cho phù hợp hơn về tổng lượng.
Các kết quả tính toán cho ba phương án điều chỉnh tham số phân bố mưa trên
lưu vực với phân bố mưa theo phương pháp đa giác Thiessen cho trong hình vẽ dưới
đây.
11000
He so mua chuan
He so mua be
10000
He so mua lon
9000
8000
7000
Lưu lượng (m3)
6000
5000
4000
3000
2000
1000
0
75 85 95 105 115 125 135 145 155 165 175 185 195 205 215 225 235 245 255 265
Thời gian (giờ)
Hình 4.10: Ảnh hưởng của trọng số phân bố mưa đến kết quả tính của Marine
Các kết quả tính của ba phương án cho thấy, trọng số của phân bố mưa trực tiếp
ảnh hưởng đến giá trị của lưu lượng tính toán trên lưu vực. Đây chính là tham số điều
chỉnh tổng lượng nước vào mô hình tính chính vì vậy tham số này rất nhạy với kết
quả tính của mô hình. Tham số hiệu chỉnh này về nguyên tắc không nên điều chỉnh

quá thấp hoặc quá cao so với giá trị thực là 1. Vì khi điều chỉnh quá nhiều tham số
này sẽ dẫn đến sai về bản chất của mô hình tính.
Qua việc thử độ nhạy của các tham số hiệu chỉnh mô hình có thể thấy mô hình
thủy văn đã được thiết lập cho lưu vực có các tham số khá nhạy. Như vậy là các số
liệu đã được xử lý tốt và cho phép tính toán hiệu chỉnh các tham số của mô hình thủy
văn cho lưu vực này trong phạm vi hiệu chỉnh khá lớn cả về pha va định lượng. Đây
cũng là thuận lợi cho việc hiệu chỉnh xác định bộ thông số của mô hình cho lưu vực
thông qua các số liệu lịch sử.

Chương 5
Mô hình thủy lực một chiều mở rộng
1. Cơ sở khoa học của mô hình thủy lực một chiều mở rộng

Mô hình thủy lực một chiều mở rộng IMECH_1D được Tập thể Khoa học
Nghiên cứu về Lũ lụt của Viện Cơ học xây dựng, hoàn thiện và áp dụng trong một số
đề tài và dự án về kiểm soát lũ lụt trên lưu vực sông Hồng. Bộ chương trình tính toán
thủy lực một chiều mở rộng IMECH_1D không chỉ có khả năng tính toán quá trình
lan truyền lũ trong mạng sông mà có cả khả năng tính toán quá trình ngập vùng lưu
vực ngoài đê.
Đê mô phỏng quá trình lan truyền lũ trong hệ thống sông cần mô phỏng lũ trong
các thành phần:
- Mạng sông.
- Ô ruộng.
Tất cả các sông trong hệ thống sông được liên kết trong mạng sông. Các ô
ruộng được liên kết với mạng sông qua các công trình.
1.1. Mạng sông
Mạng sông được xây dựng từ các đoạn sông và các nút sông.
Nút sông.
Trong IMECH-1D có 2 loại nút sông.
+ Nút biên: Là vị trí tiếp xúc của hệ thống (ở đây là mạng sông) với các yếu tố
bên ngoài của hệ thống. Giả thiết rằng dòng chảy trên mạng sông là dòng
chảy êm, do vậy, tại mỗi nút biên sẽ cho 1 điều kiện biên. IMECH-1D sử
dụng 2 loại điều kiện biên.
- Cho mực nước (nút biên Z).
- Cho lưu lượng (nút biên Q).
+ Nút trong của mạng: là vị trí tiếp xúc của từ 2 đoạn sông của mạng sông trở
lên.
Nút sông chỉ có một đặc trưng duy nhất là cao trình mực nước tại nút đó.
Đoạn sông.
Đoạn sông là mô hình của đoạn sông thực nằm giữa 2 nút sông. Đoạn sông có
các đặc trưng sau:

- Nút đầu đoạn.

- Nút cuối đoạn.
- Mặt cắt đầu đoạn.
- Mặt cắt cuối đoạn.
- Độ dài của đoạn
- Các yếu tố thủy lực của đoạn như: độ dốc, hệ số nhám, lưu lượng bổ
xung,...
Trong mặt cắt của đoạn có các đặc trưng như lòng sông, bãi sông, bối.
1.2. Ô ruộng (ô chứa)
Trong IMECH-1D ô ruộng được mô phỏng có vai trò chứa nước, chưa tính đến
ảnh hưởng của vận tốc trên các ô ruộng đến các đoạn sông. Vì vậy, một ô ruộng được
đặc trưng bởi các thông số:
- Thể tích ô theo cao trình mực nước.
Các mối quan hệ giữa ô đang xét với các thành phần khác của hệ thống (thí dụ:
trao đổi nước qua đập tràn, chiều cao, chiều rộng, hệ số của đập v.v...)
1.3. Mô hình toán học một đoạn sông
Dòng chảy trong một đoạn sông được mô phỏng bằng hệ phương trình Saint
Venant 1 chiều, mô tả chuyển động của nước trong sông hoặc kênh hở. Trong
IMECH-1D hệ phương trình S.Venant được sử dụng dưới dạng sau:
Ac Q
 q (5.1)
t x
Q   Q 2   Z 
     gA  Sf   0 (5.2)
t x  A   x 
ở đây sử dụng các ký hiệu:
Q=Q(x,t) – lưu lượng của dòng chảy trong đoạn sông;
Z=Z(x,t) – mực nước trong đoạn sông;
q - lưu lượng phụ;
Ac - Diện tích mặt cắt (kể cả vùng chứa);
 - hệ số điều chỉnh
A - Diện tích chảy
Sf - Sức cản đáy
Sức cản đáy trong IMECH-1D được tính theo công thức sau:

n 2Q Q
Sf  (5.3)
A 2R 4 / 3
Trong đó R là bán kính thủy lực.
1.4. Mô hình toán học của một ô ruộng
IMECH-1D mô phỏng quá trình ngập một ô ruộng (khu chứa) bằng định luật
bảo toàn khối lượng nước tại ô đó.
dV
 P   Qk (5.4)
dt k
ở đây: V = V(Z) = V(Z(t)) thể tích của ô theo mực nước Z.

P- Lượng mưa hoặc bốc hơi tại ô.
Qk - Lượng nước trao đổi giữa ô đang xét với các ô liên quan (ô liên
quan có thể là một đoạn sông, một nút sông, hoặc một ô ruộng
khác).
1.5. Lược đồ sai phân
Lược đồ sai phân Preissmann được sử dụng để sai phân hóa hệ phương trình
(5.1), (5.2), (5.4). Cụ thể là:
f f in1 1  f in1 f in 1  f in
 
t 2t 2t
f f in11  f i n1 f in1  f i n

  1    , 0  1
x x x
 n 1
f  f i 1  f in 1   1   f in1  f in 
2 2
Từ phương trình (4.1) ta có:
1
2t
  
x
  
Ac, i1  Ac,i   AcT,i1  AciT  1  Qi1  Qi   1    QiT1  QiT 
(5.5)
 
  Qi 1  qi   1    qiT1  qiT
1
2

Để sai phân hoá phương trình (5.2), ta viết phương trình này thành 4 số hạng a1,
a2, a3, a4 như sau:
a1 + a 2 + a 3 + a 4 = 0 (5.6)
trong đó

Q   Q2 
a1  , a2   
t x  A 
Z
a 3  gA , a 4  gASf
x
Sai phân từng số hạng trong (4.6) ta được
a1  ~
a1 
1
Qi 1  Q1   QiT1  QiT 
2t
   Qi21 Qi2   QiT1 QiT 

2 2
~
a2  a2       1    T  T 

x   Ai 1 Ai   Ai 1 Ai 
 
a3  ~
a3 
g
2
 
Ai 1  Ai   1   AiT1  AiT
1
x
  
Zi 1  Zi   1   ZiT1  ZiT 

a 4  a~4  g AS f  
i 1
 AS f   g 1    AS 
i f
T
i 1
 AS f 
T
i
2 2
Do vậy phương trình sai phân của (5.2) có dạng sau:

~
a1  ~
a2  ~
a3  ~
a4  0 (5.7)
Sai phân hóa phương trình (4.4) ta có
1
t
 
   
Vi  ViT   Pi   Qi, k   1   PiT   QiT, k  (5.8)
 k   k 
Trong (5.5) - (5.8), f tính ở thời điểm hiện tại còn fT tính ở thời điểm trước đó.
Ta giả thiết rằng nút đầu của đoạn sông có số thứ tự là i còn nút cuối đoạn có số
thứ tự là i+1. Khi đó các đẳng thức (5.5) và (5.7) cho ta quan hệ lưu lượng và mực
nước tại hai đầu của một đoạn sông. Như vậy, mỗi một đoạn sông có 4 ẩn số cần tìm
là:
Zd, Zc - mực nước ở đầu và ở cuối đoạn
Qd, Qc - Lưu lượng ở đầu và ở cuối đoạn
Mỗi một ô ruộng có một phương trình (5.8). Phương trình này cho phép xác
định một ẩn cần tìm của một ô ruộng là cao trình mực nước Zr tại tâm điểm của ô.

Còn các hàm Vi, Qi, k trong (5.8) là hàm phi tuyến phụ thuộc vào cao trình mực
nước Zr của ô ruộng đang xét và của các ô ruộng liên quan.
Bây giờ ta xét tính đóng kín của hệ phương trình (5.5), (5.7) và (5.8) với các ẩn
Zd, Zc, Qd, Qc và Zr.
Mỗi một ẩn Zd hoặc Zc đều tương ứng với một giá trị cao trình mực nước tại
một nút nào đó của mạng sông. Ta đặt:
n - số nút của mạng sông (kể cả nút biên) ;
nd - số đoạn sông của mạng sông ;
nr - số ô ruộng.
Tại các nút của mạng sông (nút đơn hoặc nút hợp lưu) giả thiết là chỉ có một
cao trình mực nước. Như vậy tại n nút của mạng sông cần phải xác định n cao trình
mực nước Zi : ta có n ẩn số.
Vì mỗi đoạn sông có lưu lượng vào và lưu lượng ra khỏi đoạn, nên nếu ta có nd
đoạn sông trong mạng sông thì ta cần xác định 2nd giá trị lưu lượng : ta có 2nd ẩn số.
Nếu ta có nr ô ruộng ta cần xác định nr giá trị cao trình mực nước tại tâm các ô
ruộng này :
Như vậy để xác định dòng chảy trong mạng sông và ô ruộng ta cần xác định
n+2nd+nr ẩn số.
Các đẳng thức (5.5), (5.7). (5.8) cho ta 2nd+nr phương trình.
Nếu nút là nút biên thì ta có một điều kiện biên.
Nếu nút là nút trong thì ta có một phương trình cân bằng lưu lượng tại nút đó:
Qvào - Qra = 0 (5.9)
Do vậy tại n nút ta có n phương trình (hoặc dạng (5.9) hoặc là điều kiện biên).
Cùng với 2nd + nr phương trình đã có, n phương trình này sẽ tạo thành hệ kín để xác
định 2nd+nr+n ẩn số.

1.6. Tuyến tính hóa hệ phương trình (5.5), (5.7), (5.8)

Hệ phương trình phi tuyến (5.5), (5.7), (5.8) có thể giải được theo một phương
pháp xấp xỉ. Trong IMECH-1D hệ phương trình phi tuyến (5.5), (5.7), (5.8) được đưa
về hệ phương trình tuyến tính theo công thức Newton.
Một hàm phi tuyến F(H, Q), tại bước n+1 có thể thay bằng một hàm tuyến tính
dạng:
    
F H n 1, Qn 1  F H* , Q*  H n 1  H* HF 
 Qn 1  Q* QF
H  H* Q  Q*
ở đây H*, Q* là giá trị lặp, giá trị xuất phát của chúng là Hn, Qn tương ứng.
Tuyến tính hoá các biểu thức đơn giản.
Ta xét các biểu thức đơn giản trong (5.5), (5.7), 5.8):
A = A(Z), Q2/A, AZ, Ad Zc, AcZd.
Chỉ số d là giá trị tính tại đầu đoạn, còn chỉ số c là giá trị ở cuối đoạn. Sử dụng
công thức Newton để tuyến tính hóa các biểu thức này ta có:
A  A* + b*(Z - Z*) (5.10)
2
 Q* 
   
2
Q2 Q* Q*
 *  2 * Q  Q*   *  b* Z  Z* (5.11)
A A A A 

AZ  A*Z*  Z*b*  A* Z  Z*   (5.12)
  
A d Zc  A*d Z*c  b*d Z*c Zd  Z*d  A*d Zc  Z*c  (5.13)
A c Zd  A*c Z*d  A Z  Z   b Z Z
*
c d
*
d
* *
c d c Z 
*
c (5.14)
Trong các công thức (5.10) - (5.14), b* - chiều rộng của sông (tương ứng với
mực nước Z*). b* xuất hiện theo đẳng thức
A
b
Z
Tuyến tính hoá biểu thức có lực cản đáy.
Trong số hạng ~a 4 của (4.7) có chứa hàm phi tuyến ASf. Để tuyến tính hoá số
hạng này, ta viết Sf về dạng sau:
QQ
S 
f
,
2
K  kAR 2/3
K
Hệ số K phụ thuộc vào mực nước Z: K = K(Z). Hàm này được tính qua diện
tích chảy A = A(Z) và bán kính thủy lực R = R(Z). Vì các mặt cắt thực tế trên lưu
vực sông nói chung khá phức tạp, cho nên K phải tính theo kiểu lòng dẫn phức hợp.

Hiện tại, IMECH-1D tính K theo từng cấp và giả thiết rằng K biến đổi tuyến tính
trong khoảng giữa hai cấp. Như vậy ASf có thể tuyến tính hoá như sau:
Q* Q* Q*
ASf  A*S*f  2A *
Q  Q   2A
* *

K*z Z  Z* 
K 
* 2
K 
* 3
Tuyến tính hoá biểu thức trao đổi nước qua đê.
Trong phương trình (5.8) có biểu thức phi tuyến Qi,k = F(Zi, Zk). Đây là hàm mô
tả lượng nước trao đổi giữa ô i (có mực nước Zi) với ô k (có mực nước Zk). Việc trao
đổi này còn phụ thuộc vào công trình giữa ô i và ô k. Giả sử rằng quá trình trao đổi
nước giữa ô i với ô k tuân theo qui luật của dòng chảy tràn qua đập.
Xét hàm F(Zi, Zk) khi giữa ô i và ô k là một đập tràn với cao độ Zd, độ dài tràn
là Ld. Khi đó, nếu Zk - Zd 
2
Zi  Zd  (chảy tự do từ i sang k).
3
Qi ,k  F  Z i , Z k   mLd 2 g  Z i  Z d 
3/ 2
(5.15)
2
Nếu Z k  Z d   Z i  Z d  (chảy ngập)
3
Qi, k  mL d Zk  Zd Zi  Zk 1 / 2 (5.16)
Với các hàm (4.15) Và (5.16) ta có thể sử dụng công thức Newton để tuyến tính
hóa:
- Trường hợp chảy tự do (5.15)

3 *
Z i  Z d   Z i  Z i* 
1/ 2
Qi ,k  Qi*,k  mLd 2 g (5.17)
2
- Trường hợp chảy ngập (5.16)
  1/ 2
Qi ,k  Qi*,k  mLd  Z i*  Z k*    Z i*  Z d  Z i *  Z k*   Z k  Z k * 
1/ 2 1
 2 
(5.18)
1 1/ 2 
 mLd   Z i  Z d  Z i*  Z k    Z i  Z i* 
2 
Hệ phương trình phi tuyến (1.5), (1.7), (1.8) có thể đưa về hệ phương trình đại
số tuyến tính theo mực nước tại các nút sông và các ô ruộng và theo lưu lượng tại hai
đầu của mỗi đoạn sông.
2. Mô hình hóa lưu vực sông Tích-Bùi trong IMECH1D mở rộng
 Mô tả chung về sông Tích
Sông Tích là nhánh cấp 1, nhánh lớn nhất của sông Đáy, bắt nguồn từ núi
Ba Vì theo hướng Tây Bắc – Đông Nam chảy vào sông Đáy tại Ba Thá. Diện

2
tích lưu vực sông Tích là 1330km , với chiều dài hiện tại 91km, độ rộng trung
bình là 14,6km, hệ số quanh co là 2,0. Sông chảy qua 4 huyện và một thị xã.
Lưu vực sông Tích có dạng hình lông chim, các nhánh sông phần lớn
nhập lưu ở bờ phải.
Lòng sông Tích có thể chia 3 đoạn:Từ nguồn đến Cống Chuốc: mặt cắt
hẹp, có độ rộng từ 10.0-15.0m, độ sâu biến đổi đều, có độ dốc đáy khoảng
0.8m/km. Từ Công Chuốc đến Cầu Trôi: lòng sông mở rộng hơn, có độ dốc
đáy trung bình vào khoảng 0.3m/km. Đoạn từ Cầu Trôi đến Ba Thá: lòng sông
mở rộng rõ rệt, có hiện tượng bồi xói, có độ rộng trung bình 30.0-40.0m, có
độ dốc đáy là 0.1m/km.
Sông Tích chảy qua nhiều vùng đồi đất và nham cứng, vì vậy có sức xói
yếu. Mặc dù độ dốc đáy lòng sông chính không lớn song độ dốc các sông
nhánh lại rất lớn, trung bình từ 10-20m/km, có sông suối với độ dốc lên tới
trên 30m/km.
Lòng sông Tích bé, song thềm sông khá rộng, trung bình khoảng 2.0-
3.0km, nơi rộng nhất có thể tới 5.0-6.0km.
Khả năng thoát lũ sông Tích kém ( độ dốc mặt nước quá nhỏ), do lòng
sông quanh co, uốn khúc, lại bị thu hẹp bởi làng mạc, đê bối, đường xá và
nhiều cầu qua sông. Một phần nữa là do tình trạng nhập lưu của các phụ lưu
khá lớn làm cho lượng nước tập trung và thời gian tập trung nước dọc sông
không đều. Vì vậy, gây nên tốc độ dòng chảy trên sông phân bố không đều
theo chiều dài sông.
Một đặc điểm đáng ngại nữa của lũ sông Tích, đó là mực nước dâng cao,
quá trình lũ kéo dài, đê bị ngâm lâu, đường cong bão hoà cao dẫn đến hiện
tượng sạt lở chân đê phía hạ lưu, gây uy hiếp đến sự an toàn của đê.
 Thiết lập mạng sông Tích - sông Bùi
Mạng sông gồm 2 nhánh sông: nhánh thứ nhất: sông Tích - sông Bùi. Nhánh
thứ hai: một phần của sông Đáy (từ đập Đáy đến trạm thủy văn Phủ lý). Nhánh thứ 2
có thể tách thành 2 nhánh. Như vậy mạng sông tính toán có thể chia thành 3 nhánh
như sau:
- Sông Tích-Bùi
- Sông đáy đoạn từ đập Đáy đên Ba Thá
- Sông Đáy đoạn từ Ba Thá đến Phủ Lý
Mạng sông sông Tích - sông Bùi được nối với các ô ruộng như trong Hình 5.1
dưới đây để mô tả ngập lụt khi lũ lớn.

Hình 5.1: Mô hình hóa sông Tích-Bùi trong mô hình IMECH1D mở rộng
3. Sơ đồ kết nối giữa thủy văn và thủy lực

Mô hình thủy văn Marine sau khi được thiết lập xong sẽ được kết nối với mô
hình thủy lực IMech1D mở rộng để thành bộ chương chương trình Thủy văn -Thủy
lực cho phép cảnh báo và dự báo ngập lụt trên lưu vực sông Tích-Bùi.
Hình 5.2: Mô hình kết nối đa điểm

Hình 5.3: Mô hình kết nối đơn điểm
Hình 5.4: Sơ đồ tổng thể của mô hình kết nối thủy văn - thủy lực
Với đặc thù của lưu vực sông Tích-Bùi sẽ có hai loại kết nối như sau:
 Mô hình kết nối đa điểm (Hình 5.2): Sử dụng cho các sông suối nhỏ kết nối với
sông Tích-Bùi đoạn hạ lưu như khu vực Xuân Mai, Miếu Môn và các khu vực
cách xa các điểm nhập lưu của các nhánh phụ đã liệt kê ở phần tổng quan.
 Mô hình kết nối đơn điểm (Hình 5.3): sử dụng cho các biên hoặc chi lưu như phần
lưu vực thuộc khu núi Ba Vì và phần tiếp giáp với sông Đà và sông Hồng

Sơ đồ tổng thể kết nối thủy văn thủy lực trên sông Tích-Bùi được mô tả như
trên Hình 5.4. Còn Hình 5.5 là sơ đồ mạng sông tính toán trong khuôn khổ dự án này
để phục vụ việc cảnh báo, dự báo ngập lụt lưu vực sông Tích-Bùi. Mạng sông đã
được thết lập déo dài đến trạm thủy văn Phủ Lý và lấy mực nước tại trạm Phủ Lý làm
biên dưới. Với cách thiết lập mô hình như vậy thì trong sơ đồ tính có trạm Ba Thá là
điểm kiểm chứng mô hình vì có số liệu thực đo.
Day river Crosss sections Day river

QUB
HDB
Tich-Bui river
Ba Tha station Phu Ly station
QUB
Qlateral from result of Hyrologycal model
Hình 5.5: Các vị trí kết nối trong sơ đồ tính toán thủy lực một chiều mở rộng
4. Thu thập và xử lý số liệu cho cho lưu vực sông Tích-Bùi

Số liệu sử dụng cho mô hình thủy lực một chiều mở rộng bao gồm có các số
liệu chính sau:
- Số liệu về lòng dẫn của sông
- Số liệu về biên trên, biên dưới, biên phụ và điểm kiểm chứng
- Số liệu về ô chứa
Đối với mô hình thủy lực một chiều mở rộng thì việc xử lý ô chứa chiếm rất
nhiều thời gian và công sức. Để xử lý ra được số liệu của các ô chứa đòi hỏi phải có
nhiều lớp thông tin (khó thu thập) có độ chính xác cao và người xử lý có kỹ thuật tốt.
Các thông tin cần để xử lý ra các ô chứa bao gồm:
- Bản đồ mô hình số độ cao của nền lưu vực (khu vực phân chia ô)
- Bản đồ mạng lưới đường giao thông có cao độ của từng cung đường
- Bản đồ hệ thống đê có cao độ chi tiết của từng đoạn
Quá trình xử lý gồm các bước chính sau:
- Tích hợp các bảo đồ hệ thống đê và bản đồ mạng lưới giao thông vào bản
đồ số cao độ của lưu vực.
- Xác định đường bao của các ô chứa (phân chia ô chứa)
- Xác định quan hệ V-Z (thể tích và cao độ) của ô chứa

- Xác định quan hệ F-Z (diện tích và cao độ) của các ô chứa
- Xác định vị trí tràn giữa các ô chứa
- Xây dựng hàm quan hệ tràn hoặc bảng thông số của công trình chảy tràn.
- Xác định liên kết giữa các ô chứa với nhau và với mạng sông trong mô
hình thủy lực.
Việc xác định các thông số của ô chứa cang cẩn thận và chi tiết thì độ chính xác
của mô hình càng cao. Hơn thế nếu ô chứa được tính toán phân chia nhỏ, hợp lý và
dữ liệu sử dụng có độ càng chi tiết thì mô hình giả hai chiều sẽ cho kết quả tiến gần
đến kết quả của mô hình tính toán hai chiều thực.
4.1. Số liệu về lòng dẫn
Số liệu về lòng dẫn thu thập bao gồm hệ thống mặt cắt (trắc dọc và trắc ngang)
của các sông Đáy và sông Tích-Bùi. Ngoài số liệu về mặt cắt còn cần thu thập các số
liệu về cao độ đê. Các số liệu cao độ đê rất quan trọng trong tính toán bài toán ngập
lụt khu vực hạ du.
Đặc trưng của cao độ đê sông Đáy (Hình 5.6) ở đoạn nghiên cứu có thể nhận
thấy đó là cao độ đê tả (phía nội thành Hà Nội) cao hơn nhiều so với đê hữu. Đây là
do đặc thù của sông Đáy là dòng sông phục vụ phân chậm lũ để bảo vệ cho khu vực
trung tâm thành phố Hà Nội. Vì vậy trong trường hợp lũ lớn nước chỉ có thể tràn qua
đê hưu sang phía Tây (tức là phía sông Tích-Bùi) chứ hoàn toàn không thể tràn về
phía nội đô của Hà Nội.
Hình 5.6: Cao độ đê sông đáy (màu đỏ là đê tả, màu xanh là đê hữu)

Sông Tích với chiều dài 110,696km, có tổng 450 mặt cắt:
Trong đó: - Đoạn 1 có 277 mặt cắt (276 mặt cắt + 1 mặt cắt K0)
- Đoạn 2&3 có 173 mặt cắt (171 mặt cắt + 2 mặt cắt K0, KC)
Từ hình 5.7 đến hình 5.17 là một số mặt cắt điển hình:
Mặt cắt ngang K0

25
20
Cao độ đáy sông (m)
15
10
0
0 20 40 60 80 100 120 140 160
Khoảng cách cộng dồn (m)
Hình 5.7: Số liệu mặt cắt ngang K0 của sông Tích-Bùi mới
Mặt cắt ngang MC153

14
12
10
0
0 20 40 60 80 100 120 140 160
Hình 5.8: Số liệu mặt cắt ngang MC153 của sông Tích-Bùi mới

12
10
0
0 50 100 150 200 250 300

12
10
0
0 50 100 150 200 250

Mặt cắt ngang C14

12
10
0
0 50 100 150 200 250
Hình 5.11: Số liệu mặt cắt ngang C14 của sông Tích-Bùi mới

12
10
0
0 20 40 60 80 100 120 140 160 180


8
6
0
0 20 40 60 80 100 120 140 160 180

14
12
10
0
0 20 40 60 80 100 120 140 160
-2
-4


8
6
0
0 20 40 60 80 100 120 140 160

9
7
0
0 20 40 60 80 100 120 140 160
-1


10
6
0
0 20 40 60 80 100 120 140 160
-2
-4
4.2. Số liệu về biên
Biên trên tại Đập Đáy được lấy là hằng số, còn biên trên của sông Tích-Bùi
được tính từ mưa bằng mô hình thủy văn. Các biên phụ (nhập lưu) trên tuyến Tích-
Bùi như trên Hình 4.5 được tính bằng mô hình thủy văn. Các phần nhập lưu bên sông
Đáy chủ yếu là các trạm bơm. Chính vì vậy nhập lưu bên sông đáy được xác định dựa
theo công suất và mức độ mưa.
Hình 5.18: Đường quá trình mực nước tại trạm Phủ Lý năm 2014

Hình 5.19: Đường quá trình mực nước tại trạm Ba Thá năm 2014
Biên dưới của mô hình được xác đinh là mực nước tại trạm thủy văn Phủ Lý.
Tại đây số liệu mực nước của các năm 2014, 2015, 2016, 2017 và năm 2018 đã được
thu thập đầy đủ.

Trong lưu vực tính toán có trạm thủy văn Ba Thá. Đây là điểm kiểm định mô
hình và cũng là điểm cần dự báo của mô hình. Số liệu mực nước tại Ba Thá cũng đã
được thu thập đầy đủ các năm như tại trạm Phủ Lý.

Các hình từ 4.18 đến 4.23 là mực nước một số năm của trạm Ba Thá và trạm
Phủ Lý. Các hình này cho thấy thủy triệu trực tiếp có ảnh hưởng các trạm này
4.3. Số liệu về ô chứa
Các ô chứa trông mô hình thủy liều mở rộng được xác định ranh giới trên cơ sở
cao độ của hệ địa hình kết hợp với hệ thống giao thông, hệ thống đê, đường bao. Các
quan hệ V-Z và F-Z của các ô được xác định trên cơ sở mô hình số độ cao của ô đó.
Về độ dài đường tràn và cao độ đường tràn được xác định thông qua hệ thống cao độ
đê, cao độ đường giao thông và cao độ của các hệ thống đê. Tổng số ô chứa đưa vào
tính toán là 62 ô đã được nhóm nghiên cứu xác định các tham số cơ bản dựa trên các
thông tin thu thập được từ nhiều nguồn khác nhau.
Các ô chứa thuộc lưu vực sông Tích-Bùi chỉ là 49 ô (như trên Hình 4.24). Nhưng
khi mở rộng mạng tính toán kéo dài đến Phủ Lý thì số lượng ô chứa đưa vào trong
mô hình thủy lực một chiều mở rộng tăng lên là 62 ô.
Các ô chứa được kết nối với các đoạn sông chính theo vị trí địa lý, cơ chế tràn
nước giữa ô chứa và sông dựa trên mực nước thực của sông và ô so với cao độ đê tại
vị trí kết nối.
Các ô trong miền tính cũng có sự kết nối và tràn nước qua lại với nhau tạo thành
một hệ thống liên hoàn. Cơ chế tràn thông qua các đường tràn và cao độ mực nước
giữa các ô chứa với nhau và so với cao độ đường tràn và độ rộng của đường tràn hoặc

hàm độ rộng của đường tràn được xác đinh từ quá trình xử lý số liệu ô chứa như đã
trình bày ở phần trên.
Hình 5.24: Vị trí các ô chứa trong khu vực nghiên cứu

Chương 6
Mô hình học máy
1. Một số mô hình học máy trong dự báo mực nước

1.1. Mô hình hồi quy tuyến tính nhiều biến
Xét mô hình hồi quy tổng quát để giải bài toán xác định mức độ hài lòng của
các hộ dân dùng dịch vụ nước tưới tiêu, thông thường được viết như sau:
Y = f(X) + ϵ, (6.1)
trong đó ϵ là lỗi của mô hình, E(ϵ) = 0, Var(ϵ) = σ2ϵ . Tập dữ liệu đầu vào ℒ =
(X i , Yi )N
i=1 dùng để xây dựng mô hình hồi quy được thu thập, khảo sát độc lập từ các
hộ dùng nước với các tiêu chí quan sát X (predictor features) và biến đích Y (response
feature) lưu giá trị đánh giá mức độ hài lòng của các hộ dùng nước. Trong biểu thức
(5.1), X ∈ ℝM và Y ∈ ℝ1 là các biến ngẫu nhiên với xác suất 𝒫, cụ thể, 𝒫(X = x, Y =
y) là xác suất mà các biến ngẫu nhiên X, Y nhận các giá trị x và y. Ở đây, M là số
chiều của tập dữ liệu đầu vào và N là số mẫu thu thập được. Mục tiêu của bài toán
hồi quy là tìm mô hình mà giá trị ước lượng của nó được dự đoán bởi hàm f(∙) có
trung bình sai số bình phương (mean squared errors) càng nhỏ càng tốt. Các mô hình
hồi quy trình bày trong bài báo này được dùng như 1 hàm f: ℝM → ℝ1 ước lượng giá
trị y ∈ Y tương ứng với dữ liệu đầu vào x ∈ ℝM .
Mô hình hồi quy tuyến tính gồm hồi quy đơn biến (single) và nhiều biến
(multivariate). Hồi quy đơn biến là mô hình hồi quy với một biến hoặc đặc trưng
(biến độc lập), hồi quy đa biến là mô hình hồi quy với nhiều biến và thường được sử
dụng rộng rãi trong thực tế. Với tập dữ liệu đầu vào ℒ cho trước, mô hình hồi quy
tổng quát ở công thức (6.1) có thể được viết lại ở dạng sau:
𝑌 = 𝐸 (𝑌|𝑋 ) + ϵ, (6.2)
trong đó ϵ ∼ 𝑁(0, 𝜎 2 ) và
𝐸 (𝑌|𝑋 ) = 𝛽0 + ∑𝑁
𝑖=1 𝑋𝑖 𝛽𝑖 , (6.3)
𝛽0 là hệ số chặn (intercept) và các 𝛽𝑖 là độ dốc (slope). Để tìm các hệ số của mô
hình, cách tiếp cận phổ biến là dựa trên phương pháp bình phương nhỏ nhất, trong
đó chúng ta tìm các hệ số 𝛽 = (𝛽0 , 𝛽1 , … , 𝛽𝑀 )𝑇 để cực tiểu hóa tổng bình phương
phần dư (residual sum of squares, RSS):
2 2
𝑅𝑆𝑆(𝛽) = ∑𝑁 𝑁 𝑁
𝑖=1(𝑌𝑖 − 𝐸 (𝑌 |𝑋 )) = ∑𝑖=1(𝑌𝑖 − 𝛽0 − ∑𝑗=1 𝑋𝑗 𝛽𝑗 ) . (6.4)

Ta cần xác định véc-tơ 𝛽 cho các hệ số trong mô hình hồi quy, giả thiết các
điều kiện cho mô hình tuyến tính được đáp ứng. Công thức (6.4) có thể được viết như
sau:
𝑅𝑆𝑆(𝛽) = (𝑌 − 𝑋𝛽)𝑇 (𝑌 − 𝑋𝛽). (6.5)
Nếu 𝑋 𝑇 𝑋 không suy biến, véc-tơ 𝛽 được xác định bằng phương trình sau:
𝛽̂ = (𝑋 𝑇 𝑋)−1 𝑋 𝑇 𝑌. (6.6)
Từ (5.6) ta có phương trình hồi quy nhiều biến, để dự đoán giá trị mới 𝑋 = 𝑥
ta tính đầu ra 𝑌̂ của mô hình hồi quy tuyến tính nhiều biến như sau:
𝑌̂ = 𝑋𝛽̂ = (𝑋 𝑇 𝑋 )−1 𝑋 𝑇 𝑌. (6.7)
1.2. Hồi quy LASSO
Phương pháp LASSO (Least absolute shrinkage and selection operator) là
phương pháp hồi quy tuyến tính nhiều biến có hiệu chỉnh mô hình, phương pháp này
đưa thêm hàm phạt vào hàm lỗi để lỗi hồi quy đạt nhỏ nhất:
2
𝑅𝑆𝑆(𝛽) = ∑𝑁 𝑀
𝑖=1(𝑌𝑖 − 𝐸 (𝑌 |𝑋 )) + 𝜆 ∑𝑗=1 |𝛽𝑗 |. (6.8)
Trong đó 𝜆 là hệ số phạt dùng để điều chỉnh mô hình, chuẩn L1 được dùng cho
việc dự đoán các tham số. Trong trường hợp 𝜆 đủ lớn sẽ có một số tham số hồi quy
tiến dần về 0, do đó chúng không đóng vai trò gì trong mô hình hồi quy. Phương pháp
LASSO cũng được dùng cho bài toán lựa chọn thuộc tính, với các biến có tham số
hồi quy bằng 0 ta có thể loại khỏi mô hình.
1.3. Phương pháp hồi quy k láng giềng
Phương pháp k láng giềng dùng cho bài toán hồi quy không có quá trình huấn
luyện để xây dựng mô hình học, khi dự đoán 1 mẫu mới, giải thuật tìm k (k=1, 2,..)
láng giềng gần nhất của mẫu này trong tập dữ liệu huấn luyện ℒ, sau đó tính giá trị
trung bình (hoặc trung vị) để trả về kết quả cuối cùng.
Quá trình tìm k láng giềng của mẫu mới thường sử dụng khoảng cách Euclidean
được định nghĩa như sau:
1
2 2
d(𝑥𝑎 , 𝑥𝑏 ) = (∑𝑀
𝑗=0(𝑥𝑎𝑗 − 𝑥𝑏𝑗 ) ) , trong đó xa và xb là 2 mẫu độc lập. (6.9)
1.4. Cây hồi quy

Mô hình cây hồi quy tách đệ quy theo hàng của tập dữ liệu đầu vào ℒ thành các
tập dữ liệu nhỏ hơn, hình thành nút và lá của cây. Tại mỗi lần tách nút, một thuộc tính
và giá trị tách của thuộc tính này được chọn để chia nút thành 2 nút con, nút con trái
và nút con phải.
Xây dựng cây hồi quy

Gọi 𝑡 là nút cha để tách nhánh trên cây hồi quy. Việc tách nhánh trên thuộc tính
𝑋 được xác định bởi việc giảm sự hỗn tạp tại nút 𝑡, ký hiệu ∆𝑅(𝑋, 𝑡). Kỳ vọng của 𝑌
ở nút 𝑡 được tối thiểu hóa nhờ hàm lỗi bình phương sai số được định nghĩa như sau:
1
𝑅(𝑡 ) = 𝑎𝑟𝑔𝑚𝑖𝑛𝑌𝑡∈ℒ 𝐸 [(𝑌𝑖 − 𝑌̅𝑡 )2 ] = 𝑎𝑟𝑔𝑚𝑖𝑛𝑌𝑡∈ℒ ∑𝑋𝑖 ∈𝑡(𝑌𝑖 − 𝑌̅𝑡 )2 . (6.10)
𝑁(𝑡)
Trong đó 𝑁(𝑡) là tổng số mẫu hiện tại ở nút 𝑡 và 𝑌̅𝑡 là trung bình mẫu của 𝑌 tại 𝑡.
Gọi 𝑠 là giá trị chia tách thuộc tính 𝑋 tại nút 𝑡 thành nút con trái 𝑡𝐿 và nút con
phải 𝑡𝑅 phụ thuộc vào 𝑋 ≤ 𝑠 hoặc 𝑋 > 𝑠, 𝑡𝐿 = {𝑋𝑖 ∈ 𝑡, 𝑋𝑖 ≤ 𝑠} và 𝑡𝑅 = {𝑋𝑖 ∈
𝑡, 𝑋𝑖 > 𝑠}, 𝑖 = 1. . 𝑁. Độ biến thiên của các mẫu cho mỗi nút con là
1 2 1 2
𝑅(𝑡𝐿 ) = ∑𝑋𝑖 ∈𝑡𝐿(𝑌𝑖 − 𝑌̅𝑡𝐿 ) , 𝑅(𝑡𝑅 ) = ∑𝑋𝑖 ∈𝑡𝑅(𝑌𝑖 − 𝑌̅𝑡𝑅 ) . (6.11)
𝑁𝐿 (𝑡) 𝑁𝑅 (𝑡)
Trong đó 𝑌̅𝑡𝐿 là trung bình mẫu của 𝑡𝐿 và 𝑁𝐿 (𝑡 ) là kích thước mẫu của 𝑡𝐿 .
Tương tự, 𝑌̅𝑡𝑅 và 𝑁𝑅 (𝑡 ) là trung bình mẫu và kích thước mẫu của 𝑡𝑅 .
Như vậy, việc giảm độ hỗn tạp theo việc chia tách 𝑠 đối với 𝑋 được tính như sau:
∆𝑅 (𝑋, 𝑡 ) = 𝑅 (𝑡 ) − [𝑅(𝑡𝐿 )𝑝(𝑡𝐿 ) + 𝑅(𝑡𝑅 )𝑝(𝑡𝑅 )]. (6.12)
Trong đó 𝑝(𝑡𝐿 ) = 𝑁𝐿 (𝑡)/𝑁(𝑡) và 𝑝(𝑡𝑅 ) = 𝑁𝑅 (𝑡)/𝑁(𝑡) là các tỷ lệ quan sát
trong 𝑡𝐿 và 𝑡𝑅 . Điểm chia tách được chọn trên thuộc tính 𝑋 cho mỗi nút 𝑡 chính là
giá trị làm cho ∆𝑅 (𝑋, 𝑡 ) đạt cực đại.
Dự đoán dùng cây hồi quy
Khi xây dựng cây hồi quy, ta cần phải tính toán giá trị cho nút lá của cây, quá
trình này được mô tả sau đây. Sử dụng các ký hiệu của Breiman, gọi 𝜃 là véc-tơ chứa
tham số ngẫu nhiên để xác định việc xây dựng cây. Trong mỗi cây hồi quy, ta tính
toán trọng số dương 𝑤𝑖 (𝑥𝑖 , 𝜃) cho mỗi mẫu 𝑥𝑖 ∈ ℒ. Đặt 𝑙(𝑥, 𝜃, 𝑡) là nút lá 𝑡 trong cây
hồi quy. Các mẫu 𝑥𝑖 ∈ 𝑙(𝑥, 𝜃, 𝑡) được gán các trọng số 𝑤𝑖 (𝑥, 𝜃) = 1/𝑁(𝑡), trong đó
𝑁𝑡 là số mẫu trong 𝑙(𝑥, 𝜃, 𝑡). Nghĩa là việc dự đoán dùng cây hồi quy đơn giản là tính
giá trị trung bình của các mẫu tại nút lá của cây.
Với dữ liệu thử nghiệm 𝑋 = 𝑥, 𝑌̂ là giá trị dự đoán của cây hồi quy được tính
như sau:
𝑌̂ = ∑𝑁
𝑖=1 𝑤𝑖 (𝑥, 𝜃 )𝑌𝑖 = ∑𝑥𝑖 ,𝑋𝑖 ∈𝑙(𝑥,𝜃,𝑡) 𝑤𝑖 (𝑥, 𝜃 )𝑌𝑖 . (6.13)
1.5. Mạng nơ-ron nhân tạo
Mạng nơ-ron nhân tạo giả lập quá trình học tập và tính toán của bộ não con
người. Một mạng nơ-ron nhân tạo được xây dựng từ những thành phần cơ sở là những
nơ-ron nhân tạo gồm nhiều đầu vào và một đầu ra (Hình 6.1). Mỗi nơ-ron nhân tạo
giả lập một nơ-ron sinh học, gồm một ngưỡng kích hoạt (bias) và một hàm kích hoạt
(hay hàm truyền –transfer function), đặc trưng cho tính chất của nơ-ron. Các nơ-ron
nhân tạo được liên kết với nhau bằng các kết nối. Mỗi kết nối có trọng số kết nối

(weight), đặc trưng cho khả năng nhớ của mạng nơ-ron. Quá trình huấn luyện mạng
nơ-ron là một quá trình điều chỉnh các ngưỡng kích hoạt và các trọng số kết nối, dựa
trên dữ liệu học.
Hình 6.1: Kiến trúc một nơ-ron nhân tạo

Trong đó:
v(t): Tổng tất cả các đầu vào mô tả toàn bộ thế năng tác động ở thân nơ-ron.
Xk(t): Các biến đầu vào (các đặc trưng), k=1..M.
wk: Trọng số liên kết ngoài giữa các đầu vào k với nơ-ron hiện tại.
H(.): Hàm kích hoạt.
Y(t): Tín hiệu đầu ra nơ-ron.
: Ngưỡng (là hằng số), xác định ngưỡng kích hoạt.
Khi kết hợp các nơ-ron lại với nhau ta có một mạng nơ-ron nhân tạo. Tuỳ theo
cách thức liên kết giữa các nơ-ron mà ta có các loại mạng khác nhau như: mạng truyền
thẳng (Hình 6.2), mạng phản hồi,… Ta có thể xem như mạng nơ-ron nhân tạo biểu
thị mô hình hồi quy theo công thức (6.1) với X là véctơ số liệu đầu vào và Y là véctơ
số liệu đầu ra. Ưu điểm của một mạng nơ-ron nhân tạo là nó cho phép xây dựng một
mô hình tính toán có khả năng học dữ liệu rất cao. Có thể coi mạng nơ-ron nhân tạo
là một hộp đen có nhiều đầu vào và nhiều đầu ra có khả năng học được mối quan hệ
giữa đầu ra và đầu vào dựa trên dữ liệu được học.
Hình 6.2: Mạng nơ-ron lan truyền thẳng

Quá trình huấn luyện mạng nơ-ron dựa trên lỗi hồi quy giữa giá trị dự đoán và
giá trị quan sát được của biến đích, giải thuật huấn luyện sẽ điều chỉnh các trọng số
kết nối của mạng nơ-ron nhằm cực tiểu hóa lỗi hồi quy trên các mẫu huấn luyện. Sau
khi mạng được huấn luyện thành công, các tri thức tích luỹ được trong quá trình huấn
luyện mạng (các ma trận trọng số, các tham số tự do, v.v) sẽ được cập nhật vào cơ sở
tri thức để sử dụng trong quá trình dự đoán.Có nhiều loại mạng nơ-ron, nhiều tầng và
được dùng cho cả bài toán học có giám sát và học không giám sát. Trong nhiều nghiên
cứu mạng nơ-ron một lớp truyền thẳng được lựa chọn, sử dụng trọng số suy giảm
(weight decay) và hệ số co của mô hình để λ tránh tình trạng học vẹt (over-fitting).
1.6. Máy véc-tơ hồi quy
Máy véc-tơ hỗ trợ hồi quy (Support Vector Regression, SVR) tìm siêu phẳng đi
qua tất cả các điểm dữ liệu với độ lệch chuẩn ε. Trong hồi quy ε – SV, mục đích là
tìm một hàm f(X) trong công thức (6.1) có sai số nhỏ nhất ε so với biến đích Yi:
f(X) = w T Φ(X) + b, (6.14)
Trong đó w  RM, (X) biểu thị một hàm phi tuyến được chuyển từ không gian
RM vào không gian nhiều chiều. Mục đích ở đây là cần tìm w và b để giá trị X=x có
thể được xác định bằng cách tối thiểu hóa lỗi hồi quy. Từ đó dẫn đến giải bài toán
quy hoạch toàn phương như sau:
N

1 2
min  (w, b,  ,  * )  w  C ( i   i* ) (6.15)
2 i 1
Với điều kiện:
Yi  ( wX i  b)     i

( wX i  b)  Yi     i
*

 i ,  i  0
*
Ở đây, i, i* là hai biến bù và C > 0 dùng để chỉnh độ rộng giữa lề và lỗi. Để
giải quyết bài toán (6.15), trước tiên phải tìm cực tiểu của hàm L theo w, b, i, i*.
 
1 2 N N
min L(w, b,  ,  * ,  ,  * ,  , *)  w C (i  i* )  (ii  i * i* )
2 i 1 i 1
 
N N
  i (  i  Yi  wT  ( X i )  b)   i* (  i*  Yi  wT  ( X i )  b). (6.16)
i 1 i 1
Với i, i*, i, i* là các hệ số Lagrange và thỏa mãn điều kiện: i, i*, i, i*
 0, i=1..N.
Lấy đạo hàm cấp một của phương trình (6.16), hồi quy phi tuyến SVR sử dụng
hàm lỗi  được tính như sau:

1 ∗ ∗ ∗ ∗
𝑚𝑎𝑥 {− 2 ∑𝑁 𝑁 𝑁
1 (𝛼𝑖 − 𝛼𝑖 )(𝛼𝑗 − 𝛼𝑗 )Φ(𝑋𝑖 , 𝑋𝑗 ) − 𝜀 ∑1 (𝛼𝑖 + 𝛼𝑖 ) + ∑1 𝑌𝑖 (𝛼𝑖 − 𝛼𝑖 )} (6.17)
với ràng buộc:
∗ ∗
∑𝑁
1 (𝛼𝑖 − 𝛼𝑖 ) = 0; 𝛼𝑖 , 𝛼𝑖 ∈ [0, 𝐶 ]. (6.18)
Giải biểu thức (6.17) với ràng buộc (6.18) xác định được các nhân tử Lagrange
i, i . Khi đó, mô hình hồi quy SVR được trình bày ở (6.14), với
*
𝑁
1
̂ = ∑(𝛼𝑖 − 𝛼𝑖∗ )𝑋𝑖 , 𝑏̂ = − 𝑤
𝑤 ̂ (𝑋𝑗 + 𝑋𝑘 ).
2
1
Trong đó Xj và Xk là 2 véc-tơ hỗ trợ, 𝛼𝑖 ∈ (0, 𝐶) và 𝛼𝑖∗ ∈ (0, 𝐶).

SVR có thể dùng các hàm nhân khác nhau để giải quyết lớp các bài toán hồi quy
phi tuyến mà không cần bất kỳ một thay đổi nào về mặt thuật toán, các hàm nhân
được dùng thông dụng như:
2
− Hàm nhân đa năng Gaussian RBF có dạng: K(u, v) = e−σ||u−v||
− Hàm nhân đa thức bậc d > 0: K(u, v) = (C + u. v)d .
1.7. Rừng ngẫu nhiên hồi quy
Rừng ngẫu nhiên hồi quy (RF) gồm tập hợp các cây hồi quy đã trình bày ở trên
Từ tập dữ liệu đầu vào ℒ, RF dùng kỹ thuật lấy mẫu bootstrap có hoàn lại tạo ra nhiều
tập dữ liệu khác nhau. Trên mỗi tập dữ liệu con này, lấy ngẫu nhiên một lượng cố
định thuộc tính, thường gọi là mtry để xây dựng cây. Mỗi cây hồi quy được xây dựng
không cắt nhánh với chiều cao tối đa. Việc lấy hai lần ngẫu nhiên cả mẫu và thuộc
tính đã tạo ra các tập dữ liệu con khác nhau giúp RF giảm độ dao động (variance) của
mô hình học.
Dự đoán bằng rừng ngẫu nhiên hồi quy
Việc xây dựng rừng ngẫu nhiên hồi quy và dự đoán mẫu mới được mô tả như
sau. Đặt Θ = {𝜃𝑘 }1𝐾 là tập gồm K các véc-tơ tham số ngẫu nhiên cho rừng được sinh
ra từ ℒ, trong đó 𝜃𝑘 là một véc-tơ tham số ngẫu nhiên để xác định độ lớn của cây thứ
𝑘 trong rừng (k = 1. . K). Gọi ℒ 𝑘 là tập dữ liệu thứ 𝑘 sinh ra từ ℒ dùng kỹ thuật
bootstrap, trong mỗi cây hồi quy 𝑇𝑘 từ ℒ 𝑘 , ta tính trọng số dương 𝑤𝑖 (𝑥𝑖 , 𝜃𝑘 ) cho từng
mẫu 𝑥𝑖 ∈ ℒ . Đặt 𝑙(𝑥, 𝜃𝑘 , 𝑡) là nút lá 𝑡 trong cây 𝑇𝑘 . Mẫu 𝑥𝑖 ∈ 𝑙(𝑥, 𝜃𝑘 , 𝑡) được gán
cùng một trọng số 𝑤𝑖 (𝑥, 𝜃𝑘 ) = 1/𝑁(𝑡), trong đó 𝑁(𝑡) là số các mẫu trong 𝑙(𝑥, 𝜃𝑘 , 𝑡).
Trong trường hợp này, tất cả các mẫu trong ℒ 𝑘 được gán trọng số dương và các mẫu
không trong ℒ 𝑘 được gán bằng 0.
Với một cây hồi quy 𝑇𝑘 , khi có giá trị thử nghiệm 𝑋 = 𝑥 thì giá trị dự đoán 𝑌̂𝑘
tương ứng:
𝑌̂𝑘 = ∑𝑁
𝑖=1 𝑤𝑖 (𝑥, 𝜃𝑘 )𝑌𝑖 = ∑𝑥𝑖 ,𝑋𝑖 ∈𝑙(𝑥,𝜃𝑘 ,𝑡) 𝑤𝑖 (𝑥, 𝜃𝑘 )𝑌𝑖 . (6.18)

Trọng số 𝑤𝑖 (𝑥) được tính bởi rừng ngẫu nhiên là giá trị trung bình của các
trọng số dự đoán của tất cả các cây trong rừng. Công thức tính như sau:
1
𝑤𝑖 (𝑥) = ∑𝐾
𝑘=1 𝑤𝑖 (𝑥, 𝜃𝑘 ). (6.19)
𝐾
Cuối cùng, giá trị dự đoán của rừng ngẫu nhiên hồi quy được cho bởi:
𝑌̂ = ∑𝑁
𝑖=1 𝑤𝑖 (𝑥 )𝑌𝑖 . (6.20)
Độ đo sự quan trọng của thuộc tính
Khi cây hồi quy phân chia tập dữ liệu đầu vào thành các vùng không giao nhau
(theo hàng), giá trị dự đoán là giá trị trung bình được gán vào các vùng tương ứng (lá
của cây). Tại mỗi bước tính toán để tách nút 𝑡, theo công thức (6.12) tất cả các giá trị
của mỗi thuộc tính 𝑋 được xét để tìm điểm tách khi đạt độ giảm hỗn tạp (impurity)
∆𝑅 (𝑋, 𝑡 ) là lớn nhất. Do đó, trong quá trình xây dựng cây hồi quy, việc giảm sự hỗn
tạp trên từng thuộc tính cụ thể được dùng để tính độ đo sự quan trọng của thuộc tính
khi dùng mô hình cây.
Với mô hình rừng ngẫu nhiên, độ đo sự quan trọng của thuộc tính 𝑋 được tính
bằng cách lấy giá trị trung bình của tất cả các độ đo của các cây hồi quy độc lập. Có
một điểm lợi trong việc tính độ đo sự quan trọng của thuộc tính dùng mô hình rừng
ngẫu nhiên là độ đo của các biến có tương tác lẫn nhau đều được xem xét một cách
tự động, điều này khác hẳn với những phương pháp tính tương quan tuyến tính như
Kendall, Pearson. Độ đo sự quan trọng của thuộc tính 𝑋 còn được tính theo cách khác
dùng phương pháp lặp hoán vị cho kết quả chính xác hơn, tuy nhiên thời gian tính
toán lâu hơn do chạy nhiều lần rừng ngẫu nhiên trên tập dữ liệu mở rộng cỡ 2M chứa
các biến giả.
Gọi 𝐼𝑆𝑘 (𝑋𝑗 ), 𝐼𝑆𝑋𝑗 lần lượt là độ đo sự quan trọng của thuộc tính Xj trong một
cây hồi quy Tk(k=1...K) và trong một rừng ngẫu nhiên. Từ công thức (6.12), ta tính
độ đo sự quan trọng của Xj từ cây hồi quy độc lập như sau:
𝐼𝑆𝑘 (𝑋𝑗 ) = ∑𝑡∈𝑇𝑘 ∆𝑅(𝑋𝑗 , 𝑡), (6.21)
và từ rừng ngẫu nhiên là:
1
𝐼𝑆𝑋𝑗 = ∑𝐾
𝑘=1 𝐼𝑆𝑘 (𝑋𝑗 ). (6.22)
𝐾
1.8. Boosting
Mô hình boosting ban đầu được phát triển xử lý bài toán phân lớp sau đó được
mở rộng cho bài toán hồi quy. Trong mục này, kỹ thuật điển hình của boosting là
AdaBoost (Adaptive Boost) được trình bày vắn tắt, sau đó mô hình boosting của
Friedman với hàm cơ sở là cây hồi quy được áp dụng xử lý bài toán dự đoán sự hài
lòng của các hộ dân dùng nước tưới tiêu.

Adaboost là một bộ phân loại mạnh phi tuyến dựa trên hướng tiếp cận boosting
được Freund và Schapire đưa ra vào năm 1996 xử lý bài toán phân lớp nhị phân.
Adaboost hoạt động trên nguyên tắc kết hợp tuyến tính các phân loại yếu để hình
thành một phân loại mạnh. Để có thể kết hợp các bộ phân loại yếu, adaboost sử dụng
một trọng số (weight) để đánh dấu các mẫu khó nhận dạng. Trong quá trình huấn
luyện, cứ mỗi phân loại yếu được xây dựng, thuật toán sẽ tiến hành cập nhật lại trọng
số để chuẩn bị cho việc xây dựng phân loại yếu tiếp theo: tăng trọng số của các mẫu
bị nhận dạng sai và giảm trọng số của các mẫu được nhận dạng đúng bởi phân loại
yếu vừa xây dựng. Bằng cách này, các phân loại yếu sau có thể tập trung vào các mẫu
mà các phân loại yếu trước đó chưa thực hiện tốt. Sau cùng các phân loại yếu sẽ được
kết hợp tùy theo mức độ ‘tốt’ của chúng để tạo nên một phân loại mạnh.
Các bước thực hiện thuật toán AdaBoost như sau:
- Khởi tạo trọng số ban đầu cho tất cả các mẫu: với m là số mẫu đúng (ứng với
các mẫu có nhãn Y = 1) và l là số mẫu sai (có nhãn tương ứng Y = -1).
1 1
𝑤1,𝑘 = , (6.23)
2𝑚 2𝑙
- Xây dựng T các phân loại yếu. Lặp t = 1, …, T.
- Với mỗi mẫu trong ℒ, xây dựng một phân loại yếu hj với ngưỡng θj và lỗi εj.
- 𝜀𝑗 = ∑𝑁 𝑘=1 𝑤𝑡,𝑘 |ℎ𝑗 (𝑋𝑘 ) − 𝑌𝑘 | (6.24)
- Chọn ra hj với εj nhỏ nhất, ta được ℎ𝑡 : 𝑋 → {1, −1}
- Cập nhật lại trọng số:
𝑤𝑡,𝑘 𝑒 −𝛼𝑡 , ℎ𝑡 (𝑥𝑘 ) = 𝑦𝑘
𝑤𝑡+1,𝑘 = × { 𝛼𝑡 (6.25)
𝑍𝑡 𝑒 , ℎ𝑡 (𝑥𝑘 ) ≠ 𝑦𝑘
Trong đó:
1 1−𝜀𝑗
α𝑡 = ln ( ), (6.26)
2 𝜀𝑗
và hệ số 𝑍𝑡 dùng để đưa 𝑤𝑡+1 về đoạn [0,1] (normalization factor).

- Phân loại mạnh được xây dựng :
𝐻 (𝑥) = 𝑑ấ𝑢(∑𝑇𝑡=1 𝛼𝑡 ℎ𝑡 (𝑥)). (6.27)
Friedman đề xuất mô hình máy boosting dùng hàm học cơ sở là cây quyết định
xử lý được cả bài toán phân lớp và hồi quy. Ý tưởng chính khi xây dựng mô hình hồi
quy như sau: Mô hình học ban đầu khởi tạo với cây hồi quy và hàm lỗi cho trước
(thường dùng hàm lỗi bình phương), giải thuật tìm mô hình cực tiểu hóa lỗi hồi quy.
Bước đầu tiên, giải thuật dự đoán biến đầu ra 𝑌̂i bằng cách lấy giá trị trung bình các
biến quan sát được Yi. Tiếp theo lặp lại K lần (số cây hồi quy K là tham số của mô
hình) để thực hiện: (i) Tính toán phần dư 𝐸̃ = 𝑌𝑖 − 𝑌̂𝑖 và xây dựng mô hình cây hồi
quy dùng phần dư 𝐸̃ là biến đích với mục tiêu cực tiểu hóa lỗi. (ii) Dự đoán mẫu dùng
mô hình cây hồi quy ở bước trước đó. (iii) Cập nhật 𝑌̂𝑖 bằng cách thêm các giá trị dự
đoán ở lần lặp trước vào các giá trị dự đoán được tạo ra trong bước trước đó. Mô hình

Boosting dùng cây hồi quy khác rừng ngẫu nhiên khi các cây trong Boosting có đóng
góp khác nhau khi đưa ra kết quả dự đoán cuối và cây hồi quy sau được xây dựng
phụ thuộc cây trước, ngoài ra chúng được xây dựng với chiều cao biết trước còn ở
rừng ngẫu nhiên các cây hồi quy được xây dựng độc lập và không cắt nhánh.
2. Thu thập và xử lý dữ liệu
2.1. Vùng nghiên cứu
Sông Tích - sông Bùi là một phụ lưu chính của sông Đáy. Sông Tích - sông Bùi
Bắt nguồn từ núi Tản Viên thuộc dãy núi Ba Vì theo hướng Tây Bắc – Đông Nam có
chiều dài 110 km đổ vào sông Đáy tại Ba Thá. Diện tích lưu vực 1.330 km2, phần
phía bờ phải có diện tích 910 km2, phần phía bờ trái có diện tích 390 km2. Lưu vực
dài 75,5 km rộng 17,6 km, độ cao trung bình lưu vực 92 m, độ dốc trung bình lưu vực
5,8%, mật độ lưới sông 0,66 km/km2. Sông Tích chảy qua nhiều vùng đồi, đất cứng
sức xói yếu. Tuy độ dốc của lòng sông Tích không lớn nhưng độ dốc của các sông
nhánh khá lớn, trung bình 10 ÷ 20 m/km, có suối tới 30 m/km (Hình 6.3).
Hình 6.2: Sông Tích-Bùi và các trạm đo
2.2. Sông Tích-Bùi và các trạm đo

Dữ liệu dược thu thập bao gồm: Các điều kiện tự nhiên, các đặc tính khí tượng,
thuỷ văn. Mưa và mực nước ở các trạm thuỷ văn có cho 3.5 tháng, từ 01h này 15/6.
Vùng nghiên cứu là song Tích và song Bùi tại Hà nội. Các trạm khí tượng và thuỷ
văn được sử dụng được liệt kê trong Bảng 6.1.

Bảng 6.1: Các trạm thuỷ văn

N
Station Location (long, lat) data
o
1 Hoa Binh (105o20’, 20o49’) X
2 Hoai Duc (105o43’, 20o04’) X
3 Son Tay meteorology (105o30’, 20o08’) X
4 Ba Vi (105o25’, 20o09’) X
5 Trung Ha (105o20’, 21o14’) X
6 Ba Tha* (105o42’, 20o48’) H, X
7 Son Tay hydrology (105o30’, 21o09’) X
8 Viet Tri (105o25’, 21o18’) X
9 Phu Ly (105o27’, 20o29’) H
Trong đó: H là mực nước; X là mưa; * là trạm cần dự báo mực nước.
Thông tin của các trạm được chỉ ra trong Bảng 6.1. Các dữ liệu này thu thập
trong khoảng thời gian từ 1/5 đến 31/11 trong 5 năm 2014, 2015, 2016, 2017 và 2018
với bước thời gian quan sát là 6h (Hình 5.4 và 5.5).
Hình 6.4: Mưa ở các trạm trong năm 2014

Việc dự đoán mực nước được thực hiện tại trạm Ba Thá trước 6h,12h, 18h, 24h.
Mực nước này được dự đoán dựa vào lượng mưa tại các trạm đo mưa và mực nước
hiện tại tại trạm Ba Thá. Ví dụ, để dự đoán mực nước tại trạm Ba Thá, dữ liệu mưa
đo được trong từng khoảng 6h ở các trạm thương lưu như Hoa Binh, Hoai Duc, Trạm
thuỷ văn Son Tay, Trạm khí tượng Son Tay, Trung Ha, Viet Tri và Ba Tha được ghi

lại từ 1AM ngày 15/06 đến 19PM ngày 31/10 trong 4 năm, 2014, 2015, 2016 và 2017
Tương tự như vậy, mực nước đo theo chu kỳ 6h tại trạm Ba Thấ trong 3 tháng
từ 15/6 đến15/9 của 4 năm 2014, 2014, 2016 và 2017 được sử dụng để dự đoán mực
nước tương lai tại trạm Ba Tha.
Hình 6.5: Mực nước quan sát được tại trạm Ba Thá năm 2017
2.3. Xử lý dữ liệu
Dữ liệu được cần được chuẩn hoá trước khi đưa vào huấn luyện các mô hình dự
đoán. Do dữ liệu được thu thập và lưu không hoàn toàn đầy đủ. Ví dụ, lượng mưa
không phải luôn luôn được đo 6h một lần, mà có thời điểm hoặc vài ngày không được
đo. Thậm chí, đôi khi lại đo dày hơn như 3h một lần. Do đó, dữ liệu những ngày/giờ
thiếu cần được nội suy hoặc được gán giá trị trung bình khi tần suất đo mau hơn là
6h một lần. Thêm vào đó, để có thể ghép dữ liệu Mưa và mực nước lại, các dữ liệu
trong mỗi file cần được sắp xếp theo chiều tang dần về thời gian như trong Hình 5.6
Hình 6.6: Tệp dữ liệu mưa của năm 2014

Các dữ liệu mưa và mực nước này sau đó sẽ được ghép lại theo từng năm. Do
yêu cầu dự đoán trước mực nước 6, 12, 18, 24h. Do đó, các dữ liệu huấn luyện khác
nhau cần được tạo ra để phù hợp với yêu cầu dự đoán
Hình 6.7: Dữ liệu huấn luyện để dự đoán trước 6h (L6) cho năm 2014


Sau khi mô hình đã được huấn luyện sẽ được lưu ra thành file và được sử dụng
để dự đoán mực nước tương lai căn cứ vào dữ liệu hiện tại (mưa và mực nước). Dựa
trên kết quả dự đoán, chúng ta có thể vẽ biểu đồ để so sánh sự sai khác giữa dữ liệu
thực đo và dự đoán.
3. Thực nghiệm để lựa chọn mô hình
3.1. Mô tả dữ liệu
Thông tin của các trạm được chỉ ra trong Bảng 6.1 (ở trên). Các dữ liệu này thu
thập trong khoảng thời gian từ 1/5 đến 31/10 trong 4 năm 2014, 2015, 2016 và 2017
với bước thời gian quan sát là 6h (Hình 6.4 và 6.5 ở trên).
Việc dự đoán mực nước được thực hiện tại trạm Ba Thá trước 6h,12h, 18h, 24h.
Mực nước này được dự đoán dựa vào lượng mưa tại các trạm đo mưa và mực nước
hiện tại tại trạm Ba Thá. Ví dụ, để dự đoán mực nước tại trạm Ba Thá, dữ liệu mưa
đo được trong từng khoảng 6h ở các trạm thương lưu như Hoa Binh, Hoai Duc, Trạm
thuỷ văn Son Tay, Trạm khí tượng Son Tay, Trung Ha, Viet Tri và Ba Tha được ghi
lại từ 1AM ngày 15/06 đến 19PM ngày 31/10 trong 4 năm, 2014, 2015, 2016 và 2017
Tương tự như vậy, mực nước đo theo chu kỳ 6h tại trạm Ba Thá trong 3 tháng
từ 15/6 đến15/9 của 4 năm 2014, 2014, 2016 và 2017 được sử dụng để dự đoán mực
nước tương lai tại trạm Ba Tha.
Dữ liệu huấn luyện gồm 1382 bản ghi thu thập từ 1/5 đến 31/10 trong 4 năm
2014, 2015, 2016 và 2017. Tập dữ liệu kiểm thử gồm 239 bản ghi thu thập từ ngày
15/6/2018 đến ngày 24/9/2018.
3.2. Các độ đo đánh giá
Để đánh giá hiệu năng của các mô hình dự báo chúng tôi sử dụng các độ đo
MSE (Mean Squared Error), R2 và CE trong thực nghiệm của đề tài.
 Độ đo MSE:
Nếu Yˆ là vector với n thành phần dự đoán và Y là vector các giá trị được quan
sát tương ứng với các đầu vào của hàm tạo ra các dự đoán Yˆ thì độ đo MSE được ước
lượng bởi công thức sau:
MSE  
1 n ˆ
 Yi  Yi
n i 1

2

1 n
 ei .
n i 1
(6.28)
Điều này có nghĩa là độ đo MSE là trung bình của bình phương các sai số. Chỉ
số này được tính toán một cách dễ dàng cho một mẫu đặc thù. Giá trị tốt nhất của độ
đo MSE là giá trị nhỏ nhất của nó.
 Độ đo CE:

Bên cạnh độ đo MSE, độ đo CE tính theo chỉ tiêu NASH cũng được sử dụng để
đánh giá sai số dự đoán nhưng thường dùng trong phân tích chuỗi thời gian. Công
thức xác định độ đo CE được cho bởi:
2
∑𝑛 ̂
𝑖=1(𝑌𝑖 −𝑌𝑖 )
𝐶𝐸 = 1 − ̅𝑖 )2
(6.29)
(𝑌𝑖 −𝑌
Trong đó 𝑌̂𝑖 là thành phần dự đoán, 𝑌𝑖 là giá trị mực nước thực đo, 𝑌
̅𝑖 là giá trị
trung bình của mực nước thực đo. Giá trị của độ đo CE càng gần 1 càng tốt.
3.3. Các kết quả thực nghiệm
Gói phần mềm caret được sử dụng để tiến hành các thực nghiệm trên môi trường
R, các mô hình Học máy liệt kê ở phần I đều được tích hợp trong gói phần mềm này.
Dữ liệu huấn luyện gồm 1382 bản ghi thu thập từ 1/5 đến 31/11 trong 4 năm 2014,
2015, 2016 và 2017. Tập dữ liệu kiểm thử gồm 239 bản ghi thu thập từ ngày
15/6/2018 đến ngày 24/9/2018. Khi xây dựng mô hình học máy, chúng tôi sử dụng
kỹ thuật kiểm tra chéo 10-folds với 2 lần lặp và dựa trên hàm lỗi MSE để tìm tham
số tối ưu của từng mô hình, sau đó lựa chọn mô hình có MSE nhỏ nhất với tham số
tìm được để dự đoán dữ liệu kiểm thử. Các thực nghiệm được tiến hành trên 2 máy
phục vụ dùng hệ điều hành Windows Server 2012 64-bit, mỗi máy có cấu hình IntelR
XeonR CPU E5-2640 2.5 GHz, 24 cores, 8 MB cache và 128 GB RAM. Các mô hình
đều được cài đặt song song sử dụng hết 24 cores trên mỗi máy để huấn luyện, tìm
tham số tối ưu và các thực nghiệm khác.
Bảng 6.2: Kết quả dự đoán mốc trước 6h
TT Mô hình học máy Tham số tối ưu RMSE CE
1 Hồi quy tuyến tính (LM) Mặc định 0.162 0.992
2 Hồi quy LASSO 0.194 0.992
3 K láng giềng (KNN) k=4 0.916 0.992
Complexity parameter
4 Cây hồi quy (CART) 0.285 0.992
(cp)=0
Mạng nơ ron nhân tạo Trọng số phân rã=0.1 và
5 0.180 0.990
(ANN) số nơ-ron=9
Nhân poly, degree=1,
6 Máy véc-tơ hỗ trợ (SVR) 0.157 0.993
.001 và C = 16
7 Rừng ngẫu nhiên (RF) mtry = 5 và trees=1000 0.345 0.965
K = 50, interaction.depth
8 Boosting = 16, shrinkage = 0.1 và 0.199 0.988
n.minobsinnode = 10


3 K láng giềng (KNN) k=4 0.948 0.980
(cp)=0
Mạng nơ ron nhân tạo Trọng số phân rã=0.1 và số
5 0.293 0.974
(ANN) nơ-ron=9
Máy véc-tơ hỗ trợ Nhân poly, degree=1,
6 0.254 0.981
(SVR)
K = 50, interaction.depth =
8 Boosting 15, shrinkage = 0.1 và 0.325 0.969
n.minobsinnode = 10

3 K láng giềng (KNN) k=8 0.976 0.959
4 Cây hồi quy (CART) Complexity parameter (cp)=0 0.456 0.959
Mạng nơ ron nhân tạo Trọng số phân rã=0.1 và số
5 0.376 0.958
(ANN) nơ-ron=9
6 0.373 0.958
(SVR)
K = 50, interaction.depth = 8,
8 Boosting shrinkage = 0.1 và 0.405 0.951
n.minobsinnode = 10


3 K láng giềng (KNN) k=4 1.010 0.936
(cp)=0
Mạng nơ ron nhân tạo Trọng số phân rã=0.1 và
5 0.464 0.935
(ANN) số nơ-ron=9
6 0.460 0.938
(SVR)
K = 50, interaction.depth
8 Boosting = 11, shrinkage = 0.1 và 0.472 0.933
n.minobsinnode = 10
Kết quả các mô hình học máy dự báo mực nước tại các mốc 6h, 12h, 18h và 24h
được trình bày ở Bảng trên. Ở 2 cột RMSE và CE kết quả dự đoán với CE cao nhất
và lỗi dự báo thấp nhất được in đậm và gạch dưới.
Ta có thể dễ dàng nhận thấy mô hình học máy k-láng giềng và cây hồi quy có
kết quả dự đoán kém nhất, mô hình hồi quy tuyến tính cho kết quả khả quan với số
liệu mực nước được thử nghiệm, mô hình LASSO có cải thiện khả năng dự báo hơn
so với mô hình tuyến tính nhiều biến. Các mô hình hồi quy phi tuyến tỏ rõ ưu thế
hơn, cụ thể như mạng nơ-ron nhân tạo, boosting, đặc biệt là phương pháp support
vector regression có kết quả dự đoán với lỗi dự báo nhỏ và CE cao.
4. Dự báo mực nước tại trạm Ba Thá sử dụng SVR
Qua các kết quả thử nghiệm ở trên cho thấy kết quả của phương pháp SVR là
tốt nhất với các kết quả thử nghiệm. Vì vậy chúng tôi lựa chọn phương pháp SVR để
dự báo mực nước tại trạm Ba Thá.
Gói phần mềm caret được sử dụng để tiến hành các thực nghiệm trên môi trường
R. Dữ liệu huấn luyện (training data) gồm 1382 bản ghi thu thập từ 1/5 đến 31/11
trong 4 năm 2014, 2015, 2016 và 2017. Tập dữ liệu kiểm thử (testing data) gồm 239
bản ghi thu thập từ ngày 15/6/2018 đến ngày 24/9/2018. Khi xây dựng mô hình dự
báo sử dụng SVR, chúng tôi sử dụng kỹ thuật kiểm tra chéo 10-folds với 2 lần lặp và

dựa trên hàm lỗi MSE để tìm tham số tối ưu của mô hình (C, d), sau đó lựa chọn mô
hình có MSE nhỏ nhất với tham số tìm được để dự đoán dữ liệu kiểm thử.
Bảng dữ liệu training và Bảng dữ liệu testing được thể hiện trong các bảng 6.6
và 6.7 dưới đây.
Bảng 6.6: Bảng dữ liệu training
Bảng 6.7: Bảng dữ liệu Testing
Kết quả chạy SVR trên tập huấn luyện để tìm tham số tối ưu (C, degree của hàm
nhân đa thức dùng trong SVR) dùng kỹ thuật đánh giá chéo 10-folds, tham số lựa
chọn là degrescale scale=0.001 và C = 16.
Kết quả thực nghiệm sử dụng phương pháp SVR để dự báo mực nước tại trạm
Ba Thá được thể hiện trong Hình 6.6 và Bảng 6.8 dưới đây.

Hình 6.6: Kết quả thực nghiệm dự báo mực nước tại trạm Ba Thá sử SVR
Bảng 6.8: Bảng kết quả thực nghiệm dự báo mực nước tại trạm Ba Thá sử dụng
phương pháp SVR
TT SVR Tham số tối ưu RMSE CE
1 Mốc 6h Nhân poly, degree=1, 0.157 0.993
=0.001 và C = 16
2 Mốc 12h - 0.254 0.981
3 Mốc 18h - 0.373 0.958
4 Mốc 24h - 0.460 0.938
R code huấn luyện mô hình dự báo sử dụng SVR:

indx <- createFolds(TrainY, k = 10, returnTrain = TRUE)
ctrl <- trainControl(method = "repeatedcv", number = 10,
repeats = 2, index = indx)
#############################################################
### Support Vector Regression
svmGrid <- expand.grid(degree = 1:2,

scale = c(0.01, 0.005, 0.001),

C = 2^(-2:5))
set.seed(100)
svmPTune <- train(x = TrainX, y = TrainY,
method = "svmPoly",
preProc = c("center", "scale"),
tuneGrid = svmGrid,
trControl = ctrl)
svmPTune
pred<-predict(svmPTune, TestX)
print("R2="); print(R2(TestY, pred))
print("RMSE="); print(RMSE(TestY, pred))
print("CE="); print(CE <- 1 - (sum((TestY -
pred)^2)/sum((TestY - mean(TestY))^2)))
plot(svmPTune, scales = list(x = list(log = 2))) # Plot the tuning
5. Mô hình mạng Nơ ron hồi tiếp RNN (Recurrent Neural Networks)

Bên cạnh mô hình học máy được các chuyên gia của Đại học Thủy Lợi xây
dựng như đã trình bày ở trên thì nhóm nghiên cứu đề tài của Viện Cơ học cũng đã tự
phát triển một mạng tính toán dựa trên phương pháp mạng nơ ron hồi tiếp RNN
(Recurrent Neural Networks).
5.1. Mạng RNN
Con người không bắt đầu suy nghĩ từ đầu tại tất cả các thời điểm. Giống như
khi chúng ta đọc một bài viết chúng ta đọc, mỗi hiểu biết chúng ta thu nhận được dựa
vào từ các hiểu trước đó chứ không phải là đọc tới đâu xong tới đó, rồi lại bắt đầu suy
nghĩ lại từ đầu tới từ chúng ta đang đọc. Tức là tư duy đã có một bộ nhớ để lưu lại
những gì diễn ra trước đó.
Tuy nhiên các mô hình mạng nơ-ron truyền thống thì không thể làm được việc
này, và đó có thể coi là một khuyết điểm chính của chúng. Ví dụ, bạn muốn phân loại
các bối cảnh xảy ra ở tất cả các thời điểm trong một bộ phim, thì đúng là không rõ
làm thế nào để có thể hiểu được một tình huống trong phim mà lại phụ thuộc vào các
tình huống trước đó nếu sử dụng các mạng nơ-ron truyền thống.
Mạng nơ-ron hồi quy (Recurrent Neural Network) sinh ra để giải quyết vấn đề
đó. Nó chứa các vòng lặp bên trong cho phép thông tin có thể lưu lại được.

Hình 6.7: Mạng nơron hồi tiếp có vòng lặp

Hình vẽ trên mô tả một đoạn của mạng nơ-ron hồi quy A với đầu vào là xt và
đầu ra là ht . Một vòng lặp cho phép thông tin có thể được truyền từ bước này qua
bước khác của mạng nơ-ron.
Các vòng lặp này khiến cho mạng nơ-ron hồi quy trông có vẻ khó hiểu. Tuy
nhiên, nếu bạn để ý một chút thì nó không khác mấy so với các mạng nơ-ron thuần.
Một mạng nơ-ron hồi quy có thể được coi là nhiều bản sao chép của cùng một mạng,
trong đó mỗi đầu ra của mạng này là đầu vào của một mạng sao chép khác. Nói thì
hơi khó hiểu, nhưng bạn hãy xem hình mô tả sau:
Hình 6.8: Một mạng nơron hồi tiếp

Chuỗi lặp lại các mạng này chính là phân giải của mạng nơ-ron hồi quy, các
vòng lặp khiến chúng tạo thành một chuỗi danh sách các mạng sao chép nhau. Các
nút của mạng vẫn nhận đầu vào và có đầu ra hệt như mạng nơ-ron thuần.
Trong vài năm gần đây, việc ứng dụng RNN đã đưa ra được nhiều kết quả trong
nhiều lĩnh vực: nhận dạng giọng nói, mô hình hóa ngôn ngữ, dịch máy, mô tả ảnh,…
Đằng sau sự thành công này chính là sự đóng góp của LSTM (Long Short Term
Memory). là một kiểu RNN đặc biệt, với nhiều bài toán thì nó tốt hơn mạng hồi quy
thuần. Hầu hết các kết quả thú vị thu được từ mạng RNN là được sử dụng với LSTM.
5.2. Vấn đề của sự phụ thuộc dài hạn
Một trong những yêu cầu của RNNs là ý tưởng rằng họ có thể kết nối thông tin
trước với nhiệm vụ hiện tại, chẳng hạn như sử dụng khung hình trước đó có thể thông
báo cho sự hiểu biết về khung hiện tại. Nếu RNNs có thể làm điều này, họ sẽ rất hữu
ích. Nhưng có thể họ? Nó phụ thuộc.

Đôi khi, chúng ta chỉ cần nhìn vào thông tin gần đây để thực hiện nhiệm vụ hiện
tại. Ví dụ: hãy xem xét mô hình ngôn ngữ cố gắng dự đoán từ kế tiếp dựa trên các mô
hình trước đó. Nếu chúng ta đang cố gắng dự đoán từ cuối cùng trong "những đám
mây đang trên bầu trời ", chúng ta không cần bất kỳ bối cảnh nào nữa - thì rõ ràng từ
tiếp theo sẽ là bầu trời. Trong những trường hợp như vậy, khi khoảng cách giữa thông
tin liên quan và nơi cần thiết là nhỏ, RNNs có thể học cách sử dụng thông tin trong
quá khứ.
Nhưng trong nhiều tình huống ta buộc phải sử dụng nhiều ngữ cảnh hơn để suy
luận. Ví dụ, dự đoán chữ cuối cùng trong đoạn: “Tôi sinh ra và lớn lên tại Pháp…
Tối có thể nói thuần thục tiếng Pháp.”. Từ thông tin gần nhất cho thấy rằng từ tiếp
theo là tên một ngôn ngữ nhưng khi chúng ta muốn biết cụ thể ngôn ngữ nào thì cần
quay về quá khứ xa hơn để tìm được ngữ cảnh “Tôi sinh ra và lớn lên tại Pháp”. Và
như vậy, RNN có thể phải tìm những thông tin có liên quan và số lượng các điểm đó
trở nên rất lớn. Rõ ràng là khoảng cách thông tin lúc này có thể đã khá xa rồi.
Không được như mong đợi, RNN không thể học để kết nối các thông tin lại với
nhau. Về mặt lý thuyết, rõ ràng là RNN có khả năng xử lý các phụ thuộc xa (long-
term dependencies). Chúng ta có thể xem xét và cài đặt các tham số sao cho khéo là
có thể giải quyết được vấn đề này. Tuy nhiên, đáng tiếc trong thực tế RNN có vẻ
không thể học được các tham số đó. Vấn đề này đã được khám phá khá sâu
bởi Hochreiter (1991) và Bengio, et al. (1994), trong các bài báo của mình, họ đã tìm
được nhưng lý do căn bản để giải thích tại sao RNN không thể học được. Tuy nhiên,
LSTM không vấp phải vấn đề đó!
5.3. Mạng LSTM
LSTM là một dạng đặc biệt của RNN, nó có khả năng học được các phụ thuộc
xa. Mô hình LSTM được giới thiệu bởi Hochreiter & Schmidhuber (1997), và sau đó
đã được cải tiến và phổ biến bởi rất nhiều người trong ngành. Chúng hoạt động cực
kì hiệu quả trên nhiều bài toán khác nhau nên dần đã trở nên phổ biến như hiện nay.
Hình 6.8: Các mô-đun lặp của mạng mạng RNN chứa 1 lớp

LSTM được thiết kế nhằm loại bỏ vấn đề phụ thuộc quá dài (long-term
dependency). Việc nhớ thông tin trong suốt thời gian dài là đặc tính mặc định của
chúng, chứ ta không cần phải huấn luyện nó để có thể nhớ được. Tức là ngay nội tại
của nó đã có thể ghi nhớ được mà không cần bất kì can thiệp nào.
Mọi mạng hồi quy đều có dạng là một chuỗi các mô-đun lặp đi lặp lại của mạng
nơ-ron. Với mạng RNN chuẩn, các mô-đun này có cấu trúc rất đơn giản, thường là
một lớp đơn giản tanh layer.
LSTM cũng có cấu trúc mắt xích tương tự, nhưng các mo-đun lặp có cấu trúc
khác với mạng RNN chuẩn. Thay vì chỉ có một tầng mạng nơ-ron, thì LSTM có tới
bốn tầng tương tác với nhau theo một cách rất đặc biệt.
Hình 6.9: Các mô-đun lặp của mạng LSTM chứa 4 lớp
Hình 6.10: Các ký hiệu sử dụng

Ở sơ đồ trên, mỗi một đường mang một véc-tơ từ đầu ra của một nút tới đầu vào
của một nút khác. hình chữ nhật là các lớp ẩn của mạng nơ-ron, hình tròn biểu diễn
toán tử Pointwise, đường kẻ gộp lại với nhau biểu thị phép nối các toán hạng, và
đường rẽ nhánh biểu thị cho sự sao chép từ vị trí này sang vị trí khác.
5.4. Kết quả xây dựng mạng RNN
Nhóm nghiên cứu đã phát triển một công cụ tính toán dự trên mạng RNN. Công
cụ này đã được thử nghiệm tích hợp vào công cụ cảnh báo dự báo là sản phầm của đề
tài. Tuy nhiên do công cụ này là phần nhóm nghiên cứu xây dựn thêm nên chúng tôi
chỉ để ở mức thử nghiệm dự báo một mức giờ. Đây cũng là để có điều kiện so sánh
với kết quả tính toán của các mô hình khác giúp nhóm nghiên cứu có điều kiện hoàn
thiện hơn và đưa mô hình này vào ứng dụng trong thời gian tới.

PHẦN 3
CÔNG CỤ CẢNH BÁO VÀ DỰ BÁO LŨ LỤT SÔNG
TÍCH-BÙI

Chương 7
Xây dựng công cụ hỗ trợ cảnh báo lũ lụt
1. Xây dựng cơ sở dữ liệu

1.1. Lựa chọn công nghệ
Việc cân nhắc, đánh giá lựa chọn công nghệ sử dụng cần tính tới các yếu tố:
dễ sử dụng, đảm bảo tính tin cậy, sẵn sàng cao, có khả năng chịu lỗi, khả năng nâng
cấp mở rộng lớn.
Một số hệ quản trị cơ sở dữ liệu quan hệ MSSQL, MySQL, PostgreSQL,
Oracle, MongoDB, CouchDB,… Sau đây điểm qua một số đặc tính của các hệ quản
trị phổ biến:
a. Hệ quản trị cở dữ liệu MySQL
MySQL hỗ trợ nhiều nền tảng khác nhau bao gồm cả Microsoft Windows, các
phiên bản Linux, UNIX, và Mac OS X. MySQL có phiên bản miễn phí và trả phí
dựa trên mục đích sử dụng (không thương mại/thương mại) và tính năng. MySQL
nhanh, đa luồng, đa người sử dụng, mạnh mẽ với database server.
Tính năng:
- Hiệu năng cao.
- Lợi ích lớn.
- Khả năng mở rộng và linh hoạt, có thể chạy ở bất cứ đâu.
- Hỗ trợ “giao dịch” mạnh mẽ.
- Tính bảo mật cao.
- Bao hàm phát triển ứng dụng.
- Quản lý dễ dàng.
- Giá thành rẻ.
b. Hệ quản trị cở dữ liệu MS SQL Server
MS SQL Server là một RDBMS phát triển bởi Microsoft. Ngôn ngữ truy vấn
chính là T-SQ và ANSI SQL.
Tính năng:
- Hiệu năng cao.

- Có khả năng sử dụng lớn.

- Phản chiếu trung thực cơ sở dữ liệu.
- Lưu trưc nhanh trạng thái cơ sở dữ liệu.
- CLR integration.
- Service Broker.
- DDL triggers.
- Ranking functions.
- Row version-based isolation levels.
- XML integration.
- TRY…CATCH.
- Database Mail.
c. Hệ quản trị cở dữ liệu ORACLE
Đây là hệ quản trị cơ sở dữ liệu chủ yếu được sử dụng trong các hệ thống lớn
nhiều người dùng. Oracle là hệ quản trị cơ sở dữ liệu quan hệ phát triển bởi ‘Oracle
Corporation’. Oracle quản lý hiệu quả tài nguyên, thông tin của cơ sở dữ liệu, và xử
lý tốt trong quá trình các client gửi yêu cầu và dữ liệu trong mạng. Nó là sự lựa chọn
tuyệt vời cho các hệ thống quản lý dữ liệu theo mô hình client/server. Oracle hỗ trợ
tất cả các hệ điều hành lớn gồm cả client và server bao gồm Windows, Mac OS, BSD
và đa số các phiên bản UNIX.
Tính năng:
- Song song.
- Nhất quán.
- Kỹ thuật khóa.
- Quiesce Database
- Khả chuyển
- Tự quản lý cơ sở dữ liệu.
- SQL*Plus
- ASM
- Scheduler
- Resource Manager (quản lý tài nguyên)
- Data Warehousing (Kho chứa dữ liệu)

- Materialized views
- Bitmap indexes
- Table compression
- Parallel Execution (thực thi song song)
- Analytic SQL
- Data mining (khai phá dữ liệu)
- Partitioning
d. Hệ quản trị cơ sở dữ liệu MS ACCESS
Đây là một trong những sản phẩm của Microsoft. Microsoft Access là phần
mềm quản lý dữ liệu ở mức độ nhập. MS Access là hệ quản trị cơ sở dữ liệu hoàn
toàn phù hợp với các dự án nhỏ. MS Access sử dụng Jet database engine, dùng ngôn
ngữ SQL riêng (đôi khi được gọi là Jet SQL). MS Access đi cùng với gói MS Office.
MS Access dễ dàng sử dụng bằng giao diện.
Tính năng:
- Người dùng có thể tạo bảng, truy vấn, form và reports kết nối với nhau.
- Nhập và xuất dữ liệu với nhiều định dạng khác nhau như Excel, Outlook, ASCII,
dBase, Paradox, FoxPro, SQL Server, Oracle, ODBC,….
Từ các thông tin có được, chúng tôi đưa ra một số giải pháp xây dựng hệ thống
như sau:
- Tổ chức hệ thống theo mô hình dữ liệu tập trung: CSDL lưu trữ tại Trung tâm
dữ liệu và việc cập nhật, truy xuất hoặc kết xuất dữ liệu thông qua môi trường
mạng có bảo mật.
Hệ quản trị CSDL: Microsoft SQL Server 2016 là một hệ quản trị CSDL hiện
đại, chạy được trên nhiều nền tảng hệ điều hành (kể cả Linux), đồng bộ với nền tảng
xây dựng phần mềm đã chọn và bộ công cụ phát triển, đáp ứng được các yêu cầu đề
ra của hệ thống và có giải pháp mở rộng tận dụng dữ liệu dùng chung. Microsoft SQL
Server 2016 cho phép hàng ngàn người kết nối làm việc cùng một lúc, có khả năng
trao đổi dữ liệu với các cơ sở dữ liệu khác, đảm bảo khả năng bảo mật. Các cơ sở dữ
liệu có có thể có kích cỡ lớn, có thể ứng dụng theo mô hình kho dữ liệu.
1.2. Thiết kế cơ sở dữ liệu

Cơ sở dữ liệu là nền tảng của hệ thống, tại cơ sở dữ liệu sẽ lưu trữ tất cả các dữ
liệu liên quan đến đề tài. Trong đề tài này, mô hình cơ sở dữ liệu được xây dựng theo
cấu trúc như sau:
a. Hệ thống sông
1. Sông được phân loại và đánh chỉ số ID.
2. Tên sông
3. Ghi chú.
4. Bảng cao độ đê trái và phải với khoảng cách cộng dồn tương ứng.
b. Hệ thống mặt cắt
1. Mặt cắt được phân loại và đánh chỉ số ID
2. Mã số sông chứa mặt cắt.
3. Tên mặt cắt.
4. Khoảng cách cộng dồn và năm đo.
5. Bảng số liệu mặt cắt ngang X-Y của mặt cắt
c. Hệ thống khu phân chậm lũ
- Các ô được phân loại và đánh chỉ số ID.
- Tên ô
- Bảng số liệu về quan hệ V-Z; F-Z của các ô
d. Hệ thống công trình
- Công trình được phân loại và đánh chỉ số ID.
- Tên công trình.
- Các thuộc tính khác của công trình.
e. Hệ thống trạm khí trượng – thủy văn
- Trạm được phân loại và đánh chỉ số ID.
- Têm trạm.
- Tọa độ các trạm
- Số hiệu quốc tế của các trạm.
f. Số liệu mực nước
- Số liệu được phân loại và đánh chỉ số ID.
- Mã trạm đo.
- Thời gian đo.

- Số liệu đo.
- Cờ.
g. Số liệu Lưu lượng
- Mã trạm đo.
- Thời gian đo.
- Số liệu đo.
- Cờ.
h. Số liệu Nhiệt độ
- Mã trạm đo.
- Thời gian đo.
- Số liệu đo.
- Cờ.
i. Số liệu Độ ẩm
- Mã trạm đo.
- Thời gian đo.
- Số liệu đo.
- Cờ.
Cấu trúc các bảng dữ liệu được mô tả chi tiết như sau:
1. Bảng dữ liệu công trình
STT Tên trường Loại dữ liệu Ràng buộc Ghi chú
1 CT_ID int Unchecked Mã công trình
2 CT_Name nvarchar(250) Checked Tên công trình
3 CT_HSQTN real Unchecked Hệ số Q tràn
4 CT_HSQTTD real Unchecked Hệ số Q tràn
5 HS_Q_CONG real Unchecked Hệ số Q qua cống
6 Z_NGUONG real Unchecked Cao trình ngưỡng

7 Z_DINH real Unchecked Cao trình đỉnh

8 B_TRAN real Unchecked Độ rộng đường
tràn
9 KIEU_CT int Unchecked Kiểu công trình
10 GHICHU nvarchar(900) Unchecked Ghi chú
2. Bảng dữ liệu danh sách sông

1 S_ID int Unchecked Mã sông
2 S_NAME nvarchar(250) Checked Tên sông
3. Bảng dữ liệu mặt cắt sông

1 MC_ID int Unchecked Mã mặt cắt
2 S_ID int Checked Mã sông
3 X real Unchecked Giá trị đo trục X
4 Z real Unchecked Giá trị đo trục Z
4. Bảng dữ liệu đê
1 D_ID int Unchecked Mã cao độ đê
2 S_ID int Checked Mã sông
3 D_TG datetime Unchecked Thời gian đo
4 D_KCCD real Unchecked Trắc dọc

5 D_CD real Unchecked Cao độ đê

6 D_P Int Unchecked Phía
5. Bảng dữ liệu danh sách khu phân lũ, chậm lũ

1 O_ID int Unchecked Mã ô
2 O_NAME nvarchar(250) Checked Tên ô
6. Bảng dữ liệu từng khu phân lũ chậm lũ

1 ID int Unchecked Chỉ số dữ liệu
2 O_ID int Checked Mã ô
3 Z real Unchecked Cao trình
4 F real Unchecked Diện tích
5 V real Unchecked Thể tích
7. Bảng dữ liệu trạm khí tượng

1 KT_ID int Unchecked Mã trạm
2 KT_NAME nvarchar(250) Checked Tên trạm
3 KT_LONG real Unchecked Tọa độ Long
4 KT_LAT real Unchecked Tọa độ Lat
5 CODE nvarchar(250) Unchecked Mã quốc gia, QT

8. Bảng dữ liệu trạm thủy văn

1 KT_ID int Unchecked Chỉ số trạm
2 KT_NAME nvarchar(250) Checked Tên trạm
3 KT_LONG real Unchecked Tọa độ Long
4 KT_LAT real Unchecked Tọa độ Lat
5 CODE nvarchar(250) Unchecked Mã quốc gia, QT
6 S_ID int Unchecked Mã sông
9. Bảng dữ liệu độ ẩm
1 DA_ID int Checked Chỉ số dữ liệu
2 KT_ID int Checked Mã trạm khí tượng
3 DA_TIME datetime Checked Thời gian đo
4 DA_GT real Checked Giá trị độ ẩm
10. Bảng dữ liệu nhiệt độ

1 ND_ID int Checked Chỉ số dữ liệu
2 KT_ID int Checked Mã trạm khí tượng
3 ND _TIME datetime Checked Thời gian đo
4 ND _GT real Checked Giá trị nhiệt độ

11. Bảng dữ liệu mưa

1 M_ID int Checked Chỉ số dữ liệu
2 M_ID int Checked Mã trạm khí tượng
3 NM _TIME datetime Checked Thời gian đo
4 M _GT real Checked Giá trị mưa
12. Bảng dữ liệu mực nước

1 MN_ID int Checked Chỉ số dữ liệu
2 TV _ID int Checked Mã trạm thủy văn
3 MN _TIME datetime Checked Thời gian đo
4 MN _GT real Checked Giá trị mực nước
13. Bảng dữ liệu lưu lượng

1 LL_ID int Checked Chỉ số dữ liệu
2 TV_ID int Checked Mã trạm thủy văn
3 LL _TIME datetime Checked Thời gian đo
4 LL _GT real Checked Giá trị lưu lượng

1.3. Thu thập thông tin

Thu thập thông tin là hoạt động nhằm mục đích đảm bảo cho đơn vị thông tin
có được đầy đủ nhất những thông tin tư liệu thuộc diện bao quát của đơn vị, lựa chọn
những tài liệu, những nguồn thông tin phù hợp với chuyên ngành nhiệm vụ của cơ
quan thông tin, đồng thời phải phù hợp với yêu cầu của người dùng tin.
Công tác thu thập thông tin đòi hỏi cán bộ tiến hành công tác thu thập phải có
trình độ, có phương pháp làm việc khoa học, am hiểu người dùng tin, nắm vững nhu
cầu của người dùng tin, đồng thời phải hiểu rõ chức năng, nhiệm vụ, đặc điểm, đặc
thù của công việc chuyên ngành mình.
Công tác thu thập thông tin cũng đòi hỏi công tác tổ chức thu thập phải được
tiến hành một cách khoa học, tuân thủ theo những nguyên tắc nhất định và kế hoạch
bổ sung, nguyên tắc bổ sung. Từ việc xác định các loại hình tài liệu và tỷ lệ các loại
hình tài liệu, xác định nội dung và chủ đề của tài liệu, đảm bảo yêu cầu bao quát diện
đề tài, phù hợp với mục đích của đơn vị và yêu cầu của người dùng tin, xác định sự
thích ứng của tài liệu với lợi ích của người dùng tin cho đến việc xác định ngôn ngữ
của tài liệu thu thập và niên hạn cũng như độ hồi cố của tài liệu.
Đầu vào của hệ thống là nguồn thông tin mà hệ thống sẽ xử lý, lưu trữ, quản trị
và luân chuyển trong quá trình thông tin. Nguồn dữ liệu của đề tài hiện tồn tại ở nhiều
không gian, địa điểm khác nhau với nhiều trạng thái và phương thức khác nhau. Để
thu thập tất cả các nguồn thông tin về hệ thống cần vận dụng nhiều hình thức khác
nhau phù hợp với đặc điểm, điều kiện của từng nguồn dữ liệu. Đôi khi đối với một
nguồn dữ liệu cũng phải vận dụng nhiều hình thức thu thập để bảo đảm thông tin thu
thập về đầy đủ bảo đảm chất lượng của thông tin phục vụ cho công tác xử lý, lưu trữ
và nhập dữ liệu cho hệ thống. Đầu mối này phải có tính chủ động trong công tác cũng
như khả năng tài chính và hành lang pháp lý đảm bảo có thể vận dụng, tiến hành
những biện pháp, hình thức khác nhau để đạt được mục đích tập hợp đầy đủ thông tin
cần thiết phục vụ cho nhiệm vụ xây dựng và vận hành hệ quản trị CSDL.
Ta có thể tiếp cận với nguồn dữ liệu trên bằng hai phương pháp:
- Trực tiếp: thông qua các đơn vị chính danh trong và ngoài nước như cục Bản
đồ Quốc gia,….
- Gián tiếp: thông qua trao đổi, đo đạc, sử dụng lại dữ liệu từ các nguồn đã có
như các đề tài, dự án đã thực hiện, ...
Việc thu thập thông tin thường được tiến hành theo nguyên tắc từ trực tiếp đến
gián tiếp.

1.4. Xử lý nội dung

Dữ liệu đầu tiên được xử lý nội dung xác định các yếu tố:
- Thông tin thư mục: phân loại dữ liệu vào các nhóm riêng.
- Các đặc thù mô tả vật lý: số lượng trang, khổ cỡ, kích thước file, tài liệu kèm
theo, đặc điểm dữ liệu, thành phần dữ liệu
- Thông tin về quản lý: đánh chỉ số dữ liệu, gán các đặc tính, đồng bộ với hệ
thống quốc gia và quốc tế
- Thông tin về nội dung: Các tọa độ, số liệu đo, số liệu tính toán, các đặc trưng
riêng
- Trách nhiệm về nội dung xử lý: người xử lý, người biên tập, địa chỉ chứa file
dữ liệu
Những yếu tố trên là những yếu tố chủ yếu, quan trọng nhất của một đơn vị dữ
liệu sẽ được xử lý để đưa vào hệ thống, bên cạnh đó đôi khi còn có một số những
yếu tố thông tin đặc thù của riêng từng loại tài liệu, thậm chí của từng dữ liệu cá
biệt, chúng sẽ được tổ chức sắp xếp trên phiếu xử lý tiền máy. Cán bộ nghiệp vụ
thông qua quá trình xử lý tài liệu sẽ điền những thông tin này vào phiếu xử lý tiền
máy.
Phiếu xử lý tiền máy sẽ được một cán bộ có trách nhiệm, có nghiệp vụ tiến hành
kiểm tra, biên tập lại những nội dung đã được xử lý. Sau bước này phiếu xử lý tiền
máy sẽ trở thành phiếu nhập tin sẵn sàng cho công việc nhập dữ liệu vào CSDL của
hệ thống.
1.5. Xây dựng mô đun phần mềm nhập giữa liệu
Phần mềm TichBuiData được viết trên nền Net FrameWork 2.0 sử dụng bộ
công cụ lập trình Visual Studio 2015 với hệ quản trị cơ sở dữ liệu MS SQL 2016 bao
gồm một form chính và 4 form phụ.
TichBuiData đã tuân thủ được các yêu cầu chung về một phần mềm:
- Có giao diện thân thiện.
 Hệ thống dễ dàng khai thác, giao diện thuận tiện cho người sử dụng.
 Tuân thủ bộ mã tiếng Việt TCVN 6909:2001.
 Thông tin kết xuất chính xác, rõ ràng, đầy đủ.
 Tạo ấn tượng cho người xem.
 Mọi nút trong hệ thống đơn giản, có sắc thái riêng thể hiện nét đẹp trang
nhã và ấn tượng, tạo cảm giác thoải mái và dễ chịu cho người xem.

 Bố cục trình bày dễ xem và dễ sử dụng, dễ tìm kiếm, đem lại nhiều thông
tin cho người đọc.
- Hệ thống dễ sử dụng.
 Các chức năng của hệ thống được bố trí thân thiện, phù hợp với người
dùng cuối.
 Các icon hiệu ứng 3D thể hiện được nội dung cụ thể của các module khi
bấm nút.
- Quản trị hệ thống.
Cho phép bộ phận quản trị hệ thống quản lý cập nhật và duyệt các nội dung của
hệ thống.
1.6. Nhập dữ liệu vào hệ thống
Sau khi hoàn tất công đoạn xử lý nội dung, tiến hành công đoạn nhập dữ liệu
vào hệ thống.
Thông tin của dữ liệu sẽ được nhập vào các trường tương ứng của biểu ghi thể
hiện tài liệu trong cơ sở dữ liệu. Việc nhập dữ liệu phải bảo đảm chính xác với nội
dung thông tin trên phiếu nhập tin đã được xử lý, kiểm tra, biên tập. Nội dung thông
tin nhập vào phải đúng các trường đã được xác định.
Việc nhập tin phải đảm bảo sau khi hoàn thành, hệ thống sẽ hiển thị đầy đủ,
chính xác thông tin về tài liệu khi được yêu cầu, việc tìm tin trong CSDL dựa trên
những điểm tiếp cận thông tin đã được lựa chọn và xử lý phải thuận lợi, nhanh chóng
và chính xác.
Hoàn tất công đoạn này, việc quản lý thông tin thư mục của tài liệu đã được
thực hiện xong. Khi đó, sử dụng hệ thống sẽ có thể tìm được dữ liệu theo những từ
khoá chuyên ngành có kiểm soát và không có kiểm soát hay những yêu tố thông tin
của dữ liệu đã được xử lý.
Xác định các đối tượng quản trị của hệ thống dữ liệu cũng như sơ bộ phương án
xử lý chúng trong hệ thống là bước đầu tiên để hình thành nên sơ đồ của hệ thống
cũng như phương thức hoạt động của hệ thống quản trị cơ sở dữ liệu . Trên cơ sở đó
để đưa ra các yêu cầu, các bài toán, các tính năng của hệ thống để yêu cầu đơn vị thiết
kế, lập trình giải quyết đảm báo đáp ứng được yêu cầu của phần mềm tính toán cũng
như yêu cầu của truy xuất, thống kê của người dùng.

Thêm dữ liệu
Đối với các nút thêm dữ liệu, người dùng điền các thông tin vào các ô tương
ứng và ấn nút “Thêm” để ghi mới vào CSDL. Nếu cần làm lại hoặc đang ở chế độ
sửa, ấn nút “Đọc lại”, chương trình sẽ chuyển sang chế độ thêm dữ liệu để người
dùng thực hiện các thao tác thêm.
Sửa dữ liệu
Khi nhấn đúp vào danh sách dữ liệu, chương trình sẽ tự động điền dữ liệu của
hàng tương ứng vào các ô để sửa. Người dùng chỉnh sửa nội dung các ô và ấn nút
“Sửa” để chương trình cập nhật thông tin cần sửa. Nếu muốn thoát ra khỏi chế độ
sửa, ấn nút “Đọc lại”.
Xóa dữ liệu
Trong chế độ sửa (sau khi ấn đúp vào danh sách số liệu), nếu thấy dữ liệu không
cần thiết, người dùng ấn nút “Xóa” để loại dữ liệu tương ứng đã chọn ra khỏi danh
sách của cơ sở dữ liệu.
Trích xuất dữ liệu
Mỗi bảng biểu, đồ thị đều được đính kèm các nút trích xuất dữ liệu tương ứng
ra file text (Ghi file - đối với các dữ liệu dạng chuỗi số) hay file ảnh (Ghi-đối với cá
kết quả dạng đồ thị). Bên cạnh đó, chương trình có thể trích xuất theo kịch bản cho
trước nhằm tạo các số liệu đầu ra cho các chương chình khác nhằm kết nối nhanh
chóng thành một bộ các công cụ toàn diện.
1.7. Các kết quả nhập liệu
- 3 sông
- 506 mặt cắt
- 47 khu phân chậm lũ
- 26 công trình
- 2 trạm thủy văn
- 8 trạm khí tượng
- Số liệu mực nước mùa lũ theo ốp 6h các trạm Ba Thá và Phủ lý trong 5 năm
(từ năm 2014 đến năm 2018)
- Số liệu mưa mùa lũ theo ốp 6h các trạm Ba Thá, Hòa Bình, Ba Vì, Hoài Đức,
Sơn Tây khí tượng, Sơn Tây thủy văn, Trung Hà, Việt Trì trong 5 năm (từ năm
2014 đến năm 2018)

2. Xây dựng giao diện người dùng trên nền GIS

2.1. Thiết kế giao diện đồ họa trực quan
Sản phẩm của đề tài là một công cụ phần mềm đã tích hợp các chương trình
toán, cơ sở dữ liệu và cả phần trình diễn kết quả trong một chương trình duy nhất tạo
thuận lợi cho người sử dụng. Sản phẩm có giao diện đồ họa trực quan và dễ sử dụng
kể cả với người không có nhiều kiến thức về khí tượng thủy văn. Hình 7.1 dưới đây
là giao diện chính của công cụ.
Hình 7.1: Bản đồ GIS lưu vực sông Tích Bùi

Chương trình sau khi đăng nhập sẽ hiển hệ thống bản đồ GIS dạng sharp file
(.shp) của lưu vực sông Tích Bùi với đa lớp dữ liệu: sông, mặt cắt, ô chứa – ruộng,
các trạm khí tượng thủy văn,… Khi bấm vào các đối tượng thuộc các lớp này, nếu có
thông tin về đối tượng sẽ được hiển thị dữ liệu qua hộp thông báo. Người dùng có thể
dùng chuột kéo thả để di chuyển vị trí bản đồ cũng như cuộn chuột để phóng to hoặc
thu nhỏ.
Nếu máy tính có kết nối internet, hệ thống bản đồ GEOMAP sẽ hiển thị bản đồ
trực tuyến của lưu vực Tích Bùi (Hình 7.2) để cho người dùng có thể nhìn toàn cảnh
về hệ thống vùng có dữ liệu được quản lý bởi chương trình. Việc tích hợp bản đồ
GEOMAP vào sẽ hỗ trợ người dùng khai đác tối đa các tài nguyên sẵn có của bản đồ
trực tuyến.

Hình 7.2: Bản đồ Google Map lưu vực sông Tích Bùi
2.2. Sử dụng liên kết bản đồ GIS

Để hỗ trợ người dùng trong việc đánh giá các kết quả tính được từ mô hình, nhất
là đối với bài toán tính vùng ảnh hưởng, số liệu cần được hiển thị trên bản đồ GIS.
Khi đó, người dùng dễ dàng đánh giá, đưa ra các quyết định điều chỉnh kịp thời. Tuy
nhiên các phần mềm thương mại thường chỉ cho phép hiển thị các bản đồ này qua
việc đọc dữ liệu của mô hình sau khi tính toán xong và phải nhập thủ công các kết
quả được trích xuất từ mô hình tính. Do đó, nhu cầu xây dựng module hiển thị kết
quả trên bản đồ GIS theo thời gian thực (tính đến đâu hiển thị kết quả đến đó) là cần
thiết. Để làm được điều này, module cần phải tích hợp được vào phần mềm, tương
ứng với nền tảng mà phần mềm chính đang hoạt động. Module này cần có các tính
năng cơ bản giúp tăng tính tương tác giữa bản đồ và người dùng, cho phép tạo ra các
công cụ cho ứng dụng như phóng to, thu nhỏ, đo đạc, đổ màu...
Nhóm nghiên cứu lựa chọn MapWindow là một hệ mã nguồn mở cho GIS trên
nền hệ điều hành Windows cho phép xử lý, phân tích và hiển thị dữ liệu và các thuộc
tính của dữ liệu ở một số chuẩn định dạng của GIS, trong nghiên cứu của luận án thì
shapefile - một cấu trúc dữ liệu GIS được đưa ra bởi ESRI (hãng xây dựng bộ phần
mềm ArcGis nổi tiếng), một chuẩn dữ liệu định dạng vector quen thuộc, được sử
dụng. MapWindow là công cụ vẽ bản đồ, là hệ thống mô hình và là một ứng dụng
GIS cung cấp các giao diện lập trình (API). MapWindow bao gồm nhiều phần, trong
đó đa số dành cho việc xây dựng các ứng dụng GIS (lập trình).

Điểm lưu ý là MapWindow sử dụng giấy phép mã nguồn mở MPL 1.1, có thể
sử dụng trong các ứng dụng thương mại và phi thương mại, nghĩa là ngoài việc không
mất phí sử dụng mà còn có thể tích hợp vào bộ đóng gói phần mềm để chuyển giao
cho các đơn vị sử dụng.
Có nhiều phương án để xây dựng ứng dụng dựa trên MapWindow, từ cách đơn
giản nhất là cài đặt và sử dụng (nghĩa là không cần phải lập trình), hay sử dụng các
Plug-in có sẵn, cho đến sử dụng mã để lập trình (nghĩa là sử dụng MapWindow ở
mức thấp nhất).
Do không chỉ đơn thuần là đọc và hiển thị dữ liệu bản đồ hay cung cấp các thao
tác cơ bản để xem bản đồ nên luận án đã tiếp cận theo cách xây dựng ứng dụng từ
đầu và sử dụng ActiveX MapWinGIS (lõi của mã nguồn mở MapWindow) để thao
tác với dữ liệu GIS. Với cách tiếp cận này chúng ta hoàn toàn có thể tùy biến giao
diện cũng như truy vấn, ví dụ có thể tắt hoặc tùy biến bảng chú giải (legend), vùng
quản lý lớp, bản đồ nhỏ, hay tắt các plug-in hỗ trợ,...
MapWinGIS cung cấp các lớp và Enumeration để thao tác với các dữ liệu bản
đồ (như thao tác với shapefile, điều khiển việc hiển thị nhãn trên bản đồ, làm việc với
lưới bản đồ,...). Trong đó, hai lớp quan trọng là lớp Shapefile (chứa các hàm để thao
tác trên một lớp bản đồ, cả dữ liệu không gian lẫn dữ liệu phi không gian) và lớp Map
(thành phần chính trong ứng dụng MapWindow GIS, biểu diễn lưới, ảnh và các
shapefile).
Khi các module tính toán thủy lực và môi trường có kết quả sau mỗi bước xuất
kết quả, chúng lập tức được cập nhật để hiển thị trên module có sử dụng MapWinGIS
để hiển thị kết quả tương ứng với số liệu đó.
3. Song song hóa các mô đun tính toán
3.1. Kỹ thuật tính toán song song
Tính toán song song hiệu suất cao được thực hiện bằng cách tách các nhiệm vụ
lớn và phức tạp ra nhiều phần để chạy trên nhiều đơn vị xử lý. Mặc dù có nhiều
phương pháp có thể sử dụng để cải thiện hiệu suất hệ thống các máy tính, nhưng
phương pháp thông dụng nhất để tổ chức và điều phối quá trình xử lý song song là
viết code tự động phân tích bài toán sắp đến và cho phép các đơn vị xử lý liên lạc với
nhau khi cần thiết trong khi thực hiện công việc.
Không phải tất cả các bài toán đều có thể tính toán song song. Nếu không có
công việc con nào có thể thực hiện đồng thời hoặc nếu hệ đang được mô tả phụ thuộc
lẫn nhau mạnh (bài toán "fine-grained"), mọi nỗ lực song song hoá nó có thể dẫn tới
tăng thời gian tính toán. May mắn là rất nhiều các bài toán khoa học phức tạp có thể
phân tích thành các nhiệm vụ riêng biệt để thực hiện độc lập và đồng thời bởi nhiều
đơn vị xử lý. Thông thường nhất là việc tách các toạ độ không gian (hoặc thời gian)

của hệ được mô hình thành các vùng không gian con (hay khoảng thời gian con) và
có thể tính toán đồng thời. Những ứng dụng loại này, được gọi là "coarse grained",
khá dễ dàng song song hoá và chúng ta có thể có được lợi ích lớn nhất từ xử lý song
song.
Việc song song hóa một bài toán phụ thuộc vào điều kiện về phần cứng và phần
mềm để từ đó lựa chọn phương pháp tối ưu cho bài toán đó. Các phương pháp song
song thường dựa trên kiến trúc bộ nhớ cơ bản - bộ nhớ chia sẻ, bộ nhớ phân tán, hay
hỗn hợp. Các ngôn ngữ lập trình chia sẻ bộ nhớ giao tiếp bằng cách điều khiển các
biến chia sẻ bộ nhớ (OpenMP là API phổ biến nhất sử dụng bộ nhớ chia sẻ), bộ nhớ
phân tán sử dụng phương pháp truyền tin trong đó (giao diện truyền tin MPI là API
sử dụng hệ thống truyền tin nổi bật nhất). Trong 10 năm trở lại đây, các hệ thống sử
dụng card đồ họa (GPU) tính toán được phát triển mạnh mẽ nhờ ưu điểm của chúng
so với CPU (số lõi tính toán lớn – hàng ngàn đơn vị xử lý trên 1 card), mỗi card đồ
họa có 1 bộ nhớ riêng, các bộ nhớ này được giao tiếp với bộ nhớ của CPU qua các
thư viện riêng (ví dụ như CUDA của dòng card đồ họa Nvidia).
a. OpenMP
OpenMP được coi như một giao diện lập trình ứng dụng API
(ApplicationProgram Interface) chuẩn dành cho lập trình với bộ nhớ chia sẻ. Hệ thống
bộ nhớ chia sẻ bao gồm nhiều bộ xử lý CPU, mỗi bộ xử lý truy cập tới bộ nhớ chung
thông qua các siêu kết nối hoặc các đường bus. Việc sử dụng không gian địa chỉ đơn
làm cho mỗi bộ xử lý đều có một cái nhìn giống nhau về bộ nhớ được sử dụng. Truyền
thông trong hệ thống bộ nhớ chia sẻ thông qua cách đọc và ghi dữ liệu giữa các bộ
xử lý với nhau lên bộ nhớ. Với cách này, thời gian truy cập tới các phần dữ liệu là
như nhau, vì tất cả các quá trình truyền thông đều thông qua đường bus.
Ưu điểm của kiến trúc này là dễ dàng lập trình, bởi vì không yêu cầu sự truyền
thông giữa các bộ xử lý với nhau, chúng chỉ đơn giản là truy cập tới bộ nhớ chung.
Có thể xem mô hình lập trình OpenMP như là một mô hình Fork-Join, Hình 7.3.

Hình 7.3: Mô hình Fork-Join

Trong mô hình Fork-Join, tất cả các chương trình OpenMP đều bắt đầu bởi một
tiến trình đơn. Đó là master thread (luồng chính), luồng chính này được thực hiện
tuần tự cho đến khi gặp chỉ thị khai báo vùng cần song song hóa.
Fork: sau khi gặp chỉ thị khai báo song song, master thread sẽ tạo ra một nhóm
các luồng song song. Khi đó, các câu lệnh trong vùng được khai báo song song sẽ
được thực hiện song song hóa trên nhóm các luồng vừa được tạo.
Join: khi các luồng đã thực hiện xong nhiệm vụ của mình, chúng sẽ tiến hành
quá trình đồng bộ hóa, ngắt luồng, và chỉ để lại 1 luồng duy nhất là master thread.
b. MPI
MPI là một chuẩn chính thức về truyền thông giữa các bộ nhớ phân tán tạo ra
bởi một uỷ ban, gọi là Message Passing Interface Forum (MPIF), phát hành năm
1994. Chuẩn này mô tả các đặc điểm và cú pháp của thư viện lập trình song song cần
phải có. Có rất nhiều các thư viện dựa trên chuẩn MPI đã được các nhà phát triển
phần mềm viết trên nhiều hệ máy tính khác nhau. Nổi bật nhất trong số chúng là
MPICH và LAM/MPI. Hiện nay MPI đã nâng cấp lên chuẩn MPI phiên bản 3.0 năm
2012 nhanh hơn và có tính khả chuyển cao hơn và được sử dụng hầu hết ở các hệ
thống siêu máy tính trên thế giới.
c. GPU
Kỹ thuật tính toán dùng đơn vị xử lý đồ họa đa dụng - General-Purpose
computing of Graphics Processing Units (GPGPU, hay còn gọi tắt là GP²U) là kỹ
thuật sử dụng đơn vị xử lý đồ họa GPU (vốn được thiết kế để tính toán đồ họa máy
tính) để thực hiện những tác vụ trước đây được xử lý bởi CPU. Thông thường các
chức năng của GPU được giới hạn trong việc xử lý đồ họa máy tính. Trong rất nhiều
năm, GPU chỉ được sử dụng để tăng tốc một vài phần trong đồ họa đường ống

(graphics pipeline). Từ đòi hỏi của thị trường cho đồ họa 3D thời gian thực và đồ họa
với độ phân giải cao, các GPU đã phát triển với kiến trúc song song hóa mức cao, xử
lý đa luồng với kiến trúc manycore processor đã đem lại khả năng tính toán cùng với
băng thông bộ nhớ rất cao, thậm chí còn vượt qua những CPU thông thường.
Hình 7.4: So sánh kiến trúc CPU và GPU.
Hình 7.5: Tiến trình thực hiện của 1 chương trình CUDA

Lý do dẫn đến việc GPU có khả năng tính toán các phép tính dấu phẩy động cao
hơn CPU là vì GPU được thiết kế cho các tác vụ đòi hỏi sự song song hóa ở mức cao,
đó cũng chính là đòi hỏi của việc rendering đồ họa. Chính vì thế nên trong thiết kế,
GPU sử dụng phần lớn transitors cho việc xử lý dữ liệu hơn là việc điều khiển luồng
và đưa dữ liệu vào bộ nhớ đệm (data caching).
GPU có các đặc tính sau:
 Nhấn mạnh xử lý song song (Emphasize parallelism): GPU là về cơ bản máy
song song và việc sử dụng hiệu quả nó phụ thuộc vào mức độ xử lý song song
trong khối lượng công việc. Ví dụ, NVIDIA CUDA chạy hàng ngàn luồng chạy
tại một thời điểm, tối đa hóa cơ hội che giấu độ trễ bộ nhớ bằng cách sử dụng
đa luồng. Nhấn mạnh xử lý song song đòi hỏi lựa chọn các thuật toán mà chia
miền tính toán thành càng nhiều mảnh độc lập càng tốt. Để tối đa hóa số lượng
luồng chạy đồng thời, GPU lập trình cũng nên tìm cách giảm thiểu việc sử dụng
thread chia sẻ tài nguyên (như dùng các thanh ghi cục bộ và bộ nhớ dùng chung
CUDA), và nên sự đồng bộ giữa các luồng là ít đi.
 Giảm thiểu sự phân kỳ SIMD (Minimize SIMD divergence): GPU cung cấp một
mô hình lập trình SPMD: nhiều luồng chạy cùng một chương trình tương tự,
nhưng truy cập dữ liệu khác nhau và do đó có thể có sự khác nhau trong thực
thi của chúng. Tuy nhiên, trong một số trường hợp đặc biệt, GPU thực thi chế
độ SIMD cho các lô các luồng. Nếu luồng trong một lô trệch ra, toàn bộ lô sẽ
thực thi cùng các đường code cho đến khi các luồng hội tụ lại. Tính toán hiệu
năng cao GPU đòi hỏi cơ cấu code sao cho giảm thiểu sự phân kỳ trong lô.
 Tăng tối đa cường độ số học (Maximize arithmetic intensity): Trong khung cảnh
tính toán ngày nay, các tính toán thực tế là tương đối tốt nhưng băng thông bị
hạn chế. Điều này thật sự rất đúng với GPU nơi hỗ trợ rất tốt tính toán dấu phảy
động. Để tận dụng tối đa sức mạnh đó cần cấu trúc thuật toán để tối đa hóa
cường độ số học, hoặc số lượng các tính toán trên số thực hiện trong mỗi thao
tác với bộ nhớ. Truy cập dữ liệu mạch lạc bằng các luồng trợ giúp riêng biệt bởi
vì các thao tác này có thể kết hợp để làm giảm tổng số thao tác bộ nhớ. Sử dụng
bộ nhớ dùng chung CUDA trên GPU NVIDIA cũng giúp giảm overfetch (do
các luồng có thể giao tiếp) và cho phép các chiến lược "blocking" việc tính toán
trên bộ nhớ của chip.
 Khai thác băng thông dòng (Exploit streaming bandwidth): Mặc dù có tầm quan
trọng của cường độ số học, nó là cần lưu ý rằng GPU có băng thông rất ít (very

high peak) trên bộ nhớ đi kèm, cỡ 1/10 băng thông bộ nhớ thông dụng trên nền
máy PC. Đây là lý do tại sao GPU có thể thực thi tốt hơn CPU ở các tác vụ như
sắp xếp, trong đó có tỷ lệ tính toán/băng thông thấp. Để đạt được hiệu năng cao
trên các ứng dụng như thế đòi hỏi các mẫu truy cập bộ nhớ dòng (streaming)
trong đó các luồng đọc và ghi vào các khối lớn liền mạch (tối đa hóa băng thông
cho mỗi giao dịch) nằm trong các khu vực riêng biệt của bộ nhớ (tránh các rủi
ro dữ liệu).
d. Mô hình kết hợp

Tận dụng ưu điểm của các mô hình trên, phần lớn các siêu máy tính hiện nay
được xây dựng là sự kết hợp của các công nghệ trên. Hệ thống này bao gồm nhiều
máy chủ, trên mỗi máy chủ bao gồm nhiều CPU và GPU cùng thực hiện chức năng
tính toán. Chúng được liên kết với nhau qua các card mạng Ethernet có tốc độ Gbps
hoặc các card chuyên dụng có tốc độ lên đến 100Gbps trực tiếp giữa các bộ nhớ của
GPU.
Hình 7.6: Mô hình siêu máy tính có card mạng kết nối chuyên dụng GPUDirect
RDMA
Bên cạnh đó, các hãng sản xuất hiện nay cũng đang tập trung nghiên cứu sản
xuất các bộ vi xử lý có cấu trúc tối ưu phục vụ tính toán trí tuệ nhân tạo như các dòng
FPGA (Field-Programmable Gate Arrays).
3.2. Một số kết quả ứng dụng song song hóa

Để tạo điều kiện thuận lợi cho phát triển mã nguồn cũng như sử dụng, chúng tôi
thực hiện 2 giải pháp song song cho phần mềm của mình là kỹ thuật OpenMP và kỹ
thuật dùng card đồ họa GPU của Nvidia trên nền CUDA. Sự tiện lợi của hai giải pháp
này là người lập trình không cần phải có kiến thức về cài đặt, cấu hình chính xác

mạng máy tính mà chỉ đóng gói kèm thư viện động hoặc cần cài các driver mặc định
của nhà sản xuất phần cứng là sử dụng được. Khi được chuyển giao, người sử dụng
cũng dễ dàng chạy trên các máy tính cá nhân nhanh chóng mà không cần kiến thức
chuyên sâu về song song.
+ OpenMP: Ứng dụng được cho mọi máy tính phổ thông CPU đa lõi hiện có trên thị
trường. Trong thử nghiệm này, chúng tôi sử dụng CPU Intel i7 3770 4 lõi 8 thread
với tốc độ 3.9 Ghz, năng lực tính toán dấu phẩy động theo công bố của nhà sản xuất
là 125 GFLOP.
Khai báo thư viện sử dụng:
#ifdef _OPENMP
include 'omp_lib.h'
#endif
#ifdef _OPENMP
Đối với cả hai giải thuật, trong vòng lặp điều kiện dừng (RMS nhỏ hơn sai số
cho trước hoặc số bước lặp lớn hơn số cho trước), thao tác huấn luyện mạng được
chạy cho nhiều mẫu học. Mỗi mẫu học này được chương trình phân bổ trên các lõi
CPU. Do đó, sau dòng lệnh vòng lặp điều kiện dừng và trước dòng lệnh vòng lặp
huấn luyện theo các mẫu, bẫy song song được đặt để chia nhỏ công việc cho các CPU,
có kèm ghi chú các biến dùng chung cũng như các biến riêng cho từng lõi.
!$omp parallel SHARED(danh sách biến chung...) private(danh sách biến riêng...)
!$omp do
Kết thúc vòng lặp huấn luyện, đặt bẫy chặn để chờ các lõi hoàn tất phần tính
của mình, các giá trị tính được này được tập trung cập nhật vào bộ nhớ chung và hoàn
tất phần tính song song.
!$omp end do
!$omp barrier
!$omp end parallel
+ GPU: Trong khuôn khổ đề tài này, chúng tôi có sử dụng kinh phí tự có để mua thiết
bị tính toán là 01 card NVIDIA GeForce GTX 1060 6GB với thông số được trình bày
như Bảng 7.1.
Bảng 7.1: Thông số card NVIDIA GeForce GTX 1060 6GB

Thông số Chi tiết
Tên mã thiết bị GP106 (8/2016)
Transistors 4.4 tỉ
Số lõi tính 1280

Xung nhịp tính 1708 Mhz
Bộ nhớ 6144 MB / GDDR5 / 192 bit / 192.2 GB/s
Băng thông giao tiếp PCIe 3.0 x16 / 16Gbps
Năng lực tính toán dấu phẩy động 4.375 TFLOPS
Sơ đồ khối khi song song trên GPU được thể hiện như hình 7.7 dưới đây.
Bắt đầu
Truyền dữ liệu từ
Host đến Device
Device thực hiện tính

toán trên các dữ liệu
Truyền dữ liệu sau khi

tính từ Device đến Host
Kết thúc
Hình 7.7: Sơ đồ khối cách thực hiện song song trên GPU
Trong đó:
- Host: là những tác vụ và cấu trúc phần cứng, phần mềm được xử lý từ CPU.
- Driver: là những tác vụ và cấu trúc phần cứng, phần mềm được xử lý từ
GPU.
Quá trình được diễn giải như sau:
 Dữ liệu cần được tính toán luôn ở trên bộ nhớ của Host vì vậy bước 1 là
truyền dữ liệu cần tính toán từ bộ nhớ Host qua bộ nhớ Device.
 Sau đó Device sẽ gọi các hàm riêng của mình để tính toán dữ liệu đó.
 Sau khi tính toán xong, dữ liệu cần được trả về lại cho bộ nhớ của Host.
Trong khuôn khổ nghiên cứu cứ này chúng tôi lấy kiểm tra khả năng tính toán của
mô hình thủy văn trong các trường hợp song song hóa và không song song hóa để
thấy rõ hiệu quả của việc song song hóa.

Chúng tôi lựa chọn tính toán mô phỏng lại trận lũ của các năm 2014, 2015, 2016
và 2017 bằng chường trình không song song, chương trình song song OpenMP và
GPU. Mỗi bài toán được chúng tôi chạy 100 lần để tính thời gian trung bình của mỗi
phương pháp, kết quả được thể hiện ở bảng 7.3 dưới đây.
Bảng 7.2: Thời gian tính trung bình của các bài toán thử nghiệm
Phương án tính Tính đơn nhân Tính đa nhân CPU Tính đa nhân Tỉ lệ thời gian
CPU (OpenMP) GPU
Bài toán 1 52s 19s 90s 1:0.36:1.73
Bài toán 2 1h:22m:53s 0h:20m:24s (1224s) 0h:04m:34s (274s) 1:0.25:0.055 ~

(4973s) (1:4:18)
Hình 7.8: Biểu đồ hiệu năng card đồ họa khi xử lý song song trên GPU

Qua các kết quả trong Bảng 7.2 ở trên có thể thấy: Khi số lượng phần tử là nhỏ,
việc song song trên GPU lại không mang lại hiệu quả, thậm chí còn gây ra sự chậm
trễ tổng thể tính toán do phải truyền dữ liệu nhiều; tính đa lõi CPU bằng OpenMP đạt
hiệu quả tốt nhưng cũng chưa đạt hết mức độ thiết kế. Khi số lượng phần tử cần tính
tăng, việc tính toán song song cho bài toán sử dụng thuật toán hiện càng hiệu quả do
tính song song của các bài toán này lớn. Tính song song thể hiện ở chỗ: trong mỗi
bước, các phép tính của các phần tử khác nhau là độc lập. Do đó, khi áp dụng tính
song song cho bài toán giải hiện đem lại hiệu quả cao. Đối với các bài toán dự báo
khác trong thực tế, thời gian tính lên đến đơn vị hàng tháng, hoặc các tác vụ yêu cầu
xử lý thời gian thực, việc song song hóa tính toán là một yêu cầu bắt buộc.
Ngoài ra, chúng tôi đánh giá kết quả qua việc phân tích biểu đồ đo hiệu năng
card đồ họa của Windows bằng phần mềm thông dụng Task Manager (phiên bản
Windows 10 Fall Creator phát hành vào 17/10/2017) như Hình 7.8.
Một vài nhận xét:
 Thuật toán song song áp dụng cho tập dữ liệu trong bài toán này chưa tận dụng
hết 1280 lõi của card đồ họa nên chưa đạt hiệu quả cao nhất.
 Với bài toán có khối lượng truyền dữ liệu lớn, nên xảy ra hiện tượng ngắt quãng
thời gian xử lý trên card đồ họa mặc dù bài toán có khối lượng tính toán lớn
nhưng thời gian ngắt quãng đợi truyền dữ liệu đã làm chậm tiến độ và giảm hiệu
xuất của song song.
4. Tích hợp các mô đun/phần mềm và đóng gói sản phẩm

4.1. Tích hợp các mô đun/phần mềm trên một công cụ thống nhất
Các phần mềm tính toán và quản lý dữ liệu đã được tích hợp trong một sản phẩm
duy nhất. Trên Hình 7.9 thể hiện rõ điều này
Hình 7.9: Các công cụ tính toán, quản lý dữ liệu được tích hợp trên giao diện chính

Hình 7.10 cho thấy giao diện quản lý chung các mô đun tính toán. Còn mô đun
quản lý cơ sở dữ liệu.
Hình 7.10: Quản lý các mô đun tính toán
Hình 7.11: Mô đun quản lý CSDL được tích hợp trên phần mềm chung

4.2. Đóng gói và tạo bộ cài đặt

Sản phẩm của đề tài được đóng gói thành một bộ cài đặt rất tiện lợi cho việc
sử dụng trên các máy tính khác nhau. Các tệp của bộ cài đặt được thể hiện trên Hình
7.12 dưới đây:
Hình 7.12: Bộ cài đặt

Người dùng sử dụng hệ điều hành Windows (Windows XP, Windows Server
2003, Windows Vista, Windows 7, Windows 8, Windows 10 với các máy có cấu hình
trung bình để có thể cài đặt và sử dụng phần mềm với yêu cầu đi kèm bộ thư viện
Microsoft .NET Framework 4.
Cài đặt bao gồm các bước sau:
Bước 1: Nếu hệ điều hành chưa cài đặt Microsoft .NET Framework 4 thì có thể
tải tại địa chỉ: https://www.microsoft.com/en-us/download/details.aspx?id=17718
hoặc từ file dotnetfx4.0.exe kèm theo bộ cài đặt chương trình.
Bước 2: Bấm vào TichBuiDataSetup.exe để cài đặt chương trình.

Hình 7.13:Bắt đầu cài đặt chương trình TichBui.

Ấn Next để tiếp tục.
Hình 7.14:Lựa chọn thư mục cài đặt.

Lựa chọn thư mục để cài đặt chương trình với lưu ý ổ đĩa cài đặt cần còn trống
khoảng 200MB. Ấn Next để tiếp tục.

Hình 7.15:Chương trình đang được cài vào máy tính.
Hình 7.16:Hoàn tất việc cài đặt chương trình vào máy tính.
Ấn Finish để kết thúc cài đặt và bắt đầu sử dụng chương trình.
Để gỡ cài đặt phần mềm ra khỏi hệ thống, vào thư mục cài đặt chương trình,
chọn file uninstall.exe để thực hiện

Hình 7.17:Gỡ cài đặt chương trình ra khỏi máy tính.

Ấn Next để bắt đầu gỡ chương trình.
Hình 7.18:Hoàn tất việc gỡ cài đặt chương trình ra khỏi máy tính.
Ấn Finish để hoàn tất việc gỡ bỏ chương trình.

Để chạy trường trình lựa chọn biểu tượng trên màn hình desktop:
Khi chương trình được chạy, đòi hỏi người dùng phải đăng nhập với tên và
mật khẩu được cấp để có thể có quyền truy cập chương trình với mức độ ưu tiên ứng
với tên đăng nhập.
Hình 7.19:Đăng nhập vào chương trình với tài khoản

Nếu người dùng điền sai tên và mật khẩu 5 lần liên tiếp, chương trình sẽ tự động
thoát.
Sau khi vào chương trình, trên cùng là thanh điều hướng bao gồm các “Hướng
dẫn sử dụng” cũng như thông tin của chương trình như hình 1.8.
Hình 7.20:Thanh menu điều hướng của chương trình.

Chương 8
Một số kết quả ứng dụng
1. Hiệu chỉnh mô hình bằng số liệu lịch sử

Để chuẩn hóa bộ tham số của mô hình liên kết khi sử dụng để tính toán cho lưu
vực sông Tich-Bùi nhóm nghiên cứu sử dụng các số liệu thực đo lịch sử của lưu vực
sông này để hiệu chỉnh các thông số của mô hình sao cho với số liệu mưa thực đo
trong quá khứ thì kết quả tính toán mực nước của mô hình tại trạm thủy văn Ba Thá
bám sát mực nước thực đo.
Trong nghiên cứu này chúng tôi sử dụng số liệu của hai trận lũ để hiệu chỉnh
mô hình bao gồm:
- Trận lũ thứ nhất sảy ra trong thời gian từ ngày 26/08/2014 đến ngày 15/09/2014
- Trận lũ thứ hai sảy ra trong thời gian từ 28/07/2015 đến ngày 11/08/2015
5
Observation
4.5
Calculation
4
3.5
2.5
1.5
0.5
0
8/26/14 0:00
8/27/14 0:00
8/28/14 0:00
8/29/14 0:00
8/30/14 0:00
8/31/14 0:00
9/10/14 0:00
9/11/14 0:00
9/12/14 0:00
9/13/14 0:00
9/14/14 0:00
9/15/14 0:00
9/1/14 0:00
9/2/14 0:00
9/3/14 0:00
9/4/14 0:00
9/5/14 0:00
9/6/14 0:00
9/7/14 0:00
9/8/14 0:00
9/9/14 0:00
Hình 8.1: Kết quả hiệu chỉnh mô hình theo trận lũ năm 2014
Kết quả hiệu chỉnh mô hình theo hai trận lũ được thể hiện trên các Figure 3 và
Figure 4. Các hình vẽ cho thấy kết quả tính toán đã được hiệu chỉnh bám khá sát với
số liệu thực đo. Đặc biệt là kết quả tính toán mô phỏng khá chính xác phần đỉnh của
cả hai trận lũ. Nhìn chung kết quả tính toán của trận lũ năm 2014 tốt hơn so với kết
quả tính toán của trận lũ năm 2015. Các đồ thị cũng cho ta thấy sai số giữa tính toán

và thực đo thường sảy ra khi mực nước thấp. Một trong các nguyên nhân gây nên sai
số này có lẽ là do sự anhe hưởng của các hồ chứa trong lưu vực. Khi mưa lớn trong
thời gian dài (mực nước sông lên cao) thì các hồ này đầy nước và ở chế độ tràn tự do.
Còn khi mưa nhỏ và mưa ngắt quãng thì một phần nước được lưu trữ lại trong các hồ
này tạo nên sự thiếu hụt nước. Đây là vấn đề mà mô hình tính toán không phản ánh
được. Vì vậy khi mực nước sông thấp thì kết quả tính toán có chiều hướng lớn hơn
giá trị thực đo.
4.500
Observation
4.000 Calculation
3.500
3.000
2.500
2.000
1.500
1.000
0.500
0.000
7/28/2015 0:00
7/29/2015 0:00
7/30/2015 0:00
7/31/2015 0:00
8/10/2015 0:00
8/11/2015 0:00
8/1/2015 0:00
8/2/2015 0:00
8/3/2015 0:00
8/4/2015 0:00
8/5/2015 0:00
8/6/2015 0:00
8/7/2015 0:00
8/8/2015 0:00
8/9/2015 0:00
Hình 8.2: Kết quả hiệu chỉnh mô hình theo trận lũ năm 2015
Năm 2017 lưu vực sông Tích Bùi bị nước tràn qua đên gây nên tình trạng sạt đê
ở khu vực này. Nhóm nghiên cứu đã sử dụng phần mềm để tính toán mô phỏng cho
trận lũ năm 2017. Kết quả tính toán nhue trên Hình 7.3 cho thấy mô hình đã phát hiện
ra có một khu vực nước bị tràn từ sông vào khu vực dân cư. Kết quả tính toán này
cũng đã đã được nhóm nghiên cứu xác định là đúng với thực tế về vị trí tràn và khu
vực bị ngập nước. Tuy nhiên về độ sâu ngập và diện tích ngập mà mô hình tính toán
được có sự sai khác lớn với thực tế của trận lũ năm 2017. Nguyên nhân của sự sai số
đó là do trong quá trình nước tràn qua đê thì một đoạn đê đã bị vỡ do sói mòn. Chính
vì vậy dẫn đến kết quả tính toán mực nước trong sông và mực nước trong khu dân cư
(ngập lụt) chưa chính xác về mặt định lượng.
Các kết quả hiệu chỉnh mô hình cho thấy mô hình đã bắt tốt cóa số liệu thực đo
trong sông và phản ánh đúng hiện trạng ngập lụt ngoài sông cũng như hiện tượng tràn
đê (nếu có)

Hình 8.3: Kết quả mô phỏng trận lũ năm 2017
2. Thử nghiệm dự báo lại

Sau khi đã hiệu chỉnh mô hình bằng các trận lũ năm 2014, 2015 và cả năm
2018 (có ngập lụt). Nhóm nghiên cứu sử dụng bộ tham số thu được sau khi hiệu chỉnh
mô hình theo các số liệu lịch sử (trận lũ năm 2014 và trận lũ năm 2015) nhóm nghiên
cứu đã ứng dụng mô hình số này để dự báo mực nước sông tại trạm thủy văn ba Thá
và cảnh báo ngập lụt của lưu vực sông này trong năm 2016 và năm 2017.
Kết quả dự báo mực nước tại trạm Ba Thá trước 24 giờ của các trận lũ năm 2016
và năm 2017 được thể hiện trong Hình 8.4 và Hình 8.5.
Các kết quả dự báo trước 24 tiếng mực nước tại trạm Ba Thá của hai trận lũ
năm 2016 và 2017 cho thấy mô hình tính toán số đã dự báo khá chính xác mực nước
trong sông trong trường hợp không sảy ra sự cố tràn đên hoặc vỡ đê.
Trong trường hợp sảy ra sự cố tràn đê thì mô hình tính toán sẽ chỉ ra được khu
vực bị tràn, thời gian bị tràn. Đối với vùng bị ngập lụt, mô hình tính toán có thể chỉ
ra được độ sau ngập lụt (của chỗ ngập sâu nhất) và diện tích bị ngập.

7
Forecasting 24h
Observation
6
0
0 100 200 300 400 500 600 700 800 900 1000 1100 1200
Hình 8.4: Kết quả dự báo trước 24h mực nước tại trạm Ba Tha năm 2016
7
Forecasting 24h
Observation
6
0
0 100 200 300 400 500 600 700 800 900 1000 1100 1200
Hình 8.5: Kết quả dự báo trước 24h mực nước tại trạm Ba Tha năm 2017

3. Kết quả dự báo thực trận lũ năm 2018

3.1. Các bản tin dự báo
Trong thời gian sảy ra trận lũ năm 2018. Nhóm nghiên cứu đã thực hiện tính
toán thử nghiệm dự báo các bản tin cảnh báo lũ trên lưu vực sông Tích-Bùi trong thời
gian từ ngày 18/7 đến ngày 08/08. Dưới đây là nội dung của một số bản tin:
 Bản tin 7:00 ngày 18/07/2018
HBa Thá = 3.67 (m) tại thời điểm phát bản tin
Các ô đang ngập: Không

Thời gian
3h 6h 9h 12h 15h 18h 21h 24h
Vị trí
H Ba Thá 3.85 3.87 3.9 3.92 3.94 3.96 4.0 4.06
H QL6 6.18 6.14 6.09 6.05 6.01 5.97 5.93 5.9
Các ô ngập
5.00
4.50
4.00
3.50
3.00
2.50
2.00
1.50
1.00
0.50
0.00
7/9/2018 7/11/2018 7/13/2018 7/15/2018 7/17/2018 7/19/2018 7/21/2018
Thực đo Dự báo
Đồ thị dự báo mực nước tại vị trí trạm thủy văn Ba Thá ngày 18/7/2018
 Bản tin 7:00 ngày 19/07/2018
HBa Thá = 4.07 (m) tại thời điểm phát bản tin

Thời gian
3h 6h 9h 12h 15h 18h 21h 24h
Vị trí
H Ba Thá 4.14 4.22 4.33 4.38 4.45 4.54 4.64 4.75
H QL6 5.92 5.98 6.1 6.25 6.39 6.52 6.64 6.75
Các ô ngập
6.00
5.00
4.00
3.00
2.00
1.00
0.00
7/9/2018 7/11/2018 7/13/2018 7/15/2018 7/17/2018 7/19/2018 7/21/2018 7/23/2018
 Bản tin 7:00 ngày 20/07/2018

HBa Thá = 4.75 (m)
Thời gian
3h 6h 9h 12h 15h 18h 21h 24h
Vị trí
H Ba Thá 4.86 4.95 5.04 5.1 5.15 5.19 5.21 5.23
H QL6 6.85 6.92 6.95 6.94 6.94 6.92 6.89 6.89
Các ô ngập

7.00
6.00
5.00
4.00
3.00
2.00
1.00
0.00
7/11/2018 7/13/2018 7/15/2018 7/17/2018 7/19/2018 7/21/2018 7/23/2018
 Bản tin 7:00 ngày 21/07/2018

HBa Thá = 5.07 (m)
Thời
gian 3h 6h 9h 12h 15h 18h 21h 24h
Vị trí
H Ba 5.27 5.4 5.58 5.76 5.88 6.0 6.08 6.15
Thá
H QL6 6.97 7.14 7.44 7.84 8.27 8.6 8.77 8.79
Các ô OCH_034 OCH_034, OCH_034, OCH_034, OCH_034,

ngập OCH_037 OCH_037 OCH_037, OCH_037,
OCH_035 OCH_035
7.00
6.00
5.00
4.00
3.00
2.00
1.00
0.00
7/11/2018 7/13/2018 7/15/2018 7/17/2018 7/19/2018 7/21/2018 7/23/2018 7/25/2018

Bản đồ dự báo ngập lụt cho lưu vực sông Tích Bùi lúc 19:00 ngày 21/7/2018
 Bản tin 7:00 ngày 25/07/2018

HBa Thá = 6.01 (m)
Các ô đang ngập: OCH_034, OCH_035, OCH_037.
Thời
gian 3h 6h 9h 12h 15h 18h 21h 24h
Vị trí
H Ba 5.82 5.79 5.73 5.7 5.67 5.61 5.55 5.49
Thá
H QL6 6.44 6.35 6.27 6.2 6.18 6.2 6.23 6.24
Các ô OCH_034 OCH_034 OCH_034 OCH_034 OCH_034 OCH_034 OCH_034 OCH_034

ngập OCH_037 OCH_037 OCH_037 OCH_037 OCH_037 OCH_037 OCH_037 OCH_037
OCH_035 OCH_035 OCH_035 OCH_035 OCH_035 OCH_035 OCH_035 OCH_035
7.00
6.00
5.00
4.00
3.00
2.00
1.00
0.00
7/15/2018 7/17/2018 7/19/2018 7/21/2018 7/23/2018 7/25/2018 7/27/2018 7/29/2018

 Bản tin 7:00 ngày 22/07/2018

HBa Thá = 6.05 (m)
Các ô đang ngập: OCH_034, OCH_035, OCH_037.
Thời
gian 3h 6h 9h 12h 15h 18h 21h 24h
Vị trí
H Ba Thá 5.9 5.93 5.95 5.95 5.94 5.93 5.9 5.89
H QL6 7.34 7.37 7.39 7.39 7.36 7.32 7.26 7.2
Các ô OCH_034 OCH_034 OCH_034 OCH_034 OCH_034 OCH_034 OCH_034 OCH_03

ngập OCH_037 OCH_037 OCH_037 OCH_037 OCH_037 OCH_037 OCH_037 4OCH_0
OCH_035 OCH_035 OCH_035 OCH_035 OCH_035 OCH_035 OCH_035 37OCH_
035
7.00
6.00
5.00
4.00
3.00
2.00
1.00
0.00
7/21/2018 7/23/2018 7/25/2018 7/27/2018 7/29/2018 7/31/2018 8/2/2018

3.2. Tổng hợp kết quả dự báo của các bản tin
Dưới đây là bảng tổng hợp các kết quả dự báo của năm 2018.
Dự báo 6 giờ
Ngày Thời gian Thực đo DB Ba DB QL6
(giờ) BT (m) Thá (m) (m)
7/18/2018 7:00 6:00:00 3.87 6.14
7/19/2018 7:00 30:00:00 4.22 5.98
7/20/2018 7:00 54:00:00 4.84 4.95 6.92
7/21/2018 7:00 78:00:00 5.39 5.4 7.14
7/22/2018 7:00 102:00:00 6.19 6.23 8.65
7/23/2018 7:00 126:00:00 6.24 6.17 7.73
7/24/2018 7:00 150:00:00 6.17 6.02 7.05
7/25/2018 7:00 174:00:00 5.91 5.79 6.35
7/26/2018 7:00 198:00:00 5.68 5.38 6.16
7/27/2018 7:00 222:00:00 5.62 5.22 5.75
7/28/2018 7:00 246:00:00 5.86 5.42 6.17
7/29/2018 7:00 270:00:00 5.94 5.65 6.89
7/30/2018 7:00 294:00:00 6.08 5.93 7.37
7/31/2018 7:00 318:00:00 5.93 5.84 7.05
8/1/2018 7:00 342:00:00 5.86 6.77 6.69
8/2/2018 7:00 366:00:00 5.68 5.62 6.37
8/3/2018 7:00 390:00:00 5.54 5.55 5.88

8/4/2018 7:00 414:00:00 5.26 5.29 5.44

8/5/2018 7:00 438:00:00 5.12 5.17 5.2
8/6/2018 7:00 462:00:00 4.83 4.85 5.01
8/7/2018 7:00 486:00:00 4.55 4.9
8/8/2018 7:00 510:00:00 4.34 4.69
Dự báo 12 giờ
Ngày Thời gian Thực đo DB Ba DB QL6
(giờ) BT (m) Thá (m) (m)
7/18/2018 7:00 12:00:00 3.92 6.05
7/19/2018 7:00 36:00:00 4.38 6.25
7/20/2018 7:00 60:00:00 4.91 5.1 6.94
7/21/2018 7:00 84:00:00 5.72 5.76 7.84
7/22/2018 7:00 108:00:00 6.22 6.25 8.45
7/23/2018 7:00 132:00:00 6.24 6.14 7.54
7/24/2018 7:00 156:00:00 6.11 5.96 6.87
7/25/2018 7:00 180:00:00 5.85 5.7 6.2
7/26/2018 7:00 204:00:00 5.62 5.31 6.06
7/27/2018 7:00 228:00:00 5.72 5.27 5.75
7/28/2018 7:00 252:00:00 5.84 5.44 6.32
7/29/2018 7:00 276:00:00 5.98 5.73 7.11
7/30/2018 7:00 300:00:00 6.08 5.95 7.39
7/31/2018 7:00 324:00:00 5.91 5.8 6.88
8/1/2018 7:00 348:00:00 5.82 5.74 6.64
8/2/2018 7:00 372:00:00 5.65 5.61 6.25
8/3/2018 7:00 396:00:00 5.46 5.47 5.75
8/4/2018 7:00 420:00:00 5.23 5.27 5.33
8/5/2018 7:00 444:00:00 5.05 5.09 5.17
8/6/2018 7:00 468:00:00 4.77 4.79 5
8/7/2018 7:00 492:00:00 4.49 4.83
8/8/2018 7:00 516:00:00 4.29 4.68
Hai bảng kết quả dự báo 6h và 12h ở trển cho thấy các kết quả dự báo bằng bộ
công cụ được xây dựng và phát triển trong khuôn khổ đề tài này đã dự báo tương đối
chính xác diễn biến mực nước tại trạm thủy văn Ba Thá.
Theo thống kê của nhóm thực hiện đề tài thì các khu vực bị ngập trong bản tin
dự báo là khá phù hợp với trên thực tế. Tuy nhiên về diện tích ngập và độ sau ngập
của từng vùng thì mô hình chưa thể hiện tốt. Đây cũng chính là nhược điểm của mô
hình thủy lực giả hai chiều (một chiều mở rộng) so với mô hình thủy lực hai chiều.

10
Thực đo Dự Báo Ba Thá
Dự Báo QL6
9
6
Mực nước (m)
1 Thời gian (giờ)
0
7/17/2018 7/23/2018 7/29/2018 8/4/2018 8/10/2018
Hình 8.6: Kết quả dự báo 6h của các bản tin
9
Thực đo Dự Báo Ba Thá
8 Dự Báo QL6
6
Mực nước (m)
1
Thời gian (giờ)
0
7/14/18 0:00 7/19/18 0:00 7/24/18 0:00 7/29/18 0:00 8/3/18 0:00 8/8/18 0:00 8/13/18 0:00

10
Thực đo Dự báo Ba Thá Dự báo QL6

9
6
Mực nước (m)
1
Thời gian (giờ)
0
7/15/2018 7/21/2018 7/27/2018 8/2/2018 8/8/2018 8/14/2018
10
Thực đo DB Ba Thá (m) DB QL6 (m)
9
6
Mực nước (m)
1
Thời gian (giờ)
0
7/14/2018 7/19/2018 7/24/2018 7/29/2018 8/3/2018 8/8/2018 8/13/2018

KẾT LUẬN
Trong khuôn khổ đề tài nghiên cứu khoa học này. Nhóm nghiên cứu về giảm
nhẹ thiên tai của Viện Cơ học cùng với các chuyên gia đã xây dựng được một công
cụ phần mềm hỗ trợ công tác cảnh báo và dự báo ngập lụt trên lưu vực sông Tích-
Bùi. Mô hình đã đáp ứng được các mục tiêu đặt ra cụ thể là:
- Có giao diện sử dụng công nghệ GIS thân thiện với người dùng
- Ngôn ngữ sử dụng trong công cụ là tiếng Việt
- Phần mềm đóng gói thành một bộ cài đặt hoàn chỉnh
- Phần mềm sử dụng một số kỹ thuật hiện đại trong lĩnh vực công nghệ thông
tin đó là kỹ thuật tính toán song song để nâng cao hiệu xuất sử dụng của
thiết bị.
- Các bộ phần mềm tính toán (thủy văn, thủy lực, mô hình học máy) được
phát triển trên cơ sở các thuật toán hiện đại và có độ tin cậy cao.
- Bộ công cụ đã được thử nghiệm dự báo cho trận lũ năm 2018 cho kết quả
khá tốt. Các kết quả dự báo phản ánh đúng về mặt định tính đối với các
khu vực ngập lụt. Còn về mực nước trong sông thì có định lượng khá tốt
tại vị trí trạm thủy văn Ba Thá
Bên cạnh bộ công cụ được xây dựng đáp ứng các yêu cầu đặt ra thì nhóm nghiên
cứu cũng đã có các công bố và đào tạo đáp ứng đủ yêu cầu theo như thuyết minh đề
tài đã được phê duyệt. Cụ thể là:
 Về đào tạo: Đã tham gai đào tạo 02 nghiên cứu sinh
 Nghiên cứu sinh Nguyễn Hồng Phong (thành viên tham chủ chốt trực
tiếp hiện đề tài)
 Nghiên cứu sinh Phan Thị Thu Phương (thành viên tham gia thực hiên
đề tài)
 Về công bố: Đã công bố được 01 bài báo trên tạp chí quốc tế, 01 bài trên tuyển
tập hội nghị cấp quốc gia, 01 bài trên tuyển tập hội thảo quốc tế và còn 01 bài
đã được chấp nhận in trong tuyển tập hội nghị cấp quốc gia.
Mặc dù bộ công cụ được phát triển của đề tài đã đáp ứng được các mục tiêu đặt ra.
Nhưng trong thời gian qua tình hình diễn biến mưa lũ của lưu vực sông Tích-Bùi rất
phức tạp và đã đặt ra những bài toán khó hơn. Chính vì vậy để công cụ có thể đáp
ứng tốt các vấn đề mới thì cần phải tiếp tục đầu tư công sức và tài chính để tiếp tục
hoàn thiện về mặt dữ liệu cũng như các tiện ích của công cụ.

TÀI LIỆU THAM KHẢO
[1]. Cuong T. Nguyen, Kien C. Nguyen, Phuong T.T. Phan: "Hydrological - Quasi 2D
Hydraulic Linked Model for Flood Forecasting", American Journal of Engineering
Research, Volume-7, Issue-10, pp-325-331, 2018.
[2]. Cuong T. Nguyen, Kien C. Nguyen: "Research and Proposal a Solution to Mitigate
Salinity Intrusion for Tam Ky River in Quang-Nam Province of Vietnam",
International Journal of Scientific Engineering and Applied Science (IJSEAS) –
Volume-3, Issue-11, Nov 2018 , pp.13-18
[3]. NGUYEN Tien Cuong, TRINH Thu Phuong: "Forecasting the discharge into
Hoa Binh reservoir by applying the Connecting model MARINE-IMech1D", Vietnam
Journal of Mechanics, VAST, Vol.30, No.3 (2009), pp.149-157.
[4]. Cuong T. NGUYEN, Lai V. HOANG and Ryoichi FUKAGAWA: “Coupling
hydrological - hydraulic models for flood simulating in tich river Basin”, The First
Joint Seminar on Landslide, Flood Disasters and the Environmental Issues, Tp. Hồ
Chí Minh, 2017
[5]. Cuong T. NGUYEN, Thao P. TRINH, Huong T.T. DUONG and Ryoichi
FUKAGAWA: “Set up rainfall-runoff models for simulating inflow of Ban Chat
reservoir”, The First Joint Seminar on Landslide, Flood Disasters and the
Environmental Issues, Tp. Hồ Chí Minh, 2017
[6]. Lai. V. HOANG, Cuong. T. NGUYEN, Huong. T. T. DUONG and Ryoichi
FUKAGAWA: Using Hydrologycal and Hydraulic Models in Regulation of HoaBinh
Reservoir, Proceedings of the 7th Vietnam/Japan Joint Seminar on Geohazards and
Environmental Issues, Sendai city, Japan, March - 2016.
[7]. H. Van Lai, N. Van Diep, N. Tien Cuong and N. Hong Phong: "Coupling hydrological-
hydraulic models for extreme flood simulating and forecasting on the North Central
Coast of Vietnam", WIT Transctions on Ecology and the Environment, Vol.124
(2009), pp.113-123. River Basin Management 2009, The fifth International
Conference, Malta, September 7-9, 2009.
[8]. Son T. Hoang, Lam X. Nguyen, Trinh D. Tran, Son T. Nguyen, Phuong T. T. Phan,
Cuong T. Nguyen: "Researching on Developing the Decision Support System for
Salinity Control Operation and Management in Vu Gia – Thu Bon River Basin",
Proceedings of The First International Conference on Fluid Machinery and
Automation Systems 2018 (ICFMAS2018), pp.590-596. (ISBN: 978-604-95-0609-3).
[9]. Nguyễn Chính Kiên: "Thử nghiệm ứng dụng mạng neuron nhân tạo trong dự báo thủy
văn và thủy lực", Tuyển tập công trình Hội nghị Khoa học Cơ học toàn quốc lần
thứ X (ISBN: 978-604-913-752-5), tập 2 (2018).
[10]. Nguyen Hong Phong, Tran Thu Ha, F. X. Le Dimet, Duong Ngoc Hai: "An Improved
Numerical Method for a 2D Pollution Water Model: Direct Model", Vietnam Journal
of Mechanics, Vol.39 (2017), No. 4, pp.339-349.

[11]. Nguyễn Hồng Phong, Trần Thu Hà và F.-X. Le Dimet: "Phương pháp số cho dòng
chảy không dừng trên đoạn sông có tính đến ảnh hưởng của độ dốc đáy", Tuyển tập
công trình Hội nghị Khoa học Cơ học toàn quốc lần thứ X (ISBN: 978-604-913-
752-5), tập 2 (2018)
[12]. Báo cáo dự án “Tiếp nước, cải tạo khôi phục sông Tích”
[13]. Báo cáo đề tài nghiên cứu khoa học cấp nhà nước mã số KC08-13/2010
[14]. Báo cáo dự án quốc tế FLOCODS.
[15]. Báo cáo “Quy hoạch và phát triển lưu vực sông Đáy”
[16]. Nguyễn Tiến Cường, Trịnh Thu Phương, Lê Thu Hoài: "Đánh giá các ưu và nhược
điểm của mô hình thủy văn Marine so với các mô hình khác qua kết quả ứng dụng tác
nghiệp trong mùa lũ", Tuyển tập công trình Hội nghị Khoa học Cơ học Thủy khí
toàn quốc năm 2011, Tx. Cửa Lò, tỉnh Nghệ An, tháng 7 năm 2011.
[17]. Nguyễn Tiến Cường: "Xây dựng mô hình dự báo lũ cho khu vực thượng nguồn hệ
thống sông Vu Gia", Tuyển tập công trình Hội nghị Khoa học Cơ học Thủy khí toàn
quốc năm 2010, (2011). tr.117-125, Tp. Quy Nhơn, tỉnh Bình Định, tháng 7 năm 2010.
[18]. Nguyễn Tiến Cường, Ngô Huy Cẩn, Đoàn Xuân Thủy, Dương Thị Thanh Hương:
"Ứng dụng mô hình thủy văn MARINE tính toán lưu lượng vào hồ Tuyên Quang",
Tuyển tập công trình Hội nghị Khoa học Cơ học Thủy khí toàn quốc năm 2008,
(2009). tr.27-66, Tp. Phan Thiết, tỉnh Bình Thuận, tháng 7 năm 2008.
[19]. Nguyễn Tiến Cường, Trần Thu Hà: "Mô hình cảnh báo, dự báo lũ hệ thống sông
Hương", Tuyển tập công trình Hội nghị Khoa học Cơ học toàn quốc lần thứ 8,
(2008) tập 3, tr.51-65, Tp. Hà Nội, tháng 12, năm 2007.
[20]. Nguyễn Tiến Cường: "Ứng dụng mô hình MARINE mô phỏng quá trình lũ thượng du
hệ thống sông Hương", Tuyển tập công trình Hội nghị Khoa học Cơ học Thủy khí
toàn quốc năm 2005, (2006). tr.9-18.
[21]. Trần Thu Hà, Nguyễn Hồng Phong, Nguyễn Tiến Cường: "Mô hình kết nối thủy văn
thủy lực tính lũ thượng du sông Đà qua hệ thống máy song song", Tuyển tập công
trình Hội nghị Khoa học Cơ học Thủy khí toàn quốc năm 2005, (2006). tr.115-126.
[22]. Nguyễn Trọng Hoài (chủ biên), Dự Báo Và Phân Tích Dữ Liệu Trong Kinh Tế Và Tài
Chính, NXB Thống Kê, 2009.
[23]. N.Đ. Xuyên, N.Q. Hỷ, N.V. Hữu, T.Đ. Quỳ, N.X. Bình, T. Cảnh, Lập hàm dự báo
chấn cấp động đất cực đại trên lãnh thổ Việt Nam bằng phương pháp xấp xỷ ngẫu
nhiên, Tạp chí các KH về Trái đất, T.22 (2000), 2 (81-89).
[24]. James, S. C., Zhang, Y., & O'Donncha, F. (2018). A machine learning framework to
forecast wave conditions. Coastal Engineering, 137, 1-10.
[25]. De Matteis, A. D., Marcelloni, F., & Segatori, A. (2015, August). A new approach to
fuzzy random forest generation. In Fuzzy Systems (FUZZ-IEEE), 2015 IEEE
International Conference on (pp. 1-8). IEEE.

[26]. Williams, J. K., & Abernethy, J. (2008, January). Using random forests and fuzzy logic
for automated storm type identification. In AMS Sixth Conference on Artificial
Intelligence Applications to Environmental Science.
[27]. Oánh, N. Q., & Lê Thanh Hà, Đ. Q. G (2014). Vận dụng các phương pháp dự báo san
bằng mũ để dự báo doanh thu cho doanh nghiệp ngành thép việt nam. Tạp chí Khoa
học và Phát triển, tập 12, số 2: 205-213
[28]. Dục, P. H. Đ. (2008). Mô hình điều khiển dự báo và ứng dụng điều khiển thích nghi
hướng tàu thủy. Tạp chí Khoa học & Công nghệ, Số 1 (45), Tập 1, 101 – 106
[29]. Tài, V. V. (2002). Dự báo sản lượng lúa Việt Nam bằng các mô hình toán học. Tạp chí
Khoa học-Trường Đại học Cần Thơ 25b, 125-134.
[30]. Nguyễn Hoàng Sơn, Hoàng Thanh Tùng, Lê Kim Truyền, Trần Kim Châu (2014). Xây
dựng công cụ dự báo lũ đến hồ và cảnh báo ngập lụt khi xả lũ và do vỡ đập gây ra cho
hồ chứa vừa và nhỏ. Tạp chí Khoa học kỹ thuật Thủy lợi và Môi trường, (44), 95 -
103.
[31]. Sung, J. Y., Lee, J., Chung, I. M., & Heo, J. H. (2017). Hourly water level forecasting
at tributary affected by main river condition. Water, 9(9), 644.
[32]. Chen, J. F., Hsieh, H. N., & Do, Q. H. (2014). Forecasting Hoabinh Reservoir’s
Incoming Flow: An Application of Neural Networks with the Cuckoo Search
Algorithm. Information, 5(4), 570-586.
[33]. N.Đ. Xuyên, N.Q. Hỷ, N.V. Hữu, T.Đ. Quỳ, N.X. Bình, T. Cảnh, Lập hàm dự báo
chấn cấp động đất cực đại trên lãnh thổ Việt Nam bằng phương pháp xấp xỷ ngẫu
nhiên, Tạp chí các KH về Trái đất, T.22 (2000), 2 (81-89).
[34]. Trevor Hastie, Robert Tibshirani, Jerome Friedman, T Hastie, J Friedman, and
R Tibshirani. The elements of statistical learning, volume 2. Springer, 2009.
[35]. Peter J Huber. Robust statistics. Springer, 2011.
[36]. J Martin Bland, Douglas G Altman, et al. Statistics notes: Cronbach’s alpha. Bmj,
314(7080):572, 1997.
[37]. Leo Breiman, Jerome Friedman, Charles J Stone, and Richard A Olshen. Classification
and regression trees. CRC press, 1984.
[38]. Yoav Freund, Robert Schapire, and N Abe. A short introduction to boosting. Journal-
Japanese Society For Artificial Intelligence, 14(771-780):1612, 1999.
[39]. Brian D. Ripley. Pattern recognition and neural networks. Cambridge university press,
1996.
[40]. Alex J Smola and Bernhard Schölkopf. A tutorial on support vector regression.
Statistics and computing, 14(3):199–222, 2004.
[41]. Leo Breiman. Random forests. Machine learning, 45(1):5–32, 2001.
[42]. Thanh-Tung Nguyen, Joshua Z Huang, Qingyao Wu, Thuy T Nguyen, and Mark J Li.
Genome-wide association data classification and snps selection using two-stage
quality-based random forests. BMC Genomics, 16(Suppl 2):S5, 2015.

[43]. Yoav Freund and Robert E Schapire. Adaptive game playing using multiplicative
weights. Games and Economic Behavior, 29(1):79–103, 1999.
[44]. Jerome H Friedman. Greedy function approximation: a gradient boosting machine.
Annals of Statistics, pages 1189–1232, 2001.
[45]. Lehmann, E. L., & Casella, G. (1998), Theory of point estimation, Springer Science
& Business Media.
[46]. Hyndman, R. J., & Koehler, A. B. (2006), “Another look at measures of forecast
accuracy”, International journal of forecasting, 22(4), 679-688.
[47]. Nguyen, Phuoc Khac-Tien, Lloyd Hock-Chye Chua, and Lam Hung Son. "Flood
forecasting in large rivers with data-driven models." Natural hazards 71.1 (2014): 767-
784.
[48]. Nam, T. X., & Tùng, N. T. (2017). DEEP LEARNING: ứng dụng cho dự báo lưu
lượng nước đến hồ chứa Hòa Bình. PROCEEDING of Publishing House for Science
and Technology.
[49]. KIM, S., & TACHIKAWA, Y. (2018). Real-time river-stage prediction with artificial
neural network based on only upstream observation data. 水工学論文集 Annual
journal of Hydraulic Engineering, JSCE, 62, Ⅰ_1375-1380.
[50]. Wang, Y., Zhou, J., Chen, K., Wang, Y., & Liu, L. (2017, November). Water quality
prediction method based on LSTM neural network. In Intelligent Systems and
Knowledge Engineering (ISKE), 2017 12th International Conference on(pp. 1-5).
IEEE.
[51]. Lehmann, E. L., & Casella, G. (1998), Theory of point estimation, Springer Science
& Business Media.
[52]. Hyndman, R. J., & Koehler, A. B. (2006), “Another look at measures of forecast
accuracy”, International journal of forecasting, 22(4), 679-688.
[53]. Chun-Tian Cheng, K.W. Chau. Flood Control management system for reservoirs.
Environmental Modeling & Software 19 (2004) 1141-1150
[54]. Integrated Project FLOODsite, Contract GOCE-CT-2004-505420, Co-ordinator: HR
Wallingford, UK, Project website: www.floodsite.net, 2005.
[55]. NeWater - New Approaches to Adaptive Water Management under Uncertainty,
www.newater.info, Contract no 511179 (GOCE), Integrated Project in PRIORITY 6.3
Global Change and Ecosystems in the 6th EU framework programme, 2005.
[56]. Chun-Tian Cheng, K.W. Chau. Fuzzy iteration methodology for reservoir flood
control operation. Journal of the American Water Resources Association 37(2001),
1381-1388
[57]. Chun-Tian Cheng, K.W. Chau, Xiang-Yang Li & Gang Li. Developing a Web-based
flood forecasting system for reservoirs with J2EE. Hydrological Sciences–Journal–
des Sciences Hydrologiques, 49(6) December 2004

[58]. Cheng, C.T., 1999. Fuzzy optimal model for the flood control system of the upper and
middle reaches of the Yangtze River. Hydrological Sciences Journal 44 (4), 573–582.
[59]. A Chronology of Major Events Affecting the National Flood Insurance Program.
Completed for the Federal Emergency Management AgencyUnder Contract Number
282-98-0029, October 2002.
[60]. Intergrated flood management, Case study: Canada: FLOOD MANAGEMENT IN THE
RED RIVER, Technical support unit, World Meteorological organization, May 2004.
[61]. http://en.wikipedia.org/wiki/SMART_Tunnel
[62]. Intergrated flood management, Case study: Bangladesh: FLOOD MANAGEMENT
Technical support unit, World Meteorological organization, September 2003.
[63]. http://www.mikepoweredbydhi.com/
[64]. http://www.hec.usace.army.mil/software/
[65]. http://www.delftsoftware.com.au/
[66]. Quyết định số 172/2007/QĐ-TTg của Thủ tướng Chính phủ ký ngày 16/11/2007 phê
duyệt Chiến lược quốc gia phòng, chống và giảm nhẹ thiên tai đến năm 2020.
[67]. Đặng Đình Đức, Trần Ngọc Anh, Nguyễn Ý Như, Nguyễn Thanh Sơn. Ứng dụng mô
hình MIKE FLOOD tính toán ngập lụt hệ thống sông Nhuệ - Đáy trên địa bàn thành
phố Hà Nội. Tạp chí Khoa học ĐHQGHN, Khoa học Tự nhiên và Công nghệ 27, Số
1S (2011) 37-43.
[68]. Lã Thanh Hà. Đánh giá khả năng phân chậm lũ sông Đáy và sử dụng lại các khu chậm
lũ và đề xuất các phương án xử lý khi gặp lũ khẩn cấp thuộc chương trình phòng lũ
sông Hồng - Thái Bình, 1999-2001.
[69]. Lê Vũ Việt Phong, Trần Hồng Thái, Phạm Văn Hải. Nghiên cứu áp dụng mô hình toán
MIKE 11 tính toán chất lượng nước sông Nhuệ - sông Đáy. Tuyển tập báo cáo Hội
thảo khoa học lần thứ 10 - Viện KH KTTV & MT, 269-278.
[70]. Phạm Thị Hương Lan, Trần Khắc Thạc. Nghiên cứu diễn biến lòng dẫn đoạn cửa vào
sông Đáy theo kịch bản đưa nước thường xuyên và đề xuất giải pháp chỉnh trị. Tuyển
tập Hội nghị Khoa học thường niên năm 2013, 113-115.
[71]. Abrahart, R.J. and See, L. (2000) Comparing neural network and autoregressive
moving average techniques for the provision of continuous river flow forecasts in two
contrasting catchments, Hydrological Processes, 14, 2157-2172.
[72]. Ahmed, N.K., et al. (2010) An empirical comparison of machine learning models for
time series forecasting, Econometric Reviews, 29, 594-621.
[73]. Bontempi, G., Ben Taieb, S. and Le Borgne, Y.-A. (2013) Machine Learning
Strategies for Time Series Forecasting. In Aufaure, M.-A. and Zimányi, E. (eds),
Business Intelligence. Springer Berlin Heidelberg, pp. 62-77.
[74]. Box, G.E.P. and Jenkins, G.M. (1976) Time series analysis: forecasting and control.
Holden-Day.

[75]. Broersen, P.M. (2007) Error correction of rainfall-runoff models with the ARMAsel
program, Instrumentation and Measurement, IEEE Transactions on, 56, 2212-2219.
[76]. Chen, S.H., et al. (2006) The strategy of building a flood forecast model by neuro‐
fuzzy network, Hydrological Processes, 20, 1525-1540.
[77]. Dawson, C.W. and Wilby, R. (1998) An artificial neural network approach to rainfall-
runoff modelling, Hydrological Sciences Journal, 43, 47-66.
[78]. Hsu, K.l., Gupta, H.V. and Sorooshian, S. (1995) Artificial Neural Network Modeling
of the Rainfall‐Runoff Process, Water resources research, 31, 2517-2530.
[79]. Jang, J.-S.R. (1993) ANFIS: adaptive-network-based fuzzy inference system,
Systems, Man and Cybernetics, IEEE Transactions on, 23, 665-685.
[80]. Maier, H.R., et al. (2010) Methods used for the development of neural networks for
the prediction of water resource variables in river systems: current status and future
directions, Environmental Modelling & Software, 25, 891-909.
[81]. Nayak, P., et al. (2005) Short‐term flood forecasting with a neurofuzzy model, Water
Resources Research, 41.
[82]. Plate, E.J. (2007) Early warning and flood forecasting for large rivers with the lower
Mekong as example, Journal of Hydro-environment Research, 1, 80-94.
[83]. See, L. and Openshaw, S. (1999) Applying soft computing approaches to river level
forecasting, Hydrological Sciences Journal, 44, 763-778.
[84]. See, L. and Openshaw, S. (2000) A hybrid multi-model approach to river level
forecasting, Hydrological Sciences Journal, 45, 523-536.
[85]. Serban, P. and Askew, A. (1991) Hydrological forecasting and updating procedures,
IAHS Publ, 201, 357-369.
[86]. Shamseldin, A. (2010) Artificial neural network model for river flow forecasting in a
developing country, Journal of Hydroinformatics, 12, 22-35.
[87]. Shamseldin, A.Y. (1997) Application of a neural network technique to rainfall-runoff
modelling, Journal of Hydrology, 199, 272-294.
[88]. Shamseldin, A.Y. and O'CONNOR, K.M. (1999) A real-time combination method for
the outputs of different rainfall-runoff models, Hydrological Sciences Journal, 44, 895-
912.
[89]. Shamseldin, A.Y. and O'Connor, K.M. (2001) A non-linear neural network technique
for updating of river flow forecasts, Hydrology and Earth System Sciences
Discussions, 5, 577-598.
[90]. Takagi, T. and Sugeno, M. (1985) Fuzzy identification of systems and its applications
to modeling and control, Systems, Man and Cybernetics, IEEE Transactions on, 116-
132.
[91]. Valença, M. and Ludermir, T. (2004) Hydrological forecasting and updating
procedures for neural network. Neural Information Processing. Springer, pp. 1304-
1309.

[92]. Werner, M.G.F., Schellekens, J. and Kwadijk, J.C.J. (2006) Flood Early Warning
Systems for Hydrological (Sub) Catchments. In, Encyclopedia of Hydrological
Sciences. John Wiley & Sons, Ltd.
[93]. Xiong, L. and O'connor, K.M. (2002) Comparison of four updating models for real-
time river flow forecasting, Hydrological Sciences Journal, 47, 621-639.

BCFull TichBui

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

BCFull TichBui

Uploaded by

Copyright:

Available Formats

VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

BÁO CÁO ĐỀ TÀI NGHIÊN CỨU KHOA HỌC VÀ CÔNG NGHỆ

“Ứng dụng Công nghệ thông tin xây dựng mô hình

Hà Nội, tháng 12 năm 2018

MỤC LỤC ........................................................................................................................................................ 2

Báo cáo kết quả thực hiện đề tài Trang số 2

1.1. Mô hình hồi quy tuyến tính nhiều biến ...................................................................................................... 77

PHẦN 3: CÔNG CỤ CẢNH BÁO VÀ DỰ BÁO LŨ LỤT SÔNG TÍCH-BÙI....................................... 100

KẾT LUẬN .................................................................................................................................................. 145

Báo cáo kết quả thực hiện đề tài Trang số 3

CÁC NHÀ KHOA HỌC THỰC HIỆN ĐỀ TÀI

 Các cán bộ và nghiên cứu sinh của Viện Cơ học

 Các chuyên gia ngoài Viện Cơ học

Báo cáo kết quả thực hiện đề tài Trang số 4

Báo cáo kết quả thực hiện đề tài Trang số 5

Báo cáo kết quả thực hiện đề tài Trang số 6

Báo cáo kết quả thực hiện đề tài Trang số 7

Báo cáo kết quả thực hiện đề tài Trang số 8

Báo cáo kết quả thực hiện đề tài Trang số 9

Báo cáo kết quả thực hiện đề tài Trang số 10

Báo cáo kết quả thực hiện đề tài Trang số 11

Báo cáo kết quả thực hiện đề tài Trang số 12

Báo cáo kết quả thực hiện đề tài Trang số 13

Hình 1: Lưu vực sông Tích - sông Bùi

Báo cáo kết quả thực hiện đề tài Trang số 14

Báo cáo kết quả thực hiện đề tài Trang số 15

Báo cáo kết quả thực hiện đề tài Trang số 16

Báo cáo kết quả thực hiện đề tài Trang số 17

Tổng quan về lưu vực sông Tích-Bùi

1. Đặc điểm của lưu vực sông Tích-Bùi

Báo cáo kết quả thực hiện đề tài Trang số 18

Hình 1: Phạm vi nghiên cứu của đề tài

1.2. Đặc điểm về khí tượng thủy văn và thủy hệ

Báo cáo kết quả thực hiện đề tài Trang số 19

Báo cáo kết quả thực hiện đề tài Trang số 20

 Hệ thống trạm quan trắc

TT Tr¹m YÕu tè Thêi gian

Báo cáo kết quả thực hiện đề tài Trang số 21

- Z: Bốc hơi (mm)

STT Lưu vực Flv(km2) Lc(km) SLn(km) Js(‰) Jd(‰)

2. Dự án cải tạo sông Tích-Bùi

Báo cáo kết quả thực hiện đề tài Trang số 22

Báo cáo kết quả thực hiện đề tài Trang số 23

Báo cáo kết quả thực hiện đề tài Trang số 24

Báo cáo kết quả thực hiện đề tài Trang số 25

Giải pháp đề xuất của đề tài

1. Mục tiêu của đề tài

Báo cáo kết quả thực hiện đề tài Trang số 26

Báo cáo kết quả thực hiện đề tài Trang số 27

Mưa (thực đo và dự báo)

DỰ BÁO CẢNH BÁO

Hình 2.1: Sơ đồ giải pháp của đề tài

Báo cáo kết quả thực hiện đề tài Trang số 28

Báo cáo kết quả thực hiện đề tài Trang số 29

Thu thập dữ liệu

1. Thu thập dữ liệu địa hình

Báo cáo kết quả thực hiện đề tài Trang số 30

Bảng 3.1: Đặc trưng hình thái lưu vực

TT Tên lưu vực Flv Lc SLn Js Jd

Báo cáo kết quả thực hiện đề tài Trang số 31

9 Đội Phú 21 7,53 11 3,7 108

Hình 3.3: Bản đồ hiện trạng sử dụng đất

Báo cáo kết quả thực hiện đề tài Trang số 32