Professional Documents
Culture Documents
VIỆN CƠ HỌC
Đề tài: 01C-07/-1-2016-3
Đơn vị chủ trì: Viện Cơ học, Viện Hàn lâm KH&CN Việt Nam
Chủ nhiệm: TS. Nguyễn Tiến Cường
Trưởng phòng Thủy động lực và Giảm nhẹ thiên tai
MỤC LỤC
MỞ ĐẦU
Lũ lụt là một trong các hiểm hoạ thiên nhiên có thể gây thiệt hại lớn về người
và tài sản cho các khu vực dân cư sống trong lưu vực của các hệ thống sông. Thí dụ,
ở Trung Quốc trong những năm gần đây tính trung bình thiệt hai do lũ lụt hàng năm
là hơn 200 tỷ Nhân dân tệ (Cheng, C.T. 2004). Trên thế giới vấn đề lũ lụt đã và đang
được nhiều cơ quan quan tâm cho tất cả các lưu vực sông có con người sinh sống. Vì
vậy, nghiên cứu về các biện pháp phòng và chống lũ đã và đang được nhiều cơ quan,
tổ chức thực hiện. Có rất nhiều dự án về phòng và chống lũ đã hoàn thành và nhiều
dự án đang được đầu tư để nghiên cứu và triển khai. Có thể liệt kê một số dự án lớn
trong những năm gần đây về phòng và chống lũ trên thế giới như sau:
Tại châu Âu: Dự án FLOODSITE được tổ chức thực hiện ngay sau khi thực hiện
các Dự án lớn như CADAM, IMPACT. Dự án FLODSITE được bắt đầu tổ chức thực
hiện từ 1/3/2004, thời hạn là 5 năm, kinh phí là 10 triệu Euros, bao gồm 35 nhiệm vụ
với 36 tổ chức và 150 các nhà khoa học và quản lý của 13 nước châu Âu tham gia.
Dự án đặt ra mục tiêu tập hợp các nhà khoa học và quản lý vào việc nghiên cứu và
giải quyết những vấn đề khoa học, công nghệ, chính sách bao gồm các khía cạnh vật
lý, môi trường, sinh thái, kinh tế-xã hội nhằm đề xuất biện pháp quản lý tổng hợp lũ
lụt. Dự án tiếp theo là Dự án NEWATER. Dự án được thực hiện từ 1/2005 đến
12/2008, với 37 tổ chức và khoảng 130 nhà khoa học nghiên cứu các phương pháp
và công cụ để có thể quản lý tổng hợp nguồn nước trong điều kiện bất định, trong đó
có vấn đề quản lý tổng hợp lũ lụt.
Ở Trung Quốc, nhận thức được tầm quan trọng của việc phòng và chống lũ, năm
1998 chính phủ Trung Quốc đã giao cho Cục Phòng chống Lũ lụt và Hạn hán Quốc
gia và 3 trường đại học: Đại học Công nghệ Đại Liên, Đại học Hồ Hải và Đại học
Thuỷ điện Vũ Hán thực hiện dự án: Hệ thống quản lý tích hợp kiểm soát lũ của các
hồ chứa (Integrated Management System for Flood Conrol of Reservoirs). Thời gian
thực hiện dự án là 5 năm 1998-2003. Mục tiêu của dự án là thiết lập hệ thống phần
mềm chuẩn kiểm soát lũ cho hệ thống đa hồ chứa, thu thập và sử lý số liệu tổng thể
theo thời gian thực, phân tích mưa, dự báo lũ, trao đổi dữ liệu trên toàn quốc thông
qua Cơ sở quản lý dữ liệu lớn trên máy tính. Kết quả của dự án là bộ chương trình
phần mềm và bộ cơ sở dữ liệu có thể sử dụng bởi trung tâm điều hành chống lũ và
các hồ chứa đơn lẻ. Kết quả của dự án đã được đăng tải trên nhiều tạp chí Khoa học
quốc tế.
Tại Mỹ: ngay từ năm 1968 Quốc hội Mỹ đã thông qua đạo luật Bảo hiểm lũ lụt
Quốc gia (P.L. 90-448). Các đạo luật tiếp theo liên tục được bổ sung (thí dụ năm 1973
thông qua đạo luật Bảo vệ thiên tai lũ lụt (PL 93-234). Các đạo luật này đã đề ra các
điều kiện bảo vệ người dân và cơ sở hạ tầng với mức lũ tần suất xuất hiện 100 năm.
Việc thực thi các đạo luật đã khuyến khích người dân di trú khỏi vùng ngập lụt nhờ
sự hỗ trợ tài chính của nhà nước và xây dựng các công trình đạt chuẩn đế giảm thiểu
tác hại do lũ gây ra.
Ở Canada có dự án thiết lập cụm công trình kiểm soát lũ để bảo vệ thành phố
Winnipeg bao gồm hồ chứa Shellmouth, kênh dẫn chuyển hướng dòng nước và hành
lang thoát lũ (dài 47 km) qua thành phố với mức lưu lượng tương đương trận lũ lịch
sử năm 1826. Sau trận lũ năm 1997 hành lang thoát lũ này đã được mở rộng để nâng
cao khả năng thoát lũ bảo đảm an toàn cho thành phố Winnipeg.
Tại Malaysia: sau trận mưa lớn và dài, với lượng mưa hàng trăm mm/ngày xảy
ra vào năm 2004, cả Thủ đô Kuala Lumpur từng lâm vào tình trạng ngập lụt nặng,
giao thông đình trệ, thiệt hại lớn. Trước tình hình này, chính quyền thành phố Kuala
Lampur đã cho phép Tập đoàn Gamuda cùng Công ty MMC thực hiện dự án theo
hình thức BOT, với tổng vốn khoảng 700 triệu USD. Đường hầm SMART có chiều
dài 4,7 km (đường hầm xa lộ dài 3km, 1,7 km đường dẫn), cao 13,2 m (2 tầng cho
giao thông, 1 tầng cho thoát nước khi mưa nhỏ) rộng 6,5 m (2 làn xe). Với hệ thống
công nghệ và kỹ thuật hiện đại, mọi thông tin liên lạc bằng di động và sóng radio đảm
bảo tốt trong SMART.
Tại Bangladesh: Là quốc gia thường xuyên đối mặt với lũ lụt do nằm ở vùng thấp
đồng bằng sông Hằng. Diện tích ngập lụt khoảng 25 - 30 % diện tích cả nước khi xảy
ra lũ lụt. Những trận lũ lớn (thí dụ như trận lũ năm 1968) đã làm ngập 2/3 diện tích
nước này. Các giải pháp phòng chống lũ tại Bangladesh bao gồm xây dựng 10.000
km đê, 3.500 km kênh tiêu, với khoảng 5.000 công trình tiêu úng, khoảng 100 trạm
bơm lớn và 1.250 công trình ngăn cửa sông để điều chỉnh nước.
Trong các dự án trên một trong những phương pháp quan trọng đã được sử dụng
là phương pháp mô hình hóa. Các mô hình thủy văn, thủy lực với các độ phức tạp
khác nhau đã được xây dựng. Theo các mô hình, các phần mềm tương ứng đã được
hình thành. Thí dụ như phân tích tổng quan về các mô hình lũ lụt đã và đang được
xây dựng và sử dụng ở các tổ chức tham gia dự án FLOODSITE (Bảng 1).
Nhiều phần mềm đã được các công ty phát triển thành các phần mềm tổng quát
và được phổ biến rộng rãi trên thế giới. Có thể liệt kê ở đây một số phần mềm đa dạng
về thủy văn và thủy lực của các công ty nổi tiếng sau:
Phần mềm của Công ty DHI (Đan Mạch): Các phần mềm của DHI là các phần
mềm thương mại. Hiện nay các phần mềm của DHI là phần mềm thương mại
được khai thác sử dụng ở nhiều nước trên thế giới trong đó có Việt Nam. Giá
bản quyền của bộ phần mềm MIKE của DHI khá đắt và được chia theo các
option hỗ trợ nên mức giá khác nhau nhiều. Giá mô đun tính toán thủy lực một
chiều (MIKE11) và mô đun thủy văn (MIKE-NAM) được chào bán cho Viện
Cơ học (giữa năm 2018) là khoảng 1.6 tỷ đồng cho một người dùng. Nếu lựa
chọn bản tính toán hai chiều (MIKE21) và mô đun thủy văn (MIKE-NAM) thì
giá chào bán là khoảng 2.4 tỷ đồng. Hiện nay hầu hết các cơ quan nghiên cứu,
đào tạo cũng như tư vấn quy hoạch lũ lụt, thủy lợi đều mua bản quyền sử dụng
của phần mềm MIKE với các lựa chọn phù hợp với điều kiện tài chính và mục
đích sử dụng và tầm chi phí bỏ ra để mua bản quyền sử dụng nằm trong khoảng
từ 800 triệu đồng đến 8 tỷ đồng.
Bảng 1: Các Mô hình Thuỷ lực mô tả và dự báo lũ lụt được xây dựng và sử dụng
trong Dự án FLOODSITE
Comput
Exampl
Met Descripti ation
Application e Inputs Outputs
hod on time (as
Models
of 2006)
DEM Inundation
No
extent and
physical Broad scale Upstream
water depth
laws assessment of ArcGIS water
by
0D included flood extents Delta level Seconds
intersecting
in and flood mapper
Downstre planar water
simulatio depths.
am water surface with
ns.
level DEM
Surveyed
cross Water depth
sections and average
of velocity at
Design scale channel each cross
Solution Mike 11
modelling and section
of the HEC-
which can be floodplai
one- RAS Inundation
of the order n
dimensio SOBEK extent by
1D of 10s to 100s Minutes
nal St -CF Upstream intersecting
of km
Venant Infowor discharge predicted
depending on
equations ks RS hydrogra water depths
catchment
. (ISIS) phs with DEM
size.
Downstre Downstream
am stage outflow
hydrogra hydrograph
phs
Design scale
modelling
which can be
of the order
1D plus a
of 10s to 100s
storage
of km Mike 11
cell
depending on HEC-
approach
catchment RAS As for 1D As for 1D Minutes
1D+ to the
size, also has Infowor models models to hours
simulatio
the potential ks RS
n of
for broad (ISIS)
floodplai
scale
n flow.
application if
used with
sparse cross-
section data.
DEM
2D minus
Broad scale Upstream Inundation
the law of
modelling or discharge extent
conservat
urban hydrogra
ion of LISFLO Water depths
2D- inundation phs Hours
momentu OD-FP
depending on Downstream
m for the Downstre
cell outflow
floodplai am stage
dimensions. hydrograph
n flow. hydrogra
phs
Inundation
Design scale extent
modelling of DEM
Solution TUFLO Water depths
the order of
of the W Mike Upstream
10s km. May Depth-
two- 21 discharge
have the averaged
dimensio TELEM hydrogra
potential for velocities at Hours to
2D nal AC phs
use in broad each days
shallow SOBEK
scale Downstre computationa
wave -OF
modelling if am stage l node
equations Delft-
applied with hydrogra
. FLS Downstream
very course phs
grids. outflow
hydrograph
Predominantl
y coastal DEM
modelling Inundation
Upstream
applications extent
discharge
2D plus a where 3D hydrogra Water depths
solution velocity phs
for profiles are TELEM u, v and w
vertical important. AC 3D Inlet velocities for
2D+ velocity each Days
velocities Has also been Delft-
using applied to distributi computationa
3D
continuity reach scale on l cell
only. river Downstre Downstream
modelling am stage outflow
problems in hydrogra hydrograph
research phs
projects.
DEM
Upstream
discharge Inundation
3D hydrogra extent
solution phs Water depths
of the Local
Inlet u, v and w
three- predictions of
velocity velocities
dimensio three-
and and turbulent
nal dimensional
3D CFX turbulent kinetic energy Days
Reynolds velocity fields
averaged in main kinetic for each
Navier channels and energy computationa
Stokes floodplains. distributi l cell
equations on Downstream
. outflow
Downstre
am stage hydrograph
hydrogra
phs
Phần mềm HEC-HMS của Công ty HEC (Mỹ): Các phần mềm của HEC là các
phần mềm được cung cấp miễn phí trên Internet. Các phần mềm của HEC có
ưu điểm là dễ sử dụng và miễn phí nên được sử dụng nhiều trong nghiên cứu,
đào tạo và ứng dụng thực tế. Các phần mềm của HEC có cộng đồng người sử
dụng lớn trên thế giới và cả ở Việt Nam. Khả năng tính toán của HEC là khá tốt
nhưng sự tiện dụng đối với người sử dụng thì không cao. Tuy nhiên vì là phần
mềm được miễn phí (trừ một số công cụ - tools phụ trợ phải trả phí) nên cộng
đồng người sử dụng bộ phần mềm HEC là khá đông. Bộ phần mềm HEC về cơ
bản có 4 sản phẩm chính gồm: HEC-HMS là mô hình thủy văn, HEC-RAS là
mô hình thủy lực, HEC-RASSIM là mô hình điều hành hồ chứa, Geo-HEC là
phần mềm hỗ trợ kết nối và hiển thị GIS.
Phần mềm SOBEK (Úc)
Các phần mềm của DELL là các phần mềm thương mại
Nhờ sự phát triển mạnh mẽ của công nghệ thông tin, đặc biệt là những tiến bộ
của máy tính điện tử, nhiều phần mềm thủy văn, thủy lực đã được sử dụng như một
công cụ chính trong dự báo và kiểm soát lũ lụt trên các lưu vực sông.
Dự đoán chính xác mực nước và lưu lượng là yêu cầu chủ yếu trong việc xây
dựng thành công một hệ thống quản lý và giảm nhẹ ảnh hưởng của lũ trong một lưu
vực sông. Ví dụ, dự báo chính xác mực nước sẽ làm cho việc quản lý các hồ chứa
hiệu quả hơn, từ đó cũng làm giảm thiểu nguy cơ lũ. Dự báo mực nước cũng cung
cấp các cảnh báo sớm về mức độ thiệt hại của lũ đối với đời sống cũng như tài sản
của người dân trong khu vực.
Nhìn chung, có ba hướng tiếp cập chính đối với việc dự báo lũ. Hướng tiếp cận
đầu tiên là dựa vào các mô hình vật lý, thứ hai là dựa vào cách tiếp cận thống kê và
thứ ba là dựa trên dữ liệu. Trong đó, hướng tiếp cận dựa trên các mô hình vật lý dựa
trên các công thức toán học về sự bảo toàn khối lượng, mô men và năng lượng. Chúng
được gọi chung là các mô hình thủy văn nếu chỉ xem xét bảo toàn khối lượng, và
được xem là mô hình thủy lực nếu như xem xét đến bảo toàn năng lượng. Hệ thống
phân tích thủy lực sông (Hydrologic Engineering Center’s River Analysis System)
phát triển bởi Mỹ (US Army Corps of Engineers) và phần mềm MIKE FLOOD phát
triển bởi Viện thủy lực Đan Mạch (Danish Hydraulic Institute) là các mô hình thủy
lực đã được sử dụng nhiều cho dự báo ngập lụt ở đồng bằng. Nhóm tác giả (Werner,
et al., 2006) đã tổng kết lại các mô hình thủy lực trong dự báo lũ. Ưu điểm của các
mô hình thủy lực đó là chúng biểu diễn được tính chất vật lý của hệ thống mà ta có
thể hiểu được. Những mô hình này cho phép trực quan hóa về lũ cả về mặt thời gian
và không gian và có thể mô hình hóa các quá trình vật lý như ảnh hưởng của lũ theo
các kịch bản vận hành khác nhau. Tuy nhiên, các mô hình thủy lực đòi hỏi một lượng
lớn dữ liệu để có thể mô tả đầy đủ về lưu vực và hệ thống sông vì sự đầy đủ ảnh
hưởng hưởng trực tiếp đến độ chính xác của mô hình dự báo. Trong khi trong nhiều
trường hợp, dữ liệu không đầy đủ và sẵn có. Thêm vào đó, việc hiệu chỉnh các mô
hình vật lý này đòi hỏi nhiều kinh nghiệm thực tiễn và thường cần nhiều thời gian để
tối ưu các tham số của mô hình. Trong hầu hết các trường hợp về dự báo lũ thời gian
thực, việc dự báo chính xác mực nước ở các vùng mục tiêu hoặc ở các trạm đo dọc
sông được quan tâm hơn là các quá trình thủy lực, thủy văn (Plate, 2007).
Bên cạnh việc sử dụng các mô hình thủy lực phục vụ việc dự báo mực nước và
lưu lượng tại các trạm đo hoặc vùng mục tiêu còn có hướng tiếp cận khác là các
phương pháp thống kê. Với hướng tiếp cận này đòi hỏi số liệu quan trắc của vùng
nghiên cứu phải đầy đủ và đủ dài. Ưu điểm của hướng tiếp cận này là quá trình phân
tích dự báo cho kết quả nhanh do quá trình này chỉ đơn thuần là phân tích trên cơ sở
dữ liệu lớn để đưa ra kết quả dự báo cho tương lai dựa trên các quan hệ này đã sảy
trong quá khứ.
Các hướng tiếp cận thống kê này bao gồm các phương pháp phân tích theo chuỗi
thời gian như mô hình trung bình trượt tự hồi quy (ARMA) hoặc mô hình ARMA với
các đầu vào ngoại suy, được giới thiêu bởi (Box and Jenkins, 1976). Các mô hình này
đã được sử dụng cho viêc dự báo mực nước và lưu lượng trên sông (Abrahart and
See, 2000). Tuy nhiên, những mô hình tự hồi quy tuyến tính này không biểu diễn tốt
được các tính chất động và phi tuyến ở mức độ cao trong quá trình lũ và do đó không
hoàn toàn phù hợp (Hsu, et al., 1995). Trong hai thập kỷ qua, các mô hình dựa trên
dữ liệu dựa trên các công cụ tính toán thông minh như mạng nơ ron nhân tạo (ANNs)
và các hệ thống suy luận mờ (FISs) đã được đưa vào sử dụng trong các ứng dụng mô
hình hóa thủy văn. Những công cụ thông minh này có thể học được các mối quan hệ
phi tuyến của các quá trình thủy lực, thủy văn. ANNs được phát minh dựa trên khả
năng học của người. Đó là một quá trình thay đổi các kết nối giữa các nơ ron trong
não người. Và do đó ANNs có thể học các cơ chế quan hệ cơ bản giữa đầu vào và
đầu ra (Dawson and Wilby, 1998). Trong khi đó, FIS là các mô hình định tính được
dựa trên khả năng suy luận của con người trong đó các hoạt động của hệ thống được
mô tả bằng ngôn ngữ tự nhiên (Takagi and Sugeno, 1985). Mô hình này hiện đang
được ứng dụng rộng rãi trong lình vực kỹ thuật tài nguyên nước (See and Openshaw,
1999; See and Openshaw, 2000; Xiong and O'connor, 2002). Gần đây, ANN và FIS
đã được tích hợp chung thành một hệ thông chung gọi là NFIS (neuro-FIS). Hệ thống
NFIS dựa trên mạng thích ứng được gọi là ANFIS được đề xuất bởi (Jang, 1993) là
một phiên bản nổi bật của NFIS. Năm 2005, (Nayak, et al., 2005) đã sử dụng ANFIS
để mô hình hóa quá trình mưa-dòng chảy của lưu vực Kolar (rộng 1350 km2) ở Ấn
độ cho dự báo lũ thời đoạn ngắn (16h). Kết quả của mô hình ANFIS đã cho thấy
tốt hơn so với các mô hình mạng nơ rơn và mờ hoạt động độc lập. Nhóm tác giả
(Chen, et al., 2006) đã phát triển mô hình ANFIS cho việc dự báo mực nước (dự báo
trước 13h) cho lưu vực sông Choshui (rộng 3157 km2) ở Đài Loan. Các tác giả đã
cho thấy rằng mô hình ANFIS tốt hơn mạng nơ ron nhân tạo lan truyền ngược thường
được sử dụng.
Thông thường, các mô hình theo chuỗi thời gian hồi quy tuyến tính như mô hình
tự hồi quy AR (Serban and Askew, 1991; Xiong and O'connor, 2002) hoặc ARMA
(Broersen, 2007) được sử dụng. Với mục đích này, AR hoặc ARMA được hiệu chỉnh
sau khi đã học (offline) sử dụng lỗi đầu ra và sau đó được sử dụng để dự đoán các lỗi
đầu ra của các mô hình dự đoán theo thời gian thực. Các lỗi dự đoán sau đó được
thêm vào các dự đoán ban đầu để đưa ra kết quả đầu ra mới của mô hình. Sự thành
công của quá trình cập nhật AR phụ thuộc chủ yếu vào mức độ tương quan trong lỗi
dự báo theo chuỗi thời gian của mô hình cơ sở (Shamseldin, 1997; Valença and
Ludermir, 2004). Trong các nghiên cứu mở rộng, (Shamseldin and O'CONNOR,
1999) đã sử dụng mô hình AR tuyến tính với đầu vào ngoại suy (ARX) để cập nhật
đầu ra. Trong thủ tục cập nhật của ARX, đầu ra chuỗi thời gian ban đầu được tạo bởi
mô hình cơ sở đóng góp cho các đầu vào ngoại suy, đầu vào này được sử dụng cùng
với các giá trị quan sát được sẵn có trong việc đưa ra kết quả dự báo cập nhật.
(Shamseldin and O'Connor, 2001) và (Shamseldin, 2010) đã sử dụng mô hình mạng
nơ ron, đây có thể được coi là dạng phi tuyến của mô hình ARX, thay cho ARX trong
việc cập nhật đầu ra.
Có rất nhiều các nghiên cứu dựa trên ANN trong việc mô hình hóa thủy văn dựa
trên dữ liệu, trong đó các nghiên cứu sử dụng NFIS cho mục đích này còn tương đối
ít (Maier, et al., 2010). Tuy nhiên, NFIS hứa hẹn là một công cụ hiệu quả bởi vì nó là
một hệ thống lai có được ưu điểm của cả ANN và FIS (Nayak, et al., 2005). Thêm
vào đó, các thủ tục cập nhật đầu ra đã được ứng dụng để cải thiện độ chính xác dự
báo trong nhiều nghiên cứu. Tuy nhiên, các mô hình cập nhật đầu ra đã áp dụng những
thủ tục này là chưa mang tính thích ứng. Điều này có nghĩa việc các tham số của mô
hình đã cập nhật là cố định sau khi đã hiệu chỉnh. Do đó, khi chúng được sử dụng
trong bài toán thời gian thực, các tham số này không thể tự điều chỉnh, thậm chí không
cải thiện được hiệu năng của mô hình.
Lãnh thổ Việt Nam trải dài trên 15 độ vĩ Bắc (từ 8 độ 30 phút đến 23 độ 20 phút)
và 7 độ kinh đông (từ 102 độ 10 phút đến 109 độ 20 phút) nên lũ lụt ở Việt Nam có
những đặc trưng riêng cho miền Bắc, cho miền Trung và cho miền Nam. Chiến lược
phòng tránh lũ lụt cho từng miền cũng khác nhau. Vùng đồng bằng Bắc Bộ và Bắc
Trung Bộ thực hiện phòng, chống lũ triệt để. Phương châm phòng, chống và giảm
nhẹ thiên tai cho vùng đồng bằng ven biển miền Trung và miền Đông Nam Bộ là
"Chủ động phòng, tránh, thích nghi để phát triển". Phương châm phòng, chống và
giảm nhẹ thiên tai cho vùng đồng bằng sông Cửu Long là “Sống chung với lũ” đảm
bảo an toàn để phát triển bền vững.
Đồng bằng Bắc Bộ là trung tâm chính trị, kinh tế, xã hội và văn hóa quan trọng
của nước ta. Trung tâm của đồng bằng Bắc bộ là thành phố Hà Nội, thủ đô của cả
nước với bề dày lịch sử hơn 1000 năm tuổi. Vì vậy, kiểm soát lũ lụt để bảo đảm an
toàn cho đồng bằng Bắc Bộ, an toàn tuyệt đối cho thủ đô Hà Nội, luôn được các cơ
quan liên quan quan tâm.
Đã có rất nhiều chương trình, dự án về phòng chống lũ ở đồng bằng Bắc bộ, đặc
biệt là các dự án điều hành hồ chứa trên thượng du. Có thể liệt kê sau đây một số
chương trình, dự án sau:
Chương trình Phòng chống lũ trên hệ thống sông Hồng của Bộ Nông nghiệp và
Phát triển Nông thôn 1999-2001. Trong dự án này đã tiến hành đo đạc một cách đồng
bộ mặt cắt trên các sông chính của hệ thống sông Hồng - sông Thái Bình.
Dự án "Quy trình vận hành liên hồ chứa trên sông Đà và sông Lô đảm bảo an
toàn chống lũ đồng bằng Bắc Bộ khi có các hồ Thác Bà, Hòa Bình, Tuyên Quang",
Chủ nhiệm dự án GS. TS. Nguyễn Tuấn Anh, Viện Khoa học Thủy lợi 2005-2006.
Dự án đã xây dựng "Quy trình vận hành liên hồ chứa thuỷ điện Hoà Bình, Tuyên
Quang, Thác Bà trong mùa lũ hàng năm". Qui trình đã được Chính phủ phê duyệt
(Quyết định số 80/2007/QĐ-TTg) và ban hành vào ngày 01/6/2007. Theo Quy trình
này các hồ chứa phải vận hành đảm bảo an toàn cho hạ du trong các trận lũ có tần
suất xuất hiện nhỏ hơn hoặc bằng 250 năm
Dự án "Quy trình vận hành liên hồ chứa trên sông Đà và sông Lô đảm bảo an
toàn chống lũ đồng bằng Bắc Bộ khi có các hồ Sơn La, Hòa Bình, Thác Bà và Tuyên
Quang", Chủ nhiệm dự án TS. Nguyễn Thái Lai, Bộ Tài nguyên và Môi trường 2009-
2010. Dự án đã xây dựng "Quy trình vận hành liên hồ chứa thuỷ điện Sơn La, Hoà
Bình, Thác Bà và Tuyên Quang trong mùa lũ hàng năm ". Qui trình đã được Chính
phủ phê duyệt (Quyết định số 198/QĐ-TTg) và ban hành vào ngày 10/02/2011. Theo
Quy trình này các hồ chứa phải vận hành đảm bảo an toàn cho hạ du trong các trận
lũ có tần suất xuất hiện nhỏ hơn hoặc bằng 500 năm.
Sông Đáy là một chi lưu chính của sông Hồng ở phía trên thủ đô Hà Nội. Lũ ở
sông Hồng được chuyển vào sông Đáy qua cụm công trình phân lũ gồm cống Hát
Môn, tràn Hát Môn và Đập Đáy để bảo vệ thủ đô Hà Nội. Theo Quyết định số
92/2007/QĐ-TTg phê duyệt Quy hoạch phòng, chống lũ hệ thống sông Hồng, sông
Thái Bình, ký ngày 21/6/2007, phân lũ là chuyển một phần lưu lượng lũ từ sông Hồng
vào sông Đáy qua cửa đập Đáy; chuyển một phần lưu lượng lũ từ sông Đà vào sông
Tích qua đoạn đê được chủ động phá vỡ bằng mìn tại Lương Phú. Phân lũ nhằm đảm
bảo an toàn cho hạ du. Với các trận lũ có tần suất xuất hiện nhỏ hơn hoặc bằng 200
năm. Với lưu lượng phân vào sông Đáy khoảng 3.200 m3/s, thì mực nước tại trạm
thủy văn Hà Nội không vượt quá 13,25 m.
Hiện nay nhiều hồ chứa lớn trên thượng du sông Hồng (trong đó có hồ Sơn La)
đã xây dựng xong và đi vào hoạt động các khu chậm lũ, trong đó có khu chậm lũ trên
sông Đáy đã được xóa bỏ (Quyết định số 1821/QĐ-TTg ngày 07/10/2014 Phê duyệt
Quy hoạch phòng, chống lũ và đê điều hệ thống sông Đáy). Theo Quyết định này khi
xảy ra lũ lớn cần phân vào sông Đáy tối đa 2.500 m3/s.
Vì sông Đáy có vai trò quan trọng trong phòng chống lũ trên hệ thống sông
Hồng, bảo đảm an toàn cho thủ đô Hà Nội, cho nên có rất nhiều đề tài nghiên cứu về
sử dụng tài nguyên nước trên sông Đáy. Có thể liệt kê ở đây một số đề tài sau:
Đề tài KC.08.12/06-10 “Nghiên cứu, đề xuất giải pháp, công trình khơi thông
dòng chảy, tăng khả năng chịu tải và tự làm sạch của các sông để bảo vệ môi trường
lưu vực sông Đáy, sông Nhuệ”. Chủ nhiệm đề tài: GS. TS Trần Đình Hợi. Cơ quan
chủ trì Viện Khoa học Thủy lợi Việt Nam. Thời gian thực hiện 2007-2010. Phạm vi
nghiên cứu của đề tài: lưu vực sông Đáy, sông Nhuệ. Đề tài đã đề xuất các giải pháp,
công trình khơi thông dòng chảy, tăng khả năng chịu tải và tự làm sạch của các sông
để bảo vệ môi trường sông Nhuệ, sông Đáy.
Đề tài KC.08.13/06-10 “Nghiên cứu cơ sở khoa học cho các giải pháp tổng thể
dự báo phòng tránh lũ lụt ở đồng bằng sông Hồng“ . Chủ nhiệm đề tài: GS. TSKH
Nguyễn Văn Điệp. Cơ quan chủ trì Viện Cơ học (Viện Hàn lâm Khoa học và Công
nghệ Việt Nam). Thời gian thực hiện 2007-2010. Phạm vi nghiên cứu của đề tài: Hệ
thống sông Hồng - sông Thái Bình. Trong mô hình thủy lực của đề tài này, phần sông
Đáy được mô tả chi tiết gồm sông Đáy, cụm công trình phân lũ, các phụ lưu sông
Tích - sông Bùi, sông Hoàng Long và các ô phân chậm lũ.
Đề tài độc lập cấp nhà nước “Nghiên cứu cơ sở khoa học cho việc xóa các khu
chậm lũ sông Hồng, sông Đáy và sông Hoàng Long”. Chủ nhiệm đề tài: GS.TS Hà
Văn Khối. Cơ quan chủ trì: Trường Đại học Thủy lợi. Thời gian thực hiện: 2008-
2009. Đề tài đã nghiên cứu một số giải pháp làm cơ sở khoa học cho việc xóa các khu
chậm lũ, trong đó giải pháp nâng cao hiệu quả cắt lũ của hồ chứa Hòa Bình - Sơn La,
phân lũ vào sông Đáy kết hợp với cải tạo lòng dẫn sông Đáy, sông Hoàng Long và
tạo dòng chảy thường xuyên cho dòng sông Đáy.
Nhiều nghiên cứu về thủy văn, thủy lực cho lưu vực sông Đáy đã được công bố.
Trong các nghiên cứu này, nhiều phần mềm thủy văn, thủy lực đã được áp dụng và
cho các kết quả tốt.
Sông Tích - sông Bùi là một phụ lưu chính của sông Đáy. Sông Tích - sông Bùi
Bắt nguồn từ núi Tản Viên thuộc dãy núi Ba Vì theo hướng Tây Bắc - Đông Nam có
chiều dài 110 km đổ vào sông Đáy tại Ba Thá. Diện tích lưu vực 1350 km2, phần
phía bờ phải có diện tích 960 km2, phần phía bờ trái có diện tích 390 km2. Lưu vực
dài 75,5 km rộng 17,6 km, độ cao trung bình lưu vực 92 m, độ dốc trung bình lưu
vực 5,8%, mật độ lưới sông 0,66 km/km2. Sông Tích chảy qua nhiều vùng đồi, đất
cứng sức xói yếu. Tuy độ dốc của lòng sông Tích không lớn nhưng độ dốc của các
sông nhánh khá lớn, trung bình 10 ÷ 20 m/km, có suối tới 30 m/km (hình 1).
Ngoài các nghiên cứu kể trên thì hiện nay trên lưu vực sông Tích-sông Bùi cũng
đang triển khai một hệ thống thủy lợi lớn có tên gọi là “Dự án đầu tư tiếp nước, cải
tạo, khôi phục sông Tích”. Dự án cải tạo sông Tích là dự án nhóm A, có quy mô lớn,
phục vụ đa mục tiêu, thời gian thực hiện kéo dài, tổng mức đầu tư lớn, địa bàn triển
khai thực hiện dự án rộng, tính phức tạp cao, có tổng chiều dài trên 110km đi qua 07
huyện và Thị xã của thành Phố Hà Nội. Vì vậy để tạo điều kiện thuận lợi cho công
tác điều hành hoạt động của Ban nhằm thực hiện tốt nhiệm vụ được giao. Ngày
17/6/2011 UBND thành phố Hà Nội ra Quyết định số 2774/QĐ-UBND về việc thành
lập Ban quản lý dự án sông Tích Hà Nội thuộc Sở Nông nghiệp &PNT Hà Nội trên
cơ sở kiện toàn Ban Quản lý dự án đầu tư tiếp nước, cải tạo khôi phục sông Tích từ
Lương Phú, xã Thuần Mỹ, huyện Ba Vì, thành phố Hà Nội. Hệ thống thủy lợi của
Lưu vực song Tích-sông Bùi khá phức tạp do vừa phải đảm bảo việc tưới tiêu lại
phải đảm bảo chống lũ cho khu vực nội Hà Nội. Dự án lại đang trong giai đoạn triển
khai do vậy các số liệu về triển tiến độ công việc đã hoàn thành đến đâu cần phải
được cập nhật liên tục để tránh tình trạng ảnh hưởng của quá trình xây dựng đến việc
phòng chống lũ lụt trên lực vực này.
Tuy lưu vực sông Đáy đã được nghiên cứu nhiều, nhưng phụ lưu sông Tích -
sông Bùi chưa được quan tâm một cách đầy đủ. Một trong những lý do là tỷ lệ đóng
góp tổng lượng lũ cho sông Đáy của sông Tích - sông Bùi thường dduwwocj cho là
tương đối nhỏ.
Sau khi thủ đô Hà Nội được mở rộng, lưu vực sông Tích - sông Bùi là khu vực
hành chính của thành phố Hà Nội. Kinh tế, xã hội ở khu vực này đang thay đổi và
phát triển rất mạnh. Vì vậy, nguồn nước trên lưu vực sông Tích - sông Bùi cần được
bổ sung và bảo vệ phục vụ cho phát triển bền vững. Ngày 18/04/2015 trong chuyến
đi thị sát hiện trạng và các dự án chỉnh trị, giải pháp làm “hồi sinh” các đoạn tuyến
sông phía Nam và Tây Hà Nội, Phó Thủ tướng Hoàng Trung Hải đã có các đánh giá,
chỉ đạo đối với các dự án, giải pháp quan trọng trong bài toán cân bằng nước đối với
Hà Nội. Chính phủ sẽ sớm có các yêu cầu cụ thể đối với vấn đề này, và tinh thần
chính là đôn đốc sớm có nghiên cứu tổng thể, giải pháp hiệu quả và nhất là kết quả
triển khai cụ thể các giải pháp chỉnh trị các con sông trên địa bàn thủ đô, đảm bảo cân
bằng nước trên toàn hệ thống. Việc dự báo lũ sớm và cảnh báo ngập lụt cho lưu vực
sông Tích - sông Bùi là một vấn đề cấp bách nhằm hạn chế thiệt hại do thiên tai lũ lụt
có thể gây ra trong điều kiện phát triển mạnh mẽ của lưu vực.
Sông Tích - sông Bùi ở trên thượng du của sông Đáy, cần xây dựng mô hình
thủy văn, thủy lực chi tiết cho lưu vực này để có được thông tin tốt hơn trong nghiên
cứu và quản lý nguồn nước của sông Đáy. Bên cạnh các mô hình thủy văn và thủy
lực, việc xây dựng các mô hình học máy thống kê để có thể khai thác hiệu quả cơ sở
dữ liệu của lưu vực phục vụ công tác dự báo, cảnh báo lũ lụt trên lưu vực sông này là
cần thiết.
PHẦN 1
TỔNG QUAN VỀ SÔNG TÍCH BÙI VÀ GIẢI PHÁP
ĐỀ XUẤT CỦA ĐỀ TÀI
Chương 1
Khu vực tả sông Tích-Bùi: hầu hết là đồng bằng và bãi sông chạy dọc theo chiều
dài sông Tích, thế dốc từ sông Hồng, sông Đáy vào sông Tích và dốc dần từ
thượng nguồn về cửa ra của sông tại Ba Thá, cao độ đất đai biến đổi từ 11-13m
thuộc Ba Vì đến 2-3m thuộc Chương Mỹ. Khu vực từ đường Quốc lộ 6 trở lên
đã được bao đê chống lũ, từ dưới đường quốc lộ 6 xuống đến Ba Thá chỉ có đê
bao địa phương do dân trong vùng tự đắp để chống lũ nội tại của sông Tích-Bùi
và sông Đáy, đây là khu vực trũng và là khu chậm lũ khi có phân lũ từ sông
Hồng vào sông Đáy.
Mùa mưa ở đây bắt đầu từ tháng V đến tháng X. Lượng mưa trung bình nhiều năm
khỏang 1900mm, dao động từ 1500 đến 2200mm. Trong lưu vực có tâm mưa lớn
thuộc vùng núi Ba Vì, với lượng mưa trung bình nhiều năm là 2500mm. Đã có một
số trận mưa với cường độ lớn xẩy ra trên lưu vực, như: trận mưa ngày 24/7-1980 tại
Quảng Oai, lượng mưa một ngày lớn nhất đạt tới 724mm, ngày 2/9-1975 tại Minh
Quang (Ba Vì): 701mm. Lượng mưa trong mùa mưa chiếm tới 80-85% lượng mưa
cả năm. Mùa ít mưa bắt đầu từ tháng XI đến cuối tháng IV, lượng mưa chỉ chiếm 15-
20% và mưa ít nhất là vào tháng I và tháng II. Mưa lớn nhất thường tập trung vào 3
tháng VII, IX, X. Lượng mưa 3 tháng này thường chiếm từ 50-55% lượng mưa cả
năm. Lượng bốc hơi trung bình nhiều năm trong lưư vực thay đổi từ 700 đến
1000mm/năm. Lượng bốc hơi lớn nhất vào các tháng mùa hè, do độ ẩm và nhiệt độ
không khí cao. Khả năng bốc hơi thấp nhất vào các tháng I và tháng II trong năm.
Chế độ thủy văn:
Chế độ thuỷ văn lưu vực sông Tích-Bùi cũng trên nền chế độ thuỷ văn vùng
đồng bằng Bắc Bộ. Mùa lũ thường bắt đầu từ tháng VI,VII và kết thúc vào tháng
X,XI. Lượng dòng chảy mùa lũ thường chiếm từ 75-85% lượng dòng chảy năm.
Tháng có dòng chảy lớn nhất là tháng VII hoặc tháng IX và tháng II là tháng thường
có lượng dòng chảy nhỏ nhất trong năm.
Xét về quan hệ mưa lũ trên hai lưu vực sông Hồng và sông Tích-Bùi cho thấy:
mùa lũ cùng trong thời gian từ tháng VI đến tháng X và mùa mưa từ tháng V đến
tháng X. Song tháng có dòng chảy lớn nhất trên sông Hồng là tháng VIII, nhưng trên
sông Tích-Bùi lại là tháng VII và tháng IX. Tháng VIII trên lưu vực sông Hồng
thường sẩy ra những trận lũ đặc biệt lớn do các hoạt động của các hình thái thời tiết
gây ra trong mùa mưa lũ. Với lưu vực sông Tích-Bùi, vào tháng IX thường có nhiều
bão trực tiếp ảnh hưởng tới vùng núi Hoà Bình và Ba Vì (Hà Nội) gây mưa lớn trên
lưu vực sông này. Lượng mưa bão trong tháng IX ở lưu vực sông Tích-Bùi thường
lớn gấp hơn hai lần so với tháng VIII. Vào tháng VII do dông bão tạo nên tâm mưa
Ba Vì và Hoà Bình, vì vậy cũng thường gây ra mưa lớn trên lưu vực sông Tích-Bùi.
Đối với những trận lũ lớn ở trên hai lưu vực cùng do một trận bão gây nên thì
lũ trên sông Hồng (tại Sơn Tây) thường xuất hiện sau lũ sông Tích-Bùi (tại Ba Thá)
từ 3 đến 5 ngày. Nguyên nhân là do hướng di chuyển của bão từ biển vào lục địa và
thời gian chuyền lũ trên hai sông chênh nhau rất lớn. Và còn do những trận lũ đặc
biệt lớn xẩy ra trên sông Hồng gây nên bởi các hình thái thời tiết phối hợp hoạt động,
cũng lệch pha với lũ lớn xuất hiện trên sông Tích-Bùi. Như vậy trong mọi nguyên
nhân gây nên lũ lớn thì lũ sông Hồng (tại Sơn Tây) và lũ sông Tích-Bùi đều xuất hiện
lệch pha nhau. Vì vậy, khi phân lũ vào sông Tích-Bùi và sông Đáy từ sông Hồng, hầu
như ít gặp lũ nội đồng trong lưu vực hệ thống sông này.
Ghi chú:
- T: Nhiệt độ không khí (0C)
- S: Số giờ nắng (giờ)
- U: Độ ẩm không khí (%)
- V: Tốc độ gió (m/s)
- Đoạn 1: Từ cống Lương Phú (lấy nước từ sông Đà) đến Đường Lâm (Sơn Tây).
Với đoạn này hầu như là đào đắp để tạo hình lòng dẫn cho sông và xây dựng
công trình đầu mối tiếp nước từ sông Đà (cống Lương Phú)
- Đoạn 2: Từ Đường lâm đến Cầu Trắng (hết địa phận thị xã Sơn Tây). Đoạn này
chủ yếu nạo vét mở rộng lòng dẫn sông Tích và xây dựng các cầu cống.
- Đoạn 3: Từ Cầu Trắng đến Ba Thá. Đoạn này do lòng dẫn hiện tại của sông khá
rộng nên chủ yếu là nạo vét lòng dẫn chính của sông Tích-Bùi để đảm bảo độ
dốc đều của lòng dẫn và thoát lũ.
Hiện nay mới chỉ có đoạn 1 của dự án đang được thi công còn các đoạn 2 và
đoạn 3 chưa tiến hành. Trong khi đó đoạn một cũng chưa thông tuyến do còn vướng
mắc một số cầu cống và đường bắc ngang. Chính vì vậy việc thoát nước lũ của sông
Tích-Bùi vẫn chưa có sự cải thiện nào từ dự án cải tạo này.
3. Tính hình lũ lụt của lưu vực sông Tích-Bùi
Trong những năm gần đây do ảnh hưởng của tình trạng biến đổi khí hậu toàn
cầu nên diễn biến của lũ lụt trên lưu vực sông Tích-Bùi cũng có những dấu hiệu cực
đoan và gia tăng. Tiêu biểu có thể thấy trong hai năm liên tiếp là 2017 và 2018 đều
sảy ra lũ lớn gây ngập lụt diện rộng trên lưu vực sông này.
Hình 1.2: Đoạn đê bị sạt gây tình trạng ngập lụt năm 2017 (nguồn VOV)
Năm 2017 tình trạng ngập lụt do một đoạn đên bị sạt vì nước tràn qua mặt đê.
Theo báo cáo của Chủ tịch UBND huyện Chương Mỹ Đinh Mạnh Hùng, mưa lớn đã
làm ngập khoảng 92ha lúa mùa chưa kịp thu hoạch; khoảng 842,4ha cây vụ Đông bị
hư hỏng; diện tích cây ăn quả bị ngập khoảng 63,8ha; diện tích thủy sản bị ngập
khoảng 125ha. Trên địa bàn huyện, mưa lũ đã làm chết 178 con gia súc, 9.700 con
gia cầm. Đặc biệt, có 9.900 mét đê bị ngập, bao gồm các địa bàn: Thị trấn Xuân Mai
và các xã: Thủy Xuân Tiên, Tân Tiến, Nam Phương Tiến, Mỹ Lương, Hoàng Văn
Thụ, Tốt Động, Thanh Bình và Đông Sơn… Như vậy có thể thấy ngập lụt năm 2017
là do lượng nước trong sông bị tràn ra và nguồn nước lũ được hình thành từ thượng
nguồn (phía núi Ba Vì đổ về).
Còn năm 2018, do mưa to cả phần thượng nguồn sông Tích (núi Ba Vì) và phần
thượng nguồn sông Bùi (phía Hòa Bình) nên tình trạng ngập lụt đã trở nên rất nặng
nề và kéo dài trong nhiều ngày.
Hình 1.3: Khu vực hữu sông Bùi (của sông Tích-Bùi) ngập diện rộng, đê hữu bị
nằm dưới mực nước lũ (nguồn: internet)
Theo thống kê của thành phố Hà Nội thì diện tích ngập là khá lớn: Tổng diện
tích là 2.006ha sản xuất nông nghiệp bị úng ngập; trong đó, các huyện còn nhiều diện
tích là Chương Mỹ (714ha), Quốc Oai (481ha), Ba Vì (466ha), Sơn Tây (133ha),
Thạch Thất (132ha). Trong khi đó đê tả của sông Tích-Bùi có nhiều đoàn bị tràn (phải
đắp bao cát để nâng cao độ đê) với độ chênh mực nước sông với mặt đê khá lớn.
Nhiều khu vực ngập ghi nhận độ sâu ngập đến hơn 3m.
Do ảnh hưởng của hai trận mưa cách nhau khoảng gần 10 ngày làm cho tình
trạng ngập úng năm 2018 đã kéo dài nhiều ngày gây thiệt hại về kinh tế và ảnh hưởng
nghiêm trọng đến môi trường sống của người dân huyện Chương Mỹ. Nhiều tuyến
giao thông đi qua khu vực này cũng bị gián đoạn nhiều ngày.
Hình 1.4: Đê tả sông Tích-Bùi được gia cố bằng bao cát để chống bị nước tràn
trong trận lũ năm 2018
Có thể thấy tình trạng lũ lụt của lưu vực sông Tích-Bùi đã đến mức nguy hiểm
và cần có các giải pháp về lâu dài để giải quyết vấn đề này. Tuy nhiên, do đặc thù của
khu vực này có nền địa hình thấp chỉ khoảng 3m đến 6m thấp hơn mực nước sông
trong mùa lũ. Hơn thế khu vực Ba Tha có thiết diện lòng sông hẹp lại bị ảnh hưởng
của thủy triều nên khả năng thoát nước chậm.
Để có được giải pháp dài hạn và toàn diện cho bài toán lũ lụt sông Tích-Bùi thì
cần rất nhiều thời gian và kinh phí. Chính vì vậy trước mắt để hạn chế các thiệt hại
do lũ lụt gây ra cũng như hỗ trợ công tác ứng phó sớm với lũ lụt ở khu vực này thì rất
cần các dự báo có độ chính xác cao và sớm tình trạng lũ lụt của khu vực này. Và mục
tiêu của đề tài này cũng nhằm góp phần nhỏ để giải quyết vấn đề đó.
Chương 2
thành từ mưa trên lưu vực và các dòng chảy vào lưu vực (tại khu vực lấy nước trên
sông Đà) và các dòng chảy ra khỏi lưu vực (đổ vào sông Đáy). Mô hình tính toán số
này gồm ba phần chính là:
- Mô hình thủy văn
- Mô hình thủy lực kết nối hệ thống ô chứa (thủy lực một chiều giả hai chiều)
- Mô hình điều khiển dòng chảy qua công trình và các mô đun giao diện, phụ
trợ, …
Mô hình thủy văn phân bố Marine là mô hình phù hợp cho việc thu gom nước mưa
trên phần lưu vực có độ dốc cao và tập trung vào các nhánh sông suối.
Mô hình Thủy lực 1D mở rộng IMech1D sẽ được sử dụng để diễn toán dòng chảy
trong hệ thống sông suối và kênh mương thủy lợi trên lưu vực nghiên cứu. Khu vực
đồng bằng sẽ được phân chia thành hệ thống các ô chứa và kết nối với với mô hình
thủy lực thông qua các công trình như đập tràn, cống, …
Việc điều hành dòng chảy qua các công trình cũng như điều hành các hồ chứa
trong lưu vực sẽ được xử lý trong các mô đun phụ trợ.
Bên cạnh đó để khắc phục tình trạng một số khu vực thiếu số liệu phục vụ việc
tính toán bằng mô hình vật lý nêu trên thì cần thiết phải có các công cụ khác cho phép
dự báo, cảnh báo lũ lụt dựa trên các kinh nghiệm đúc rút được. Đó chính là các mô
hình học máy (Machine Learning). Trong nghiên cứu này, chúng tôi sẽ khảo sát các
phương pháp học máy tiên tiến như ANN, máy véc-tơ hỗ trợ, rừng ngẫu nhiên,
boosting, .. cho bài toán dự báo với dữ liệu theo chuỗi thời gian. Sau đó chúng tôi sẽ
thử nghiệm từng phương pháp cho bài toán dự báo lũ theo các kịch bản khác nhau.
Từ đó, chúng tôi sẽ lựa chọn được mô hình học máy phù hợp nhất với bài toán. Chúng
tôi cũng sẽ phát triển một mô đun phần mềm dựa trên các mô hình đã được lựa chọn.
Kết quả của mô hình được lựa chọn sẽ được so sánh với các kết quả khác để đảm bảo
sự tin cậy của mô hình được chúng tôi phát triển trong khuôn khổ đề tài nghiên cứu
này.
2. Giải pháp đề xuất của đề tài
Để thực hiện các mục tiêu đề ra của đề tài. Nhóm nghiên cứu đã đề xuất một
giải pháp là xây dựng công cụ (phần mềm chuyên dụng) hỗ trợ công tác dự báo và
cảnh báo lũ lụt trên lưu vực sông Tích-Bùi phù hợp với điều kiện số liệu hiện có và
đáp ứng được yêu cầu là cảnh báo và dự báo sớm 6h, 12h, 18h và 24h tình trạng lũ
lụt trên lưu vực sông này.
Để có thể dự báo được trước tình trạng lũ lụt trên lưu vực sông này chúng tôi
đề xuất hai gải pháp. Trong đó một giải pháp chính và một giải pháp thử nghiệm.
Hình 2.1 dưới đây là sơ đồ các thành phần chính của giải pháp mà đề tài đề xuất.
Giải pháp chính là sử dụng các mô hình tính toán dựa trên các mô hình vật lý đó
là sự kết hợp giữa mô hình Thủy văn phân bố và mô hình thủy lực một chiều mở rộng.
Đây là hai mô hình đã và đang được Viện Cơ học nghiên cứu và phát triển. Các mô
hình này cũng đã được cộng đồng khoa học trong nước và ngoài nước đánh giá cao.
MÔ HÌNH THỦY
MÔ HÌNH
VĂN
HỌC MÁY
(thu gom nước mưa
trên lưu vực và tập (sử dụng số
trung ra đầu /ven các liệu mưa và
số liệu mực
sông suối)
nước tại Ba
Thá
CƠ SỞ
DỮ LIỆU
MÔ HÌNH THỦY
LỰC
(nhận nước từ mô hình
thủy văn và diễn toán
dòng chảy trong sông từ
thượng lưu đến hạ lưu)
Mô hình thứ hai được sử dụng đó là mô hình học máy. Đây là một mô hình mới
trong dự báo thủy văn thủy lực sử dụng các tiến bộ trong lĩnh vực tin học đó là trí tuệ
nhân tạo (AI). Chính vì là mô hình mới tronh lĩnh vực dự báo thủy văn thủy lực ở
Việt Nam nên nhóm nghiên cứu cũng muốn được đưa vào thử nghiệm đối với hệ
thống sông Tích-Bùi.
Theo sơ đồ giải pháp (Hình 2.1) thì thành phần tính toán chính của công cụ được
xây dựng gồm ba phần mềm tính toán số đó là:
- Mô hình thủy văn
- Mô hình thủy lực
- Mô hình học máy
Ngoài ba phần mềm tính toán chính thì còn một phần mềm quản lý cơ sở dữ
liệu phục vụ cho việc truy vấn sử dụng một số dữ liệu được thu thập, xử lý trong
khuôn khổ đề tài. Cơ sở dữ liệu này cũng được kết nối trực tiếp với các chương trình
tính toán để tính các kịch bản được thiết lập trên cơ sở các số liệu lũ lịch sử.
Để để kết nối các mô này thành một công cụ tiện lợi thì còn nhiều mô đun khác
được xây dựng và tích hợp vào như:
- Quản lý dữ liệu
- Trình diễn kết quả
- Giao diện GIS
- Dòng chảy qua các công trình
Bên cạnh việc xây dựng các mô đun thì nhóm nghiên cứu còn ứng dụng kỹ thuật
tính toán song song để nâng cao hiệu quả sử dụng tài nguyên của thiết bị đồng thời
làm giảm thời gian tính toán nhằm đưa ra kết quả cảnh báo và dự báo một cách nhanh
nhất có thể.
3. Phương pháp nghiên cứu
Để thực hiện mục tiêu và các nhiệm vụ đã đặt ra của đề tài. Nhóm nghiên cứu
thực hiện đề tài sẽ sử dụng một số phương pháp sau đây kết hợp để thực hiện:
- Phương pháp mô hình hóa: Mô hình hóa sự vận động của nước trên bề mặt lưu
vực thành các mô hình toán lý để giải.
- Phương pháp mô phỏng: Mô phỏng lại các quá trình mưa lũ để thấy được bức
tranh toàn cảnh và rõ ràng của sự vật hiện tượng cần nghiên cứu
- Phương pháp thống kê
- Phương pháp tổng hợp và phân tích
Chương 3
Hình 3.1: Bản đồ địa hình được thu thập ban đầu
Khi sử dụng bản đồ DEM được xây dựng như đã nói ở trên thì mô hình thủy
văn vẫn tính toán tốt. Nhưng nhóm nghiên cứu gặp khó khăn trong việc xử lý số liệu
ô chứa ở khu vực đồng bằng. Chính vì vậy nhóm nghiên cứu đã mua bản đồ số DEM
với độ phân giải 30x30 của toàn bộ khu vực nghiên cứu của Trung tâm thông tin bản
đồ, Bộ Tài nguyên và Môi trường. Bản đồ DEM mới có chất lượng khá tốt, phản ánh
khá trung thực các phần địa hình trên thực tế.
Hình 3.2: Bản đồ địa hình DEM mới có độ phân giải 30x30
Ngoài việc thu thập bản đồ địa hình lưu vực, nhóm nghiên cứu cũng thu thập thêm
nhiều thông tin khác liên quan đến địa mạo và đặc điểm của lưu vực phục vụ cho việc
xử lý số liệu đầu vào cho mô hình tính toán. Ví dụ như các thông tin về một số tiểu
lưu vực bộ phận của khu vực nghiên cứu trong Bảng 3.1 dưới đây:
2. Thu thập bản đồ hiện trạng sử dụng đất và bản đồ phân loại đất
Bản đồ hiện trạng sử dụng đất và bản đồ phân loại đất được thu thập phục vụ
tính toán trong khuôn khổ đề tài nghiên cứu này là:
- Bản đồ hiện trạng sử dụng đất được cung cấp bởi Viện khoa học Khí tượng
Thủy văn và Biến đổi khí hậu. Đây là bản đồ có tỷ lệ 1:50 000
- Bản đồ phân loại đất được cung cấp bởi Viện nghiên cứu Nông hóa thổ nhưỡng
có tỷ lệ 1:50 000
Các mặt cắt sông Tích-Bùi đã được nhóm nghiên cứu đi đo đạc bổ sung trong
thời gian thực hiện đề tài bằng nguồn kinh phí tự có của cơ quan. Còn mặt cắt sông
Đáy cũng được đo đạc bổ sung trong khuôn khổ một đề tài nghiên cứu khác do Viện
Công nghệ môi trường thuộc Viện Hàn lâm Khoa học và Công nghệ Việt Nam chủ
trì thực hiện.
4. Thu thập dữ liệu khí tượng thủy văn và các công trình ven sông
Để phục vụ tính toán của mô hình số và đảm bảo các dữ liệu có đầy đủ đáp ứng
được yêu cầu sử dụng trong cảnh báo dự báo theo thời gian thực nhóm nghiên cứu đã
lựa chọn các trạm đo khí tượng và thủy văn thuộc mạng lưới quan trắc quốc gia được
cập nhật phục vụ dự báo lũ trên hệ thống dữ liệu quốc gia.
Cụ thể về trạm đo mưa (khí tượng), nhóm nhiên cứu thu thập số liệu của 8 trạm
đo mưa liên quan đến lưu vực bao gồm:
- Trạm Hòa Bình
- Trạm Ba Vì
- Trạm Ba Thá
- Trạm Trung Hà
- Trạm Việt Trì
- Tràm Hoài Đức
- Trạm Sơn Tây (khí tượng)
- Trạm Sơn Tây (thủy văn) .
Hình 3.9: Số liệu mực nước của trạm thủy văn Ba Thá
Về mực nước (thủy văn) nhóm nghiên cứu thu thập số liệu của hai trạm trong
lưu vực là:
- Trạm Ba Thá
- Trạm Phủ Lý
Các số liệu được thu thập đồng bộ trong mùa lũ (từ 15/06 đến 30/09, một số
năm đến 31/10) của các năm 2014, 2015, 2016, 2017 và 2018
Số liệu về các công trình thủy lợi ven sông cũng đã được nhóm nghiên cứu thu
thập như các trạm bơm, các cống kết nối với sông.
PHẦN 2
CÁC MÔ HÌNH TÍNH TOÁN SỐ
Chương 4
Với chất lỏng không nén được ta có div (u) 0 , sử dụng công thức Green-
Ostrogradski
div(m.u).dS m.u.n.d
S
V
Từ (1) suy ra : t .dS V.u.n.d P
S S
0 (4.2)
Vận tốc của dòng chảy trao đổi giữa các ô được tính theo công thức:
H2/3
u pente . (4.3)
Km
Vì lưới sử dụng để tính toán là lưới vuông (DEM) nên thay biểu thức vận tốc vào
phương trình tích phân ta thu được:
4 H5j / 3 t
H . pente . P0 .t (4.4)
j1 Km x
Trong đó: F(t) là độ sâu luỹ tích của nước thấm vào trong đất
: Cột nước mao dẫn của mặt ướt
= -i với là độ rỗng của đất , i là độ ẩm của đất
k: Độ dẫn thuỷ lực
Phương trình (4.5) là phương trình phi tuyến, ta có thể giải bằng phương pháp
thay thế liên tiếp, hoặc phương pháp lặp Newton. Trong trường hợp độ sâu lớp nước
đọng ho không thể bỏ qua ta phải thay thế bằng giá trị - ho trước khi giải. Sau khi
tìm được độ sâu thấm tích lũy tiềm năng F(t) ta xác định được tốc độ thấm tiềm năng
f k( 1) (4.6)
F
Theo định luật Darcy ta xác định được lưu lượng thấm của mỗi ô lưới sẽ là:
qthấm = f*dx*dx
Trước khi sinh nước đọng (t < tp) cường độ mưa nhỏ hơn tốc độ thấm tiềm năng
và mặt đất chưa bão hòa. Quá trình nước đọng trên mặt đất bắt đầu xảy ra khi cường
độ mưa vượt quá cường độ thấm tiềm năng (t = tp) lúc đó đất ở trạng thái bão hòa.
Khi quá trình mưa tiếp tục (t > tp), vùng bão hòa trên mặt đất lan dần xuống tầng đất
sâu hơn và dòng chảy trên mặt đất bắt đầu xuất hiện từ lượng nước đọng.
P0 (mưa)
Quá trình Q~t tại cửa ra của lưu Dòng chảy sát mặt
vực hoặc nút đăng ký tại ô lưới
Nước đọng xuất hiện khi tốc độ thấm tiềm năng nhỏ hơn hoặc bằng cường
độ mưa i (t > tp).
Khi t = tp, lượng thấm tích lũy tại thời điểm sinh nước đọng tp được tính bởi
công thức: Fp = i*tp nên f = i
Thay vào (6) có: i k ( 1) dẫn tới t p k (4.7)
it p i(i K )
Sau khi có nước đọng, lượng thấm tích lũy được tính theo công thức:
F
F F p ln( ) k (t t p ) (4.8)
F p
Như vậy, tại mỗi bước thời gian mô đun thấm cho ta lưu lương thấm qthấm của
mỗi ô chứa. Với trường hợp tính toán MARINE có sử dụng mô đun thấm tại mỗi
bước thời gian tổng lưu lượng trao đổi của mỗi ô bao gồm lưu lượng nhận từ mưa,
lưu lương chảy vào, lưu lượng chảy ra và lưu lượng thấm: Q=H*dx*dx - qthấm
Hình 4.3: Xác định lưu vực hứng nước của sông Tích-Bùi từ DEM
Hình 4.4: Mô hình số độ cao của lưu vực đưa vào tính trong mô hình thủy văn
Các khu vực có rừng rậm sẽ có độ nhám lớn và khả năng giữ nước của lưu vực
tốt. Các khu vực này sẽ làm chậm quá trình hình thành dòng chảy làm hạn chế khả
năng phát sinh lũ cực đoan.
Hình 4.5: Bản đồ hiện trạng sử dụng đất của thành phố Hà Nội
Với mỗi hiện trạng sử dụng đất trên bề mặt lưu vực sẽ có những đặc trưng riêng,
các đặc trưng này lại có các mức độ ảnh hưởng đến độ nhám của bề mặt lưu vực khác
nhau. Có nhiều loại hiện trạng sử dụng đất, dưới đây là một số hiện trạng thường gặp
ở Việt Nam:
1. Đồng cỏ.
2. Lúa
3. Hoa màu.
4. Cây bụi rải rác.
5. Cây thân gỗ trồng không thành rừng.
6. Cây bụi trồng không thành rừng.
7. Cây bụi trồng thành rừng.
8. Cây bụi xen lẫn cỏ.
9. Rừng cây bụi.
10. Rừng thưa xen lẫn rừng cây bụi.
11. Rừng thưa.
12. Rừng già cây lá rộng, lá kim, tre nứa
13. Rừng nguyên sinh gồm nhiều tầng cây đan sen dầy đặc.
14. Núi đá.
15. Đất trống đồi núi trọc
chính vì vậy cần phải hiệu chỉnh các tham số để tìm ra bộ tham số tương ứng với các
lớp đất sao cho bộ tham số đó là giá trị trung bình của lớp đất.
Hình 3.6: Bản đồ phân loại đất của thành phố Hà Nội
Mức độ tổn thất của dòng chảy chính là kết quả tính toán của mô đun thấm. Quá
trình thấm trực tiếp ảnh hưởng đến giá trị của lưu lượng đầu ra của mô hình. Ngoài
ra diễn biến của quá trình thấm còn làm ảnh hưởng đến thời gian đạt đỉnh của các trận
lũ tính toán. Chính vì vậy cần phải điều chỉnh mô đun thấm sao cho lượng nước tổn
thất hợp lý với thực tế.
Bảng 4.1 là bảng giá trị và phạm vi giá trị của 4 thông số của một số loại đất cơ
bản đã được xác định bằng phương pháp đo đạc trực tiếp:
Bảng 4.1: Các giá trị của bốn thông số chính của một số loại đất
Hình 4.7: Bản đồ phân vùng ảnh hưởng của các trạm mưa
Phân vùng ảnh hưởng của các trạm mưa đưa vào tính trong mô hình thủy văn
được xác định theo phương pháp đa giác Thiessen như trong Hình 3.7 trên đây.
3. Kiểm tra độ nhạy của các tham số trong mô hình
3.1. Thử độ nhạy của mô hình với các tham số của bản đồ hiện trạng sử dụng đất
Để đánh giá mức độ ảnh hưởng và độ nhạy của hệ số nhám đến kết quả tính của
mô hình thủy văn Marine, xét ba kịch bản tính toán sau:
- Kịch bản hệ số nhám thực của lưu vực.
- Hệ số nhám của lưu vực được cho rất nhỏ trên toàn lưu vực.
- Hệ số nhám của lưu vực được cho rất lớn trên toàn lưu vực.
8,500.00
Nham TB
8,000.00
Nham Be
7,500.00 Nham Lon
7,000.00
6,500.00
6,000.00
5,500.00
Lưu lượng (m3)
5,000.00
4,500.00
4,000.00
3,500.00
3,000.00
2,500.00
2,000.00
1,500.00
1,000.00
500.00
0.00
75 85 95 105 115 125 135 145 155 165 175 185 195 205 215 225 235 245 255 265
Thời gian (giờ)
Hình 4.8: Thử độ nhạy với các tham số của bản đồ thảm phủ
Từ các kết quả tính toán của ba phương án (Hình 3.8) cho thấy: Hệ số nhám có
ảnh hưởng lớn đến kết quả tính toán của mô hình, nhưng ảnh hưởng của hệ số nhám
đến mô hình chủ yếu là về tốc độ dòng chảy tức là về pha của dòng chảy, còn về giá
trị của lưu lượng tính toán có chịu ảnh hưởng của sự biến đổi độ nhám nhưng không
lớn lắm. Như vậy để hiệu chỉnh mô hình trong trường hợp kết quả tính bị lệch pha có
thể sử dụng tham số hiệu chỉnh là hệ số nhám.
Bảng số liệu so sánh của ba phương án tính được trình bày trong phần phụ lục
của báo cáo. Từ đồ thị và bảng số liệu có thể thấy pha của quá trình tính toán có thể
sai khác rất nhiều, phạm vi điều chỉnh pha cho lưu vực có thể lên đến 10 tiếng. trong
khi đó quá trình điều chỉnh pha làm thay đổi giá trị lưu lượng tính toán nhỏ, chưa đến
600 m3/s so với giá trị lưu lượng tại đỉnh là 8000 m3/s.
3.2. Thử độ nhạy của mô hình với các tham số của bản đồ phân loại đất
Để xét ảnh hưởng của mô hình thấm có nhiều tham số có thể hiệu chỉnh. Nhưng
từ công thức tính của phương pháp thấm Green Ampt cho thấy điều chỉnh tham số độ
rỗng hiệu dụng của đất sẽ hiệu quả nhất. Để điều chỉnh ta đưa vào tham số
độ ẩm của đất. vì là hiệu của độ rỗng của đất (có dược từ thực nghiệm) và độ ẩm
của đất. Do độ ẩm của đất là tham số đo đạc (biến đổi theo thời gian) nên để điều
chỉnh sử dụng tham số này là hoàn toàn hợp lý.
12000 Do am TB
Do am be
11000 Do am lon
10000
9000
8000
Lưu lượng (m3)
7000
6000
5000
4000
3000
2000
1000
0
75 85 95 105 115 125 135 145 155 165 175 185 195 205 215 225 235 245 255 265
Thời gian (giờ)
Hình 4.9: Thử độ nhạy với các tham số của bản đồ phân loại đất
Để nghiên cứu ảnh hưởng của mô đun thấm hay chính là của độ ẩm của đất đến
kết quả tính toán của mô hình thủy văn Marine nhóm nghiên cứu xem xét ba phương
án sau:
- Độ ẩm của đất lấy trung bình hoặc theo số liệu thực đo.
- Độ ẩm của đất cho rất nhỏ.
- Độ ẩm của đất cho lớn.
Ba phương án tính trên đã bao hàm các trường hợp từ trường hợp khoảng không
gian giành cho thấm lớn nhất đến trường hợp khoảng không gian giành cho thấm nhỏ
nhất. Kết quả tính toán của ba phương án được thể hiện trên Hình 3.9.
Các kết quả tính toán theo ba phương án trong hình trên cho thấy khi điều chỉnh
mức độ thấm của mô đun thấm sẽ trực tiếp ảnh hưởng đến giá trị lưu lượng tính toán
của mô hình, còn về pha có chịu ảnh hưởng nhưng là nhỏ. Như vậy điều chỉnh mô
đun thấm hay chính là điều chỉnh độ ẩm của đất là cách nhanh và hiệu quả nhất để
điều chỉnh giá trị của lưu lượng đầu ra của mô hình tính toán.
3.3. Thử độ nhạy của mô hình với hệ số phân bố mưa
Mô hình thủy văn Marine cho phép đưa số liệu mưa vào mô hình tính ở hai dạng
phù hợp với tình hình số liệu của mỗi khu vực tính khác nhau.
Số liệu mưa được xử lý từ ảnh mây vệ tinh hoặc ảnh ra đa: Với loại số liệu này
ảnh chụp từ vệ tinh hoặc ra đa được đưa qua phần mềm xử lý và hiệu chỉnh thông
qua một số trạm hiệu chỉnh mưa thực đo trên mặt đất. Số liệu sau khi xử lý sẽ bao
gồm cả giá trị mưa định lượng và phân bố mưa trên lưu vực. Lưới phân bố mưa tùy
thuộc vào loại ảnh. Với ảnh ra đa độ phân giải của lưới mưa thường là 1000m (1km)
còn với ảnh vệ tinh thì độ phân giải của lưới mưa tùy thuộc vào hệ ảnh. Trên mỗi một
lưới mưa có gá trị mưa khác nhau, chính vì vậy số liệu mưa này rất gần với số liệu
mưa đã rơi thực tế trên lưu vực.
Số liệu mưa đo đạc tại các trạm khí tượng thủy văn: Với các nước hoặc khu vực
điều kiện kinh tế khó khăn như Việt Nam chỉ có số liệu mưa qua trắc tại các trạm khí
tượng thủy văn, thậm trí mạng lưới các trạm quan trắc cũng rất thưa thớt và không
đồng bộ. Với loại số liệu mưa đo đạc tại các trạm ta chỉ có giá trị về mặt định lượng
của mưa tại điểm đo, còn các điểm khác không phải tại vị trí đo, phải sử dụng các
phương pháp phân bố mưa để tìm giá trị mưa. Với số liệu mưa loại này, các trạm đo
phải được chọn vị trí đặt sao cho lượng mưa tại đó là giá trị đại diện của lượng mưa
trong vùng, mạng lưới các trạm cũng cần phải được bố trí sao cho hợp lý để phản ánh
tốt nhất thực trạng mưa.
Các số liệu thu thập của lưu vực hồ Tuyên Quang là các số liệu mưa cục bộ đo
đạc tại các trạm quan trắc. Chính vì thế cần phải chọn một phương pháp phân bố mưa
để xác định mưa trên toàn lưu vực.
Ở đây không đánh giá ảnh hưởng của các phương pháp phân bố mưa đến kết
quả tính của mô hình, mà chỉ đánh giá trọng số của phân bố mưa. Vì với bất cứ
phương pháp phân bố mưa nào cũng đều có trọng số phân bố, đây chính là tham số
điều chỉnh của phương pháp, nên để đi sâu vào chi tiết nhóm nghiên cứu chọn phương
pháp phân bố là phương pháp đa giác Thiessen. Vì phân bố mưa được tạo ra chứ
không phải là thực tế nên nếu số liệu mưa tại trạm đo không phải là giá trị đại diện
mà chỉ là giá trị mưa cục bộ thì phân bố mưa không còn hợp lý. Do đó cần phải điều
chỉnh lại phân bố mưa sao cho tổng giá trị lượng mưa trên lưu vực gần nhất với tổng
giá trị lượng mưa đã rơi trên lưu vực. Để đánh giá ảnh hưởng của tham số điều chỉnh
trong phương pháp phân bố mưa xét ba phương án tính sau:
- Tham số phân bố mưa chuẩn.
- Tham số phân bố mưa nhỏ.
- Tham số phân bố mưa lớn.
Trọng số phân bố mưa chuẩn có giá trị là 1. Đây là giá trị mưa thực của phương
pháp phân bố. Nhưng do mưa của trạm không phải là mưa đại diện nên hệ số này có
thể điều chỉnh lớn hơn hoặc nhỏ hơn 1 để cho phù hợp hơn về tổng lượng.
Các kết quả tính toán cho ba phương án điều chỉnh tham số phân bố mưa trên
lưu vực với phân bố mưa theo phương pháp đa giác Thiessen cho trong hình vẽ dưới
đây.
11000
He so mua chuan
He so mua be
10000
He so mua lon
9000
8000
7000
Lưu lượng (m3)
6000
5000
4000
3000
2000
1000
0
75 85 95 105 115 125 135 145 155 165 175 185 195 205 215 225 235 245 255 265
Thời gian (giờ)
Hình 4.10: Ảnh hưởng của trọng số phân bố mưa đến kết quả tính của Marine
Các kết quả tính của ba phương án cho thấy, trọng số của phân bố mưa trực tiếp
ảnh hưởng đến giá trị của lưu lượng tính toán trên lưu vực. Đây chính là tham số điều
chỉnh tổng lượng nước vào mô hình tính chính vì vậy tham số này rất nhạy với kết
quả tính của mô hình. Tham số hiệu chỉnh này về nguyên tắc không nên điều chỉnh
quá thấp hoặc quá cao so với giá trị thực là 1. Vì khi điều chỉnh quá nhiều tham số
này sẽ dẫn đến sai về bản chất của mô hình tính.
Qua việc thử độ nhạy của các tham số hiệu chỉnh mô hình có thể thấy mô hình
thủy văn đã được thiết lập cho lưu vực có các tham số khá nhạy. Như vậy là các số
liệu đã được xử lý tốt và cho phép tính toán hiệu chỉnh các tham số của mô hình thủy
văn cho lưu vực này trong phạm vi hiệu chỉnh khá lớn cả về pha va định lượng. Đây
cũng là thuận lợi cho việc hiệu chỉnh xác định bộ thông số của mô hình cho lưu vực
thông qua các số liệu lịch sử.
Chương 5
Các mối quan hệ giữa ô đang xét với các thành phần khác của hệ thống (thí dụ:
trao đổi nước qua đập tràn, chiều cao, chiều rộng, hệ số của đập v.v...)
1.3. Mô hình toán học một đoạn sông
Dòng chảy trong một đoạn sông được mô phỏng bằng hệ phương trình Saint
Venant 1 chiều, mô tả chuyển động của nước trong sông hoặc kênh hở. Trong
IMECH-1D hệ phương trình S.Venant được sử dụng dưới dạng sau:
Ac Q
q (5.1)
t x
Q Q 2 Z
gA Sf 0 (5.2)
t x A x
ở đây sử dụng các ký hiệu:
Q=Q(x,t) – lưu lượng của dòng chảy trong đoạn sông;
Z=Z(x,t) – mực nước trong đoạn sông;
q - lưu lượng phụ;
Ac - Diện tích mặt cắt (kể cả vùng chứa);
- hệ số điều chỉnh
A - Diện tích chảy
Sf - Sức cản đáy
Sức cản đáy trong IMECH-1D được tính theo công thức sau:
n 2Q Q
Sf (5.3)
A 2R 4 / 3
Trong đó R là bán kính thủy lực.
1.4. Mô hình toán học của một ô ruộng
IMECH-1D mô phỏng quá trình ngập một ô ruộng (khu chứa) bằng định luật
bảo toàn khối lượng nước tại ô đó.
dV
P Qk (5.4)
dt k
n 1
f f i 1 f in 1 1 f in1 f in
2 2
1
2t
x
Ac, i1 Ac,i AcT,i1 AciT 1 Qi1 Qi 1 QiT1 QiT
(5.5)
Qi 1 qi 1 qiT1 qiT
1
2
Để sai phân hoá phương trình (5.2), ta viết phương trình này thành 4 số hạng a1,
a2, a3, a4 như sau:
a1 + a 2 + a 3 + a 4 = 0 (5.6)
trong đó
Q Q2
a1 , a2
t x A
Z
a 3 gA , a 4 gASf
x
a1 ~
a1
1
Qi 1 Q1 QiT1 QiT
2t
~
a2 a2 1 T T
x Ai 1 Ai Ai 1 Ai
a3 ~
a3
g
2
Ai 1 Ai 1 AiT1 AiT
1
x
Zi 1 Zi 1 ZiT1 ZiT
a 4 a~4 g AS f
i 1
AS f g 1 AS
i f
T
i 1
AS f
T
i
2 2
1
t
Vi ViT Pi Qi, k 1 PiT QiT, k (5.8)
k k
Trong (5.5) - (5.8), f tính ở thời điểm hiện tại còn fT tính ở thời điểm trước đó.
Ta giả thiết rằng nút đầu của đoạn sông có số thứ tự là i còn nút cuối đoạn có số
thứ tự là i+1. Khi đó các đẳng thức (5.5) và (5.7) cho ta quan hệ lưu lượng và mực
nước tại hai đầu của một đoạn sông. Như vậy, mỗi một đoạn sông có 4 ẩn số cần tìm
là:
Mỗi một ô ruộng có một phương trình (5.8). Phương trình này cho phép xác
định một ẩn cần tìm của một ô ruộng là cao trình mực nước Zr tại tâm điểm của ô.
Còn các hàm Vi, Qi, k trong (5.8) là hàm phi tuyến phụ thuộc vào cao trình mực
nước Zr của ô ruộng đang xét và của các ô ruộng liên quan.
Bây giờ ta xét tính đóng kín của hệ phương trình (5.5), (5.7) và (5.8) với các ẩn
Zd, Zc, Qd, Qc và Zr.
Mỗi một ẩn Zd hoặc Zc đều tương ứng với một giá trị cao trình mực nước tại
một nút nào đó của mạng sông. Ta đặt:
nr - số ô ruộng.
Tại các nút của mạng sông (nút đơn hoặc nút hợp lưu) giả thiết là chỉ có một
cao trình mực nước. Như vậy tại n nút của mạng sông cần phải xác định n cao trình
mực nước Zi : ta có n ẩn số.
Vì mỗi đoạn sông có lưu lượng vào và lưu lượng ra khỏi đoạn, nên nếu ta có nd
đoạn sông trong mạng sông thì ta cần xác định 2nd giá trị lưu lượng : ta có 2nd ẩn số.
Nếu ta có nr ô ruộng ta cần xác định nr giá trị cao trình mực nước tại tâm các ô
ruộng này :
Như vậy để xác định dòng chảy trong mạng sông và ô ruộng ta cần xác định
n+2nd+nr ẩn số.
Các đẳng thức (5.5), (5.7). (5.8) cho ta 2nd+nr phương trình.
Nếu nút là nút trong thì ta có một phương trình cân bằng lưu lượng tại nút đó:
Do vậy tại n nút ta có n phương trình (hoặc dạng (5.9) hoặc là điều kiện biên).
Cùng với 2nd + nr phương trình đã có, n phương trình này sẽ tạo thành hệ kín để xác
định 2nd+nr+n ẩn số.
F H n 1, Qn 1 F H* , Q* H n 1 H* HF
Qn 1 Q* QF
H H* Q Q*
ở đây H*, Q* là giá trị lặp, giá trị xuất phát của chúng là Hn, Qn tương ứng.
Tuyến tính hoá các biểu thức đơn giản.
Ta xét các biểu thức đơn giản trong (5.5), (5.7), 5.8):
A = A(Z), Q2/A, AZ, Ad Zc, AcZd.
Chỉ số d là giá trị tính tại đầu đoạn, còn chỉ số c là giá trị ở cuối đoạn. Sử dụng
công thức Newton để tuyến tính hóa các biểu thức này ta có:
A A* + b*(Z - Z*) (5.10)
2
Q*
2
Q2 Q* Q*
* 2 * Q Q* * b* Z Z* (5.11)
A A A A
AZ A*Z* Z*b* A* Z Z* (5.12)
A d Zc A*d Z*c b*d Z*c Zd Z*d A*d Zc Z*c (5.13)
A c Zd A*c Z*d A Z Z b Z Z
*
c d
*
d
* *
c d c Z
*
c (5.14)
Trong các công thức (5.10) - (5.14), b* - chiều rộng của sông (tương ứng với
mực nước Z*). b* xuất hiện theo đẳng thức
A
b
Z
Tuyến tính hoá biểu thức có lực cản đáy.
Trong số hạng ~a 4 của (4.7) có chứa hàm phi tuyến ASf. Để tuyến tính hoá số
hạng này, ta viết Sf về dạng sau:
QQ
S
f
,
2
K kAR 2/3
K
Hệ số K phụ thuộc vào mực nước Z: K = K(Z). Hàm này được tính qua diện
tích chảy A = A(Z) và bán kính thủy lực R = R(Z). Vì các mặt cắt thực tế trên lưu
vực sông nói chung khá phức tạp, cho nên K phải tính theo kiểu lòng dẫn phức hợp.
Hiện tại, IMECH-1D tính K theo từng cấp và giả thiết rằng K biến đổi tuyến tính
trong khoảng giữa hai cấp. Như vậy ASf có thể tuyến tính hoá như sau:
Q* Q* Q*
ASf A*S*f 2A *
Q Q 2A
* *
K*z Z Z*
K
* 2
K
* 3
Tuyến tính hoá biểu thức trao đổi nước qua đê.
Trong phương trình (5.8) có biểu thức phi tuyến Qi,k = F(Zi, Zk). Đây là hàm mô
tả lượng nước trao đổi giữa ô i (có mực nước Zi) với ô k (có mực nước Zk). Việc trao
đổi này còn phụ thuộc vào công trình giữa ô i và ô k. Giả sử rằng quá trình trao đổi
nước giữa ô i với ô k tuân theo qui luật của dòng chảy tràn qua đập.
Xét hàm F(Zi, Zk) khi giữa ô i và ô k là một đập tràn với cao độ Zd, độ dài tràn
là Ld. Khi đó, nếu Zk - Zd
2
Zi Zd (chảy tự do từ i sang k).
3
Qi ,k F Z i , Z k mLd 2 g Z i Z d
3/ 2
(5.15)
2
Nếu Z k Z d Z i Z d (chảy ngập)
3
Với các hàm (4.15) Và (5.16) ta có thể sử dụng công thức Newton để tuyến tính
hóa:
- Trường hợp chảy tự do (5.15)
3 *
Z i Z d Z i Z i*
1/ 2
Qi ,k Qi*,k mLd 2 g (5.17)
2
- Trường hợp chảy ngập (5.16)
1/ 2
Qi ,k Qi*,k mLd Z i* Z k* Z i* Z d Z i * Z k* Z k Z k *
1/ 2 1
2
(5.18)
1 1/ 2
mLd Z i Z d Z i* Z k Z i Z i*
2
Hệ phương trình phi tuyến (1.5), (1.7), (1.8) có thể đưa về hệ phương trình đại
số tuyến tính theo mực nước tại các nút sông và các ô ruộng và theo lưu lượng tại hai
đầu của mỗi đoạn sông.
2. Mô hình hóa lưu vực sông Tích-Bùi trong IMECH1D mở rộng
Mô tả chung về sông Tích
Sông Tích là nhánh cấp 1, nhánh lớn nhất của sông Đáy, bắt nguồn từ núi
Ba Vì theo hướng Tây Bắc – Đông Nam chảy vào sông Đáy tại Ba Thá. Diện
2
tích lưu vực sông Tích là 1330km , với chiều dài hiện tại 91km, độ rộng trung
bình là 14,6km, hệ số quanh co là 2,0. Sông chảy qua 4 huyện và một thị xã.
Lưu vực sông Tích có dạng hình lông chim, các nhánh sông phần lớn
nhập lưu ở bờ phải.
Lòng sông Tích có thể chia 3 đoạn:Từ nguồn đến Cống Chuốc: mặt cắt
hẹp, có độ rộng từ 10.0-15.0m, độ sâu biến đổi đều, có độ dốc đáy khoảng
0.8m/km. Từ Công Chuốc đến Cầu Trôi: lòng sông mở rộng hơn, có độ dốc
đáy trung bình vào khoảng 0.3m/km. Đoạn từ Cầu Trôi đến Ba Thá: lòng sông
mở rộng rõ rệt, có hiện tượng bồi xói, có độ rộng trung bình 30.0-40.0m, có
độ dốc đáy là 0.1m/km.
Sông Tích chảy qua nhiều vùng đồi đất và nham cứng, vì vậy có sức xói
yếu. Mặc dù độ dốc đáy lòng sông chính không lớn song độ dốc các sông
nhánh lại rất lớn, trung bình từ 10-20m/km, có sông suối với độ dốc lên tới
trên 30m/km.
Lòng sông Tích bé, song thềm sông khá rộng, trung bình khoảng 2.0-
3.0km, nơi rộng nhất có thể tới 5.0-6.0km.
Khả năng thoát lũ sông Tích kém ( độ dốc mặt nước quá nhỏ), do lòng
sông quanh co, uốn khúc, lại bị thu hẹp bởi làng mạc, đê bối, đường xá và
nhiều cầu qua sông. Một phần nữa là do tình trạng nhập lưu của các phụ lưu
khá lớn làm cho lượng nước tập trung và thời gian tập trung nước dọc sông
không đều. Vì vậy, gây nên tốc độ dòng chảy trên sông phân bố không đều
theo chiều dài sông.
Một đặc điểm đáng ngại nữa của lũ sông Tích, đó là mực nước dâng cao,
quá trình lũ kéo dài, đê bị ngâm lâu, đường cong bão hoà cao dẫn đến hiện
tượng sạt lở chân đê phía hạ lưu, gây uy hiếp đến sự an toàn của đê.
Thiết lập mạng sông Tích - sông Bùi
Mạng sông gồm 2 nhánh sông: nhánh thứ nhất: sông Tích - sông Bùi. Nhánh
thứ hai: một phần của sông Đáy (từ đập Đáy đến trạm thủy văn Phủ lý). Nhánh thứ 2
có thể tách thành 2 nhánh. Như vậy mạng sông tính toán có thể chia thành 3 nhánh
như sau:
- Sông Tích-Bùi
- Sông đáy đoạn từ đập Đáy đên Ba Thá
- Sông Đáy đoạn từ Ba Thá đến Phủ Lý
Mạng sông sông Tích - sông Bùi được nối với các ô ruộng như trong Hình 5.1
dưới đây để mô tả ngập lụt khi lũ lớn.
Hình 5.1: Mô hình hóa sông Tích-Bùi trong mô hình IMECH1D mở rộng
Hình 5.4: Sơ đồ tổng thể của mô hình kết nối thủy văn - thủy lực
Với đặc thù của lưu vực sông Tích-Bùi sẽ có hai loại kết nối như sau:
Mô hình kết nối đa điểm (Hình 5.2): Sử dụng cho các sông suối nhỏ kết nối với
sông Tích-Bùi đoạn hạ lưu như khu vực Xuân Mai, Miếu Môn và các khu vực
cách xa các điểm nhập lưu của các nhánh phụ đã liệt kê ở phần tổng quan.
Mô hình kết nối đơn điểm (Hình 5.3): sử dụng cho các biên hoặc chi lưu như phần
lưu vực thuộc khu núi Ba Vì và phần tiếp giáp với sông Đà và sông Hồng
Sơ đồ tổng thể kết nối thủy văn thủy lực trên sông Tích-Bùi được mô tả như
trên Hình 5.4. Còn Hình 5.5 là sơ đồ mạng sông tính toán trong khuôn khổ dự án này
để phục vụ việc cảnh báo, dự báo ngập lụt lưu vực sông Tích-Bùi. Mạng sông đã
được thết lập déo dài đến trạm thủy văn Phủ Lý và lấy mực nước tại trạm Phủ Lý làm
biên dưới. Với cách thiết lập mô hình như vậy thì trong sơ đồ tính có trạm Ba Thá là
điểm kiểm chứng mô hình vì có số liệu thực đo.
QUB
Qlateral from result of Hyrologycal model
Hình 5.5: Các vị trí kết nối trong sơ đồ tính toán thủy lực một chiều mở rộng
- Xác định quan hệ F-Z (diện tích và cao độ) của các ô chứa
- Xác định vị trí tràn giữa các ô chứa
- Xây dựng hàm quan hệ tràn hoặc bảng thông số của công trình chảy tràn.
- Xác định liên kết giữa các ô chứa với nhau và với mạng sông trong mô
hình thủy lực.
Việc xác định các thông số của ô chứa cang cẩn thận và chi tiết thì độ chính xác
của mô hình càng cao. Hơn thế nếu ô chứa được tính toán phân chia nhỏ, hợp lý và
dữ liệu sử dụng có độ càng chi tiết thì mô hình giả hai chiều sẽ cho kết quả tiến gần
đến kết quả của mô hình tính toán hai chiều thực.
4.1. Số liệu về lòng dẫn
Số liệu về lòng dẫn thu thập bao gồm hệ thống mặt cắt (trắc dọc và trắc ngang)
của các sông Đáy và sông Tích-Bùi. Ngoài số liệu về mặt cắt còn cần thu thập các số
liệu về cao độ đê. Các số liệu cao độ đê rất quan trọng trong tính toán bài toán ngập
lụt khu vực hạ du.
Đặc trưng của cao độ đê sông Đáy (Hình 5.6) ở đoạn nghiên cứu có thể nhận
thấy đó là cao độ đê tả (phía nội thành Hà Nội) cao hơn nhiều so với đê hữu. Đây là
do đặc thù của sông Đáy là dòng sông phục vụ phân chậm lũ để bảo vệ cho khu vực
trung tâm thành phố Hà Nội. Vì vậy trong trường hợp lũ lớn nước chỉ có thể tràn qua
đê hưu sang phía Tây (tức là phía sông Tích-Bùi) chứ hoàn toàn không thể tràn về
phía nội đô của Hà Nội.
Hình 5.6: Cao độ đê sông đáy (màu đỏ là đê tả, màu xanh là đê hữu)
Sông Tích với chiều dài 110,696km, có tổng 450 mặt cắt:
Trong đó: - Đoạn 1 có 277 mặt cắt (276 mặt cắt + 1 mặt cắt K0)
- Đoạn 2&3 có 173 mặt cắt (171 mặt cắt + 2 mặt cắt K0, KC)
Từ hình 5.7 đến hình 5.17 là một số mặt cắt điển hình:
20
Cao độ đáy sông (m)
15
10
0
0 20 40 60 80 100 120 140 160
Khoảng cách cộng dồn (m)
Hình 5.7: Số liệu mặt cắt ngang K0 của sông Tích-Bùi mới
12
10
Cao độ đáy sông (m)
0
0 20 40 60 80 100 120 140 160
Khoảng cách cộng dồn (m)
Hình 5.8: Số liệu mặt cắt ngang MC153 của sông Tích-Bùi mới
12
10
Cao độ đáy sông (m)
0
0 50 100 150 200 250 300
Khoảng cách cộng dồn (m)
Hình 5.9: Số liệu mặt cắt ngang MC273 của sông Tích-Bùi mới
10
Cao độ đáy sông (m)
0
0 50 100 150 200 250
Khoảng cách cộng dồn (m)
Hình 5.10: Số liệu mặt cắt ngang MC276 của sông Tích-Bùi mới
10
Cao độ đáy sông (m)
0
0 50 100 150 200 250
Khoảng cách cộng dồn (m)
Hình 5.11: Số liệu mặt cắt ngang C14 của sông Tích-Bùi mới
10
Cao độ đáy sông (m)
0
0 20 40 60 80 100 120 140 160 180
Khoảng cách cộng dồn (m)
Hình 5.12: Số liệu mặt cắt ngang C19 của sông Tích-Bùi mới
6
Cao độ đáy sông (m)
0
0 20 40 60 80 100 120 140 160 180
Khoảng cách cộng dồn (m)
Hình 5.13: Số liệu mặt cắt ngang C29 của sông Tích-Bùi mới
12
10
Cao độ đáy sông (m)
0
0 20 40 60 80 100 120 140 160
-2
-4
Khoảng cách cộng dồn (m)
Hình 5.14: Số liệu mặt cắt ngang C49 của sông Tích-Bùi mới
6
Cao độ đáy sông (m)
0
0 20 40 60 80 100 120 140 160
Khoảng cách cộng dồn (m)
Hình 5.15: Số liệu mặt cắt ngang C71 của sông Tích-Bùi mới
7
Cao độ đáy sông (m)
0
0 20 40 60 80 100 120 140 160
-1
Khoảng cách cộng dồn (m)
Hình 5.16: Số liệu mặt cắt ngang C100 của sông Tích-Bùi mới
6
Cao độ đáy sông (m)
0
0 20 40 60 80 100 120 140 160
-2
-4
Khoảng cách cộng dồn (m)
Hình 5.17: Số liệu mặt cắt ngang C155 của sông Tích-Bùi mới
4.2. Số liệu về biên
Biên trên tại Đập Đáy được lấy là hằng số, còn biên trên của sông Tích-Bùi
được tính từ mưa bằng mô hình thủy văn. Các biên phụ (nhập lưu) trên tuyến Tích-
Bùi như trên Hình 4.5 được tính bằng mô hình thủy văn. Các phần nhập lưu bên sông
Đáy chủ yếu là các trạm bơm. Chính vì vậy nhập lưu bên sông đáy được xác định dựa
theo công suất và mức độ mưa.
Hình 5.18: Đường quá trình mực nước tại trạm Phủ Lý năm 2014
Hình 5.19: Đường quá trình mực nước tại trạm Ba Thá năm 2014
Biên dưới của mô hình được xác đinh là mực nước tại trạm thủy văn Phủ Lý.
Tại đây số liệu mực nước của các năm 2014, 2015, 2016, 2017 và năm 2018 đã được
thu thập đầy đủ.
Hình 5.20: Đường quá trình mực nước tại trạm Phủ Lý năm 2015
Trong lưu vực tính toán có trạm thủy văn Ba Thá. Đây là điểm kiểm định mô
hình và cũng là điểm cần dự báo của mô hình. Số liệu mực nước tại Ba Thá cũng đã
được thu thập đầy đủ các năm như tại trạm Phủ Lý.
Hình 5.21: Đường quá trình mực nước tại trạm Ba Thá năm 2015
Hình 5.22: Đường quá trình mực nước tại trạm Phủ Lý năm 2016
Hình 5.23: Đường quá trình mực nước tại trạm Ba Thá năm 2016
Các hình từ 4.18 đến 4.23 là mực nước một số năm của trạm Ba Thá và trạm
Phủ Lý. Các hình này cho thấy thủy triệu trực tiếp có ảnh hưởng các trạm này
4.3. Số liệu về ô chứa
Các ô chứa trông mô hình thủy liều mở rộng được xác định ranh giới trên cơ sở
cao độ của hệ địa hình kết hợp với hệ thống giao thông, hệ thống đê, đường bao. Các
quan hệ V-Z và F-Z của các ô được xác định trên cơ sở mô hình số độ cao của ô đó.
Về độ dài đường tràn và cao độ đường tràn được xác định thông qua hệ thống cao độ
đê, cao độ đường giao thông và cao độ của các hệ thống đê. Tổng số ô chứa đưa vào
tính toán là 62 ô đã được nhóm nghiên cứu xác định các tham số cơ bản dựa trên các
thông tin thu thập được từ nhiều nguồn khác nhau.
Các ô chứa thuộc lưu vực sông Tích-Bùi chỉ là 49 ô (như trên Hình 4.24). Nhưng
khi mở rộng mạng tính toán kéo dài đến Phủ Lý thì số lượng ô chứa đưa vào trong
mô hình thủy lực một chiều mở rộng tăng lên là 62 ô.
Các ô chứa được kết nối với các đoạn sông chính theo vị trí địa lý, cơ chế tràn
nước giữa ô chứa và sông dựa trên mực nước thực của sông và ô so với cao độ đê tại
vị trí kết nối.
Các ô trong miền tính cũng có sự kết nối và tràn nước qua lại với nhau tạo thành
một hệ thống liên hoàn. Cơ chế tràn thông qua các đường tràn và cao độ mực nước
giữa các ô chứa với nhau và so với cao độ đường tràn và độ rộng của đường tràn hoặc
hàm độ rộng của đường tràn được xác đinh từ quá trình xử lý số liệu ô chứa như đã
trình bày ở phần trên.
Hình 5.24: Vị trí các ô chứa trong khu vực nghiên cứu
Chương 6
Ta cần xác định véc-tơ 𝛽 cho các hệ số trong mô hình hồi quy, giả thiết các
điều kiện cho mô hình tuyến tính được đáp ứng. Công thức (6.4) có thể được viết như
sau:
𝑅𝑆𝑆(𝛽) = (𝑌 − 𝑋𝛽)𝑇 (𝑌 − 𝑋𝛽). (6.5)
Nếu 𝑋 𝑇 𝑋 không suy biến, véc-tơ 𝛽 được xác định bằng phương trình sau:
𝛽̂ = (𝑋 𝑇 𝑋)−1 𝑋 𝑇 𝑌. (6.6)
Từ (5.6) ta có phương trình hồi quy nhiều biến, để dự đoán giá trị mới 𝑋 = 𝑥
ta tính đầu ra 𝑌̂ của mô hình hồi quy tuyến tính nhiều biến như sau:
𝑌̂ = 𝑋𝛽̂ = (𝑋 𝑇 𝑋 )−1 𝑋 𝑇 𝑌. (6.7)
1.2. Hồi quy LASSO
Phương pháp LASSO (Least absolute shrinkage and selection operator) là
phương pháp hồi quy tuyến tính nhiều biến có hiệu chỉnh mô hình, phương pháp này
đưa thêm hàm phạt vào hàm lỗi để lỗi hồi quy đạt nhỏ nhất:
2
𝑅𝑆𝑆(𝛽) = ∑𝑁 𝑀
𝑖=1(𝑌𝑖 − 𝐸 (𝑌 |𝑋 )) + 𝜆 ∑𝑗=1 |𝛽𝑗 |. (6.8)
Trong đó 𝜆 là hệ số phạt dùng để điều chỉnh mô hình, chuẩn L1 được dùng cho
việc dự đoán các tham số. Trong trường hợp 𝜆 đủ lớn sẽ có một số tham số hồi quy
tiến dần về 0, do đó chúng không đóng vai trò gì trong mô hình hồi quy. Phương pháp
LASSO cũng được dùng cho bài toán lựa chọn thuộc tính, với các biến có tham số
hồi quy bằng 0 ta có thể loại khỏi mô hình.
1.3. Phương pháp hồi quy k láng giềng
Phương pháp k láng giềng dùng cho bài toán hồi quy không có quá trình huấn
luyện để xây dựng mô hình học, khi dự đoán 1 mẫu mới, giải thuật tìm k (k=1, 2,..)
láng giềng gần nhất của mẫu này trong tập dữ liệu huấn luyện ℒ, sau đó tính giá trị
trung bình (hoặc trung vị) để trả về kết quả cuối cùng.
Quá trình tìm k láng giềng của mẫu mới thường sử dụng khoảng cách Euclidean
được định nghĩa như sau:
1
2 2
d(𝑥𝑎 , 𝑥𝑏 ) = (∑𝑀
𝑗=0(𝑥𝑎𝑗 − 𝑥𝑏𝑗 ) ) , trong đó xa và xb là 2 mẫu độc lập. (6.9)
Gọi 𝑡 là nút cha để tách nhánh trên cây hồi quy. Việc tách nhánh trên thuộc tính
𝑋 được xác định bởi việc giảm sự hỗn tạp tại nút 𝑡, ký hiệu ∆𝑅(𝑋, 𝑡). Kỳ vọng của 𝑌
ở nút 𝑡 được tối thiểu hóa nhờ hàm lỗi bình phương sai số được định nghĩa như sau:
1
𝑅(𝑡 ) = 𝑎𝑟𝑔𝑚𝑖𝑛𝑌𝑡∈ℒ 𝐸 [(𝑌𝑖 − 𝑌̅𝑡 )2 ] = 𝑎𝑟𝑔𝑚𝑖𝑛𝑌𝑡∈ℒ ∑𝑋𝑖 ∈𝑡(𝑌𝑖 − 𝑌̅𝑡 )2 . (6.10)
𝑁(𝑡)
Trong đó 𝑁(𝑡) là tổng số mẫu hiện tại ở nút 𝑡 và 𝑌̅𝑡 là trung bình mẫu của 𝑌 tại 𝑡.
Gọi 𝑠 là giá trị chia tách thuộc tính 𝑋 tại nút 𝑡 thành nút con trái 𝑡𝐿 và nút con
phải 𝑡𝑅 phụ thuộc vào 𝑋 ≤ 𝑠 hoặc 𝑋 > 𝑠, 𝑡𝐿 = {𝑋𝑖 ∈ 𝑡, 𝑋𝑖 ≤ 𝑠} và 𝑡𝑅 = {𝑋𝑖 ∈
𝑡, 𝑋𝑖 > 𝑠}, 𝑖 = 1. . 𝑁. Độ biến thiên của các mẫu cho mỗi nút con là
1 2 1 2
𝑅(𝑡𝐿 ) = ∑𝑋𝑖 ∈𝑡𝐿(𝑌𝑖 − 𝑌̅𝑡𝐿 ) , 𝑅(𝑡𝑅 ) = ∑𝑋𝑖 ∈𝑡𝑅(𝑌𝑖 − 𝑌̅𝑡𝑅 ) . (6.11)
𝑁𝐿 (𝑡) 𝑁𝑅 (𝑡)
Trong đó 𝑌̅𝑡𝐿 là trung bình mẫu của 𝑡𝐿 và 𝑁𝐿 (𝑡 ) là kích thước mẫu của 𝑡𝐿 .
Tương tự, 𝑌̅𝑡𝑅 và 𝑁𝑅 (𝑡 ) là trung bình mẫu và kích thước mẫu của 𝑡𝑅 .
Như vậy, việc giảm độ hỗn tạp theo việc chia tách 𝑠 đối với 𝑋 được tính như sau:
∆𝑅 (𝑋, 𝑡 ) = 𝑅 (𝑡 ) − [𝑅(𝑡𝐿 )𝑝(𝑡𝐿 ) + 𝑅(𝑡𝑅 )𝑝(𝑡𝑅 )]. (6.12)
Trong đó 𝑝(𝑡𝐿 ) = 𝑁𝐿 (𝑡)/𝑁(𝑡) và 𝑝(𝑡𝑅 ) = 𝑁𝑅 (𝑡)/𝑁(𝑡) là các tỷ lệ quan sát
trong 𝑡𝐿 và 𝑡𝑅 . Điểm chia tách được chọn trên thuộc tính 𝑋 cho mỗi nút 𝑡 chính là
giá trị làm cho ∆𝑅 (𝑋, 𝑡 ) đạt cực đại.
Dự đoán dùng cây hồi quy
Khi xây dựng cây hồi quy, ta cần phải tính toán giá trị cho nút lá của cây, quá
trình này được mô tả sau đây. Sử dụng các ký hiệu của Breiman, gọi 𝜃 là véc-tơ chứa
tham số ngẫu nhiên để xác định việc xây dựng cây. Trong mỗi cây hồi quy, ta tính
toán trọng số dương 𝑤𝑖 (𝑥𝑖 , 𝜃) cho mỗi mẫu 𝑥𝑖 ∈ ℒ. Đặt 𝑙(𝑥, 𝜃, 𝑡) là nút lá 𝑡 trong cây
hồi quy. Các mẫu 𝑥𝑖 ∈ 𝑙(𝑥, 𝜃, 𝑡) được gán các trọng số 𝑤𝑖 (𝑥, 𝜃) = 1/𝑁(𝑡), trong đó
𝑁𝑡 là số mẫu trong 𝑙(𝑥, 𝜃, 𝑡). Nghĩa là việc dự đoán dùng cây hồi quy đơn giản là tính
giá trị trung bình của các mẫu tại nút lá của cây.
Với dữ liệu thử nghiệm 𝑋 = 𝑥, 𝑌̂ là giá trị dự đoán của cây hồi quy được tính
như sau:
𝑌̂ = ∑𝑁
𝑖=1 𝑤𝑖 (𝑥, 𝜃 )𝑌𝑖 = ∑𝑥𝑖 ,𝑋𝑖 ∈𝑙(𝑥,𝜃,𝑡) 𝑤𝑖 (𝑥, 𝜃 )𝑌𝑖 . (6.13)
1.5. Mạng nơ-ron nhân tạo
Mạng nơ-ron nhân tạo giả lập quá trình học tập và tính toán của bộ não con
người. Một mạng nơ-ron nhân tạo được xây dựng từ những thành phần cơ sở là những
nơ-ron nhân tạo gồm nhiều đầu vào và một đầu ra (Hình 6.1). Mỗi nơ-ron nhân tạo
giả lập một nơ-ron sinh học, gồm một ngưỡng kích hoạt (bias) và một hàm kích hoạt
(hay hàm truyền –transfer function), đặc trưng cho tính chất của nơ-ron. Các nơ-ron
nhân tạo được liên kết với nhau bằng các kết nối. Mỗi kết nối có trọng số kết nối
(weight), đặc trưng cho khả năng nhớ của mạng nơ-ron. Quá trình huấn luyện mạng
nơ-ron là một quá trình điều chỉnh các ngưỡng kích hoạt và các trọng số kết nối, dựa
trên dữ liệu học.
Quá trình huấn luyện mạng nơ-ron dựa trên lỗi hồi quy giữa giá trị dự đoán và
giá trị quan sát được của biến đích, giải thuật huấn luyện sẽ điều chỉnh các trọng số
kết nối của mạng nơ-ron nhằm cực tiểu hóa lỗi hồi quy trên các mẫu huấn luyện. Sau
khi mạng được huấn luyện thành công, các tri thức tích luỹ được trong quá trình huấn
luyện mạng (các ma trận trọng số, các tham số tự do, v.v) sẽ được cập nhật vào cơ sở
tri thức để sử dụng trong quá trình dự đoán.Có nhiều loại mạng nơ-ron, nhiều tầng và
được dùng cho cả bài toán học có giám sát và học không giám sát. Trong nhiều nghiên
cứu mạng nơ-ron một lớp truyền thẳng được lựa chọn, sử dụng trọng số suy giảm
(weight decay) và hệ số co của mô hình để λ tránh tình trạng học vẹt (over-fitting).
1.6. Máy véc-tơ hồi quy
Máy véc-tơ hỗ trợ hồi quy (Support Vector Regression, SVR) tìm siêu phẳng đi
qua tất cả các điểm dữ liệu với độ lệch chuẩn ε. Trong hồi quy ε – SV, mục đích là
tìm một hàm f(X) trong công thức (6.1) có sai số nhỏ nhất ε so với biến đích Yi:
f(X) = w T Φ(X) + b, (6.14)
Trong đó w RM, (X) biểu thị một hàm phi tuyến được chuyển từ không gian
RM vào không gian nhiều chiều. Mục đích ở đây là cần tìm w và b để giá trị X=x có
thể được xác định bằng cách tối thiểu hóa lỗi hồi quy. Từ đó dẫn đến giải bài toán
quy hoạch toàn phương như sau:
N
1 2
min (w, b, , * ) w C ( i i* ) (6.15)
2 i 1
Yi ( wX i b) i
( wX i b) Yi i
*
i , i 0
*
Ở đây, i, i* là hai biến bù và C > 0 dùng để chỉnh độ rộng giữa lề và lỗi. Để
giải quyết bài toán (6.15), trước tiên phải tìm cực tiểu của hàm L theo w, b, i, i*.
1 2 N N
min L(w, b, , * , , * , , *) w C (i i* ) (ii i * i* )
2 i 1 i 1
N N
i ( i Yi wT ( X i ) b) i* ( i* Yi wT ( X i ) b). (6.16)
i 1 i 1
Với i, i*, i, i* là các hệ số Lagrange và thỏa mãn điều kiện: i, i*, i, i*
0, i=1..N.
Lấy đạo hàm cấp một của phương trình (6.16), hồi quy phi tuyến SVR sử dụng
hàm lỗi được tính như sau:
1 ∗ ∗ ∗ ∗
𝑚𝑎𝑥 {− 2 ∑𝑁 𝑁 𝑁
1 (𝛼𝑖 − 𝛼𝑖 )(𝛼𝑗 − 𝛼𝑗 )Φ(𝑋𝑖 , 𝑋𝑗 ) − 𝜀 ∑1 (𝛼𝑖 + 𝛼𝑖 ) + ∑1 𝑌𝑖 (𝛼𝑖 − 𝛼𝑖 )} (6.17)
với ràng buộc:
∗ ∗
∑𝑁
1 (𝛼𝑖 − 𝛼𝑖 ) = 0; 𝛼𝑖 , 𝛼𝑖 ∈ [0, 𝐶 ]. (6.18)
Giải biểu thức (6.17) với ràng buộc (6.18) xác định được các nhân tử Lagrange
i, i . Khi đó, mô hình hồi quy SVR được trình bày ở (6.14), với
*
𝑁
1
̂ = ∑(𝛼𝑖 − 𝛼𝑖∗ )𝑋𝑖 , 𝑏̂ = − 𝑤
𝑤 ̂ (𝑋𝑗 + 𝑋𝑘 ).
2
1
Trọng số 𝑤𝑖 (𝑥) được tính bởi rừng ngẫu nhiên là giá trị trung bình của các
trọng số dự đoán của tất cả các cây trong rừng. Công thức tính như sau:
1
𝑤𝑖 (𝑥) = ∑𝐾
𝑘=1 𝑤𝑖 (𝑥, 𝜃𝑘 ). (6.19)
𝐾
Cuối cùng, giá trị dự đoán của rừng ngẫu nhiên hồi quy được cho bởi:
𝑌̂ = ∑𝑁
𝑖=1 𝑤𝑖 (𝑥 )𝑌𝑖 . (6.20)
Độ đo sự quan trọng của thuộc tính
Khi cây hồi quy phân chia tập dữ liệu đầu vào thành các vùng không giao nhau
(theo hàng), giá trị dự đoán là giá trị trung bình được gán vào các vùng tương ứng (lá
của cây). Tại mỗi bước tính toán để tách nút 𝑡, theo công thức (6.12) tất cả các giá trị
của mỗi thuộc tính 𝑋 được xét để tìm điểm tách khi đạt độ giảm hỗn tạp (impurity)
∆𝑅 (𝑋, 𝑡 ) là lớn nhất. Do đó, trong quá trình xây dựng cây hồi quy, việc giảm sự hỗn
tạp trên từng thuộc tính cụ thể được dùng để tính độ đo sự quan trọng của thuộc tính
khi dùng mô hình cây.
Với mô hình rừng ngẫu nhiên, độ đo sự quan trọng của thuộc tính 𝑋 được tính
bằng cách lấy giá trị trung bình của tất cả các độ đo của các cây hồi quy độc lập. Có
một điểm lợi trong việc tính độ đo sự quan trọng của thuộc tính dùng mô hình rừng
ngẫu nhiên là độ đo của các biến có tương tác lẫn nhau đều được xem xét một cách
tự động, điều này khác hẳn với những phương pháp tính tương quan tuyến tính như
Kendall, Pearson. Độ đo sự quan trọng của thuộc tính 𝑋 còn được tính theo cách khác
dùng phương pháp lặp hoán vị cho kết quả chính xác hơn, tuy nhiên thời gian tính
toán lâu hơn do chạy nhiều lần rừng ngẫu nhiên trên tập dữ liệu mở rộng cỡ 2M chứa
các biến giả.
Gọi 𝐼𝑆𝑘 (𝑋𝑗 ), 𝐼𝑆𝑋𝑗 lần lượt là độ đo sự quan trọng của thuộc tính Xj trong một
cây hồi quy Tk(k=1...K) và trong một rừng ngẫu nhiên. Từ công thức (6.12), ta tính
độ đo sự quan trọng của Xj từ cây hồi quy độc lập như sau:
𝐼𝑆𝑘 (𝑋𝑗 ) = ∑𝑡∈𝑇𝑘 ∆𝑅(𝑋𝑗 , 𝑡), (6.21)
và từ rừng ngẫu nhiên là:
1
𝐼𝑆𝑋𝑗 = ∑𝐾
𝑘=1 𝐼𝑆𝑘 (𝑋𝑗 ). (6.22)
𝐾
1.8. Boosting
Mô hình boosting ban đầu được phát triển xử lý bài toán phân lớp sau đó được
mở rộng cho bài toán hồi quy. Trong mục này, kỹ thuật điển hình của boosting là
AdaBoost (Adaptive Boost) được trình bày vắn tắt, sau đó mô hình boosting của
Friedman với hàm cơ sở là cây hồi quy được áp dụng xử lý bài toán dự đoán sự hài
lòng của các hộ dân dùng nước tưới tiêu.
Adaboost là một bộ phân loại mạnh phi tuyến dựa trên hướng tiếp cận boosting
được Freund và Schapire đưa ra vào năm 1996 xử lý bài toán phân lớp nhị phân.
Adaboost hoạt động trên nguyên tắc kết hợp tuyến tính các phân loại yếu để hình
thành một phân loại mạnh. Để có thể kết hợp các bộ phân loại yếu, adaboost sử dụng
một trọng số (weight) để đánh dấu các mẫu khó nhận dạng. Trong quá trình huấn
luyện, cứ mỗi phân loại yếu được xây dựng, thuật toán sẽ tiến hành cập nhật lại trọng
số để chuẩn bị cho việc xây dựng phân loại yếu tiếp theo: tăng trọng số của các mẫu
bị nhận dạng sai và giảm trọng số của các mẫu được nhận dạng đúng bởi phân loại
yếu vừa xây dựng. Bằng cách này, các phân loại yếu sau có thể tập trung vào các mẫu
mà các phân loại yếu trước đó chưa thực hiện tốt. Sau cùng các phân loại yếu sẽ được
kết hợp tùy theo mức độ ‘tốt’ của chúng để tạo nên một phân loại mạnh.
Các bước thực hiện thuật toán AdaBoost như sau:
- Khởi tạo trọng số ban đầu cho tất cả các mẫu: với m là số mẫu đúng (ứng với
các mẫu có nhãn Y = 1) và l là số mẫu sai (có nhãn tương ứng Y = -1).
1 1
𝑤1,𝑘 = , (6.23)
2𝑚 2𝑙
- Xây dựng T các phân loại yếu. Lặp t = 1, …, T.
- Với mỗi mẫu trong ℒ, xây dựng một phân loại yếu hj với ngưỡng θj và lỗi εj.
- 𝜀𝑗 = ∑𝑁 𝑘=1 𝑤𝑡,𝑘 |ℎ𝑗 (𝑋𝑘 ) − 𝑌𝑘 | (6.24)
- Chọn ra hj với εj nhỏ nhất, ta được ℎ𝑡 : 𝑋 → {1, −1}
- Cập nhật lại trọng số:
𝑤𝑡,𝑘 𝑒 −𝛼𝑡 , ℎ𝑡 (𝑥𝑘 ) = 𝑦𝑘
𝑤𝑡+1,𝑘 = × { 𝛼𝑡 (6.25)
𝑍𝑡 𝑒 , ℎ𝑡 (𝑥𝑘 ) ≠ 𝑦𝑘
Trong đó:
1 1−𝜀𝑗
α𝑡 = ln ( ), (6.26)
2 𝜀𝑗
Boosting dùng cây hồi quy khác rừng ngẫu nhiên khi các cây trong Boosting có đóng
góp khác nhau khi đưa ra kết quả dự đoán cuối và cây hồi quy sau được xây dựng
phụ thuộc cây trước, ngoài ra chúng được xây dựng với chiều cao biết trước còn ở
rừng ngẫu nhiên các cây hồi quy được xây dựng độc lập và không cắt nhánh.
2. Thu thập và xử lý dữ liệu
2.1. Vùng nghiên cứu
Sông Tích - sông Bùi là một phụ lưu chính của sông Đáy. Sông Tích - sông Bùi
Bắt nguồn từ núi Tản Viên thuộc dãy núi Ba Vì theo hướng Tây Bắc – Đông Nam có
chiều dài 110 km đổ vào sông Đáy tại Ba Thá. Diện tích lưu vực 1.330 km2, phần
phía bờ phải có diện tích 910 km2, phần phía bờ trái có diện tích 390 km2. Lưu vực
dài 75,5 km rộng 17,6 km, độ cao trung bình lưu vực 92 m, độ dốc trung bình lưu vực
5,8%, mật độ lưới sông 0,66 km/km2. Sông Tích chảy qua nhiều vùng đồi, đất cứng
sức xói yếu. Tuy độ dốc của lòng sông Tích không lớn nhưng độ dốc của các sông
nhánh khá lớn, trung bình 10 ÷ 20 m/km, có suối tới 30 m/km (Hình 6.3).
Trong đó: H là mực nước; X là mưa; * là trạm cần dự báo mực nước.
Thông tin của các trạm được chỉ ra trong Bảng 6.1. Các dữ liệu này thu thập
trong khoảng thời gian từ 1/5 đến 31/11 trong 5 năm 2014, 2015, 2016, 2017 và 2018
với bước thời gian quan sát là 6h (Hình 5.4 và 5.5).
lại từ 1AM ngày 15/06 đến 19PM ngày 31/10 trong 4 năm, 2014, 2015, 2016 và 2017
được sử dụng.
Tương tự như vậy, mực nước đo theo chu kỳ 6h tại trạm Ba Thấ trong 3 tháng
từ 15/6 đến15/9 của 4 năm 2014, 2014, 2016 và 2017 được sử dụng để dự đoán mực
nước tương lai tại trạm Ba Tha.
Hình 6.5: Mực nước quan sát được tại trạm Ba Thá năm 2017
2.3. Xử lý dữ liệu
Dữ liệu được cần được chuẩn hoá trước khi đưa vào huấn luyện các mô hình dự
đoán. Do dữ liệu được thu thập và lưu không hoàn toàn đầy đủ. Ví dụ, lượng mưa
không phải luôn luôn được đo 6h một lần, mà có thời điểm hoặc vài ngày không được
đo. Thậm chí, đôi khi lại đo dày hơn như 3h một lần. Do đó, dữ liệu những ngày/giờ
thiếu cần được nội suy hoặc được gán giá trị trung bình khi tần suất đo mau hơn là
6h một lần. Thêm vào đó, để có thể ghép dữ liệu Mưa và mực nước lại, các dữ liệu
trong mỗi file cần được sắp xếp theo chiều tang dần về thời gian như trong Hình 5.6
Các dữ liệu mưa và mực nước này sau đó sẽ được ghép lại theo từng năm. Do
yêu cầu dự đoán trước mực nước 6, 12, 18, 24h. Do đó, các dữ liệu huấn luyện khác
nhau cần được tạo ra để phù hợp với yêu cầu dự đoán
Hình 6.7: Dữ liệu huấn luyện để dự đoán trước 6h (L6) cho năm 2014
Hình 6.8: Dữ liệu huấn luyện để dự đoán trước 12h (L12) cho năm 2015
Hình 6.9: Dữ liệu huấn luyện để dự đoán trước 18h (L18) cho năm 2016
Hình 6.10: Dữ liệu huấn luyện để dự đoán trước 24h (L24) cho năm 2017
Sau khi mô hình đã được huấn luyện sẽ được lưu ra thành file và được sử dụng
để dự đoán mực nước tương lai căn cứ vào dữ liệu hiện tại (mưa và mực nước). Dựa
trên kết quả dự đoán, chúng ta có thể vẽ biểu đồ để so sánh sự sai khác giữa dữ liệu
thực đo và dự đoán.
3. Thực nghiệm để lựa chọn mô hình
3.1. Mô tả dữ liệu
Thông tin của các trạm được chỉ ra trong Bảng 6.1 (ở trên). Các dữ liệu này thu
thập trong khoảng thời gian từ 1/5 đến 31/10 trong 4 năm 2014, 2015, 2016 và 2017
với bước thời gian quan sát là 6h (Hình 6.4 và 6.5 ở trên).
Việc dự đoán mực nước được thực hiện tại trạm Ba Thá trước 6h,12h, 18h, 24h.
Mực nước này được dự đoán dựa vào lượng mưa tại các trạm đo mưa và mực nước
hiện tại tại trạm Ba Thá. Ví dụ, để dự đoán mực nước tại trạm Ba Thá, dữ liệu mưa
đo được trong từng khoảng 6h ở các trạm thương lưu như Hoa Binh, Hoai Duc, Trạm
thuỷ văn Son Tay, Trạm khí tượng Son Tay, Trung Ha, Viet Tri và Ba Tha được ghi
lại từ 1AM ngày 15/06 đến 19PM ngày 31/10 trong 4 năm, 2014, 2015, 2016 và 2017
được sử dụng.
Tương tự như vậy, mực nước đo theo chu kỳ 6h tại trạm Ba Thá trong 3 tháng
từ 15/6 đến15/9 của 4 năm 2014, 2014, 2016 và 2017 được sử dụng để dự đoán mực
nước tương lai tại trạm Ba Tha.
Dữ liệu huấn luyện gồm 1382 bản ghi thu thập từ 1/5 đến 31/10 trong 4 năm
2014, 2015, 2016 và 2017. Tập dữ liệu kiểm thử gồm 239 bản ghi thu thập từ ngày
15/6/2018 đến ngày 24/9/2018.
3.2. Các độ đo đánh giá
Để đánh giá hiệu năng của các mô hình dự báo chúng tôi sử dụng các độ đo
MSE (Mean Squared Error), R2 và CE trong thực nghiệm của đề tài.
Độ đo MSE:
Nếu Yˆ là vector với n thành phần dự đoán và Y là vector các giá trị được quan
sát tương ứng với các đầu vào của hàm tạo ra các dự đoán Yˆ thì độ đo MSE được ước
lượng bởi công thức sau:
MSE
1 n ˆ
Yi Yi
n i 1
2
1 n
ei .
n i 1
(6.28)
Điều này có nghĩa là độ đo MSE là trung bình của bình phương các sai số. Chỉ
số này được tính toán một cách dễ dàng cho một mẫu đặc thù. Giá trị tốt nhất của độ
đo MSE là giá trị nhỏ nhất của nó.
Độ đo CE:
Bên cạnh độ đo MSE, độ đo CE tính theo chỉ tiêu NASH cũng được sử dụng để
đánh giá sai số dự đoán nhưng thường dùng trong phân tích chuỗi thời gian. Công
thức xác định độ đo CE được cho bởi:
2
∑𝑛 ̂
𝑖=1(𝑌𝑖 −𝑌𝑖 )
𝐶𝐸 = 1 − ̅𝑖 )2
(6.29)
(𝑌𝑖 −𝑌
Trong đó 𝑌̂𝑖 là thành phần dự đoán, 𝑌𝑖 là giá trị mực nước thực đo, 𝑌
̅𝑖 là giá trị
trung bình của mực nước thực đo. Giá trị của độ đo CE càng gần 1 càng tốt.
3.3. Các kết quả thực nghiệm
Gói phần mềm caret được sử dụng để tiến hành các thực nghiệm trên môi trường
R, các mô hình Học máy liệt kê ở phần I đều được tích hợp trong gói phần mềm này.
Dữ liệu huấn luyện gồm 1382 bản ghi thu thập từ 1/5 đến 31/11 trong 4 năm 2014,
2015, 2016 và 2017. Tập dữ liệu kiểm thử gồm 239 bản ghi thu thập từ ngày
15/6/2018 đến ngày 24/9/2018. Khi xây dựng mô hình học máy, chúng tôi sử dụng
kỹ thuật kiểm tra chéo 10-folds với 2 lần lặp và dựa trên hàm lỗi MSE để tìm tham
số tối ưu của từng mô hình, sau đó lựa chọn mô hình có MSE nhỏ nhất với tham số
tìm được để dự đoán dữ liệu kiểm thử. Các thực nghiệm được tiến hành trên 2 máy
phục vụ dùng hệ điều hành Windows Server 2012 64-bit, mỗi máy có cấu hình IntelR
XeonR CPU E5-2640 2.5 GHz, 24 cores, 8 MB cache và 128 GB RAM. Các mô hình
đều được cài đặt song song sử dụng hết 24 cores trên mỗi máy để huấn luyện, tìm
tham số tối ưu và các thực nghiệm khác.
Bảng 6.2: Kết quả dự đoán mốc trước 6h
TT Mô hình học máy Tham số tối ưu RMSE CE
1 Hồi quy tuyến tính (LM) Mặc định 0.162 0.992
2 Hồi quy LASSO 0.194 0.992
3 K láng giềng (KNN) k=4 0.916 0.992
Complexity parameter
4 Cây hồi quy (CART) 0.285 0.992
(cp)=0
Mạng nơ ron nhân tạo Trọng số phân rã=0.1 và
5 0.180 0.990
(ANN) số nơ-ron=9
Nhân poly, degree=1,
6 Máy véc-tơ hỗ trợ (SVR) 0.157 0.993
.001 và C = 16
7 Rừng ngẫu nhiên (RF) mtry = 5 và trees=1000 0.345 0.965
K = 50, interaction.depth
8 Boosting = 16, shrinkage = 0.1 và 0.199 0.988
n.minobsinnode = 10
Kết quả các mô hình học máy dự báo mực nước tại các mốc 6h, 12h, 18h và 24h
được trình bày ở Bảng trên. Ở 2 cột RMSE và CE kết quả dự đoán với CE cao nhất
và lỗi dự báo thấp nhất được in đậm và gạch dưới.
Ta có thể dễ dàng nhận thấy mô hình học máy k-láng giềng và cây hồi quy có
kết quả dự đoán kém nhất, mô hình hồi quy tuyến tính cho kết quả khả quan với số
liệu mực nước được thử nghiệm, mô hình LASSO có cải thiện khả năng dự báo hơn
so với mô hình tuyến tính nhiều biến. Các mô hình hồi quy phi tuyến tỏ rõ ưu thế
hơn, cụ thể như mạng nơ-ron nhân tạo, boosting, đặc biệt là phương pháp support
vector regression có kết quả dự đoán với lỗi dự báo nhỏ và CE cao.
4. Dự báo mực nước tại trạm Ba Thá sử dụng SVR
Qua các kết quả thử nghiệm ở trên cho thấy kết quả của phương pháp SVR là
tốt nhất với các kết quả thử nghiệm. Vì vậy chúng tôi lựa chọn phương pháp SVR để
dự báo mực nước tại trạm Ba Thá.
Gói phần mềm caret được sử dụng để tiến hành các thực nghiệm trên môi trường
R. Dữ liệu huấn luyện (training data) gồm 1382 bản ghi thu thập từ 1/5 đến 31/11
trong 4 năm 2014, 2015, 2016 và 2017. Tập dữ liệu kiểm thử (testing data) gồm 239
bản ghi thu thập từ ngày 15/6/2018 đến ngày 24/9/2018. Khi xây dựng mô hình dự
báo sử dụng SVR, chúng tôi sử dụng kỹ thuật kiểm tra chéo 10-folds với 2 lần lặp và
dựa trên hàm lỗi MSE để tìm tham số tối ưu của mô hình (C, d), sau đó lựa chọn mô
hình có MSE nhỏ nhất với tham số tìm được để dự đoán dữ liệu kiểm thử.
Bảng dữ liệu training và Bảng dữ liệu testing được thể hiện trong các bảng 6.6
và 6.7 dưới đây.
Bảng 6.6: Bảng dữ liệu training
Kết quả chạy SVR trên tập huấn luyện để tìm tham số tối ưu (C, degree của hàm
nhân đa thức dùng trong SVR) dùng kỹ thuật đánh giá chéo 10-folds, tham số lựa
chọn là degrescale scale=0.001 và C = 16.
Kết quả thực nghiệm sử dụng phương pháp SVR để dự báo mực nước tại trạm
Ba Thá được thể hiện trong Hình 6.6 và Bảng 6.8 dưới đây.
Hình 6.6: Kết quả thực nghiệm dự báo mực nước tại trạm Ba Thá sử SVR
Bảng 6.8: Bảng kết quả thực nghiệm dự báo mực nước tại trạm Ba Thá sử dụng
phương pháp SVR
TT SVR Tham số tối ưu RMSE CE
1 Mốc 6h Nhân poly, degree=1, 0.157 0.993
=0.001 và C = 16
2 Mốc 12h - 0.254 0.981
3 Mốc 18h - 0.373 0.958
4 Mốc 24h - 0.460 0.938
Đôi khi, chúng ta chỉ cần nhìn vào thông tin gần đây để thực hiện nhiệm vụ hiện
tại. Ví dụ: hãy xem xét mô hình ngôn ngữ cố gắng dự đoán từ kế tiếp dựa trên các mô
hình trước đó. Nếu chúng ta đang cố gắng dự đoán từ cuối cùng trong "những đám
mây đang trên bầu trời ", chúng ta không cần bất kỳ bối cảnh nào nữa - thì rõ ràng từ
tiếp theo sẽ là bầu trời. Trong những trường hợp như vậy, khi khoảng cách giữa thông
tin liên quan và nơi cần thiết là nhỏ, RNNs có thể học cách sử dụng thông tin trong
quá khứ.
Nhưng trong nhiều tình huống ta buộc phải sử dụng nhiều ngữ cảnh hơn để suy
luận. Ví dụ, dự đoán chữ cuối cùng trong đoạn: “Tôi sinh ra và lớn lên tại Pháp…
Tối có thể nói thuần thục tiếng Pháp.”. Từ thông tin gần nhất cho thấy rằng từ tiếp
theo là tên một ngôn ngữ nhưng khi chúng ta muốn biết cụ thể ngôn ngữ nào thì cần
quay về quá khứ xa hơn để tìm được ngữ cảnh “Tôi sinh ra và lớn lên tại Pháp”. Và
như vậy, RNN có thể phải tìm những thông tin có liên quan và số lượng các điểm đó
trở nên rất lớn. Rõ ràng là khoảng cách thông tin lúc này có thể đã khá xa rồi.
Không được như mong đợi, RNN không thể học để kết nối các thông tin lại với
nhau. Về mặt lý thuyết, rõ ràng là RNN có khả năng xử lý các phụ thuộc xa (long-
term dependencies). Chúng ta có thể xem xét và cài đặt các tham số sao cho khéo là
có thể giải quyết được vấn đề này. Tuy nhiên, đáng tiếc trong thực tế RNN có vẻ
không thể học được các tham số đó. Vấn đề này đã được khám phá khá sâu
bởi Hochreiter (1991) và Bengio, et al. (1994), trong các bài báo của mình, họ đã tìm
được nhưng lý do căn bản để giải thích tại sao RNN không thể học được. Tuy nhiên,
LSTM không vấp phải vấn đề đó!
5.3. Mạng LSTM
LSTM là một dạng đặc biệt của RNN, nó có khả năng học được các phụ thuộc
xa. Mô hình LSTM được giới thiệu bởi Hochreiter & Schmidhuber (1997), và sau đó
đã được cải tiến và phổ biến bởi rất nhiều người trong ngành. Chúng hoạt động cực
kì hiệu quả trên nhiều bài toán khác nhau nên dần đã trở nên phổ biến như hiện nay.
Hình 6.8: Các mô-đun lặp của mạng mạng RNN chứa 1 lớp
LSTM được thiết kế nhằm loại bỏ vấn đề phụ thuộc quá dài (long-term
dependency). Việc nhớ thông tin trong suốt thời gian dài là đặc tính mặc định của
chúng, chứ ta không cần phải huấn luyện nó để có thể nhớ được. Tức là ngay nội tại
của nó đã có thể ghi nhớ được mà không cần bất kì can thiệp nào.
Mọi mạng hồi quy đều có dạng là một chuỗi các mô-đun lặp đi lặp lại của mạng
nơ-ron. Với mạng RNN chuẩn, các mô-đun này có cấu trúc rất đơn giản, thường là
một lớp đơn giản tanh layer.
LSTM cũng có cấu trúc mắt xích tương tự, nhưng các mo-đun lặp có cấu trúc
khác với mạng RNN chuẩn. Thay vì chỉ có một tầng mạng nơ-ron, thì LSTM có tới
bốn tầng tương tác với nhau theo một cách rất đặc biệt.
Hình 6.9: Các mô-đun lặp của mạng LSTM chứa 4 lớp
PHẦN 3
CÔNG CỤ CẢNH BÁO VÀ DỰ BÁO LŨ LỤT SÔNG
TÍCH-BÙI
Chương 7
- Materialized views
- Bitmap indexes
- Table compression
- Parallel Execution (thực thi song song)
- Analytic SQL
- Data mining (khai phá dữ liệu)
- Partitioning
d. Hệ quản trị cơ sở dữ liệu MS ACCESS
Đây là một trong những sản phẩm của Microsoft. Microsoft Access là phần
mềm quản lý dữ liệu ở mức độ nhập. MS Access là hệ quản trị cơ sở dữ liệu hoàn
toàn phù hợp với các dự án nhỏ. MS Access sử dụng Jet database engine, dùng ngôn
ngữ SQL riêng (đôi khi được gọi là Jet SQL). MS Access đi cùng với gói MS Office.
MS Access dễ dàng sử dụng bằng giao diện.
Tính năng:
- Người dùng có thể tạo bảng, truy vấn, form và reports kết nối với nhau.
- Nhập và xuất dữ liệu với nhiều định dạng khác nhau như Excel, Outlook, ASCII,
dBase, Paradox, FoxPro, SQL Server, Oracle, ODBC,….
Từ các thông tin có được, chúng tôi đưa ra một số giải pháp xây dựng hệ thống
như sau:
- Tổ chức hệ thống theo mô hình dữ liệu tập trung: CSDL lưu trữ tại Trung tâm
dữ liệu và việc cập nhật, truy xuất hoặc kết xuất dữ liệu thông qua môi trường
mạng có bảo mật.
Hệ quản trị CSDL: Microsoft SQL Server 2016 là một hệ quản trị CSDL hiện
đại, chạy được trên nhiều nền tảng hệ điều hành (kể cả Linux), đồng bộ với nền tảng
xây dựng phần mềm đã chọn và bộ công cụ phát triển, đáp ứng được các yêu cầu đề
ra của hệ thống và có giải pháp mở rộng tận dụng dữ liệu dùng chung. Microsoft SQL
Server 2016 cho phép hàng ngàn người kết nối làm việc cùng một lúc, có khả năng
trao đổi dữ liệu với các cơ sở dữ liệu khác, đảm bảo khả năng bảo mật. Các cơ sở dữ
liệu có có thể có kích cỡ lớn, có thể ứng dụng theo mô hình kho dữ liệu.
1.2. Thiết kế cơ sở dữ liệu
Cơ sở dữ liệu là nền tảng của hệ thống, tại cơ sở dữ liệu sẽ lưu trữ tất cả các dữ
liệu liên quan đến đề tài. Trong đề tài này, mô hình cơ sở dữ liệu được xây dựng theo
cấu trúc như sau:
a. Hệ thống sông
1. Sông được phân loại và đánh chỉ số ID.
2. Tên sông
3. Ghi chú.
4. Bảng cao độ đê trái và phải với khoảng cách cộng dồn tương ứng.
b. Hệ thống mặt cắt
1. Mặt cắt được phân loại và đánh chỉ số ID
2. Mã số sông chứa mặt cắt.
3. Tên mặt cắt.
4. Khoảng cách cộng dồn và năm đo.
5. Bảng số liệu mặt cắt ngang X-Y của mặt cắt
c. Hệ thống khu phân chậm lũ
- Các ô được phân loại và đánh chỉ số ID.
- Tên ô
- Bảng số liệu về quan hệ V-Z; F-Z của các ô
d. Hệ thống công trình
- Công trình được phân loại và đánh chỉ số ID.
- Tên công trình.
- Các thuộc tính khác của công trình.
e. Hệ thống trạm khí trượng – thủy văn
- Trạm được phân loại và đánh chỉ số ID.
- Têm trạm.
- Tọa độ các trạm
- Số hiệu quốc tế của các trạm.
f. Số liệu mực nước
- Số liệu được phân loại và đánh chỉ số ID.
- Mã trạm đo.
- Thời gian đo.
- Số liệu đo.
- Cờ.
g. Số liệu Lưu lượng
- Số liệu được phân loại và đánh chỉ số ID.
- Mã trạm đo.
- Thời gian đo.
- Số liệu đo.
- Cờ.
h. Số liệu Nhiệt độ
- Số liệu được phân loại và đánh chỉ số ID.
- Mã trạm đo.
- Thời gian đo.
- Số liệu đo.
- Cờ.
i. Số liệu Độ ẩm
- Số liệu được phân loại và đánh chỉ số ID.
- Mã trạm đo.
- Thời gian đo.
- Số liệu đo.
- Cờ.
Cấu trúc các bảng dữ liệu được mô tả chi tiết như sau:
1. Bảng dữ liệu công trình
STT Tên trường Loại dữ liệu Ràng buộc Ghi chú
1 CT_ID int Unchecked Mã công trình
2 CT_Name nvarchar(250) Checked Tên công trình
3 CT_HSQTN real Unchecked Hệ số Q tràn
4 CT_HSQTTD real Unchecked Hệ số Q tràn
5 HS_Q_CONG real Unchecked Hệ số Q qua cống
6 Z_NGUONG real Unchecked Cao trình ngưỡng
4. Bảng dữ liệu đê
STT Tên trường Loại dữ liệu Ràng buộc Ghi chú
1 D_ID int Unchecked Mã cao độ đê
2 S_ID int Checked Mã sông
3 D_TG datetime Unchecked Thời gian đo
4 D_KCCD real Unchecked Trắc dọc
Bố cục trình bày dễ xem và dễ sử dụng, dễ tìm kiếm, đem lại nhiều thông
tin cho người đọc.
- Hệ thống dễ sử dụng.
Các chức năng của hệ thống được bố trí thân thiện, phù hợp với người
dùng cuối.
Các icon hiệu ứng 3D thể hiện được nội dung cụ thể của các module khi
bấm nút.
- Quản trị hệ thống.
Cho phép bộ phận quản trị hệ thống quản lý cập nhật và duyệt các nội dung của
hệ thống.
1.6. Nhập dữ liệu vào hệ thống
Sau khi hoàn tất công đoạn xử lý nội dung, tiến hành công đoạn nhập dữ liệu
vào hệ thống.
Thông tin của dữ liệu sẽ được nhập vào các trường tương ứng của biểu ghi thể
hiện tài liệu trong cơ sở dữ liệu. Việc nhập dữ liệu phải bảo đảm chính xác với nội
dung thông tin trên phiếu nhập tin đã được xử lý, kiểm tra, biên tập. Nội dung thông
tin nhập vào phải đúng các trường đã được xác định.
Việc nhập tin phải đảm bảo sau khi hoàn thành, hệ thống sẽ hiển thị đầy đủ,
chính xác thông tin về tài liệu khi được yêu cầu, việc tìm tin trong CSDL dựa trên
những điểm tiếp cận thông tin đã được lựa chọn và xử lý phải thuận lợi, nhanh chóng
và chính xác.
Hoàn tất công đoạn này, việc quản lý thông tin thư mục của tài liệu đã được
thực hiện xong. Khi đó, sử dụng hệ thống sẽ có thể tìm được dữ liệu theo những từ
khoá chuyên ngành có kiểm soát và không có kiểm soát hay những yêu tố thông tin
của dữ liệu đã được xử lý.
Xác định các đối tượng quản trị của hệ thống dữ liệu cũng như sơ bộ phương án
xử lý chúng trong hệ thống là bước đầu tiên để hình thành nên sơ đồ của hệ thống
cũng như phương thức hoạt động của hệ thống quản trị cơ sở dữ liệu . Trên cơ sở đó
để đưa ra các yêu cầu, các bài toán, các tính năng của hệ thống để yêu cầu đơn vị thiết
kế, lập trình giải quyết đảm báo đáp ứng được yêu cầu của phần mềm tính toán cũng
như yêu cầu của truy xuất, thống kê của người dùng.
Thêm dữ liệu
Đối với các nút thêm dữ liệu, người dùng điền các thông tin vào các ô tương
ứng và ấn nút “Thêm” để ghi mới vào CSDL. Nếu cần làm lại hoặc đang ở chế độ
sửa, ấn nút “Đọc lại”, chương trình sẽ chuyển sang chế độ thêm dữ liệu để người
dùng thực hiện các thao tác thêm.
Sửa dữ liệu
Khi nhấn đúp vào danh sách dữ liệu, chương trình sẽ tự động điền dữ liệu của
hàng tương ứng vào các ô để sửa. Người dùng chỉnh sửa nội dung các ô và ấn nút
“Sửa” để chương trình cập nhật thông tin cần sửa. Nếu muốn thoát ra khỏi chế độ
sửa, ấn nút “Đọc lại”.
Xóa dữ liệu
Trong chế độ sửa (sau khi ấn đúp vào danh sách số liệu), nếu thấy dữ liệu không
cần thiết, người dùng ấn nút “Xóa” để loại dữ liệu tương ứng đã chọn ra khỏi danh
sách của cơ sở dữ liệu.
Trích xuất dữ liệu
Mỗi bảng biểu, đồ thị đều được đính kèm các nút trích xuất dữ liệu tương ứng
ra file text (Ghi file - đối với các dữ liệu dạng chuỗi số) hay file ảnh (Ghi-đối với cá
kết quả dạng đồ thị). Bên cạnh đó, chương trình có thể trích xuất theo kịch bản cho
trước nhằm tạo các số liệu đầu ra cho các chương chình khác nhằm kết nối nhanh
chóng thành một bộ các công cụ toàn diện.
1.7. Các kết quả nhập liệu
- 3 sông
- 506 mặt cắt
- 47 khu phân chậm lũ
- 26 công trình
- 2 trạm thủy văn
- 8 trạm khí tượng
- Số liệu mực nước mùa lũ theo ốp 6h các trạm Ba Thá và Phủ lý trong 5 năm
(từ năm 2014 đến năm 2018)
- Số liệu mưa mùa lũ theo ốp 6h các trạm Ba Thá, Hòa Bình, Ba Vì, Hoài Đức,
Sơn Tây khí tượng, Sơn Tây thủy văn, Trung Hà, Việt Trì trong 5 năm (từ năm
2014 đến năm 2018)
Hình 7.2: Bản đồ Google Map lưu vực sông Tích Bùi
Điểm lưu ý là MapWindow sử dụng giấy phép mã nguồn mở MPL 1.1, có thể
sử dụng trong các ứng dụng thương mại và phi thương mại, nghĩa là ngoài việc không
mất phí sử dụng mà còn có thể tích hợp vào bộ đóng gói phần mềm để chuyển giao
cho các đơn vị sử dụng.
Có nhiều phương án để xây dựng ứng dụng dựa trên MapWindow, từ cách đơn
giản nhất là cài đặt và sử dụng (nghĩa là không cần phải lập trình), hay sử dụng các
Plug-in có sẵn, cho đến sử dụng mã để lập trình (nghĩa là sử dụng MapWindow ở
mức thấp nhất).
Do không chỉ đơn thuần là đọc và hiển thị dữ liệu bản đồ hay cung cấp các thao
tác cơ bản để xem bản đồ nên luận án đã tiếp cận theo cách xây dựng ứng dụng từ
đầu và sử dụng ActiveX MapWinGIS (lõi của mã nguồn mở MapWindow) để thao
tác với dữ liệu GIS. Với cách tiếp cận này chúng ta hoàn toàn có thể tùy biến giao
diện cũng như truy vấn, ví dụ có thể tắt hoặc tùy biến bảng chú giải (legend), vùng
quản lý lớp, bản đồ nhỏ, hay tắt các plug-in hỗ trợ,...
MapWinGIS cung cấp các lớp và Enumeration để thao tác với các dữ liệu bản
đồ (như thao tác với shapefile, điều khiển việc hiển thị nhãn trên bản đồ, làm việc với
lưới bản đồ,...). Trong đó, hai lớp quan trọng là lớp Shapefile (chứa các hàm để thao
tác trên một lớp bản đồ, cả dữ liệu không gian lẫn dữ liệu phi không gian) và lớp Map
(thành phần chính trong ứng dụng MapWindow GIS, biểu diễn lưới, ảnh và các
shapefile).
Khi các module tính toán thủy lực và môi trường có kết quả sau mỗi bước xuất
kết quả, chúng lập tức được cập nhật để hiển thị trên module có sử dụng MapWinGIS
để hiển thị kết quả tương ứng với số liệu đó.
3. Song song hóa các mô đun tính toán
3.1. Kỹ thuật tính toán song song
Tính toán song song hiệu suất cao được thực hiện bằng cách tách các nhiệm vụ
lớn và phức tạp ra nhiều phần để chạy trên nhiều đơn vị xử lý. Mặc dù có nhiều
phương pháp có thể sử dụng để cải thiện hiệu suất hệ thống các máy tính, nhưng
phương pháp thông dụng nhất để tổ chức và điều phối quá trình xử lý song song là
viết code tự động phân tích bài toán sắp đến và cho phép các đơn vị xử lý liên lạc với
nhau khi cần thiết trong khi thực hiện công việc.
Không phải tất cả các bài toán đều có thể tính toán song song. Nếu không có
công việc con nào có thể thực hiện đồng thời hoặc nếu hệ đang được mô tả phụ thuộc
lẫn nhau mạnh (bài toán "fine-grained"), mọi nỗ lực song song hoá nó có thể dẫn tới
tăng thời gian tính toán. May mắn là rất nhiều các bài toán khoa học phức tạp có thể
phân tích thành các nhiệm vụ riêng biệt để thực hiện độc lập và đồng thời bởi nhiều
đơn vị xử lý. Thông thường nhất là việc tách các toạ độ không gian (hoặc thời gian)
của hệ được mô hình thành các vùng không gian con (hay khoảng thời gian con) và
có thể tính toán đồng thời. Những ứng dụng loại này, được gọi là "coarse grained",
khá dễ dàng song song hoá và chúng ta có thể có được lợi ích lớn nhất từ xử lý song
song.
Việc song song hóa một bài toán phụ thuộc vào điều kiện về phần cứng và phần
mềm để từ đó lựa chọn phương pháp tối ưu cho bài toán đó. Các phương pháp song
song thường dựa trên kiến trúc bộ nhớ cơ bản - bộ nhớ chia sẻ, bộ nhớ phân tán, hay
hỗn hợp. Các ngôn ngữ lập trình chia sẻ bộ nhớ giao tiếp bằng cách điều khiển các
biến chia sẻ bộ nhớ (OpenMP là API phổ biến nhất sử dụng bộ nhớ chia sẻ), bộ nhớ
phân tán sử dụng phương pháp truyền tin trong đó (giao diện truyền tin MPI là API
sử dụng hệ thống truyền tin nổi bật nhất). Trong 10 năm trở lại đây, các hệ thống sử
dụng card đồ họa (GPU) tính toán được phát triển mạnh mẽ nhờ ưu điểm của chúng
so với CPU (số lõi tính toán lớn – hàng ngàn đơn vị xử lý trên 1 card), mỗi card đồ
họa có 1 bộ nhớ riêng, các bộ nhớ này được giao tiếp với bộ nhớ của CPU qua các
thư viện riêng (ví dụ như CUDA của dòng card đồ họa Nvidia).
a. OpenMP
OpenMP được coi như một giao diện lập trình ứng dụng API
(ApplicationProgram Interface) chuẩn dành cho lập trình với bộ nhớ chia sẻ. Hệ thống
bộ nhớ chia sẻ bao gồm nhiều bộ xử lý CPU, mỗi bộ xử lý truy cập tới bộ nhớ chung
thông qua các siêu kết nối hoặc các đường bus. Việc sử dụng không gian địa chỉ đơn
làm cho mỗi bộ xử lý đều có một cái nhìn giống nhau về bộ nhớ được sử dụng. Truyền
thông trong hệ thống bộ nhớ chia sẻ thông qua cách đọc và ghi dữ liệu giữa các bộ
xử lý với nhau lên bộ nhớ. Với cách này, thời gian truy cập tới các phần dữ liệu là
như nhau, vì tất cả các quá trình truyền thông đều thông qua đường bus.
Ưu điểm của kiến trúc này là dễ dàng lập trình, bởi vì không yêu cầu sự truyền
thông giữa các bộ xử lý với nhau, chúng chỉ đơn giản là truy cập tới bộ nhớ chung.
Có thể xem mô hình lập trình OpenMP như là một mô hình Fork-Join, Hình 7.3.
(graphics pipeline). Từ đòi hỏi của thị trường cho đồ họa 3D thời gian thực và đồ họa
với độ phân giải cao, các GPU đã phát triển với kiến trúc song song hóa mức cao, xử
lý đa luồng với kiến trúc manycore processor đã đem lại khả năng tính toán cùng với
băng thông bộ nhớ rất cao, thậm chí còn vượt qua những CPU thông thường.
Hình 7.5: Tiến trình thực hiện của 1 chương trình CUDA
Lý do dẫn đến việc GPU có khả năng tính toán các phép tính dấu phẩy động cao
hơn CPU là vì GPU được thiết kế cho các tác vụ đòi hỏi sự song song hóa ở mức cao,
đó cũng chính là đòi hỏi của việc rendering đồ họa. Chính vì thế nên trong thiết kế,
GPU sử dụng phần lớn transitors cho việc xử lý dữ liệu hơn là việc điều khiển luồng
và đưa dữ liệu vào bộ nhớ đệm (data caching).
GPU có các đặc tính sau:
Nhấn mạnh xử lý song song (Emphasize parallelism): GPU là về cơ bản máy
song song và việc sử dụng hiệu quả nó phụ thuộc vào mức độ xử lý song song
trong khối lượng công việc. Ví dụ, NVIDIA CUDA chạy hàng ngàn luồng chạy
tại một thời điểm, tối đa hóa cơ hội che giấu độ trễ bộ nhớ bằng cách sử dụng
đa luồng. Nhấn mạnh xử lý song song đòi hỏi lựa chọn các thuật toán mà chia
miền tính toán thành càng nhiều mảnh độc lập càng tốt. Để tối đa hóa số lượng
luồng chạy đồng thời, GPU lập trình cũng nên tìm cách giảm thiểu việc sử dụng
thread chia sẻ tài nguyên (như dùng các thanh ghi cục bộ và bộ nhớ dùng chung
CUDA), và nên sự đồng bộ giữa các luồng là ít đi.
Giảm thiểu sự phân kỳ SIMD (Minimize SIMD divergence): GPU cung cấp một
mô hình lập trình SPMD: nhiều luồng chạy cùng một chương trình tương tự,
nhưng truy cập dữ liệu khác nhau và do đó có thể có sự khác nhau trong thực
thi của chúng. Tuy nhiên, trong một số trường hợp đặc biệt, GPU thực thi chế
độ SIMD cho các lô các luồng. Nếu luồng trong một lô trệch ra, toàn bộ lô sẽ
thực thi cùng các đường code cho đến khi các luồng hội tụ lại. Tính toán hiệu
năng cao GPU đòi hỏi cơ cấu code sao cho giảm thiểu sự phân kỳ trong lô.
Tăng tối đa cường độ số học (Maximize arithmetic intensity): Trong khung cảnh
tính toán ngày nay, các tính toán thực tế là tương đối tốt nhưng băng thông bị
hạn chế. Điều này thật sự rất đúng với GPU nơi hỗ trợ rất tốt tính toán dấu phảy
động. Để tận dụng tối đa sức mạnh đó cần cấu trúc thuật toán để tối đa hóa
cường độ số học, hoặc số lượng các tính toán trên số thực hiện trong mỗi thao
tác với bộ nhớ. Truy cập dữ liệu mạch lạc bằng các luồng trợ giúp riêng biệt bởi
vì các thao tác này có thể kết hợp để làm giảm tổng số thao tác bộ nhớ. Sử dụng
bộ nhớ dùng chung CUDA trên GPU NVIDIA cũng giúp giảm overfetch (do
các luồng có thể giao tiếp) và cho phép các chiến lược "blocking" việc tính toán
trên bộ nhớ của chip.
Khai thác băng thông dòng (Exploit streaming bandwidth): Mặc dù có tầm quan
trọng của cường độ số học, nó là cần lưu ý rằng GPU có băng thông rất ít (very
high peak) trên bộ nhớ đi kèm, cỡ 1/10 băng thông bộ nhớ thông dụng trên nền
máy PC. Đây là lý do tại sao GPU có thể thực thi tốt hơn CPU ở các tác vụ như
sắp xếp, trong đó có tỷ lệ tính toán/băng thông thấp. Để đạt được hiệu năng cao
trên các ứng dụng như thế đòi hỏi các mẫu truy cập bộ nhớ dòng (streaming)
trong đó các luồng đọc và ghi vào các khối lớn liền mạch (tối đa hóa băng thông
cho mỗi giao dịch) nằm trong các khu vực riêng biệt của bộ nhớ (tránh các rủi
ro dữ liệu).
Hình 7.6: Mô hình siêu máy tính có card mạng kết nối chuyên dụng GPUDirect
RDMA
Bên cạnh đó, các hãng sản xuất hiện nay cũng đang tập trung nghiên cứu sản
xuất các bộ vi xử lý có cấu trúc tối ưu phục vụ tính toán trí tuệ nhân tạo như các dòng
FPGA (Field-Programmable Gate Arrays).
mạng máy tính mà chỉ đóng gói kèm thư viện động hoặc cần cài các driver mặc định
của nhà sản xuất phần cứng là sử dụng được. Khi được chuyển giao, người sử dụng
cũng dễ dàng chạy trên các máy tính cá nhân nhanh chóng mà không cần kiến thức
chuyên sâu về song song.
+ OpenMP: Ứng dụng được cho mọi máy tính phổ thông CPU đa lõi hiện có trên thị
trường. Trong thử nghiệm này, chúng tôi sử dụng CPU Intel i7 3770 4 lõi 8 thread
với tốc độ 3.9 Ghz, năng lực tính toán dấu phẩy động theo công bố của nhà sản xuất
là 125 GFLOP.
Khai báo thư viện sử dụng:
#ifdef _OPENMP
include 'omp_lib.h'
#endif
#ifdef _OPENMP
Đối với cả hai giải thuật, trong vòng lặp điều kiện dừng (RMS nhỏ hơn sai số
cho trước hoặc số bước lặp lớn hơn số cho trước), thao tác huấn luyện mạng được
chạy cho nhiều mẫu học. Mỗi mẫu học này được chương trình phân bổ trên các lõi
CPU. Do đó, sau dòng lệnh vòng lặp điều kiện dừng và trước dòng lệnh vòng lặp
huấn luyện theo các mẫu, bẫy song song được đặt để chia nhỏ công việc cho các CPU,
có kèm ghi chú các biến dùng chung cũng như các biến riêng cho từng lõi.
!$omp parallel SHARED(danh sách biến chung...) private(danh sách biến riêng...)
!$omp do
Kết thúc vòng lặp huấn luyện, đặt bẫy chặn để chờ các lõi hoàn tất phần tính
của mình, các giá trị tính được này được tập trung cập nhật vào bộ nhớ chung và hoàn
tất phần tính song song.
!$omp end do
!$omp barrier
!$omp end parallel
+ GPU: Trong khuôn khổ đề tài này, chúng tôi có sử dụng kinh phí tự có để mua thiết
bị tính toán là 01 card NVIDIA GeForce GTX 1060 6GB với thông số được trình bày
như Bảng 7.1.
Transistors 4.4 tỉ
Sơ đồ khối khi song song trên GPU được thể hiện như hình 7.7 dưới đây.
Bắt đầu
Truyền dữ liệu từ
Host đến Device
Kết thúc
Hình 7.7: Sơ đồ khối cách thực hiện song song trên GPU
Trong đó:
- Host: là những tác vụ và cấu trúc phần cứng, phần mềm được xử lý từ CPU.
- Driver: là những tác vụ và cấu trúc phần cứng, phần mềm được xử lý từ
GPU.
Quá trình được diễn giải như sau:
Dữ liệu cần được tính toán luôn ở trên bộ nhớ của Host vì vậy bước 1 là
truyền dữ liệu cần tính toán từ bộ nhớ Host qua bộ nhớ Device.
Sau đó Device sẽ gọi các hàm riêng của mình để tính toán dữ liệu đó.
Sau khi tính toán xong, dữ liệu cần được trả về lại cho bộ nhớ của Host.
Trong khuôn khổ nghiên cứu cứ này chúng tôi lấy kiểm tra khả năng tính toán của
mô hình thủy văn trong các trường hợp song song hóa và không song song hóa để
thấy rõ hiệu quả của việc song song hóa.
Chúng tôi lựa chọn tính toán mô phỏng lại trận lũ của các năm 2014, 2015, 2016
và 2017 bằng chường trình không song song, chương trình song song OpenMP và
GPU. Mỗi bài toán được chúng tôi chạy 100 lần để tính thời gian trung bình của mỗi
phương pháp, kết quả được thể hiện ở bảng 7.3 dưới đây.
Bảng 7.2: Thời gian tính trung bình của các bài toán thử nghiệm
Phương án tính Tính đơn nhân Tính đa nhân CPU Tính đa nhân Tỉ lệ thời gian
CPU (OpenMP) GPU
Hình 7.8: Biểu đồ hiệu năng card đồ họa khi xử lý song song trên GPU
Qua các kết quả trong Bảng 7.2 ở trên có thể thấy: Khi số lượng phần tử là nhỏ,
việc song song trên GPU lại không mang lại hiệu quả, thậm chí còn gây ra sự chậm
trễ tổng thể tính toán do phải truyền dữ liệu nhiều; tính đa lõi CPU bằng OpenMP đạt
hiệu quả tốt nhưng cũng chưa đạt hết mức độ thiết kế. Khi số lượng phần tử cần tính
tăng, việc tính toán song song cho bài toán sử dụng thuật toán hiện càng hiệu quả do
tính song song của các bài toán này lớn. Tính song song thể hiện ở chỗ: trong mỗi
bước, các phép tính của các phần tử khác nhau là độc lập. Do đó, khi áp dụng tính
song song cho bài toán giải hiện đem lại hiệu quả cao. Đối với các bài toán dự báo
khác trong thực tế, thời gian tính lên đến đơn vị hàng tháng, hoặc các tác vụ yêu cầu
xử lý thời gian thực, việc song song hóa tính toán là một yêu cầu bắt buộc.
Ngoài ra, chúng tôi đánh giá kết quả qua việc phân tích biểu đồ đo hiệu năng
card đồ họa của Windows bằng phần mềm thông dụng Task Manager (phiên bản
Windows 10 Fall Creator phát hành vào 17/10/2017) như Hình 7.8.
Một vài nhận xét:
Thuật toán song song áp dụng cho tập dữ liệu trong bài toán này chưa tận dụng
hết 1280 lõi của card đồ họa nên chưa đạt hiệu quả cao nhất.
Với bài toán có khối lượng truyền dữ liệu lớn, nên xảy ra hiện tượng ngắt quãng
thời gian xử lý trên card đồ họa mặc dù bài toán có khối lượng tính toán lớn
nhưng thời gian ngắt quãng đợi truyền dữ liệu đã làm chậm tiến độ và giảm hiệu
xuất của song song.
Hình 7.9: Các công cụ tính toán, quản lý dữ liệu được tích hợp trên giao diện chính
Hình 7.10 cho thấy giao diện quản lý chung các mô đun tính toán. Còn mô đun
quản lý cơ sở dữ liệu.
Hình 7.11: Mô đun quản lý CSDL được tích hợp trên phần mềm chung
Hình 7.16:Hoàn tất việc cài đặt chương trình vào máy tính.
Ấn Finish để kết thúc cài đặt và bắt đầu sử dụng chương trình.
Để gỡ cài đặt phần mềm ra khỏi hệ thống, vào thư mục cài đặt chương trình,
chọn file uninstall.exe để thực hiện
Hình 7.18:Hoàn tất việc gỡ cài đặt chương trình ra khỏi máy tính.
Ấn Finish để hoàn tất việc gỡ bỏ chương trình.
Để chạy trường trình lựa chọn biểu tượng trên màn hình desktop:
Khi chương trình được chạy, đòi hỏi người dùng phải đăng nhập với tên và
mật khẩu được cấp để có thể có quyền truy cập chương trình với mức độ ưu tiên ứng
với tên đăng nhập.
Chương 8
3.5
2.5
1.5
0.5
0
8/26/14 0:00
8/27/14 0:00
8/28/14 0:00
8/29/14 0:00
8/30/14 0:00
8/31/14 0:00
9/10/14 0:00
9/11/14 0:00
9/12/14 0:00
9/13/14 0:00
9/14/14 0:00
9/15/14 0:00
9/1/14 0:00
9/2/14 0:00
9/3/14 0:00
9/4/14 0:00
9/5/14 0:00
9/6/14 0:00
9/7/14 0:00
9/8/14 0:00
9/9/14 0:00
Hình 8.1: Kết quả hiệu chỉnh mô hình theo trận lũ năm 2014
Kết quả hiệu chỉnh mô hình theo hai trận lũ được thể hiện trên các Figure 3 và
Figure 4. Các hình vẽ cho thấy kết quả tính toán đã được hiệu chỉnh bám khá sát với
số liệu thực đo. Đặc biệt là kết quả tính toán mô phỏng khá chính xác phần đỉnh của
cả hai trận lũ. Nhìn chung kết quả tính toán của trận lũ năm 2014 tốt hơn so với kết
quả tính toán của trận lũ năm 2015. Các đồ thị cũng cho ta thấy sai số giữa tính toán
và thực đo thường sảy ra khi mực nước thấp. Một trong các nguyên nhân gây nên sai
số này có lẽ là do sự anhe hưởng của các hồ chứa trong lưu vực. Khi mưa lớn trong
thời gian dài (mực nước sông lên cao) thì các hồ này đầy nước và ở chế độ tràn tự do.
Còn khi mưa nhỏ và mưa ngắt quãng thì một phần nước được lưu trữ lại trong các hồ
này tạo nên sự thiếu hụt nước. Đây là vấn đề mà mô hình tính toán không phản ánh
được. Vì vậy khi mực nước sông thấp thì kết quả tính toán có chiều hướng lớn hơn
giá trị thực đo.
4.500
Observation
4.000 Calculation
3.500
3.000
2.500
2.000
1.500
1.000
0.500
0.000
7/28/2015 0:00
7/29/2015 0:00
7/30/2015 0:00
7/31/2015 0:00
8/10/2015 0:00
8/11/2015 0:00
8/1/2015 0:00
8/2/2015 0:00
8/3/2015 0:00
8/4/2015 0:00
8/5/2015 0:00
8/6/2015 0:00
8/7/2015 0:00
8/8/2015 0:00
8/9/2015 0:00
Hình 8.2: Kết quả hiệu chỉnh mô hình theo trận lũ năm 2015
Năm 2017 lưu vực sông Tích Bùi bị nước tràn qua đên gây nên tình trạng sạt đê
ở khu vực này. Nhóm nghiên cứu đã sử dụng phần mềm để tính toán mô phỏng cho
trận lũ năm 2017. Kết quả tính toán nhue trên Hình 7.3 cho thấy mô hình đã phát hiện
ra có một khu vực nước bị tràn từ sông vào khu vực dân cư. Kết quả tính toán này
cũng đã đã được nhóm nghiên cứu xác định là đúng với thực tế về vị trí tràn và khu
vực bị ngập nước. Tuy nhiên về độ sâu ngập và diện tích ngập mà mô hình tính toán
được có sự sai khác lớn với thực tế của trận lũ năm 2017. Nguyên nhân của sự sai số
đó là do trong quá trình nước tràn qua đê thì một đoạn đê đã bị vỡ do sói mòn. Chính
vì vậy dẫn đến kết quả tính toán mực nước trong sông và mực nước trong khu dân cư
(ngập lụt) chưa chính xác về mặt định lượng.
Các kết quả hiệu chỉnh mô hình cho thấy mô hình đã bắt tốt cóa số liệu thực đo
trong sông và phản ánh đúng hiện trạng ngập lụt ngoài sông cũng như hiện tượng tràn
đê (nếu có)
7
Forecasting 24h
Observation
6
0
0 100 200 300 400 500 600 700 800 900 1000 1100 1200
Hình 8.4: Kết quả dự báo trước 24h mực nước tại trạm Ba Tha năm 2016
7
Forecasting 24h
Observation
6
0
0 100 200 300 400 500 600 700 800 900 1000 1100 1200
Hình 8.5: Kết quả dự báo trước 24h mực nước tại trạm Ba Tha năm 2017
HBa Thá = 3.67 (m) tại thời điểm phát bản tin
5.00
4.50
4.00
3.50
3.00
2.50
2.00
1.50
1.00
0.50
0.00
7/9/2018 7/11/2018 7/13/2018 7/15/2018 7/17/2018 7/19/2018 7/21/2018
Thực đo Dự báo
Đồ thị dự báo mực nước tại vị trí trạm thủy văn Ba Thá ngày 18/7/2018
HBa Thá = 4.07 (m) tại thời điểm phát bản tin
Thời gian
3h 6h 9h 12h 15h 18h 21h 24h
Vị trí
H Ba Thá 4.14 4.22 4.33 4.38 4.45 4.54 4.64 4.75
H QL6 5.92 5.98 6.1 6.25 6.39 6.52 6.64 6.75
Các ô ngập
6.00
5.00
4.00
3.00
2.00
1.00
0.00
7/9/2018 7/11/2018 7/13/2018 7/15/2018 7/17/2018 7/19/2018 7/21/2018 7/23/2018
Thực đo Dự báo
Đồ thị dự báo mực nước tại vị trí trạm thủy văn Ba Thá ngày 19/7/2018
7.00
6.00
5.00
4.00
3.00
2.00
1.00
0.00
7/11/2018 7/13/2018 7/15/2018 7/17/2018 7/19/2018 7/21/2018 7/23/2018
Thực đo Dự báo
Đồ thị dự báo mực nước tại vị trí trạm thủy văn Ba Thá ngày 20/7/2018
7.00
6.00
5.00
4.00
3.00
2.00
1.00
0.00
7/11/2018 7/13/2018 7/15/2018 7/17/2018 7/19/2018 7/21/2018 7/23/2018 7/25/2018
Thực đo Dự báo
Đồ thị dự báo mực nước tại vị trí trạm thủy văn Ba Thá ngày 21/7/2018
Bản đồ dự báo ngập lụt cho lưu vực sông Tích Bùi lúc 19:00 ngày 21/7/2018
7.00
6.00
5.00
4.00
3.00
2.00
1.00
0.00
7/15/2018 7/17/2018 7/19/2018 7/21/2018 7/23/2018 7/25/2018 7/27/2018 7/29/2018
Thực đo Dự báo
Đồ thị dự báo mực nước tại vị trí trạm thủy văn Ba Thá ngày 25/7/2018
Bản đồ dự báo ngập lụt cho lưu vực sông Tích Bùi lúc 07:00 ngày 26/7/2018
7.00
6.00
5.00
4.00
3.00
2.00
1.00
0.00
7/21/2018 7/23/2018 7/25/2018 7/27/2018 7/29/2018 7/31/2018 8/2/2018
Thực đo Dự báo
Đồ thị dự báo mực nước tại vị trí trạm thủy văn Ba Thá ngày 30/7/2018
Bản đồ dự báo ngập lụt cho lưu vực sông Tích Bùi lúc 07:00 ngày 31/7/2018
3.2. Tổng hợp kết quả dự báo của các bản tin
Dưới đây là bảng tổng hợp các kết quả dự báo của năm 2018.
Dự báo 6 giờ
Ngày Thời gian Thực đo DB Ba DB QL6
(giờ) BT (m) Thá (m) (m)
7/18/2018 7:00 6:00:00 3.87 6.14
7/19/2018 7:00 30:00:00 4.22 5.98
7/20/2018 7:00 54:00:00 4.84 4.95 6.92
7/21/2018 7:00 78:00:00 5.39 5.4 7.14
7/22/2018 7:00 102:00:00 6.19 6.23 8.65
7/23/2018 7:00 126:00:00 6.24 6.17 7.73
7/24/2018 7:00 150:00:00 6.17 6.02 7.05
7/25/2018 7:00 174:00:00 5.91 5.79 6.35
7/26/2018 7:00 198:00:00 5.68 5.38 6.16
7/27/2018 7:00 222:00:00 5.62 5.22 5.75
7/28/2018 7:00 246:00:00 5.86 5.42 6.17
7/29/2018 7:00 270:00:00 5.94 5.65 6.89
7/30/2018 7:00 294:00:00 6.08 5.93 7.37
7/31/2018 7:00 318:00:00 5.93 5.84 7.05
8/1/2018 7:00 342:00:00 5.86 6.77 6.69
8/2/2018 7:00 366:00:00 5.68 5.62 6.37
8/3/2018 7:00 390:00:00 5.54 5.55 5.88
Dự báo 12 giờ
Ngày Thời gian Thực đo DB Ba DB QL6
(giờ) BT (m) Thá (m) (m)
7/18/2018 7:00 12:00:00 3.92 6.05
7/19/2018 7:00 36:00:00 4.38 6.25
7/20/2018 7:00 60:00:00 4.91 5.1 6.94
7/21/2018 7:00 84:00:00 5.72 5.76 7.84
7/22/2018 7:00 108:00:00 6.22 6.25 8.45
7/23/2018 7:00 132:00:00 6.24 6.14 7.54
7/24/2018 7:00 156:00:00 6.11 5.96 6.87
7/25/2018 7:00 180:00:00 5.85 5.7 6.2
7/26/2018 7:00 204:00:00 5.62 5.31 6.06
7/27/2018 7:00 228:00:00 5.72 5.27 5.75
7/28/2018 7:00 252:00:00 5.84 5.44 6.32
7/29/2018 7:00 276:00:00 5.98 5.73 7.11
7/30/2018 7:00 300:00:00 6.08 5.95 7.39
7/31/2018 7:00 324:00:00 5.91 5.8 6.88
8/1/2018 7:00 348:00:00 5.82 5.74 6.64
8/2/2018 7:00 372:00:00 5.65 5.61 6.25
8/3/2018 7:00 396:00:00 5.46 5.47 5.75
8/4/2018 7:00 420:00:00 5.23 5.27 5.33
8/5/2018 7:00 444:00:00 5.05 5.09 5.17
8/6/2018 7:00 468:00:00 4.77 4.79 5
8/7/2018 7:00 492:00:00 4.49 4.83
8/8/2018 7:00 516:00:00 4.29 4.68
Hai bảng kết quả dự báo 6h và 12h ở trển cho thấy các kết quả dự báo bằng bộ
công cụ được xây dựng và phát triển trong khuôn khổ đề tài này đã dự báo tương đối
chính xác diễn biến mực nước tại trạm thủy văn Ba Thá.
Theo thống kê của nhóm thực hiện đề tài thì các khu vực bị ngập trong bản tin
dự báo là khá phù hợp với trên thực tế. Tuy nhiên về diện tích ngập và độ sau ngập
của từng vùng thì mô hình chưa thể hiện tốt. Đây cũng chính là nhược điểm của mô
hình thủy lực giả hai chiều (một chiều mở rộng) so với mô hình thủy lực hai chiều.
10
Thực đo Dự Báo Ba Thá
Dự Báo QL6
9
6
Mực nước (m)
0
7/17/2018 7/23/2018 7/29/2018 8/4/2018 8/10/2018
9
Thực đo Dự Báo Ba Thá
8 Dự Báo QL6
6
Mực nước (m)
1
Thời gian (giờ)
0
7/14/18 0:00 7/19/18 0:00 7/24/18 0:00 7/29/18 0:00 8/3/18 0:00 8/8/18 0:00 8/13/18 0:00
Hình 8.7: Kết quả dự báo 12h của các bản tin
10
6
Mực nước (m)
1
Thời gian (giờ)
0
7/15/2018 7/21/2018 7/27/2018 8/2/2018 8/8/2018 8/14/2018
Hình 8.7: Kết quả dự báo 18h của các bản tin
10
Thực đo DB Ba Thá (m) DB QL6 (m)
9
6
Mực nước (m)
1
Thời gian (giờ)
0
7/14/2018 7/19/2018 7/24/2018 7/29/2018 8/3/2018 8/8/2018 8/13/2018
Hình 8.8: Kết quả dự báo 24h của các bản tin
KẾT LUẬN
Trong khuôn khổ đề tài nghiên cứu khoa học này. Nhóm nghiên cứu về giảm
nhẹ thiên tai của Viện Cơ học cùng với các chuyên gia đã xây dựng được một công
cụ phần mềm hỗ trợ công tác cảnh báo và dự báo ngập lụt trên lưu vực sông Tích-
Bùi. Mô hình đã đáp ứng được các mục tiêu đặt ra cụ thể là:
- Có giao diện sử dụng công nghệ GIS thân thiện với người dùng
- Ngôn ngữ sử dụng trong công cụ là tiếng Việt
- Phần mềm đóng gói thành một bộ cài đặt hoàn chỉnh
- Phần mềm sử dụng một số kỹ thuật hiện đại trong lĩnh vực công nghệ thông
tin đó là kỹ thuật tính toán song song để nâng cao hiệu xuất sử dụng của
thiết bị.
- Các bộ phần mềm tính toán (thủy văn, thủy lực, mô hình học máy) được
phát triển trên cơ sở các thuật toán hiện đại và có độ tin cậy cao.
- Bộ công cụ đã được thử nghiệm dự báo cho trận lũ năm 2018 cho kết quả
khá tốt. Các kết quả dự báo phản ánh đúng về mặt định tính đối với các
khu vực ngập lụt. Còn về mực nước trong sông thì có định lượng khá tốt
tại vị trí trạm thủy văn Ba Thá
Bên cạnh bộ công cụ được xây dựng đáp ứng các yêu cầu đặt ra thì nhóm nghiên
cứu cũng đã có các công bố và đào tạo đáp ứng đủ yêu cầu theo như thuyết minh đề
tài đã được phê duyệt. Cụ thể là:
Về đào tạo: Đã tham gai đào tạo 02 nghiên cứu sinh
Nghiên cứu sinh Nguyễn Hồng Phong (thành viên tham chủ chốt trực
tiếp hiện đề tài)
Nghiên cứu sinh Phan Thị Thu Phương (thành viên tham gia thực hiên
đề tài)
Về công bố: Đã công bố được 01 bài báo trên tạp chí quốc tế, 01 bài trên tuyển
tập hội nghị cấp quốc gia, 01 bài trên tuyển tập hội thảo quốc tế và còn 01 bài
đã được chấp nhận in trong tuyển tập hội nghị cấp quốc gia.
Mặc dù bộ công cụ được phát triển của đề tài đã đáp ứng được các mục tiêu đặt ra.
Nhưng trong thời gian qua tình hình diễn biến mưa lũ của lưu vực sông Tích-Bùi rất
phức tạp và đã đặt ra những bài toán khó hơn. Chính vì vậy để công cụ có thể đáp
ứng tốt các vấn đề mới thì cần phải tiếp tục đầu tư công sức và tài chính để tiếp tục
hoàn thiện về mặt dữ liệu cũng như các tiện ích của công cụ.
[1]. Cuong T. Nguyen, Kien C. Nguyen, Phuong T.T. Phan: "Hydrological - Quasi 2D
Hydraulic Linked Model for Flood Forecasting", American Journal of Engineering
Research, Volume-7, Issue-10, pp-325-331, 2018.
[2]. Cuong T. Nguyen, Kien C. Nguyen: "Research and Proposal a Solution to Mitigate
Salinity Intrusion for Tam Ky River in Quang-Nam Province of Vietnam",
International Journal of Scientific Engineering and Applied Science (IJSEAS) –
Volume-3, Issue-11, Nov 2018 , pp.13-18
[3]. NGUYEN Tien Cuong, TRINH Thu Phuong: "Forecasting the discharge into
Hoa Binh reservoir by applying the Connecting model MARINE-IMech1D", Vietnam
Journal of Mechanics, VAST, Vol.30, No.3 (2009), pp.149-157.
[4]. Cuong T. NGUYEN, Lai V. HOANG and Ryoichi FUKAGAWA: “Coupling
hydrological - hydraulic models for flood simulating in tich river Basin”, The First
Joint Seminar on Landslide, Flood Disasters and the Environmental Issues, Tp. Hồ
Chí Minh, 2017
[5]. Cuong T. NGUYEN, Thao P. TRINH, Huong T.T. DUONG and Ryoichi
FUKAGAWA: “Set up rainfall-runoff models for simulating inflow of Ban Chat
reservoir”, The First Joint Seminar on Landslide, Flood Disasters and the
Environmental Issues, Tp. Hồ Chí Minh, 2017
[6]. Lai. V. HOANG, Cuong. T. NGUYEN, Huong. T. T. DUONG and Ryoichi
FUKAGAWA: Using Hydrologycal and Hydraulic Models in Regulation of HoaBinh
Reservoir, Proceedings of the 7th Vietnam/Japan Joint Seminar on Geohazards and
Environmental Issues, Sendai city, Japan, March - 2016.
[7]. H. Van Lai, N. Van Diep, N. Tien Cuong and N. Hong Phong: "Coupling hydrological-
hydraulic models for extreme flood simulating and forecasting on the North Central
Coast of Vietnam", WIT Transctions on Ecology and the Environment, Vol.124
(2009), pp.113-123. River Basin Management 2009, The fifth International
Conference, Malta, September 7-9, 2009.
[8]. Son T. Hoang, Lam X. Nguyen, Trinh D. Tran, Son T. Nguyen, Phuong T. T. Phan,
Cuong T. Nguyen: "Researching on Developing the Decision Support System for
Salinity Control Operation and Management in Vu Gia – Thu Bon River Basin",
Proceedings of The First International Conference on Fluid Machinery and
Automation Systems 2018 (ICFMAS2018), pp.590-596. (ISBN: 978-604-95-0609-3).
[9]. Nguyễn Chính Kiên: "Thử nghiệm ứng dụng mạng neuron nhân tạo trong dự báo thủy
văn và thủy lực", Tuyển tập công trình Hội nghị Khoa học Cơ học toàn quốc lần
thứ X (ISBN: 978-604-913-752-5), tập 2 (2018).
[10]. Nguyen Hong Phong, Tran Thu Ha, F. X. Le Dimet, Duong Ngoc Hai: "An Improved
Numerical Method for a 2D Pollution Water Model: Direct Model", Vietnam Journal
of Mechanics, Vol.39 (2017), No. 4, pp.339-349.
[11]. Nguyễn Hồng Phong, Trần Thu Hà và F.-X. Le Dimet: "Phương pháp số cho dòng
chảy không dừng trên đoạn sông có tính đến ảnh hưởng của độ dốc đáy", Tuyển tập
công trình Hội nghị Khoa học Cơ học toàn quốc lần thứ X (ISBN: 978-604-913-
752-5), tập 2 (2018)
[12]. Báo cáo dự án “Tiếp nước, cải tạo khôi phục sông Tích”
[13]. Báo cáo đề tài nghiên cứu khoa học cấp nhà nước mã số KC08-13/2010
[14]. Báo cáo dự án quốc tế FLOCODS.
[15]. Báo cáo “Quy hoạch và phát triển lưu vực sông Đáy”
[16]. Nguyễn Tiến Cường, Trịnh Thu Phương, Lê Thu Hoài: "Đánh giá các ưu và nhược
điểm của mô hình thủy văn Marine so với các mô hình khác qua kết quả ứng dụng tác
nghiệp trong mùa lũ", Tuyển tập công trình Hội nghị Khoa học Cơ học Thủy khí
toàn quốc năm 2011, Tx. Cửa Lò, tỉnh Nghệ An, tháng 7 năm 2011.
[17]. Nguyễn Tiến Cường: "Xây dựng mô hình dự báo lũ cho khu vực thượng nguồn hệ
thống sông Vu Gia", Tuyển tập công trình Hội nghị Khoa học Cơ học Thủy khí toàn
quốc năm 2010, (2011). tr.117-125, Tp. Quy Nhơn, tỉnh Bình Định, tháng 7 năm 2010.
[18]. Nguyễn Tiến Cường, Ngô Huy Cẩn, Đoàn Xuân Thủy, Dương Thị Thanh Hương:
"Ứng dụng mô hình thủy văn MARINE tính toán lưu lượng vào hồ Tuyên Quang",
Tuyển tập công trình Hội nghị Khoa học Cơ học Thủy khí toàn quốc năm 2008,
(2009). tr.27-66, Tp. Phan Thiết, tỉnh Bình Thuận, tháng 7 năm 2008.
[19]. Nguyễn Tiến Cường, Trần Thu Hà: "Mô hình cảnh báo, dự báo lũ hệ thống sông
Hương", Tuyển tập công trình Hội nghị Khoa học Cơ học toàn quốc lần thứ 8,
(2008) tập 3, tr.51-65, Tp. Hà Nội, tháng 12, năm 2007.
[20]. Nguyễn Tiến Cường: "Ứng dụng mô hình MARINE mô phỏng quá trình lũ thượng du
hệ thống sông Hương", Tuyển tập công trình Hội nghị Khoa học Cơ học Thủy khí
toàn quốc năm 2005, (2006). tr.9-18.
[21]. Trần Thu Hà, Nguyễn Hồng Phong, Nguyễn Tiến Cường: "Mô hình kết nối thủy văn
thủy lực tính lũ thượng du sông Đà qua hệ thống máy song song", Tuyển tập công
trình Hội nghị Khoa học Cơ học Thủy khí toàn quốc năm 2005, (2006). tr.115-126.
[22]. Nguyễn Trọng Hoài (chủ biên), Dự Báo Và Phân Tích Dữ Liệu Trong Kinh Tế Và Tài
Chính, NXB Thống Kê, 2009.
[23]. N.Đ. Xuyên, N.Q. Hỷ, N.V. Hữu, T.Đ. Quỳ, N.X. Bình, T. Cảnh, Lập hàm dự báo
chấn cấp động đất cực đại trên lãnh thổ Việt Nam bằng phương pháp xấp xỷ ngẫu
nhiên, Tạp chí các KH về Trái đất, T.22 (2000), 2 (81-89).
[24]. James, S. C., Zhang, Y., & O'Donncha, F. (2018). A machine learning framework to
forecast wave conditions. Coastal Engineering, 137, 1-10.
[25]. De Matteis, A. D., Marcelloni, F., & Segatori, A. (2015, August). A new approach to
fuzzy random forest generation. In Fuzzy Systems (FUZZ-IEEE), 2015 IEEE
International Conference on (pp. 1-8). IEEE.
[26]. Williams, J. K., & Abernethy, J. (2008, January). Using random forests and fuzzy logic
for automated storm type identification. In AMS Sixth Conference on Artificial
Intelligence Applications to Environmental Science.
[27]. Oánh, N. Q., & Lê Thanh Hà, Đ. Q. G (2014). Vận dụng các phương pháp dự báo san
bằng mũ để dự báo doanh thu cho doanh nghiệp ngành thép việt nam. Tạp chí Khoa
học và Phát triển, tập 12, số 2: 205-213
[28]. Dục, P. H. Đ. (2008). Mô hình điều khiển dự báo và ứng dụng điều khiển thích nghi
hướng tàu thủy. Tạp chí Khoa học & Công nghệ, Số 1 (45), Tập 1, 101 – 106
[29]. Tài, V. V. (2002). Dự báo sản lượng lúa Việt Nam bằng các mô hình toán học. Tạp chí
Khoa học-Trường Đại học Cần Thơ 25b, 125-134.
[30]. Nguyễn Hoàng Sơn, Hoàng Thanh Tùng, Lê Kim Truyền, Trần Kim Châu (2014). Xây
dựng công cụ dự báo lũ đến hồ và cảnh báo ngập lụt khi xả lũ và do vỡ đập gây ra cho
hồ chứa vừa và nhỏ. Tạp chí Khoa học kỹ thuật Thủy lợi và Môi trường, (44), 95 -
103.
[31]. Sung, J. Y., Lee, J., Chung, I. M., & Heo, J. H. (2017). Hourly water level forecasting
at tributary affected by main river condition. Water, 9(9), 644.
[32]. Chen, J. F., Hsieh, H. N., & Do, Q. H. (2014). Forecasting Hoabinh Reservoir’s
Incoming Flow: An Application of Neural Networks with the Cuckoo Search
Algorithm. Information, 5(4), 570-586.
[33]. N.Đ. Xuyên, N.Q. Hỷ, N.V. Hữu, T.Đ. Quỳ, N.X. Bình, T. Cảnh, Lập hàm dự báo
chấn cấp động đất cực đại trên lãnh thổ Việt Nam bằng phương pháp xấp xỷ ngẫu
nhiên, Tạp chí các KH về Trái đất, T.22 (2000), 2 (81-89).
[34]. Trevor Hastie, Robert Tibshirani, Jerome Friedman, T Hastie, J Friedman, and
R Tibshirani. The elements of statistical learning, volume 2. Springer, 2009.
[35]. Peter J Huber. Robust statistics. Springer, 2011.
[36]. J Martin Bland, Douglas G Altman, et al. Statistics notes: Cronbach’s alpha. Bmj,
314(7080):572, 1997.
[37]. Leo Breiman, Jerome Friedman, Charles J Stone, and Richard A Olshen. Classification
and regression trees. CRC press, 1984.
[38]. Yoav Freund, Robert Schapire, and N Abe. A short introduction to boosting. Journal-
Japanese Society For Artificial Intelligence, 14(771-780):1612, 1999.
[39]. Brian D. Ripley. Pattern recognition and neural networks. Cambridge university press,
1996.
[40]. Alex J Smola and Bernhard Schölkopf. A tutorial on support vector regression.
Statistics and computing, 14(3):199–222, 2004.
[41]. Leo Breiman. Random forests. Machine learning, 45(1):5–32, 2001.
[42]. Thanh-Tung Nguyen, Joshua Z Huang, Qingyao Wu, Thuy T Nguyen, and Mark J Li.
Genome-wide association data classification and snps selection using two-stage
quality-based random forests. BMC Genomics, 16(Suppl 2):S5, 2015.
[43]. Yoav Freund and Robert E Schapire. Adaptive game playing using multiplicative
weights. Games and Economic Behavior, 29(1):79–103, 1999.
[44]. Jerome H Friedman. Greedy function approximation: a gradient boosting machine.
Annals of Statistics, pages 1189–1232, 2001.
[45]. Lehmann, E. L., & Casella, G. (1998), Theory of point estimation, Springer Science
& Business Media.
[46]. Hyndman, R. J., & Koehler, A. B. (2006), “Another look at measures of forecast
accuracy”, International journal of forecasting, 22(4), 679-688.
[47]. Nguyen, Phuoc Khac-Tien, Lloyd Hock-Chye Chua, and Lam Hung Son. "Flood
forecasting in large rivers with data-driven models." Natural hazards 71.1 (2014): 767-
784.
[48]. Nam, T. X., & Tùng, N. T. (2017). DEEP LEARNING: ứng dụng cho dự báo lưu
lượng nước đến hồ chứa Hòa Bình. PROCEEDING of Publishing House for Science
and Technology.
[49]. KIM, S., & TACHIKAWA, Y. (2018). Real-time river-stage prediction with artificial
neural network based on only upstream observation data. 水工学論文集 Annual
journal of Hydraulic Engineering, JSCE, 62, Ⅰ_1375-1380.
[50]. Wang, Y., Zhou, J., Chen, K., Wang, Y., & Liu, L. (2017, November). Water quality
prediction method based on LSTM neural network. In Intelligent Systems and
Knowledge Engineering (ISKE), 2017 12th International Conference on(pp. 1-5).
IEEE.
[51]. Lehmann, E. L., & Casella, G. (1998), Theory of point estimation, Springer Science
& Business Media.
[52]. Hyndman, R. J., & Koehler, A. B. (2006), “Another look at measures of forecast
accuracy”, International journal of forecasting, 22(4), 679-688.
[53]. Chun-Tian Cheng, K.W. Chau. Flood Control management system for reservoirs.
Environmental Modeling & Software 19 (2004) 1141-1150
[54]. Integrated Project FLOODsite, Contract GOCE-CT-2004-505420, Co-ordinator: HR
Wallingford, UK, Project website: www.floodsite.net, 2005.
[55]. NeWater - New Approaches to Adaptive Water Management under Uncertainty,
www.newater.info, Contract no 511179 (GOCE), Integrated Project in PRIORITY 6.3
Global Change and Ecosystems in the 6th EU framework programme, 2005.
[56]. Chun-Tian Cheng, K.W. Chau. Fuzzy iteration methodology for reservoir flood
control operation. Journal of the American Water Resources Association 37(2001),
1381-1388
[57]. Chun-Tian Cheng, K.W. Chau, Xiang-Yang Li & Gang Li. Developing a Web-based
flood forecasting system for reservoirs with J2EE. Hydrological Sciences–Journal–
des Sciences Hydrologiques, 49(6) December 2004
[58]. Cheng, C.T., 1999. Fuzzy optimal model for the flood control system of the upper and
middle reaches of the Yangtze River. Hydrological Sciences Journal 44 (4), 573–582.
[59]. A Chronology of Major Events Affecting the National Flood Insurance Program.
Completed for the Federal Emergency Management AgencyUnder Contract Number
282-98-0029, October 2002.
[60]. Intergrated flood management, Case study: Canada: FLOOD MANAGEMENT IN THE
RED RIVER, Technical support unit, World Meteorological organization, May 2004.
[61]. http://en.wikipedia.org/wiki/SMART_Tunnel
[62]. Intergrated flood management, Case study: Bangladesh: FLOOD MANAGEMENT
Technical support unit, World Meteorological organization, September 2003.
[63]. http://www.mikepoweredbydhi.com/
[64]. http://www.hec.usace.army.mil/software/
[65]. http://www.delftsoftware.com.au/
[66]. Quyết định số 172/2007/QĐ-TTg của Thủ tướng Chính phủ ký ngày 16/11/2007 phê
duyệt Chiến lược quốc gia phòng, chống và giảm nhẹ thiên tai đến năm 2020.
[67]. Đặng Đình Đức, Trần Ngọc Anh, Nguyễn Ý Như, Nguyễn Thanh Sơn. Ứng dụng mô
hình MIKE FLOOD tính toán ngập lụt hệ thống sông Nhuệ - Đáy trên địa bàn thành
phố Hà Nội. Tạp chí Khoa học ĐHQGHN, Khoa học Tự nhiên và Công nghệ 27, Số
1S (2011) 37-43.
[68]. Lã Thanh Hà. Đánh giá khả năng phân chậm lũ sông Đáy và sử dụng lại các khu chậm
lũ và đề xuất các phương án xử lý khi gặp lũ khẩn cấp thuộc chương trình phòng lũ
sông Hồng - Thái Bình, 1999-2001.
[69]. Lê Vũ Việt Phong, Trần Hồng Thái, Phạm Văn Hải. Nghiên cứu áp dụng mô hình toán
MIKE 11 tính toán chất lượng nước sông Nhuệ - sông Đáy. Tuyển tập báo cáo Hội
thảo khoa học lần thứ 10 - Viện KH KTTV & MT, 269-278.
[70]. Phạm Thị Hương Lan, Trần Khắc Thạc. Nghiên cứu diễn biến lòng dẫn đoạn cửa vào
sông Đáy theo kịch bản đưa nước thường xuyên và đề xuất giải pháp chỉnh trị. Tuyển
tập Hội nghị Khoa học thường niên năm 2013, 113-115.
[71]. Abrahart, R.J. and See, L. (2000) Comparing neural network and autoregressive
moving average techniques for the provision of continuous river flow forecasts in two
contrasting catchments, Hydrological Processes, 14, 2157-2172.
[72]. Ahmed, N.K., et al. (2010) An empirical comparison of machine learning models for
time series forecasting, Econometric Reviews, 29, 594-621.
[73]. Bontempi, G., Ben Taieb, S. and Le Borgne, Y.-A. (2013) Machine Learning
Strategies for Time Series Forecasting. In Aufaure, M.-A. and Zimányi, E. (eds),
Business Intelligence. Springer Berlin Heidelberg, pp. 62-77.
[74]. Box, G.E.P. and Jenkins, G.M. (1976) Time series analysis: forecasting and control.
Holden-Day.
[75]. Broersen, P.M. (2007) Error correction of rainfall-runoff models with the ARMAsel
program, Instrumentation and Measurement, IEEE Transactions on, 56, 2212-2219.
[76]. Chen, S.H., et al. (2006) The strategy of building a flood forecast model by neuro‐
fuzzy network, Hydrological Processes, 20, 1525-1540.
[77]. Dawson, C.W. and Wilby, R. (1998) An artificial neural network approach to rainfall-
runoff modelling, Hydrological Sciences Journal, 43, 47-66.
[78]. Hsu, K.l., Gupta, H.V. and Sorooshian, S. (1995) Artificial Neural Network Modeling
of the Rainfall‐Runoff Process, Water resources research, 31, 2517-2530.
[79]. Jang, J.-S.R. (1993) ANFIS: adaptive-network-based fuzzy inference system,
Systems, Man and Cybernetics, IEEE Transactions on, 23, 665-685.
[80]. Maier, H.R., et al. (2010) Methods used for the development of neural networks for
the prediction of water resource variables in river systems: current status and future
directions, Environmental Modelling & Software, 25, 891-909.
[81]. Nayak, P., et al. (2005) Short‐term flood forecasting with a neurofuzzy model, Water
Resources Research, 41.
[82]. Plate, E.J. (2007) Early warning and flood forecasting for large rivers with the lower
Mekong as example, Journal of Hydro-environment Research, 1, 80-94.
[83]. See, L. and Openshaw, S. (1999) Applying soft computing approaches to river level
forecasting, Hydrological Sciences Journal, 44, 763-778.
[84]. See, L. and Openshaw, S. (2000) A hybrid multi-model approach to river level
forecasting, Hydrological Sciences Journal, 45, 523-536.
[85]. Serban, P. and Askew, A. (1991) Hydrological forecasting and updating procedures,
IAHS Publ, 201, 357-369.
[86]. Shamseldin, A. (2010) Artificial neural network model for river flow forecasting in a
developing country, Journal of Hydroinformatics, 12, 22-35.
[87]. Shamseldin, A.Y. (1997) Application of a neural network technique to rainfall-runoff
modelling, Journal of Hydrology, 199, 272-294.
[88]. Shamseldin, A.Y. and O'CONNOR, K.M. (1999) A real-time combination method for
the outputs of different rainfall-runoff models, Hydrological Sciences Journal, 44, 895-
912.
[89]. Shamseldin, A.Y. and O'Connor, K.M. (2001) A non-linear neural network technique
for updating of river flow forecasts, Hydrology and Earth System Sciences
Discussions, 5, 577-598.
[90]. Takagi, T. and Sugeno, M. (1985) Fuzzy identification of systems and its applications
to modeling and control, Systems, Man and Cybernetics, IEEE Transactions on, 116-
132.
[91]. Valença, M. and Ludermir, T. (2004) Hydrological forecasting and updating
procedures for neural network. Neural Information Processing. Springer, pp. 1304-
1309.
[92]. Werner, M.G.F., Schellekens, J. and Kwadijk, J.C.J. (2006) Flood Early Warning
Systems for Hydrological (Sub) Catchments. In, Encyclopedia of Hydrological
Sciences. John Wiley & Sons, Ltd.
[93]. Xiong, L. and O'connor, K.M. (2002) Comparison of four updating models for real-
time river flow forecasting, Hydrological Sciences Journal, 47, 621-639.