You are on page 1of 4

TOÁN HỌC ĐẰNG SAU COVID-19

==========================
Sau kì thi tốt nghiệp phổ thông trung học, một số người trong chúng ta sẽ rất vui khi bỏ lại phía sau môn
toán, bởi chúng ta vẫn nghĩ học toán ở phổ thông hay cả ở đại học sẽ chẳng để làm gì.
Nhưng COVID đã bắt chúng ta phải suy nghĩ lại.
Các mô hình toán học - được xây dựng trên nền tảng của lí thuyết giải tích, thống kê và xác suất - là một
trong những động lực thúc đẩy các chính sách ở hầu hết các quốc gia văn minh, xung quanh đại dịch
COVID-19.
Toán học sẽ giúp các nhà hoạch định chính sách trả lời những câu hỏi: Có bao nhiêu bệnh nhân sẽ cần
nhập viện? Có bao nhiêu bệnh nhân cần hồi sức cấp cứu? Khi nào bệnh nhân sẽ tràn vào bệnh viện? Bệnh
viện có đủ máy thở không?
Chính vì vậy, Viện Đo lường và Đánh giá Sức khỏe tại Đại học Washington, nơi có khoảng 500 nhà thống
kê, nhà khoa học máy tính và nhà dịch tễ học có khả năng phân tích dữ liệu mạnh mẽ. Viện này xuất bản
"Báo cáo Nghiên cứu Gánh nặng Bệnh tật Toàn cầu" hàng năm, định lượng tỉ lệ mắc từng bệnh ở 195 quốc
gia và khu vực trên thế giới, phân tích tác động của nó đối với nước Mỹ.
Đó mới chỉ là một viện nghiên cứu trong số rất nhiều viện ở Mỹ!
Tôi cho rằng, chống dịch mà không sử dụng toán học, sẽ chẳng khác gì chơi với lửa!
Chống dịch COVID-19 ở Việt Nam, tôi không biết BCĐ Quốc gia xây dựng mô hình toán học như thế
nào, bản thân tôi cũng không giỏi toán, dịch tễ học và toán học tôi chỉ biết bì bõm, viết bài đăng Facebook
để ai quan tâm đọc cho vui.
Có nhiều phương pháp toán học để tiếp cận đại dịch COVID, tôi dự định sẽ viết lần lượt, chỉ tiếc Facebook
không cho phép viết công thức toán, nên việc diễn đạt đầy đủ và tường minh là rất khó.
Tôi xin liệt kê vài vấn đề toán học áp dụng trong dịch COVID:
Động lực dịch tễ học.
Mô hình khuếch tán.
Kiểu ngăn và mô hình SIR.
Động lực của con người.
Mô hình tác nhân của các quần thể có cấu trúc.
Y học mạng.
Chất lượng dữ liệu.
Trí tuệ nhân tạo và mô hình chuyên sâu.
Phân tích dữ liệu của mạng xã hội.
Trong bài viết hôm nay, tôi nói về nguồn gốc của mô hình toán học Bernoulli, đồng thời giải thích kĩ hơn
về mô hình SEIR trong bài viết trước.

Năm 1766, bác sĩ Daniel Bernoulli khi nghiên cứu dịch bệnh đậu mùa xâm nhập vào nước Pháp, ông đã
xây dựng mô hình toán học đầu tiên để mô tả và dự báo quy mô của của loại vi-rút gây bệnh đường hô hấp
chết người này.
Tốt nghiệp y khoa tại Đại học Basel vào năm 1721, nhưng trong thời gian học bác sĩ thực hành, Daniel
Bernoulli lại nghiên cứu về toán để xuất bản cuốn sách “Một số bài tập toán học – Some mathematical
exercises”.
Tốt nghiệp bác sĩ thực hành, Bernoulli đã nhiều lần nộp đơn xin làm công việc giảng dạy vào nghiên cứu
giải phẫu học và thực vật học tại Đại học Basel, nhưng đều thất bại. Đến năm 1733, may mắn đến với
Bernoulli khi ông được Đại học Basel nhận vào giảng dạy thực vật học, năm 1743 trở thành giáo sư giảng
dạy sinh lí học, năm 1750 trường đại học này chuyển ông sang làm giáo sư vật lí học.
Nhưng số phận thật oái oăm: Daniel Bernoulli lại trở thành nhà toán học!
Được coi là nhà toán học vĩ đại nhất thế kỉ 18, bác sĩ Daniel Bernoulli là người đầu tiên sử dụng phương
trình vi phân có hệ thống để xây dựng những công thức đầu tiên của thống kê học, bởi vậy ông được công
nhận là cha đẻ của toán thống kê.
Vào năm 1760, Bernoulli rất quan tâm đến cách thức bệnh đậu mùa xâm nhập vào nước Pháp và lây truyền
thành dịch viêm đường hô hấp cấp. Ngày 22Tháng 3 năm 1760, Bernoulli đã có một báo cáo toán học về
dịch bệnh trước Học viện Khoa học Hoàng gia ở Paris. Ngay sau đó, báo cáo đã liên tục được đọc đi đọc
lại tại các hội nghị quan trọng.
Năm 1766 mô hình toán học Bernoulli dự báo dịch bệnh chính thức được công bố.
Nếu chỉ giải phương trình vi phân thuần túy của Bernoull, chúng ta sẽ chỉ thấy đây là mô hình tĩnh, tức là
nó được giả định lực lây nhiễm không đổi trong suốt thời gian. Nhưng thật may mắn, nhờ có phương pháp
xấp xỉ Euler, mà mô hình Bernoulli đã trở thành mô hình động, nó còn được sử dụng để ước đoán sự lây
lan vi-rút trong hệ thống máy tính mạng.
Bernoulli và Leonhard Euler là bạn rất thân của nhau.

Trong mô hình toán học Bernoulli dân số N được chia thành các ngăn, bao gồm những người nhạy cảm
(Susceptibles), người mắc bệnh (infected) và những người đã được miễn dịch (immunes). Tỉ lệ tử vong do
tất cả các nguyên nhân trừ nhiễm trùng là µ(a). Lực lây nhiễm λ(a) là tỉ lệ các đối tượng nhạy cảm bị
nhiễm bệnh. Người khỏi bệnh có miễn dịch là s(a). Còn lại c(a) = 1 – s(a) là chết do nhiễm trùng. Ở đây,
c(a) là tỉ lệ tử vong theo trường hợp ca bệnh, vì nó không phải tỉ lệ có thứ nguyên theo đơn vị thời gian.
Gọi u(a) là xác suất đứa trẻ sinh ra còn sống và nhạy cảm với bệnh ở a tuổi.
Khi đó u(a) thỏa mãn phương trình vi phân:
du / da = - [λ(a) + µ(a)]u
với điều kiện ban đầu u(0) = 1.
Xác suất w(a) để được miễn nhiễm và sống sót là:
dw / da = [1 – c(a)] λ(a)u(a) - µ(a)w
với điều kiện w(a) = 0.
Nghiệm của các phương trình này là:
u(a) = exp {- [Λ(a) + M(a)]}
w(a) = eᴧ-M(a) ʃ {[1 – c(t)]λ(t)eᴧ-λ(t)}dt
với t ϵ [0;a]
Trong đó: Λ(a) = ʃ λ(t)dt
Và M(a) = ʃ µ(t)dt
Đặt l(a) là số sống sót sau tuổi a. Khi đó: l(a) = u(a) + w(a) bởi vì hai trạng thái mẫn cảm và miễn dịch bổ
sung cho nhau.
Khả năng sống sót của dân số không có bệnh đậu mùa sẽ là: l₀(a) = -eᴧM(a).
Khả năng sống sót khi mắc bệnh đậu mùa có thể được viết dưới dạng tích số của l₀(a) và a yếu tố không
phụ thuộc vào tỉ suất chết tự nhiên và chỉ được xác định bởi lực nhiễm trùng và trường hợp tử vong.
l(a) = l₀(a) {eᴧ-λ(a) + ʃ[1 – c(t)]λ(t)eᴧ-λ(t)dt}
Đắt x(a) = u(a)l(a) biểu thị tỉ lệ mắc bệnh ở tuổi a và z(a) = w(a)l(a) sự phân bố miễn dịch ở tuổi a, ta có:
z(a) = 1 – x(a)
Vì thời gian lây nhiễm chỉ vài tuần nên khoảng thời gian này không đáng kể so với thời gian của trạng thái
mẫn cảm và trạng thái miễn dịch có thể là hàng năm.
Bằng cách đưa ra sự phổ biến của các đối tượng nhạy cảm ở độ tuổi a, Bernoulli rút ra một phương trình vi
phân không liên quan đến tỷ lệ tử vong chung µ(a).
dx / da = -λ(a)x(a)[1 – c(a)x(a)]
với điều kiện ban đầu x(0) = 0.
Phương trình biệt này có nghiệm:
x(a) = eᴧ-λ(a) / {eᴧ-λ(a) + ʃ[1 – c(t)]λ(t)eᴧ-λ(t)}
Đây mới chỉ là một phần rất nhỏ, nhưng đó là gốc rễ để chúng ta phát triển, xây dựng các mô hình toán học
trong dịch tễ học hiện đại, từ mô hình Bernoulli cho đến mô hình SIR, không ai có thể thoát li được khi
muốn thực hiện công việc dự báo dịch bệnh.
Đại dịch COVID càng cần phải sử dụng toán học.

Mặc dù Daniel Bernoull đã sử dụng các mô hình toán học để nghiên cứu sự lây lan của bệnh đậu mùa bắt
đầu từ năm 1760, sau đó chính thức được công bố thành lí thuyết toán học vào năm 1766, nhưng việc sử
dụng mô hình động lực học bệnh truyền nhiễm chỉ thực sự bắt đầu vào thế kỷ 20.
Năm 1906, Hamer sử dụng một mô hình toán rời rạc để nghiên cứu các đợt dịch sởi lặp đi lặp lại. Năm
1911, Ross sử dụng phương trình vi phân thông thường để nghiên cứu sự lây lan của bệnh sốt rét giữa
muỗi và người, sau đó ông đoạt giải Nobel Y học. Kermack và McKendrick đã xây dựng mô hình ngăn
SIR để dự báo về dịch hạch xảy ra ở nước Anh, từ đó mở ra một chân trời mới cho kỉ nguyên dịch tễ học
hiện đại.
Năm 1957, Bailey xuất bản cuốn sách "Lý thuyết toán học về các bệnh truyền nhiễm", đây là một công
trình mang tính bước ngoặt của dịch tễ học hiện đại, sách được tái bản vào năm 1975. Kể từ đó, một số
lượng lớn các mô hình toán học đã được sử dụng để phân tích các vấn đề bệnh truyền nhiễm khác nhau.
Toán học đã chỉ ra hàng loạt các quy luật trong từng dịch bệnh như sởi, sốt rét, lao, cúm, đậu mùa, sốt xuất
huyết, giun sán, hội chứng hô hấp cấp tính nặng, SARS năm 2003, Hội chứng hô hấp cấp nặng Trung
Đông MERS, Ebola, HIV, tay chân miệng.
Ở bài trước tôi đã nói về mô hình SEIR cơ bản.
Trong bài viết này, tôi xin nói rõ về cách xây dựng mô hình SEIR mở rộng, mở rộng cả về tham số và hằng
số, để không chỉ dự báo dịch chính xác mà còn biết cách can thiệp vào những yếu tố nào cho phù hợp,
tránh lãng phí nguồn lực mà lại không hiệu quả trong công tác phòng chống dịch bệnh.
Đầu tiên, tôi có thể giải thích một cách đơn giản rằng, nếu nhìn tổng thể toàn bộ dịch bệnh, sẽ chẳng ai
hiểu nổi những điều gì đang xảy ra. Vậy chỉ có cách chia cái tổng thể ấy ra thành các ngăn (compartment).
Mỗi ngăn có một trạng thái đặc trưng liên quan đến bệnh mà có một số cá nhân có thể rơi vào đó. Và khi
xem xét từng ngăn như vậy chúng ta sẽ biết được dịch bệnh đang diễn ra thế nào.
S = susceptible (nhạy cảm).
E = exposed (ủ bệnh).
A = asymptomatic (lây nhiễm không có triệu chứng).
I = infectious (lây nhiễm).
R = recovered (đã miễn nhiễm).
Tôi thêm ngăn A, là bởi đại dịch COVID đã xuất hiện tỉ lệ rất lớn bệnh nhân không có triệu chứng, nhưng
vẫn lây nhiễm.
Gọi N là tổng số dân và ta có:
N=S+E+I+A+R
Gọi tốc độ truyền bệnh bình quân trên đầu người là β.
Gọi tỉ lệ phục hồi bệnh là γ (khi đó khoảng lây nhiễm trung bình sẽ là 1/γ).
Ở trạng thái ban đầu, tất cả người dân đều có nguy cơ bị nhiễm, nghĩa là S(0) = N. Sau đó một người dân
bị nhiễm bệnh rồi truyền virus cho những người khác với tỉ lệ βN trong khoảng thời gian 1/γ. Như vậy,
người bị nhiễm bệnh đầu tiên sẽ có hệ số lây nhiễm Ro = βN/γ.
GIẢ SỬ TÔI BỎ ĐI CHỮ E.
Tức là tôi không quan tâm đến thời kì ủ bệnh.
Vậy mô hình sẽ là SIAR theo thống kê gồm 2 phương trình sau:
dS/dt = - βS(I + A)
dI/dt + dA/dt = βS(I + A) – γ(I + A)
Trong đó t là thời gian diễn ra dịch bệnh ở thời điểm mô phỏng.
Để giải mô hình toán học SIAR này, việc đầu tiên là tích hợp 2 phương trình trên, nên ta có:
d(I + A)/dS = dI/dS + dA/dS
= (dI/dt):(dS/dt) + (dA/dt):(dS/dt)
= (dI/dt + dA/dt):(dS/dt)
= -1 + γ/βS
= -1 + S(0)/RoS
= -1 + 1/RoS
Vậy phương trình sau khi đồng nhất là:
d(I + A)/dS = -1 + 1/RoS
Lấy nguyên hàm tích phân cả hai vế ta được:
ʃd(I + A)/dS = ʃ(-1 + 1/RoS)dS
như vậy:
I + A = I(0) + A(0) – S(0) + [lnS – lnS(0)]:Ro
Đây là lời giải chính tắc cho số bệnh nhân bị nhiễm bệnh, nhưng đáng tiếc nó lại là hàm của biến S, chứ
không phải là hàm của thời gian t như mong đợi. Nghĩa là có thể ước lượng được số bệnh nhân mắc ở một
thời điểm bất kì nào đó, nhưng không thể đánh giá được sự biến thiên theo thời gian của vụ dịch. Đến nay,
vẫn chưa có lời giải chính xác nào để ra hàm theo biến thời gian t.
Có một số phương án xấp xỉ để xây dựng hàm theo biến t.
Nếu sử dụng phương pháp xấp xỉ Euler, với giả thiết thời gian Δt đủ nhỏ thì dS/dt xấp xỉ bằng ΔS/Δt, trong
đó ΔS = S(t + Δt) - S(t).
Như vậy, xấp xỉ bệnh nhân bị nhiễm ở thời điểm (t + Δt) sẽ là:
S(t + Δt) = S(t) – βS(t)[I(t) + A(t)]Δt
Tương tự, xấp xỉ của bệnh nhân nhiễm có triệu chứng I và bệnh nhân nhiễm không triệu chứng A tại thời
điêm (t + Δt) sẽ là:
I(t + Δt) = I(t) + βS(t)I(t)Δt – γI(t)Δt
A(t + Δt) = A(t) + βS(t)A(t)Δt – γA(t)Δt
Đồng nhất cả ba phương trình này ta được mô hình SIAR với một hệ các hàm số theo biến thời gian t.
BÂY GIỜ TÔI MỞ RỘNG MÔ HÌNH ĐA BIẾN
Để mở rộng hơn, tôi có thể sử dụng mô hình nhiều vi phân hơn, khi đó độ chính xác sẽ cao hơn cho công
tác dự báo dịch.
Cụ thể:
W: là số ổ dịch ở nhà hàng tại Hải Dương chẳng hạn.
n: là tỉ lệ sinh tự nhiên của thành phố Hải Dương.
m: là tỉ lệ chết tự nhiên của thành phố Hải Dương.
Rõ ràng khi dịch bùng phát mạnh, thì mọi người sẽ áp dụng biện pháp kế hoạch hóa nên tỉ lệ sinh tự nhiên
sẽ rất thấp (ví dụ tỉnh Quảng Nam đã phải làm công văn xin Trung ương tài trợ phương tiện phòng tránh
thai cho những người dân không thuộc hộ nghèo và cận nghèo nhưng do ảnh hưởng COVID nên không có
điều kiện tránh thai), trong khi tỉ lệ tử vong cao lên nếu dịch bùng phát mạnh; để tránh nhiễu tôi có thể tối
ưu hóa bằng cách bổ sung bằng tỉ lệ người đi vào và đi ra khỏi Hải Dương theo những thuật toán hợp lí. Ví
dụ, n có thể coi là tỉ lệ người đến Hải Dương và m là tỉ lệ người rời khỏi Hải Dương.
β = tốc độ lây truyền bình quân trên đầu người
1/ω = thời gian ủ bệnh tiềm ẩn
1/ω’ = thời gian nhiễm bệnh tiềm tàng
1/γ = thời gian lây nhiễm của I (nhiễm có triệu chứng)
1/γ’ = thời gian lây nhiễm của A (nhiễm không triệu chứng)
δ = tỉ lệ nhiễm bệnh không có triệu chứng
Khi đó số người trong ngăn S sẽ bị nhiễm thông qua tiếp xúc với W và I với tốc độ lan truyền tương ứng là
βw và β. Đồng thời giả định khả năng truyền bệnh của A gấp k lần I với 0 ≤ k ≤ 1.
Giả sử người nhiễm có triệu chứng (I) và không có triệu chứng (A) có thể lan truyền virus sang W với tỉ lệ
tương ứng là µ và µWE. Tiếp theo, virus trong ngăn W sẽ rời khỏi ngăn này với tốc độ ƸW, khi đó thời
gian tồn tại của virus sẽ là 1/Ƹ.
Trong mô hình tổng quát, ta xét hàm f(t0,ti) trong t0 = thời gian bắt đầu mô phỏng dịch, ti = thời gian xem
xét dịch ở tại thời điểm i.
Mô hình toán học cũng được xây dựng từ phương trình cơ bản giống như ở phần đầu, sau khi đồng nhất
các phương trình, ta có hệ phương trình vi phân đầy đủ hơn như sau:
𝑑𝑆/𝑑𝑡 = nN − 𝑚𝑆 – 𝛽𝑆(I + kA) – 𝛽w𝑆𝑊
𝑑𝐸/𝑑𝑡 = 𝛽𝑆(𝐼 + k𝐴) + 𝛽w𝑆𝑊 − (1 – 𝛿)ωE – 𝛿ω’𝐸 – 𝑚𝐸
dI/dt = (1 – δ)ωE – (γ + m)I
dA/dt = ƸωE – (γ’ + m)A
dR/dt = γI + γ’A – mR
dW/dt = µI + µ’A - ƸW
Điều quan tâm đặc biệt trong mô hình toán học dịch bệnh là hệ số lây nhiễm cơ bản R0. Nếu R0 > 1 nghĩa
là dịch đang còn. Khi R0 < 1 là dịch được coi đã được khống chế và đang hết dần. Từ hệ phương trình có
thể xây dựng trạng thái cân bằng R0.
R0 = β [nA/m] (1 – δ)ω/[(ω + m)(γ + m)] +
β [knA/m] δω/[(ω + m)(γ’ + m)] +
βw [nA/m] (1 – δ)µω/[(ω + m)(γ + m)Ƹ] +
βw [nA/m] δµ’ω/[(ω + m)(γ’ + m)Ƹ]
Những phương trình này chẳng thể giải thủ công nổi, bắt buộc phải lập trình cho nó chạy trên máy tính,
các chuyên gia IT cũng phải mất 1-2 ngày mới có thể viết xong phần mềm. Và khi đã giải bằng máy tính,
thì chúng ta có thể lập hệ phương trình đến khoảng 20 biến, việc dự báo dịch sẽ chính xác hơn nhiều.
Mỗi lần dự báo dịch, tôi rất khó khăn trong việc lấy số liệu, vì chúng ta chưa có thói quen xây dựng cơ sở
dữ liệu, những người trực tiếp chống dịch cung cấp bệnh nhân với những thông tin chẳng giúp gì cho việc
tính toán theo mô hình toán thống kê.

You might also like