You are on page 1of 7

Bài 1.

Giới thiệu về môn học và một số nét đại cương về ứng dụng thực tế

Lịch sử của môn học trong Trường SoICT


Khoảng năm 2008, TG (tác giả) được giao xây dựng môn Toán chuyên đề như một môn học cơ sở
cho ngành ICT (bao gồm cả Khoa học máy tính – KHMT – và Kỹ thuật Máy tính – KTMT). Định hướng
dự kiến của môn học lúc đó là củng cố và trang bị thêm kiến thức về Xác suất và Thống kê để sinh
viên có thể dễ dàng tiếp cận với những lĩnh vực chuyên sâu mà ở đó XS&TK là một công cụ then
chốt, có ứng dụng sâu rộng. Ví dụ điển hình là AI và hàng loạt lĩnh vực liên quan như Học Máy, Nhận
dạng, và các lĩnh vực lớn khác như Xử lý tín hiệu, Lý thuyết thông tin, An toàn thông tin, Hệ phân tán
& tính toán phân tán … Mặc dù thời lượng chỉ có 2 tính chỉ (30 giờ) môn học vẫn được chia thành 2
phần: nửa đầu tập trung về xác suất cơ bản và ứng dụng trong thuật toán (do TG phụ trách) và nửa
thứ hai về thống kê và các ứng dụng rộng rãi trong khoa học và công nghệ nói chung do các PGS.
Nguyễn Thị Hoàng Lan và Nguyễn Linh Giang phụ trách.

Tuy nhiên môn học Toán chuyên đề chỉ được duy trì trong tổ hợp môn cơ sở ngành được khoảng 3
năm. Tại thời điểm 2008-2012, trường SoICT có nhiều biến động về cải tổ và xây dựng các dạng
chương trình đào tạo mới, phục vụ cho những mục tiêu mới do sự thúc bách đã có từ lâu đến từ thế
giới bên ngoài: sự phát triển đi trước của các nước tiên tiến trên thế giới cũng như sự chuyển mình
rất nhanh của nhu cầu đào tạo cho thị trường trong nước. Do cần thỏa mãn đồng thời nhiều đòi hỏi
đón bắt các xu hướng mới, yêu cầu “hot” về đào tạo, môn học này (tên gọi không quá gắn liền với
ICT) phải nhường “sân” cho những môn học của lĩnh vục “hot” bấy giờ!

Do nặng nợ với môn học mới xây dựng và tiếc công sức đã bỏ ra, TG đã quyết định cải tiến phần
mình phụ trách (xác suất và ứng dụng cho KHMT) để thành một môn mới có thể chuyển vào các
chương trình đào tạo mang tính ứng dụng cao hơn. Nhằm có thể giới thiệu như một môn học nền
tảng cho chương trình đào tạo của ngành Công nghệ phần mềm (mà lúc đó TG là một trong những
người trực tiếp xây dựng CTĐT), tác giả đã cố gắng chuyển hóa và phát triển để giới thiệu môn học
với tên mới “Mô hình và thuật toán mạng Internet phổ biến”. Đây là một tên học được đặt với nhiều
băn khoăn và bây giờ vẫn còn “trăn trở”. Cụm từ “mô hình” và “thuật toán” hướng đến việc giảng
dạy các mô hình tính toán và các thuật toán có dựa trên yếu tố ngẫu nhiên và công cụ xác suất. Tuy
nhiên những công cụ này không chỉ dùng cho Công nghệ phần mềm mà có thể dùng tốt ở mọi nơi
trong ICT. Ngoài ra nếu đặt tên với “mùi vị” quá thiên về lý thuyết thì lại dễ làm sinh viên, nhất là
giới quen tư duy “lập trình” và các thói quen chuyên về thao tác, khai thác, tích hợp, … “hoảng sợ” và
xa lánh. (Tất nhiên ở các trường tiên tiến thế giới như MIT, Stanford, Uni Berkeley … thì sinh viên
chả lạ gì mà còn hứng thú hơn với những tên thế này nhưng ở ta thì việc này chưa nhanh ngay được
như vậy) Chính vị vậy TG đã lắp thêm vào cái đuôi “internet phổ biến” để ngụ ý hướng tới ứng dụng
cụ thể rõ ràng. Quả thật hầu hết các ví dụ ứng dụng lớn của môn học đều có màu sắc BigData và
đương nhiên là cần sự cài đặt thế giới thật là trên mạng Internet hoặc IoT. Thêm nữa, những ví dụ
nổi tiếng như thuật toán ranking cho máy tìm kiếm Google (Google search engine) thì quá rõ là …
phổ biến vì sinh viên nào chẳng khai thác hàng ngày!

Thậm chí cũng không ngoa nếu nói rằng bất kỳ hiện tượng “nóng” nào, xảy ra trên thế giới vào thế
kỷ 21 này cũng có thể tìm được sự liên hệ vào môn học này, từ sự kiện “chiến tranh khủng bố” dịp
11/9/2001, đến gần đây như Đại dịch do virus Covid hay như xung đột chiến tranh Ucraina-Nga.
Yếu tố liên quan ở đây chính là những mô hình tính toán hay thuật toán có thể được sử dụng và khai
thác bởi chính phủ các quốc gia liên quan.

Hiện nay môn học đã được đưa vào chương trình đào tạo của cả 2 ngành là Khoa học máy tính và Kỹ
thuật máy tính (tuy chỉ là các môn lựa chọn), với mục đích là hỗ trợ chuẩn bị cho một nền tảng cơ sở
về xác suất và ứng dụng về thuật toán & mô hình ngẫu nhiên thật tốt cho sinh viên, mà thiếu nó sẽ
ảnh hưởng rất nhiều cho việc giúp sinh viên học tập & phát triển trong những lịch vực chuyên môn
ICT như AI, học máy, BigData, IoT, Xử lý tín hiệu, Lý thuyết thông tin và an toàn thông tin. Mục tiếp
theo sẽ làm rõ hơn ý tưởng cơ bản này.

Ý tưởng cơ bản: hỗ trợ nền móng cho Kỹ sư Thuật toán với định hướng Mạng và BigData
Đại học Bách Khoa Hà nội đã có một truyền thống tốt đẹp, nổi tiếng để phát triển một “chất riêng”,
chất “Kỹ sư Bách khoa” ngay từ những năm đầu thành lập. Sản phẩm đào tạo của ĐHBKHN là những
người mà được chuẩn bị về hành trang kỹ thuật, phương pháp và tư tưởng để trở thành những “bậc
thầy kỹ thuật” (“Sư” là “bậc thầy”), những chuyên gia giỏi có thể chủ động phát hiện bài toán trong
thực tiễn, tìm cách tiếp cận tốt , rồi xây dựng phương án giải quyết hiệu quả… và cho đến việc có thể
tham gia tổ chức quản lý dự án, huy động nguồn lực tài nguyên và trực tiếp triển khai thi công. Yếu
tố “bậc thầy” có thể thay thể và chuyển đổi thành “thủ lĩnh team” trong thế giới hiện đại, nơi mà có
thể coi những người làm start-up kỹ thuật thành công là những kỹ sư loại một.

Chính với thương hiệu và triết lý đào tạo gắn với yếu tố kỹ sư, ĐHBK đã từng có những danh xưng
rất nổi tiếng quen thuộc như Kỹ sư cơ khí, KS Điện, KS điện tử, KS VTĐ, KS Hóa-thực phẩm, … rồi
muộn hơn về sau này có KS tin học (rồi CNTT), KS Công nghệ SH … Có cả những cái danh xưng
tương đối khó hiểu với bên ngoài như KS kinh tế, KS Toán ứng dụng … Nếu truyền thống tốt đẹp này
tiếp tục phát triển, không khó để tưởng tượng chúng ta sẽ có KS AI, KS IoT, KS an toàn thông tin …
trong tương lai gần.

Vậy cốt lõi của Kỹ sư là gì? Là người phát hiện bài toán thực tế đáng kể và tìm ra phương pháp giải
quyết hiệu quả trong đó có việc phát triển những yếu tố kỹ thuật và công nghệ mới cần thiết. Trong
đó bao gồm những việc then chốt như mô hình hóa (tìm nền lý thuyết cơ sở liên quan và biểu diễn
được bài toán thực tiễn dưới dạng một mô hình của cơ sở lý thuyết với những yếu tố mở rộng cần
thiết) và tìm đường lối giải quyết sao cho tiêu chuẩn đánh giá quan trọng nhất là yếu tố khả thi trên
thực tế. Những công việc này đều đòi hỏi yếu tố sáng tạo; thậm chí một nhà khoa học làm việc để
thực hiện một bài báo nghiên cứu tạp chí Q1 cũng có thể xem là một Kỹ sư giỏi đã biết vận dụng
sáng tạo những cơ sở lý thuyết vào việc giải quyết một vấn đề phát sinh từ thực tiễn (thực ra yếu tố
thực tiễn càng cao, bài báo càng dễ được quan tâm). Tất nhiên tiêu chuẩn đánh giá cuối cùng của
một sản phẩm là bài báo Q1 thường là khác với các sản phẩm của một kỹ sư truyền thống: bài báo
phải có yếu tố đóng góp mới rõ ràng về học thuật – tính originality – thậm chí cần được thuyết
minh nổi bật; trong khi đó các sản phẩm của KS truyền thống cần hướng tới sự chấp nhận của khách
hàng lý tưởng hoặc cơ sở thực tế và đánh giá hiệu quả thực tế. Tuy nhiên óc sáng tạo của cả hai thực
ra không khác nhau nhiều, thậm chí họ có thể đổi chỗ cho nhau sau khi được đào tạo thêm về lĩnh
vực huy động!
Môn học được giới thiệu với các em chính nhằm tạo thêm một trụ cột cho một nền móng kiến thức
cơ sở để từ đó những người đầu tư học vấn lâu dài ở đây có thể trở thành những Kỹ sư chuyên gia
về thuật toán, với những sở trường mũi nhọn là thiết kế, chế tạo hoặc cải tiến những thuật toán hiệu
quả trong các lĩnh vực liên quan đến mạng & hệ phân tán, BigData và AI.

Cơ sở cho những lĩnh vực KHMT nâng cao và ứng dụng thực tế lớn
Cách tiếp cận của môn học có thể coi là mới mẻ và hiện đại, trong đó các kiến thức xác suất và mô
hình ngẫu nhiên cơ sở sẽ được giới thiệu và minh họa cách khai thác bằng những ứng dụng trực tiếp
trong các thuật toán và mô hình tính toán trong những lĩnh vực kể trên. Thậm chí ngay trước khi bắt
tay vào giới thiệu các tiên đề về không gian xác suất, chúng ta sẽ xem xét một ứng dụng rất cụ thể là
việc thiết kế một phép thử ngẫu nhiên đơn giản để kiểm tra kết quả một phép nhân đa thức, từ đó
tạo ra một chương trình phần mềm nhỏ hỗ trợ học sinh phổ thông học phép nhân đa thức.

Xuyên suốt trong chương trình, chúng ta lần lượt được giới thiệu những kiến thức cơ sở của lý
thuyết xác suất và các mô hình ngẫu nhiên và ngay sau đó sẽ làm quen và khảo sát sự ứng dụng cụ
thể của chúng trong KHMT. Bằng cách học này, tư duy phân tích và thiết kế thuật toán (đặc biệt với
thuật toán có yếu tố ngẫu nhiên) sẽ được liên tục thúc đẩy, nâng cao và góp phần làm hình thành
nên “não trạng” đặc trưng của người Kỹ sư thuật toán!

Lấy một bài toán cơ sở cụ thể làm ví dụ, bài toán “Lát cắt cực tiểu”: Cho đồ thị G(V, E) vô hướng liên
thông, tức là với mọi cặp đỉnh trong V tồn tại một đường đi trên G kết nối 2 đỉnh này. Một lát cắt
là một tập con C  E sao cho nếu ta “tháo bỏ” các cạnh nằm trong C thì đồ thị G sẽ bị chia tách
làm 2 phần độc lập, không còn liên thông nữa. Bài toán đặt vấn đề đi tìm lát cắt có số cạnh nhỏ
nhất (cực tiểu). Lắt cắt đó gọi là LCCT, và số cạnh của nó được gọi là kích thước của LCCT. Ứng
dụng của bài toán là đa dạng như trong khảo sát tình bền vững của các thiết kế mạng thực tế, thậm
chí ta có thể liên hệ tới vấn đề xây dựng các mạng lưới truyền tin và vận tải trong chiến tranh cùng
việc tìm cách tấn công triệt phá mạng lưới tương tự của đối thủ. Chúng ta sẽ phân tích các cách giải
quyết bài toán này đặc biệt là trong các tình huống thực tế mà đồ thị có qui mô lớn, từ đó nhận ra
rằng phải có một giải pháp phù hợp với thực tiễn, theo tiếp cận xấp xỉ khác với việc tìm đáp án tối
ưu truyền thống. Đó là một giải pháp dựa trên sử dụng một giải thuật ngẫu nhiên sẽ cho kết quả xấp
xỉ, nhưng độ “tốt” của nó (xác suất mà nó chính là đáp án tối ưu) hoàn toàn có thể kiểm soát và đạt
đến ngưỡng gần sát 1 (tốt nhất) tùy ý, chỉ phụ thuộc vào thời gian thực hiện bỏ ra. Đây có thể xem là
một ví dụ tốt thể hiện góc nhìn tư duy BigData cơ sở.

Quá trình liên tục “cọ sát” với các đặc trưng mô-tip tư duy của môn học, như việc làm quen và thuần
thục với việc áp dụng phân tích xác suất trong phân tích thuật toán và với thiết kế các thuật toán
ngẫu nhiên và xấp xỉ, dần sẽ tạo ra một “trực giác” sáng suốt trong làm việc với các công cụ này, và
năng lực nhanh chống nắm bắt được bản chất của các mô hình ngẫu nhiên trong các ứng dựng thực
tế. Trực giác thu được là một điều rất quí giá cho việc học hỏi và rèn luyện trong lĩnh vực nâng cao
của KHMT, đặc biệt là trong việc đọc hiểu các bài báo khoa học để từ đó nắm vững phương pháp và
học cách áp dụng.Tiếp cận với các tài liệu sách vở của các lĩnh vực chuyên sâu trong KHMT như các
hệ thống mạng, các hệ BidData, hay các địa hạt khó của AI như học máy (đặc biệt là các bài báo khoa
học ở các lĩnh vực này) ta thường xuyên gặp phải những phần nội dung đòi hỏi kiến thức tốt về tin
học lý thuyết và toán ứng dụng thì mới có thể nắm vững và làm chủ. Thiếu đi cái trực giác nhạy bén
về thuật toán, đặc biệt liên quan đến xác suất và mô hình ngẫu nhiên (gần như chắc chắn các xử lý
BigData điển hình sẽ có các yếu tố này), người đọc sẽ cảm thấy “chịu trận ghê gớm” và không thu
được gì mặc dù có thể đã cố thử đọc nhiều lần. Có được trực giác nhạy bén này chúng ta sẽ không bị
ngợp, biết cách tiếp cận hợp lý và chiếm lĩnh được các nội dung tài liệu khó nhằn nhất.

Một số ví dụ và cases ứng dụng điển hình


Thuật toán sắp xếp Quick-Sort. Đây có thể coi là thuật toán cơ bản, có ý nghĩa ứng dụng cao mà hầu hết
sinh viên kỹ thuật năm hai trở lên đều ít nhiều biết tới hoặc quen thuộc. Thuật toán rất đơn giản và sinh
viên mới học lập trình có thể cài đặt thử được ngay, nhưng hiểu biết rõ ràng là tại sao thuật toán lại
nhanh và có độ phức tạp thời gian thực hiện O(nlogn) thì rất ít sinh viên nắm được. Môn học cho ta câu
trả lời chính xác, tường tận và qua đó giới thiệu phương pháp phân tích xác suất thông qua motiv chia-
để-trị cơ bản, từ đó có thể biến thành một công cụ rất lợi hại nếu ta “lão luyện” nó. Phương pháp này
cũng cho ta thấy Q-Sort có thể coi là một dạng thuật toán xử lý “thông minh”, và cái thông minh ở đây là
rất quen thuộc: biết học từ kinh nghiệm đã có để nâng cao năng suất xử lý dữ liệu.

Thuật toán tuyển dụng trợ lý. Bài toán tuyển dụng này có thể coi là dạng đặc thù nhưng khá phổ biến,
khi đối tượng tuyển dụng cần phù hợp với một môi trường công việc đặc thù mà các kỹ năng và phẩm
tính mong muốn của người được tuyển khó bộc lộ hết qua CV và phỏng vấn. Cho thử việc sẽ tạo điều
kiện đánh giá chính xác nhất tuy nhiên điều này thường bị e ngại nếu số lượng ứng viên là cao: việc thử
và thay thế “giữa dòng” lặp đi lặp lại sẽ có thể gây ra sự mệt mỏi và nhiễu loạn cho các vị trí liên quan,
đặc biệt là lãnh đạo bộ phận sẽ mất nhiều thời gian quí báu để đào tạo nhanh, giải thích, hỗ trợ người
làm mới. Thuật toán đề xuất là khá đơn giản nhưng cũng gây hoài nghi về chi phí thử việc, điều mà sẽ
được chứng minh là khả thi thông qua quá trình đánh giá thuật toán nhờ phân tích xác suất. Điều thú vị
là một cách làm tưởng như thiếu tính thực tế hóa ra lại là có tính khả thi thông qua phân tích lý thuyết
(100 ứng viên cũng chỉ dẫn đến khoảng 4-5 người được tuyển làm thử!) Hơn nữa ta có thẻ áp dụng
thuật toán này trong khá nhiều tình huống tương tự. Một ví dụ rất thực tế là việc thu thập thông tin
quảng cáo và tìm nhà ở thuê: số lượng tin xem có thể lớn nhưng số lượng điểm ta đến xem “người thực
việc thực” có thể nhỏ ở mức kiểm soát dễ dàng. Sinh viên có thể tự mình đề xuất các ví dụ khác, kể cả
các ví dụ có tính áp dụng cao trong thị trường kinh doanh.

Bài toán tính thành viên xấp xỉ và cấu trúc dữ liệu Bloom Filter. Bài toán tính thành viên xấp xỉ được
đặt ra nhằm tìm giải pháp hiệu quả (nhanh & chấp nhận xác suất lỗi) cho câu hỏi “một phần tử X đang
xét có thuộc một tập S đang quan tâm hay không?” trong đó tập S có kích thước lớn gồm các đối tượng
phức tạp. Thử tưởng tượng phải giải quyết một vấn đề khó như phát hiện tình nghi khủng bố tại các sân
bay trong và sau sự kiện tấn công khủng bố ở Mỹ (Tấn công đánh sập thòa Tháp Đôi Trung tâm tài chính
quốc tế, 11/9/2001) thông qua các thiết bị lọc kiểm tra khi hành khách lên máy bay. Dữ liệu tình nghi
khủng bố, bao gồm hồ sơ đầy đủ với ảnh và dấu vân tay là rất lớn và có thể phân tán, làm sao có thể cho
phép kiểm tra đối sánh nhanh nhất với mỗi hành khách và phát hiện tình nghi kịp thời, đồng thời đảm
bảo thời gian trễ đủ nhỏ, không gây ra quá tải “vỡ trận” xếp hàng tại sân bay? Một motiv điển hình là với
một số bài toán BigData, khi đối tượng thực tế có số lượng và kích thước lớn, người ta có thể lựa chọn
lưu trữ các fingerprint tức dấu vết đặc trưng của dữ liệu rồi khai thác trong các thuật toán tìm kiếm và
cập nhật xấp xỉ. Là một cấu trúc dữ liệu xác suất, Bloom Filter lưu trữ các fingerprint của các đối tượng
thực tế phức tạp (tập S); nhờ lưu trữ “dấu vết” thay vì lưu trữ dữ liệu đầy đủ, “tập S” sẽ gọn nhẹ và việc
kiểm tra thành viên sẽ cực kỳ nhanh nhưng có tính xấp xỉ (tồn tại xác suất nhầm nhưng có thể kiểm soát
xác suất lỗi). Bloom Filter có rất nhiều ứng dụng trong ICT, chẳng hạn như trong lớp học ta sẽ khảo sát
ứng dụng phát hiện tấn công DoS và xây dựng cơ chế lọc giảm thiểu gói tin SYN trong tấn công DDoS
dạng TCP SYN Flood (kẻ địch phá hoại hệ thống nạn nhân bằng việc tạo ra dòng thác gói tin SYN làm tràn
ngập không gian mạng và cạn kiệt khả năng xử lý của máy chủ nạn nhân).

Chuỗi Markov và thuật toán Page rank (Google Search Engine). Chuỗi Markov là mô hình ngẫu nhiên
mô tả chuỗi trạng thái diễn biến khi quan sát một quá trình ngẫu nhiên nào đó, trong đó xác suất của sự
kiện rơi vào một trạng thái nào đó sẽ chỉ phụ thuộc vào trạng thái đạt ở diễn biến trước. Mô hình cơ bản
này có ứng dụng đa dạng, trong đó ứng dụng cho khảo sát diễn biến trong các hệ thống ICT, là nền tảng
cho quản lý hàng đợi trong các hệ thống xử lý dịch vụ, có thể gặp trong hệ điều hành, trong mạng truyền
tin, trong xử lý yêu cầu trên Web Server. Thuật toán Page Rank, một cơ sở nền tảng cho cỗ máy tìm kiếm
Google Engince, cũng được xây dựng và phân tích dựa trên mô hình chuỗi Markov (cụ thể hơn là dựa
vào Random Walk, một chuỗi Markov trên đồ thị). Nhờ có mô hình này mà ta chứng minh được là khái
niệm “rank” của mỗi trang web là có thật, ổn định và dó đó có thể tính và xếp hạng.

Đồ thị ngẫu nhiên và ứng dụng trong nghiên cứu các tổ chức mạng thế giới thực, mạng xã hội và đại
dịch. Các mô hình đồ thị ngẫu nhiên, từ cơ sở đến các phiên bản mở rộng, cho phép ta khảo sát và lý giải
hàng loạt hiện tượng thú vị hay gặp trong các mạng kết nối lớn hình thành tự nhiên hay nhân tạo. Chẳng
hạn như nó giúp ta hiểu được hiện tượng Small-World (hiệu ứng thế giới nhỏ) trong đó tồn tại một giả
thuyết khá thú vị đã biết đến từ lâu: hai người bất kỳ trên trái đất chỉ “tách biệt nhau” bởi tối đa có 6
mỗi quan hệ quen biết; nói cách khác là có thể kết nối 2 người bất kỳ bằng một “cây cầu xã hội” với tối
đa 6 nhịp – 6 mối quan hệ quen biết. Những mô hình đồ thị ngẫu nhiên cũng giúp ta khảo sát về các cấu
trúc mạng lớn, như mạng Internet vật lý, mạng WWW, và các dạng mạng xã hội phong phú; từ đó người
ta có thể xây dựng những giao thức hay thuật toán xử lý thông tin mạng hiệu quả, hoặc phát triển
những các hệ AI như hệ gợi ý hay phân tích và khai thác mạng xã hội. Đặc biệt mô hình đồ thị ngẫu
nhiên, trong đó có các nghiên cứu về phase transition, giúp chúng ta mô hình hóa về quá trình truyền
nhiễm, chuỗi lây lan của virus, và sự bùng phát của đại dịch cũng như cách mô hình hóa và đánh giá hiệu
quả của các biện pháp kiểm soát và dập tắt dịch như chiến dịch vắc-xin.

Còn rất nhiều ứng dụng ICT quan trọng khác mà ở đó ta thấy các cấu trúc dữ liệu (CTDL) ngẫu nhiên, các
mô hình và các thuật toán ngẫu nhiên có thể đóng vai trò hạt nhân trung tâm của giáp pháp thiết kế.
Một số đã được đề cập trong nội dung môn học như thiết kế cấu trúc mạng P2P chia sẻ nội dung sử
dụng CTDL bảng băm phân tán (Distributed Hash Tables). Một số đang được đưa vào tầm ngắm để bổ
sung giới thiệu như các ứng dụng đa dạng của mô hình Hiden Markov. Chủ đề Blockchain, đặc biệt là
khái niệm proof-of-work có thể được bổ sung như là một nội dung đọc thêm.

Một số yêu cầu thêm


Bài tập lớn tự chọn. Nhiều chủ đề chỉ mới được giới thiệu sơ lược ở mức “vỡ hoang” và còn nhiều chủ
đề liên quan khác chưa được giới thiệu trong nội dung chính môn học, nên sinh viên được khuyến khích
tự nghiên cứu mở rộng thêm hoặc “tự thám hiểm các chủ đề mới” trong hình thức BT lớn tự chọn. Đây
là phần tự chọn nên sinh viên chỉ nên thực hiện khi có hứng thú quan tâm thực sự, muốn đầu tư lâu dài
cho một topic nào đó có thể đi sâu nghiên cứu, hoặc hỗ trợ cho chủ đề nghiên cứu (có thể ở các môn
học khác). Chẳng hạn sinh viên có thể hướng vào những chủ đề liên quan đến các công cụ nền tảng của
Khoa học Dữ liệu, hay Học Máy, … (Các mô hình Markov Chain & Random Walk, Random Graphs là
những chương cơ sở của cuốn “Fundamentals of Data Science” – Blum, Hopcroft & Kannan, 2015) hoặc
các chủ đề nâng cao trong cuốn “Probability and Computing” – Mizenmacher & Upfal, Cambrige Press
(2005). Sinh viên có thể chọn thể hiện BTL dưới dạng một báo cáo chuyên đề, khảo sát chi tiết một bài
toán hoặc một phương pháp, một thuật toán cụ thể. Nên đọc nhiều tài liệu tham khảo và thể hiện khả
năng tổng hợp. Đặc biệt cần có sự liên hệ ứng dụng, và thậm chí có thể đi sâu trình bày về một ứng dụng
có tính thực tế với thời lượng đến một nửa BTL. Cố gắng trình bày trong khuôn khổ hình thức của một
bài báo khoa học (vận dụng kiến thức về văn phong học thuật, kỹ thuật). Có thể thực hiện một số cài
đặt, lập trình và đưa kết quả thực nghiệm vào báo cáo. Phần thực nghiệm nếu muốn thể hiện sâu sắc
cần có các case studies và/hoặc so sánh đánh giá hiệu năng của một số giải pháp/thuật toán khác nhau.

Chống đạo văn. Thông qua môn học “Technical Writing & Presentations” các em đã hiểu thế nào là đạo
văn, từ các hình thức đạo văn thô sơ đến tinh vi. Đặc biệt, hy vọng các em đã thấy rõ sự cần thiết phải
chống đạo văn, không chỉ là khía cạnh thiếu đạo đức của nó (“ăn trộm” công sức người khác cố ý hay vô
tình), mà còn hiểu rằng dù chỉ là “mượn tạm” nó sẽ trở thành thói quen lười biếng phá hỏng nỗ lực phát
triển chuyên nghiệp, rèn luyện để trở thành một kỹ sư, một nhà chuyên môn giỏi! Các bài viết của các
em sẽ được đưa kiểm tra trên một hệ kiểm tra đạo văn chuyên nghiệp (quốc tế), và sẽ bị loại bỏ nếu chỉ
số đạo văn là đáng kể. Hệ thống kiểm tra này cho phép phát hiện ngay cả tài liệu tiếng Việt sinh bởi
Google Translate từ tiếng Anh!

Tinh thần tự học – tự nghiên cứu. Trên đây ta đã chia sẻ về nội hàm ban đầu của từ Kỹ Sư. Chúng ta đã
nhận định về nội hàm của nó – sáng tạo trong thực tiễn – là quan trọng hơn nhiều so với quan niệm hình
thức phổ biến – một bằng cấp đại học ở các đại học kỹ thuật, có yếu tố chuyên sâu ứng dụng và thường
“oai” hơn cử nhân một chút do học lâu hơn. Thậm chí, những nhà phát minh nông dân (gọi đùa là
NPM Hai Lúa) đã tạo ra nhưng công cụ máy móc nông nghiệp, giải quyết rất hiệu quả cho những vấn
đề sản suất nông nghiệp tại địa phương, đều có thể xem là những Kỹ sư giỏi. Dù có thể họ không có
bằng cấp bậc đại học, nhưng họ đúng là có tố chất KS, họ có thể không qua môi trường đại học,
nhưng họ đã phải tự học hết sức chủ động & hiệu quả. Những KS có bằng cấp có khi vẫn nên xem
NPM Hai Lúa là … thầy ít nhất là về tinh thần dám nghĩ dám làm và năng lực chủ động đi tìm & học
các công cụ kỹ thuật để dần dần nắm vững & giải quyết vấn đề. Bằng cấp không phải là điều kiện cần
và đủ, nó chỉ là một trong những phương tiện quan trọng mà thôi. Doanh nhân nổi tiếng, không
bằng cấp, như Bill Gate, là một ví dụ thú vị khác. Bill Gate đã xây dựng hệ điều hành cho máy tính PC
đời đầu (MS-DoS) khi còn là một sinh viên năm dưới: trong khi đa phần bạn bè cũng lứa đang mới
học lập trình thì ông đã xông vào nghiên cứu giải quyết một bài toán lõi hệ thống. Ông đã phát hiện
ra một bài toán thực tiễn quan trọng, một “miếng bánh thị trường” chưa được các công ty lớn chú ý,
rồi phát triển giải pháp phù hợp và hiệu quả, từ đó chiếm lĩnh thị trường phần mềm máy tính cá
nhân, và xây dựng một công ty hàng đầu thế giới trong CNTT. Tất nhiên những tấm gương thành
công nhưng chưa qua một quá trình đào tạo trường lớp thông thường này không hề “thiếu kiến
thức nền tảng”, trái lại là đằng khác, chỉ có điều họ đã đạt được điều này thông qua quá trình tự học
hết sức quyết liệt, chủ động tìm tòi, đào sâu và chinh phục công cụ kiến thức. Những ví dụ này cho
thấy “bằng cấp” thực ra chỉ là thành tích hình thức, tinh thần tự học quyết liệt, tinh thần “dám nghĩ
dám làm” để đào sâu nghiên cứu bất cứ vấn đề mới và khó nào mới là điều tối quan trọng để thành
công! Tất nhiên, đại bộ phận chúng ta những người không có năng lực phi thường vẫn cần dựa vào
môi trường đào tạo truyền thống để có thể chiếm lĩnh những nền tảng kiến thức cần thiết. Nhưng để
thực sự thành công cao thì luôn cần có những yếu tố “dám nghĩ dám làm” và quyết liệt trong việc tự
học & nghiên cứu!

Thiết kế của môn học này là rất mở, do đó hy vọng các em sẽ nỗ lực trong việc đóng góp vào bài học
trên lớp, rồi chịu khó & quyết liệt đầu tư thời gian cho BTL, và tiếp tục đào sâu và nâng cao kỹ năng
nghiên cứu liên quan trong thời gian đại học và cả sau đó!

You might also like