You are on page 1of 28

NHẬP MÔN CÔNG NGHỆ THÔNG TIN

CÔNG NGHỆ TRI THỨC


Nội dung

Ø Tổng quan và các khái niệm


Ø Đào tạo - hệ thống các môn học cơ sở và
chuyên ngành
Ø Nghiên cứu – các sản phẩm đã và đang
xây dựng
Ø Định hướng nghề nghiệp

2
Tổng quan
£ Giới thiệu bộ môn Công Nghệ Tri Thức:
p Thành lập từ năm 2005
p Là bộ môn gồm các thành viên trẻ, năng động trong
nghiên cứu và giảng dạy.
p Nhiều GV học tập và
tốt nghiệp nước ngoài đã
trở về và tham gia hoạt
động nghiên cứu và
giảng dạy của BM

3
Tổng quan
Bộ Môn Công Nghệ Tri Thức
Phòng I63
Khoa Công Nghệ Thông Tin
Đại học Khoa Học Tự Nhiên
227 Nguyễn Văn Cừ – Quận 5, Tp.Hồ Chí Minh
Phone: (84 8) 3835 4266

4
Hướng đào tạo
• KHMT (hướng tổng quát),
• Đa phương tiện,
• Xử lý ngôn ngữ tự nhiên,
• An ninh máy tính,
• Mã hóa mật mã
• Bên cạnh đó, sv có thể chọn các môn tự
chọn hướng Tài Chính Định Lượng (Khoa
Tóan) thì có thể nhận bằng 2 về Tóan tài
chính với thời gian 4,5 – 5 năm.

5
Mạng/an ninh mạng Mining Tài chính định lượng
Công nghệ lập trình Hiding Giải tích số
TK/bảo trị HTTT Nhận dạng Đại số/số học
Xử lý ảnh/thị giác MT CS trí tuệ nhân tạo Toán tài chính CB
Logic toán
CNThông tin KHMT Toán tài chính/xử lý dữ liệu
Các môn tự chọn ngành (chọn 5 môn)

Xử lý NNTN nâng cao


Bảo mật CSDL An ninh máy tính Xử lý NNTN

Mã hóa – mật mã Mã hóa ứng dụng Máy học thống kê Xử lý tín hiệu số

Thống kê máy tính

Các môn ngành (chọn 5 môn)

Khối kiến thức tự nhiên, Khối kiến thức cơ bản


Khối kiến thức toán
xã hội khoa học máy tính

Danh mục môn học


Hướng nghiên cứu
™ Mô hình toán cho
£ Xử lý ngôn ngữ tự nhiên xử lý số liệu
p Xử lý ngôn ngữ viết tiếng Việt
p Xử lý ngôn ngữ nói – Tài chánh, dữ liệu
p Đa phương tiện lớn, xu hướng từ
p Đa ngôn ngữ (Nhật, Hàn, Hoa,Anh) dữ liệu
p {vhq,ddien}@fit.hcmus.edu.vn
– Đa phương tiện
– Khai thác và kiểm
toán dữ liệu đảm
£ Mã hóa ứng dụng bảo tính riêng tư.
p Mật mã và an ninh thông tin
p Đa phương tiện – {ndthuc,tdthu}
p An ninh phần cứng và thám mã @fit.hcmus.edu.vn
p {ndthuc,tdthu} @fit.hcmus.edu.vn – {nhquan,ttson}
@fit.hcmus.edu.vn
7
Hợp tác
£ Các chuyên gia trong Khoa/Trường
£ Các chuyên gia từ các trường khác
£ Các doanh nghiệp
£ Các trường/viện/GS quốc tế

8
Phòng thí nghiệm AI Lab
£ Thành lập năm 2008…
£ Sản phẩm “Tiếng nói phương Nam -
VOS” đạt giải 3 Nhân tài đất Việt năm
2009
£ Phần mềm tổng hợp và nhận dạng tiếng
Việt trên iPhone, iSago, iNghe

9
Định hướng nghề nghiệp
£ Sinh viên chuyên ngành sau khi tốt nghiệp
có thể thực hiện các công việc ở: viện
nghiên cứu, các công ty có bộ phận nghiên
cứu và phát triển (R&D - Research and
Development) …
£ Sin viên tốt nghiệp có thể tham gia trực tiếp
vào tiến trình phát triển phần mềm hàm
lượng tri thức sâu của các công ty.
£ Sinh viên muốn học ở các bậc đào tạo sau
đại học (Thạc sĩ, hoặc Tiến sĩ) có thể xin học
bổng tại các trường Đại học có uy tín.

10
Khai thác văn bản
(text mining)
Xử lý ngôn ngữ tự nhiên
(natural language processing)
Phân loại văn bản
Tập văn bản đã được tổ chức vào các chủ đề
(tập văn bản huấn luyện). Với mỗi văn bản
mới, mục tiêu là xác định chủ đề thích hợp
của văn bản này.

Document
Classification

NMCNTT2 - FIT - HCMUS 12


Phân loại văn bản

Độ tương đồng và pp Nearest-Neighbor


p 1.Tính độ tương đồng giữa newDoc với mỗi văn bản
trong tập huấn luyện.

¡ Ví dụ độ tương đồng euclid

§ distance(x,y)=(x1−y1) 2 +···+(xm−ym)2

p 2.Chọn k văn bản tương đồng với newDoc.

p 3.Chủ đề của newDoc là chủ đề xuất hiện nhiều nhất


trong k văn bản ở bước 2.

NMCNTT2 - FIT - HCMUS 13


Tìm kiếm văn bản
Search engine
p Lưu trữ một tập văn bản D.
p Với mỗi văn bản đầu vào (query), một tập con
của D có độ tương đồng giảm dần với query
được trả về.

NMCNTT2 - FIT - HCMUS 14


Gom nhóm văn bản
Cho trước một tập văn bản, mục tiêu là tìm ra
các cụm văn bản sao cho mỗi cụm chứa các
văn bản tương đồng.

NMCNTT2 - FIT - HCMUS 15


Gom nhóm văn bản
Thuật toán k-Means
p 1. Chia ngẫu nhiêu các văn bản trong tập vào k nhóm.
p 2. Tính vector trọng tâm của mỗi nhóm.
p 3. So sánh các văn bản trong tập với mỗi trọng tâm của
nhóm. Chú ý trọng tâm nhóm tương đồng với văn bản
nhất.
p 4. Di chuyển các văn bản trong tập vào nhóm có trọng
tâm gần nhất.
p 5. Nếu không có văn bản nào bị chuyển nhóm thì thuật
toán kết thúc, ngược lại quay lại bước 2.

NMCNTT2 - FIT - HCMUS 16


Mật mã học
(Cryptography)
Cryptography

£ Mật mã học là ngành nghiên cứu các kỹ thuật


toán học để tạo ra các giao tiếp an toàn.
W. Stallings (2003), Cryptography and Network Security:
Principles and Practice, Third Edition, Prentice Hall

NMCNTT2 - FIT - HCMUS 18


Cryptography
Alice và Bob nói chuyện với nhau trong khi Eve đang
cố gắng nghe lén

Làm sao để giữ bí mật của cuộc nói chuyện!

Alice
Bob

Eve

NMCNTT2 - FIT - HCMUS 19


Main issues in information security
£ Secrecy: giữ bí mật thông tin.
£ Integrity: đảm bảo tính toàn vẹn của thông tin
hoặc giúp phát hiện thông tin đã được sửa
đổi.
£ Authentication: xác thực các đối tác trong giao
tiếp.
£ Non-repudiation: đảm bảo rằng bất kỳ đối tác
nào trong hệ thống không thể từ chối trách
nhiệm đối với hành động mà họ đã thực hiện.

NMCNTT2 - FIT - HCMUS 20


Symmetric-key cryptography
£ Mật mã đối xứng đề cập đến các phương thức
mã hóa trong đó cả người gửi và người nhận
đều chia sẻ cùng một khóa (khóa bí mật)

secret key

Ï
Mật mã đối xứng,
trong đó một khóa duy nhất được sử dụng để mã hóa và giải mã
Ð
Một khó khăn là chia sẻ khóa một cách an toàn

NMCNTT2 - FIT - HCMUS 21


Symmetric-key cryptography
£ Phương pháp:
p Substitution: Thay thế 1 từ / ký tự bằng 1 từ / ký tự
khác
X: JBCRCLQRWCRVNBJENBWRWN
lần lượt được mã hóa bằng các khóa bí mật
Yi= (Xi - K) mod 26
26: số ký tự trong bảng chữ cái
K=0 à Y: jbcrclqrwcrvnbjenbwrwn
K=1à Y: iabqbkpqvbqumaidmavqvm
K=2à Y: hzapajopuaptlzhclzupul

q Transposition: Thay đổi vị trí của các ký tự

NMCNTT2 - FIT - HCMUS 22


Public-key (asymmetric key)
cryptography
£ Năm 1976, Whitfield Diffie và Martin Hellman đã đề xuất khái niệm về mật
mã công khai (bất đối xứng) trong đó hai khóa khác nhau nhưng có liên
quan về mặt toán học với nhau - khóa công khai (public key) và khóa bí
mật (private key).

Trong các hệ thống mật mã công


khai, public key có thể được phân
phối tự do, trong khi private key
tương ứng với public key phải được
giữ bí mật

NMCNTT2 - FIT - HCMUS 23


Public-key (asymmetric key)
cryptography

Dùng khoá công khai để mã hóa,


nhưng dùng khoá bí mật để giải
mã.

NMCNTT2 - FIT - HCMUS 24


Public-key (asymmetric key)
cryptography

Dùng khoá bí mật để ký một thông


báo; dùng khoá công khai để xác
minh chữ ký.

NMCNTT2 - FIT - HCMUS 25


Public-key (asymmetric key)
cryptography

Tổ hợp khoá bí mật mình với khoá


công khai của người khác tạo ra khoá
dùng chung chỉ hai người biết.

NMCNTT2 - FIT - HCMUS 26


Tài liệu tham khảo
q Weiss, S. M., Indurkhya, N., & Zhang, T. (2015). Fundamentals of predictive
text mining. Springer.
q Tran Minh Triet (2009). Information security slide. The HCMC university of
Science.
q Wikipedia.

27

You might also like