Professional Documents
Culture Documents
1 thinhtlp@ueh.edu.vn
Nội dung
• Data là gì?
• Vai trò của Data?
• Data Science là gì?
• Các nguyên tắc của Data Science?
• Ứng dụng Data Science
• Quy trình xứ lý dữ liệu
thinhtlp@ueh.edu.vn
Data
thinhtlp@ueh.edu.vn
Data
thinhtlp@ueh.edu.vn
Thế giới thực, số hóa, không gian số
• Thời chuyển đổi số: Thời mọi thứ ngày càng được số hoá và kết nối
nhiều hơn qua Internet (Internet of Everything) và công nghệ số được
dùng trong mọi mặt của xã hội và kinh tế.
• Công nghệ số: là công nghệ về các đối tượng đã số hoá biểu diễn với
các mã số (Gồm công nghệ số hóa trong mọi lĩnh vực và công nghệ
xử lý dữ liệu được số hoá).
• Kinh tế số: Nền kinh tế dựa vào công nghệ số và internet. Cốt lõi là
kết nối, chia sẻ và khai thác dữ liệu
thinhtlp@ueh.edu.vn
Đột phá về công nghệ
Artificial Intelligent
Data Science
Cloud Computing
Internet of Thing
thinhtlp@ueh.edu.vn
Những cuộc cách mạng công nghiệp
S ả n ph ẩ
Sản xuất
thông minh
Sản xuất
hàng loạt
m
CMCN IV
Sản xuất Công nghệ số, AI
cơ khí
Sản xuất CMCN III
nông nghiệp Máy tính, Internet
CMCN II
Năng lượng điện
CMCN 1
Động cơ hơi nước
thinhtlp@ueh.edu.vn Th ời
gian
Điện toán đám mây
thinhtlp@ueh.edu.vn
Internet vạn vật (IoT)
• Là sự kết nối trên mạng Internet
của các vật thể, thiết bị .
• Các vật thể, thiết bị có thể trao đổi
thông tin, dữ liệu với nhau qua
Internet mà không cần kết nối trực
tiếp với nhau. (Người – người,
người – máy, máy – máy)
• Ví dụ: Hồ sơ bệnh án của một
người.
thinhtlp@ueh.edu.vn
Blockchain
• Về bản chất, blockchain như cơ sở dữ liệu thông thường: lưu trữ
dữ liệu với các thuộc tính duy nhất:
• Phân cấp - không ai có toàn quyền kiểm soát thông tin nào đi vào
• Đồng thuận - nhiều bên khác nhau lưu trữ các bản sao chính xác
của cùng một hồ sơ gốc, vì vậy đa số phải đồng ý với dữ liệu thêm
vào
• ‘Chỉ thêm’, nghĩa là không thể chỉnh sửa những gì đã có, chỉ có
thể thêm
• Thông tin mới không thể xung đột với những gì đã được thêm
• Thông tin có thể được truy cập và nhân rộng bởi tất cả mọi
người
thinhtlp@ueh.edu.vn
What is Big Data?
thinhtlp@ueh.edu.vn
Big Data
thinhtlp@ueh.edu.vn
Big Data
thinhtlp@ueh.edu.vn
Trí tuệ nhân tạo (AI)
thinhtlp@ueh.edu.vn
Lịch sử hình thành
thinhtlp@ueh.edu.vn
Định nghĩa AI
• Là khoa học và kỹ thuật chế tạo máy thông minh, đặc biệt là các chương
trình máy tính thông minh (John McCarthy, 1956).
• Trí tuệ nhân tạo giúp tạo ra máy tính có khả năng suy nghĩ, có trí tuệ như
con người (Haugeland, 1985).
• Là khoa học nghiên cứu các hoạt động trí não thông qua các mô hình tính
toán (Chaniaka và McDemott, 1985).
• Là khoa học nghiên cứu để máy tính có thể thực hiện được những công
việc mà con người làm tốt hơn máy tính (Rich và Knight, 1991).
• Trí tuệ nhận tạo nghiên cứu các mô hình máy tính có thể nhận thức, suy
luận và hành động (Winston, 1992)
• Trí tuệ nhân tạo nghiên cứu các hành vi thông minh mô phỏng các vật thể
nhân tạo (Nilsson, 1998)
thinhtlp@ueh.edu.vn
Định nghĩa AI
• Mục đích chính của AI là phát triển các máy tính (hoặc
chức năng máy tính) có khả năng thông minh như con
người.
1. Nhận thức
2. Học
3. Suy luận
4. Giao tiếp ngôn ngữ
5. Giải quyết vấn đề
thinhtlp@ueh.edu.vn
Định nghĩa AI
Sources:
Tutorials Point (2015). Artificial Intelligent Systems.
thinhtlp@ueh.edu.vn
Một số lĩnh vực AI
thinhtlp@ueh.edu.vn
Một số ứng dụng AI
thinhtlp@ueh.edu.vn
Một số ứng dụng AI
thinhtlp@ueh.edu.vn
Một số ứng dụng AI
• Giáo dục (Education)
• Hệ thống giảng dạy trực tuyến
• Người máy giảng dạy
• Trợ giảng thông minh
• Máy tính phân tích hành vi người
học, đánh giá kết quả học tập
thinhtlp@ueh.edu.vn
Một số ứng dụng AI
• Y tế, sức khỏe (Healthcare)
• Máy tính hỗ trợ chẩn đoán lâm sàng.
• Phẫu thuật với sự hỗ trợ từ robot.
• Ứng dụng trợ lý y tá ảo (VD: Care Angel).
• Tự động hóa các hoạt động quản trị bệnh viện.
thinhtlp@ueh.edu.vn
Một số ứng dụng AI
thinhtlp@ueh.edu.vn
Data, Information, Knowledge
thinhtlp@ueh.edu.vn
Data, Information, Knowledge
thinhtlp@ueh.edu.vn
Data, Information, Knowledge
integrated information,
Metaphor:
including facts and their
Data: rock; relations (“justified true
knowledge: belief)
ore. Miner? Is this road appropriate for
such amount of cars?
Obtaining by
- Perceiving data equipped with
- Discovering meaning
- Learning Average of number
of cars
Obtaining by each hour, each day, each
- Processing week, each year on the road.
Un-interpreted signal
Obtaining by Number of cars counted
- Observing on a road by hours, by
- Measuring days of the week, by
- Collecting months.
thinhtlp@ueh.edu.vn
Thu thập dữ liệu
Randomly
Collecting all
sampling
available
data
PHÂN TÍCH
HỌC MÁY &
THỐNG KHAI PHÁ DỮ
PHÂN
TÍCH DỮ KÊ LIỆU
LIỆU
QUẢN TRỊ Các hệ Làm sạch dữ
phân tán liệu
QUẢN Tính toán CSD An toàn dữ
liệu
TRỊ DỮ song song L ……
LIỆU .
Statistics
Data mining metaphor:
Large
Extracting ore from rock
and
KD unstructured
real-life
Database D Machine data
s Learning
Hỗ trợ ra quyết định
Áp dụng vào doanh nghiệp
Tài
Phân
chính
tích mô
tả
Sản xuất
6 bài toán của doanh nghiệp
Tài chính
01
Vận hành
Khách hàng
sản xuất 06 02
04
Thị trường
6 bài toán của doanh nghiệp
01 Khách hàng
06 02 P1
Sự hài lòng của khách
hàng
Khách hàng trung
P2 thành
Phân khúc khách
05 03 P3 hàng
Kênh bán và khách
P4 hàng
04 Mất
P5 khách
Thu hút khách
P6 hàng
6 bài toán của doanh nghiệp
▪ Doanh nghiệp có đang cung cấp
đúng những sản phẩm, dịch vụ mà
cái khách hàng mong muốn?
▪ Khách hàng có hài lòng về trải nghiệm
khi mua sản phẩm, dịch vụ của doanh
nghiệp?
▪ Khách hàng có hài lòng về sản phẩm,
dịch vụ của doanh
nghiệp? Họ hài lòng ở mức độ
nào và đâu là yếu tố khiến họ hài lòng
nhất? Nếu không thì nguyên nhân là
vì sao?
Principles of Data Science?
5Interpretation
and
Evaluation
4 Data Analysis
Making
decisions
3
Data
transformation
2
Data
preprocessing
1 The process is
Data collection inherently interactive
and and iterative
Quy trình phân tích dữ liệu
1 Data cleaning
2 Data integration and
transformation
3 Data reduction
(instances and 4 Data discretization
dimensions)