You are on page 1of 23

PHÂN TÍCH DỮ LIỆU

LỚN
TRONG HỆ THỐNG
GIAO THÔNG THÔNG
MINH (ITS)

Thành viên nhóm:


2051120071 – Nguyễn Ngọc Thiện
2051120175 – Trần Minh Tú
2051120194 – Hồ Ngọc Trung
Giáo viên hướng dẫn: Trần Anh Quân
Bố cục:
1. Giới thiệu về dữ liệu lớn trong ITS
2. Thu thập dữ liệu lớn trong ITS
3. Phương pháp phân tích dữ liệu lớn trong ITS
4. Ứng dụng của dữ liệu lớn trong ITS
5. Nền tảng dữ liệu lớn trong ITS
6. Những thách thức mở ra
1. Giới thiệu về dữ liệu lớn trong ITS
● Với sự phát triển của ITS, lượng dữ liệu được tạo ra trong ITS đang phát triển từ mức
Trillionbyte (nghìn tỷ byte) lên Petabyte (Triệu tỷ byte) -> các hệ thống xử lý dữ liệu
truyền thống không hiệu quả và không thể đáp ứng yêu cầu phân tích dữ liệu.
● Phân tích dữ liệu lớn có thể giải quyết các vấn đề về dữ liệu cho ITS như sau:

 Xử lý một lượng lớn dữ liệu đa dạng và phức tạp được tạo ra trong ITS

 Cải thiện hiệu quả hoạt động của ITS

 Cải thiện mức độ an toàn của ITS


Kiến trúc vận hành phân tích dữ liệu lớn trong ITS
2. Thu thập dữ liệu lớn trong ITS
Máy dò
Smart card
video
Thẻ gắn chip Camera cao tốc,
camera hành trình,..

CAV và
GPS Big Data In VANET
ITS
App định vị Hệ thống mạng lưới

Cảm biến, Nguồn


RFID
Quan trắc khác
Lưới điện thông
giao thông minh,..
Dữ
liệu lớn
trong ITS
3. Phương pháp phân tích dữ liệu lớn trong ITS
● Học có giám sát (Supervised Learning)

- Hồi quy tuyến tính (Linear Regression)


- Cây quyết định (Decision Tree)
- Mạng nơ-ron nhân tạo (Artificial Neural Network)
- Máy vector hỗ trợ (Support Vector Machine)
● Học không giám sát (Unsupervised Learning)
● Học tăng cường (Reinforcement Learning)
● Học sâu (Deep Learning)
● Phương pháp dựa trên bản thể học (Ontology Based Methods)
Học có giám sát (Supervised Learning)
Học có giám sát là một kỹ thuật của ngành học máy để xây dựng một hàm (function) từ
tập dữ liệu huấn luyện được dán nhãn (Labeled training data).
Hồi quy tuyến tính (Linear Regression)
● Chức năng của hồi quy (regression) là tìm ra mối quan hệ giữa một biến phụ
thuộc và một hay nhiều biến độc lập.
● Được sử dụng thành công trong rất nhiều trường hợp như: dự đoán lưu
lượng giao thông, ước lượng tốc độ dòng giao thông,
đánh giá tuyến đường giao thông,…
Cây quyết định (Decision Tree)
Cây quyết định là một công cụ hỗ trợ ra quyết định sử dụng cây đồ thị để mô
hình hóa những quyết định (decisions) và những kết quả có thể xảy ra.
Mạng nơ-ron nhân tạo (Artificial Neural
Network)
Mạng nơ-ron nhân tạo là một thuật toán học có giám sát vừa linh hoạt và mạnh
mẽ, được dùng cho cả phân loại (classification) và hồi quy (regression). Chỉ cần
lượng nút xử lý ẩn và tập dữ liệu training đủ lớn, ANN có thể tìm ra mọi mối
quan hệ phi tuyến tính (non-linear) giữa dữ liệu đầu vào và dữ liệu đích.
Máy vector hỗ trợ (Support Vector Machine)
Máy vector hỗ trợ (SVM) là một thuật toán sử dụng dữ liệu được dán nhãn để
thực hiện phân tích hồi quy và phân loại. Mục tiêu của SVM là tìm ra một siêu
phẳng trong không gian N chiều (ứng với N đặc trưng) chia dữ liệu thành hai
phần tương ứng với lớp của chúng.
Học không giám sát (Unsupervised Learning)
Học không giám sát còn được gọi là phân cụm (clustering) tập trung vào việc
gom các đối tượng dữ liệu đa chiều không được dán nhãn thành từng cụm, từng
nhóm.
Học tăng cường (Reinforcement Learning)
Khác với học có giám sát và học không giám sát, mục tiêu của học tăng cường
là giảm thiểu tiêu hao dài hạn thông qua việc thăm dò và tìm ra phương án tối
ưu (optimal policy) bằng cách tương tác với số liệu thực nghiệm.
Học sâu (Deep Learning)
Học sâu là một chức năng của trí tuệ nhân tạo (AI), bắt chước hoạt động của bộ
não con người trong việc xử lí dữ liệu và tạo ra các mẫu để sử dụng cho việc ra
quyết định.
Phương pháp dựa trên bản thể học (Ontology
Based Methods)
Các phương pháp bản thể học có thể mô tả chính xác ngữ nghĩa dữ liệu và suy
ra các quan hệ ngữ nghĩa tiềm ẩn.
4. Ứng dụng của dữ liệu lớn trong ITS

● Phân tích tai nạn giao thông đường bộ


● Dự đoán lưu lượng giao thông đường bộ
● Quy hoạch dịch vụ giao thông công cộng
● Lập lộ trình di chuyển cá nhân
● Quản lý và kiểm soát vận tải đường sắt
● Quản lý bảo trì tài sản
Ví dụ về phân tích
tai nạn giao thông
đường bộ
Mô hình dự đoán lưu lượng giao thông điển hình
5. Nền tảng dữ liệu lớn trong ITS
● Nền tảng dữ liệu lớn với các phương pháp phân tích dữ liệu có vai trò to lớn
trong việc phân tích dữ liệu trong ITS. Một khuôn khổ điển hình của việc sử
dụng nền tảng Spark trong ITS:
6. Những thách thức mở ra
● Thu thập dữ liệu: Do các phương tiện và người đi bộ di chuyển thường
xuyên, dữ liệu được thu thập trong quá trình di chuyển có thể không chính
xác, không đầy đủ.
● Bảo mật dữ liệu: Đây là vấn đề được quan tâm nhất.
● Lưu trữ dữ liệu: Mức phát triển về dung lượng lưu trữ dữ liệu chậm hơn
nhiều so với mức phát triển dữ liệu.
● Xử lý dữ liệu: Tính kịp thời rất quan trọng đối với các ứng dụng dữ liệu lớn
trong ITS.
● Dữ liệu mở: Để cho phép người dùng dịch vụ vận tải và nhà phát triển ứng
dụng tìm và sử dụng lại dữ liệu một cách hiệu quả, dữ liệu cần được lưu trữ
và có thể truy cập công khai với chất lượng tốt.
Lời kết

You might also like