You are on page 1of 7

Mục lục

Lời mở đầu 2
Nội dung 3
1. Tổng quan về Big Data 3

1.1. Khái niệm về Big Data 3


1.2. Đặc trưng của Big Data 3
1.3. Sự khác nhau giữa dữ liệu lớn và dữ liệu truyền thống 4
2. Ứng dụng của Big Data 5
2.1. Ứng dụng của Big Data trong thương mại điện tử 5
2.2. Ứng dụng của Big Data trong y tế 5
Kết luận 6
Tài liệu tham khảo 7
Lời mở đầu
Ngày nay, sự phát triển không ngừng của khoa học kỹ thuật, tiêu biểu như
sự ra đời của Internet và các thiết bị điện thoại, máy tính cá nhân, đã mang lại
những thay đổi lớn trong mọi lĩnh vực đời sống. Trong kỷ nguyên của IoT2 với
việc ứng dụng và tích hợp sâu rộng các thiết bị di động như điện thoại di động, ô
tô, và máy móc công nghiệp góp phần vào việc tạo và chuyển dữ liệu, dẫn đến sự
bùng nổ của dữ liệu có thể thu thập được. Trong dòng thác dữ liệu liên tục được
tạo ra từng giây, thuật ngữ Big Data (Dữ liệu lớn) được sử dụng để chỉ những bộ
dữ liệu khổng lồ, chủ yếu không có cấu trúc, được thu thập từ nhiều nguồn khác
nhau. Tuy nhiên, Big Data lại chứa trong mình rất nhiều thông tin quý giá mà nếu
trích xuất thành công, nó sẽ giúp rất nhiều cho việc kinh doanh, nghiên cứu khoa
học, dự đoán các dịch bệnh sắp phát sinh và thậm chí là cả việc xác định điều kiện
giao thông theo thời gian thực. Trong công tác nghiên cứu khoa học, Big Data
đang mang lại các nhà nghiên cứu cơ hội tiếp cận và giải quyết rất nhiều vấn đề
hóc búa mà trước đây không thể hoặc rất khó thực hiện. Bằng việc tìm hiểu thông
tin dựa vào phương pháp thu thập và phân tích số liệu, qua bài viết này, em muốn
giới thiệu về khái niệm Big Data đang ngày càng phổ biến và những ứng dụng của
nó trong đời sống hiện nay và đặc biệt trong nền kinh tế số.
Nội dung
1. Tổng quan về Big Data
1.1. Khái niệm về Big Data
Big Data là các tập dữ liệu có khối lượng lớn và phức tạp. Độ lớn đến mức
các phần mềm xử lý dữ liệu truyền thống không có khả năng thu thập, quản
lý và xử lý dữ liệu trong một khoảng thời gian hợp lý.
1.2. Đặc trưng của Big Data
Big Data (Dữ liệu lớn) có 5 đặc trưng cơ bản (mô hình 5V):
Đầu tiên đó là khối lượng dữ liệu (Volume): Đây là đặc điểm tiêu biểu nhất
của dữ liệu lớn, khối lượng dữ liệu rất lớn. Kích cỡ của Big Data đang tung ngày
tăng lên, và tính đến năm 2012 thì nó có thể nằm trong khoảng vài chục terabyte
cho đến nhiều petabyte (1 petabyte = 1024 terabyte) chỉ cho một tập hợp dữ liệu.
Dữ liệu truyền thống có thể lưu trữ trên các thiết bị đĩa mềm, đĩa cứng. Nhưng với
dữ liệu lớn chúng ta sẽ sử dụng công nghệ “đám mây” mới đáp ứng khả năng lưu
trữ được dữ liệu lớn.
Thứ hai là tốc độ (Velocity): Tốc độ có thể hiểu theo 2 khía cạnh: Một là
khối lượng dữ liệu gia tăng rất nhanh (mỗi giây có tới 72.9 triệu các yêu cầu truy
cập tìm kiếm trên web bán hàng của Amazon); thứ hai là xử lý dữ liệu nhanh ở
mức thời gian thực (real-time), có nghĩa dữ liệu được xử lý ngay tức thời ngay sau
khi chúng phát sinh (tính đến bằng mili giây). Các ứng dụng phổ biến trên lĩnh vực
Internet, Tài chính, Ngân hàng, Hàng không, Quân sự, Y tế – Sức khỏe như hiện
nay phần lớn dữ liệu lớn được xử lý real-time. Công nghệ xử lý dữ liệu lớn ngày
nay đã cho phép chúng ta xử lý tức thì trước khi chúng được lưu trữ vào cơ sở dữ
liệu.
Thứ ba là độ đa dạng (Variety): Đối với dữ liệu truyền thống chúng ta hay
nói đến dữ liệu có cấu trúc, thì ngày nay hơn 80% dữ liệu được sinh ra là phi cấu
trúc (tài liệu, blog, hình ảnh, video, bài hát, dữ liệu từ thiết bị cảm biến vật lý, thiết
bị chăm sóc sức khỏe...). Big data cho phép liên kết và phân tích nhiều dạng dữ
liệu khác nhau. Ví dụ: với các bình luận của một nhóm người dùng nào đó trên
Facebook với thông tin video được chia sẻ từ Youtube và Twitter.
Thứ tư là độ chính xác (Veracity): Một trong những tính chất phức tạp nhất
của Dữ liệu lớn là độ chính xác của dữ liệu.Với xu hướng phương tiện truyền
thông xã hội (Social Media) và mạng xã hội (Social Network) ngày nay và sự gia
tăng mạnh mẽ tính tương tác và chia sẻ của người dùng Mobile làm cho bức tranh
xác định về độ tin cậy và chính xác của dữ liệu ngày một khó khăn hơn. Bài toán
phân tích và loại bỏ dữ liệu thiếu chính xác và nhiễu đang là tính chất quan trọng
của Big data.
Cuối cùng đó là giá trị (Value): Giá trị là đặc điểm quan trọng nhất của dữ
liệu lớn, vì khi bắt đầu triển khai xây dựng dữ liệu lớn thì việc đầu tiên chúng ta
cần phải làm đó là xác định được giá trị của thông tin mang lại như thế nào, khi đó
chúng ta mới có quyết định có nên triển khai dữ liệu lớn hay không. Nếu chúng ta
có dữ liệu lớn mà chỉ nhận được 1% lợi ích từ nó, thì không nên đầu tư phát triển
dữ liệu lớn. Kết quả dự báo chính xác thể hiện rõ nét nhất về giá trị của dữ liệu lớn
mang lại. Ví dụ, từ khối dữ liệu phát sinh trong quá trình khám, chữa bệnh sẽ giúp
dự báo về sức khỏe được chính xác hơn, sẽ giảm được chi phí điều trị và các chi
phí liên quan đến y tế.
1.3. Sự khác nhau giữa dữ liệu lớn và dữ liệu truyền thống
Dữ liệu lớn khác với dữ liệu truyền thống (ví dụ, kho dữ liệu – Data
Warehouse) ở 4 điểm cơ bản: Dữ liệu đa dạng hơn, lưu trữ dữ liệu lớn hơn, truy
vấn dữ liệu nhanh hơn, độ chính xác cao hơn.
Dữ liệu đa dạng hơn: Khi khai thác dữ liệu truyền thống (dữ liệu có cấu
trúc), chúng ta thường phải trả lời các câu hỏi: Dữ liệu lấy ra kiểu gì? Định dạng
dữ liệu như thế nào? Đối với dữ liệu lớn, không phải trả lời các câu hỏi trên. Hay
nói khác, khi khai thác, phân tích dữ liệu lớn chúng ta không cần quan tâm đến
kiểu dữ liệu và định dạng của chúng. Điều quan tâm là giá trị mà dữ liệu mang lại
có đáp ứng được cho công việc hiện tại và tương lai hay không.
Lưu trữ dữ liệu lớn hơn: Lưu trữ dữ liệu truyền thống vô cùng phức tạp và
luôn đặt ra câu hỏi lưu như thế nào? Dung lượng kho lưu trữ bao nhiêu là đủ? Gắn
kèm với câu hỏi đó là chi phí đầu tư tương ứng. Công nghệ lưu trữ dữ liệu lớn hiện
nay đã phần nào có thể giải quyết được vấn đề trên nhờ những công nghệ lưu trữ
đám mây, phân phối lưu trữ dữ liệu phân tán và có thể kết hợp các dữ liệu phân tán
lại với nhau một cách chính xác và xử lý nhanh trong thời gian thực.
Truy vấn dữ liệu nhanh hơn: Dữ liệu lớn được cập nhật liên tục, trong khi đó
kho dữ liệu truyền thống thì lâu lâu mới được cập nhật và trong tình trạng không
theo dõi thường xuyên gây ra tình trạng lỗi cấu trúc truy vấn dẫn đến không tìm
kiếm được thông tin đáp ứng theo yêu cầu.
Độ chính xác cao hơn: Dữ liệu lớn khi đưa vào sử dụng thường được kiểm
định lại dữ liệu với những điều kiện chặt chẽ, số lượng thông tin được kiểm tra
thông thường rất lớn, và đảm bảo về nguồn lấy dữ liệu không có sự tác động của
con người vào thay đổi số liệu thu thập.
2. Ứng dụng của Big Data
Dữ liệu lớn đã được ứng dụng trong nhiều lĩnh vực như: hoạt động chính trị,
giao thông, y tế, thể thao, tài chính, thương mại, thống kê... dưới đây là một số ví
dụ về ứng dụng dữ liệu lớn.
2.1. Ứng dụng của Big Data trong thương mại điện tử
Big Data giúp quản lý chuỗi cung ứng: Phân tích dự đoán dữ liệu đo từ xa
thời gian thực được thu thập từ các cảm biến thông minh được phân phối dọc theo
dây chuyền sản xuất cũng có thể giúp các nhà cung cấp ngăn chặn sự cố và giảm
thiểu thời gian chết. Nếu xảy ra lỗi, các mô hình Big data có thể xác định nguyên
nhân và ngăn chặn các trục trặc tương tự tái diễn trong tương lai.
Big Data cho biết trải nghiệm của khách hàng: Không có nghi ngờ rằng trải
nghiệm cá nhân hóa là rất quan trọng đối với nhận thức tích cực của khách hàng về
bất kỳ cửa hàng thương mại điện tử nào. Big Data có thể cung cấp thông tin
chuyên sâu về hành vi khách hàng từ nhiều kênh tương tác của người tiêu dùng với
một thương hiệu, như trang web, phương tiện truyền thông xã hội, tìm kiếm duyệt,
bảng câu hỏi trực tuyến. Qua đó, các doanh nghiệp có thể nắm được nhu cầu, sở
thích của khách hàng để gợi ý sản phẩm, dịch vụ muốn sử dụng trong thời gian
thực. Điều này làm tăng trải nghiệm cá nhân hóa của khách hàng.
Big Data giúp thanh toán trực tuyến an toàn: Các giải pháp Big Data đi sâu
vào thông tin khách hàng và mua hàng trong quá khứ và theo dõi các mẫu lặp đi
lặp lại để phân biệt giữa các giao dịch hợp pháp và đáng ngờ và đề xuất hướng
hành động phù hợp nhất để chống lại tội phạm mạng.
2.2. Ứng dụng của Big Data trong y tế
Big Data có thể lưu hồ sơ sức khỏe điện tử: Đây là ứng dụng rộng rãi nhất
của Big Data trong y học. Mỗi bệnh nhân đều có hồ sơ kỹ thuật số của riêng mình,
bao gồm nhân khẩu học, lịch sử bệnh, dị ứng, kết quả xét nghiệm trong phòng thí
nghiệm,... .Hồ sơ được chia sẻ qua hệ thống thông tin an toàn và có sẵn cho các
nhà cung cấp từ cả khu vực công và tư nhân. Mọi hồ sơ đều bao gồm một tệp có
thể sửa đổi, có nghĩa là bác sĩ có thể thực hiện các thay đổi theo thời gian mà
không cần thủ tục giấy tờ và không có nguy cơ sao chép dữ liệu.
Big Data giúp tăng cường sự tham gia của bệnh nhân: Nhiều bệnh nhân đã
quan tâm đến các thiết bị thông minh ghi lại mọi bước họ thực hiện, nhịp tim, thói
quen ngủ, ... của họ một cách thường xuyên. Tất cả thông tin quan trọng này có thể
được kết hợp với các dữ liệu có thể theo dõi khác để xác định các nguy cơ sức
khỏe tiềm ẩn đang rình rập. Ví dụ, mất ngủ mãn tính và nhịp tim tăng cao có thể
báo hiệu nguy cơ mắc bệnh tim trong tương lai. Bệnh nhân trực tiếp tham gia vào
việc theo dõi sức khỏe của chính họ và các ưu đãi từ bảo hiểm y tế có thể thúc đẩy
họ có lối sống lành.
Như vậy, Big Data đang ngày càng trở thành chìa khóa để có chuỗi cung
ứng hiệu quả và giảm chi phí. Trên thực tế, giờ đây Big Data đã trở thành một tiêu
chuẩn để thu nhập và phân tích lượng thông tin khổng lồ để giúp tăng doanh thu.
Các chuyên gia dự đoán xu hướng sẽ tiếp tục mở rộng và chỉ riêng việc tiết kiệm
chi phí trong tái cấu trúc chuỗi cung ứng, tiềm năng Big Data không chỉ mang lại
hiệu quả đáng kể mà còn là cơ sở cho việc phát triển vận hành hiệu quả. Song đó là
sự tận dụng công nghệ này rất linh hoạt và hiệu quả của các doanh nghiệp Việt
Nam giúp cho nền kinh tế nước ta phát triển mạnh mẽ hơn, bắt kịp xu thế hệ thống
thông tin thế giới để không phải tuột lại phía sau trong cuộc chạy đua đổi mới công
nghệ thông tin.
Kết luận
Tóm lại, Big Data đem lại rất nhiều lợi ích trong thời đại kinh tế số hiện nay.
Tuy nhiên, Big Data chính là thách thức đặt ra cho các doanh nghiệp trong thời đại
công nghệ số. Các doanh nghiệp cần hiểu rõ Dữ liệu lớn- Big Data là gì? và tận
dụng được tối đa nguồn dữ liệu lớn thì sẽ có hội thành công sẽ lớn hơn nhiều lần.
Xa hơn một chút Big Data có thể giúp các cơ quan Chính phủ dự đoán được tỉ lệ
thất nghiệp, xu hướng nghề nghiệp của tương lai để tập trung đầu tư cho các hạng
mục đó, cắt giảm chi phí, kích thích tăng trưởng kinh tế, thậm chí là ra phương án
phòng ngừa trước một dịch bệnh nào đó. Tuy vẫn còn những chỉ trích về Bigdata
nhưng đây là một lĩnh vực còn rất mới nên chúng ta hãy chờ đón sự tiến hóa của
Big Data trong tương lai.

Tài liệu tham khảo


1. Giáo trình Kinh tế số
2. TOPDev
3. GSOT
4. PACE

You might also like