You are on page 1of 4

1. Khoa học dữ liệu (DS) là gì?

Nguồn tham khảo 1: https://aws.amazon.com/vi/what-is/data-science/


“Khoa học dữ liệu là lĩnh vực nghiên cứu dữ liệu nhằm khai thác những thông tin
chuyên sâu có ý nghĩa đối với hoạt động kinh doanh. Đây là một phương thức tiếp cận
đa ngành, kết hợp những nguyên tắc và phương pháp thực hành của các lĩnh vực toán
học, thống kê, trí tuệ nhân tạo và kỹ thuật máy tính để phân tích khối lượng lớn dữ liệu.
Nội dung phân tích này sẽ giúp các nhà khoa học dữ liệu đặt ra và trả lời những câu hỏi
như sự kiện gì đã xảy ra, tại sao nó xảy ra, sự kiện gì sẽ xảy ra và có thể sử dụng kết
quả thu được cho mục đích gì.”
Nguồn tham khảo 2: https://tuyensinh.ueh.edu.vn/bai-viet/tuyen-sinh-dai-hoc-2021-
khoa-hoc-du-lieu-nganh-hoc-don-dau-ky-nguyen-so/
“Khoa học dữ liệu là khoa học về việc quản trị và phân tích dữ liệu để tìm ra các hiểu
biết, các tri thức hành động, các quyết định dẫn dắt hành động. Khoa học dữ liệu gồm
ba phần chính: Tạo và quản trị dữ liệu, phân tích dữ liệu, và chuyển kết quả phân tích
thành giá trị của hành động. Việc phân tích và sử dụng các kết quả phân tích dựa vào
ba nguồn tri thức: thống kê toán học, khoa học máy tính và tri thức của lĩnh vực ứng
dụng cụ thể. Các mảng kiến thức của khoa học dữ liệu gồm: Khai thác dữ liệu (Data
mining), Thống kê (Statistic), Học máy (Machine learning), Phân tích (Analyze) và Lập
trình (Programming).”
Nguồn tham khảo 3: https://vi.wikipedia.org/wiki/Khoa_h%E1%BB%8Dc_d%E1%BB
%AF_li%E1%BB%87u#:~:text=Khoa%20h%E1%BB%8Dc%20d%E1%BB%AF%20li
%E1%BB%87u%20l%C3%A0,%E1%BB%9F%20c%C3%A1c%20c%C6%A1%20s
%E1%BB%9F%20d%E1%BB%AF
“Khoa học dữ liệu là một lĩnh vực liên ngành về các quá trình và các hệ thống rút trích
tri thức hoặc hiểu biết từ dữ liệu ở các dạng khác nhau, kể ở dạng cấu trúc hay phi cấu
trúc, là sự tiếp nối của một số lĩnh vực phân tích dữ liệu như khoa học thống kê, khai
phá dữ liệu, tương tự như khám phá tri thức ở các cơ sở dữ liệu (KDD).”

2. Các khối kiến thức cần thiết của người làm khoa học dữ liệu, kỹ năng cần thiết
tương ứng các khối kiến thức này?
Nguồn tham khảo 1: https://vnexpress.net/8-ky-nang-de-tro-thanh-nha-khoa-hoc-du-
lieu-3978465.html
Khối kiến thức cần thiết:
1. Phân tích (Analytics): gồm kỹ năng và kiến thức về thống kê, đo lường, tư duy
phản biện, kỹ năng và kiến thức trực quan hóa dữ liệu, sắp xếp dữ liệu và thao
tác với dữ liệu phi cấu trúc.

2. Lập trình (Programming): cần có kiến thức và kỹ năng về lập trình (sử dụng một
hoặc nhiều ngôn ngữ như Python, R, SAS và Scala), kiến thức về trí tuệ tự tạo,
học máy, học sâu, và kinh nghiệm tay nghề về SQL.
3. Kiến thức chuyên ngành (Domain Knowledge): Việc hiểu càng sâu các kiến thức
chuyên ngành sẽ giúp nhà khoa học dữ liệu có tư duy sâu, rộng hơn về các mô
hình, các phân tích mà họ sẽ nghĩ ra để giải các bài toán của doanh nghiệp, giúp
cho mô hình và phân tích của họ tổng quát nhất và chính xác.
Những kỹ năng chi tiết mà một nhà khoa học dữ liệu cần có:
1. Tư duy phản biện: sử dụng các phân tích, khảo sát và ước lượng khách quan
trước một vấn đề để đưa ra phán đoán chính đáng và có tính khả thi.
2. Thống kê: thống kê sẽ giúp các nhà khoa học dữ liệu có cái nhìn tổng quan về
dữ liệu trong bước tiền xử lý dữ liệu, cũng như giúp họ thể hiện tốt các kết quả
nghiên cứu cho đồng nghiệp và khách hàng. Khi hiểu rõ những công cụ, khái
niệm này, nhà khoa học dữ liệu sẽ lựa chọn được kỹ thuật tốt nhất có thể áp
dụng cho vấn đề của họ.
3. Kỹ năng lập trình: nhà khoa học dữ liệu phải thành thạo kỹ năng về việc sử dụng
các công cụ lập trình như Python, R và ngôn ngữ truy vấn cơ sở dữ liệu như
SQL, trên cả hai khía cạnh tính toán và thống kê.
4. Kiến thức về Học máy, Học sâu và AI
5. Kỹ năng làm việc với dữ liệu phi cấu trúc: Kỹ năng làm việc với dữ liệu phi cấu
trúc là một điểm cộng đối với các nhà khoa học dữ liệu.
6. Kỹ năng tiền xử lý dữ liệu: nhà khoa học dữ liệu sẽ cần phải dọn dẹp và sắp xếp
lại dữ liệu vì rất nhiều dữ liệu bị lộn xộn và các giá trị có thể bị thiếu, có thể có
định dạng không nhất quán.
7. Kỹ năng trực quan hóa dữ liệu: đây là một phần thiết yếu của khoa học dữ liệu,
vì nó cho phép nhà khoa học dữ liệu mô tả và truyền đạt kết quả của họ tới đồng
nghiệp và khách hàng. Nhà khoa học dữ liệu nên thành thạo một trong các thư
viện như Matplotlib, ggplot, d3.js, hoặc Tableau.
8. Kỹ năng thuyết trình: nhà khoa học dữ liệu cần có kỹ năng sử dụng dữ liệu để
giao tiếp hiệu quả với các bên liên quan. Các phẩm chất như tài hùng biện và
khả năng kể chuyện giúp họ truyền tải những thông tin kỹ thuật phức tạp thành
thứ đơn giản, dễ hiểu và chính xác đến đồng nghiệp hay những nhà lãnh đạo
doanh nghiệp.
Nguồn tham khảo 2: https://truongvietnam.net/nghe-phan-tich-du-lieu/
Các khối kiến thức cần thiết của người làm khoa học dữ liệu:
+ Để trở thành chuyên gia phân tích dữ liệu, người theo nghề phải có kiến thức về
toán học thống kê cũng như máy học, kiến thức về lập trình, kiến thức về cơ sở
dữ liệu.
8 kỹ năng để trở thành nhà khoa học dữ liệu:
+ Tư duy phản biện.
+ Thống kê
+ Kỹ năng lập trình.
+ Kiến thức về Học máy, Học sâu và AI.
+ Kỹ năng làm việc với dữ liệu phi cấu trúc.
+ Kỹ năng tiền xử lý dữ liệu.
+ Kỹ năng trực quan hóa dữ liệu.
Nguồn tham khảo 3: Những kiến thức cơ bản nào mọi Data Scientist cần có
(isb.edu.vn)
Kiến thức cơ bản mà mọi Data Scientist cần có
1. Kỹ năng phân tích và thống kê:Nhìn chung, xác suất và thống kê cần phải được kết
hợp để tạo thành chỉnh thể kỹ năng cần thiết cho Data Scientist.
2. Toán học: Toán học cũng là phần quan trọng đối với Data Science. Nếu bạn muốn
trở thành một Data Scientist chuyên nghiệp, bạn cần biết Đại số tuyến tính, tính toán,
toán học và lý thuyết tối ưu hóa.
3. Lập trình: Lập trình là kỹ năng khác biệt với 2 kỹ năng trên, tuy nhiên lại vô cùng
quan trọng vì nó quyết định tính ứng dụng của các dữ liệu mà Data Scientist đã xử lý.

3. Ví dụ ứng dụng KHDL trong ngành (lĩnh vực) chuyên ngành của bạn

Ví dụ ứng dụng KHDL trong ngành (lĩnh vực) chuyên ngành kế toán
Nguồn tham khảo 1: Uses of Data Analytics in Accounting and Finance | Maryville
Online
1. Phân tích báo cáo tài chính: Khoa học dữ liệu có thể giúp phân tích báo cáo tài
chính một cách chính xác và nhanh chóng, đồng thời đưa ra các quyết định kinh
doanh hiệu quả.
2. Quản lý hàng tồn kho: Khoa học dữ liệu có thể giúp quản lý hàng tồn kho một
cách hiệu quả, từ theo dõi mức tồn kho, dự báo nhu cầu đến tối ưu hóa việc
phân phối và phân phối.
3. Tính thuế và bảng lương: Khoa học dữ liệu có thể giúp tính toán thuế và bảng
lương chính xác, giảm sai sót và tiết kiệm thời gian.
Nguồn tham khảo 2: https://www.datatobiz.com/blog/data-science-in-accounting/
1. Dự đoán rủi ro tài chính: Khoa học dữ liệu có thể giúp dự đoán rủi ro tài chính,
giúp doanh nghiệp chuẩn bị và ứng phó kịp thời.
2. Tự động hóa quy trình kế toán: Khoa học dữ liệu có thể giúp tự động hóa quy
trình kế toán, giảm bớt công việc thủ công và tăng năng suất.
3. Phân tích xu hướng thị trường: Khoa học dữ liệu có thể giúp phân tích xu hướng
thị trường và giúp doanh nghiệp phát triển chiến lược kinh doanh phù hợp.
Nguồn tham khảo 3: https://www.lsbf.org.uk/blog/opinion-features/how-can-data-
science-help-accountants
Tác động của dữ liệu được thể hiện rõ ràng trong thế giới tài chính và kế toán. Kế toán
sử dụng phân tích dữ liệu để giúp doanh nghiệp khám phá những hiểu biết sâu sắc và
xác định các cải tiến quy trình.

Các công ty ngày càng phụ thuộc vào dữ liệu có thể phục vụ khách hàng một cách hiệu
quả bằng cách hiểu rõ hơn nhu cầu của họ. Thay vào đó, thời gian dành cho những
mục tẻ nhạt có thể được sử dụng để thúc đẩy hoạt động kinh doanh của khách hàng và
phát triển trong tương lai.

Dữ liệu lớn có thể được sử dụng để tìm hiểu các mô hình hành vi theo xu hướng thị
trường và người tiêu dùng mà kế toán viên có thể sử dụng để hỗ trợ xác định các cơ
hội đầu tư sinh lời.

You might also like