You are on page 1of 3

Machine Translated by Google

CÔNG CỤ CHO KHOA HỌC DỮ LIỆU

Liên kết: https://www.coursera.org/learn/open-source-tools-for-data-science?action=enroll#syllabus

Tuần 1. Tổng quan về các công cụ khoa học dữ liệu

Trong mô-đun này, bạn sẽ tìm hiểu về các loại và danh mục công cụ khác nhau mà các nhà khoa học dữ liệu sử

dụng và các ví dụ phổ biến của từng loại. Bạn cũng sẽ làm quen với các tùy chọn Nguồn mở, Dựa trên đám mây và

Thương mại cho các công cụ khoa học dữ liệu.

1. Giới thiệu khóa học

2. Danh mục Công cụ Khoa học Dữ liệu

3. Công cụ nguồn mở cho khoa học dữ liệu 4. Công

cụ nguồn mở cho khoa học dữ liệu


5. Công cụ thương mại cho khoa học dữ liệu

6. Công cụ dựa trên đám mây cho khoa học dữ liệu

Tuần 2. Ngôn ngữ của Khoa học dữ liệu


Đối với những người dùng mới bắt đầu hành trình khoa học dữ liệu, phạm vi ngôn ngữ lập trình có thể

khiến họ choáng ngợp. Vì vậy, ngôn ngữ nào bạn nên học đầu tiên? Mô-đun này sẽ nâng cao nhận thức về các tiêu

chí xác định ngôn ngữ nào bạn nên học.

Bạn sẽ tìm hiểu những lợi ích của Python, R, SQL và các ngôn ngữ phổ biến khác như Java, Scala, C++, JavaScript

và Julia. Bạn sẽ khám phá cách bạn có thể sử dụng các ngôn ngữ này trong Khoa học dữ liệu. Bạn cũng sẽ xem một

số trang web để tìm thêm thông tin về các ngôn ngữ.

1. Ngôn ngữ của khoa học dữ liệu

2. Giới thiệu về Python

3. Giới thiệu về ngôn ngữ R

4. Giới thiệu về SQL

5. Các ngôn ngữ khác cho Khoa học dữ liệu

Tuần 3. Gói, API, Bộ dữ liệu và Mô hình


Trong mô-đun này, bạn sẽ tìm hiểu về các thư viện khác nhau trong khoa học dữ liệu. Ngoài ra, bạn sẽ hiểu một

API liên quan đến yêu cầu và phản hồi REST. Ngoài ra, trong mô-đun này, bạn sẽ khám phá các bộ dữ liệu mở trên

eXchange Nội dung dữ liệu. Cuối cùng, bạn sẽ học cách sử dụng mô hình máy học để giải quyết vấn đề và điều

hướng eXchange Tài sản Mô hình.

1. Thư viện Khoa học Dữ liệu

2. Giao diện lập trình ứng dụng (API)

3. Tập dữ liệu - Cung cấp năng lượng cho Khoa học dữ liệu

4. Chia sẻ dữ liệu doanh nghiệp - Data Asset eXchange

5. Mô hình học máy – Học từ các mô hình để đưa ra dự đoán

6. Trao đổi tài sản mô hình

Tuần 4. Jupyter Notebooks và JupyterLab


Với sự tiến bộ của dữ liệu kỹ thuật số, Jupyter Notebook cho phép Nhà khoa học dữ liệu ghi lại các thử nghiệm

và kết quả dữ liệu của họ mà những người khác có thể sử dụng lại. Mô-đun này giới thiệu Jupyter Notebook và

Jupyter Lab. Bạn sẽ học cách làm việc với các nhân khác nhau trong phiên Notebook và về kiến trúc Jupyter cơ

bản. Ngoài ra, bạn sẽ xác định các công cụ trong một

1
Machine Translated by Google

Môi trường Anaconda Jupyter. Cuối cùng, mô-đun cung cấp tổng quan về môi trường Jupyter dựa trên đám mây
và các tính năng khoa học dữ liệu của chúng.

1. Giới thiệu về Máy tính xách tay Jupyter


2. Bắt đầu với Jupyter
3. Hạt nhân Jupyter
4. Kiến trúc Jupyter
5. Môi trường Anaconda Jupyter bổ sung
6. Môi trường Jupyter dựa trên đám mây bổ sung

Tuần 5. RStudio & GitHub

R là một ngôn ngữ lập trình thống kê và là một công cụ mạnh mẽ để xử lý và thao tác dữ liệu. Mô-đun này
sẽ bắt đầu với phần giới thiệu về R và RStudio. Bạn sẽ tìm hiểu về các gói trực quan hóa R khác nhau và
cách tạo biểu đồ trực quan bằng chức năng vẽ đồ thị.

1. Giới thiệu về R và RStudio

2. Vẽ đồ thị trong RStudio


3. Tổng quan về Git/GitHub

4. Giới thiệu về GitHub

5. Kho lưu trữ GitHub


6. GitHub - Bắt đầu
7. GitHub - Làm việc với các nhánh 8. Các
nhánh GitHub

Tuần 6. Tạo và chia sẻ Notebook Jupyter của bạn


Trong mô-đun này, bạn sẽ thực hiện một dự án cuối khóa để thể hiện một số kỹ năng đã học được trong khóa
học. Bạn cũng sẽ được kiểm tra kiến thức của mình về các thành phần và công cụ khác nhau trong bộ công
cụ của Nhà khoa học dữ liệu đã học trong các mô-đun trước.

Tuần 7. [Tùy chọn] IBM Watson Studio


Watson Studio là một nền tảng cộng tác dành cho cộng đồng khoa học dữ liệu và được các Nhà phân
tích dữ liệu, Nhà khoa học dữ liệu, Kỹ sư dữ liệu, Nhà phát triển và Người quản lý dữ liệu sử dụng để
phân tích dữ liệu và xây dựng mô hình. Trong mô-đun này, bạn sẽ tìm hiểu về Watson Studio và IBM Cloud
Pak cho dữ liệu dưới dạng dịch vụ. Sau đó, bạn sẽ tạo một dịch vụ IBM Watson Studio và một dự án trong
Watson Studio. Sau khi tạo dự án, bạn sẽ tạo sổ ghi chép Jupyter và tải tệp dữ liệu. Bạn cũng sẽ khám
phá các mẫu và hạt nhân khác nhau trong sổ ghi chép Jupyter.
Cuối cùng, bạn sẽ kết nối tài khoản Watson Studio của mình với GitHub và xuất bản sổ ghi chép trong GitHub.

1. Giới thiệu về Watson Studio

2. Tùy chọn: Tạo tài khoản trên IBM Watson Studio


3. Máy tính xách tay Jupyter trong Watson Studio

4. Máy tính xách tay Jupyter trong Watson Studio

5. Liên kết GitHub với Watson Studio

2
Machine Translated by Google

PHƯƠNG PHÁP KHOA HỌC DỮ LIỆU

Liên kết: https://www.coursera.org/learn/data-science-methodology#syllabus

Tuần 1. Từ Vấn đề đến Cách tiếp cận và Từ Yêu cầu đến


Bộ sưu tập

Trong mô-đun này, bạn sẽ tìm hiểu về lý do tại sao chúng ta quan tâm đến khoa học dữ liệu, phương
pháp luận là gì và tại sao các nhà khoa học dữ liệu cần một phương pháp luận. Bạn cũng sẽ tìm hiểu về
phương pháp khoa học dữ liệu và sơ đồ của nó. Bạn sẽ tìm hiểu về hai giai đoạn đầu tiên của phương pháp
khoa học dữ liệu, đó là Hiểu biết về Doanh nghiệp và Phương pháp Phân tích. Cuối cùng, thông qua một
phiên thực hành trong phòng thí nghiệm, bạn cũng sẽ nắm được cách hoàn thành các giai đoạn Hiểu biết về
doanh nghiệp và Phương pháp tiếp cận phân tích cũng như các giai đoạn Yêu cầu dữ liệu và Thu thập dữ
liệu liên quan đến bất kỳ vấn đề khoa học dữ liệu nào.

1. Hiểu biết về kinh doanh


2. Phương pháp phân tích
3. Yêu cầu dữ liệu
4. Thu thập dữ liệu

Tuần 2. Từ Hiểu đến Chuẩn bị và Từ Làm mẫu đến


Sự đánh giá

Trong mô-đun này, bạn sẽ tìm hiểu ý nghĩa của việc hiểu dữ liệu và chuẩn bị hoặc làm sạch dữ
liệu. Bạn cũng sẽ tìm hiểu về mục đích của việc lập mô hình dữ liệu và một số đặc điểm của quy trình lập
mô hình. Cuối cùng, thông qua một phiên thực hành trong phòng thí nghiệm, bạn sẽ học cách hoàn thành các
giai đoạn Hiểu dữ liệu và Chuẩn bị dữ liệu, cũng như các giai đoạn Lập mô hình và Đánh giá mô hình liên
quan đến bất kỳ vấn đề khoa học dữ liệu nào.

1. Hiểu dữ liệu
2. Chuẩn bị dữ liệu - Khái niệm
3. Chuẩn bị dữ liệu - Nghiên cứu tình huống

4. Mô hình hóa - Khái niệm


5. Mô hình hóa - Nghiên cứu tình huống

6. Đánh giá

Tuần 3. Từ triển khai đến phản hồi


Trong mô-đun này, bạn sẽ tìm hiểu về điều gì sẽ xảy ra khi một mô hình được triển khai và tại sao
phản hồi của mô hình lại quan trọng. Ngoài ra, bằng cách hoàn thành bài tập được đánh giá ngang hàng,
bạn sẽ thể hiện sự hiểu biết của mình về phương pháp khoa học dữ liệu bằng cách áp dụng nó vào một vấn
đề mà bạn xác định.

1. Triển khai
2. Phản hồi

3. Tóm tắt khóa học

You might also like