Professional Documents
Culture Documents
Nguyen Anh Do TopCV - VN 010823.94627
Nguyen Anh Do TopCV - VN 010823.94627
Education
BACHELOR DEGREE OF DATA SCIENTIST 2020 - 2024
Work experience
2022 - 2023
NGUYỄN ẢNH ĐÔ • Đã triển khai kiến trúc dịch vụ vi mô giúp cải thiện tính phân tử của hệ thống và giảm sự
phụ thuộc vào thành phần.
• Các truy vấn cơ sở dữ liệu được tối ưu hóa để cải thiện hiệu suất ứng dụng và giảm
Data Scientist thời gian phản hồi xuống X%.
• Tái cấu trúc mã kế thừa để cải thiện độ tin cậy, khả năng mở rộng và khả năng bảo trì.
0903147636
Kết quả đạt được: Qua quá trình làm việc tại công ty FPT Software, tôi đã tạo được một
do123bg2020@gmail.com
Website/app mới.
Tân Phú, TP. HCM
vực Khoa học dữ liệu. Building an Azure Data Lake for Bike Share Data Analytics
• Phát triển các kỹ năng về Khoa học dữ * This project aims to develop a data lake solution using Databricks using a lake house
liệu, sở hữu kỹ năng phân tích sâu rộng, chú architecture.
ý đến từng chi tiết và khả năng làm việc
trong môi trường nhóm tốt. • The dataset used in this project is Chicago Divvy Bike Share Data.
• Design the star schema based on business outcomes. The business outcomes for
• Cam kết giúp các Công ty thăng tiến bằng designing are:
cách giúp họ phát triển các kế hoạch chiến 1. Analyze how much time is spent per ride based on the date time; station; the age of the
lược dựa trên các kết quả và mô hình dự rider.
đoán. Thành thạo trong việc nhận và giám 2. Analyze how much money is spent per month, quarter; per member; based on the age
sát dữ liệu từ nhiều luồng dữ liệu, bao gồm of the rider.
các nguồn dữ liệu Access, SQL và Excel. 3. Analyze how much money is spent per member:
• Based on how many riders the rider averages per month.
• Based on how many minutes the rider spends on a bike per month.
Skills
• Extract: Product Spark code in Azure Databricks to extract information from CSV files
Python, SQL, R, Java
stored in Databricks and write it to the Delta file system.
Copy Writing • Load: Create a gold data store in Delta Lake tables. Use spark.sql statements to create
the tables and then load data from the files that were extracted in the Extract step.
• Transform: Transform the data into a star scheme for a gold store
Quản lý thời gian
Interests
Bóng đá
Bơi lội
Cử tạ
Calisthenics