Professional Documents
Culture Documents
👉Câu hỏi 1 (3 điểm): Tập làm phân tích realtime với Flink - 10 phút
Lấy mẫu clickstream avro từ divolte từ một website có click có text input
Truyền mẫu clickstream đó qua kafka sang flink. Phân tích realtime với windows tại
Fink, tìm xem nếu trong 2 phút có 2 lần click "Rau", hoặc "Thịt"; thì message log
ra "Sữa"
Truyền mẫu clickstream sang hdfs và ở Spark để load các file avro lên
Tạo cluster flink và spark để làm các tác vụ trên
.
.
👉Câu hỏi 2 (2 điểm): Tập làm phân tích batch với Python/Spark - 10 phút
Lấy mẫu data … load lên Spark để cleanse: tìm ra row thiếu, tìm ra giá trị col
null; loai bỏ null, thêm cột mới, chuyển data…
Trên Spark/Python tạo hàm xử lý cột…. Group và tính tổng các Note.
Thêm hàm, bóc tách trên …
Sử dụng thuật toán phù hợp tìm yếu tố…
.
.
👉Câu hỏi 3 (2 điểm): Tạo data warehouse với Scylla database với thiết kế như sau -
10 phút
Tạo bảng fact, và dimension xuất Báo cáo bán hàng, với mẫu database trong một doanh
nghiệp bán lẻ
Thêm dữ liệu mẫu và các bảng
Truy vấn và hiện dữ liệu vừa nhập
.
.
👉Câu hỏi 4 (3 điểm): Tạo ứng dụng web, theo dõi tiến trình phân tích dữ liệu bất
kỳ - 10 phút
Tạo theo mẫu web đã cho website kèm chức năng Đăng nhập theo Firebase
Tạo theo mẫu web đã cho: theo dõi dữ liệu di chuyển trên kafka
Tạo theo mẫu web đã cho: đưa ra ảnh kết quả phân tích trên python/spark qua image
tu plot; hoặc visualize từ một query database tạo từ canvas.js
.
###########################################
Reg_LiveStream_DathocNET
#koolj_dataengineering
Team,
Tiếp tục đăng ký khoá học, LIVESTREAM 1h15 phut mỗi buổi tối, từ 8/6 với mức
donation 1tr500k vnd/ bạn.
Mở đăng ký mới Xây dựng ứng dụng AI Stock Trading, LIVESTREAM 1h15 phut mỗi buổi
tối, từ 11/6 với mức donation 4tr vnd/ bạn.
.
.
.
Current classes: dathoc.net/botcl
👉Chi tiết học phần BigData fullstack toàn năng - livestream 1 thang
Tìm hiểu thông tin về thị trường nghề nghiệp của Nghề phát triển ứng dụng BigData.
Trao đổi tài liệu toàn khoá học
Các khái niệm cơ bản: Quy trình làm/xây dựng ứng dụng BigData. Các nguyên lý cơ bản
cho việc xây dựng ứng dụng BigData. Các công cụ hỗ trợ. Hiểu phương pháp luận phân
tích yêu cầu khách hàng ra yêu cầu ứng dụng dữ liệu lớn.
Phân tích yêu cầu khách hàng ra yêu cầu bài toán dữ liệu lớn
Dự trù nguồn lực và chi phí cho việc triển khai xây dựng bài toán dữ liệu lớn
Setup hadoop, hive, presto, spark
Tập thực hành: thiết kế một ứng dụng bigdata với script có sẵn trên hdfs, scala
hive, presto, parquet…
Tập thực hành: các câu lệnh và cài cắm phần mềm cơ bản trên bigdata hdfs
Tập thực hành: lập trình cơ bản Scala
Tập thực hành: lập trình Scala, transform, map và moving dữ liệu
Tập thực hành: lập trình cơ bản Java với webdriver
Tập thực hành: phương pháp luận chung về data mining, thực hành mining data,
crawling data cơ bản. Streaming data với Kafka, Nifi
Tập thực hành: lập trình ứng dựng crawling dữ liệu trên Java và webdriver
Tập thực hành: lập trình + sử dụng mã nguồn mở Java ứng dụng xử lý ngôn ngữ tự
nhiên NLP
Tập thực hành: tìm hiểu và thực hành phân tích thống kê: random forest, logistic
regression. Zeppelin, JS về visualize dữ liệu
Apply to project + coding from the source
Sizing/Scale Up hệ thống
Secure hệ thống
👉Demo: https://www.youtube.com/watch?
v=lLDrUuw1RHc&list=PL0ANjPcxElLh0wVySS_pJO2mvz8-19U3f
https://www.youtube.com/watch?
v=baa4iU97XSk&list=PL751V5I3RIDF3p62okHvxPC7lUBuLgx5Z&fbclid=IwAR1ejX0kdp38Xh70g-
9F_MiRp3boBTfwr8XKWdTRuCvA3r7Nw1rrjHkJxnU
👉Mọi ng setup Discord (search và cài) tool chat và share tài liệu Discord để dễ
liên lạc: https://discord.gg/Mcdwcra
.
.
.
👉Vì khoá học dạy bạn những chiêu thức lấy data qua internet, và chúng tôi dựa trên
tôn chỉ:
- Chỉ lấy những thông tin share public, được phép xem và công khai, theo quy định
public share của WWW, IEEE, những thông tin không vi phạm Luật An Ninh Mạng.
- Không truyền bá dạy học những chiêu thức lấy, lưu trữ những thông tin cá nhân,
thông tin vi phạm Pháp luật Nhà nước.
*Bắt buộc
Email *
Họ tên bạn *
Số điện thoại liên lạc khi cần *
Bạn làm nghề gì? *
Khoá học bạn muốn tham gia? *
BotData
BotCrawl
BotSeg
BotVision
BetGeoMap
BotTrade - AI Stock Trading
Bigdata fullstack
Khoá học là 5 - 12 buổi, LIVESTREAM 1h15 phut mỗi buổi tối, vậy time nào là ok cho
bạn? *
19h
21h
20h
Cảm ơn bạn đã đăng ký tham gia Khoá học tại Dathoc.NET
Không bao giờ gửi mật khẩu thông qua Google Biểu mẫu.
Biểu mẫu này đã được tạo ra bên trong dathoc.net. Báo cáo Lạm dụng
Google Biểu mẫu
##########################################
[REMOTE JOB] SENIOR DATA ENGINEER
US-UK crypto/blockchain project with ATTRACTIVE TOKEN BONUS
Salary: 3000~3500$ NET
■ Qualifications:
● Good English
● At least 3+ years of relevant experience in developing scalable secured fault-
tolerant, resilient & mission-critical Big Data platforms.
● Able to maintain and monitor the ecosystem with high availability.
● Must have a sound understanding of all Big Data components & Administration
Fundamentals. Hands-on in building a complete data platform using various open
source technologies.
● Must have good fundamental hands-on knowledge of Linux and building big data
stacks on top of AWS infrastructure.
● Understanding of big data principles and related technologies like HDFS, Spark,
Presto, Airflow, Kafka, Apache Atlas, etc.
● Good knowledge of Complex Event Processing systems like Spark Streaming, Kafka,
Apache Flink, Beam, etc.
● Able to drive DevOps best practices like CI/CD, containerization, blue-green
deployments, secrets management, etc in the Data ecosystem.
● Able to develop an agile platform with auto-scale capability up & down as well
vertically and horizontally.
● Able to develop an observability and monitoring ecosystem for all the components
in use in the data ecosystem.
● Proficiency in at least one of the programming languages Java, Scala, Python or
Go.
● Proficient understanding of distributed computing principles.
● Familiar or prone to adopt design thinking methods.
● Openness to experimenting with new techniques and new ways of working.
● Ability to build internal clients relationships, and work effectively across
functions and geographies.
● Ability to design solutions independently based on high-level architecture.
● You are a thought leader and are responsible for delivering complex projects
successfully.
● Mentor and guide junior members and contribute to global department expertise,
deliverables quality, and skills development.
● Excellent written and verbal communication skills for coordinating across teams.
■Working time : Monday-Friday (Flexible)
■Benefits & Perks:
- Work off on Saturday and Sunday by weekly, public holidays according to Vietnam
labor Law.
- Team building & party
- Annual leave
- 100% remote
- Probation time : 100% salary
- Competitive Salaries
- Token Bonus
-------------------------------------------------------------------
Contact me for further information
📷Email: Duyennguyen.viecoi@gmail.com (Ms. Duyen)
📷Phone: (+84) 287 3030 707 - Ext: 1024
📷Zalo: 085 69 38 576
📷Skype: live:.cid.a7f8289a10e2fbf0
##################################################################
[FUNiX FPT] KHÓA HỌC DATA ENGINEER
Chương trình Data Engineer của FUNiX - FPT gồm 5 môn học giúp trang bị cho học viên
những kiến thức cơ bản về thiết kế và xây dựng hệ quản trị cơ sở dữ liệu quan hệ và
phi quan hệ, thu thập dữ liệu trên mạng Internet, tự động hóa các quy trình làm
việc với dữ liệu (data pipelines) thông qua kho dữ liệu (data warehouse) và hồ dữ
liệu (data lake), làm việc với bộ dữ liệu lớn (big data) và ứng dụng học máy
(machine learning) vào các bài toán cần sử dụng dữ liệu lớn, triển khai một hệ
thống databricks trên nền tảng Azure hoặc AWS. Vào cuối chương trình, các bạn có
thể chọn một trong hai lựa chọn sau: Kết hợp các kỹ năng của mình để hoàn thành một
dự án capstone hoặc đi thực tập tại danh nghiệp.
🔻 Mục tiêu:
- Xây dựng được các mô hình cơ sở dữ liệu quan hệ và phi quan hệ.
- Tạo ra được các kho dữ liệu (data warehouse) hiệu quả và có thể mở rộng
- Có đầy đủ các kỹ năng làm việc hiệu quả với Big Data trên Pyspark và Python.
- Thao tác và làm việc tốt với các tác vụ về kỹ thuật dữ liệu trên nền tảng điện
toán đám mây AWS.
- Sử dụng thành thạo SQL cho truy vấn dữ liệu.
- Biết cách sử dụng Python 3 (Scrapy, Splash, Selenium) để thu thập dữ liệu web.
- Thiết lập được các quy trình giám sát và tự động hóa trên các đường ống dữ liệu
lớn (data pipelines) với Apache Airflow
💥 Thời gian học: 6 tháng, học online.
=>> Trong trường hợp chưa có đầy đủ các kiến thức điều kiện, người học cần học thêm
các môn học sau trong chứng chỉ điều kiện của chương trình Data Engineer:
✔️Lập trình Python cơ bản
https://courses.funix.edu.vn/courses/course-v1:FUNiX+PYB101x_01-
A_VN+2020_T6/about
✔️Hệ điều hành
https://courses.funix.edu.vn/courses/course-v1:FUNiX+OSM201x_2.1-
A_VN+2020_T6/about
✔️Cấu trúc dữ liệu và giải thuật với Python
https://courses.funix.edu.vn/courses/course-v1:FUNiX+CSD203x_01-
A_VN+2020_T11/about
*Bắt buộc
Cam kết đầu ra
🔴 Cam kết sau chương trình:
- Đảm bảo 100% việc làm cho tất cả các học viên theo học chương trình Data Engineer
- Mức lương tối thiểu 12 triệu đồng (mức lương trung bình là 16 triệu đồng)
- Địa điểm làm việc: Hà Nội, Đà Nẵng và TP. HCM (Danh sách đang tiếp tục update)
- Điều kiện: Học viên kết thúc được khóa học, sẽ có lộ trình việc làm khi các bạn
kết thúc 4 môn đầu và bắt đầu với môn thứ 5.