Big Data Trong Giao Duc

Machine Translated by Google
Kỷ yếu hội thảo quốc tế về kỹ thuật công nghiệp và quản lý vận hành
Istanbul, Thổ Nhĩ Kỳ, ngày 7-10 tháng 3 năm 2022
Ứng dụng dữ liệu lớn để dự đoán hành vi của học sinh trong
Ngành giáo dục
Meltem Yontar Aksoy

Bằng tiến sĩ. sinh viên Chương trình Kỹ thuật Công
nghiệp Đại học Kỹ thuật İstanbul
Istanbul, Thổ Nhĩ
Kỳ yontarm@itu.edu.tr
trừu tượng
Dữ liệu lớn là một công nghệ có tính sáng tạo cao, mang lại lợi ích kinh tế và xã hội cho mọi thành phần trong xã hội. Phân tích dữ liệu
lớn mang lại những khoản tiết kiệm đáng kể và những khả năng mới bằng cách chuyển hỗ trợ quyết định của nhiều lĩnh vực kiến thức quan
trọng lên một chiều cao hơn trong nhiều ngành khác nhau như ngân hàng, công ty năng lượng, ngành dược phẩm, dịch vụ y tế, dịch vụ công,
v.v. Còn ít nghiên cứu về ứng dụng dữ liệu lớn trong giáo dục, dữ liệu lớn sẽ cách mạng hóa ngành học tập trong những năm tới. Vì vậy,
nghiên cứu này đề cập đến các ứng dụng dữ liệu lớn trong lĩnh vực giáo dục, đặc biệt là trong việc dự đoán hành vi của học sinh. Bài viết
này nghiên cứu các tài liệu hiện có về việc sử dụng dữ liệu lớn để dự đoán hành vi của sinh viên trong ngành giáo dục. Sau đó đề xuất một
phương pháp cụ thể để xác định những sinh viên có khả năng bỏ học sớm. Bởi vì tỷ lệ tốt nghiệp ngày càng tăng là mục tiêu chiến lược của
bất kỳ cơ sở giáo dục công hay tư nào, người ta tin rằng với đề xuất
mô hình, họ có thể có hành động phù hợp vào đúng thời điểm để giảm tỷ lệ bỏ học và tăng tỷ lệ tốt nghiệp.
Từ khóa
Dữ liệu lớn, phân tích học tập, dự đoán hành vi, dự đoán hiệu suất, giáo dục
1. Giới thiệu
Ngày nay, dữ liệu lớn rất quan trọng đối với cuộc sống của chúng ta và trong cuộc sống hiện đại, nó đang nổi lên như một trong những công
nghệ thiết yếu. Việc sử dụng và áp dụng dữ liệu lớn có giá trị và mang lại hiệu quả về chi phí và năng suất. Do đó, ngày càng có nhiều
công ty tập trung vào dữ liệu lớn. Ngày nay, công nghệ dữ liệu lớn được sử dụng trong nhiều lĩnh vực như; dịch vụ y tế, lĩnh vực bán lẻ,
lĩnh vực y tế, dịch vụ công cộng, giáo dục, dầu khí, công nghiệp ô tô, công nghệ cao, truyền thông, du lịch và vận tải, v.v. Trong tương
lai, người ta cho rằng dữ liệu lớn sẽ cách mạng hóa ngành học tập. Vì lý do đó, nghiên cứu này đề cập đến các ứng dụng dữ liệu lớn trong
giáo dục.
Dữ liệu lớn là một công nghệ mới được thiết kế để mang lại giá trị một cách hiệu quả bằng cách cung cấp khả năng thu thập và phân tích
tốc độ cao từ các cụm dữ liệu có khối lượng lớn, rất đa dạng (Gantz và Reinsel 2011). Theo IBM (2012), "dữ liệu lớn là bất kỳ dữ liệu có
cấu trúc và phi cấu trúc nào như dữ liệu hoạt động, dữ liệu văn bản, dữ liệu cảm biến, âm thanh, video, dữ liệu luồng nhấp chuột, dữ liệu
tệp nhật ký, dữ liệu internet của vạn vật và hơn thế nữa". Dữ liệu lớn chứa các loại dữ liệu có khối lượng lớn, tốc độ cao và có thể mở rộng
từ các nguồn khác nhau. Các ứng dụng dữ liệu lớn phù hợp với dữ liệu có cấu trúc thô (dữ liệu quan hệ), dữ liệu bán cấu trúc (dữ liệu XML)
và dữ liệu phi cấu trúc (Word, PDF, Văn bản, Nhật ký phương tiện).
Sự hình thành dữ liệu lớn có năm thành phần: khối lượng, tốc độ, tính đa dạng, tính xác thực và giá trị. Thuộc tính quan trọng nhất của
dữ liệu lớn là khối lượng biểu thị kích thước của tập dữ liệu lớn. Vận tốc cho biết tốc độ dữ liệu mới được tạo ra và tốc độ chúng di
chuyển xung quanh dữ liệu. Sự đa dạng có nghĩa là dữ liệu thu được được lấy từ nhiều nguồn khác nhau. Việc phân tích dữ liệu lớn bị thay
đổi và không cần thiết có thể dẫn đến lãng phí thời gian nghiêm trọng và đưa ra kết quả sai sót.
Vì lý do này, tính xác thực của dữ liệu là một trong những tiêu chí nhạy cảm nhất. Các định nghĩa về khối lượng, vận tốc, tính đa dạng, tính
xác thực mô tả Dữ liệu lớn. Sau khi tạo và xử lý dữ liệu, các phân tích này phải tạo ra một 'giá trị' để đạt được kết quả hữu ích. Quá trình
biến dữ liệu lớn thành giá trị được hiển thị trong Hình 1. Vì vậy, V của Giá trị được thêm vào 4V còn lại.
Như đã thấy trong Hình 1, đầu vào của quy trình được gọi là "Dữ liệu hóa" của thế giới chúng ta. Đây là những nguồn dữ liệu của dữ liệu
lớn. Các nguồn dữ liệu này có thể được liệt kê dưới dạng hoạt động, bảo tồn, từ ngữ, mạng xã hội, nhật ký trình duyệt, ảnh, video, v.v.
Một số ví dụ về năm loại nguồn dữ liệu được trình bày dưới đây.
Hiệp hội quốc tế IEOM 434

• Hoạt động: Danh mục này bao gồm thông tin theo dõi trang web, nhật ký ứng dụng, dữ liệu cảm biến chẳng hạn như nội dung đăng ký và theo dõi
vị trí khác cũng như dữ liệu do bộ xử lý tạo ra trong xe cộ, trò chơi điện tử, hộp cáp hoặc thiết bị gia dụng.
• Cuộc trò chuyện: Nguồn bảo tồn rộng rãi là e-mail, dòng nhấp chuột trên web, thông tin CRM, nguồn cung cấp
công cụ dây chuyền, vv
• Truyền thông xã hội: Danh mục này bao gồm Twitter, Facebook, LinkedIn, Yahoo, Instagram, Snapchat, Tumblr, Pinterest, Google và các trang web
xã hội hoặc du lịch quan tâm cụ thể để thu thập hồ sơ và thông tin nhân khẩu học của cá nhân.
• Nhật ký trình duyệt: Nhật ký người dùng mang lại sự hiểu biết độc đáo về hành vi người dùng trực tuyến của họ, chẳng hạn như những gì họ đã
làm trên trang web, những thứ họ đã nhấp vào, v.v., trong hành trình của người mua. Phân tích nhật ký người dùng thô cho phép kiểm soát,
độ chính xác và tính minh bạch cao hơn đối với các hoạt động của người dùng ngoài số liệu thống kê được cung cấp bởi các dịch vụ phân
tích trang web tiêu chuẩn như Google Analytics hoặc Omniture.
• Video: Một lượng lớn nội dung được tạo và chia sẻ liên tục trên nhiều mạng và ở định dạng video. YouTube là trang chia sẻ video trực tuyến
hàng đầu với một tỷ người dùng, bốn tỷ video được xem hàng ngày và hơn sáu tỷ giờ video được xem mỗi tháng. Các ví dụ khác là Vimeo và
Daily Motion.
Hình 1. Biến dữ liệu lớn thành giá trị (Tháng 3 năm 2016)
Sau khi xác định nguồn dữ liệu, cần xử lý ba thách thức quan trọng: thu thập, lưu trữ và phân tích dữ liệu. Hiện có một số công nghệ giúp thu thập,
lưu trữ và phân tích dữ liệu lớn, chẳng hạn như MongoDB, Hadoop, MapReduce, Orange. Hadoop là một thư viện mã nguồn mở được sử dụng để xử lý dữ
liệu lớn trên các máy chủ thông thường. Nó cung cấp dung lượng lưu trữ lớn, sức mạnh xử lý rất cao và khả năng quản lý số lượng tác vụ đồng thời
gần như không giới hạn cho tất cả các loại dữ liệu. Nó cho phép quản lý và xử lý hiệu quả dữ liệu lớn trong môi trường điện toán phân tán.
MapReduce là một hệ thống cho phép phân tích dễ dàng dữ liệu rất lớn trên kiến trúc phân tán. MongoDB, theo định nghĩa đơn giản nhất, là một ứng dụng
cơ sở dữ liệu NoSQL mã nguồn mở. Nó là một ứng dụng dựa trên tài liệu và có thể mở rộng. Do tốc độ nhanh và mã nguồn mở, MongoDB, vốn được ưa chuộng
hơn trong các cấu trúc mà cơ sở dữ liệu quan hệ truyền thống không thể theo kịp và còn cồng kềnh, đã trở nên phổ biến trên toàn thế giới. Orange là
một công cụ dựa trên Python để xử lý và khai thác dữ liệu lớn. Nó có giao diện dễ sử dụng với các chức năng kéo và thả và nhiều tiện ích bổ sung.
tiện ích.
Giai đoạn phân tích bao gồm việc áp dụng các kỹ thuật phân tích khác nhau vào dữ liệu để rút ra kết luận có ý nghĩa từ dữ liệu thu được ở các định
dạng khác nhau từ các nguồn khác nhau, hay nói cách khác là tạo ra giá trị. Có nhiều phương pháp phân tích dữ liệu lớn nhưng bài báo được đề cập
được sử dụng phổ biến nhất trên toàn cầu. Nó có thể được liệt kê như khai thác dữ liệu, học máy,
phân tích văn bản, phân tích trong bộ nhớ, phân tích dự đoán, phân tích cảm xúc, nhận dạng khuôn mặt, phân tích giọng nói, phân tích chuyển động, v.v.
Không có một công nghệ nào bao gồm phân tích dữ liệu lớn. Tất nhiên, các kỳ thi nâng cao có thể được áp dụng cho dữ liệu lớn. Tuy nhiên, trên thực
tế, một số loại công nghệ được sử dụng cùng nhau để giúp thu được giá trị cao nhất từ thông tin của bạn.

Học máy: Học máy, một lớp con chính xác của Trí tuệ nhân tạo huấn luyện máy về cách học, giúp tạo ra các mô hình có thể nhanh chóng và
tự động có thể phân tích dữ liệu rộng và phức tạp, mang lại kết quả nhanh hơn và chính xác hơn ngay cả trên quy mô lớn. Bằng cách tạo
ra các mô hình chính xác, tổ chức có thể xác định các cơ hội sinh lời hoặc tránh những rủi ro chưa biết.
Quản lý dữ liệu: Để được phân tích một cách đáng tin cậy, dữ liệu phải có chất lượng cao và được quản lý tốt. Với dữ liệu liên tục
vào và ra khỏi tổ chức, điều cần thiết là tạo ra các quy trình lặp lại để tạo và duy trì các tiêu chuẩn chất lượng dữ liệu. Sau khi
dữ liệu được tin cậy, các tổ chức nên tạo một chương trình quản lý dữ liệu tổng thể để đưa toàn bộ doanh nghiệp vào cùng một trang.
Khai thác dữ liệu: Khai thác dữ liệu hỗ trợ kiểm tra lượng lớn dữ liệu để nhận thấy các mẫu trong đó. Với phần mềm khai thác dữ liệu,
tất cả dữ liệu hỗn loạn và lặp đi lặp lại có thể được xem xét, xác định những gì có liên quan, sử dụng thông tin này để đánh giá các
kết quả có thể xảy ra và sau đó tăng tốc độ đưa ra quyết định sáng suốt.
Phân tích trong bộ nhớ: Bằng cách phân tích dữ liệu trong bộ nhớ hệ thống, hệ thống có thể nhận được thông tin chi tiết tức thì về dữ liệu và
phản hồi nhanh chóng. Công nghệ này giúp loại bỏ sự chậm trễ trong việc chuẩn bị dữ liệu và xử lý phân tích để thử nghiệm các kịch bản mới và xây
dựng mô hình.
Phân tích dự đoán: Công nghệ phân tích dự đoán sử dụng thuật toán thống kê và kỹ thuật học máy để xác định xác suất xảy ra kết quả sắp tới dựa
trên dữ liệu trong quá khứ. Đó là tất cả về việc đưa ra đánh giá tốt nhất về những gì sẽ xảy ra trong tương lai. Do đó, các tổ chức có thể tự
tin hơn rằng họ đưa ra quyết định kinh doanh tốt nhất có thể.
Khai thác văn bản: Khai thác văn bản sử dụng công nghệ xử lý ngôn ngữ tự nhiên và/hoặc máy học để quét tài liệu nhằm phân tích lượng
lớn thông tin và khám phá các chủ đề và mối quan hệ thuật ngữ mới.
Phân tích tình cảm: Phân tích tình cảm là một phương pháp để trích xuất, xác định hoặc mô tả nội dung tình cảm của một đơn vị văn bản
bằng cách sử dụng các phương pháp lập trình ngôn ngữ tư duy, thống kê hoặc học máy. Phân tích tình cảm được áp dụng trong nhiều ứng
dụng truyền thông xã hội, từ tiếp thị đến dịch vụ khách hàng.
Nhận dạng khuôn mặt: Nhận dạng khuôn mặt là một ứng dụng có thể nhận dạng hoặc xác minh một người từ khung hình video, hình ảnh kỹ
thuật số hoặc nguồn video. Nó đã trở nên phổ biến như một công cụ tiếp thị và nhận diện thương mại.
Phân tích giọng nói: Phân tích giọng nói (hoặc phân tích giọng nói) thu thập thông tin khách hàng bằng cách phân tích các cuộc gọi
được ghi lại để tăng cường giao tiếp và tương tác. Nó cho phép các cuộc trò chuyện được ghi lại giữa đại diện khách hàng và khách
hàng trong trung tâm cuộc gọi được chuyển đổi thành thư từ và các phân tích thống kê và cảm xúc có liên quan.
1.1 Mục tiêu Ngày

nay, học sinh là một phần thiết yếu của mọi cấp học trong việc quản lý giáo dục và các trường học có rất nhiều dữ liệu về học sinh
trong cơ sở dữ liệu lớn của họ. Ngày càng có nhiều trường đại học và cao đẳng biết đến những dữ liệu này và đã sử dụng dữ liệu lớn để
cải thiện chất lượng giáo dục. Một trong những cách sử dụng dữ liệu lớn nhất trong ngành giáo dục là theo dõi sự thành công và xác
định học sinh có nguy cơ gặp rủi ro. Tóm lại, dữ liệu rất quan trọng để các tổ chức tạo ra kết quả tốt hơn cho học sinh bằng cách phục
vụ các giáo viên đánh giá cao sự nghiệp.
Nghiên cứu này tập trung vào việc học phân tích trong giáo dục bằng cách sử dụng các kỹ thuật dữ liệu lớn. Phân tích học tập là thủ tục
thu thập, phân tích và báo cáo dữ liệu của sinh viên cũng như bối cảnh của họ để hiểu và tối ưu hóa môi trường họ đang học tập và
trải nghiệm. Xem xét các lợi thế của phân tích học tập và dữ liệu lớn, quy trình giao dịch phải chủ yếu là điện tử thay vì thủ công.
Điều quan trọng là phải thu thập dữ liệu giảng dạy khi chúng chuyển sang các ứng dụng phân tích học tập toàn diện hơn và nhạy cảm hơn
về thời gian. Việc giảng dạy trực tiếp cổ điển có thể hỗ trợ quá trình ra quyết định dựa trên dữ liệu truyền thống. Do đại dịch Covid
-19, giáo dục trực tiếp phần lớn đã rời bỏ vị trí của mình trong giáo dục trực tuyến. Bằng cách này, việc lưu trữ dữ liệu đào tạo đã
trở nên dễ dàng hơn nhiều.
Quan trọng nhất, việc phân tích dữ liệu này và sử dụng nó trong quá trình ra quyết định đã trở nên quan trọng hơn. Giống như dữ liệu
mà một người tạo ra khi mua sắm trên internet, một sinh viên được hệ thống đào tạo trực tuyến vô tình
tạo ra dữ liệu của họ. Ví dụ về dữ liệu này bao gồm các đặc điểm nhân khẩu học của người dùng, chương trình đào tạo họ nhận được,

thời gian họ dành cho việc đào tạo và hoạt động nào họ đã hoàn thành hoặc chưa hoàn thành. Các viện giáo dục đại học đã bắt đầu sử
dụng những phân tích này để cải thiện dịch vụ của họ và tăng khả năng tiếp tục tốt nghiệp của sinh viên.
Kỹ thuật Dữ liệu lớn có thể được sử dụng theo nhiều cách khác nhau trong phân tích học tập như dự đoán hiệu suất của học sinh, ước
tính kỹ năng, phát hiện hành vi, đề xuất khóa học (Manolis et al. 2013). Thành tích của học sinh có thể được ước tính bằng cách
phân tích các đặc điểm nhân khẩu học, dữ liệu thành tích lịch sử, sự tương tác của học sinh với giáo viên và các học sinh khác
trong môi trường học tập. Bằng cách phân tích hành vi của học sinh, có thể nhận thấy nguy cơ học sinh bị tách khỏi lớp học và có
thể áp dụng các biện pháp phòng ngừa ngay từ đầu khóa học để bảo vệ học sinh. Hệ thống học tập có thể cung cấp phản hồi tức thời và
thông minh cho học sinh để đáp lại thông tin đầu vào của họ, điều này sẽ làm tăng sự tương tác và hiệu suất của họ. Các khóa học
mới có thể được đề xuất theo sở thích của họ bằng cách phân tích hoạt động của sinh viên. Khi số lượng dữ liệu giáo dục tăng lên,
các báo cáo về dữ liệu giáo dục ngày càng trở nên phức tạp. Dữ liệu có thể được hiển thị bằng cách sử dụng các kỹ thuật trực quan
hóa dữ liệu để xác định các xu hướng và mối liên hệ chỉ dựa trên các báo cáo trực quan một cách nhanh chóng.
Tỷ lệ tốt nghiệp thấp có tác động xã hội, cá nhân và kinh tế đối với tất cả các bên liên quan trong giáo dục đại học. Tỷ lệ này là
thành phần quan trọng nhất của nguồn tài trợ phụ thuộc vào hiệu suất. Hơn nữa, sinh viên cân nhắc ảnh hưởng của tỷ lệ tốt nghiệp
thấp khi lựa chọn trường đại học. Phân tích dữ liệu lớn có thể giúp tăng tỷ lệ tốt nghiệp ở nhiều khía cạnh khác nhau. Nghiên cứu
này tập trung vào việc dự đoán và đưa ra các biện pháp phòng ngừa học sinh bỏ học nhằm nâng cao tỷ lệ tốt nghiệp.
Mục đích chính của bài viết này là dự đoán thời điểm sinh viên có khả năng bỏ học sớm khi học đại học.
Ngoài ra, nó còn xem xét cách xác định đặc điểm học tập và nhân khẩu học của học sinh bằng cách sử dụng dữ liệu lớn và cách xác định
học sinh có khả năng bỏ học.
2. Phê bình văn học

Trong thế kỷ 21, các công nghệ học tập và giảng dạy mới đã bắt đầu xuất hiện. Học trực tuyến là một trong những ví dụ nổi bật nhất
về điều này. Học trực tuyến là hình thức học đồng thời hoặc không đồng bộ thông qua internet hoặc mạng máy tính, được thực hiện
bằng việc tự học của cá nhân. Sự phổ biến của giáo dục trực tuyến ra thế giới mang đến cơ hội thu thập, phân tích và báo cáo dữ liệu
mới. Học trực tuyến giúp thu thập dữ liệu theo thời gian thực một cách chi tiết từ mỗi học sinh. Điều này có thể được thực hiện để
xác định cách học tốt nhất, xác định những điểm mà học sinh gặp khó khăn và kiểm tra các nguyên tắc dạy và học. Các trường đại học
truyền thống và các cơ sở giáo dục khác cũng đã mở rộng đáng kể cơ hội học tập theo hướng này.
Mặc dù phân tích dữ liệu lớn đã được áp dụng trong nhiều lĩnh vực khác nhau nhưng lĩnh vực giáo dục lại ít được quan tâm. Gần đây
hơn, công việc đã bắt đầu trong Khai thác dữ liệu giáo dục (EDM), một môn học mới tập trung vào việc áp dụng các công cụ và kỹ thuật
khai thác dữ liệu vào thực tiễn giáo dục. Đặc biệt với sự lan rộng của giáo dục trực tuyến, dữ liệu lớn được tạo ra trong giáo dục
ngày càng phát triển. Do đó, hiện nay một số mục đích giáo dục có thể tạo ra kết quả có ý nghĩa từ những dữ liệu được tạo ra này.
Dữ liệu quan trọng thu được đang được triển khai để đạt được các mục tiêu như cải thiện quá trình học tập của học sinh, cung cấp
hệ thống học tập cá nhân hóa cho học sinh, tạo hệ thống quản lý khóa học và đưa ra dự đoán cho tương lai. Để đạt được những mục
tiêu này, việc khai thác dữ liệu giáo dục
Các nhà nghiên cứu sử dụng các phương pháp kỹ thuật như phân loại, hồi quy, ước lượng mật độ và phân cụm cũng đã được áp dụng
để phân tích trong lĩnh vực học thuật. Bằng cách sử dụng những kỹ thuật này, các nhà nghiên cứu khai thác dữ liệu giáo dục đang phát
triển nhiều mô hình khác nhau để tiến hành nghiên cứu của họ.
Kỹ thuật quan trọng nhất là phân tích dự đoán, một chủ đề phân tích dữ liệu cố gắng dự đoán dữ liệu trong tương lai hoặc dữ liệu
chưa biết bằng cách sử dụng kiến thức hiện có với các kỹ thuật lập mô hình, học máy, thống kê và khai thác dữ liệu. Các mô hình dự
đoán đã được áp dụng thành công vào lĩnh vực dữ liệu lớn giáo dục để dự đoán những học sinh chưa biết trước đó
thành tích học tập, làm mẫu cho sự thất bại và bỏ học của học sinh, cũng như các hành vi khác của học sinh liên quan đến giáo dục.
Dự đoán mô hình kết quả học tập của học sinh thuộc hai loại: mô hình dự đoán dựa trên tính năng và mô hình dự đoán tổng quát. Xác
định các yếu tố quan trọng như điểm số trước đây, hành vi của học sinh và các yếu tố tâm lý của học sinh là rất quan trọng để dự
đoán kết quả học tập của học sinh. Mô hình dự đoán dựa trên tính năng chủ yếu tập trung vào việc lựa chọn tính năng và lựa chọn mô
hình. Xác định các tính năng quan trọng là rất quan trọng đối với các mô hình dự đoán. Ngoài ra, việc lựa chọn phù hợp
mô hình có thể đạt được hiệu suất dự đoán tốt. Các mô hình dự đoán dựa trên tính năng được sử dụng các phương pháp học có giám
sát, chẳng hạn như hồi quy tuyến tính, hàng xóm gần nhất (KNN), máy vectơ hỗ trợ (SVM), phân tích phân biệt tuyến tính, rừng ngẫu
nhiên, XGBoost, v.v. Ngược lại, các mô hình tổng quát khó thực hiện get nhưng cung cấp khả năng diễn giải tốt hơn.

Các mô hình dự đoán tổng quát thường sử dụng các mạng Naive Bayesian, Bayesian, Markov, v.v. Bài viết này tập trung vào mô
hình dự đoán hướng đặc trưng.
Các phương pháp khai thác dữ liệu cổ điển như phân loại, hồi quy, phân tích phân cụm, một trong những kỹ thuật thống kê đa
biến được sử dụng để phân loại dữ liệu chưa biết và chưa được nhóm theo mức độ giống nhau của chúng. Ngoài ra, phân tích
mạng xã hội còn sử dụng lý thuyết đồ thị để hiểu, phát triển và tiến hành phân tích định lượng và định tính các mối quan hệ
trong mạng xã hội. Tài liệu hiện có về việc sử dụng dữ liệu lớn để dự đoán hành vi của sinh viên trong ngành giáo dục được tóm
tắt trong Bảng 1. Như đã thấy trong Bảng 1, các nghiên cứu trong tài liệu được xem xét và tóm tắt
theo điểm cụ thể của nghiên cứu, kỹ thuật, các tính năng được lựa chọn và bộ dữ liệu được sử dụng trong nghiên cứu.

Bảng 1. Tổng quan tài liệu
(Các) tác giả Điểm cụ thể của nghiên cứu Kỹ thuật Tính năng sử dụng Tập dữ liệu
Iatrellis và cộng Dự đoán kết quả của học sinh K-means, GPA thuật toán rừng ngẫu nhiên, lĩnh vực chuyên môn, điểm dự án capstone, thời gian hoàn thành 1100 hồ sơ trong sáu năm học, từ 2007 đến
sự. (2020) chu trình cơ bản, thành tích năm đầu tiên trong các môn học 2012
chính, trung học, xếp hạng trong lớp, chương trình di

chuyển học sinh, thực tập, giải thưởng, điểm ở trường
trung học , điểm thi tuyển sinh
Xu và cộng Dự đoán việc học tập của học sinh Cây quyết định, máy vectơ hỗ trợ, Điểm cuối cùng của các khóa học bắt buộc của sinh viên đại 20 triệu hồ sơ từ 4000 học sinh mẫu
sự. (2019) hiệu suất liên quan đến hành vi mạng lưới thần kinh nhân tạo học, thời gian trực tuyến, thời gian ngoại tuyến, lượng tải
sử dụng internet xuống Internet, lượng tải lên Internet, loại thiết bị đầu cuối
Zhang và cộng Dự đoán kết quả học tập của học sinh Đa nhiệm thường xuyên Tập hành vi, bao gồm bữa sáng, bữa trưa, bữa tối, mua Thành tích của sinh viên trong 12 khóa học từ một
sự. (2018) dựa trên hành vi của học sinh sắm, tập thể dục, trị liệu, mua tài liệu, vào thư trường đại học châu Á
mẫu viện, phục vụ thẻ, xe buýt trường học, vào ký túc xá

Ge và cộng Cảnh báo hành vi của học sinh Hadoop, phân tích thành phần chính Giới tính, chuyên ngành, lớp, ký túc xá, tuổi, nơi ở, sở Hơn 10000 sinh viên
sự. (2018) thích, thông tin điểm danh lớp học, tình hình học trực
tuyến, thư viện, tỷ lệ về nhà ở ký túc xá, hệ thống bảo

vệ lối vào, mã trường
Ashraf và cộng Dự đoán thành tích học Cây quyết định, cây quyết định thay Tuổi, giới tính, khu vực, nơi cư trú, thông tin người giám Bộ dữ liệu khác nhau
sự. (2018) sinh thế, thuật toán perceptron nhiều hộ, chứng chỉ đã được cấp, học bổng và kết quả, điểm số,
lớp, hồi quy logic, máy vectơ hỗ chi tiết mạng xã hội, hoạt động ngoại khóa và các
trợ, k-hàng xóm gần nhất và Cơ sở ngây yếu tố tâm lý

thơ
Shingari và Dự đoán thành tích học Cây quyết định (ID3, C4.5), Điểm học sinh, phương tiện giảng dạy, quê hương, nơi ở, tình trạng NA
cộng sự. (2017) sinh Mạng nơ ron nhân tạo thu nhập gia đình, trình độ chuyên môn của cha, trình độ
chuyên môn của mẹ, đọc báo, đọc tiểu thuyết, sử dụng internet để
học tập, thức dậy sớm vào buổi sáng, tập thể dục hàng ngày, phương
thức đi lại
Uddin và Dự đoán tỷ lệ bỏ học, khả năng Xác suất ngẫu nhiên Điểm trung bình, lớp trước, ngôn ngữ, tuổi, trình độ trước Dữ liệu học thuật từ 17 trường đại học
Lý (2017) duy trì thấp, kết quả học đây, lĩnh vực bằng cấp trước đây, IQ, nhà ở trước đây, trên khắp thế giới trong hồ sơ 8–10 năm của sinh
tập kém, thiếu động lực và nhà ở tương lai, quy mô gia đình, tình trạng tài viên đại học và sau đại học;
thay đổi chuyên ngành học và tái chính, học bổng, tình trạng toàn thời gian, thay đổi chuyên Một cuộc khảo sát trực tuyến đã được thiết kế và sử
tuyển sinh không cần thiết ngành, kỹ năng đọc, kỹ năng viết, kỹ năng nói, sinh viên trở dụng để thu thập dữ liệu từ sinh viên; API Twitter và
lại, bỏ học, tình trạng hôn nhân, thành viên Facebook, API Facebook
thành viên twitter, số lượng bạn bè trên Facebook, số lượng

Bài đăng trên Facebook hàng ngày, số lượng tweet
hàng ngày, tính nhất quán, tính thân thiện, hoạt động
viết, hoạt động thích, tweet lại, các loại tweet, người viết blog
Xu và cộng Dự đoán của sinh viên Học tập theo nhóm, Vector hỗ trợ GPA, điểm SAT, điểm trung bình và tổng số tín chỉ 367 sinh viên ẩn danh tại UCLA
sự. (2017) hiệu suất Máy (SVM) Kỹ thuật cơ khí và hàng không vũ trụ
Phòng

(Các) tác giả Điểm cụ thể của nghiên cứu Kỹ thuật Tính năng sử dụng Tập dữ liệu
Jose và cộng Phân tích mối liên hệ giữa Phân tích tương quan, hồi quy Điểm lịch sử, tuổi 1037 sinh viên đại học tại Trung Đông
sự. (2016) độ tuổi và kết quả học tập, Phân tích Bộ dữ liệu đại học
dự đoán kết quả học tập
của học sinh
Chàng Cảnh báo hành vi trong Thống kê mô tả Khảo sát các giảng viên Tâm lý bất thường Dữ liệu được thu thập thông qua khảo sát
trai (2016) Tâm lý bất thường Giảng viên Tâm lý bất thường của 131 học viên
Sweeney và Dự đoán điểm học sinh học Máy nhân tố hóa Lớp lịch sử Dữ liệu điểm lịch sử của các học kỳ mùa hè, mùa
cộng sự. (2015) kỳ tới thu và mùa xuân của một trường đại học công lập (George
Đại học Mason) từ năm 2009 đến năm 2014
Meier và cộng sự. Dự đoán điểm Thuật toán dự đoán điểm Bài tập về nhà, bài kiểm tra hoặc bài kiểm tra giữa kỳ Điểm của khoảng 700 học sinh
(2015)
Iam-On và Phát hiện sớm học sinh có nguy Phân cụm tập hợp Giới tính, tỉnh, khoa, tổng điểm và điểm trung bình 811 sinh viên tại Đại học Mae Fah Luang,
Boongoen cơ bỏ học của 4 nhóm môn học Chiang Rai, Thái Lan
(2015)
Tamhane và Dự đoán nguy cơ học sinh kém Cây quyết định, bảng quyết Điểm số, giới tính, dân tộc, bữa ăn miễn phí, giáo dục năng NA
cộng sự. (2014) định, hồi quy logistic khiếu và đặc biệt, số ngày vắng mặt, số lần đình
chỉ và số lần vi phạm kỷ luật
Sobecki Đề xuất khóa học Tối ưu hóa đàn kiến, tối ưu hóa Học kỳ, chuyên ngành nghiên cứu, loại hình nghiên 33000 sinh viên tại Đại học Wroclaw
(2014) đàn hạt, tối ưu hóa cỏ dại thông cứu, cấp tuyển dụng và mã số tuyển dụng, mã số sinh Công nghệ
minh, tối ưu hóa đàn ong và thuật viên, mã số khóa học và cấp độ khóa học
toán dơi
Baker (2010) Nghiên cứu trạng thái tâm lý trong quá ANOVA Trạng thái tâm lý (tỷ lệ mắc, sự kiên trì và tác động của Có nhiều bộ dữ liệu khác nhau từ ba môi
trình sử dụng ba môi trường học sự buồn chán, thất vọng, bối rối, tập trung, trường học tập dựa trên máy tính khác
tập trên máy tính khác nhau vui thích và trạng thái cảm xúc bất ngờ) nhau: 1. AutoTutor: 28 sinh viên
đại học từ một trường đại học ở miền trung nam

Hoa Kỳ, 2. The Incredible Machine: 36 sinh
viên tại một trường trung học tư thục ở
Thành phố Quezon, 3 .
Aplusix: 140 học sinh trung học từ bốn trường

ở Metro Manila và một trường ở Cavite
O'Connor và Ảnh hưởng của hệ thống Phân tích tương quan, hồi quy Giới tính, tuổi tác, khả năng đáp ứng phần thưởng, lái xe, tìm kiếm 533 sinh viên đại học đang theo học tại một trường
cộng sự. (2009) tiếp cận hành vi và hệ Phân tích niềm vui, sử dụng rượu, sử dụng thuốc lá, cờ bạc Đại học Đông Canada
thống ức chế hành vi đối với việc
uống rượu, hút thuốc và
hành vi cờ bạc
Vialardi và cộng Đề xuất khóa học Cây phân loại (C4.5) Các khóa học đã đăng ký, tên khóa học, tích lũy 58871 hồ sơ học sinh tại Trường
sự. (2009) Điểm trung bình, lớp Kỹ thuật hệ thống tại Đại học de
Lima

1. Phương pháp luận

Nhờ sự gia tăng của môi trường học tập trực tuyến trong những năm gần đây, việc thu thập và phân tích dữ liệu theo thời gian thực một cách chi tiết cho
mỗi học sinh dễ quản lý hơn nhiều. Hầu như mọi trường đại học đều có hệ thống tự động hóa và cơ sở dữ liệu của hệ thống này. Cơ
sở dữ liệu này chứa dữ liệu về đặc điểm học tập và nhân khẩu học của sinh viên. Các trường đại học cũng cung cấp cho sinh viên
các ứng dụng web (dịch vụ chương trình trực tuyến), như môi trường học tập điện tử. Có thể tìm thấy mối quan hệ giữa xu hướng
bỏ học và biến đặc tính được thu thập từ hệ thống tự động hóa và các dịch vụ chương trình trực tuyến.
Bài viết đề xuất chiến lược xây dựng mô hình tham khảo về học sinh bỏ học và không bỏ học để giải quyết vấn đề này. Các mô hình
tham khảo thu thập các mẫu khác nhau được sử dụng để dự đoán liệu một học sinh có bỏ học trong kỳ học hay không.
Học thuật. Với cơ cấu đề xuất này, giáo viên có thể nhận biết những học sinh có nguy cơ bỏ học và có biện pháp ngăn chặn tình
trạng này. Kiến trúc tổng thể của hệ thống dự đoán loại bỏ hoặc không loại bỏ được thể hiện trong Hình 2.
Hình 2. Kiến trúc tổng thể của hệ thống dự đoán drop-out/không drop-out
Như được thấy trong Hình 2, hệ thống được đề xuất bao gồm ba cơ sở dữ liệu khác nhau: cơ sở dữ liệu hệ thống tự động hóa, cơ sở
dữ liệu hệ thống học tập điện tử và cơ sở dữ liệu mô hình. Cơ sở dữ liệu tự động hóa bao gồm dữ liệu nhân khẩu học và học thuật
của những năm trước. Trong nghiên cứu này, độ tuổi, giới tính (Nữ, nam), tình trạng hôn nhân (đã kết hôn, độc thân, ly hôn) và
người phụ thuộc của sinh viên (sinh viên có phải chăm sóc ai không? Có, không) được chọn làm đặc điểm nhân khẩu học. Điểm trung
bình của học sinh được chọn là đặc điểm của kết quả học tập. Từ cơ sở dữ liệu của hệ thống e-learning, số lượng lớp học ảo được
học sinh truy cập trong một khoảng thời gian cụ thể, số ngày khác nhau trong tuần mà học sinh truy cập vào hệ thống, tần suất xem
tài liệu khóa học và tần suất phản hồi phản hồi của giáo viên được trích xuất dưới dạng dữ liệu tương tác trên web. Hệ thống
học tập trực tuyến lưu trữ hồ sơ về từng hành động được học sinh thực hiện. Có thể xảy ra
các hành động trên hệ thống học tập được thể hiện trong Bảng 2. Có thể hiểu rằng mô hình đề xuất tập trung vào việc trực quan hóa
và bổ sung các hành động. Dữ liệu hoạt động này phải được xử lý trước bằng một mô-đun chuyên biệt gọi là xử lý trước dữ liệu.

Bảng 2. Hành động được ghi lại trong hệ thống e-learning
Các hành động được ghi lại trong hệ thống e-Learning
Hoạt động Sự miêu tả
Hình dung Sinh viên mở và xem tài nguyên
Thêm vào
Sinh viên thêm một mục mới vào tài nguyên
Cập nhật Học sinh thay đổi mục nhập đã thêm trước đó
Xóa bỏ Học sinh xóa mục đã thêm trước đó
Dữ liệu nhân khẩu học và học thuật cũng như dữ liệu học tập điện tử được xử lý trước được sử dụng để tạo các mô hình tham chiếu.
Dữ liệu mô hình tham chiếu được lưu trữ trong cơ sở dữ liệu có mục đích đặc biệt gọi là cơ sở dữ liệu Mô hình. Ngoài ra, còn có một công cụ so
sánh có thể đo khoảng cách của một học sinh với từng mô hình tham chiếu bỏ học và không bỏ học được tạo ra trước đó. Một học sinh có thể được
phân loại vào các nhóm gần nhất có liên quan đến khoảng cách này. Học sinh hiện tại được so sánh với các mô hình tham chiếu này và đo lường mức
độ gần gũi với hai cụm. Giá trị gần gũi của học sinh hiện tại với cụm này có thể là một cảnh báo cho giáo viên. Hệ thống theo dõi này có thể cảnh
báo giáo viên bằng cách phân loại học sinh theo tương tác trên web, các biến số về nhân khẩu học và kết quả học tập của họ.
Một ví dụ về trạng thái cuối cùng của dữ liệu tương tác web được xử lý trước được trình bày trong Hình 3. Hình 3 cũng hiển thị các đặc điểm
được chọn về đặc điểm nhân khẩu học và hiệu suất của học sinh. Mục đích là phân loại học sinh theo những đặc điểm này thành hai loại: bỏ học và
không bỏ học.
Hình 3. Ví dụ về dữ liệu cho mô hình tham chiếu
2. Kết luận và nghiên cứu trong tương lai
Dữ liệu lớn là một công nghệ có tính sáng tạo cao, mang lại lợi ích kinh tế và xã hội cho mọi thành phần trong xã hội. Phân tích dữ liệu lớn mang
lại những khoản tiết kiệm đáng kể và những khả năng mới bằng cách chuyển hỗ trợ quyết định của nhiều lĩnh vực kiến thức quan trọng lên một chiều
cao hơn trong nhiều ngành công nghiệp khác nhau như ngân hàng, công ty năng lượng, dược phẩm

công nghiệp, dịch vụ y tế, dịch vụ công cộng, v.v. Mặc dù có rất ít nghiên cứu về ứng dụng dữ liệu lớn trong giáo dục nhưng dữ liệu lớn sẽ
cách mạng hóa ngành học tập trong những năm tới.
Tỷ lệ tốt nghiệp thấp có tác động xã hội, cá nhân và kinh tế đối với tất cả các bên liên quan trong giáo dục đại học. Tỷ lệ này là thành
phần quan trọng nhất của nguồn tài trợ phụ thuộc vào hiệu suất. Hơn nữa, sinh viên cân nhắc ảnh hưởng của tỷ lệ tốt nghiệp thấp khi lựa
chọn trường đại học. Phân tích dữ liệu lớn có thể giúp tăng tỷ lệ tốt nghiệp ở nhiều khía cạnh khác nhau. Để giải quyết vấn đề tỷ lệ tốt
nghiệp thấp, nghiên cứu này đề xuất một mô hình để dự đoán những sinh viên nào có khả năng bỏ học sớm khi học đại học. Nó tập trung vào việc
dự đoán và đề phòng học sinh bỏ học để tăng tỷ lệ tốt nghiệp.
Bài viết này nghiên cứu các tài liệu hiện có về việc sử dụng dữ liệu lớn để dự đoán hành vi của sinh viên trong ngành giáo dục. Nó đề xuất
một phương pháp cụ thể để xác định những sinh viên có khả năng bỏ học sớm bằng cách sử dụng dữ liệu lớn. Dự kiến sẽ đánh giá mô hình đề
xuất với dữ liệu thực tế từ các trường đại học khác nhau trong các nghiên cứu trong tương lai. Ngoài ra, các nghiên cứu trong tương lai có
thể tập trung vào các đặc điểm nhân khẩu học, học thuật và hành động khác nhau có thể ảnh hưởng đến độ chính xác của dự đoán. Ngoài ra,
ngoài hai lớp được cố gắng dự đoán, các tình huống hoặc hành vi khác nhau của học sinh có thể được dự đoán bằng mô hình được trình bày.
Người giới thiệu
Ashraf, A., Anwer, S., Khan, MG, Một nghiên cứu so sánh về dự đoán hiệu suất của học sinh bằng cách sử dụng các kỹ thuật khai thác dữ liệu,
Tạp chí Nghiên cứu Khoa học Hàn lâm Hoa Kỳ về Kỹ thuật, Công nghệ và Khoa học, Tập. 44 không. 1, 122–136, 2018.
Baker, RSJ, D'Mello, SK, Rodrigo, MMT và Graesser, AC, Thà chán nản còn hơn chán nản: tỷ lệ mắc, sự kiên trì và tác động của trạng thái cảm
xúc nhận thức của người học trong quá trình tương tác với ba môi trường học tập dựa trên máy tính khác nhau, Tạp chí Quốc tế về Nghiên
cứu Con người-Máy tính, tập. 68, không. 4, trang 223–241, 2010.
Boysen, GA, Wells, AM, và Dawson, KJ, Việc sử dụng cảnh báo kích hoạt và cảnh báo hành vi của người hướng dẫn trong tâm lý bất thường,
Giảng dạy Tâm lý học, tập. 43, không. 4, trang 267–275, 2016.
Gantz, J. và Reinsel, D., Trích xuất giá trị từ sự hỗn loạn, Đánh giá của IDC, tập. 1142, trang 9-10, 2011.
Ge, S., Bai, C., Wan, Q., Hệ thống quyết định cảnh báo hành vi của sinh viên đại học dựa trên Hadoop, Hội nghị quốc tế IEEE về phân tích dữ
liệu lớn, trang 217–221, 2018.
IBM, dữ liệu lớn là gì? Có sẵn: http://www.01.ibm.com/software/data/bigdata, 2012.
Iam-On, N., Boongoen, T., Cải thiện khả năng dự đoán tỷ lệ sinh viên bỏ học ở trường đại học Thái Lan bằng cách sử dụng tập hợp các cụm dữ
liệu kiểu hỗn hợp, Tạp chí Quốc tế về Học máy và Điều khiển học, tập. 8, không. 2, trang 1–14, 2015.
Iatrellis, O., Savvas, I. Κ., Fitsilis, P., và Gerogiannis, VC, Phương pháp học máy hai pha để dự đoán
kết quả của học sinh. Giáo dục và Công nghệ thông tin, 2020.
Jose, M., Kurian, P., và Biju, V., Phân tích sự tiến bộ của sinh viên trong một cơ sở giáo dục đại học sử dụng Công cụ mô hình dự đoán nguồn
mở dữ liệu lớn, Hội nghị quốc tế MEC lần thứ 3 của IEEE về Dữ liệu lớn và Thành phố thông minh, 2016.
Manolis M., Patricia C., và Demetra K., Tiềm năng của Phân tích học tập và Dữ liệu lớn, Có sẵn: http://www.ariadne.ac.uk/issue71/charlton-et-
al, 2013.
Marr, B., Dữ liệu lớn trong thực tế, Vương quốc Anh: Wiley, 2016.
Meier, Y., Xu, J., Atan, O. và Schaar, MVD, Dự đoán cấp độ cá nhân hóa: phương pháp khai thác dữ liệu, IEEE
Hội nghị quốc tế về khai thác dữ liệu, trang 907–912, 2016.
O'Connor, RM, Stewart, SH và Watt MC, Phân biệt rủi ro cơ bản đối với hành vi uống rượu, hút thuốc và đánh bạc của sinh viên đại học, Sự
khác biệt về tính cách và cá nhân, tập. 46, không. 4, trang 514–519, 2019.
Shingari, I., Kumar, D., Khetan, M., Đánh giá các ứng dụng kỹ thuật khai thác dữ liệu để dự đoán kết quả học tập của sinh viên trong giáo dục đại
học, Tạp chí Hệ thống Thống kê và Quản lý, tập. 20, không. 4, trang 713–722, 2018.
Sobecki J., So sánh các thuật toán thông minh bầy đàn được chọn trong ứng dụng đề xuất khóa học dành cho sinh viên, Tạp chí quốc tế về Kỹ
thuật phần mềm và Kỹ thuật tri thức, tập. 24, số 1, trang 91-109, 2014.
Sweeney, M., Lester, J., Rangwala, H., Dự đoán điểm học sinh trong học kỳ tới, Hội nghị quốc tế IEEE về Dữ liệu lớn, trang 970–975, 2015.
Tamhane, A., İkbal, S., Sengupta, B., Duggirala, M., và Appleton, J., Dự đoán rủi ro của sinh viên thông qua phân tích theo chiều dọc, Hội
nghị quốc tế ACM SIGKDD về khám phá kiến thức và khai thác dữ liệu, trang 1544–1552, 2014.
Uddin, MF và Lee, J., Đề xuất mô hình toán học dựa trên xác suất ngẫu nhiên và các thuật toán sử dụng mạng xã hội và dữ liệu học thuật để dự
đoán phù hợp cho sinh viên, Phân tích và khai thác mạng xã hội, tập. 7, không. 1, trang 29, 2017.

Vialardi, J. Braver, J., Shaftr, L. và Ortiaosa, A., Khuyến nghị trong giáo dục đại học sử dụng kỹ thuật khai thác dữ liệu.
Hội nghị quốc tế lần thứ 2 về khai thác dữ liệu giáo dục, trang 190-199, 2009.
Xu, J., Han, Y., Marcu, D. và Schaar, M., Dự đoán tiến bộ về thành tích của sinh viên trong các chương trình đại học, The
Hội nghị trí tuệ nhân tạo AAAI lần thứ 31. AAAI, trang 1604–1610, 2017.
Xu, X., Wang, J., Peng, H., & Wu, R, Dự đoán kết quả học tập liên quan đến hành vi sử dụng Internet bằng thuật toán học
máy, Máy tính trong hành vi con người, 2019.
Zhang, X., Sun, G., Pan, Y., Sun, H., He, Y., và Tan, J., Làm mẫu hiệu suất của học sinh dựa trên mô hình hành vi,
Tạp chí Trí tuệ xung quanh và Máy tính nhân bản, tập. 3, không. 3, trang 1–12, 2018.
Tiểu sử
Meltem Yontar Aksoy, ThS, Tiến sĩ. Ứng viên là tiến sĩ. sinh viên Chương trình Kỹ thuật Công nghiệp tại Đại học Kỹ thuật Istanbul. Cô nhận
bằng thạc sĩ Kỹ thuật Công nghiệp tại Đại học Kỹ thuật Istanbul vào năm 2017. Cô lấy bằng cử nhân Kỹ thuật Công nghiệp tại Đại học Gaziantep
vào năm 2012. Song song với cuộc sống học tập, cô còn làm chuyên gia kiểm toán dự án trong Đơn vị Hỗ trợ của Cơ quan Phát triển Istanbul. kể
từ tháng 10 năm 2013.

Big Data Trong Giao Duc

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Big Data Trong Giao Duc

Uploaded by

Copyright:

Available Formats

Machine Translated by Google

Meltem Yontar Aksoy

Hiệp hội quốc tế IEOM 434

công cụ dây chuyền, vv

Hiệp hội quốc tế IEOM 435

1.1 Mục tiêu Ngày

Hiệp hội quốc tế IEOM 436

2. Phê bình văn học

Hiệp hội quốc tế IEOM 437

Hiệp hội quốc tế IEOM 438

Bảng 1. Tổng quan tài liệu

chính, trung học, xếp hạng trong lớp, chương trình di

mẫu viện, phục vụ thẻ, xe buýt trường học, vào ký túc xá

tuyến, thư viện, tỷ lệ về nhà ở ký túc xá, hệ thống bảo

trợ, k-hàng xóm gần nhất và Cơ sở ngây yếu tố tâm lý

thành viên twitter, số lượng bạn bè trên Facebook, số lượng

Hiệp hội quốc tế IEOM 439

Đại học Mason) từ năm 2009 đến năm 2014

đại học từ một trường đại học ở miền trung nam

Thành phố Quezon, 3 .

Aplusix: 140 học sinh trung học từ bốn trường

uống rượu, hút thuốc và

Hiệp hội quốc tế IEOM 440

1. Phương pháp luận

Hiệp hội quốc tế IEOM 441

Bảng 2. Hành động được ghi lại trong hệ thống e-learning

Các hành động được ghi lại trong hệ thống e-Learning

Hoạt động Sự miêu tả

Hình dung Sinh viên mở và xem tài nguyên

Xóa bỏ Học sinh xóa mục đã thêm trước đó

Hình 3. Ví dụ về dữ liệu cho mô hình tham chiếu

2. Kết luận và nghiên cứu trong tương lai

Hiệp hội quốc tế IEOM 442

dự đoán và đề phòng học sinh bỏ học để tăng tỷ lệ tốt nghiệp.

Người giới thiệu

liệu lớn, trang 217–221, 2018.

IBM, dữ liệu lớn là gì? Có sẵn: http://www.01.ibm.com/software/data/bigdata, 2012.

Hội nghị quốc tế về khai thác dữ liệu, trang 907–912, 2016.

Hiệp hội quốc tế IEOM 443

từ tháng 10 năm 2013.

Hiệp hội quốc tế IEOM 444

You might also like