Professional Documents
Culture Documents
dịch
dịch
Các yếu tố ảnh hưởng đến thành tích của học sinh trong giáo dục đại học:
Tóm tắt Dự
đoán thành tích của học sinh đã trở thành một nhiệm vụ đầy thách thức do lượng dữ liệu ngày càng
tăng trong các hệ thống giáo dục. Để phù hợp với điều này, việc xác định các yếu tố ảnh hưởng đến
thành tích của sinh viên trong giáo dục đại học, đặc biệt là bằng cách sử dụng các kỹ thuật khai
thác dữ liệu dự đoán, vẫn còn thiếu. Lĩnh vực nghiên cứu này thường được xác định là khai thác dữ
liệu giáo dục. Do đó, mục đích chính của nghiên cứu này là xác định các yếu tố được nghiên cứu phổ
biến nhất ảnh hưởng đến kết quả học tập của sinh viên, cũng như các kỹ thuật khai thác dữ liệu phổ
biến nhất được áp dụng để xác định các yếu tố này. Trong nghiên cứu này, 36 bài nghiên cứu trong
tổng số 420 bài từ năm 2009 đến 2018 đã được xem xét và phân tích nghiêm túc bằng cách áp dụng phương
pháp tổng quan tài liệu có hệ thống. Kết quả cho thấy các yếu tố phổ biến nhất được nhóm thành bốn
loại chính, cụ thể là điểm số trước đó của học sinh và thành tích học tập trong lớp, hoạt động Học
trực tuyến của học sinh, nhân khẩu học của học sinh và thông tin xã hội của học sinh. Ngoài ra, kết
quả cũng chỉ ra rằng các kỹ thuật khai thác dữ liệu phổ biến nhất được sử dụng để dự đoán và phân
loại các yếu tố của sinh viên là cây quyết định, bộ phân loại Naïve Bayes và mạng lưới thần kinh
nhân tạo.
Keywords Khai phá dữ liệu giáo dục · Hoạt động của học sinh · Kỹ thuật khai phá dữ liệu ·
1. Giới thiệu
Trong thập kỷ qua, mối quan tâm ngày càng tăng đối với việc xác định các yếu tố quan trọng nhất ảnh
hưởng đến thành tích của sinh viên trong giáo dục đại học, đặc biệt là bằng cách sử dụng các phương
pháp và kỹ thuật khai thác dữ liệu. Lĩnh vực nghiên cứu này thường được xác định là dữ liệu giáo dục
* Mostafa Al-Emran
al.emran@tdtu.edu.vn
Khaled Shaalan
khaled.shaalan@buid.ac.ae
1
Khoa Kỹ thuật và CNTT, Đại học Anh tại Dubai, Dubai, UAE
2
Nhóm Nghiên cứu Kỹ thuật Kết cấu và Dân dụng Tính toán Ứng dụng, Khoa Xây dựng
Kỹ thuật, Đại học Tôn Đức Thắng, Thành phố Hồ Chí Minh, Việt Nam
1 3
Tập:(0123456789)
Machine Translated by Google
khai thác mỏ (EDM) (Bakhshinategh et al. 2018). Động lực đằng sau mối quan tâm này là do khả
năng ứng dụng của nghiên cứu như vậy trong việc giúp xác định sớm những sinh viên có thành
tích kém để vượt qua những khó khăn trong học tập và cải thiện kết quả học tập của họ, từ đó
phục vụ các mục tiêu của tổ chức là cung cấp hệ sinh thái giáo dục chất lượng cao. các hệ
thống. Ngoài ra, EDM đang nhanh chóng trở thành một lĩnh vực nghiên cứu quan trọng nhờ khả
năng trích xuất kiến thức mới từ một lượng lớn dữ liệu của sinh viên (Wook et al. 2017). Bài
báo này cũng quan tâm đến chủ đề này và mục tiêu của chúng tôi là khám phá và xem xét các bài
báo từ thập kỷ trước trong bối cảnh khai thác dữ liệu giáo dục và xác định các yếu tố chính
ảnh hưởng đến kết quả học tập của sinh viên trong giáo dục đại học. EDM được trang web cộng
đồng Khai thác dữ liệu giáo dục (www.educationaldatamining.org) định nghĩa là “một nguyên tắc
mới nổi, liên quan đến việc phát triển các phương pháp khám phá dữ liệu quy mô lớn và độc đáo
đến từ các cơ sở giáo dục và sử dụng các phương pháp đó để hiểu rõ hơn về học sinh và các cài
đặt mà chúng tìm hiểu trong”. Nói chung, EDM là một tập hợp các phương pháp áp dụng các kỹ
thuật khai thác dữ liệu như phân cụm, phân loại, dự đoán giữa các phương pháp khác cho dữ liệu
được truy xuất bởi nhiều hệ thống giáo dục (Berland et al. 2014).
Các nhà nghiên cứu trong lĩnh vực này có xu hướng nghiên cứu các loại yếu tố và thuộc tính
khác nhau của học sinh ảnh hưởng đến hiệu suất và kết quả học tập của học sinh (Abu Saa và
cộng sự 2019). Shahiri và cộng sự. (2015) đã tiến hành đánh giá tài liệu có hệ thống về dự
đoán hiệu suất của học sinh bằng cách sử dụng các kỹ thuật khai thác dữ liệu. Đánh giá đã giải
quyết nhiều chủ đề, một trong số đó là xác định các thuộc tính quan trọng được sử dụng để dự
đoán hiệu suất của học sinh. Kết quả cho thấy điểm trung bình tích lũy và đánh giá nội bộ là
những thuộc tính thường xuyên nhất được sử dụng để dự đoán kết quả học tập của học sinh. Hơn
nữa, các thuộc tính quan trọng khác cũng được xác định, bao gồm các đánh giá nhân khẩu học và
bên ngoài của học sinh, các hoạt động ngoại khóa, nền tảng trường trung học và mạng lưới tương
tác xã hội. Ngoài ra, kết quả cho thấy rằng Cây quyết định và Mạng thần kinh là những kỹ thuật
khai thác dữ liệu được sử dụng thường xuyên nhất để dự đoán hiệu suất của học sinh. Bên cạnh
đó, Peña Ayala (2014) đã tiến hành khảo sát và phân tích tổng hợp các nghiên cứu liên quan đến EDM.
Kết quả chỉ ra rằng 60% các bài báo nghiên cứu về EDM đã sử dụng các phương pháp khai thác dữ
liệu dự đoán so với 40% đã sử dụng các phương pháp mô tả. Hơn nữa, kết quả cũng chỉ ra rằng
phân loại và phân cụm là những kỹ thuật điển hình nhất được sử dụng bởi nghiên cứu EDM. Ngoài
ra, định lý Bayes, cây quyết định, học tập dựa trên cá thể (IBL) và mô hình Markov ẩn (HMM)
được phát hiện là những phương pháp phổ biến nhất được nghiên cứu EDM sử dụng. Hơn nữa, Romero
và Ventura (2007) đã thực hiện một nghiên cứu đánh giá nhằm phân tích ứng dụng khai thác dữ
liệu cho các hệ thống giáo dục khác nhau: hệ thống truyền thống, các khóa học dựa trên web,
hệ thống quản lý nội dung và hệ thống dựa trên web thông minh. Các kết quả gợi ý điều tra khả
năng ứng dụng của việc sử dụng các kỹ thuật khai thác dữ liệu cho các hệ thống e-learning.
Dự đoán thành tích của học sinh đã trở thành một nhiệm vụ đầy thách thức do lượng dữ liệu
ngày càng tăng trong các hệ thống giáo dục (Shahiri et al. 2015). Người ta cũng lập luận rằng
các phương pháp dự đoán hiện tại vẫn chưa đủ để xác định các kỹ thuật thích hợp để dự đoán kết
quả học tập của sinh viên trong các cơ sở giáo dục đại học. Hơn nữa, việc xác định các yếu tố
ảnh hưởng đến kết quả học tập của sinh viên vẫn còn bị bỏ qua và cần được nghiên cứu thêm. Do
đó, rõ ràng cần phải xác định các yếu tố quan trọng nhất được cho là có ý nghĩa và thực sự ảnh
hưởng đến thành tích của học sinh từ số lượng tài liệu EDM ngày càng tăng. Mục đích của bài
báo này là điều tra các tài liệu liên quan đến EDM và xác định các yếu tố quan trọng nhất và
được nghiên cứu nhiều nhất ảnh hưởng đến thành tích của sinh viên trong giáo dục đại học, cũng
như tạo ra một tập hợp các yếu tố và thuộc tính tổng quát được cho là có ảnh hưởng năng lực
và kết quả học tập của sinh viên trong lĩnh vực giáo dục đại học. Để thực hiện nghiên cứu này,
các tài liệu hiện có đã được xem xét bằng cách sử dụng
1 3
Machine Translated by Google
Các yếu tố ảnh hưởng đến thành tích của học sinh trong giáo dục đại học:…
một phương pháp đánh giá tài liệu có hệ thống (SLR). SLR là một trong những cách tiếp cận phổ biến nhất
được sử dụng để xem xét tài liệu (Al-Emran và cộng sự 2018), và nó phục vụ mục tiêu của chúng tôi là cung
cấp một bản tóm tắt các nghiên cứu liên quan đến EDM và xác định các yếu tố ảnh hưởng đến kết quả học
Phần còn lại của bài báo được tổ chức như sau. Phương pháp đánh giá tài liệu có hệ thống được giải
thích trong phần tiếp theo. Phần 3 trình bày các kết quả đạt được từ nghiên cứu này. Thảo luận về các
kết quả được nêu trong Phần. 4, trong khi các nhận xét kết luận được thể hiện trong Phần. 5.
Trong bài báo này, chúng tôi đã sử dụng một phương pháp SLR tiêu chuẩn, tuân theo các hướng dẫn được đề
xuất bởi Kitchenham et al. (2009). SLR có nhiều lợi thế so với các phương pháp đánh giá tài liệu đơn
giản và không có cấu trúc, vì nó có nhiều khả năng được coi là đáng tin cậy và không thiên vị (Al-Qaysi
et al. 2018). Ngoài ra, thông tin thu thập từ SLRs có độ tin cậy cao vì nó được lấy từ nhiều nguồn khác
nhau (Kitchenham và Charters 2007). Có ba giai đoạn chính của SLR, đó là lập kế hoạch, thực hiện và báo
cáo (Kitchenham et al. 2009). Hai giai đoạn đầu tiên được thảo luận trong hai phần phụ sau đây, trong
Lập kế hoạch đại diện cho giai đoạn đầu tiên của phương pháp SLR bao gồm năm bước theo các phần phụ sau
đây.
2.1.1 Xác định mục tiêu nghiên cứu và câu hỏi nghiên cứu
Mục tiêu của chúng tôi trong bài báo này là xem xét một cách có hệ thống các tài liệu liên quan thông
qua quy trình SLR (Kitchenham và Charters 2007), và các câu hỏi nghiên cứu của chúng tôi được cung cấp
như sau:
• Các yếu tố ảnh hưởng đến kết quả học tập của sinh viên trong giáo dục đại học là gì? •
Các kỹ thuật khai thác dữ liệu được sử dụng để phân tích và dự đoán kết quả học tập của sinh viên là gì?
chùy?
Các từ khóa tìm kiếm của chúng tôi chủ yếu được thúc đẩy bởi các câu hỏi nghiên cứu đã nêu trong tiểu
mục trước. Sau khi xác định được các từ khóa tìm kiếm, chúng ta phải chuẩn bị một chuỗi tìm kiếm hoạt
động được với các máy tìm kiếm của thư viện cần tìm sẽ được xác định trong phần tiếp theo. Chuỗi tìm kiếm
được sử dụng trong nghiên cứu này là: [(“khai thác dữ liệu” OR “khai thác dữ liệu giáo dục”) AND (“các
yếu tố ảnh hưởng đến hiệu suất của sinh viên” OR “dự đoán hiệu suất của sinh viên”)].
Như có thể thấy trong chuỗi tìm kiếm, thuật ngữ “dự đoán thành tích của học sinh” đã được thêm vào
chuỗi tìm kiếm mặc dù nó không xuất hiện trong các câu hỏi nghiên cứu. Điều này là do chúng tôi đã nhận
thấy trong giai đoạn lập kế hoạch rằng có rất nhiều nghiên cứu đã đưa thuật ngữ này vào tiêu đề và/hoặc
tóm tắt của chúng, điều này cho thấy rằng nghiên cứu này là
1 3
Machine Translated by Google
liên quan đến EDM và những nghiên cứu này dự đoán hiệu suất của học sinh dựa trên các thuộc tính khác.
Các cơ sở dữ liệu thư viện trực tuyến và công cụ tìm kiếm sau đây đã được chọn để tìm kiếm SLR hiện tại:
ScienceDirect, EBSCO, ProQuest, JSTOR và Taylor & Francis. Các tác giả của nghiên cứu này cho rằng những cơ sở
dữ liệu này là nguồn chính để thu thập các bài báo liên quan đến EDM và hiệu suất của sinh viên.
Tiêu chí đưa vào của chúng tôi được trình bày trong Bảng 1. Mỗi nghiên cứu được tìm thấy trong kết quả tìm
kiếm phải đáp ứng các tiêu chí này để được đưa vào SLR của chúng tôi.
Trong nghiên cứu này, dữ liệu được thu thập dựa trên các feld được mô tả trong Bảng 2. Các bài báo nghiên cứu
không có một hoặc nhiều feld từ dữ liệu được mô tả trong Bảng 2 đã bị loại khỏi nghiên cứu.
Tiến hành đánh giá đại diện cho giai đoạn thứ hai của phương pháp SLR bao gồm năm bước theo các phần phụ sau
đây.
Trong bước này, chúng tôi bắt đầu tìm kiếm cơ sở dữ liệu của các thư viện trực tuyến bằng chuỗi tìm kiếm đã
nói ở trên. Các kết quả tìm kiếm ban đầu do các công cụ tìm kiếm trả về được minh họa trong Bảng 3.
Trong nghiên cứu này, việc lựa chọn các bài báo được thực hiện theo các Mục Báo cáo Ưu tiên cho Đánh giá Hệ
Một. Phải đáp ứng các điều kiện về từ khóa nghiên cứu
b. Phải được phân loại là nghiên cứu khai thác dữ liệu hoặc học máy c. Phải
đ. Các bài báo toàn văn phải có sẵn và có thể truy cập được, và không được truy
cập qua arXiv
f. Phải được xuất bản trong thập kỷ qua (nghĩa là từ năm 2009 đến 2018) g. Phải
1 3
Machine Translated by Google
Các yếu tố ảnh hưởng đến thành tích của học sinh trong giáo dục đại học:…
ID giấy Một số ID được chỉ định cho mỗi bài nghiên cứu để dễ dàng tham khảo trong quá trình
xem xét
Tiêu đề báo đề của bài báo nghiên cứu Tạp chí xuất bản bài
tạp chí báo nghiên cứu (Các) tác giả của bài báo nghiên cứu
Tác giả Năm xuất bản bài báo Quốc gia nơi nghiên cứu bài
Năm báo nghiên cứu được thực hiện Danh sách các yếu tố
Quốc gia học tập đã được nghiên cứu trong bài nghiên cứu Các loại yếu tố trong feld trước đây,
Các yếu tố nghiên cứu chẳng hạn như: đồ họa demo của sinh viên, thông tin xã hội của sinh viên, hoạt
Các yếu tố được tìm thấy có ý nghĩa Danh sách các yếu tố được các nhà nghiên cứu của nghiên cứu này cho là có ý nghĩa
ra khỏi danh sách đầy đủ các yếu tố được nghiên cứu
Các phương pháp khai phá dữ liệu Các kỹ thuật khai phá dữ liệu được sử dụng trong bài nghiên cứu như: phân loại,
phân cụm, v.v.
Các thuật toán khai thác dữ liệu Các thuật toán khai phá dữ liệu được sử dụng trong bài nghiên cứu như: cây quyết
định, SVM, phân cụm K-Means, v.v.
Kỹ thuật thu thập dữ liệu Các kỹ thuật được sử dụng để thu thập dữ liệu trong bài nghiên cứu, chẳng hạn như:
khảo sát, dữ liệu hệ thống thông tin sinh viên, dữ liệu hệ thống e-Learning, v.v.
EBSCO 80
ProQuest 34
JSTOR 201
PRISMA thể hiện luồng thông tin xuyên suốt các giai đoạn SLR, trong đó nó ánh xạ số lượng bài
báo được xác định, đưa vào, loại trừ và lý do đằng sau việc loại trừ (Liberati et al. 2009).
Hình 1 minh họa fowchart PRISMA. Trong đó, chúng tôi lựa chọn các bài báo nghiên cứu thỏa mãn
tiêu chí đưa vào/loại trừ và kiểm tra nội dung của các bài báo được lựa chọn để kiểm chứng tính
hợp lệ của chúng khi lựa chọn. Sau đó chúng tôi áp dụng lựa chọn bài viết tự động và bán tự
động. Quá trình lựa chọn tự động liên quan đến việc kiểm tra các bài báo dựa trên tiêu đề, tóm
tắt và từ khóa, trong khi lựa chọn bán tự động liên quan đến việc đọc toàn văn của các bài báo
còn lại.
Do lựa chọn tự động, chúng tôi đã tìm thấy 218 bài báo trùng lặp, trong đó, 57 bài không
đáp ứng các từ khóa nghiên cứu và không liên quan đến chủ đề của nghiên cứu SLR này, 19 bài
không phải là nghiên cứu khai thác dữ liệu, 23 bài không truy cập miễn phí cũng như có sẵn,
hoặc một bài báo arXiv, 21 bài là bài đánh giá và 34 bài không phải tiếng Anh. Hơn nữa, ngày
nghiên cứu đã được đặt làm bộ lọc tìm kiếm trong công cụ tìm kiếm và bị loại khỏi kết quả tìm kiếm ban đầu.
1 3
Machine Translated by Google
Cuối cùng, chúng tôi chỉ còn lại 48 tài liệu nghiên cứu. Qua việc áp dụng phương pháp chọn
bài bán tự động và đọc toàn văn bài báo, nhận thấy 12 bài không đưa vào các yếu tố ảnh hưởng
đến kết quả học tập của sinh viên; do đó, họ cũng bị loại khỏi danh sách. Do đó, kích thước
tập dữ liệu cuối cùng của SLR là 36 tài liệu nghiên cứu. Bảng 11 (Xem “Phụ lục”) liệt kê tất
cả 36 tài liệu nghiên cứu được chọn cho SLR này.
Để đánh giá chất lượng của các bài báo được chọn trong phần trước, chúng tôi phải trả lời
các câu hỏi trong Bảng 4 cho từng bài báo trong tập dữ liệu. Điều đáng nói là việc phân tích
các nghiên cứu thu thập được thực hiện bởi các tác giả thứ nhất và thứ hai của nghiên cứu
này bằng cách phân tích thủ công từng bài viết. Tỷ lệ thỏa thuận giữa các bộ mã hóa cho mã
hóa là 97,5%. Sự khác biệt về phân tích giữa hai tác giả đã được giải quyết thông qua thảo
luận và xem xét thêm các nghiên cứu gây tranh cãi.
Tương ứng, các câu trả lời cho các câu hỏi trong Bảng 4 chấp nhận ba mức điểm: Có (1),
Một phần (0,5) và Không (0). Tổng điểm của tất cả các câu hỏi cho mỗi nghiên cứu sẽ dẫn đến
điểm chất lượng tích lũy cho mỗi bài viết trên 9. Kết quả sau đó được chuyển đổi
1 3
Machine Translated by Google
Các yếu tố ảnh hưởng đến thành tích của học sinh trong giáo dục đại học:…
Điều lệ 2007)
Q1 Mục tiêu nghiên cứu có được trình bày rõ ràng không?
Q3 Nghiên cứu có khám phá sự đa dạng của các quan điểm và bối cảnh không?
Q7 Các nhà nghiên cứu có giải thích hậu quả của bất kỳ vấn đề nào không?
Q8 Nghiên cứu có bổ sung thêm kiến thức hoặc hiểu biết của bạn không?
thành tỷ lệ phần trăm, ví dụ: 7 trên 9 là 77,78%. Bảng 12 (Xem “Phụ lục”) cho thấy điểm chất lượng tích lũy
cho tất cả các bài báo có trong tập dữ liệu của chúng tôi cùng với kết quả phần trăm của chúng, được sắp xếp
Như thể hiện trong Bảng 12, 34 trong số 36 bài đạt điểm bằng hoặc lớn hơn 4,5 (50%), trong khi chỉ có 2
bài đạt giá trị 4/9 (44,44%) do chất lượng thấp và nội dung nghèo nàn. Bài đạt điểm cao nhất là RP10 và RP22
Do đó, hai bài báo có điểm thấp (RP130, RP136) đã bị xóa khỏi quy trình SLR và 34 bài còn lại được giữ lại cho
Trong bước này, dữ liệu cần thiết cho nghiên cứu SLR của chúng tôi sẽ được trích xuất từ các bài báo đã chọn
theo bố cục dữ liệu trong Bảng 2. Ở bước này, chúng tôi tập trung vào việc tìm kiếm các yếu tố ảnh hưởng đến
kết quả học tập của học sinh và quan trọng nhất là những yếu tố ảnh hưởng đến kết quả học tập của học sinh.
được các nhà nghiên cứu tìm thấy trong các bài báo của họ, cũng như các kỹ thuật và thuật toán khai thác dữ
liệu được các nhà nghiên cứu sử dụng trong nghiên cứu khai thác dữ liệu của họ. Những dữ liệu này sẽ giúp chúng
tôi có được những hiểu biết và kết quả hữu ích giúp chúng tôi trả lời các câu hỏi nghiên cứu của mình. Bảng 13
(Xem “Phụ lục”) tóm tắt dữ liệu được trích xuất cho từng bài báo trong bộ dữ liệu của chúng tôi.
Chúng tôi đã trích xuất 215 yếu tố quan trọng khác biệt từ 34 tài liệu nghiên cứu ảnh hưởng đến thành tích của
sinh viên trong cuộc sống giáo dục của họ. Ngoài ra, trong quá trình trích xuất dữ liệu, chúng tôi đã xác định
danh mục cho từng nhóm yếu tố được thu thập từ mỗi bài viết. Kết quả là, chúng tôi đã tìm thấy các loại chín
yếu tố mà 215 yếu tố thuộc về. Bảng 5 trình bày trích xuất chín loại yếu tố cùng với mô tả của chúng, trong
khi nguồn và số lượng bài báo cho các loại này được minh họa trong phần mở rộng của Bảng 14 trong “Phụ lục”.
3. Kết quả
Trong phần này, chúng tôi báo cáo kết quả nghiên cứu SLR của mình, nơi chúng tôi sẽ trả lời các câu hỏi nghiên
cứu của mình và trình bày chi tiết về các kết quả thú vị mà chúng tôi thu được từ dữ liệu được trích xuất.
1 3
Machine Translated by Google
Loại Sự miêu tả
Hoạt động e-Learning của học sinh Nhật ký hoạt động của học sinh trong hệ thống e-Learning như: số lần đăng nhập, số
Học sinh lớp trước và hiệu suất Điểm hoặc các chỉ số hoạt động khác của học sinh trong các khóa học, học kỳ
môi trường sinh viên Các thuộc tính của môi trường sinh viên, chẳng hạn như: loại trường học,
nhân khẩu học sinh viên Dữ liệu nhân khẩu học của một sinh viên, chẳng hạn như: giới tính, tuổi tác, quốc tịch,
thuộc tính người hướng dẫn Thông tin về người hướng dẫn của sinh viên và đánh giá của anh ấy / cô ấy
kết quả
thuộc tính khóa học Thông tin về khóa học hoặc mô-đun mà sinh viên đang tham gia, chẳng hạn như,
Thông tin xã hội sinh viên Thông tin liên quan đến đời sống xã hội của sinh viên, như số lượng bạn bè,
đánh giá khóa học Dữ liệu được thu thập từ các cuộc khảo sát đánh giá khóa học, chẳng hạn như, các câu hỏi liên quan đến
Thông tin trải nghiệm của học viên Thông tin về trải nghiệm của học viên về khóa học, chẳng hạn như
3.1 Câu hỏi nghiên cứu 1: Các yếu tố ảnh hưởng đến kết quả học tập của sinh viên
3.1.1 Phân phối các bài báo nghiên cứu theo danh mục yếu tố
Chúng tôi đã phân loại mỗi bài viết theo một hoặc nhiều danh mục như được mô tả trong Bảng 5. Chúng bao
gồm: (1) Hoạt động học trực tuyến của sinh viên, (2) Các lớp trước của sinh viên và thành tích của lớp,
(3) Môi trường của sinh viên, (4) Nhân khẩu học của sinh viên, (5) Thuộc tính của người hướng dẫn, (6)
Thuộc tính khóa học, (7) Thông tin xã hội của sinh viên, (8) Đánh giá khóa học và (9) Thông tin trải
nghiệm của sinh viên. Như có thể thấy trong Hình 2, cách phổ biến nhất và được sử dụng rộng rãi
Hình 2 Phân bố các bài báo nghiên cứu theo thể loại
1 3
Machine Translated by Google
Các yếu tố ảnh hưởng đến thành tích của học sinh trong giáo dục đại học:…
Các loại yếu tố để dự đoán kết quả học tập của sinh viên trong giáo dục đại học là điểm số trước đây của
sinh viên và kết quả học tập trong lớp (26%), tiếp theo là hoạt động Học trực tuyến của sinh viên (25%),
nhân khẩu học của sinh viên (23%) và thông tin xã hội của sinh viên ( 12%), tương ứng.
4 loại này đã được trình bày trong 86% các nghiên cứu được phân tích.
Phát hiện này phù hợp với phát hiện của một tổng quan tài liệu có hệ thống trước đây được thực hiện
bởi Shahiri et al. (2015), cho thấy CGPA và điểm đánh giá nội bộ là những thuộc tính được sử dụng thường
xuyên nhất trong cộng đồng EDM để dự đoán hiệu suất của học sinh. Điều này phù hợp với hạng mục yếu tố
hàng đầu của chúng tôi đại diện cho “điểm trước đây của học sinh và thành tích trong lớp”. Năm danh mục
khác chiếm tổng cộng 14% đã được một số nghiên cứu sử dụng và không thường xuyên xuất hiện trong các bài
báo nghiên cứu khác; do đó, chúng được coi là các yếu tố đặc biệt.
3.1.2 Phân bổ các bài báo nghiên cứu theo năm xuất bản
Bảng 6 chỉ ra rằng nghiên cứu khai thác dữ liệu giáo dục phổ biến nhất vào năm 2016, trong đó hơn 17,5%
nghiên cứu được thực hiện trong năm nay và sự quan tâm tăng lên đáng kể đã bắt đầu vào năm 2012.
3.1.3 Phân phối các bài báo nghiên cứu theo kỹ thuật thu thập dữ liệu
Một khía cạnh khác đã được thêm vào việc thu thập dữ liệu, đó là các kỹ thuật thu thập dữ liệu. Trên thực
tế, chúng tôi đã xác định được năm kỹ thuật thu thập dữ liệu, cụ thể là: (1) Nhật ký hệ thống e-Learning,
(2) Dữ liệu hệ thống thông tin sinh viên, (3) Khảo sát, (4) Khảo sát đánh giá khóa học và (5) Nhật ký truy
cập mạng . Bảng 7 tóm tắt các kỹ thuật thu thập dữ liệu được sử dụng bởi các tài liệu nghiên cứu trong bộ
3.2 Câu hỏi nghiên cứu 2: Các kỹ thuật khai thác dữ liệu được sử dụng để phân tích và dự đoán
Thành tích của học sinh
Các phương pháp khai thác dữ liệu chính được sử dụng trong hầu hết các nghiên cứu được phân tích là: (1)
phân loại và (2) phân cụm. Bảng 8 tóm tắt việc phân phối các bài báo nghiên cứu trong tập dữ liệu của
chúng tôi theo hai cách tiếp cận khai thác dữ liệu được mô tả. Phương pháp khai thác dữ liệu chính được sử dụng
2009 RP142 1
1 3
1 3
Nhật
ký
truy
cập
mạng Khảo
sát
đánh
giá
khóa
học khảo
sát Dữ
liệu
hệ
thống
thông
tin
sinh
viên
Dữ
liệu
được
trích
xuất
từ
hệ
thống
thông
tin
sinh
viên,
chẳng
hạn
như Nhật
ký
hệ
thống
e-
Learning Kỹ
thuật
thu
thập
dữ
liệu Bảng
7
Tóm
tắt
các
kỹ
thuật
thu
thập
dữ
liệu
Mạng
ghi
nhật
ký
hoạt
động
của
sinh
viên
trên
internet án
Đáp
khảo
sát
đánh
giá
khóa
học,
thường
thu
được
tại Khảo
sát
chung
thu
được
trực
tiếp
từ
sinh
viên Nhật
ký
thu
được
từ
hệ
thống
e-
Learning Sự
miêu
tả
và
mạng
lưới
trường
đại
học cuối
mỗi
khóa
học dữ
liệu
nhân
khẩu
học,
dữ
liệu
nhập
học,
điểm
số,
v.v.
RP174 RP10,
RP12,
RP25,
RP35 RP16,
RP22,
RP67,
RP69,
RP75,
RP128,
RP142 RP2,
RP5,
RP16,
RP22,
RP25,
RP28,
RP43,
RP120, RP1,
RP7,
RP9,
RP23,
RP25,
RP33,
RP34,
RP36,
RP44, Bài
viết
RP123,
RP127,
RP323 RP94,
RP113,
RP198,
RP220,
RP277
Số
bài
viết
11 14
1 4 7
A. Abu Saa và cộng sự.
Machine Translated by Google
Machine Translated by Google
Các yếu tố ảnh hưởng đến thành tích của học sinh trong giáo dục đại học:…
là phân loại. Có thể thấy rằng tất cả các bài nghiên cứu trong bộ dữ liệu đều sử dụng phương pháp
phân loại để phân loại và dự đoán kết quả học tập của sinh viên. Mặt khác, chỉ có 4 tài liệu
nghiên cứu đã sử dụng phân cụm cùng với phân loại hữu ích để tìm ra có bao nhiêu nhóm sinh viên
khác nhau có sẵn trong tập dữ liệu và rút ra các đặc điểm cụ thể của từng nhóm. Phát hiện này phù
hợp với kết quả của một nghiên cứu trước đây do Peña-Ayala (2014) thực hiện, trong đó nó chỉ ra
rằng phân loại và phân cụm là các kỹ thuật khai thác dữ liệu điển hình nhất được sử dụng bởi
nghiên cứu EDM.
Hơn nữa, chúng tôi đã trích xuất 141 kỹ thuật/thuật toán khai thác dữ liệu được sử dụng bởi 34
bài báo trong bộ dữ liệu của chúng tôi. Trong số đó, 74 là khác biệt. Các thuật toán là: 1NN, 3NN,
ADTree, Thuật toán Apriori, Mạng thần kinh nhân tạo, BayesNet, Hồi quy hai biến, BP, Cây quyết
định C4.5, Cây quyết định GIỎ HÀNG, CHAID, CitationKNN, Phân cụm, Cây quyết định CRT, Cây quyết
định (DT), DecisionStump, DTNB, EM, FarthestFirst, Feed-Forward Neural Network (FFNN), G3P-MI, GP-
ICRM, Gradient Boosting (GBM), HierarchicalClusterer, IBk, ICRM v1, ICRM v2, ICRM v3, ICRM2, Cây
quyết định ID3, J48, Jrip, Phân cụm K-Means, K-Láng giềng gần nhất (k-NN), LADTree, LGR, Hồi quy
tuyến tính có trọng số cục bộ, Hồi quy logistic, MILR, Mạng thần kinh Perceptron (MLP) nhiều lớp,
Cây mô hình, Đa hậu cần Hồi quy (MLR), Bộ phân loại Naïve Bayes, NaiveBayesSimple, Công việc mạng
thần kinh (NN), NLPCA, Nnge, OneR, PART, Lăng kính, Bộ phân loại SFAM nhóm xác suất (PESFAM),
ARTMAP mờ đơn giản hóa nhóm xác suất, Mô hình lẻ tỷ lệ (POM), Radial Chức năng cơ sở (RBF) Mạng,
Rừng ngẫu nhiên, Cây ngẫu nhiên, Công việc mạng RBF, Hồi quy, Chế độ mạng thần kinh hồi quy l
(RNN), REPTree, Lập bản đồ lý thuyết cộng hưởng (PESFAM), Ridor, RIPPER, Cảm ứng quy tắc, sIB,
SimpleCart, SimpleKMeans, SMO, Máy vectơ hỗ trợ (SVM), Hồi quy vectơ hỗ trợ (SVOR), Hệ thống khai
thác dữ liệu giáo dục (SEDM), Trực quan hóa, WINNOW, Xmeans. Tuy nhiên, các thuật toán được sử
dụng phổ biến nhất đã được sử dụng trong 4 bài báo nghiên cứu trở lên (tức là trong hơn 10% bài
báo), được trình bày trong Bảng 9.
Hơn nữa, chúng tôi đã hợp nhất các thuật toán tương tự lại với nhau thành một danh mục, ví dụ:
ID3 và C4.5 đều là cây quyết định, vì vậy chúng tôi đã nhóm chúng lại với nhau trong danh mục cây
quyết định. Sau khi làm như vậy, chúng tôi đã kết thúc với 7 loại thuật toán. Bảng 10 cho thấy 7
nhóm thuật toán và tần suất sử dụng chúng trong các bài báo nghiên cứu đã phân tích.
Như có thể quan sát được từ Bảng 10, các loại thuật toán khai thác dữ liệu được sử dụng phổ biến
nhất là Cây quyết định, bộ phân loại Naïve Bayes và Mạng thần kinh nhân tạo.
4. Thảo luận
Nghiên cứu này báo cáo một đánh giá tài liệu có hệ thống liên quan đến thành tích học tập của
sinh viên trong giáo dục đại học. Nghiên cứu được thiết kế để xác định các yếu tố được nghiên cứu
phổ biến nhất ảnh hưởng đến thành tích của học sinh, cũng như các kỹ thuật khai thác dữ liệu phổ
biến nhất được áp dụng để xác định các yếu tố này. Nghiên cứu đã xem xét 34 bài báo nghiên cứu liên quan
1 3
Machine Translated by Google
Một
Tỷ lệ phần trăm được tính trên tổng số bài viết được phân tích (N=34)
K-Means 3 2.1
Một
đến chủ đề và đưa ra kết quả phân phối nghiên cứu trên nhiều chiều.
Về hướng nghiên cứu thứ nhất, kết quả chính cho thấy rằng điểm số trước đây của sinh viên và
kết quả học tập trên lớp, hoạt động e-Learning của sinh viên, nhân khẩu học của sinh viên và
thông tin xã hội của sinh viên nói chung là những yếu tố chính ảnh hưởng đến kết quả học tập
của sinh viên ở bậc đại học. giáo dục.
Theo tài liệu (Asif et al. 2017; Burgos et al. 2018; Gómez-Rey et al. 2016; Kotsiantis et
al. 2010; Márquez-Vera et al. 2013, 2016), phân loại đầu tiên liên quan đến học sinh ' Các lớp
trước và kết quả học tập trong lớp cũng được coi là một trong những yếu tố ảnh hưởng có thể
ảnh hưởng đến kết quả học tập của học sinh. Phát hiện này có thể giải thích rằng kết quả học
tập của học sinh vẫn như nhau trong suốt cuộc đời học tập của họ. Nói cách khác, nếu học sinh
có thói quen đạt điểm cao khi bắt đầu học, thì học sinh đó sẽ vẫn đạt điểm cao trong phần còn
lại của cuộc đời học tập. Điều này cũng tương tự đối với những sinh viên có xu hướng bị điểm
kém, họ cũng có thể giữ nguyên khuôn mẫu trong suốt quá trình học tập của mình và chắc chắn,
điều này có thể ảnh hưởng đến thành tích của họ trong học tập hiện tại và tương lai. Đối với
các cơ sở giáo dục đại học, những kết quả này có thể hỗ trợ các bên liên quan trong giáo dục
tập trung vào các điểm yếu cụ thể trong đời sống học tập của sinh viên và cố gắng khắc phục
những thiếu sót này bằng cách cải thiện kết quả và chất lượng giáo dục của sinh viên.
1 3
Machine Translated by Google
Các yếu tố ảnh hưởng đến thành tích của học sinh trong giáo dục đại học:…
Kết quả cũng phù hợp với các tài liệu hiện có (Abdous et al. 2012; Bur gos et al. 2018; Hung et
al. 2012; Lara et al. 2014; Xing et al. 2015; Zafra và Ventura 2012), trong đó loại yếu tố thứ hai
(tức là hoạt động e-Learning của học sinh) cũng được phát hiện là có tác động đáng kể đến kết quả học
tập của học sinh. Điều này cho thấy rằng càng nhiều sinh viên tham gia vào các hoạt động e-Learning
(ví dụ: truy cập tài liệu trực tuyến, giải các câu đố trực tuyến và tải bài tập lên hệ thống e-
Learning), thì càng có nhiều khả năng sinh viên đạt được điểm cao hơn và cải thiện thành tích tổng
thể của họ. Trên thực tế, những kết quả này có thể hỗ trợ các tổ chức giáo dục tập trung vào các hoạt
động e-Learning của sinh viên và thúc đẩy việc sử dụng các hệ thống e-Learning nhằm nâng cao hiệu suất
và chất lượng giáo dục của sinh viên (Salloum et al. 2019).
Liên quan đến hai loại yếu tố khác liên quan đến nhân khẩu học của sinh viên và thông tin xã hội
của sinh viên, người ta thừa nhận rằng những loại này là những loại cụ thể hơn của sinh viên liên
quan đến nền tảng của sinh viên và các hành vi xung quanh họ. Hai yếu tố này chủ yếu phụ thuộc vào
bản thân học sinh và học sinh nên quan tâm đến các yếu tố đó và cố gắng tránh mọi hành vi hoặc hoạt
động xã hội có thể ảnh hưởng đến kết quả học tập của mình. Hơn nữa, các nhà hoạch định chính sách có
thể tận dụng các yếu tố đó để tạo ra các nhóm tập trung nhằm chăm sóc sinh viên và dành cho họ sự
quan tâm đặc biệt trong quá trình học tập tại cơ sở giáo dục.
Đối với các kỹ thuật thu thập dữ liệu, kết quả chỉ ra rằng nhật ký hệ thống e-Learning và dữ liệu
hệ thống thông tin sinh viên là những kỹ thuật thu thập dữ liệu thường xuyên nhất được sử dụng trong
các nghiên cứu được phân tích. Nghiên cứu sâu hơn nên xem xét các kỹ thuật thu thập dữ liệu khác như
khảo sát, khảo sát đánh giá khóa học và nhật ký truy cập mạng vì những kỹ thuật này ít được sử dụng
Về hướng nghiên cứu thứ hai, kết quả chỉ ra rằng Cây quyết định, bộ phân loại Naïve Bayes và Mạng
thần kinh nhân tạo là những thuật toán khai thác dữ liệu được sử dụng phổ biến nhất. Phát hiện này
phù hợp với phát hiện của các nghiên cứu tổng quan tài liệu có hệ thống trước đây (Peña-Ayala 2014;
Shahiri et al. 2015), trong đó người ta thấy rằng cây quyết định và bộ phân loại Naïve Bayes là các
kỹ thuật khai thác dữ liệu thường xuyên nhất được sử dụng trong nghiên cứu EDM . Với những kết quả
này, nghiên cứu sâu hơn được đề xuất để tham khảo các thuật toán khai thác dữ liệu khác có thể bổ
Mặc dù tổng quan hệ thống hiện tại chia sẻ một phần các câu hỏi nghiên cứu giống như với Shahiri
et al. (2015) và Peña-Ayala (2014), nó cũng có một số điểm khác biệt mà chúng ta cần thảo luận. Đầu
tiên, khoảng thời gian của các bài báo nghiên cứu được phân tích nằm trong khoảng từ năm 2002 đến
2015 theo nghiên cứu đánh giá được thực hiện bởi Shahiri et al. (2015), và từ năm 2010 đến 2013 theo
nghiên cứu đánh giá được thực hiện bởi Peña-Ayala (2014). So với các đánh giá này, khoảng thời gian
của các nghiên cứu được phân tích trong nghiên cứu đánh giá này nằm trong khoảng từ năm 2009 đến
2018. Thứ hai, liên quan đến chiến lược tìm kiếm, Shahiri et al. (2015) chủ yếu tập trung vào việc
thu thập các nghiên cứu liên quan đến “hiệu suất của sinh viên” và “khai thác dữ liệu giáo dục”,
trong khi Peña-Ayala (2014) tập trung vào việc thu thập các nghiên cứu liên quan đến “phương pháp
tiếp cận EDM” và “công cụ EDM”. Để làm cho nghiên cứu đánh giá này trở nên đặc biệt hơn, nó đã tập
trung vào việc thu thập các nghiên cứu liên quan đến “các yếu tố ảnh hưởng đến hiệu suất của học
sinh” và “kỹ thuật khai thác dữ liệu hoặc khai thác dữ liệu giáo dục”. Thay đổi chiến lược tìm kiếm
cho phép chúng tôi truy xuất các bài báo khác với những bài báo đã được truy xuất trong các bài đánh giá trước đó.
Thứ ba, Shahiri et al. (2015) kết luận rằng Cây quyết định và Mạng thần kinh là các kỹ thuật khai
thác dữ liệu được sử dụng phổ biến nhất, trong khi Peña-Ayala (2014) chỉ ra rằng định lý Bayes, Cây
quyết định, học tập dựa trên cá thể (IBL) và mô hình Markov ẩn (HMM) là các kỹ thuật được sử dụng
thường xuyên nhất. Trong nghiên cứu này, các kết quả đã được hỗ trợ một phần, trong đó Cây quyết
định, bộ phân loại Naïve Bayes và Mạng thần kinh nhân tạo được coi là các kỹ thuật khai thác dữ liệu
phổ biến nhất được sử dụng để dự đoán khả năng của sinh viên.
1 3
Machine Translated by Google
hiệu suất. Nhìn chung, sự khác biệt giữa nghiên cứu đánh giá này và các nghiên cứu trước nằm ở
khoảng cách giữa khoảng thời gian, chiến lược tìm kiếm và kết quả đạt được. Vì vậy, nghiên cứu này
có thể phục vụ như một tài liệu tham khảo toàn diện để theo đuổi các nghiên cứu sâu hơn về EDM nói
Trong bài báo này, chúng tôi đã xác định các yếu tố phổ biến nhất và được nghiên cứu rộng rãi ảnh
hưởng đến thành tích của sinh viên trong giáo dục đại học, cũng như các phương pháp, kỹ thuật và
thuật toán khai thác dữ liệu phổ biến nhất được sử dụng để phân loại và dự đoán thành tích của sinh viên.
Chúng tôi tuân theo một phương pháp đánh giá tài liệu có hệ thống bao gồm nhiều giai đoạn và các
bước. Quá trình này được bắt đầu bằng việc lập kế hoạch đánh giá, từ việc hình thành các câu hỏi
nghiên cứu, thông qua việc thiết lập các tiêu chí đưa vào và loại trừ, cho đến khi quyết định chiến
lược trích xuất dữ liệu. Hơn nữa, giai đoạn thứ hai bao gồm các bước để tiến hành đánh giá, bắt đầu
bằng cách tìm kiếm và xác định các tài liệu nghiên cứu để đánh giá tài liệu, tiếp theo là đánh giá
chất lượng của các tài liệu nghiên cứu được chọn và kết thúc bằng cách trích xuất dữ liệu và tổng
hợp nó. Cuối cùng, chúng tôi kết thúc bằng việc báo cáo kết quả nghiên cứu SLR của chúng tôi, trong
đó kết luận rằng các yếu tố phổ biến nhất và được sử dụng rộng rãi để dự đoán thành tích của sinh
viên trong giáo dục đại học là điểm số trước đây của sinh viên và thành tích trong lớp, hoạt động
Học trực tuyến của sinh viên, sinh viên ' nhân khẩu học, và thông tin xã hội của sinh viên. Ngoài
ra, kết quả cũng chỉ ra rằng các kỹ thuật khai thác dữ liệu phổ biến và được sử dụng rộng rãi nhất
trong lĩnh vực EDM là Cây quyết định, bộ phân loại Naïve Bayes và Mạng thần kinh nhân tạo.
Là một công việc trong tương lai, các nhà nghiên cứu có thể hưởng lợi từ các kết quả của việc
xem xét tài liệu có hệ thống này bằng cách sử dụng nó cho nghiên cứu trong tương lai của họ, đặc
biệt là các kết quả chính làm nổi bật các loại yếu tố được sử dụng thường xuyên nhất ảnh hưởng đến
hiệu suất của học sinh, cũng như các yếu tố thường xuyên nhất. kỹ thuật khai phá dữ liệu đã sử dụng.
Chưa kể, việc có một tập hợp chung các danh mục yếu tố cung cấp một số khả năng để điều chỉnh việc
sử dụng các danh mục này và đưa ra các yếu tố cụ thể trong danh mục của từng tổ chức giáo dục, vì nó
có thể khác nhau giữa các nơi và theo thời gian. thời gian. Như một hạn chế, nghiên cứu này đã tập
trung vào một số cơ sở dữ liệu về bộ sưu tập các bài báo. Ngoài ra, những nỗ lực trong tương lai có
thể xem xét các cơ sở dữ liệu và công cụ tìm kiếm khác để thu thập các bài báo nhằm tận dụng số
ruột thừa
1 3
1 3
RP120 RP113 RP94 RP81 RP75 RP69 Rp67 RP44 RP43 RP36 RP35 RP34 RP33 RP28 RP25 RP23 RP22 RP16 RP12 RP10 RP9 RP7 RP5 RP2 RP1 ID
giấy Bảng
11
Các
bài
nghiên
cứu
chọn
lọc
khoa
học
trực
tiếp khoa
học
trực
tiếp khoa
học
trực
tiếp khoa
học
trực
tiếp khoa
học
trực
tiếp khoa
học
trực
tiếp khoa
học
trực
tiếp khoa
học
trực
tiếp khoa
học
trực
tiếp khoa
học
trực
tiếp
Google
học
giả JSTOR JSTOR Google
học
giả JSTOR JSTOR ProQuest EBSCO EBSCO JSTOR JSTOR EBSCO ProQuest ProQuest EBSCO Nguồn
Tạp
chí
quốc
tế
về
khoa
học
máy
tính
tiên
tiến
và
ứng
dụng Máy
tính
và
Giáo
dục Tạp
chí
điện
tử
về
hệ
thống
thông
tin
ở
các
nước
đang
phát
triển Tạp
chí
Khoa
học
và
Công
nghệ
Ấn
Độ Tạp
chí
quốc
tế
về
khoa
học
máy
tính
tiên
tiến
và
ứng
dụng Tạp
chí
Khoa
học
Máy
tính Tạp
chí
Châu
Âu
về
Mở,
Từ
xa
và
Học
trực
tuyến Máy
tính
trong
hành
vi
con
người giá
Đánh
trí
tuệ
nhân
tạo Những
hệ
thống
chuyên
gia Các
mô
hình
ngẫu
nhiên
ứng
dụng
trong
kinh
doanh
và
công
nghiệp Máy
tính
và
Giáo
dục Tính
toán
mềm
ứng
dụng Hệ
thống
dựa
trên
tri
thức Tạp
chí
Công
nghệ
Giáo
dục
và
Xã
hội Tạp
chí
Công
nghệ
Giáo
dục
và
Xã
hội Những
hệ
thống
chuyên
gia Trí
tuệ
ứng
dụng Tin
học
trong
giáo
dục Những
hệ
thống
chuyên
gia Máy
tính
và
Giáo
dục Máy
tính
và
Kỹ
thuật
điện Tạp
chí
Nghiên
cứu
Kinh
doanh Máy
tính
và
Giáo
dục Máy
tính
trong
hành
vi
con
người tạp
chí
Baradwaj
và
Pal
(2012) Macfadyen
và
Dawson
(2010) Mwalumbwe
Và
Mtebe
(2017) Anuradha
Bharathiar
(2015) Abu
Saa
(2016) Abazeed
Và
Khder
(2017) Yukselturk
và
cộng
sự.
(2014) Hu
et
al.
(2014) Kotsiatis
(2012) Gamulin
et
al.
(2016) Costantini
và
cộng
sự.
(2010) Romero
et
al.
(2013) Zafra
và
Ventura
(2012) Kotsiatis
et
al.
(2010) Hùng
và
cộng
sự.
(2012) Abdous
et
al.
(2012) Márquez-
Vera
et
al.
(2016) Márquez-
Vera
et
al.
(2013) Giang
và
cộng
sự.
(2016) Gómez-
Rey
và
cộng
sự.
(2016) Lara
và
cộng
sự.
(2014) Burgos
và
cộng
sự.
(2018) Fernandes
và
cộng
sự.
(2018) Asif
et
al.
(2017) Xing
et
al.
(2015) Tác
giả
Các yếu tố ảnh hưởng đến thành tích của học sinh trong giáo dục đại học:…
Machine Translated by Google
1 3
RP323 RP277 RP220 RP198 RP174 RP142 RP136 RP130 RP128 RP127 RP123 ID
giấy Bảng
11
(tiếp
theo)
khoa
học
trực
tiếp EBSCO ProQuest khoa
học
trực
tiếp ProQuest khoa
học
trực
tiếp Google
học
giả Google
học
giả Google
học
giả Google
học
giả Google
học
giả Nguồn
Máy
tính
và
Giáo
dục Tạp
chí
AI
và
Khai
thác
dữ
liệu Tạp
chí
Quốc
tế
về
Công
nghệ
Thông
tin
và
Học
tập Máy
tính
và
Giáo
dục Hội
nghị
quốc
tế
về
công
nghệ
thông
tin
và
truyền
thông
số Máy
tính
và
Giáo
dục Tạp
chí
Thế
giới
Khoa
học
Máy
tính
và
Công
nghệ
Thông
tin Tạp
chí
quốc
tế
về
công
nghệ
đổi
mới
và
kỹ
thuật
sáng
tạo Tạp
chí
Quốc
tế
về
Khoa
học
Máy
tính
và
Bảo
mật
Thông
tin Tạp
chí
Quốc
tế
về
Khoa
học
Máy
tính
và
Công
nghệ
Thông
tin Tạp
chí
Thế
giới
về
Công
nghệ
và
Ứng
dụng
Máy
tính tạp
chí
và
ứng
dụng
của
nó
Hoàng
và
Phương
(2013) Hasheminejad
và
Sarvmili
(2018) Chamizo-
Gonzalez
và
cộng
sự.
(2015) Cerezo
et
al.
(2016) Châu
và
cộng
sự.
(2015) Araque
et
al.
(2009) Yadav
Và
Pal
(2012) Yadav
và
cộng
sự.
(2012) Bhardwaj
và
Pal
(2012) Pandey
và
Pal
(2011) Badr
El
Din
Ahmed
và
Sayed
Elaraby
(2014) Tác
giả
A. Abu Saa và cộng sự.
Machine Translated by Google
Machine Translated by Google
Các yếu tố ảnh hưởng đến thành tích của học sinh trong giáo dục đại học:…
RP10 1 1 1 1 1 0 1 1 1 số 8 88,89
RP22 1 1 1 1 1 0 1 1 1 số 8 88,89
RP12 1 1 1 1 1 0 0 1 1 7 77,78
RP75 1 1 1 1 1 0 0 1 1 7 77,78
RP174 1 1 1 1 1 0 0 1 1 7 77,78
1 3
1 3
RP9 RP7 RP5 RP2 RP1 Danh
mục
yếu
tố
ID
giấy Bảng
13
Tóm
tắt
các
yếu
tố
ảnh
hưởng
đến
hiệu
suất
của
học
sinh
và
các
phương
pháp
và
kỹ
thuật
khai
thác
dữ
liệu
được
sử
dụng
Hoạt
động
e-
Learning
của
học
sinh Hoạt
động
e-
Learning
của
học
sinh 1.
Môi
trường
của
học
sinh
2.
Nhân
khẩu
học
của
học
sinh
3.
Các
lớp
trước
đây
của
học
sinh
và
kết
quả
học
tập
của
lớp của
Điểm
học
sinh
trước
đây
và
kết
quả
học
tập
của
lớp
trung
Điểm
học
phổ
thông
(tổng
cộng
và
môn
học
cụ
thể) Hoạt
động
e-
Learning
của
học
sinh
cây
chùy
Số
lần
mà
học
sinh
đã
hình
dung Tài
nguyên
đã
được
trực
quan
hóa
hay
chưa Số
ngày
khác
nhau
trong
tuần
mà Số
lượt
truy
cập
lớp
học
ảo
của lịch
giảng
dạy Vắng
mặt số
Điểm
trong
2
tháng
đầu
tiên các
Điểm
khóa
học
đại
học
năm
thứ
nhất
và
năm
thứ
hai WhiteBoard
ghi
nhật
ký
các
hành
động
cụ
thể
hơn
về
cách Nhật
ký
Geogebra
thông
tin
về
cách
học
sinh Hồ
sơ
nhận
thức
về
hành
động
xóa
cuộc
trò
chuyện Nhật
ký
trò
chuyện
của
tất
cả
các
tin
nhắn
mà
sinh
viên
gửi
đến Các
yếu
tố
được
tìm
thấy
có
ý
nghĩa
Tuổi Nơi
cư
trú
của
học
sinh
t
—
phố
hành Những
môn
học
ở
trường Tên
trường Nơi
cư
trú
của
học
sinh
kphố
— hu Nhật
ký
hệ
thống
của
sinh
viên
tham
gia
một
phòng
ảo,
12
Hoạt
động
đánh
giá
từ
hệ
thống
e-
Learning
tài
nguyên
trong
tuần
được
đề
cập trong
tuần
trong
câu
hỏi học
sinh
trong
tuần
được
đề
cập
học
sinh
truy
cập
lớp
học
ảo chẳng
hạn
như
thay
đổi
kích
thước
đối
tượng
hoặc
tạo
hộp
văn
bản
ảo
xây
dựng
tạo
phẩm
hình
học
(thêm
điểm
hoặc
cập
nhật
phân
đoạn)
rời
khỏi
phòng
ảo
hoặc
xem
các
công
cụ
tab
khác
nhau
đang
được
sử
dụng
trong
khu
vực
bảng
trắng tin
nhắn
trên
thanh
trò
chuyện nhau
trong
nhóm
phân
loại phân
loại 1.
Phân
loại
2.
Phân
loại
theo
cụm phân
loại Phương
pháp
khai
thác
dữ
liệu
(Các)
loại
dữ
liệu
Nhật
ký
hệ
thống
e-
Learning Nhật
ký
hệ
thống
e-
Learning Dữ
liệu
hệ
thống
thông
tin
sinh
viên dữ
liệu
tuyển
sinh Nhật
ký
hệ
thống
e-
Learning
A. Abu Saa và cộng sự.
Machine Translated by Google
1 3
RP12
1.
Thuộc
tính
của
người
hướng
dẫn 2.
trước
Điểm
của
học
sinh
và
lớp
thực
hiện
RP10
1.
Thuộc
tính
của
người
hướng
dẫn Danh
mục
yếu
tố
ID
giấy Bảng
13
(tiếp
theo)
2.
Thuộc
tính
khóa
học 3.
Thuộc
tính
khóa
học
cây
chùy
Tham
dự
(số
lượng
đánh
giá
nhận
được Các
bài
kiểm
tra
phản
ánh
tài
liệu
khóa
học
tốt
như
thế
nào góp
Đóng
của
bài
tập
cho
sự
hiểu
biết
về Khó
khăn
của
các
khái
niệm
bao
phủ Mối
quan
hệ
giáo
sư-
lớp Thái
độ
của
giáo
viên
đối
với
việc
giảng
dạy Sự
khuyến
khích
của
người
hướng
dẫn
để
suy
nghĩ
độc
lập Trình
bày
trực
quan
của
giáo
viên Giáo
viên
trả
lời
câu
hỏi Tổ
chức
của
người
hướng
dẫn
và
sự
rõ
ràng Giảng
viên
giải
thích
về
khóa
học
và Giáo
viên
sẵn
sàng
cho
các
lớp
học Cách
tiếp
cận
tích
cực
của
giáo
viên
đối
với
học
sinh Sự
gắn
kết
của
giáo
viên
với
giáo
án Giáo
viên
sử
dụng
hiệu
quả
giờ
học Kiến
thức
của
giảng
viên Các
yếu
tố
được
tìm
thấy
có
ý
nghĩa
Sự
cởi
mở
và
tôn
trọng
của
người
hướng
dẫn
đối
với
sinh
viên
khái
niệm
chia
theo
khóa
học
đăng
ký) sâu
sắc sự
hữu
ích
của
người
hướng
dẫn quan
điểm
của
vết
lõm
phân
loại phân
loại Phương
pháp
khai
thác
dữ
liệu
(Các)
loại
dữ
liệu
Khảo
sát
đánh
giá
khóa
học Khảo
sát
đánh
giá
khóa
học
Các yếu tố ảnh hưởng đến thành tích của học sinh trong giáo dục đại học:…
Machine Translated by Google
1 3
RP23
Hoạt
động
học
trực
tuyến
của
học
sinh RP22
1.
Học
sinh
lớp
trước
và
lớp
thực
hiện RP16
1.
Học
sinh
lớp
trước
và
lớp
thực
hiện Danh
mục
yếu
tố
ID
giấy Bảng
13
(tiếp
theo)
2.
Nhân
khẩu
học
của
sinh
viên
3.
Dữ
liệu
xã
hội
của
sinh
viên 2.
Nhân
khẩu
học
của
sinh
viên
3.
Dữ
liệu
xã
hội
của
sinh
viên
cây
chùy cây
chùy
lớp
cuối
cùng Tổng
số
lần
đăng
nhập Số
tin
nhắn
trò
chuyện Số
lượng
các
câu
hỏi Trình
độ
học
vấn
của
mẹ Có
một
công
việc Tham
dự
trong
các
buổi
sáng
buổi
tối / Số
học
sinh
trong
nhóm/
lớp Lớp
học/
nhóm
đăng
ký trung
Điểm
bình
ở
trường
trung
học Thời
gian
làm
bài
tập Tình
trạng
hôn
nhân Số
anh
chị
em trung
Điểm
bình
ở
trường
trung
học Mức
độ
động
lực Các
yếu
tố
được
tìm
thấy
có
ý
nghĩa
Dữ
liệu
hoạt
động
của
học
sinh
từ
một
video
trực
tuyến Tuổi học
nhóm thói
quen
hút
thuốc lớp
học/
nhóm Tuổi số
Điểm
trong
các
môn
học
cụ
thể
hệ
thống
học
trực
tuyến
1.
Phân
loại
2.
Phân
cụm phân
loại phân
loại Phương
pháp
khai
thác
dữ
liệu
(Các)
loại
dữ
liệu
Nhật
ký
hệ
thống
e-
Learning 1.
Khảo
sát
2.
Dữ
liệu
hệ
thống
thông
tin
sinh
viên 1.
Khảo
sát
2.
Dữ
liệu
hệ
thống
thông
tin
sinh
viên
A. Abu Saa và cộng sự.
Machine Translated by Google
1 3
Danh
mục
yếu
tố
ID
giấy Bảng
13
(tiếp
theo)
2.
Nhân
khẩu
học
của
sinh
viên
3.
giá
Đánh
khóa
học
RP25
1.
Hoạt
động
học
trực
tuyến
của
sinh
viên
2.
Nhân
khẩu
học
của
sinh
viên:
tuổi,
giới
tính,
tốt
nghiệp Số
lượng
trung
bình
của
các
mục
thảo
luận
trên
mỗi 1.
Hoạt
động
e-
Learning
của
sinh
viên
Tần
suất
đăng
nhập
trung
bình
trên
mỗi
khóa
học
Tần
suất
truy
cập
tab
trung
bình
trên
mỗi
khóa
học
Tần
suất
trung
bình
của
mô-
đun
được
truy
cập
trên
mỗi
khóa
học
Tần
suất
nhấp
chuột
trung
bình
trên
mỗi
khóa
học
Tần
suất
truy
cập
trung
bình
của
khóa
học
trên
mỗi
khóa
học
Tần
suất
trung
bình
của
trang
được
truy
cập
trên
mỗi
khóa
học
Tần
suất
trung
bình
của
mỗi
khóa
học
nội
dung
khóa
học
được
truy
cập Các
yếu
tố
được
tìm
thấy
có
ý
nghĩa
năm
học,
thành
phố,
học
khu,
số
khóa
học
trực
tuyến
đã
học,
số
khóa
học
trực
tuyến
đạt,
số
khóa
học
trực
tuyến
không
đạt
và
điểm
trung
bình
cuối
kỳ
số
khóa
học
không
đạt,
số
khóa
học
đạt,
trung
bình
tỷ
lệ
đỗ
của
từng
học
sinh
cho
tất
cả
các
khóa
học
trong
năm
học
2009–
2010
3.
Thông
tin
về
học
sinh:
số
khóa
học
đã
học,
bài
tập
viết
thứ
2
Bài
tập
viết
thứ
3
Bài
tập
viết
thứ
4
RP28
trước
Điểm
đó
của
học
sinh
và
thành
tích
học
tập
trong
lớp
Bài
tập
viết
đầu
tiên khóa
học mỗi
khóa
học
phân
loại 1.
Phân
loại
2.
Phân
cụm Phương
pháp
khai
thác
dữ
liệu
(Các)
loại
dữ
liệu
Dữ
liệu
hệ
thống
thông
tin
sinh
viên 1.
Nhật
ký
hệ
thống
e-
Learning
2.
Dữ
liệu
hệ
thống
thông
tin
sinh
viên
3.
Khảo
sát
đánh
giá
khóa
học
Các yếu tố ảnh hưởng đến thành tích của học sinh trong giáo dục đại học:…
Machine Translated by Google
1 3
RP34
Hoạt
động
học
trực
tuyến
của
học
sinh RP33
Hoạt
động
học
trực
tuyến
của
học
sinh Danh
mục
yếu
tố
ID
giấy Bảng
13
(tiếp
theo)
Bằng
cấp
uy
tín
của
học
viên Mức
độ
trung
tâm
của
học
sinh trung
Điểm
bình
đánh
giá
của
giáo
viên
hướng
dẫn
về Số
chữ
học
sinh
viết Số
lượng
tin
nhắn
được
viết
bởi
học
sinh Tổng
thời
gian
tính
bằng
giây
mà
người
dùng
đã
sử
dụng Số
câu
đố
không
thành
công
bởi
người
dùng Số
lượng
câu
đố
được
người
dùng
thông
qua Số
câu
hỏi
mà
người
dùng
đã
xem Tổng
thời
gian
tính
bằng
giây
mà
người
dùng
đã
sử
dụng Số
lượng
tin
nhắn
được
đọc
bởi
người
dùng
trong Số
lượng
tin
nhắn
được
gửi
bởi
người
dùng
trong
diễn
đàn Tổng
thời
gian
tính
bằng
giây
mà
người
dùng
đã
sử
dụng Số
phần
của
khóa
học
được
thực
hiện
bởi
người
dùng Các
yếu
tố
được
tìm
thấy
có
ý
nghĩa
tin
nhắn
của
học
sinh phần
đố
vui phần
diễn
đàn diễn
đàn phần
bài
tập trong
khóa
học
1.
Phân
loại
2.
Phân
cụm phân
loại Phương
pháp
khai
thác
dữ
liệu
(Các)
loại
dữ
liệu
Nhật
ký
hệ
thống
e-
Learning Nhật
ký
hệ
thống
e-
Learning
A. Abu Saa và cộng sự.
Machine Translated by Google
1 3
RP43
1.
Học
sinh
lớp
trước
và
lớp
thực
hiện RP36
Hoạt
động
học
trực
tuyến
của
học
sinh RP35
giá
Đánh
khóa
học Danh
mục
yếu
tố
ID
giấy Bảng
13
(tiếp
theo)
2.
Nhân
khẩu
học
sinh
cây
chùy
Chuỗi
thời
gian
truy
cập
của
sinh
viên
Số
lần
nhấp
trên
mỗi
khóa
học.
Bài
tập
viết
thứ
4
Bài
tập
viết
thứ
3 Sự
phù
hợp
của
giảng
đường danh
sách
đọc
theo
quy
định Tỷ
lệ
khối
lượng
công
việc-
tín
dụng Sự
sẵn
có
của
giảng
viên
trong
lớp Khả
năng
động
viên
của
giáo
viên Sự
sẵn
có
của
giảng
viên
bên
ngoài
lớp
học Chương
trình
tổ
chức
dạy
học Khối
lượng
công
việc
của
chương
trình Các
yếu
tố
được
tìm
thấy
có
ý
nghĩa
Mức
độ
hài
lòng
chung
của
lớp Học
sinh
quan
tâm
đến
chủ
đề lịch
Đúng
trình
với
chương
trình giảng
dạy
rõ
ràng Kiến
thức
trước
đây
của
học
sinh
về
chủ
đề Thể
lệ
thi
rõ
ràng Giữ
giờ
đã
lên
lịch
phân
loại phân
loại phân
loại Phương
pháp
khai
thác
dữ
liệu
(Các)
loại
dữ
liệu
Dữ
liệu
hệ
thống
thông
tin
sinh
viên Nhật
ký
hệ
thống
e-
Learning Khảo
sát
đánh
giá
khóa
học
Các yếu tố ảnh hưởng đến thành tích của học sinh trong giáo dục đại học:…
Machine Translated by Google
1 3
RP69
1.
Nhân
khẩu
học
của
sinh
viên 2.
Dữ
liệu
trải
nghiệm
của
học
sinh
RP67
1.
Nhân
khẩu
học
của
học
sinh RP44
Hoạt
động
học
trực
tuyến
của
học
sinh Danh
mục
yếu
tố
ID
giấy Bảng
13
(tiếp
theo)
2.
Học
sinh
lớp
trước
và
lớp
thực
hiện
cây
chùy
Hiệu
suất Cốt
lõi
so
với
tự
chọn Sự
tham
dự điểm
tiếng
anh tham
quan
tư
vấn Số
môn
đăng
ký trung
Điểm
bình
trước
đây Chuyên
ngành
ở
trường
trung
học lớp
trung
học Giới
tính Kiến
thức
trước
đây Công
nghệ
trực
tuyến
tự
hiệu
quả Giới
tính Kinh
nghiệm
trực
tuyến
trước
đây Sẵn
sàng
học
tập
trực
tuyến Tổng
thời
gian
xem
tài
liệu
của
khóa
học
(theo
tài
liệu Thời
gian
trung
bình
tài
liệu
được
xem
(s) Số
lần
đăng
nhập #
Tài
liệu
khóa
học
đã
xem
(theo
danh
mục
tài
liệu)/ Số
tài
liệu
khóa
học
đã
xem Tổng
thời
gian
tài
liệu
đã
xem
(s) Thời
gian
trung
bình
mỗi
phiên
(s) Số
tài
liệu
khóa
học
đã
xem
(theo
tài
liệu Tổng
thời
gian
trực
tuyến
(s) Các
yếu
tố
được
tìm
thấy
có
ý
nghĩa
Thơi
gian
ho c Nhà
tài
trợ Tuổi
thể
loại)
(s)
số
lượng
tài
liệu
Khóa
học
được
phát
hành
cho
đến
nay
thể
loại)
(s)
phân
loại phân
loại phân
loại Phương
pháp
khai
thác
dữ
liệu
(Các)
loại
dữ
liệu
khảo
sát khảo
sát Nhật
ký
hệ
thống
e-
Learning
A. Abu Saa và cộng sự.
Machine Translated by Google
1 3
RP113
Hoạt
động
học
trực
tuyến
của
học
sinh Hoạt
động
học
trực
tuyến
của
học
sinh
RP94 RP81 RP75
1.
Nhân
khẩu
học
của
sinh
viên Danh
mục
yếu
tố
ID
giấy Bảng
13
(tiếp
theo)
3.
Dữ
liệu
xã
hội
của
sinh
viên 1.
Nhân
khẩu
học
của
học
sinh
2.
Học
sinh
lớp
trước
và
kết
quả
học
tập
của
lớp 3.
Dữ
liệu
xã
hội
của
sinh
viên 2.
Học
sinh
lớp
trước
và
lớp
thực
hiện
cây
chùy cây
chùy
#
Thư
đã
đọc #
Thông
báo
thảo
luận
mới
được
đăng #
Liên
kết
web
đã
xem #
Tin
nhắn
thảo
luận
đã
đọc #
Bài
tập
đã
nộp #
Thư
đã
gửi #
Trả
lời
tin
nhắn
thảo
luận
đã
đăng #
bắt
đầu
đánh
giá #
giá
Đánh
kết
thúc #
Tệp
đã
xem Tổng
thời
gian
trực
tuyến Tổng
số
buổi
trực
tuyến Tổng
số
#
bài
thảo
luận
đã
đăng Số
bài
đăng
trên
diễn
đàn Số
bài
tập
đã
thực
hiện Tương
tác
với
đồng
nghiệp Hiệu
suất
bài
tập lớp
trung
học Sự
tham
dự Quy
mô
gia
đình danh
mục
sinh
viên Thu
nhập
hàng
năm
của
gia
đình học
Điểm
kỳ
trước Giảm
giá Tình
trạng
nghề
nghiệp
của
mẹ lớp
trung
học Giới
tính Các
yếu
tố
được
tìm
thấy
có
ý
nghĩa
phân
loại phân
loại phân
loại phân
loại Phương
pháp
khai
thác
dữ
liệu
(Các)
loại
dữ
liệu
Nhật
ký
hệ
thống
e-
Learning Nhật
ký
hệ
thống
e-
Learning không
được
báo
cáo khảo
sát
Các yếu tố ảnh hưởng đến thành tích của học sinh trong giáo dục đại học:…
Machine Translated by Google
1 3
RP142
1.
Nhân
khẩu
học
sinh RP128
1.
Nhân
khẩu
học
của
sinh
viên Nhân
khẩu
học
sinh
viên
RP127 RP123
1.
Nhân
khẩu
học
của
sinh
viên RP120
học
Điểm
kỳ
trước
và
thành
tích
học
tập
của
học
sinh
học
Điểm
kỳ
trước Danh
mục
yếu
tố
ID
giấy Bảng
13
(tiếp
theo)
3.
Dữ
liệu
xã
hội
của
sinh
viên 2.
Học
sinh
lớp
trước
và
lớp
thực
hiện 3.
Dữ
liệu
xã
hội
của
sinh
viên 2.
Học
sinh
lớp
trước
và
lớp
thực
hiện 2.
Học
sinh
lớp
trước
và
lớp
thực
hiện
cây
chùy cây
chùy cây
chùy
năm
truy
cập chế
độ
vòng vòng
trung
bình Tỷ
lệ
kết
quả
học
tập trình
độ
học
vấn
của
mẹ trình
độ
học
vấn
của
bố Tình
trạng
thu
nhập
hàng
năm
của
gia
đình trình
độ
của
mẹ Phương
tiện
giảng
dạy địa
điểm
sinh
sống Bộ
phận
thu
được phương
tiện
ngôn
ngữ Sự
tham
dự chi
nhánh
trường
trung
học Bài
tập
về
nhà kiểm
Điểm
tra
phòng
thí
nghiệm điểm
giữa
kỳ Làm
việc
trong
phòng
thí
nghiệm Sự
tham
dự kiểm
Điểm
tra
trên
lớp Các
yếu
tố
được
tìm
thấy
có
ý
nghĩa
Tình
trạng
gia
đình
học
sinh Sinh
viên
có
thói
quen
khác Học
sinh
xếp
loại
giáo
dục
trung
học
phổ
thông Dòng
cử
nhân Giới
tính biểu
diễn
hội
thảo Sinh
viên
thực
hành Phân
công
phân
loại phân
loại phân
loại phân
loại phân
loại Phương
pháp
khai
thác
dữ
liệu
(Các)
loại
dữ
liệu
khảo
sát khảo
sát Dữ
liệu
hệ
thống
thông
tin
sinh
viên Dữ
liệu
hệ
thống
thông
tin
sinh
viên Dữ
liệu
hệ
thống
thông
tin
sinh
viên
A. Abu Saa và cộng sự.
Machine Translated by Google
1 3
RP277
Hoạt
động
học
trực
tuyến
của
học
sinh RP220
Hoạt
động
học
trực
tuyến
của
học
sinh RP198
Hoạt
động
học
trực
tuyến
của
học
sinh RP174
Dữ
liệu
xã
hội
của
sinh
viên Danh
mục
yếu
tố
ID
giấy Bảng
13
(tiếp
theo)
Tổng
thời
gian
sử
dụng
trên
diễn
đàn Tổng
thời
gian
sử
dụng
cho
các
câu
đố Tổng
thời
gian
sử
dụng
cho
bài
tập Số
lượng
tin
nhắn
được
đọc
trên
các
diễn
đàn Số
lượng
tin
nhắn
gửi
đến
diễn
đàn Số
câu
hỏi
không
thành
công Số
câu
hỏi
đã
qua Số
bài
đã
làm Mã
số
khóa
học Chế
độ
xem
tài
nguyên diễn
đàn
xem
diễn
đàn Chế
độ
xem
khóa
học Bài
tập
xem
tất
cả Chế
độ
xem
bài
tập Diễn
đàn
xem
thảo
luận bài
cập
nhật
diễn
đàn Diễn
đàn
thêm
bài Tải
lên
bài
tập diễn
đàn
Số
lượng
từ
trong
bài
viết Thời
gian
thực
hiện
nhiệm
vụ
kể
từ
khi
nhiệm
vụ Tổng
thời
gian
dành
cho
các
nhiệm
vụ
thực
tế Thời
lượng
xem
video
trực
tuyến Số
lượng
bản
ghi
trên
mỗi
loại
trang
web Các
yếu
tố
được
tìm
thấy
có
ý
nghĩa
của
Điểm
học
sinh
về
toán
cao
cấp
đã
có
sẵn
trong
LE
phân
loại phân
loại phân
cụm phân
loại Phương
pháp
khai
thác
dữ
liệu
(Các)
loại
dữ
liệu
Nhật
ký
hệ
thống
e-
Learning Nhật
ký
hệ
thống
e-
Learning Nhật
ký
hệ
thống
e-
Learning Nhật
ký
truy
cập
mạng
Các yếu tố ảnh hưởng đến thành tích của học sinh trong giáo dục đại học:…
Machine Translated by Google
1 3
RP323
trước
Điểm
đó
của
học
sinh
và
thành
tích
học
tập
trên
lớp
trung
Điểm
bình
tích
lũy Danh
mục
yếu
tố
ID
giấy Bảng
13
(tiếp
theo)
Dynamics
giữa
kỳ
thi
số
3 Dynamics
giữa
kỳ
thi
số
2 Dynamics
giữa
kỳ
thi
số
1 lớp
vật
lý Giải
tích
lớp
II Giải
tích
lớp
I lớp
thống
kê Các
yếu
tố
được
tìm
thấy
có
ý
nghĩa
phân
loại Phương
pháp
khai
thác
dữ
liệu
(Các)
loại
dữ
liệu
Dữ
liệu
hệ
thống
thông
tin
sinh
viên
A. Abu Saa và cộng sự.
Machine Translated by Google
1 3
đánh
giá
khóa
học thuộc
tính
khóa
học thuộc
tính
người
hướng
dẫn Loại Bảng
14
Mô
tả
các
loại
yếu
tố
(mở
rộng)
Sinh
viên
trải
nghiệm
thông
tin Thông
tin
xã
hội
sinh
viên nhân
khẩu
học
sinh
viên môi
trường
sinh
viên Học
sinh
trước
Điểm
và
lớp
thực
hiện Hoạt
động
e-
Learning
của
học
sinh
cây
chùy
Rp67 RP25,
RP35 RP16,
RP22,
RP75,
RP81,
RP128,
RP142,
RP174 RP10,
RP12 RP10,
RP12 RP5,
RP16,
RP22,
RP25,
RP43,
RP67,
RP69,
RP75,
RP81,
RP123,
RP127,
RP128,
RP142RP5 RP2,
RP5,
RP10,
RP16,
RP22,
RP28,
RP43,
RP69,
RP75,
RP81,
RP120,
RP123,
RP128,
RP142,
RP323
RP1,
RP7,
RP9,
RP23,
RP25,
RP33,
RP34,
RP36,
RP44,
RP94,
RP113,
RP198,
RP220,
RP277 giấy
tờ
Số
lượng
bài
viết
13 15 14
12722 1
Các yếu tố ảnh hưởng đến thành tích của học sinh trong giáo dục đại học:…
Machine Translated by Google
Machine Translated by Google
Abazeed, A., & Khder, M. (2017). Một mô hình phân loại và dự đoán cho hiệu suất của sinh viên trong trường đại học
trình độ thông thạo. Tạp chí Khoa học Máy tính, 13, 228–
233.
Abdous, M., He, W., & Yen, CJ (2012). Sử dụng khai thác dữ liệu để dự đoán mối quan hệ giữa chủ đề câu hỏi trực
tuyến và điểm cuối cùng. Công nghệ Giáo dục và Xã hội, 15(3), 77–88.
Abu Saa, A. (2016). Khai thác dữ liệu giáo dục và dự đoán hiệu suất của học sinh. Tạp chí Quốc tế về Khoa học Máy
tính Tiên tiến và Ứng dụng. https://doi.org/10.14569/IJACSA.2016.070531.
Abu Saa, A., Al-Emran, M., & Shaalan, K. (2019). Khai thác hồ sơ hệ thống thông tin sinh viên để dự đoán kết quả
học tập của sinh viên. Trong hội nghị quốc tế về ứng dụng và công nghệ học máy tiên tiến (trang 229–239). Béc-
lin: Mùa xuân.
Al-Emran, M., Mezhuyev, V., Kamaludin, A., & Shaalan, K. (2018). Tác động của các quy trình quản lý tri thức đối
với các hệ thống thông tin: Đánh giá có hệ thống. Tạp chí Quốc tế về Quản lý Thông tin, 43, 173–187.
Al-Qaysi, N., Mohamad-Nordin, N., & Al-Emran, M. (2018). Một đánh giá có hệ thống về sự chấp nhận của phương tiện
truyền thông xã hội từ quan điểm của các lý thuyết và mô hình hệ thống thông tin và giáo dục. Tạp chí Nghiên
cứu Máy tính Giáo dục. https://doi.org/10.1177/0735633118817879.
Anuradha Bharathiar, C., & Velmurugan, T. (2015). Phân tích so sánh đánh giá các thuật toán phân loại trong dự
đoán kết quả học tập của sinh viên. Tạp chí Khoa học và Công nghệ Ấn Độ. https://doi.org/10.17485/ijst/2015/
v8i.
Araque, F., Rolddsán, C., & Salguero, A. (2009). Các yếu tố ảnh hưởng đến tỷ lệ bỏ học đại học. máy tính
ers và Giáo dục. https://doi.org/10.1016/j.compedu.2009.03.013.
Asif, R., Merceron, A., Ali, SA, & Haider, NG (2017). Phân tích hiệu suất của sinh viên đại học bằng cách sử dụng
khai thác dữ liệu giáo dục. Máy tính và Giáo dục. https://doi.org/10.1016/j.compe du.2017.05.007.
Badr El Din Ahmed, A., Sayed Elaraby, I., & Sayed Elaraby, I. (2014). Khai thác dữ liệu: Một dự đoán cho hiệu suất
của sinh viên bằng cách sử dụng phương pháp phân loại. Tạp chí Thế giới về Ứng dụng Máy tính và Công nghệ.
https://doi.org/10.13189/wjcat.2014.020203.
Bakhshinategh, B., Zaiane, OR, ElAtia, S., & Ipperciel, D. (2018). Các ứng dụng và nhiệm vụ khai thác dữ liệu
giáo dục: Một cuộc khảo sát trong 10 năm qua. Giáo dục và Công nghệ thông tin. https://doi. org/10.1007/
s10639-017-9616-z.
Baradwaj, B., & Pal, S. (2012). Khai thác dữ liệu giáo dục để phân tích hiệu suất của học sinh. Quốc tế
Tạp chí Khoa học Máy tính Cao cấp và Ứng dụng, 2(6), 63–
69.
Berland, M., Baker, RS, & Blikstein, P. (2014). Khai thác dữ liệu giáo dục và phân tích học tập: Các ứng dụng cho
nghiên cứu xây dựng. Công nghệ, Kiến thức và Học tập. https://doi.org/10.1007/
s10758-014-9223-7.
Bhardwaj, BK, & Pal, S. (2012). Khai thác dữ liệu: Một dự đoán để cải thiện hiệu suất bằng cách sử dụng clas
sifcation. (IJCSIS) Tạp chí Quốc tế về Khoa học Máy tính và Bảo mật Thông tin, 9(4), 1–
5.
Burgos, C., Campanario, ML, de la Peña, D., Lara, JA, Lizcano, D., & Martínez, MA (2018). Khai thác dữ liệu để mô
hình hóa hiệu suất của học sinh: Kế hoạch hành động dạy kèm để ngăn chặn học sinh bỏ học.
Máy tính và Kỹ thuật điện. https://doi.org/10.1016/j.compeleceng.2017.03.005.
Cerezo, R., Sánchez-Santillán, M., Paule-Ruiz, MP, & Núñez, JC (2016). Các mẫu tương tác LMS của học sinh và mối
quan hệ của chúng với thành tích: Một nghiên cứu tình huống trong giáo dục đại học. Máy tính và Giáo dục.
https://doi.org/10.1016/j.compedu.2016.02.006.
Chamizo-Gonzalez, J., Cano-Montero, EI, Urquia-Grande, E., & Muñoz-Colomina, CI (2015). Khai thác dữ liệu giáo dục
để cải thiện kết quả học tập trong giảng dạy kế toán trong giáo dục đại học. Tạp chí Quốc tế về Công nghệ
Thông tin và Học tập. https://doi.org/10.1108/IJILT
-08-2015-0020.
Costantini, P., Linting, M., & Porzio, GC (2010). Khai thác dữ liệu hiệu suất thông qua PCA phi tuyến tính với tỷ
lệ tối ưu. Các mô hình ngẫu nhiên ứng dụng trong kinh doanh và công nghiệp. https://doi.org/10.1002/ asmb.771.
Fernandes, E., Holanda, M., Victorino, M., Borges, V., Carvalho, R., & Van Erven, G. (2018). Khai thác dữ liệu
giáo dục: Phân tích dự đoán kết quả học tập của học sinh trường công lập ở thủ đô của Brazil. Tạp chí Nghiên
cứu Kinh doanh. https://doi.org/10.1016/j.jbusres.2018.02.012.
Gamulin, J., Gamulin, O., & Kermek, D. (2016). Sử dụng hệ số Fourier trong phân tích chuỗi thời gian để dự đoán
hiệu suất của học sinh trong môi trường học tập kết hợp. Những hệ thống chuyên gia. https://doi. org/10.1111/
exsy.12142.
Gómez-Rey, P., Fernández-Navarro, F., & Barberà, E. (2016). Hồi quy thông thường theo mô hình hấp dẫn trong lĩnh
vực khai thác dữ liệu giáo dục. Những hệ thống chuyên gia. https://doi.org/10.1111/exsy.12138.
1 3
Machine Translated by Google
Các yếu tố ảnh hưởng đến thành tích của học sinh trong giáo dục đại học:…
Hasheminejad, SM, & Sarvmili, M. (2018). S3PSO: Dự đoán hiệu suất của học sinh dựa trên parti
tối ưu hóa bầy đàn rõ ràng. Tạp chí AI và Khai thác dữ liệu, 7, 77–
96.
Hu, Y.-H., Lo, C.-L., & Shih, S.-P. (2014). Phát triển hệ thống cảnh báo sớm dự đoán kết quả học tập trực tuyến của học sinh.
Huang, S., & Fang, N. (2013). Dự đoán kết quả học tập của sinh viên trong khóa học động lực kỹ thuật: So sánh bốn loại mô
Hung, J., Hsu, Y.-C., & Rice, K. (2012). Tích hợp khai thác dữ liệu trong đánh giá chương trình giáo dục trực tuyến K-12.
Jiang, YH, Javaad, SS, & Golab, L. (2016). Khai thác dữ liệu đánh giá khóa học đại học. Infor matics trong Giáo dục. https://
doi.org/10.15388/infedu.2016.05.
Kitchenham, B., & Charters, S. (2007). Hướng dẫn thực hiện đánh giá tài liệu có hệ thống trong công nghệ phần mềm (trang 1–
57). Nhóm Kỹ thuật Phần mềm, Trường Khoa học Máy tính và Toán học, Đại học Keele.
Kitchenham, B., Pearl Brereton, O., Budgen, D., Turner, M., Bailey, J., & Linkman, S. (2009). Đánh giá tài liệu theo chủ đề
hệ thống trong công nghệ phần mềm: Đánh giá tài liệu có hệ thống. Công nghệ thông tin và phần mềm. https://doi.org/
10.1016/j.infsof.2008.09.009.
Kotsiatis, SB (2012). Sử dụng các kỹ thuật học máy cho các đề xuất giáo dục: Một hệ thống cổng hỗ trợ quyết định để dự đoán
điểm của học sinh. Đánh giá trí tuệ nhân tạo. https://doi.org/10.1007/ s10462-011-9234-x.
Kotsiantis, S., Patriarcheas, K., & Xenos, M. (2010). Một tập hợp gia tăng kết hợp của các lớp được coi là một kỹ thuật để
dự đoán hiệu suất của học sinh trong giáo dục từ xa. Hệ thống dựa trên tri thức. https://doi.org/10.1016/
j.knosys.2010.03.010.
Lara, JA, Lizcano, D., Martínez, MA, Pazos, J., & Riera, T. (2014). Hệ thống khám phá tri thức trong môi trường e-Learning
trong khu vực giáo dục đại học châu Âu: Ứng dụng cho dữ liệu sinh viên từ Đại học Mở Madrid, UDIMA. Máy tính và Giáo
Liberati, A., Altman, DG, Tetzlaf, J., Mulrow, C., Gøtzsche, PC, Ioannidis, J., et al. (2009). Tuyên bố PRISMA để báo cáo các
đánh giá có hệ thống và phân tích tổng hợp các nghiên cứu đánh giá các can thiệp chăm sóc sức khỏe: Giải thích và xây
Macfadyen, LP, & Dawson, S. (2010). Khai thác dữ liệu LMS để phát triển một “hệ thống cảnh báo sớm” cho các nhà giáo dục: Một
bằng chứng về khái niệm. Máy tính và Giáo dục. https://doi.org/10.1016/j.compe du.2009.09.008.
Márquez-Vera, C., Cano, A., Romero, C., Noaman, AYM, Mousa Fardoun, H., & Ventura, S. (2016).
Dự đoán bỏ học sớm bằng cách sử dụng khai thác dữ liệu: Một nghiên cứu trường hợp với học sinh trung học. Những hệ
Márquez-Vera, C., Cano, A., Romero, C., & Ventura, S. (2013). Dự đoán sự thất bại của học sinh ở trường bằng cách sử dụng lập
trình di truyền và các phương pháp khai thác dữ liệu khác nhau với dữ liệu không cân bằng và nhiều chiều. Trí tuệ ứng
dụng. https://doi.org/10.1007/s10489-012-0374-8.
Mwalumbwe, I., & Mtebe, JS (2017). Sử dụng phân tích học tập để dự đoán hiệu suất của sinh viên trong hệ thống quản lý học
tập tâm trạng: Trường hợp của Đại học khoa học và công nghệ Mbeya. Tạp chí điện tử Hệ thống thông tin ở các nước đang
Pandey, Vương quốc Anh, & Pal, S. (2011). Khai thác dữ liệu: Một dự đoán về người thực hiện hoặc kém hiệu quả bằng cách sử
dụng clas sifcation. Tạp chí Quốc tế về Khoa học Máy tính và Công nghệ Thông tin, 2, 686–
690.
Peña-Ayala, A. (2014). Khai thác dữ liệu giáo dục: Một cuộc khảo sát và phân tích dựa trên khai thác dữ liệu của các công
trình gần đây. Hệ thống chuyên gia với các ứng dụng. https://doi.org/10.1016/j.eswa.2013.08.042.
Romero, C., López, MA, Luna, JM, & Ventura, S. (2013). Dự đoán hiệu suất cuối cùng của sinh viên từ việc tham gia vào các
diễn đàn thảo luận trực tuyến. Máy tính và Giáo dục. https://doi. org/10.1016/j.compedu.2013.06.009.
Romero, C., & Ventura, S. (2007). Khai phá dữ liệu giáo dục: Khảo sát từ 1995 đến 2005. Expert Sys
Salloum, SA, Al-Emran, M., Shaalan, K., & Tarhini, A. (2019). Các yếu tố ảnh hưởng đến việc chấp nhận E-learning: Một trường
hợp nghiên cứu từ UAE. Giáo dục và Công nghệ thông tin, 24(1), 509–
530. https://doi.org/10.1007/s10639-018-9786-3.
Shahiri, AM, Husain, W., & Rashid, NA (2015). Đánh giá về dự đoán hiệu suất của học sinh bằng cách sử dụng các kỹ thuật khai
1 3
Machine Translated by Google
Wook, M., Yusof, ZM, & Nazri, MZA (2017). Sự chấp nhận khai thác dữ liệu giáo dục giữa các sinh viên chưa tốt nghiệp. Giáo dục và
Xing, W., Guo, R., Petakovic, E., & Goggins, S. (2015). Mô hình dự đoán hiệu suất cuối cùng của học sinh dựa trên sự tham gia
thông qua lập trình di truyền có thể diễn giải: Tích hợp phân tích học tập, khai thác dữ liệu giáo dục và lý thuyết. Máy
Yadav, S., Bharadwaj, B., & Pal, S. (2012). Các ứng dụng khai thác dữ liệu: Một nghiên cứu so sánh để dự đoán kết quả học tập của
học sinh. Tạp chí Quốc tế về Công nghệ Đổi mới và Kỹ sư Sáng tạo, 1, 13–19.
Yadav, SK, & Pal, S. (2012). Khai thác dữ liệu: Một dự đoán để cải thiện hiệu suất của sinh viên kỹ thuật sử dụng phân loại. Tạp
chí Khoa học Máy tính và Công nghệ Thông tin Thế giới WCSIT. https://doi.org/10.1142/9789812771728_0012.
Yukselturk, E., Ozekes, S., Türel, YK, Education, C., Ozekes, S., Türel, YK, et al. (2014). Dự đoán học sinh bỏ học: Ứng dụng
phương pháp khai thác dữ liệu trong chương trình giáo dục trực tuyến. Tạp chí Châu Âu về Mở, Khoảng cách và Học trực tuyến.
https://doi.org/10.2478/eurodl-2014-0008.
Zafra, A., & Ventura, S. (2012). Lập trình di truyền đa phiên bản để dự đoán hiệu suất của học sinh trong môi trường giáo dục dựa
Zhou, Q., Zheng, Y., & Mou, C. (2015). Dự đoán hiệu suất của sinh viên trong một khóa học trực tuyến từ các hành vi trực tuyến của
họ. Năm 2015, Hội nghị quốc tế lần thứ 5 về công nghệ thông tin số và truyền thông và ứng dụng, DICTAP 2015. https://doi.org/
10.1109/DICTAP.2015.7113173.
Ghi chú của nhà xuất bản Springer Nature vẫn giữ thái độ trung lập đối với các khiếu nại về quyền tài phán trong các bản đồ đã xuất
bản và các liên kết thể chế.
1 3