1. GameID: Số ID duy nhất cho mỗi trò chơi (số nguyên)
2. League Index: Đồng, Bạc, Vàng, Bạch kim, Kim cương, Cao thủ, Đại kiện tướng và các giải đấu Chuyên nghiệp được mã hóa từ 1-8 (Thông thường) 3. Tuổi: Tuổi của mỗi người chơi ( số nguyên) 4. HoursPerWeek: Số giờ chơi được báo cáo mỗi tuần (số nguyên) 5. TotalHours: Tổng số giờ chơi được báo cáo (số nguyên) 6. APM: Hành động mỗi phút (liên tục) 7. SelectByHotkeys: Số đơn vị hoặc tòa nhà được lựa chọn bằng phím nóng mỗi dấu thời gian (liên tục) 8. AssignToHotkeys: Số lượng đơn vị hoặc tòa nhà được gán cho các phím nóng trên mỗi dấu thời gian (liên tục) 9. UniqueHotkeys: Số lượng phím nóng duy nhất được sử dụng trên mỗi dấu thời gian (liên tục) 10. MinimapAttacks: Số hành động tấn công trên bản đồ nhỏ trên mỗi dấu thời gian (liên tục) 11. MinimapRightClicks: số lần nhấp chuột phải vào bản đồ nhỏ trên mỗi dấu thời gian (liên tục) 12. NumberOfPAC: Số PAC trên mỗi dấu thời gian (liên tục) 13. GapBetweenPAC: Thời lượng trung bình trong mili giây giữa các PAC (liên tục) 14. ActionLatency: Độ trễ trung bình từ khi bắt đầu một PAC đến hành động đầu tiên của chúng tính bằng mili giây (liên tục) 15. ActionsInPAC: Số lượng hành động trung bình trong mỗi PAC (liên tục) 16. TotalMapExplored: Số lượng trò chơi 24x24 lưới tọa độ được người chơi xem trên mỗi dấu thời gian (liên tục) 17. WorkerMade: Số lượng SCV, máy bay không người lái và đầu dò được đào tạo trên mỗi dấu thời gian (liên tục) 18. UniqueUnitsMade: Các hợp nhất duy nhất được thực hiện trên mỗi dấu thời gian (liên tục) 19. ComplexUnitsMade: Số lượng ma, kẻ phá hoại và thái dương cao được huấn luyện trên mỗi dấu thời gian (liên tục) 20. ComplexAbilitiesUsed: Các khả năng yêu cầu hướng dẫn nhắm mục tiêu cụ thể được sử dụng trên mỗi dấu thời gian (liên tục)
Các lệnh R sử dụng trong bài
1. read_csv(): đọc file .csv vào R-Studio. 2. which(): tìm kiếm các thông số thỏa mãn từ dữ liệu cho trước. 3. is.na(): kiếm tra dữ liệu đó có mang giá trị N/A hay không. 4. mean(): tính trung bình của mẫu. 5. hist(): vẽ biểu đồ phân phối của một biến. 6. plot(): vẽ biểu đồ 7. pairs(): vẽ biểu đồ liên hệ giữa các biến. 8. view(): hiển thị giá trị của biến. 9. lm(): tính toán các giá trị hệ số của đường hồi quy. 10. summary(): liệt kê các giá trị tính toán của mô hình. 11.apply(): áp dụng một hàm trên một mảng, ma trận hoặc khung dữ liệu 12. predict(): sử dụng một mô hình phù hợp để dự đoán các giá trị phản hồi cho một tập dữ liệu mới. 13.step(): Chọn một mô hình dựa trên công thức của AIC. 14.aictab(): Tạo bảng lựa chọn mô hình dựa trên các tiêu chí: AIC, AICc, …