Professional Documents
Culture Documents
Báo Cáo Nhóm 7 - Bu I 3
Báo Cáo Nhóm 7 - Bu I 3
Yêu cầu
1) Sử dụng các công cụ sau của Orange để thực hiện tiền xử lý và hiển thị kết
quả cho dữ liệu:
+ Select Columns, Select Rows, Preprocess, Edit Domain.
+ Các biểu đồ trong Visualize
2) Từ các kết quả hiển thị ở trên, có những kết luận gì từ dữ liệu liên quan đến
bài toán cần giải quyết.
Bài làm
1)
2)
Tổng số công ty được thu thập dữ liệu: 777.
Để giải quyết bài toán: Dự đoán các công ty đáng ngờ trước khi kiểm tra
thực địa để điều tra gian lận một cách tối đa hóa. Nhóm tiến hành phân tích dữ
liệu nguồn, sử dụng một số đồ thị và đưa ra một số kết luận như sau.
Biểu đồ phân phối dữ liệu nguồn (Distributions)
+ Đầu tiên, nhóm phân tích thuộc tính liên quan đến sự khác biệt trong kế
hoạch chi tiêu được tìm thấy trong cuộc thanh tra và báo cáo tóm tắt A.
Biểu đồ cho thấy các công ty không gian lận thì sự khác biệt thường <
2.0000 Rs (chiếm 37,37% trên tổng).
+ Tiếp theo nhóm phân tích thuộc tính liên quan đến sự khác biệt trong kế
hoạch chi tiêu được tìm thấy trong cuộc thanh tra và báo cáo tóm tắt B.
Biểu đồ cho thấy các công ty không gian lận thì sự khác biệt thường <
50.0000 Rs (chiếm 37,37% trên tổng).
+ Tiếp theo, nhóm phân tích thuộc tính liên quan đến tổng rủi ro khi sử
dụng thủ thủ tục phân tích. Biểu đồ cho thấy các công ty không gian lận thì
sự khác biệt < 2.2 (chiếm 37,37% trên tổng).
+ Cuối cùng là thuộc tính phân loại rủi ro đối với 1 tình huống kiểm toán.
Số công ty gian lận là 486 (chiếm 62,63% trên tổng).
+ Điều đó cho thấy: Khi có chênh lệch của các báo cáo thì chủ thể có khả
năng gian lận, đồng thời Tổng rủi ro khi phân tích dữ liệu thu thập có giá
trị >2.1 thì chủ thể cũng có khả năng gian lận.
Biểu đồ phân phối dữ liệu hoàn chỉnh
+ KHÁC BIỆT CHI TIÊU A: Theo như dữ liệu đã được xử lý, các công ty
càng gian lận sẽ có Para A (Sự khác biệt trong kế hoạch chi tiêu được tìm
thấy trong cuộc thanh tra và báo cáo tóm tắt A tính bằng Rs) càng lớn. Cụ
thể là các công ty có tần suất Para A cao nhất là trong khoảng dưới 50 triệu
Rb (chiếm 79.2%, 385 công ty trong tổng số 486 công ty gian lận). Những
công ty không gian lận sẽ có sẽ có sự khác biệt nhỏ hơn, sự khác biệt sẽ rơi
vào khoảng nhỏ hơn 10 triệu Rb và thậm chí nhiều công ty không có sự
khác biệt nào trong cuộc thanh tra và báo cáo tóm tắt A.
+ KHÁC BIỆT CHI TIÊU B: Tương tự như thuộc tính Para A, các công ty
càng gian lận sẽ có Para B (Sự khác biệt trong kế hoạch chi tiêu được tìm
thấy trong cuộc thanh tra và báo cáo tóm tắt B tính bằng Rs) càng lớn, tuy
nhiên, mức chênh lệch của Para B khá lớn, ở khoảng từ 0 đến gần 1600
triệu Rb (Việc khác biệt chênh lệch trong số liệu của Para A và Para B sẽ
được nói kĩ hơn vào phần sau của mục kết luận này). Cụ thể là các công ty
có tần suất Para B cao nhất là trong khoảng dưới 500 triệu (chiếm 89.09%,
433 công ty trong tổng số 486 công ty gian lận). Tuy nhiên, sự khác biệt
trong các công ty không gian lận ở Para B lại được trải khá rộng so với
Para A (trong khoảng từ 0 đến gần 50 triệu Rb), mặc dù, số công ty không
gian lận có Para B trên 10 triệu không lớn (có khoảng 13 công ty không
gian lận trong tổng số 213 có Para B trên 10 triệu, trong đó có 1 công ty có
Para B trên 47 triệu) nhưng đây vẫn là điểm đáng ngờ so với Para A.
+ TỔNG CHÊNH LỆCH: Các công ty gian lận đa phần có Total (Tổng số
lượng chênh lệch được tìm thấy trong các báo cáo khác) khá cao (có
86.01% các công ty gian lận có 10 < Total < 500 triệu Rb, ngoài ra, còn có
1 công ty có Total gần 13 tỷ Rb). Sự chênh. Trong khi đó, các công ty
không gian lận thường hầu như có nhiều chênh lệch được tìm thấy (các
công ty không gian lận có Total < 1 triệu Rb chiếm 82.76% trong tổng số
các công ty gian lận). Vì vậy, chúng ta có thể nói rằng các công ty có tổng
chênh lệch càng lớn sẽ đồng nghĩa với việc các công ty đó càng đáng ngờ
trong các bản báo cáo.
+ TỔNG RỦI RO KHI PHÂN TÍCH: Thông qua chức năng Distributions,
dữ liệu về Tổng rủi ro khi phân tích điều tra gian lận của kiểm toán được
trình bày như biểu đồ trên. Các công ty này có tổng rủi ro khi phân tích
nằm trong khoảng từ 2.2 và có xu hướng giảm dần, cao nhất là 5.2. Trong
tổng số các công ty gian lận, có tới 176 công ty có tổng rủi ro khi phân tích
từ 2.2 đến 2.4, đây là mức giá trị thấp nhất về tổng rủi ro của một công ty
có khả năng gian lận kiểm toán và có sự tách biệt với mức 2.0 của các công
ty được đánh giá là không gian lận. Do đó, mức giá trị này có thể coi là
mức độ đánh giá khách quan và mang tính tổng quát nhất về điều tra gian
lận của một công ty.