You are on page 1of 15

Jurnal Manajemen Perbendaharaan ─ Volume 4, Nomor 1, 2023, 1-15

https://jmp.kemenkeu.go.id
ISSN PRINT: 2776-7256 | ISSN ONLINE: 2775-5010

DETEKSI ANOMALI MENGGUNAKAN ISOLATION FOREST


BELANJA BARANG PERSEDIAAN KONSUMSI PADA
SATUAN KERJA KEPOLISIAN REPUBLIK INDONESIA
Ahmad Zulfikar1, Farhan Ariq Rahmani2, Nurul Azizah3
1,2,3
Direktorat Jenderal Perbendaharaan, Kementerian Keuangan, Pangkal Pinang

Alamat Korespondensi: azulfikar@kemenkeu.go.id

Abstract
With frequent transaction but relatively variative in nominal value, manual supervision of
goods purchasing for operational needs such as operational inventory expense (account
code 521811) becomes very expensive and time-consuming. As a result, expenditure
business process on this account is vulnerable to fraudulent practices. The Budget Section
(BA) 060-The Indonesian National Police faces the greatest risk of fraud on that account
because the realization value of 521811 account is the highest compared to other
institutions. One of the early indications of fraudulent transactions is usually from the
irregularity of the transaction pattern from normal behavior (anomalies). Machine Learning
model can be used to automate internal control over this risk with much greater efficiency
and effectiveness. This study tries to detect anomalies at BA 060 using the Isolation Forest
method. The experiment results show that the most optimal model to detect anomalies of
operational inventory expense (account 521811) in working units of BA 060-Polri at the
contamination parameter value of 0.3%. Further development of this model can be used as
an additional feature in the payment module of the SAKTI application system to automate
anomaly detection instantly when the operator input the inventory transaction.

Abstrak
Dengan transaksi yang sering namun dalam nilai yang cukup bervariasi, pengawasan
belanja barang untuk kebutuhan operasional seperti belanja barang persediaan konsumsi
(kode akun 521811) secara manual menjadi sangat mahal dan menyita waktu. Akibatnya,
proses bisnis belanja akun 521811 ini menjadi rentan praktik fraud. Bagian anggaran (BA)
060-Kepolisian Republik Indonesia menghadapi risiko fraud realisasi akun 521811 paling
besar karena memiliki total realisasi belanja akun 521811 paling tinggi daripada BA
lainnya. Salah satu indikasi awal transaksi fraud biasanya ada pada ketidakwajaran pola
transaksi dari perilaku normal (anomali). Pemodelan machine learning dapat digunakan
untuk mengotomatisasi pengawasan internal atas risiko anomali ini dengan lebih efektif
dan efisien. Penelitian ini mencoba melakukan deteksi anomali menggunakan metode
isolation forest pada BA 060. Hasil yang didapat, model mampu mendeteksi anomali

© 2023 The Author(s). Published by Jurnal Manajemen Perbendaharaan


This is an Open Access article distributed under the terms of the Creative
Commons Attribution License | https://doi.org/10.33105/jmp.v4i1.435
Halaman 2 Jurnal Manajemen Perbendaharaan ─ Volume 4, Nomor 1, 2023

transaksi belanja barang persediaan pada satker BA 060-Polri secara optimal pada nilai
contamination parameter 0,3%. Pengembangan lebih lanjut dari model ini dapat
dijadikan fitur tambahan dalam modul pembayaran aplikasi SAKTI untuk
mengotomatisasi deteksi anomali pada saat operator melakukan proses perekaman
transaksi persediaan.

Keywords: fraud, internal control system, unsupervised machine learning

JEL Classification: H50

PENDAHULUAN Pemilihan Umum (BA 076), dan


Transaksi yang sering dan rutin Kementerian Hukum dan Hak Asasi
namun dalam nilai yang bervariasi, objek Manusia (BA 013). Selama tiga tahun
belanja barang persediaan konsumsi tersebut, gabungan kelima K/L ini
(akun 521811) seperti alat tulis kantor memiliki porsi antara 55,68%-58,39%
(ATK) rentan disalahgunakan. Menurut dari total realisasi belanja akun 521811
hasil penelitian Sholihah et al. (2016) seluruh K/L di Indonesia.
atas audit badan pemeriksa keuangan Dari tahun 2019-2021, Kepolisian
(BPK) terhadap laporan keuangan Negara Republik Indonesia (Polri) secara
pemerintah daerah (LKPD) tahun 2014 konsisten menempati posisi tertinggi
pada salah satu pemerintah kabupaten, sebagai K/L dengan porsi realisasi akun
terdapat temuan indikasi fraud objek 521811 terbesar secara nasional dan
belanja ATK pada 31 dari 33 satuan kerja terus meningkat dari tahun ke tahun.
perangkat daerah (SKPD) di kabupaten Porsi realisasi akun 521811 BA 060 (Polri)
tersebut. Dalam konteks pemerintah pada tahun 2019 sebesar 14,94% dari
pusat, Anggraeni (2018) menemukan total realisasi nasional, kemudian
adanya salah saji saldo persediaan pada meningkat menjadi 29,88% pada tahun
salah satu badan layanan umum (BLU) 2020, dan makin meningkat menjadi
Universitas karena inkonsistensi staf 30,57% porsi realisasi nasional pada
operator dalam memasukkan tahun 2021. Dengan porsi realisasi
harga/nilai per unit untuk persediaan terbesar dan makin meningkat dari
yang sama antar transaksi yang berbeda. tahun ke tahun, risiko-risiko
Grafik 1 membandingkan realisasi penyimpangan belanja akun 521811
belanja akun 521811 pada lima pada satker BA Polri pasti juga lebih
kementerian/lembaga (K/L) dengan tinggi dibandingkan satker BA lainnya.
porsi realisasi terbesar dibandingkan Adapun potensi penyimpangan yang
dengan total realisasi K/L lainnya selama dapat terjadi seperti adanya
tahun 2019–2021. Lima K/L yang ketidaksesuaian belanja terhadap
memiliki rata-rata porsi belanja akun kebutuhan atau bahkan risiko tindakan
521811 tertinggi pada tahun anggaran kecurangan (fraud). Akan tetapi, sistem
2019-2021 adalah Kepolisian Negara belanja pemerintah saat ini belum tindak
Republik Indonesia (BA 060), penyimpangan pada belanja barang
Kementerian Pertahanan (BA 012), operasional khususnya Belanja mampu
Kementerian Kesehatan (BA 024), Komisi
DETEKSI ANOMALI MENGGUNAKAN ISOLATION FOREST
BELANJA BARANG PERSEDIAAN KONSUMSI PADA SATUAN KERJA
KEPOLISIAN REPUBLIK INDONESIA Halaman 3

Grafik 1 Persentase Porsi Realisasi Akun 521811 TA 2019-2021


50,00
44,32
41,61 42,69

40,00

29,88 30,57
30,00

20,00
14,94 14,73
12,75 12,15
10,7110,91
10,00 6,37 6,73 5,60 5,63 5,89
4,02
0,49
0,00
Porsi 2019 Porsi 2020 Porsi 2021

060 (KEPOLISIAN NEGARA REPUBLIK INDONESIA) 012 (KEMENTERIAN PERTAHANAN)

024 (KEMENTERIAN KESEHATAN) 076 (KOMISI PEMILIHAN UMUM)

013 (KEMENTERIAN HUKUM DAN HAK ASASI MANUSIA RI) K/L Lainnya

Sumber: Direktorat Jenderal Perbendaharaan (2022), diolah peneliti

secara maksimal mencegah barang metode unsupervised ini, alat analisis


persediaan konsumsi (akun 521811). mengolah seluruh data transaksi belanja
Akun belanja 521811 digunakan untuk dari akun 521811 yang termasuk dalam
mencatat belanja persediaan keperluan transaksi BA 060 Polri di tingkat nasional.
operasional sehari-hari sehingga Selanjutnya, pemodelan machine
cenderung memiliki pola perilaku learning secara mandiri mengolah
belanja bulanan yang cukup konsisten informasi dari data tersebut untuk
dari tahun ke tahun. Dengan kondisi ini, menentukan kondisi informasi belanja
potensi fraud dapat dilihat dari anomali yang dianggap normal maupun yang
atau penyimpangan dari pola yang wajar. termasuk dalam kriteria anomali.
Oleh karena itu, penggunaan metode Salah satu teknik dalam metode
anomaly detection dapat menjadi salah unsupervised machine learning anomaly
satu pilihan untuk mengenali potensi detection yang sering digunakan adalah
fraud pada belanja barang persediaan isolation forest. Menurut Young (2020),
konsumsi yang sifatnya rutin tersebut. setidaknya ada dua alasan isolation
Pada saat ini belum terdapat forest disebut sebagai algoritma
standar yang jelas batas nominal pendeteksi anomali yang paling baik.
transaksi belanja akun 521811 yang Pertama, kinerja pendeteksian metode
tergolong anomali. Oleh karena itu, ini relatif lebih unggul dibandingkan
pembahasan dalam tulisan ini metode lain seperti local outliers factors
menggunakan metode unsupervised (LOF) dan k-nearest-neighbors (KNN).
machine learning anomaly detection Pendapat ini mengacu pada tes kinerja
sebagai salah satu alternatif. Dengan dan presisi receiver operating
Halaman 4 Jurnal Manajemen Perbendaharaan ─ Volume 4, Nomor 1, 2023

characteristic (ROC) yang dilakukan Berdasarkan Pasal 1 Nomor 1 pada


menggunakan benchmark data dari Peraturan Menteri Keuangan Nomor
python outlier detection package (PyOD). 214/PMK.05/2013, bagan akun standar
Kedua, kecepatan algoritma dalam (BAS) adalah daftar kodefikasi dan
memproses data dibandingkan model klasifikasi terkait transaksi keuangan
lain. Selain cepat, isolation forest tidak yang disusun secara sistematis sebagai
memerlukan memori perangkat yang pedoman dalam perencanaan,
besar ketika memproses data. Karena penganggaran, pelaksanaan anggaran,
efisiensinya, model ini sering digunakan dan pelaporan keuangan pemerintah.
untuk pemrosesan data berskala besar Ada 12 segmen BAS, yaitu: segmen
(big data) sehingga sejalan dengan satker, KPPN, akun, program, output,
potensi dari volume data yang terus dana, bank, kewenangan, lokasi,
meningkat. anggaran, antar entitas, dan segmen
Penelitian ini ditujukan untuk cadangan. Khusus untuk kodefikasi
mendeteksi anomali transaksi belanja segmen akun dalam BAS ditetapkan
barang persediaan konsumsi (akun dengan Keputusan Direktur Jenderal
521811) pada satuan kerja bagian Perbendaharaan Nomor KEP-
anggaran Kepolisian Republik Indonesia 211/PB/2018 sebagaimana telah
(BA-060) menggunakan metode beberapa kali dimutakhirkan, terakhir
isolation forest. Model deteksi anomali dengan Keputusan Direktur Jenderal
yang terbentuk diharapkan dapat Perbendaharaan Nomor KEP-
mempermudah para pemangku 331/PB/2021.
kepentingan dalam melakukan
Belanja Barang Persediaan Konsumsi
pengendalian, termasuk membantu
Berdasarkan Keputusan Dirjen
meminimalisasi potensi fraud atas
Perbendaharaan Nomor KEP-
belanja barang persediaan tersebut.
211/PB/2018 j.o. KEP-331/PB/2021
tentang kodefikasi segmen akun BAS,
TINJAUAN LITERATUR transaksi belanja barang persediaan
Persediaan konsumsi dicatat dengan kode akun
Persediaan dalam penelitian ini 521811. Hal tersebut karena akun ini
merupakan persediaan dalam konteks menghasilkan barang milik negara
pemerintah pusat. Menurut pernyataan (BMN) berupa aset lancar persediaan,
standar akuntansi pemerintah nomor 5 akun 521811 ini hanya dicatat dalam
(PSAP No. 5) tentang akuntansi jurnal kas, sementara jurnal akrualnya
persediaan, persediaan adalah aset dicatat menggunakan kode akun
lancar dalam bentuk barang atau 117111 (persediaan barang konsumsi).
perlengkapan yang dimaksudkan untuk
mendukung kegiatan operasional Persediaan Barang Konsumsi
pemerintah dan barang-barang yang Persediaan barang konsumsi (akun
dimaksudkan untuk dijual dan/atau 117111) adalah aset lancar untuk
diserahkan dalam rangka pelayanan keperluan operasional sehari-hari
kepada masyarakat. pemerintah yang ditujukan untuk
disimpan terlebih dahulu atau belum
Bagan Akun Standar untuk digunakan/dikonsumsi segera
setelah dibeli. Kategori barang yang
DETEKSI ANOMALI MENGGUNAKAN ISOLATION FOREST
BELANJA BARANG PERSEDIAAN KONSUMSI PADA SATUAN KERJA
KEPOLISIAN REPUBLIK INDONESIA Halaman 5

termasuk ke dalam persediaan konsumsi (fraud), namun red flag biasanya selalu
antara lain ATK, bahan cetakan, alat-alat muncul di setiap kasus kecurangan yang
rumah tangga, dan suplai komputer terjadi.
seperti cartridge/tinta/toner printer.
Penyalahgunaan Aset
Kecurangan (Fraud) Menurut Association of Certified
Bologna et al. (1993) Fraud Examiners (2000), ada tiga
mendefinisikan fraud sebagai “criminal kategori fraud, yaitu kecurangan laporan
deception intended to financially benefit keuangan (financial statement fraud),
the deceiver” atau kecurangan adalah penyalahgunaan aset (asset
penipuan kriminal yang bermaksud misappropriation), dan Korupsi
untuk memberi manfaat keuangan (Corruption). Kecurangan belanja
kepada pelaku. Amrizal (2004) persediaan termasuk ke dalam kategori
mencantumkan tiga langkah penyalahgunaan aset. Amrizal (2004)
kecurangan (fraud), yaitu (1) menekankan bahwa pemahaman yang
tindakan/the act, (2) penyembunyian/ tepat atas pengendalian intern yang
the concealment, dan (3) konversi/the baik dalam pos-pos aset akan sangat
conversion. Contoh fraud pada aset membantu dalam mendeteksi
persediaan seperti pelaku melakukan kecurangan penyalahgunaan aset.
tindakan (act) membuat transaksi fiktif
Sistem Pengendalian Internal
pembelian persediaan, tetapi karena
Menurut Mulyadi (2014), ada
fisik persediaannya tidak ada, pelaku
empat unsur pokok dalam sistem
akan menyembunyikan (concealment)
pengendalian internal (SPI), yaitu (1)
kecurangan tersebut dengan membuat
pemisahan tanggung jawab secara tegas
bukti transaksi pengeluaran/konsumsi
pada struktur organisasi, (2) sistem
persediaan fiktif. Selanjutnya, pelaku
wewenang dan prosedur pencatatan
dapat dengan leluasa mengonversi
yang dapat melindungi aset, utang,
(conversion) manfaat finansial dari
pendapatan, dan biaya secara cukup, (3)
transaksi pengadaan dan konsumsi fiktif
praktik yang sehat dalam pelaksanaan
tersebut.
tugas dan fungsi organisasi, serta (4)
Red Flag kualitas SDM yang sesuai dengan
Menurut Amrizal (2004), petunjuk tanggung jawabnya. Dari empat unsur
adanya kecurangan biasanya pokok SPI tersebut, unsur pertama
ditunjukkan oleh munculnya gejala- (pemisahan kewenangan) menjadi
gejala (symptoms) yang di luar kebiasaan kelemahan utama dalam proses
seperti adanya perubahan gaya hidup transaksi belanja barang persediaan,
atau perilaku seseorang, dokumentasi terutama pada satker kecil dengan
yang mencurigakan, keluhan dari jumlah personel yang terbatas. Dalam
pelanggan ataupun kecurigaan dari konteks transaksi belanja persediaan
rekan sekerja. Gejala yang menyimpang konsumsi, risiko fraud akan makin besar
dari kenormalan tersebut dinamakan red apabila tidak ada pemisahan
flag. Meskipun tidak semua indikasi red kewenangan antara pihak yang
flag merupakan tindak kecurangan melakukan kegiatan pengadaan atau
Halaman 6 Jurnal Manajemen Perbendaharaan ─ Volume 4, Nomor 1, 2023

melakukan pembelian persediaan menjadi beberapa kategori sesuai


dengan pihak yang menyimpan dan dengan label yang diberikan, sedangkan
menjaga persediaan pada suatu satker. regresi digunakan untuk memahami
hubungan/pengaruh antara variabel
Anomali
dependen dan independen.
Alla & Adari (2019) mendefinisikan
Sementara itu, Delua (2021)
anomali sebagai hasil atau nilai yang
mendefinisikan unsupervised learning
menyimpang dari yang diharapkan,
sebagai pendekatan pembelajaran
meskipun kriteria yang jelas untuk
mesin dari set data tanpa memberikan
menentukan sebuah anomali bisa
label tertentu. Mesin akan secara
berbeda-beda antarsituasi. Terminologi
mandiri mengungkap pola-pola
red flag sama dengan anomali. Data
tersembunyi di dalam data tanpa
yang bersifat anomali dapat dideteksi
intervensi manusia. Ada tiga tipe analisis
keberadaannya dengan melihat
yang dapat dilakukan menggunakan
perbedaan karakteristiknya dengan
metode unsupervised learning, yaitu:
kondisi data yang dianggap normal.
klasterisasi (clustering), asosiasi
Machine Learning (association), dan pengurangan dimensi
Menurut Buslim & Iswara (2019), (dimensionality reduction). Klasterisasi
kumpulan data yang besar atau dikenal mengelompokkan data yang tidak
dengan istilah big data dapat dianalisis diberikan label berdasarkan kesamaan
dengan berbagai macam teknik. Salah atau perbedaannya. Asosiasi mencari
satu teknik yang dapat digunakan dalam hubungan tersembunyi dalam set data
mengolah big data adalah machine yang besar. Pengurangan dimensi
learning. Teknik machine learning digunakan untuk mengurangi jumlah
merupakan salah satu varian dari sistem fitur/dimensi/variabel dalam suatu set
kecerdasan buatan (artificial intelligence) data dengan cara mengelompokkan
yang memungkinkan komputer dapat dimensi-dimensi yang mempunyai
belajar tanpa diprogram secara eksplisit. kemiripan dan hubungan yang kuat.
Auffarth (2021) mengungkapkan bahwa Baik supervised maupun
“Machine learning is the study of unsupervised learning dapat digunakan
algorithms that improve through untuk melakukan deteksi anomali.
experience. These algorithms or models Sebagaimana disebutkan pada bagian
can make systematic, repeatable, sebelumnya, saat ini belum ada standar
validated decisions based on data.” yang disepakati terkait berapa nilai
Supervised vs Unsupervised Machine transaksi belanja barang persediaan
Learning konsumsi yang dianggap wajar sehingga
Menurut Brownlee (2016), Machine tidak bisa ditentukan (labelling) mana
Learning mempunyai dua tipe teknik transaksi normal dan mana transaksi
yaitu supervised learning dan anomali. Oleh karena itu, penelitian ini
unsupervised learning. Umumnya, melakukan deteksi anomali transaksi
metode supervised learning digunakan belanja barang persediaan konsumsi
untuk melakukan dua tipe analisis, yaitu: menggunakan metode unsupervised
klasifikasi (classification) dan regresi machine learning anomaly detection.
(regression). Klasifikasi memisahkan data Isolation Forest
DETEKSI ANOMALI MENGGUNAKAN ISOLATION FOREST
BELANJA BARANG PERSEDIAAN KONSUMSI PADA SATUAN KERJA
KEPOLISIAN REPUBLIK INDONESIA Halaman 7

Metode isolation forest adalah salah penelitian yang khusus melakukan


satu metode unsupervised machine deteksi anomali pada transaksi belanja
learning anomaly detection yang pemerintah. Oleh karena itu, penelitian
pertama kali diperkenalkan oleh Liu et al. ini berusaha untuk menggunakan
(2008). Metode isolation forest adalah isolation forest sebagai metode deteksi
algoritma unsupervised learning dan anomali transaksi belanja pemerintah,
nonparametric yang didasarkan atas khususnya belanja barang persediaan.
algoritma pohon keputusan atau trees.
Deteksi anomali menggunakan isolation METODE PENELITIAN
forest melewati dua tahap proses, yaitu Penelitian ini menggunakan teknik
tahap pelatihan (training) dan tahap unsupervised machine learning anomaly
evaluasi (evaluation). Pada tahap detection dengan metode isolation forest.
pelatihan, mesin membuat pohon isolasi metode isolation forest merupakan salah
menggunakan sampel dari seluruh set satu modul dalam library machine
data. Kemudian pada tahap evaluasi, learning scikit-learn yang berjalan
seluruh individu/instance dalam set data dengan bahasa pemrograman Python.
melalui pohon isolasi untuk menghitung Aplikasi Google Colab digunakan
skor anomali setiap instance. sebagai coding environment untuk
Penelitian Terdahulu menjalankan Python.
Metode isolation forest banyak Sumber Data
digunakan untuk mendeteksi fraud Data yang digunakan dalam
transaksi keuangan, seperti fraud kartu penelitian ini merupakan data sekunder
kredit dan pencucian uang. Ounacer et realisasi belanja per bulan akun 521811
al. (2018) membandingkan kinerja pada seluruh satker BA 060-Polri selama
empat teknik unsupervised anomaly tahun 2019 s.d. 2021. Data tersebut
detection pada 284.807 transaksi kartu bersumber dari data realisasi belanja
kredit dari Kaggle menemukan bahwa APBN pada Direktorat Jenderal
isolation forest memberikan kinerja yang Perbendaharaan, Kementerian
paling baik jika dibandingkan dengan Keuangan RI.
tiga metode lainnya, yaitu one class SVM
(support vector machine), local outlier Data Cleansing
factor (LOF), dan k-means. Vijayakumar Data yang diterima masih kotor
et al. (2020) yang membandingkan (dirty/noisy) sehingga dilakukan data
performa isolation forest dengan LOF cleansing sebelum proses deteksi
juga menemukan bahwa isolation forest anomali dilakukan. Ridzuan & Zainon
merupakan metode terbaik untuk (2019) mendefinisikan data kotor
melakukan deteksi anomali pada sebagai data yang tidak akurat, tidak
transaksi kartu kredit. Shokry et al. (2020) konsisten, dan tidak lengkap karena
juga menemukan bahwa isolation forest kesalahan yang ditemukan dalam
merupakan model terbaik untuk kumpulan data. Data yang diterima
mendeteksi pencucian uang pada merupakan gabungan transaksi realisasi
transaksi perbankan jika dibandingkan akun 521811, baik realisasi belanja
dengan one class SVM. Belum ada maupun pengembalian belanja atau
Halaman 8 Jurnal Manajemen Perbendaharaan ─ Volume 4, Nomor 1, 2023

koreksi akun. Indikasi dari hal tersebut, Menentukan Nilai Contamination


ada beberapa data realisasi yang bernilai Parameter
minus. Data realisasi bulanan akun Nilai contamination parameter
521811 yang bernilai minus bisa digunakan untuk mengajarkan model
diakibatkan oleh adanya koreksi kurang berapa proporsi anomali dalam dataset.
atau pengembalian belanja yang Nilai contamination parameter
melebihi realisasi belanja pada bulan ditentukan secara trial and error melalui
bersangkutan. beberapa kali percobaan nilai parameter.
Terdapat kemungkinan data yang Secara visual akan terlihat model yang
bernilai positif masih bercampur dengan paling sesuai dan mewakili dari
data realisasi non belanja seperti koreksi scatterplot yang terbentuk.
tambah. Akan tetapi, data kotor yang
Menghitung Anomaly Score
bernilai positif tidak bisa dieliminasi
Anomaly score adalah nilai yang
secara visual atau manual sehingga tidak
menunjukkan kriteria anomali row data.
dieliminasi dalam proses data cleansing.
Secara matematis, anomaly score
Koreksi tambah yang menimbulkan nilai
didapat dari hasil perhitungan formula
yang tidak wajar akan otomatis
di bawah ini:
tereliminasi dari proses deteksi anomali.
𝐸(ℎ(𝑥 ))
Data Transformation −
𝑠(𝑥, 𝑛) = 2 𝑐(𝑛)
Nilai rupiah realisasi antar satker
sangat bervariasi sesuai dengan nilai Ket.
pagu satker bersangkutan. Oleh karena H(x) : path length
itu, perlu dilakukan transformasi data E(h(x)) : rata-rata path length dari setiap
realisasi menjadi persentase belanja isolation tree.
akun 521811 terhadap total pagu C(n) : rata-rata h(x) dari nilai variabel
belanja barang agar dapat dibandingkan ke-n
realisasi antar satker dengan lebih
relevan. Rasio persentase realisasi Path length adalah jarak yang
belanja akun 521811 terhadap total mengukur titik di mana data tidak dapat
pagu belanja barang lebih reliable dibagi lagi dengan root node dari
dibandingkan rasio terhadap akun struktur algoritma pohon keputusan.
521811 secara langsung karena selama Anomaly score sendiri memiliki rentang
tahun berjalan, pagu per akun nilai dari -1 sampai dengan 1. Anomaly
dimungkinkan untuk berubah dan score yang makin mendekati -1
mengalami penyesuaian melalui dianggap anomali dan makin mendekati
mekanisme revisi petunjuk operasional nilai 1 dianggap normal.
kegiatan (POK). Sementara itu, total
pagu belanja barang biasanya jarang HASIL PENELITIAN DAN
berubah karena harus melalui proses PEMBAHASAN
revisi daftar isian pelaksanaan anggaran Untuk melatih model isolation
(DIPA) dengan melakukan pergeseran forest, maka hanya diambil dua kolom
pagu antar jenis belanja atau dari dataset, yaitu ”BULAN” dan
penambahan/pengurangan pagu DIPA “PERSENTASE”. Kolom “BULAN”
dari satker lain. menampilkan data periode bulan
DETEKSI ANOMALI MENGGUNAKAN ISOLATION FOREST
BELANJA BARANG PERSEDIAAN KONSUMSI PADA SATUAN KERJA
KEPOLISIAN REPUBLIK INDONESIA Halaman 9

terjadinya transaksi. Sedangkan kolom belanja barang di satker BA 060-Polri


“PERSENTASE” menampilkan data terjadi pada bulan April dengan rata-
periode bulanan atas persentase belanja rata persentase 0,6643%. Selama tiga
persediaan konsumsi (akun 521811) tahun tersebut, total satker yang
terhadap total pagu belanja barang. Set melakukan realisasi belanja akun 521811
data yang hanya berisi features yang paling sedikit terjadi pada bulan Januari,
diperlukan model ini kemudian diberi yaitu hanya 1.300 satker. Nilai minimum
nama “data nasional”. dan maksimum per bulan menunjukkan
Dari proses data cleansing dan data tingginya variasi persentase realisasi
transformation, didapatkan set data belanja akun 521811 Satker BA 060-Polri,
dengan statistik deskriptif seperti yang dari nilai minimum 0,0000% sampai
ditampilkan oleh Tabel 1. Dari tahun dengan 73,946%.
2019 sampai dengan tahun 2021, rata- Proses selanjutnya adalah
rata tertinggi persentase realisasi memasukkan dataset ke dalam fungsi
belanja barang persediaan konsumsi isolation forest sebagaimana yang
(akun 521811) terhadap total pagu ditampilkan oleh Gambar 1. Parameter

Tabel 1 Statistik Deskriptif Persentase Bulanan Realisasi Belanja Akun 521811


BA 060-Polri Tahun 2019-2021
Standard
Bulan Mean Minimum Maximum Count
Deviation
Jan 0,6116495 1,6984140 0,0003394 17,0165897 1.300
Feb 0,5146982 1,2677632 0,0008167 24,2775211 2.808
Mar 0,4992162 1,3477575 0,0007967 34,3017570 2.941
Apr 0,6642793 3,0948643 0,0009004 57,5222310 2.911
Mei 0,5518261 2,2867625 0,0004091 52,3638541 2.831
Jun 0,5190978 2,6490202 0,0005149 63,8406067 2.810
Jul 0,4764332 1,6553660 0,0008207 52,8147396 2.919
Agu 0,4569261 1,8012051 0,0001533 43,1229356 2.833
Sep 0,4301082 1,9934281 0,0000004 57,3973523 2.857
Okt 0,4300444 1,8816261 0,0003273 73,9463839 2.910
Nov 0,4310028 1,7895555 0,0002664 71,0918830 2.974
Des 0,4348209 2,2469765 0,0000038 68,4648888 2.728
Sumber: Direktorat Jenderal Perbendaharaan (2022), diolah peneliti

Gambar 1 Kode Eksekusi Isolation Forest


datamodel=dftrain[['BULAN','PERSENTASE']]

model = IsolationForest(contamination=float(0.003), max_samples='auto',


n_estimators=100)
model.fit(datamodel)
Sumber: diolah peneliti
Halaman 10 Jurnal Manajemen Perbendaharaan ─ Volume 4, Nomor 1, 2023

dalam isolation forest yang digunakan dan n_estimators. Nilai contamination


antara lain contamination, max_samples, parameter akan dibahas di bagian

Grafik 2 Hasil Prediksi Model Isolation Forest dengan


Contamination Parameter 0,005

Sumber: diolah peneliti

Grafik 3 Hasil Prediksi Model Isolation Forest dengan


Contamination Parameter 0,001

Sumber: diolah peneliti

Grafik 4 Hasil Prediksi Model Isolation Forest dengan


Contamination Parameter 0,003

Sumber: diolah peneliti


DETEKSI ANOMALI MENGGUNAKAN ISOLATION FOREST
BELANJA BARANG PERSEDIAAN KONSUMSI PADA SATUAN KERJA
KEPOLISIAN REPUBLIK INDONESIA Halaman 11

Gambar 2 Kode Konversi Anomaly Score dan Visualisasi Data


dftrain['outliers']=pd.Series(model.predict(datamodel)).apply(lambda
x:'yes' if (x == -1) else 'no')

fig = px.scatter(dftrain, x='TANGGAL', y='PERSENTASE',


color='outliers', title='Belanja Persediaan Satker Nasional')

fig.update_xaxes(
rangeslider_visible=True,
)
fig.show()
Sumber: diolah peneliti

selanjutnya, karena penentuan nilainya Dari hasil trial and error, terpilih tiga
memengaruhi akurasi model nilai contamination parameter, yaitu
mendeteksi anomali. Parameter kedua 0,005; 0,003; dan 0,001. Hasil pengujian
adalah max_samples yang menentukan ketiga parameter kemudian dikonversi
berapa banyak sampel yang dapat dari anomaly score menjadi label yes dan
digunakan model untuk berlatih. Di no dengan menggunakan kode
model ini, max_samples dipasang ‘auto’ pemrograman sebagaimana
yang memiliki arti semua data (populasi) ditampilkan pada Gambar 2. Kode yes
digunakan untuk latihan model. Terakhir, berarti baris data tersebut merupakan
parameter n_estimators dipilih ke angka data anomali (outlier), sedangkan kode
100 yang merupakan angka standar no merupakan tanda untuk baris data
(default) dari model isolation forest. yang normal (inlier). Langkah
selanjutnya, melakukan visualisasi data
Proses Penentuan Nilai
realisasi yang merupakan outliers.
Contamination Parameter yang Tepat
Sedangkan tanda titik berwarna biru

Tabel 2 Data Outlier Hasil Model Isolation Forest


KANWIL_
TAHUN BULAN SATKER REAL_PERSEDIAAN PAGU_BARANG PERSENTASE
DJPB
K02 2019 10 640338 43,368,003,498 58,647,903,000 73.94638389
K17 2019 11 645852 14,182,474,490 19,949,499,000 71.09188301
K02 2020 12 640338 53,412,887,116 78,015,006,000 68.46488881
K02 2021 6 640338 43,276,268,580 67,787,997,000 63.84060674
K31 2019 12 669282 9,897,169,604 17,194,095,000 57.56144539
… … … … … … …
K07 2019 1 641834 3,648,866,069 33,850,556,000 10.77933866
K21 2019 1 644861 3,933,280,720 37,158,924,000 10.58502318
K16 2021 1 645362 5,048,632,280 48,930,076,000 10.31805526
K14 2019 1 643784 3,276,929,769 32,536,497,000 10.07155063
K11 2019 1 417899 192,500,000 1,914,792,000 10.05331127
Sumber: diolah peneliti
Halaman 12 Jurnal Manajemen Perbendaharaan ─ Volume 4, Nomor 1, 2023

merupakan titik data realisasi yang wajar. September 2022 dengan nilai belanja
dalam scatter plot diagram. Tanda titik persediaan sebesar Rp400 dari pagu
berwarna merah menunjukkan titik data belanja barang Rp111,61 Miliar atau
realisasi yang merupakan outliers. persentase persediaan sebesar
Sedangkan tanda titik berwarna biru 0,0000007%.
merupakan titik data realisasi yang wajar. Langkah selanjutnya adalah
Berdasarkan hasil pengujian deteksi menyimpan data yang sudah
anomali menggunakan nilai memperoleh label inlier dan outlier
contamination parameter sebesar 0,005 menggunakan library joblib. Karena
seperti scatter plot yang ditampilkan sudah memiliki label, data dari hasil
Grafik 2, jumlah data transaksi yang model Isolation Forest tersebut juga
terdeteksi anomali sebanyak 165 baris dapat digunakan menjadi data training
data. Secara visual, masih ada plot data untuk membuat model deteksi anomali
yang sebenarnya masih dekat dengan Supervised Machine Learning.
data lainnya, dideteksi sebagai anomali
oleh model. KESIMPULAN DAN SARAN
Apabila menggunakan nilai
contamination parameter 0,001 seperti Kesimpulan
Grafik 3, jumlah anomali data transaksi Hasil pengujian menunjukkan
yang terdeteksi sebanyak 33 transaksi. bahwa model isolation forest memiliki
Berkebalikan dengan Grafik 2, plot data potensi untuk mendeteksi anomali yang
yang tampak sudah jauh dari data terjadi pada data transaksi akun belanja
lainnya masih dianggap normal (inlier) persediaan (521811). Berdasarkan hasil
oleh model. Secara visual, nilai uji coba beberapa nilai contamination
contamination parameter terbaik adalah parameter, nilai 0,3% merupakan nilai
0,003 atau 0,3% seperti yang yang paling optimal dalam uji coba
diperlihatkan pada Grafik 4. Model model yang dipilih dalam mendeteksi
mendeteksi sebanyak 99 baris data anomali. Terlepas dari valid atau
sebagai anomali. Plot data yang jauh tidaknya indikasi fraud pada data yang
dari data lainnya dianggap anomali, dideteksi sebagai anomali oleh model,
sementara yang masih berdekatan hasil learning dari penelitian ini dapat
dianggap normal oleh sistem. dimasukkan sebagai fitur tambahan
Tabel 2 menunjukkan transaksi yang berfungsi sebagai early warning
yang dideteksi sebagai anomali oleh system pada aplikasi otorisasi belanja
model. Berdasarkan tabel tersebut, data satker, seperti aplikasi sistem aplikasi
anomali dengan persentase persediaan keuangan tingkat instansi (SAKTI).
tertinggi adalah transaksi kode satker Saran
640338 di bulan Oktober 2019 dengan Penelitian ini menggunakan data
nilai belanja persediaan (5211811) realisasi belanja akun 521811 secara
sebesar Rp43,37 miliar dari pagu belanja bulanan. Nilai realisasi bulanan ini
barang (52) sebesar Rp58,65 miliar atau merupakan nilai neto yang didapat dari
persentase persediaan sebesar 73,95%. nilai realisasi belanja
Sedangkan data anomali dengan ditambah/dikurangi dengan transaksi
persentase persediaan terendah adalah koreksi akun dan/atau transaksi
transaksi kode satker 646307 di bulan pengembalian belanja. Transaksi koreksi
DETEKSI ANOMALI MENGGUNAKAN ISOLATION FOREST
BELANJA BARANG PERSEDIAAN KONSUMSI PADA SATUAN KERJA
KEPOLISIAN REPUBLIK INDONESIA Halaman 13

akun dan pengembalian belanja ini sama positif. Ada beberapa indikasi
biasanya merupakan koreksi dan/atau yang terkait koreksi tambah ini yaitu
pengembalian belanja persediaan bulan adanya nilai realisasi per bulan yang
sebelumnya. Untuk penelitian lebih dari 70% pada satker tertentu.
selanjutnya, disarankan untuk
menggunakan nilai per transaksi pada REFERENSI
surat perintah pencairan dana (SP2D)
sehingga koreksi akun dan Alla, S & Adari, S. K. (2019). Beginning
pengembalian belanja tidak termasuk ke anomaly detection using python-
dalam model. based deep learning with keras and
pytorch. New York: Apress.
Amrizal. (2004). Pencegahan dan
IMPLIKASI DAN
pendeteksian kecurangan oleh
KETERBATASAN internal auditor. Jakarta. Badan
Implikasi Pengawasan Keuangan dan
Penelitian deteksi anomali dengan Pembangunan.
menggunakan isolation forest dapat Anggraeni, D.P. (2018). Fraud pada tata
diimplementasikan sebagai alternatif kelola penatausahaan persediaan
pencegahan melalui deteksi fraud. badan layanan umum (studi kasus
Pemodelan ini memiliki potensi untuk pada universitas x di Kota Malang).
dikembangkan dan ditambahkan ke Tesis. Universitas Brawijaya.
dalam modul pembayaran aplikasi Association of Certified Fraud Examiners.
SAKTI sebagai fitur deteksi anomali (2000). Fraud examiners manual
secara otomatis saat penginputan third edition. Texas: Association of
transaksi oleh operator. Certified Fraud Examiners.
Auffarth, B. (2021). Machine learning for
Keterbatasan time-series with python: Forecast,
Data realisasi belanja akun 521811 predict, and detect anomalies with
yang diuji hanya data total nominal state-of-the-art machine learning
transaksi per bulan, bukan data per methods. Birmingham, UK: Packt
transaksi SP2D. Dalam nilai transaksi per Publishing.
bulan yang menjadi objek penelitian, Bologna, G. J., Lindquist, R. J., & Wells, J.
selain transaksi pencairan SP2D, juga T. (1993). Investigation audit 4th
terdapat transaksi koreksi SP2D dan edition. New Jersey: Prentice-Hall.
pengembalian belanja bulan Brownlee, J. (2016). Machine learning
sebelumnya. Hal ini terlihat dari adanya mastery with python: Understand
nilai transaksi minus pada bulan dan your data, create accurate models
satker tertentu yang berasosiasi dengan and work projects end-to-end. San
total koreksi “kurang” pada bulan Francisco: Machine Learning
tersebut lebih besar daripada nilai Mastery.
realisasi belanja bulan berkenaan. Akan Buslim, N. & Iswara, R. P. (2019).
tetapi, model dalam penelitian ini tidak Pengembangan algoritma
dapat mendeteksi dan mengeliminasi unsupervised learning technique
koreksi “tambah” karena nilainya sama- pada big data analysis di media
Halaman 14 Jurnal Manajemen Perbendaharaan ─ Volume 4, Nomor 1, 2023

sosial sebagai media promosi credit card transactions. Periodicals


online bagi masyarakat. Jurnal of Engineering and Natural Sciences,
Teknik Informatika, 12(1), 79 – 81. 6(2), 394-400.
https://doi.org/10.15408/jti.v12i1.1 https://doi.org/10.21533/pen.v6i2.
1342. 533
Delua, J. (2021). Supervised vs. Republik Indonesia. (2005). Lampiran VII
unsupervised learning: What’s the Peraturan Pemerintah Republik
difference? IBM. Retrieved March Indonesia Nomor 24 Tahun 2005
22, 2022 from tentang Pernyataan Standar
https://www.ibm.com/cloud/blog/s Akuntansi Pemerintah Nomor 05 –
upervised-vs-unsupervised- Akuntansi Persediaan. Jakarta.
learning Ridzuan, F., & Zainon, W. M. N. W.
Direktorat Jenderal Perbendaharaan. (2019). A review on data cleansing
(2018). Keputusan Direktur Jenderal methods for big data. Procedia
Perbendaharaan Nomor 211 Tahun Computer Science, 161, 731-738.
2018 tentang Kodefikasi Bagan Shokry, A. M., Rizka, M. A., & Labib, N. M.
Akun pada Bagan Akun Standar. (2020). Counter terrorism finance
Jakarta. by detecting money laundering
Direktorat Jenderal Perbendaharaan. hidden networks using
(2018). Keputusan Direktur Jenderal unsupervised machine learning
Perbendaharaan Nomor 331 Tahun algorithm. In International
2018 tentang Kodefikasi Bagan Conferences ICT, Society, and
Akun pada Bagan Akun Standar. Human Beings, 89-97.
Jakarta. https://doi.org/10.33965/ict_csc_w
Direktorat Jenderal Perbendaharaan. bc_2020_202008l012
(2022). Dataset realisasi belanja Sholihah, S., Alim, M. N., & Musyarofah,
bulanan per satker per akun S. (2016). Memotret pola fraud
secara nasional. Jakarta. pada rincian objek belanja yang
Kementerian Keuangan. (2013). menjadi temuan BPK. Journal of
Peraturan Menteri Keuangan Auditing, Finance, and Forensic
Nomor 214/PMK.05/2013 tentang Accounting, 4(2), 101-110.
Bagan Akun Standar. Jakarta. https://doi.org/10.21107/jaffa.v4i2.
Liu, F. T., Ting, K. M., & Zhou, Z. H. (2008) 2783
Isolation forest. Eighth IEEE Vijayakumar, V., Divya, N. S., Sarojini, P.,
International Conference on Data & Sonika, K. (2020). Isolation forest
Mining, 413-422. and local outlier factor for credit
https://doi.org/10.1109/ICDM.2008 card fraud detection system.
.17. International Journal of Engineering
Mulyadi. (2014). Sistem akuntansi. and Advanced Technology (IJEAT),
Cetakan Keempat. Jakarta: Salemba 9(4), 261–265.
Empat. https://doi.org/10.35940/ijeat.d681
Ounacer, S., El Bour, H. A., Oubrahim, Y., 5.049420
Ghoumari, M. Y., & Azzouazi, M. Young, A. (2020). Making sense of big
(2018). Using isolation forest in data, isolation forest is the best
anomaly detection: The case of anomaly for big data right now.
DETEKSI ANOMALI MENGGUNAKAN ISOLATION FOREST
BELANJA BARANG PERSEDIAAN KONSUMSI PADA SATUAN KERJA
KEPOLISIAN REPUBLIK INDONESIA Halaman 15

Retrieved March 10,2022 from


https://towardsdatascience.com/is
olation-forest-is-the-best-
anomaly-detection-algorithm-for-
big-data-right-now-e1a18ec0f94f

You might also like