Professional Documents
Culture Documents
Tampilkan semua table, grafik semua yg dihasilkan Figure 5 Time consumption in Java statement classification
Dilakukan pembahasan
Sehingga bisa disimpulkan (mengarah ke kesimpulan)
V. CONCLUSION
Hasil terbaik
ACKNOWLEDGEMENT
This work was supported by the Indonesian Government
through the Scholarship Schema of LPDP RI and Puslapdik
Kemendikbudristek.
REFERENCES
Lexer Generating
• Download library ANTLR & grammar Java
• Set konfigurasi ANTLR
• Set target program ke Python
• Generate program Python untuk mengolah source code Java
• Dapat Lexer, Parser, Listener
• Ambil Lexernya
Language Modeling
• Import library Python: CountVectorizer & TFIDFTransformer
• CountVectorizer: Menghitung kemunculan tiap token di setiap baris & di kumpulan baris
• TFIDFTransformer: Menghitung bobot token-token yang relevan di setiap baris
• Dapat dataframe: 53 fitur bobot di 594 baris dataset
• Siap diklasifikasi
Statement Classification
• Import library Python untuk model ML: DecisionTree, NaiveBayes, SVM, RVM, kNN, Rochio
• Membuat K-Fold CrossValidation: 4 folds
• 75% data training & 25% data testing
• Memilih metode ML
• Mengeksekusi 4 iterasi:
• Membangun model klasifikasi berdasarkan metode
• Menghitung akurasi & waktu
• Menghitung rerata akurasi & waktu setiap metode ML