Home » Pendeteksian Perkelahian dengan Machine Learning

Pendeteksian Perkelahian dengan Machine Learning

Ilustrasi kamera pengawas
Illustrasi Kamera Pengawas

Pendeteksian Perkelahian dengan Machine Learning – Pernahkah anda menonton film yang berlatar waktu di masa depan dimana beberapa pekerjaan sudah digantikan oleh robot dengan kecerdasan buatan (artificial intelligence). Posisi yang berkaitan dengan bidang keamanan mungkin menjadi salah satu yang akan digantikan oleh robot.

Kamera-kamera pengawas terpasang disetiap sudut bangunan dan robot-robot polisi yang lalu-lalang di sepanjang jalan. Setiap aktivitas masyarakat diamati, pelanggaran dan tindakan kriminal diganjar dengan sanksi hukum maupun pengurangan social credit. Hal tersebut dapat menjadi utopia ataupun distopia tergantung dari siapa yang mengontrol dan menjalankan.

Kini, hal-hal yang disebutkan diatas bukan lagi fiksi, peneliti-peneliti yang tersebar di berbagai negara saat ini sedang mengembangkan dan bahkan mengaplikasikan temuan mereka.

Perkelahian dengan kekerasan dan kontak fisik adalah satu permasalahan yang mengganggu ketertiban masyarakat, baik itu dilakukan oleh individu ataupun kelompok. Berikut adalah penelitian yang membahas pendeteksian perkelahian:

Sebagai salah satu pencetus pertama penggunaan machine learning untuk mendeteksi perkelahian, Bermejo Nievas et al. (2011) menganalisa 1000 potongan video dari pertandingan hockey dan melabeli potongan video tersebut dengan “perkelahian” dan “bukan perkelahian”, ia menggunakan pendekatan Space-Time Interest Points (STIP) and Motion SIFT (MoSIFT).

Dataset untuk perkelahian di olahrage hockey
Hocket Fight Dataset

Aktı et al. (2019) dalam penelitiannya menggabungkan dua metode jaringan saraf tiruan, yaitu convolutional neural networks (CNNs) dan long short-term memory (LSTM) untuk mendeteksi perkelahian dari kamera pengawas. CNN digunakan untuk mendapatkan fitur (warna, pola, garis, dan lainnya) dari gambar dan mendapatkan vektor pergerakan dari beberapa frame gambar, sedangkan LSTM untuk mengklasifikasikan perbedaan pada setiap frame gambar.

Pada penelitian lainnya, Aktı et al. (2022) menggunakan pendekatan yang berbeda, yang mana jika pada penelitian sebelumnya menggunakan gambar yang bergerak, pada penelitian ini ia menggunakan gambar diam yang didapat dari media sosial Twitter.

Penelitian-penelitian diatas mendapatkan hasil yang cukup memuaskan dengan mendapatkan tingkat akurasi diatas 70% dan ada yang mencapai 90%, angka yang sangat tinggi. Namun terdapat batasan pada jumlah data untuk validasi, sehingga tingkat akurasi tersebut akan berubah pada data yang berbeda.

Dengan terus berkembangnya variasi dan jumlah data, serta computing power yang terus meningkat akan membuka ruang untuk mengembangkan metode atau model machine learning sehingga tingkat akurasinya dapat mendekati sempurna.

Sumber:

  • Bermejo Nievas, E., Deniz Suarez, O., Bueno García, G., & Sukthankar, R. (2011). Violence Detection in Video Using Computer Vision Techniques. Lecture Notes in Computer Science, 332–339.
  • Aktı, Ş., Tataroğlu, G. A., & Ekenel, H. K. (2019, November). Vision-based fight detection from surveillance cameras. In 2019 Ninth International Conference on Image Processing Theory, Tools and Applications (IPTA) (pp. 1-6). IEEE.
  • Aktı, Ş., Ofli, F., Imran, M., & Ekenel, H. K. (2022). Fight Detection from Still Images in the Wild. In Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (pp. 550-559).