2018년도 정보보호 R&D 데이터 챌린지 대회의 "AI기반 안드로이드 악성앱 탐지" 트랙에 활용된 안드로이드 앱 데이터셋이다.
고려대학교 해킹대응기술연구실에서 연구한 프로파일링 기반 악성앱 탐지 시스템(Andro-Profiler)의 성능검증에 기반이 된 데이터셋으로, VirusShare, Contagio 등 악성앱 공유 사이트에서 수집한 4,694개 악성앱과 구글 플레이스토어에서 수집한 9,306개 정상앱으로 구성되어 있다. 모든 앱 파일은 malwares.com 및 VirusTotal 조회를 통해 악성여부를 재확인하여, 데이터의 신뢰성 확보를 위해 노력하였다.
본 데이터셋은 정보보호 R&D 데이터 챌린지 대회의 예선 학습용, 예선 평가용, 본선 1차 평가용, 본선 2차 평가용으로 구분되어 있다. 또한 정상앱과 악성앱이 구분되어 있어, 다양한 안드로이드 악성 앱 탐지 기술의 성능평가에 활용 가능할 것으로 기대된다.
- Jang, Jae-wook, et al. "Detecting and classifying method based on similarity matching of Android malware behavior with profile." SpringerPlus 5.1 (2016): 1.
- Jang, Jae-wook, et al. "Andro-profiler: anti-malware system based on behavior profiling of mobile malware." Proceedings of the companion publication of the 23rd international conference on World wide web companion. International World Wide Web Conferences Steering Committee, 2014. (WWW 2014)