2020 K-사이버 시큐리티 챌린지 대회의 “AI기반 취약점 자동탐지” 트랙에 활용된 취약점이 포함된 바이너리 데이터셋 120종이다.
시스템 해킹과 관련된 CWE 취약점 목록을 추출하여 개발하였으며, 공개된 오픈소스 툴을 활용하여 풀릴 수 있는 수준으로 미국 CGC(Cyber Grand Challenge 2016) 문제보다 쉽게 개발되었다.
본 데이터셋은 바이너리의 취약점을 자동으로 탐지하고 공격할 수 있는 알고리즘과 프로그램을 제시하는 대회에 활용된 데이터셋으로, 탐지 정확도를 측정하고 AI 알고리즘을 개선하는 등 다양한 용도로 활용 가능하다.