Home > 전체기사

[구축사례] 서초구의 야간 사건·사고 대응 위한 IR·열화상 데이터셋 구축사업

  |  입력 : 2021-11-18 10:23
페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기
야간관제 효율성 향상 위한 서초구의 노력
전문 촬영팀과 액션배우 등 통해 사건 4개 항목 및 사고 10개 항목 데이터 제작


[보안뉴스= 전현상 베네솔루션 대표·사업추진 사무국 PM] 서울시 서초구는 2020년 과학기술정보통신부와 한국지능정보사회진흥원이 주관한 ‘인공지능 학습용 데이터셋 구축사업(2차)’ 자유 과제 부문 ‘도심 혼잡 버드뷰 AI 데이터’를 성공적으로 수행한 경험이 있다. 그리고 2020년도의 사업 수행 경험을 바탕으로 서초구는 2021년 6월, 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 인공지능 학습용 데이터 구축사업의 안전 환경 부문에 씨프로와 비젼인, 한국영상정보연구조합과 컨소시엄을 구성해 최고 점수로 선정됐다. 이에 2021년 12월까지 ‘야간 사건·사고 대응을 위한 IR·열화상 데이터셋’ 구축을 진행하고 있다.

▲서초구청 전경[사진=서초구청]


서초구는 반포대교 의대생 사건을 계기로 ‘CCTV 야간 관제의 효율성 향상을 위한 고민’을 데이터셋 자유과제의 주제로 선정했다. 구체적인 사업내용은 관내의 저조도 위험 지역에 대한 야간 IR, 회전형 열화상 카메라 촬영을 통한 방범용 영상과 사건·사고를 재연한 영상을 수집해 야간 관제 효율성 향상을 위한 데이터셋을 제작하는 것이다. 이러한 사건·사고 데이터셋의 제작 과정과 서초구 컨소시엄의 여정을 다음과 같이 정리한다.

▲인공지능 학습용 데이터셋 구축 사업 선정 결과 화면[사진=서초구청]


어디서도 볼 수 없던 데이터의 수집
서초구는 야간의 사건·사고 영상 확보를 위해 31대의 IR 카메라와 17대의 열화상 카메라를 저조도 위험 지역에 설치해 방범 목적으로 운영되는 실제 영상과 사건·사고를 연기한 재연 영상을 수집했다. 실제 영상과 재연 영상은 사건·사고 상황이 자주 발생하는 사람과 오토바이·자전거·킥보드를 대상으로 선정해 안전 환경 분야에 크게 이바지할 수 있도록 수집 목표를 세웠다.

IR·열화상 카메라와 재연 영상을 선택한 이유
야간 사건·사고 영상 확보를 위한 데이터 수집에는 크게 두 가지 문제가 있었다. 첫 번째는 저조도 위험 지역의 방범용 CCTV는 야간에 맨눈으로 식별할 수 없을 정도의 어두운 화면을 송출하고 있었으며, 두 번째 문제는 사건·사고를 방범용 CCTV로 찾는 건 하늘의 별 따기였다. 서초구는 이런 문제를 해결하고자 방범용 CCTV의 IR 기능을 활용해 야간영상을 수집하고 저조도 위험 지역 중 상대적으로 사람이 많이 다니는 장소에 열화상 카메라를 설치했다. 사건·사고 영상 확보에는 섭외된 전문 촬영팀과 액션 배우들이 4개 항목의 사건과 10개 항목의 사고를 연기해 양질의 데이터를 수집하기 위한 노력을 서슴지 않았다.

▲왼쪽부터 재연영상 테스트 촬영 현장, 재연영상 IR 화면, 재연영상 열화상 화면[사진=서초구청]


▲왼쪽 상단부터 시계방향으로 주간화면 기준으로 동일 장소, 같은 시간대의 주간화면과 야간 화면, IR 화면, 열화상 화면[사진=서초구청]


기존과는 다른 VDI 구축 통한 데이터 가공
기존의 데이터 가공은 수집된 데이터를 가공 작업자가 파일을 내려 받아 진행하는데, 이런 작업 방식은 개인 식별 가능 정보 유출의 위험성이 있다. 서초구는 개인정보 보호를 위해 라벨러들에게 기존과 전혀 다른 데이터 가공 작업 환경을 제공했다. 데이터 유통이 불가능한 VDI(데스크톱 가상화 : Virtual Desktop Infrastructure)를 구축해 개인정보 유통과 개인정보 침해에 대한 근본적인 해결책을 제시했으며, 비대면 시대에 맞춰 라벨러들을 VDI client를 통해 원하는 장소에서 서초구 데이터셋 플랫폼에 접속해 작업하는 환경을 제공했다. 특히, 라벨러로 속해 있는 거동이 불편한 어르신이나 장애인에게 최적의 작업 환경을 제공할 수 있도록 고려했다.

작업·관리 효율성 높인 데이터셋 플랫폼
서초구는 데이터 가공 작업 및 데이터 품질 관리 효율성을 위해 데이터셋 플랫폼을 구축했다. 데이터셋 플랫폼은 라벨러에게 보다 익숙한 작업 환경을 제공하기 위해 오픈소스 CVAT를 기반으로 개발돼 라벨러는 보다 익숙한 환경에서 직관적인 라벨링 작업을 진행했다. 라벨링 된 작업물은 3차 검수 과정을 거쳐 양질의 데이터로 제작된다.

▲왼쪽 상단부터 시계방향으로 데이터셋 플랫폼 작업화면[사진=서초구청]


수요자 관점의 데이터 제공
서초구 컨소시엄은 실제 영상과 재연 영상 등 총 363시간 라벨링 된 영상과 메타데이터를 결과물로 제공할 예정이다. 제공되는 데이터는 객체 데이터와 시계열 데이터로 구분되며 두 데이터 중 객체 데이터는 타 주관사에서도 제공할 수 있지만, 시계열 데이터는 타 주관사에서는 제공하지 못할 양질의 데이터다. 이러한 양질의 데이터가 제공되는 가장 큰 이유는 지능형 영상분석 카메라 제조사인 씨프로와 딥러닝 영상분석 원천기술을 보유한 비젼인이 수요자 관점에서 데이터를 생산할 수 있도록 많은 고민과 노력을 기울였기 때문이다.

▲라벨링된 객체데이터[사진=서초구청]



▲왼쪽 상단부터 시계방향으로 라벨링된 시계열데이터 취객 쓰러짐[사진=서초구청]


▲왼쪽부터 침입 시나리오 동선과 킥보드 낙차 시나리오 동선[사진=서초구청]


데이터의 광범위한 활용
이렇게 준비된 데이터셋은 ‘저조도에서 특정 구역 침입’, ‘방범용 야간 육안관제 대체 솔루션 개발’ 등 안전 목적을 위한 AI 엔진 및 서비스의 기준 데이터나 사회안전망 구축 등 다양한 실증 서비스 기준 데이터로 활용될 수 있다. 또한, 다른 방식의 라벨링 데이터가 필요한 수요자를 위해 영상 363시간, 이미지 221만장 등 충분한 양의 원본 데이터와 서초구 컨소시엄이 디자인한 라벨링 데이터가 함께 제공될 예정이다.

차별화된 데이터셋을 위한 제언
데이터셋 사업이 활성화되기 이전에는 AI 서비스 개발 기업은 차량의 번호판 또는 사람, 자전거 등 라벨링 된 객체 데이터의 수요도가 높았다. 하지만 데이터셋 사업이 활성화된 지금은 라벨링 된 객체 데이터의 공급이 충분히 이루어져 많은 AI 서비스 개발 기업들은 어디서나 쉽게 구할 수 없는 차별화된 데이터를 원하고 있다. 서초구는 이번 사업을 통해 차별화된 시계열 데이터 제공으로 수요자들의 요구를 충족시키기 위해 노력하고 있다.

차별화된 데이터셋 제작을 위한 가장 좋은 장소는 공공기관의 통합관제센터이다. 통합관제센터를 가진 공공기관이 주관기관이 된다면 각 관내 곳곳의 방범용 CCTV를 통해 원본 데이터 수집이 쉬우며 현재까지 운영하며 수집된 관제 데이터를 통해 새로운 데이터셋을 창출해낼 수 있다. 또한, 공공기관의 도덕성을 바탕으로 한 데이터 신뢰도 하락 방지 조치로 무의미한 다량의 저품질 데이터셋이 구축되는 일은 피할 수 있을 것이다. 이런 특장점을 살려 공공기관의 데이터셋 과제에 적극적으로 참여하는 분위기가 조성되길 바란다.

끝으로 라벨러라는 직업은 사회적 관점으로 사회적 약자나 사회로의 재진입이 어려운 이에게는 희망적인 일자리이다. 주관기업들은 라벨러들에게 정확한 사업개요를 설명해 사회의 도움이 된다는 희망을 심어주고 건실한 사회의 일원이라는 사회적 소속감을 느낄 수 있도록 노력해야 한다. 서초구 컨소시엄은 이에 알맞은 처우를 규정·보장하며, 최저시급 이상의 일자리가 제공되게 함으로써 사업의 취지를 살리기 위해 노력하고 있다.
[글_ 전현상 베네솔루션 대표·사업추진 사무국 PM]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>

  •  
  • 0
  • 페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기

  •  SNS에서도 보안뉴스를 받아보세요!! 
모니터랩 파워비즈 6개월 2021년7월1~12월31일 까지2021 전망보고서위즈디엔에스 2018파워비즈배너 시작 11월6일 20181105-20200131
설문조사
2021년 주요 보안 위협 트렌드 가운데 올해 말까지 가장 큰 위협이 될 것으로 전망되는 트렌드 한 가지만 꼽아주신다면?
산업 전반에 영향 미치는 타깃형 랜섬웨어 공격 증가
다크웹/딥웹 등을 통한 기업 주요 정보 유출 및 판매 피해 급증
북한/중국/러시아 등 국가지원 해킹그룹의 위협 확대
코로나 팬더믹 등 사회적 이슈 악용한 사이버 공격
서드파티 SW나 조직 인프라 솔루션을 통한 공급망 공격 증가
업무 메일로 위장한 정보유출형 악성코드 활개
기타(댓글로)