Home > 전체기사
데이터 폭증시대! ‘빅데이터’에 보안이 필요한 이유
  |  입력 : 2015-12-23 22:35
페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기
[인터뷰] 맵알테크놀러지스 코리아 홍준혁 이사
빅데이터 플랫폼 ‘하둡’에 보안을 입히면 모든 것을 한 눈에


[보안뉴스 김태형] 최근 기업의 IT 환경이 복잡·다단해지고 관련한 데이터의 양도 어마어마하게 늘어나고 있어 ‘데이터 폭증 시대’라고도 일컬어진다. 이러한 빅데이터 시대에 기업들은 데이터의 효율적인 관리와 활용을 위해 빅데이터 플랫폼 ‘하둡(Hadoop)’을 사용하고 있다.

기업용 하둡 플랫폼을 배포하는 맵알테크놀러지스 코리아(이하 맵알)의 홍준혁 이사는 “기존에는 몇몇 통신사와 게임사에서 로그분석을 위해서 하둡을 많이 사용하고 있었는데, 이제는 영상·음성·웹페이지 방문 고객에 대한 클릭 스트림 등 다양한 데이터들을 저장·관리·분석하기 위해 하둡 플랫폼을 많이 사용하고 있다”면서 “이러한 하둡에는 기업의 여러 가지 중요한 정보들을 저장·관리하고 있다. 하지만 이에 대한 보안은 아직 미흡하고 그 성장세가 아주 느리다”고 설명했다.

빅데이터는 대개 전통적인 데이터베이스(DB)나 시스템 환경에서 처리하기 힘든 대용량 데이터를 저장·분석·처리를 통해 가치 있는 정보로 만들어낸다. 이러한 대용량 데이터를 처리하는 데에는 바로 ‘하둡(Hadoop)’을 이용한다. 이에 하둡은 빅데이터를 다루는 개발자들의 많은 관심을 받고 있다.

홍준혁 이사는 “하둡은 여러 개의 작은 컴퓨터를 마치 하나인 것처럼 묶어 대용량 데이터를 처리하는 기술인데, 하둡은 수천대의 분산된 X86 장비에 대용량 파일을 저장할 수 있는 기능을 제공하는 분산파일 시스템과 저장된 파일 데이터를 분산된 서버의 CPU와 메모리 자원을 이용해 쉽고 빠르게 분석할 수 있는 컴퓨팅 플랫폼인 맵리듀스(MapReduce)로 구성돼 있다”면서 “값비싼 외부 저장장치나 데이터 웨어하우스(Data Warehouse)를 사용하는 것보다 오픈 소스인 하둡을 사용하는 것이 비용절감 등에서 효율적이며 설치와 사용 및 관리가 쉽기 때문에 기업과 금융권, 그리고 공공분야에서 많이 사용하고 있다”고 덧붙였다.

하지만 이러한 하둡 사용 고객들이 하둡에 대한 보안을 고려하지 않는 점이 문제다. 그 이유는 플랫폼이 어렵고 비용이 많이 들어가기 때문. 무엇보다 중요한 것은 기업의 빅데이터를 저장·관리하는 하둡에는 중요하고 다양한 데이터들이 포함되어 있는데, 고객들은 이에 대한 보안에 대해서는 미처 생각하고 있지 못하다는 점이다.

홍 이사는 “고객들은 기존 시스템에 대한 이해는 잘 하고 있어 여러 가지 보안 시스템을 구축하고 보안관리를 하고 있다. 그런데 하둡의 빅데이터들도 기존 시스템과 같이 다양한 업무를 처리하고 있기 때문에 컴플라이언스와 거버넌스 등을 맞추어 데이터 보호가 필요하다”면서 “하둡의 빅데이터는 기존 시스템과 스케일만 다를 뿐, 데이터 보호 측면에서는 모두 동일하기 때문에 보안도 동일하게 적용해야 한다”고 강조했다.

기존 정보계 시스템의 어플리케이션은 한정적이지만, 빅데이터 플랫폼인 하둡에는 모든 어플리케이션이 동작하고 있어 보다 많은 일을 처리할 수 있다. 또한, 하둡에는 영상·음성 등 비정형 데이터들도 저장되기 때문에 어떤 환경에서도 다른 모든 데이터들을 처리할 수 있는 유연성이 있다.

그는 “이와 같이 수많은 데이터의 처리와 보안을 위해서는 그 제품에 대한 신뢰성이 있어야 한다. 즉 고객 입장에서 빅데이터 플랫폼을 신뢰할 수 있느냐가 관건인데, 맵알의 하둡 솔루션은 유연한 인증과 외부 유출 방지를 위한 보안 기능이 포함되어 있다”면서 “모든 데이터를 암호화 처리해서 네트워크를 통한 취약점 공격으로 데이터 침해 사고가 발생해도 암호화된 데이터이기 때문에 유출되었더라도 이를 확인할 수 없다”고 설명했다.

또한, 허가된 사용자만 접근이 가능한 알고리즘이 적용되어 있고 데이터 접근 통제, 즉 하둡은 파일 형태로 저장되는데 데이터를 단순히 읽고 쓰는 기능뿐만 아니라 특정 그룹의 사용자에 따라 엑세스를 제한할 수도 있고 허용할 수 도 있는 기능을 제공한다. 이를 통해서 하둡 관리자는 어떤 사용자가 어떤 데이터를 접근했고 언제 어떤 데이터를 읽었거나 업데이트 했는지 등을 분석·저장하기 때문에 특정인의 데이터 유출 위험성에 대한 패턴 분석으로 보안이 한층 강화된다.

이렇게 되면 하둡 데이터에 대한 허가 없는 사용자 감지나 데이터 유출 등에 대한 조치가 가능하다. 또한 실시간 보안 로그 분석을 통해 외부의 다양한 데이터와 로그들을 실시간 스트림을 통해 저장·분석·처리하고, 그 결과 값을 머신러닝을 통해 예측할 수 있도록 제공하기도 한다.

이러한 문제에 대한 신뢰가 있어야 고객들이 사용하게 된다는 것. 홍 이사는 “국내에서는 국내 유명 대기업과 공공기관 및 은행, 그리고 국내 보안기업 등에서 맵알의 하둡 기반 빅데이터 플랫폼을 이용하고 있어 차별화되고 추가된 보안기능으로 빅데이터에 대해 강화된 보안을 적용하고 있다”면서 “글로벌 기업인텔 시큐리티, 시스코, RSA, 모건스탠리 등에서도 사용하고 있다”고 설명했다. 이와 같은 빅데이터 솔루션 시장은 작년보다 올해에 시장이 더욱 활성화되고 있고, 내년에 금융권이나 공공 및 제조분야에 대기업으로 시장이 확대될 것으로 전망된다.
[김태형 기자(boan@boannews.com)]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>

  •  
  • 1
  • 페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기


  •  SNS에서도 보안뉴스를 받아보세요!! 
넷앤드 파워비즈 진행 2020년1월8일 시작~2021년 1월8일까지위즈디엔에스 2018파워비즈배너 시작 11월6일 20181105-20200131
설문조사
데이터3법 통과로 데이터 보안의 중요성이 더욱 커지고 있는 가운데 귀사에서 사용하고 있는 DB암호화 솔루션의 만족도는 어느 정도인가요?
매우 만족
만족
보통
불만족
당장 바꾸고 싶다
올해 도입 예정
필요성을 못 느낀다
기타(댓글로)