Home > 전체기사
마이크로소프트, 사람처럼 사진 설명하는 AI 선봬
  |  입력 : 2020-10-20 18:01
페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기
기존 이미지 캡셔닝 기술 고도화로 사람 수준에 도달했다고 밝혀
올해 말 MS 오피스 등에 적용해 누구나 쉽게 기술 접하도록 할 계획


[보안뉴스 이상우 기자] 마이크로소프트가 인공지능 기반 이미지 캡셔닝 기술을 고도화하고, 모든 사용자가 더 쉽게 사용할 수 있도록 지원한다고 밝혔다. ‘알트 텍스트(alt text)’로 알려진 마이크로소프트 이미지 캡셔닝 기술은 다양한 이미지를 인식 및 분석하고 이를 자연어로 해설해준다. 쉽게 말해 인공지능이 사진 속 장면을 마치 사람처럼 설명할 수 있는 기술이다.

▲이미지 캡셔닝은 인공지능이 사진 속 장면을 사람처럼 설명하는 기술이다[사진=마이크로소프트]


MS는 이번 업데이트를 통해 해당 기술이 사람과 비슷한 수준에 도달했으며, 자동화를 통해 검색 엔진부터 프레젠테이션 슬라이드의 이미지에 대한 설명까지 다양한 영역에 적용할 수 있다고 소개했다.

또한, 이러한 기술 향상을 위해 아이가 그림책을 통해 표현을 배우는 방식을 사용했다고 밝혔다. 먼저 MS는 인공지능 학습 모델에 단순한 어휘를 붙인 이미지를 학습시켰다. 인공지능은 각각의 어휘를 사진 내에 있는 특정 이미지에 대입해 학습했고, 정밀교정을 거쳐 문장을 작성하는 방법을 배웠다. 마치 아이들이 언어를 익힐 때 사과 사진 한 장과 ‘사과’라는 단어를 먼저 보고 배운 뒤, 다른 사진 속에 들어있는 사과를 찾는 것과 비슷하다.

이 같은 학습 방식은 기존처럼 완성된 문장을 학습하는 방식 보다 더 효과적인 결과를 냈다. 이를 통해 새로운 개체가 포함되어 있는 사진도 시각적 정보를 사용해 설명할 수 있게 됐다.예를 들어 기존에는 “곡물 확대 사진”이나 “산 정상 위 남자” 등으로 설명했던 사진을 “들판 속 보리 확대 사진”이나 “서핑 보드를 들고 있는 남성” 등으로 더 구체적이고 정확한 어휘로 표현할 수 있게 됐다.

업그레이드된 이미지 캡셔닝 기술은 현재 애저 코그니티브 서비스(컴퓨터 비전)을 통해 사용 가능하다. MS는 올해 말 이 기술을 워드, 파워포인트, 아웃룩 등 MS오피스에 적용할 계획이다. 또, 이 기술을 시각장애인에게 주변 환경, 인물, 사물, 글자, 이미지 등을 설명해 주는 모바일 앱 ‘시각 AI(Seeing AI)’와도 통합한다. 이를 통해 시각 장애인이나 시력이 좋지 않은 사람들에게 사진을 음성으로 묘사해주는 등 보다 정확하고 풍부한 정보 전달할 수 있을 전망이다.

MS AI 플랫폼 그룹 사킵 사이크(Saquib Shaikh) 매니저는 “모두가 알트 텍스트 기능을 문서, 웹, 소셜 미디어 등의 이미지에 적용한다면, 시각장애인도 콘텐츠를 더욱 쉽게 이해하고 사람들과의 대화에 참여할 수 있을 것"이라고 말했다.
[이상우 기자(boan@boannews.com)]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>

  •  
  • 0
  • 페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기


  •  SNS에서도 보안뉴스를 받아보세요!! 
그린존시큐리티 4개월 배너모니터랩 파워비즈 6개월 2020년6월22~12월 22일 까지넷앤드 파워비즈 진행 2020년1월8일 시작~2021년 1월8일까지위즈디엔에스 2018파워비즈배너 시작 11월6일 20181105-20200131
설문조사
최근 잇따른 기밀 유출 사건으로 인해 종이유출차단방지(출력물) 보안 솔루션의 도입 필요성이 높아지고 있는데요. 해당 솔루션 도입을 위한 비용은 어느 정도가 적정하다고 보시나요?
2천만원 이하
5천만원 이하
1억원 이하
1~2억원 이내
2억원 이상