Home > 전체기사
[주말판] 인공지능 말하고 싶다면 반드시 기억해야 할 용어 12
  |  입력 : 2017-09-30 11:51
페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기
다트머스 워크숍, 튜링 테스트부터 예측 분석과 챗봇까지
인공지능과 관련된 공포감 넘치는 상상력 때문에 더 부드러운 말 나오기도


[보안뉴스 문가용 기자] 갑자기 인공지능이 세상 모든 곳에서 보이기 시작했다. 사람처럼 생각하고 학습하는 기계에 대한 꿈이 드디어 실현될 수 있다는 희망과 공포에 모두들 부풀어 있다. 혁신적인 영화가 나와 갑자기 신드롬이 일어난 것도 아니고, 알파고가 인간을 바둑에서 충격적으로 찍어 누른 것도 이미 지난 일이다. 그런데 정신차려보니 인공지능이란 것이 내 주머니 안 핸드폰에 있고, 각종 산업에서 진지하게 인공지능을 도입하려고 한다.

[이미지 = iclickart]


시장 조사 업체인 IDC는 2017년 한 해 기업들이 총 125억 달러를 인공지능에 투자할 것이라고 내다보고 있으며, 2020년 인공지능 시장은 460억 달러 규모로 자랄 것이라고 예상하고 있다. 이 정도 시장 규모면 꼭 전문가가 아니더라도 평범한 소비자의 일상 대화 속에서 인공지능이란 주제가 심심찮게 나올 수 있다는 뜻이 된다. 하지만 그것이 반드시 인공지능에 대한 이해도를 높여주지는 않는다.

최근 국가산업조사기관(National Business Research Institute)이 235명의 기업 임원들을 대상으로 실시한 바에 의하면 1) 인공지능을 업무에 활용하고 있다고 생각한다는 사람이 38%, 실제로 인공지능 기반 기술을 업무에 활용하고 있다는 응답자는 88%였다. 더 해보면 100%가 넘는다. 많은 사람이 이 간단한 질문에도 혼란스러워할 정도로 인공지능을 생각만큼 모른다는 것이다. 그래서 몇 가지 ‘반드시 알아야 하는 키워드’를 준비했다.

1. 인공지능(artificial intelligence)
인공지능이란 무엇인가? 간단히 말하면 사람처럼 생각할 수 있는 기계를 말한다. 컴퓨터는 초창기부터 논리적인 일에는 뛰어난 성능을 자랑했다. 간단한 산술 연산 등은 원시 컴퓨터 시대 때부터도 잘했다. 그렇지만 사진 속 동물이 개인지 고양이인지를 구분해낸다거나 사람의 표정을 보고 기분을 읽을 줄 아는 능력은 백만 년이 흘러가도 컴퓨터가 익힐 수 없는 것처럼 보였다. 지금도 이런 부분이 완벽히 해결됐다고 보기는 힘들다.

인공지능이라는 말은 1956년 한 컴퓨터 과학 워크숍(다트머스 워크숍)에서, 사람에겐 매우 간단한데 컴퓨터에겐 너무나 어려운 작업들에 관해 이야기 하다가 처음 등장했다. 당시 그 워크숍의 결론은 “모두가 힘을 합해 언어를 사용할 줄 알고, 개념화와 추상화를 할 줄 알며, 인간들만 해결할 수 있는 것으로 여겨지는 문제를 풀 줄 아는 기계를 만들자”였다. 그들이 인공지능 분야의 개척자였다.

그리고 그들의 연구는 오늘날까지 이어져 오고 있다. 그리고 자연어 처리, 영상 인식, 머신러닝 등의 세부 분야들이 생겨나 인공지능의 중요한 축들을 이루고 있는 상태이며, 세분화 과정은 계속해서 진행 중이다. 그래서 사회 지능, 창의력, 자율주행차, 추천엔진(recommendation engine) 등의 분야가 새롭게 만들어지고 있는 중이다. 이런 모든 분야들을 아울러 ‘인공지능’이라고 한다.

2. 머신러닝(machine learning)
머신러닝은 인공지능이라는 큰 개념의 한 항목이다. 위에서 말한 그 50년대의 컴퓨터 과학 워크숍에 모인 학자들의 목표 중 하나가 “스스로를 향상시킬 줄 아는 기계”를 만드는 것이었는데, 그것의 현대화된 개념이 바로 머신러닝이라고 말할 수 있다. 경험과 학습을 통해 어떤 것이 더 발전된 방향인지 판단하고 그것을 직접 실행할 수 있는 기계를 그들은 꿈꿔왔다. 초창기 컴퓨터 과학자인 아서 사무엘(Arthur Samuel)은 머신러닝 능력을 갖춘 컴퓨터는 “프로그램화될 필요 없이 학습을 진행할 줄 아는 것”이라고 정의했다. 이 정의는 아직도 유효하다.

그때부터 컴퓨터 과학자들은 여러 방법들을 고안해 학습하는 기계들을 만드는 시도를 해왔다. 지도 학습 혹은 감독 학습(supervised learning)이라고 하는 알고리즘을 개발하고 자율 학습(unsupervised learning)이라는 알고리즘(이 두 알고리즘은 6번과 7번에서 설명된다)도 개발했다. 기계에게 시간을 주고, 스스로 발전할 수 있도록 하는 알고리즘이었다. 그 알고리즘들은 이미 소비자들에게 도움을 주고 있다. 아마존이나 넷플릭스의 서비자라면 추천 아이템으로부터 도움을 받아본 적이 있을 텐데, 그것들이 바로 머신러닝이 상용화된 예다. 하지만 빅데이터 분석 분야에서 머신러닝은 가장 큰 기대를 모으고 있다.

3. 딥 러닝(deep learning)
머신러닝이 인공지능의 한 축을 담당하는 것처럼, 딥 러닝은 머신러닝이라는 분야의 한 축을 담당한다. 다시 그 50년대의 워크숍으로 이야기를 돌려보면, 추상화와 개념화를 할 줄 아는 컴퓨터를 만드는 게 목표였다고 위에서 말했다. 이 부분을 담당하는 것이 바로 딥 러닝이라고 볼 수 있다. 딥 러닝 시스템은 엄청난 양의 데이터를 소화시켜 카테고리를 만들어 분류할 줄 알며, 각 카테고리에 관련 데이터들을 배치시키기도 한다.

예를 들어 컴퓨터에게 개와 고양이를 구분하는 법을 가르치는 과제를 안고 있다고 생각해보자. 프로그래머들로서는 몇 가지 규칙을 뽑아내 고양이와 개란 무엇인지 정의를 내려서 입력할 수 있다. 하지만 컴퓨터가 항상 개와 고양이를 구분하게 하는 규칙을 뽑아내고 그걸 알고리즘으로 변형시킨다는 건 정말 어려운 일이다. 하지만 딥 러닝 시스템은 아주 많은 양의 동물 이미지를 흡수해 스스로 일반화 과정을 거친다. 그래서 뭐가 개고 뭐가 고양이인지, 둘의 차이는 무엇인지 익혀나간다.

물론 개와 고양이의 예만 보면 이는 기술 자체의 구현 어려움을 제외하고는 별 문제가 없어 보인다. 그러나 딥 러닝을 가지고 정상인과 비정상인을 구분하는 법을 가르친다면 어떨까? 그 구분을 사람은 할 줄 알까? 딥 러닝이 여러 데이터를 익히게 돼 스스로 정상인과 비정상인에 대한 개념화를 한다면? 사실 이미 딥 러닝에서 인종차별주의적인 요소가 보고된 예도 있다.

딥 러닝 시스템은 신경망(5번에서 설명된다)이란 것과 그래픽 처리 장치인 GPU에 의존한다. GPU는 많은 데이터를 동시에 처리하는 데 매우 특화되어 있는 컴퓨터 칩이다. 물론 비디오와 그래픽을 처리하는 게 가장 큰 임무이지만, 빅데이터 처리에도 뛰어난 모습을 보이고 있어 인공지능 시대에 새롭게 각광받고 있다.

4. 인지 컴퓨팅(cognitive computing)
어쩌면 이 기사를 통해 다룰 용어들 중 가장 정의하기 쉬운 단어일지도 모르겠다. 인지 컴퓨팅은 본질적으로 인공지능과 같은 뜻이라고 볼 수 있다. 다만 ‘인공으로 만들어낸 지능’이라는 말보다 덜 무섭게 순화되었을 뿐이다.

우리는 인공지능이 인간을 지배하는 디스토피아 장르 영화와 소설들에 익숙하다. 오랜 세월 이러한 상상력이 쌓인 덕분에 ‘인공지능’이라는 말에 원래 의도와는 상관없는 부정적인 뉘앙스가 붙어버렸다. 이런 현상 때문에 가장 곤혹스러운 건 마케팅 팀들이었다. 그래서 인공지능에 대해 말하지만 ‘인공지능’이라는 단어를 직접 언급하지 않기 위해 만든 말이 인지 컴퓨팅이다. 더 정확히는 인공지능 기술을 기반으로 만든 제품들을 묘사할 때 인지 컴퓨팅이란 말이 많이 동원된다. 그래서 모두가 동의한 ‘과학적 정의’는 존재하지 않는다. IBM이 왓슨 플랫폼에 대해 설명할 때 특히 ‘인지 컴퓨팅’이란 말을 즐겨 사용한다.

5. 신경망(neural network)
신경망은 이름이 대단히 많은 개념이다. 인공 신경망(artificial neural network), 신경회로망(neural net), 딥 신경회로망(deep neural net) 등등이 가장 대표적이다. 그렇지만 이 모든 용어들이 지칭하는 건 딱 한 가지다. 인간의 진짜 뇌를 흉내 낸 컴퓨터 시스템이 바로 그것이다.

1956년의 다트머스 워크숍에서 과학자들이 처음 인공지능이란 말을 사용하기 시작했다고 말했었다. 당시 그 자리에 있던 과학자들은 “학습의 모든 과정과 지능을 구성하는 모든 요소들은 원칙적으로는 정확하고 세밀하게 묘사하는 게 가능하며, 그러므로 기계에게 이를 흉내 내도록 만들 수 있다”고 생각했다. 당시 분위기에서 이러한 믿음은 ‘매우 쉽다’라는 전제까지 붙었고, 사람의 뇌를 기계로 구현해낸다는 것에 대해 ‘어떻게 하지?’라는 걱정도 없었다고 전해진다. 10명의 전문가만 붙으면 2개월 안에 기계 뇌가 탄생할 것이라고 믿었다고 한다.

물론 지금 우리는 그 수치(10명이 2개월)가 얼마나 비현실적인 것인지 알고 있다. 왜냐하면 전 세계의 수많은 전문가들이 그때부터 지금까지 기계 뇌를 완벽히 만들어내지 못하고 있기 때문이다. 그렇다고 아무것도 이루지 못한 것은 아니다. 컴퓨터 과학자들은 지난 세월 동안 인간의 뇌와 똑같이 작동하는 기계를 만들기 위한 길을 착착 걸어왔다. 신경망도 그 성과 중 하나다. 우리 뇌에는 뉴런이라는 게 있다면 신경망에는 노드가 있다. 뇌가 뉴런을 통해 많은 일을 하듯, 신경망도 노드를 통해 다양한 임무를 수행한다. 컴퓨터 비전, 음성 인식, 보드게임 전략 짜기 등이 바로 그것이다.

6. 감독 학습과 자율 학습
인공지능의 머신러닝과 딥 러닝이라는 분야로 돌아가 보자. 이 분야의 과학자들은 ‘컴퓨터를 어떻게 가르칠 것인가?’하는 고민을 하다가 여러 가지 방법을 고안해냈다. 그 중 가장 대표적인 두 가지가 감독 학습과 자율 학습이다.

감독 학습이란 컴퓨터에게 인간 선생님을 배정해주는 것이다. 이 선생님이 컴퓨터에게 수많은 예들과 데이터를 선별해준다. 인간 선생님은 컴퓨터에게 개 이미지를 입력해주면서 ‘이건 개다’라고 말해준다. 마찬가지로 고양이 이미지를 입력하면서 ‘이건 고양이’라고 말해준다. 컴퓨터는 그 가르침에 따라 자신의 학습을 이어나간다.

자율 학습은 어떨까? 컴퓨터에게 선생님도 없고 샘플 데이터도 없다. 다만 혼자서 데이터로부터 패턴을 찾아내도록 임무를 부여받는다. 이럴 때 컴퓨터는 인간이 예상치 못한 통찰을 얻어낸다. 그래서 빅데이터 분석에 있어서 자율 학습 알고리즘이 활용된다.

이 두 가지 학습 방법론 뒤로 많이 사용되고 있는 건 반구조학습(semi-structured learning)이다. 컴퓨터에게 일부 샘플 데이터를 공급해 학습 과정을 돕되, 이뤄내야 할 임무도 동시에 준다. 그리고 임무를 얼마나 잘 수행해내느냐에 따라 상이나 벌을 주는 학습 방식이 바로 반구조학습이다.

7. 알고리즘(algorithm)
알고리즘의 사전적 정의는 “(특히 컴퓨터 분야에서) 계산과 문제 해결 과정에 있어 따라야 할 규칙이나 과정”이다. 일반인들은 이 알고리즘을 어떻게 이해하고 있을까? 보통의 경우 수학적인 분야와 관련된 작업 프로세스를 말한다. 사실 우리는 초등학교 때 이미 알고리즘에 대해 어느 정도 배운다. 숫자를 나누고, 곱하고, 빼는 과정이 어떤 원리로 이뤄지는 건지 배우는데, 그런 논리적 구조가 바로 알고리즘이다.

인공지능과 머신러닝에서 말하는 알고리즘도 그리 다르지 않다. 다만 수학 연산식보다 훨씬 더 복잡할 뿐이다. 예를 들어 구글은 알고리즘을 활용해 검색 결과 창에 어떤 웹사이트가 가장 위에 나타날 것인지를 판단한다. 즉, 여기에는 구글이 정해둔 특정한 규칙이 있어, 그 규칙을 근거로 검색 결과 순서가 정해진다는 것이다. 머신러닝 분야에서 기계들은 수많은 종류의 알고리즘을 활용해 결과를 얻어낸다. 판단 트리(decision tree), 군집 기법(clustering algorithms), 분류 알고리즘(classification algorithm), 회귀 알고리즘(regression algorithm)이 가장 널리 알려진 알고리즘들이다.

8. 챗봇(Chatbot)
인터랙티브 에이전트(interactive agent)라고 불리기도 하는 챗봇은 자연어 처리 능력을 활용하는 인공지능 상품 혹은 서비스로, ‘인간과의 대화’를 수행하는 기능을 가졌다. 애플의 시리, 마이크로소프트의 코타나, 아마존의 알렉사가 가장 대표적인 챗봇이다. 하지만 그 외에도 많은 기업들이 챗봇에 지속적인 투자를 감행하고 있다. 고객들의 기술 지원 문의에 대응하는 데에 특히나 많은 연구가 진행되고 있고, 실제 도입한 기업들도 상당수다. 고객과 기업의 상호작용에 인공지능은 이미 깊이 들어와 있다고 볼 수 있다. 하지만 인간 상담원의 수준에는 미치지 못하고 있다.

9. 데이터 마이닝(data mining)
데이터 채굴 혹은 데이터 마이닝이란, 많은 데이터 내에서 패턴을 찾아내는 걸 말한다. 깊이 들여다보지 않으면 보이지 않고 간과될 수 있는 트렌드나 연관성을 파악해내는 데 아주 유용하다. 예를 들어 대형 마트의 영업 실적 데이터에 데이터 마이닝을 적용하면 같은 감자칩류 과자인데 동부 지방과 서부 지방 사람들이 선호하는 브랜드가 다르다는 걸 알아낼 수 있거나, 10월에는 유독 판매가 높은 상품이 있다는 정보를 얻어낼 수 있다. 물론 데이터 마이닝을 해주는 툴에 반드시 인공지능이나 머신러닝이 적용되는 건 아니다. 하지만 머신러닝에 대한 유행 때문인지 최신 마이닝 툴들에는 거의 전부 인공지능 기능이 첨가되어 있다.

10. 자연어 처리(natural language processing)
자연어 처리는 사람들의 말글, 즉 언어와 관련된 행동들을 기계가 이해할 수 있게 해주는 기능이다. 또한 기계가 사람처럼 말을 하도록 해주는 기능까지도 포함하는 개념이다. 기계는 프로그래밍 언어를 이해하는 데에는 문제가 없다. 하지만 한국어나 영어, 중국어, 스페인어 등 우리가 태어나면서부터 익히는 평범한 말들은 아직도 잘 구사하지 못한다.

그래도 초창기 검색 환경을 생각해보면 자연어 처리 기능이 얼마나 획기적으로 발전해왔는지 이해할 수 있을 것이다. 인터넷이 처음 등장했을 때 사용자들은 ‘OR’, ‘AND’ 등 불 방식(Boolean)의 연산자를 입력해 검색했다. 예를 들면 ‘인공지능’ OR ‘머신러닝’ AND ‘보안뉴스’라고 입력을 해야만 이 기사가 검색될 수 있었다는 것이다. 하지만 오늘 날은 어떤가? ‘인공지능이란 무엇인가?’만 구글에 입력해도 관련 문건이나 뉴스 기사를 읽어볼 수 있다.

11. 예측 분석(predictive analytics)
이제 거의 모든 주요 기업들이 빅데이터 분석 기능을 갖추고 있으며, 이를 통해 사업을 진행해나간다. 예측 분석은 이러한 데이터 분석의 한 분야로, 특별히 ‘앞으로 어떤 일이 일어날까?’에 대한 답을 추구하도록 분석이 진행된다. 예측 분석 시스템에 지난 10년 치의 영업 데이터를 입력하면 현재의 트렌드를 고려해 다음 1사분기에 일어날 일들을 전망할 수 있다. 현대의 예측 분석 솔루션들은 대부분 데이터 마이닝 기술과 머신러닝 기술을 혼합한 것이다. 또한 현재까지는 인공지능의 가장 적극적인 활용 사례라고도 볼 수 있다. 물론 앞으로 일어날 일을 예견하는 것이므로 결과물이 다 정확히 들어맞는 건 아니다.

12. 튜링 테스트(Turing Test)
튜링 테스트는 이름에서도 볼 수 있듯 ‘인공지능의 아버지’라고도 알려져 있는 알란 튜링(Alan Turing)이라는 인물이 고안한 것이다. 튜링은 ‘기계가 인공지능이라고 불릴 만큼의 지능을 실제 탑재하고 있는지 아닌지’ 실험해볼 수 있는 간단한 방법을 제안했다. 인간 실험자가 여러 가지 질문들을 타이핑해서 기계와 인간에게 동시에 주고 그에 대한 답을 각자가 입력하도록 하는 것이다. 당연히 질문자는 누가 어떤 답을 줬는지 모른다. 주어진 답변들만을 보고 어떤 것이 기계이고 어떤 것이 인간인지 유추하는 방법 뿐인데, 이 유추 과정을 통해 기계와 인간을 구분할 수 없다면 기계에겐 진정한 인공지능이 생긴 것이라고 튜링은 주장했다.

최근 특정 알고리즘 혹은 기계들이 이 실험을 통과했다는 말들이 나오기 시작했다. 그러나 모두가 동의할만한 ‘성적’을 받은 건 아니었다. 논란의 여지가 항상 있었다. 게다가 튜링 테스트가 정말 신뢰할만한 실험인가, 하는 의문들도 불거지고 있다. 튜링 테스트가 앞으로도 계속 유효할지는 모르겠지만, 인공지능이라는 분야의 커다란 상징처럼 남아있을 건 분명해 보인다.
[국제부 문가용 기자(globoan@boannews.com)]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>

  •  
  • 4
  • 페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기


  •  SNS에서도 보안뉴스를 받아보세요!! 
그린존시큐리티 4개월 배너모니터랩 파워비즈 6개월 2020년6월22~12월 22일 까지넷앤드 파워비즈 진행 2020년1월8일 시작~2021년 1월8일까지위즈디엔에스 2018파워비즈배너 시작 11월6일 20181105-20200131
설문조사
코로나19 팬더믹 이후, 가장 기승을 부리고 있는 사이버 공격 유형은 무엇이라고 보시나요?
랜섬웨어
피싱/스미싱
스피어피싱(표적 공격)/국가 지원 해킹 공격
디도스 공격
혹스(사기) 메일
악성 앱
해적판 소프트웨어
기타(댓글로)