Home > 전체기사

토착어와 문화 살리기 위해 힘 합친 IT 기술과 보안

  |  입력 : 2018-08-01 11:02
페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기 네이버 블로그 보내기
사라져가는 토착어 살리기 위해 클라우드 기반 플랫폼 제작
특정 단어나 표현에 신성화 부여한 문화 있어 강력한 보안 필요하기도


[보안뉴스 문가용 기자] 세계의 여러 토착어와 비토착어가 멸종의 위기에 처해있다. 원주민 인디언이 사용하던 이러쿼이어와 오네이다어는 이제 뉴욕의 일부 구성원들 사이에서만 발견될 뿐이다. 유태인의 언어인 이디시어와 시실리아어, 벨라루스어 역시 위험한 상태이긴 마찬가지다.

[이미지 = iclickart]


캐나다의 브리티시컬럼비아 주는 이런 면에서 꽤나 독특한 경우인데, 왜냐하면 거주자의 60%가 토착어 구사자들이기 때문이다. 물론 그런 토착어에 정말로 유창한 사람은 4% 정도이지만 말이다. 이 4%는 거의 대부분 나이가 지긋한 어르신들이다. 그러므로 이 지역의 토착어도 안전하다고 말할 수는 없다.

이러한 언어들의 멸종을 막기 위해 토착민문화위원회(First Peoples' Cultural council, FPCC)는 새로운 프로젝트를 시작했다. 그래서 탄생한 것이 언어 재활 플랫폼인 퍼스트보이시즈(FirstVoices)다.

퍼스트보이시즈는 언어 되살리기 전문가들이 온라인 상에서 토착어에 관한 여러 가지 정보들을 정리하고 모아둘 수 있게 하며, 토착어 구사자들이 이 정보에 접근할 수 있도록 해준다. 이 플랫폼은 소프트웨어 회사 누세오(Nuxeo)의 오픈소스 클라우드 기반 콘텐츠 서비스 플랫폼에 기반을 두고 있으며, 28개 언어권 내 38개 방언을 유치하고 있다.

이 플랫폼에는 각 언어를 유창하게 구사하는 자들과 언어 되살리기 전문가, 나이 많은 어르신들과 언어학자들의 여러 가지 정보가 수집되어 있으며, 이들은 FPCC가 제공하는 보조금을 받고 정보 수집 및 정리 활동을 진행하고 있다. 이 데이터는 현재 캐나다의 애져 클라우드 내에 저장되어 있다.

FPCC의 CEO인 트레이시 허버트(Tracey Herbert)는 “개발자들에게 줘야 할 수천~수만 달러를 아껴서 토착어 구사자 및 그 커뮤니티에 제공하고 있다”며 “언어를 되살린다는 건 어떤 특정 분야의 전문가들이 할 수 있는 일이 아니라, 관계된 모든 사람의 협업과 정보 공유로만 가능해진다”고 설명한다.

퍼스트보이시즈의 웹 플랫폼은 PC와 모바일 모두에서 사용이 가능하며 약 40만 개의 JSON 객체들을 저장하고 있다. 이 객체들에는 단어, 문장, 노래, 이야기, 녹음된 기록들과 사진, 영상물들이 포함되어 있다. “녹음된 기록물은 전부 어르신들의 발음 및 발성 자료입니다. 언어의 정확한 발음을 남기기 위한 것입니다.”

그리고 FPCC와 브리티시컬럼비아의 캐나다 원주민들은 퍼스트보이시즈를 한층 더 발전시켰다. 그저 언어와 관련된 아카이브 이상을 만들고자 한 것이다. 그래서 iOS와 안드로이드에서 사용할 수 있는 사전 앱과 튜터 앱을 만들었고, 원주민들의 언어를 입력할 수 있는 키보드도 개발했다.

많은 토착어들이 그렇지만 라틴 알파벳을 사용하지 않는 경우가 많다. 브리티시컬럼비아의 이뉴잇족 언어도 그 중 하나다. 글자 체계 자체가 라틴어 계열과 완전히 다르다. 누세오의 부회장인 리사 마르쿠스(Lisa Marcus)는 “그래서 먼저 단어들을 표기할 수 있는 방법과 체계를 만들어야 했다”고 설명한다. “그래야 이 언어에 관심을 가진 사람들이 단어나 문장을 찾아볼 수 있도록 돕는 색인 작업이 가능해지니까요.”

FPCC의 개발 관리자인 다니엘 요나(Daniel Yona)는 “플랫폼 개발을 위해 누세오에 연락을 한 이유는 성숙한 보안 모델을 가지고 있었기 때문”이라고 설명한다. “일부 자산이나 문서에는 단단한 보안 장치가 필요했습니다.” 그 이유에 대해서는 마르쿠스가 설명을 덧붙인다.

“이런 토착어 문화는 종교적인 배경을 가진 경우가 많습니다. 그러므로 꽤나 많은 단어들이 신성시되고, 특수한 경우에만 사용되죠. 약간 이해하기가 어려울 텐데, 사업을 경영하는 사람들에게 있어 개인식별정보와 같은 것들입니다. 그들 문화권에서는 신중하고 안전하게 지켜져야 할 것들이고, 따라서 아무나 접근해서는 안 되는 것들입니다.”

또한 이 언어 살리기 프로젝트의 독특한 특성 중 하나는 언어와 관련된 데이터가 언어 구성원들 사이에서만 존재한다는 것이다. “그렇다는 건 이들만이 가지고 있는 지식을 저작권 보호하듯이 안전하게 지켜줘야 한다는 뜻이 됩니다. 그래서 사전을 만들 때 저작권 보호 조치를 취하기도 했습니다.” 실제로 퍼스트보이시즈 내 모든 데이터는 FPCC 및 이 프로젝트에 참여한 언어 구사자들의 것이다.

FPCC는 퍼스트보이시즈에 대해 “토착민들을 고유 언어 전문가들로서 인정하는 것에서부터 출발한 프로젝트이며, 우리 같은 일반인들도 토착민들처럼 우리만의 데이터를 수집하고 구축해 데이터 주권을 영유할 수 있다는 걸 가르쳐주는 사례”라고 말한다.

“그래서 보안이 튼튼한 누세오를 파트너사로 선택한 것입니다. 데이터 주권을 확립하기 위해서는 확실한 보안이 뒷받침되어야 하니까요. 일반적인 국가의 주권 역시 튼튼한 국방을 바탕으로 하는 것처럼 말이죠.”

FPCC와 누세오의 퍼스트보이시즈는 입소문을 통해 IT와 문화계에 퍼지고 있는 중이다. 그동안 스웨덴, 멕시코, 쿠바, 과테말라 등의 정부 기관이나 시민 단체, 민간 기업에서 관심을 가지고 연락을 취하기도 했다. 그래서 FPCC와 누세오는 “퍼스트보이시즈라는 툴을 좀 더 많은 사람들에게 전파하고 알릴 수 있는 방법을 연구 중에 있다”고 한다.

3줄 요약
1. 일부 언어, 유창한 언어 구사자들 노령화로 멸종 위기에 처했다.
2. 그런 언어 살리기 위한 데이터 아카이브 플랫폼인 퍼스트보이시즈가 탄생했다.
3. 일부 문화권에서는 아무나 접근해서는 안 되는 특별한 단어나 표현이 존재해 튼튼한 보안이 뒷받침되어야만 가능한 프로젝트였다.

[국제부 문가용 기자(globoan@boannews.com)]

Copyrighted 2015. UBM-Tech. 117153:0515BC
<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>

  •  
  • 0
  • 페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기 네이버 블로그 보내기

  •  SNS에서도 보안뉴스를 받아보세요!! 
아스트론시큐리티 파워비즈 2023년2월23일 시작 시큐아이 위즈디엔에스 2018
설문조사
오픈AI가 개발한 인공지능 챗봇 챗GPT가 GPT4 버전까지 나오면서 디지털 혁신의 촉매재 역할을 하고 있습니다. 보안 분야에서도 챗GPT로 인해 보안위협이 가속화될 것이라는 전망과 함께 보안업무에 효과적으로 활용된다면 보안대응 역량 향상에도 크게 기여할 것이라는 의견도 제기됩니다. 이에 대한 여러분들의 생각은 어떠신가요?
챗GPT 악용으로 인해 보안위협이 더욱 고도화되고 증가할 것
챗GPT를 악용하는데 한계가 있어 보안위협이 소폭 늘어나는 추세에 그칠 것
챗GPT 활용에 따라 보안대응 업무에 적지 않은 도움이 될 것
챗GPT의 적극적인 도입 및 적용 통해 보안대응 역량이 획기적으로 향상될 것
보안위협 또는 보안대응과 관련해서는 큰 영향이 없을 것
기타(댓글로)