Home > 전체기사

토착어와 문화 살리기 위해 힘 합친 IT 기술과 보안

  |  입력 : 2018-08-01 11:02
페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기
사라져가는 토착어 살리기 위해 클라우드 기반 플랫폼 제작
특정 단어나 표현에 신성화 부여한 문화 있어 강력한 보안 필요하기도


[보안뉴스 문가용 기자] 세계의 여러 토착어와 비토착어가 멸종의 위기에 처해있다. 원주민 인디언이 사용하던 이러쿼이어와 오네이다어는 이제 뉴욕의 일부 구성원들 사이에서만 발견될 뿐이다. 유태인의 언어인 이디시어와 시실리아어, 벨라루스어 역시 위험한 상태이긴 마찬가지다.

[이미지 = iclickart]


캐나다의 브리티시컬럼비아 주는 이런 면에서 꽤나 독특한 경우인데, 왜냐하면 거주자의 60%가 토착어 구사자들이기 때문이다. 물론 그런 토착어에 정말로 유창한 사람은 4% 정도이지만 말이다. 이 4%는 거의 대부분 나이가 지긋한 어르신들이다. 그러므로 이 지역의 토착어도 안전하다고 말할 수는 없다.

이러한 언어들의 멸종을 막기 위해 토착민문화위원회(First Peoples' Cultural council, FPCC)는 새로운 프로젝트를 시작했다. 그래서 탄생한 것이 언어 재활 플랫폼인 퍼스트보이시즈(FirstVoices)다.

퍼스트보이시즈는 언어 되살리기 전문가들이 온라인 상에서 토착어에 관한 여러 가지 정보들을 정리하고 모아둘 수 있게 하며, 토착어 구사자들이 이 정보에 접근할 수 있도록 해준다. 이 플랫폼은 소프트웨어 회사 누세오(Nuxeo)의 오픈소스 클라우드 기반 콘텐츠 서비스 플랫폼에 기반을 두고 있으며, 28개 언어권 내 38개 방언을 유치하고 있다.

이 플랫폼에는 각 언어를 유창하게 구사하는 자들과 언어 되살리기 전문가, 나이 많은 어르신들과 언어학자들의 여러 가지 정보가 수집되어 있으며, 이들은 FPCC가 제공하는 보조금을 받고 정보 수집 및 정리 활동을 진행하고 있다. 이 데이터는 현재 캐나다의 애져 클라우드 내에 저장되어 있다.

FPCC의 CEO인 트레이시 허버트(Tracey Herbert)는 “개발자들에게 줘야 할 수천~수만 달러를 아껴서 토착어 구사자 및 그 커뮤니티에 제공하고 있다”며 “언어를 되살린다는 건 어떤 특정 분야의 전문가들이 할 수 있는 일이 아니라, 관계된 모든 사람의 협업과 정보 공유로만 가능해진다”고 설명한다.

퍼스트보이시즈의 웹 플랫폼은 PC와 모바일 모두에서 사용이 가능하며 약 40만 개의 JSON 객체들을 저장하고 있다. 이 객체들에는 단어, 문장, 노래, 이야기, 녹음된 기록들과 사진, 영상물들이 포함되어 있다. “녹음된 기록물은 전부 어르신들의 발음 및 발성 자료입니다. 언어의 정확한 발음을 남기기 위한 것입니다.”

그리고 FPCC와 브리티시컬럼비아의 캐나다 원주민들은 퍼스트보이시즈를 한층 더 발전시켰다. 그저 언어와 관련된 아카이브 이상을 만들고자 한 것이다. 그래서 iOS와 안드로이드에서 사용할 수 있는 사전 앱과 튜터 앱을 만들었고, 원주민들의 언어를 입력할 수 있는 키보드도 개발했다.

많은 토착어들이 그렇지만 라틴 알파벳을 사용하지 않는 경우가 많다. 브리티시컬럼비아의 이뉴잇족 언어도 그 중 하나다. 글자 체계 자체가 라틴어 계열과 완전히 다르다. 누세오의 부회장인 리사 마르쿠스(Lisa Marcus)는 “그래서 먼저 단어들을 표기할 수 있는 방법과 체계를 만들어야 했다”고 설명한다. “그래야 이 언어에 관심을 가진 사람들이 단어나 문장을 찾아볼 수 있도록 돕는 색인 작업이 가능해지니까요.”

FPCC의 개발 관리자인 다니엘 요나(Daniel Yona)는 “플랫폼 개발을 위해 누세오에 연락을 한 이유는 성숙한 보안 모델을 가지고 있었기 때문”이라고 설명한다. “일부 자산이나 문서에는 단단한 보안 장치가 필요했습니다.” 그 이유에 대해서는 마르쿠스가 설명을 덧붙인다.

“이런 토착어 문화는 종교적인 배경을 가진 경우가 많습니다. 그러므로 꽤나 많은 단어들이 신성시되고, 특수한 경우에만 사용되죠. 약간 이해하기가 어려울 텐데, 사업을 경영하는 사람들에게 있어 개인식별정보와 같은 것들입니다. 그들 문화권에서는 신중하고 안전하게 지켜져야 할 것들이고, 따라서 아무나 접근해서는 안 되는 것들입니다.”

또한 이 언어 살리기 프로젝트의 독특한 특성 중 하나는 언어와 관련된 데이터가 언어 구성원들 사이에서만 존재한다는 것이다. “그렇다는 건 이들만이 가지고 있는 지식을 저작권 보호하듯이 안전하게 지켜줘야 한다는 뜻이 됩니다. 그래서 사전을 만들 때 저작권 보호 조치를 취하기도 했습니다.” 실제로 퍼스트보이시즈 내 모든 데이터는 FPCC 및 이 프로젝트에 참여한 언어 구사자들의 것이다.

FPCC는 퍼스트보이시즈에 대해 “토착민들을 고유 언어 전문가들로서 인정하는 것에서부터 출발한 프로젝트이며, 우리 같은 일반인들도 토착민들처럼 우리만의 데이터를 수집하고 구축해 데이터 주권을 영유할 수 있다는 걸 가르쳐주는 사례”라고 말한다.

“그래서 보안이 튼튼한 누세오를 파트너사로 선택한 것입니다. 데이터 주권을 확립하기 위해서는 확실한 보안이 뒷받침되어야 하니까요. 일반적인 국가의 주권 역시 튼튼한 국방을 바탕으로 하는 것처럼 말이죠.”

FPCC와 누세오의 퍼스트보이시즈는 입소문을 통해 IT와 문화계에 퍼지고 있는 중이다. 그동안 스웨덴, 멕시코, 쿠바, 과테말라 등의 정부 기관이나 시민 단체, 민간 기업에서 관심을 가지고 연락을 취하기도 했다. 그래서 FPCC와 누세오는 “퍼스트보이시즈라는 툴을 좀 더 많은 사람들에게 전파하고 알릴 수 있는 방법을 연구 중에 있다”고 한다.

3줄 요약
1. 일부 언어, 유창한 언어 구사자들 노령화로 멸종 위기에 처했다.
2. 그런 언어 살리기 위한 데이터 아카이브 플랫폼인 퍼스트보이시즈가 탄생했다.
3. 일부 문화권에서는 아무나 접근해서는 안 되는 특별한 단어나 표현이 존재해 튼튼한 보안이 뒷받침되어야만 가능한 프로젝트였다.

[국제부 문가용 기자(globoan@boannews.com)]

Copyrighted 2015. UBM-Tech. 117153:0515BC
<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>

  •  
  • 0
  • 페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기

  •  SNS에서도 보안뉴스를 받아보세요!! 
시큐아이 에스케어 파워비즈 배너 2022년 3월15일 시작~ 12개월 위즈디엔에스 2018 파워비즈배너 시작 11월6일 20181105-20200131
설문조사
최근 다크웹을 통한 데이터 및 개인정보 유출이 빈번하게 발생하고 있습니다. 다크웹에 대해 아시거나 접속해 보신 적이 있으신가요?
다크웹에 대해 들었지만, 접속해본 적은 없다
1~2번 접속해본 적 있지만, 활용방법은 잘 모른다.
종종 들어가서 업무에 활용하기도 한다.
가끔 전문가를 통해 접속해서 유출 정보를 찾는다.
기타(댓글로)