[베리타스알파=신승희 기자] 광운대 AI번역산업연구센터는 16일 오후 3시, 학내 산학협력단장실에서 에버트란, DMT랩스와 번역데이터 감수/통계관리 관련 4년 연속 수주 성과를 달성하며 각 기관과 1억원 씩 총 2억원의 용역계약을 체결했다고 17일 전했다.
본 계약은 과학기술정보통신부 산하 한국지능정보사회진흥원(NIA)에서 추진하는 '2022 인공지능 학습용 데이터 구축 사업' 중 '9번/10번 과제: 방송콘텐츠 한국어-영어 및 유럽어 통/번역 말뭉치 데이터'분야에 에버트란과 디엠티랩스가 각각 주관기관으로 컨소시엄에 참여하며 이루어졌다.
전체 참여기관은 Saltlux 이노베이션, SYSTRAN, IC글로벌, 윤즈정보개발, 온아시아 등이며, 통/번역 데이터 구축 및 품질관리 자문을 위해 사이버한국외국어대가 참여대학으로 협력하게 된다.
이청호 에버트란 대표(현 광운대 겸임교수)는 "올해 과제는 한국어 방송콘텐츠를 영어, 러시아어, 프랑스어, 독일어, 스페인어, 이탈리아어 등 6개 언어로 통/번역데이터를 구축하게 되며 올해 11월 말까지 완성해야 한다. 약 1,000여 시간의 한국 방송 콘텐츠를 전사한 후 6개의 언어로 동등한 내용이 되도록 자체 개발한 'AIKE' 툴을 이용하여 번역한 이후 이를 6개의 언어 발화데이터를 만드는 과제로서 '정신일도하사불성' 자세로 임해야 양질의 결과를 얻는 고난도 과제"라고 말했다.
김운 디엠티랩스 대표는 "해당 과제는 약 50명의 운영진과 각 언어 별 130명~150명의 번역가능자가 참여해야하는 대규모의 다국어 통/번역데이터 구축 사업이다. 모든 참가자에게 번역과 기계번역툴 교육을 제공해야하는 과정 등 다양한 지원 작업이 많다. 첫 단계인 한국어 방송콘텐츠 전사부터 다국어 발화까지 데이터 품질관리에 있어서 관리자는 물론 언어 데이터 구축 참여자 모두가 '호시우보' 해야 한다"고 말했다.
이일재 AI번역산업연구센터장(광운대 영어산업학과)은 "우리 대학원 졸업자 및 타 대학 출신 언어 전공 석/박사급도 연구원으로 고용하게 된다. 이들은 가공되는 통/번역 결과물의 일정한 분량을 샘플로 추출해 데이터 감수/통계 검증을 실시하게 된다. 이러한 과정을 지속적이며 반복적으로 진행하며 전체 통번역의 오류율이 일정한 수준을 유지하도록 모니터링하는게 주 역할이다. 번역된 문장을 바탕으로 번역가의 번역 능력도 추론통계적으로 수치화해 번역가를 번역능력별로 분류하며 모든 참여기관에게 관련 정보를 공유하며 지원하게 된다"고 밝혔다.
윤호숙 교수(사이버한국외국어대학)는 "언어 분야 풍부한 인적 자원을 바탕으로 올해 컨소시엄에 적극적으로 참여하고 협조할 것이다. 특히 우리 사이버한국외대는 앞으로 더욱 언어 관련 사업체와 국가에 필요한 실질적 언어 관련 전공자 양성을 목표로 하고 있다. 이를 위해 올해 과제를 수행하며 많은 것을 배우게 될 것이다. 앞으로 광운대 영어산업학과 및 여러 언어 관련 산업체와도 계속 유기적인 관계를 이어나가려고 한다"고 전했다.
광운대 AI번역산업연구센터는 16일 오후 3시, 학내 산학협력단장실에서 에버트란, DMT랩스와 번역데이터 감수/통계관리 관련 4년 연속 수주 성과를 달성하며 각 기관과 1억원 씩 총 2억원의 용역계약을 체결했다. /사진=광운대 제공
[베리타스알파=신승희 기자] 광운대 AI번역산업연구센터는 16일 오후 3시, 학내 산학협력단장실에서 에버트란, DMT랩스와 번역데이터 감수/통계관리 관련 4년 연속 수주 성과를 달성하며 각 기관과 1억원 씩 총 2억원의 용역계약을 체결했다고 17일 전했다.
본 계약은 과학기술정보통신부 산하 한국지능정보사회진흥원(NIA)에서 추진하는 '2022 인공지능 학습용 데이터 구축 사업' 중 '9번/10번 과제: 방송콘텐츠 한국어-영어 및 유럽어 통/번역 말뭉치 데이터'분야에 에버트란과 디엠티랩스가 각각 주관기관으로 컨소시엄에 참여하며 이루어졌다.
전체 참여기관은 Saltlux 이노베이션, SYSTRAN, IC글로벌, 윤즈정보개발, 온아시아 등이며, 통/번역 데이터 구축 및 품질관리 자문을 위해 사이버한국외국어대가 참여대학으로 협력하게 된다.
이청호 에버트란 대표(현 광운대 겸임교수)는 "올해 과제는 한국어 방송콘텐츠를 영어, 러시아어, 프랑스어, 독일어, 스페인어, 이탈리아어 등 6개 언어로 통/번역데이터를 구축하게 되며 올해 11월 말까지 완성해야 한다. 약 1,000여 시간의 한국 방송 콘텐츠를 전사한 후 6개의 언어로 동등한 내용이 되도록 자체 개발한 'AIKE' 툴을 이용하여 번역한 이후 이를 6개의 언어 발화데이터를 만드는 과제로서 '정신일도하사불성' 자세로 임해야 양질의 결과를 얻는 고난도 과제"라고 말했다.
김운 디엠티랩스 대표는 "해당 과제는 약 50명의 운영진과 각 언어 별 130명~150명의 번역가능자가 참여해야하는 대규모의 다국어 통/번역데이터 구축 사업이다. 모든 참가자에게 번역과 기계번역툴 교육을 제공해야하는 과정 등 다양한 지원 작업이 많다. 첫 단계인 한국어 방송콘텐츠 전사부터 다국어 발화까지 데이터 품질관리에 있어서 관리자는 물론 언어 데이터 구축 참여자 모두가 '호시우보' 해야 한다"고 말했다.
이일재 AI번역산업연구센터장(광운대 영어산업학과)은 "우리 대학원 졸업자 및 타 대학 출신 언어 전공 석/박사급도 연구원으로 고용하게 된다. 이들은 가공되는 통/번역 결과물의 일정한 분량을 샘플로 추출해 데이터 감수/통계 검증을 실시하게 된다. 이러한 과정을 지속적이며 반복적으로 진행하며 전체 통번역의 오류율이 일정한 수준을 유지하도록 모니터링하는게 주 역할이다. 번역된 문장을 바탕으로 번역가의 번역 능력도 추론통계적으로 수치화해 번역가를 번역능력별로 분류하며 모든 참여기관에게 관련 정보를 공유하며 지원하게 된다"고 밝혔다.
윤호숙 교수(사이버한국외국어대학)는 "언어 분야 풍부한 인적 자원을 바탕으로 올해 컨소시엄에 적극적으로 참여하고 협조할 것이다. 특히 우리 사이버한국외대는 앞으로 더욱 언어 관련 사업체와 국가에 필요한 실질적 언어 관련 전공자 양성을 목표로 하고 있다. 이를 위해 올해 과제를 수행하며 많은 것을 배우게 될 것이다. 앞으로 광운대 영어산업학과 및 여러 언어 관련 산업체와도 계속 유기적인 관계를 이어나가려고 한다"고 전했다.
광운대 AI번역산업연구센터는 16일 오후 3시, 학내 산학협력단장실에서 에버트란, DMT랩스와 번역데이터 감수/통계관리 관련 4년 연속 수주 성과를 달성하며 각 기관과 1억원 씩 총 2억원의 용역계약을 체결했다. /사진=광운대 제공
<관련기사>
베리타스알파 에듀동아 머니투데이