메뉴판 이미지 데이터 수집은 크라우드 소싱을 활용하며, 아로정보기술에서 개발한 ‘모아바바(MOABABA)’로 메뉴판 이미지를 수집하고 있다
서울--(뉴스와이어)--다국어 번역 및 데이터 구축 전문 기업 글나무(대표 문선희)는 과학기술정보통신부가 주관하고, 한국지능정보사회진흥원(NIA)이 추진하는 ‘2022년 인공지능 학습용 데이터 구축사업’의 하나인 ‘관광 음식 메뉴판 데이터’ 구축 과제의 주관 사업자로 선정됐다.
음식 메뉴판 이미지-OCR-지식 정보로 구성된 다중쌍 융합 데이터와 한국어-다국어 번역 데이터를 구축하는 이번 사업에는 주관사 글나무를 비롯해 △관광 음식 콘텐츠 및 시스템 구축 전문 기업 아로정보기술 △딥러닝 기반의 자연어 처리 전문 기업 트위그팜 △전문 통·번역사 양성 기관인 한국외국어대학교가 참여한다.
이번 사업은 인공지능 기반 OCR 기술 향상, 인공지능 기계 번역기 품질 개선, 크라우드소싱을 통한 양질의 일자리 창출 등을 목표로 한다. 이를 위해 메뉴판 이미지 데이터와 OCR 데이터 10만건을 구축하고, 50만건이 넘는 메뉴 지식 정보를 수집해 한영, 한일, 한중(간체자, 번체자) 번역 데이터 200만건 이상을 구축할 계획이다.
다양한 형태의 메뉴판 이미지와 향토 음식을 포함한 한국의 수많은 음식 메뉴명을 수집하기 위해 서울, 부산, 대구, 인천, 광주, 대전, 울산 등 광역 지방자치단체뿐 아니라 경기, 강원, 충청, 전라, 경상, 제주 등의 일반 지자체에 있는 음식점의 메뉴판을 수집 대상으로 선정했다. 메뉴판 이미지 촬영을 위해 현지 인력을 동원하기 때문에 13개 지역의 일자리 창출에도 이바지할 것으로 기대된다.
한편 문화체육관광부는 ‘공공 용어의 외국어 번역 및 표기 지침’(문체부 훈령 제448호) 개정안을 2021년 7월부터 시행하고, 한국관광공사는 ‘2021 한식 외국어 번역 표기 편람’을 발간해 한국 음식명의 외국어 번역 표기를 표준화하기 위해 노력하고 있다. 그러나 음식명의 엉터리 번역은 여전히 온라인에서 화제가 되곤 한다.
글나무 문선희 대표는 2021 한식 외국어 번역 표기 편람 제작에 적극적으로 참여했으며, 수년간 음식 메뉴명 번역 프로젝트를 수행한 경험을 바탕으로 “이번 과제로 표준화된 음식명 번역 데이터를 구축해 외국어 메뉴판을 제작하는 전국 지자체, 기업이 활용하기를 희망한다”고 말했다.
글나무 개요
글나무는 20여년간의 공공 분야 번역 수행 경험을 보유한 대표, PM, 전문 번역가, 원어민 감수자 등 전문가 집단이 모여 시작된 언어 전문 파트너다. 수년간 산업통상자원부, 해외문화홍보원, 한국관광공사 등의 공공기관과 네이버, 카페24 등 여러 기업의 번역 전문 업체로 선정되며 최고의 경험과 노하우를 기반으로 ‘고품질의 번역 서비스’를 제공한다.