자동번역 기술은 구글번역기와 네이버 파파고가 있다.
번역기는 단어를 그대로 해석하는 경우가 많아 문맥을 이해하지 못하면 의미가 달라진다.
최근 신경망 번역기는 표준어 뿐 아니라 사투리도 학습해 비교적 자연스럽게 번역한다.
2006년 구글 번역기 등장. 초기 대중에게 번역서비스를 제공하지않고 UN이 보유한 디지털문서를 분류하고 외래어 번역을 위한 자연어 처리 서비스에 활용하며 부자연스러운 번역 기술로 비난받았다.
인공지능 번역기가 아닌 인터넷에 존재하는 문서를 통계적으로 분석해 단어 등장 빈도를 계산하는 확률이 높은 번역을 선택하는 방식. 즉 어순이 이상하고 조사 사용이 어색해 긴 문장은 거의 번역하지 못했다.
PBMT Pharse Based Machine Translation
문장을 단어 또는 구 단위로 분리하고 가장 확률이 높은 번역 결과를 선택해 문맥 이해가 어렵다.
한국어문장 - 단어분리 - 각 단어번역 - 다시연결
단어 - 단어 - 단어 번역
GNMT Google Neural Machine Translation
인공신경망 기반 번역 문장전체의미를 이해해 번역 품질이 향상되었다.
문장전체 - encoder - 의미벡터 - decoder - 번역문장
문장을 먼저 이해한 후 번역을 수행해 문맥 시제 조사 어순까지 고려할 수 있다.
GNMT는 기존 통계기반 번역을 넘어 딥러닝 기반 번역으로 발전한 기술으로 문맥을 이해하고 자연스러운 문장을 생성할 수 있어 번역 품질이 크게 향상되어 이후 Seq25eq, Attention, Transformer 모델로 이어지는 현대 신경망 번역 기술의 기반이 되었다.