자동번역 기술 PBMT와 GNMT

자동번역 기술은 구글번역기와 네이버 파파고가 있다.

번역기는 단어를 그대로 해석하는 경우가 많아 문맥을 이해하지 못하면 의미가 달라진다.

최근 신경망 번역기는 표준어 뿐 아니라 사투리도 학습해 비교적 자연스럽게 번역한다.

2006년 구글 번역기 등장. 초기 대중에게 번역서비스를 제공하지않고 UN이 보유한 디지털문서를 분류하고 외래어 번역을 위한 자연어 처리 서비스에 활용하며 부자연스러운 번역 기술로 비난받았다.

인공지능 번역기가 아닌 인터넷에 존재하는 문서를 통계적으로 분석해 단어 등장 빈도를 계산하는 확률이 높은 번역을 선택하는 방식. 즉 어순이 이상하고 조사 사용이 어색해 긴 문장은 거의 번역하지 못했다.

PBMT Pharse Based Machine Translation

문장을 단어 또는 구 단위로 분리하고 가장 확률이 높은 번역 결과를 선택해 문맥 이해가 어렵다.

한국어문장 - 단어분리 - 각 단어번역 - 다시연결

단어 - 단어 - 단어 번역

GNMT Google Neural Machine Translation

인공신경망 기반 번역 문장전체의미를 이해해 번역 품질이 향상되었다.

문장전체 - encoder - 의미벡터 - decoder - 번역문장

문장을 먼저 이해한 후 번역을 수행해 문맥 시제 조사 어순까지 고려할 수 있다.

GNMT는 기존 통계기반 번역을 넘어 딥러닝 기반 번역으로 발전한 기술으로 문맥을 이해하고 자연스러운 문장을 생성할 수 있어 번역 품질이 크게 향상되어 이후 Seq25eq, Attention, Transformer 모델로 이어지는 현대 신경망 번역 기술의 기반이 되었다.

저작자표시 (새창열림)

'이론' 카테고리의 다른 글

자연어 처리(NLP) 모델, Google이 개발한 언어모델 T5와 ELECTRA (0)	2026.07.02
멀티모달 모델, OpenAI가 개발한 CLIP과 DALL·E (0)	2026.07.02
BERT란? 구글이 2018년에 공개한 33억 단어에 대해 약 4일간 학습시킨 사전 훈련된 언어 모델 (0)	2026.07.01
자연어 처리에서 사용하는 대표적인 딥러닝 모델: DNN, CNN , RNN , LSTM , GRU , Seq2Seq , Attention, Transformer, BERT, GPT (0)	2026.06.26
앞 뒤를 모두 참고하는 Bidirectional 모델 BERT ,특수 토큰 CLS와 SEP , 두가지 학습방법 MLM, NSP (feat. Transformer의 Encoder만 쓰는 이유) (0)	2026.06.26

" standout

" standout

자동번역 기술 PBMT와 GNMT

'이론' 카테고리의 다른 글

티스토리툴바

" standout

자동번역 기술 PBMT와 GNMT

'이론' 카테고리의 다른 글

'이론' Related Articles

티스토리툴바