PROMT знакомит с новейшими технологиями
Специалисты PROMT регулярно рассказывают о том, как работают технологии автоматического перевода в интернете. Недавно о настоящем и будущем перевода можно было услышать в Санкт-Петербурге – на конференции «AINL: Искусственный интеллект и естественный язык» и в Подмосковье – на Международной конференции по компьютерной лингвистике «Диалог 2013».
На «Диалоге» лингвисты PROMT Александр Молчанов и Леонид Евдокимов рассказали об особенно актуальной для интернета теме – переводе пользовательского контента (User-Generated Content, UGC) на примере отзывов с туристического сервиса TripAdvisor. Автоматический перевод такого контента – сложная задача, так как UGC содержит большое количество разговорных выражений, эмоциональных фраз, опечаток и т. п. Тем не менее, задача была решена с помощью гибридной технологии PROMT DeepHybrid, соединяющей в себе перевод, основанный на правилах, и статистический перевод.
Ссылка на презентацию PDF, 780 Kb
Эта технология, как и статистический перевод в чистом виде, сейчас бурно развиваются и потому переживают трудности роста. Оглядываясь на накопленный опыт, уже можно выделить несколько типичных проблем, встающих перед разработчиками, и пути их решения. С докладом на эту тему на конференции AINL выступил Александр Молчанов.
Ссылка на презентацию PDF, 790 Kb
Более подробную информацию о конференциях и ссылки на презентации можно найти в новостях на сайте PROMT: На «Диалоге» объяснили, как PROMT переводит UGC и PROMT рассказал на AINL о будущем перевода .
ilove you