Записи с меткой «гибрид»

PROMT знакомит с новейшими технологиями

24.06.2013

PROMT знакомит с новейшими технологиями Специалисты PROMT регулярно рассказывают о том, как работают технологии автоматического перевода в интернете. Недавно о настоящем и будущем перевода можно было услышать в Санкт-Петербурге – на конференции «AINL: Искусственный интеллект и естественный язык» и в Подмосковье – на Международной конференции по компьютерной лингвистике «Диалог 2013».

На «Диалоге» лингвисты PROMT Александр Молчанов и Леонид Евдокимов рассказали об особенно актуальной для интернета теме – переводе пользовательского контента (User-Generated Content, UGC) на примере отзывов с туристического сервиса TripAdvisor. Автоматический перевод такого контента – сложная задача, так как UGC содержит большое количество разговорных выражений, эмоциональных фраз, опечаток и т. п. Тем не менее, задача была решена с помощью гибридной технологии PROMT DeepHybrid, соединяющей в себе перевод, основанный на правилах, и статистический перевод.

Ссылка на презентацию PDF, 780 Kb

Эта технология, как и статистический перевод в чистом виде, сейчас бурно развиваются и потому переживают трудности роста. Оглядываясь на накопленный опыт, уже можно выделить несколько типичных проблем, встающих перед разработчиками, и пути их решения. С докладом на эту тему на конференции AINL выступил Александр Молчанов.

Ссылка на презентацию PDF, 790 Kb

Более подробную информацию о конференциях и ссылки на презентации можно найти в новостях на сайте PROMT: На «Диалоге» объяснили, как PROMT переводит UGC и PROMT рассказал на AINL о будущем перевода .

Отзывы пользователей на TripAdvisor переводит PROMT

16.11.2012

PROMT переводит отзывы пользователей на TripAdvisorИзвестный рекомендательный сайт TripAdvisor для перевода пользовательского контента подключил PROMT DeepHybrid.

TripAdvisor собирает отзывы пользователей из разных стран о гостиницах, ресторанах и прочих туристических объектах, а также дает ссылки для их бронирования. Сейчас на сайты, работающие под брендом TripAdvisor, заходят более 60 миллионов уникальных посетителей в месяц, там содержится более 75 миллионов обзоров и мнений. Конечно, большинство посетителей сайтов предпочитает читать отзывы на своем родном языке, так что перед сервисом стоит задача перевода. Причем переводить надо быстро, а объем контента просто зашкаливает. Поэтому возможно использовать только машинный перевод. И для русской версии была выбрана  технология PROMT DeepHybrid.

При машинном переводе пользовательского контента возникают объективные трудности. Во-первых, тексты пишутся в неформальном стиле, изобилуют опечатками, грамматическими ошибками (к тому же отзывы на английском не всегда пишутся носителями языка), смайликами и прочими «авторскими» знаками препинания. Обычный машинный перевод этого не любит и часто в таких местах «спотыкается». Во-вторых, опять-таки из-за больших объемов, невозможно вручную проверять переводы. Поэтому должна быть автоматическая проверка результатов перевода (что-то вроде автоматической «оценки»), чтобы на сайт уходили только переводы с «оценкой» не ниже средней.

PROMT смог справиться с этой задачей, благодаря использованию гибридной технологии. Она позволяет сравнивать перевод с типичными текстами на эту тему и выбирать такую  лексику и стилистические обороты, которые употребил бы человек. В итоге текст становится более понятным и естественным.

Перевод PROMT уже год используется сервисом TripAdvisor, и в его качестве вы можете убедиться сами, зайдя на сайт.

А детальное описание внедрения размещено на сайте promt.ru.

Переводы систем PROMT и Translate.Ru – в числе мировых лидеров

22.08.2011

Качество переводов PROMT, в том числе онлайн-сервиса Translate.Ru и новой гибридной системы перевода, получило очередные высокие оценки.

30-31 июля 2011 г. в Эдинбурге состоялся ежегодный семинар по статистическому машинному переводу (6th Workshop on Statistical Machine Translation, http://www.statmt.org/wmt11/).

В рамках семинара прошел традиционный конкурс систем машинного перевода. В этом году участие в нем приняли около полусотни систем, включая и компании с мировым именем, и экспериментальные разработки. Тестировались переводы на английский и с английского для следующих языков: французского, испанского, немецкого и чешского. В числе прочих в эксперименте по переводу участвовали системы PROMT.

Участники должны были перевести тестовые тексты, используя возможные в рамках их систем настройки. Затем полученные переводы оценивались людьми и сравнивались полученные оценки.

Системы PROMT уверенно смотрелись на фоне мировых лидеров: перевод с английского на немецкий, выполненный PROMT, занял первое место в своей группе. Также на лидирующих позициях оказались переводы PROMT с английского на испанский и с немецкого на английский. Остальные переводы PROMT также показали неплохие результаты.

PROMT приглашает на Translation Forum Russia 2011

11.08.2011

23–25 сентября 2011 г. в петербургской гостинице «Прибалтийская» пройдет крупнейшая конференция переводчиков в России и СНГ – Translation Forum Russia.

В ходе этого ежегодного мероприятия представители переводческой отрасли обсуждают злободневные вопросы и рассказывают о последних новинках и разработках в этой области. Особое внимание уделяется техническим средствам, облегчающим работу переводчикам. В частности, в этом году будет организована отдельная секция по машинному переводу.

Компания PROMT стала спонсором мероприятия и планирует принимать самое активное участие в работе конференции. Для аудитории Translation Forum Russia специалисты PROMT прочтут несколько докладов. Один из них расскажет о новой разработке компании – гибридной технологии, объединяющей разные подходы к машинному переводу. Еще один доклад будет посвящен постредактированию машинного перевода. Эффективность использования машинного перевода будет продемонстрирована на примерах конкретных компаний.

Все желающие смогут задать вопросы и высказать свое мнение в ходе живого общения, открытых дискуссий и круглых столов по актуальным вопросам.

Мы приглашаем посетить мероприятие всех, кого интересуют развитие переводческой отрасли и технические средства перевода. На сайте конференции (http://tconference.ru/) можно найти дополнительную информацию и зарегистрироваться на мероприятие.

Сразу две технологии перевода на РИТ++/2011

19.04.2011

25–26 апреля в Москве пройдет четвертая ежегодная конференция «Российские интернет технологии» (РИТ++/2011). На ней сразу две российские компании представят доклады о своих технологиях машинного перевода.

В секции «Технологии будущего» сначала выступит представитель Яндекса, который расскажет о недавно запущенном сервисе машинного перевода. Этот сервис работает на технологии статистического перевода. А затем будет мой доклад. Я расскажу о гибридной технологии, над которой больше двух лет работали специалисты нашей компании. Новая разработка PROMT совмещает в себе метод машинного перевода, основанный на правилах (его сейчас используют разнообразные решения и сервисы PROMT, в том числе Translate.Ru), и статистический метод. Это будет первая российская презентация новой технологии, которая уже вызвала большой интерес в научных и коммерческих кругах Америки.

Выступления запланированы на первый день конференции, 25 апреля, на 15.00, но не исключены изменения в программе. Следите за новостями на сайте конференции и приходите послушать! Сравнение двух технологий обещает быть интересным.