Какие недостатки имеет компьютерный перевод текста кратко

Обновлено: 04.07.2024

Для достижения успеха в современном высококонкурентном мире коммерции многие предприятия выводят свой бизнес на глобальные рынки. Но для достижения высоких результатов на новом уровне необходимы веб-сайты, переведенные на языки, которые будут понятны новым клиентам.

Переведенный веб-сайт обладает огромными преимуществами. Например, он обеспечивает растущее доверие клиентов, доступность и, в целом, более позитивное восприятие со стороны пользователей. Более того, переведенный веб-сайт — это не просто "полезная штука". Как минимум 75 % глобальных клиентов предпочитают вести бизнес на родном языке.

Перевести веб-сайт можно двумя основными способами — воспользоваться услугами переводчиков или сделать перевод с помощью программного обеспечения (т. е. машинный перевод). Оба способа имеют свои преимущества и недостатки. Самое главное, ваш выбор должен обеспечить:

  • Повышение узнаваемости бренда
  • Идентичное обслуживание на всех территориях
  • Новые возможности бизнеса

Не стоит недооценивать перевод веб-сайта. 75 % глобальных клиентов предпочитают вести бизнес на их родном языке.

Машинный перевод

В последние годы далеко продвинулся машинный перевод от таких компаний, как Google и Bing. Достижения в области нейронного машинного перевода сделали его целесообразным решением для некоторых видов деятельности.

Конечно, машинный перевод веб-сайта имеет свои преимущества, среди которых:

  • Стоимость: это недорогой процесс
  • Скорость: эти системы могут перевести сотни веб-страниц за очень короткое время

Однако недостатки этого способа быстро обнаруживаются при сравнении того, насколько сильно машинный перевод отличается от естественной человеческой речи:

  • Предельно простой выбор слов: что касается лексики и грамматики, то машинный перевод выбирает самый простой вариант, не учитывая нюансы и особенности исходного контента
  • Отсутствие контекста: ваш тщательно продуманный контент в результате машинного перевода превратится в простую передачу основного смысла
  • Неоригинальный перевод: машинный перевод не способен подобрать слова, как это сделали вы для подчеркивания индивидуальности своего бренда, и использует общеупотребимые выражения, отходя от фирменного стиля бренда
  • Скрытые расходы: проверка и исправление некачественного перевода требует дополнительного времени, усилий и ресурсов

Машинный перевод — быстрый и доступный инструмент, но он не подходит для брендов, требующих лингвистической точности и аутентичности.

Перевод, выполненный вручную

В первую очередь, перевод, выполненный вручную, исключает большинство недостатков машинного перевода:

  • Больше, чем просто перевод: перевод, выполненный специалистом, заключается не только в подборе слов, но также в использовании критического мышления и культурного соответствия, чтобы переводимая информация резонировала с целевой аудиторией
  • Стиль бренда: перевод, выполненный специалистом, — единственный способ передать "тон" бренда с учетом языковых нюансов, которые машинный перевод уловить не может
  • Креативная передача информации: тщательно продуманный слог вашей компании может быть раскрыт более полно, так как перевод выполнен людьми, понимающими язык и культуру
  • Соответствующий стилю бренда перевод: смысл заключается не в дословном переводе, а в отражении духа и идеи бренда. Лучше всего это может понять и адаптировать на переводимый язык человек, прекрасно разбирающийся в позиционировании бренда
  • Преимущества поисковой оптимизации: профессиональные переводчики могут выбрать переведенные фразы, лучше всего подходящие для международной поисковой оптимизации. Машинный перевод пока на это не способен

Долгое время основным недостатком перевода, выполненного специалистом, являлась стоимость. Но в настоящее время существуют мощные решения под ключ, позволяющие использовать технологии, процессы и уникальный опыт с целью значительного снижения затрат, часто ассоциируемых с переводом веб-сайта. Более подробно об этом чуть позже.

Человеческий перевод отражает культурное соответствие и резонирует с целевой клиентурой.

Гибридный перевод

Еще одним вариантом снижения стоимости перевода веб-сайта является комбинирование обоих способов. Идеальный гибридный вариант — это использование перевода, выполненного специалистом, для наиболее часто посещаемых страниц, где крайне важны языковые нюансы, отражение идеи и контекст. Машинный же перевод может быть использован для менее зависимого от политики бренда текста, например для страниц с продукцией, где подбор слов не является столь важным.

Заключение

При изучении решений для перевода веб-сайта найдите партнера, который поможет вам успешно осуществить процесс перевода, и такой перевод будет восприниматься читателем как оригинальный текст.

Это означает необходимость найти технологию и законченное решение, адаптируемые под ваши гибкие и подверженные изменениям потребности. Эти решения могут предоставить первоклассные варианты машинного перевода и перевода, выполненного специалистом, для ваших мультиязычных веб-сайтов, а также учесть индивидуальные особенности, например использование гибридного подхода для некоторых веб-страниц или в пределах определенных секций веб-страниц с целью достижения превосходных результатов при контролируемых затратах.

Эти эффективные решения используют лидирующие в отрасли технологии и процессы, практически исключающие затраты, которые являются основным фактором при выборе того или иного варианта. Комбинируя эффективность технологий (машинного перевода и мощных инструментов управления переводом) и выдающиеся способности профессиональных переводчиков, ваши проекты по переводу веб-сайта могут быть завершены в кратчайшие сроки. Кроме того, уровень перевода будет соответствовать мировому классу и стилю бренда.

Последнее обновление: 29 июля 2020 г.

ОТВЕТИТЬ ЧЕРЕЗ TWITTER

О Джессике Ривера

На должности исполнительного вице‑президента, отвечающего за направление международного сбыта и корпоративных отношений, Джесика Ривера использует свои обширные знания в сфере международного бизнеса, руководства компанией и комплексного формирования навыков коллективной работы и корпоративной культуры. Она имеет 15-летний опыт сотрудничества с высшими руководителями ведущих компаний, осуществляющих деятельность в области сфере программного обеспечения как услуги (SaaS) и финансово‑технологической сфере.

Джессика Ривера

Исполнительный вице-президент отдела эффективности работы персонала / Глава юридического отдела

Искусственные нейронные сети, обученные на больших данных, действительно повысили качество машинного перевода настолько, что это видно невооруженным взглядом. Если поискать в интернете скриншоты с курьезами Google-переводчика и протестировать их сегодня, разница налицо.



Как работает машинный перевод?

  • С начала 2000-х и до 2015-2016 гг. в массовых переводчиках вроде Google Translate использовался статистический машинный перевод по фразам (phrase-based).
  • Статистический переводчик рубил текст на слова и цепочки слов, после чего использовал статистику переводов фраз с языка на язык. Несмотря на огромное количество дополнительных ухищрений, это был негибкий подход, который порождал огромное количество ошибок и курьезов.
  • С приходом нейросетей машинные переводчики перешли на них. Нейросеть тоже обучается на готовых переводах, но делает это гораздо гибче. Ей не нужно заранее выделять в тексте фиксированные фразы: нейросетевые алгоритмы сами постепенно выучивают на больших объемах данных оптимальные разбиения текста на части и запоминают закономерности перевода. Благодаря этому и подскочило качество работы машинных переводчиков.

Что не так с нейронным машинным переводом?

НМП имеет множество недостатков, которые совсем не похожи на проблемы человеческих переводов. Недостатки нейронных переводчиков можно поделить на 3 категории: достоверность, память и здравый смысл.

  • Достоверность: Вероятно, наибольшее беспокойство вызывает то, что НМП может оказаться недостоверным, вызывающе ошибочным и совершенно непонятным. Системы НМП не гарантируют точность перевода и часто пропускают отрицания, отдельные слова или целые фразы.
  • Память: Для системы НМП также характерна потеря кратковременной памяти. Системы заточены на перевод одного предложения. В результате они забывают информацию, полученную из предыдущих предложений. Получается хуже, чем развлечение, принятое на вечеринках, в котором каждый участник пишет следующую строчку истории, видя при этом только предыдущую.
  • Здравый смысл: Системы НМП не обладают здравым смыслом в человеческом понимании — то есть внешним контекстом и знаниями о мире. Умение различать, какие контексты подходят для определенных переводов, важно для нашего понимания ситуаций, но эти контексты часто трудно охватить полностью.

Расскажем об этих недостатках подробнее.

Достоверность: нейросеть, да ты гонишь!

Системы НМП не вооружены методами определения достоверности фактов в тексте перевода. Хуже того, такая недостоверность непредсказуема и непоследовательна, что затрудняет ее автоматическое выявление и исправление. Например, системы НМП могут путать отрицания и опускать целые отрывки информации. Каковы последствия таких ошибок?

А вот нейросеть разворачивает важнейшую строчку в знаменитом стихотворении Пушкина на 180 градусов: дай бог превращается в god forbid, т.е. не дай бог.


Одним из главных препятствий на пути широкого внедрения НМП является отсутствие доверия к такой системе. Почему эти системы неточны? Давайте подробно рассмотрим две основные причины и их признаки.

Проблема достоверности № 1: Искаженные данные, искаженные переводы


Хотя первоначальный малайский текст не содержал никакой гендерной информации, в переводе на английский язык предполагается, что медсестра-женщина, а программист-мужчина. Система НМТ предположила такой вариант, поскольку в данных для машинного обучения было больше примеров медсестер-женщин и больше примеров программистов-мужчин.

Проблема достоверности № 2: Попробуйте что-то новое и получите чепуху.

Системы НМП иногда выдают абсурдные вещи. И нам не совсем понятна логика этого безумного абсурда. Вот пример:


Разное число повторений этого знака японского алфавита выдает совершенно случайные фразы.

В целом системы НМП плохо работают при переводе исходных текстов, которые сильно отличаются от данных, использованных для машинного обучения. Такое явление ограничивает их способность распространяться на новые области и новые стили формулировки. Нейросети порождают языкоподобную чушь, когда сталкиваются с чем-то новым.

Память

Системы НМП имеют еще один заметный дефект: они сильно заточены на перевод отдельных предложений. Нейросети в современных переводчиках плохо помнят, что было до того предложения, которое они переводят.

К сожалению, нет. Система не может использовать правильные местоимения, даже если в предыдущем предложении говорится, что программист — женщина!

Почему системы НМП обучаются переводить по одному предложению, а не весь документ сразу? Причины технические. Во-первых, нейронной системе трудно читать длинный документ, компактно хранить всю эту информацию и эффективно ее запоминать. Во-вторых, этим системах нужно больше времени при большом объеме исходных данных.

Неспособность использовать более широкий контекст является основным препятствием для успеха НМП. Почти любой перевод требует понимания нескольких предложений, но в некоторых случаях, таких как перевод истории, это имеет решающее значение. Рассказывание историй — такая же человеческая деятельность, как и любая другая, требующая сочетание творчества, интеллекта и коммуникативных навыков, которые отличают нас от животных. Если системы перевода ИИ не могут переводить текст связно, не говоря уже о том, чтобы делать это красиво, то можем ли мы действительно сказать, что они обладают человеческим уровнем перевода?

Здравый смысл

Системы НМП не обладают здравым смыслом: знаниями или контекстом о мире, которые помогли бы помочь правильно перевести текст.

Для эффективного перевода системе НМП необходимы общие знания о мире. Однако эти знания трудно кодировать в полном объеме и нелегко извлечь из объемов данных. Нам нужны механизмы для включения здравого смысла и знаний о мире в нейронные сети.

Какой перевод можно назвать хорошим? Сложность оценки систем НМП

Как мы оцениваем качество системы машинного перевода? В настоящее время наиболее распространенным способом является использование оценки BLEU. Чтобы вычислить оценку по алгоритму оценки качества текста BLEU, мы берем переводы, произведенные системой MП, и сравниваем их с предложениями, переведенными людьми. Если перевод, написанный машиной содержат много слов и фраз, общих с переводами, выполненными людьми, то система получает более высокий балл BLEU.

Оценка BLEU является полезной жесткой мерой качества перевода, особенно для систем с низкой производительностью. Однако исследователи обнаружили, что оценка BLEU часто не сходится с оценками людей по качеству перевода. Это означает, что хотя показатель BLEU и может помочь нам определить, какая из систем лучше всего работает, обычно этого недостаточно для честной оценки самых эффективных систем.

Просить людей оценивать перевод напрямую — лучше, чем использовать BLEU. Но несмотря у оценивания качества МП человеком тоже есть недостатки.

Человеческая оценка не является автоматической, и поэтому она дорогостоящая и медленная — требует времени и знаний. Почти все исследования машинного перевода используют автоматические метрики, такие как BLEU, вместо более точной оценки человеком.

Человеческая оценка не всегда последовательна. Трудно добиться согласия между специалистами по оценке, особенно если они не являются двуязычными переводчиками, а просто сравнивают предложения на своем родном языке.

Двигаясь вперед, важно быть в курсе ограничений оценок НМП, сравнивая эту систему с переводчиками-людьми.

Мы работаем над этим… Как выглядит будущее?

НМП стремительно развивается и прогрессирует каждый месяц. Разработчики начинают осознавать проблемы, изложенные выше: достоверность, искажение данных, отсутствие смысла в полученном тексте перевода, память, здравый смысл и метрики оценок. Например, Google призвал исследователей к борьбе с искажениями фактов в НМП, выпустив новый набор метрик оценки специально для решения этой проблемы.

В течение прошлого года НМП также достиг заметных улучшений в эффективности и производительности. Это связано с внедрением новых систем, которым больше не требуется последовательно обрабатывать данные, например, слева направо или справа налево. Эти системы обрабатывают исходные предложения за раз, что позволяет легко находить соответствия в данных для машинного обучения. Таким образом, мы можем обучиться на большему объему данных за то же время и, в конечном итоге, выполнять более эффективные переводы. Среди таких успешных систем можно выделить Google Transformer и нейронные сети Salesforce’s Quasi-Recurrent.

Между тем, можно ожидать ускорение распространения новых исследований. Гарвардский OpenNMT — реализация нейронного машинного перевода с открытым исходным кодом в LuaTorch, PyTorch и Tensorflow — быстро объединяет новые методы исследований, и теперь другие легко могут брать за основу лучшие системы. Многие утверждают, что новая коммерческая система deepL, основанная бывшим исследователем Google, обходит по качеству Google Переводчика. Microsoft Переводчик продолжает предлагать новые функции в своей многоязычной поддержке предприятия. Машинный перевод развивается стремительно, и от наблюдения за его эволюцией сложно оторваться.

Подробнее узнать о том, как оценить качество машинного перевода с помощью метрики BLEU, можно тут.


Казалось бы сегодня информационные технологии могут все. Или почти все. Тот же онлайн-переводчик от компании Google - весьма востребованный интернет-сервис, которым пользуются ежедневно миллионы. Однако, надо понимать, что у машинного и ручного перевода есть свои преимущества и недостатки, о которых надо знать и понимать, когда какой перевод вам стоит использовать.

Когда имеет смысл использовать машинный переводчик

  • Не требуется высокая точность перевода;
  • Надо быстро оценить полезность материала для дальнейшего более подробного изучения.
  • Надо быстро перевести некий текст.
  • Требуется обзорный перевод веб-страницы.

Когда лучше использовать ручной перевод

  • Надо перевести официальные документы.
  • Требуется профессиональный перевод.
  • Необходимо подтвердить точность перевода и получить заверенный лицензированным специалистом документ.
  • Требуется перевод специализированного текста с большим числом специальных терминов, например, для публикации в иностранном издании текста.
  • Требуется литературный или художественный перевод текста.

Надо понимать при этом, что основное преимущество онлайн-перевода - это скорость, а ручной перевод - это качество. Конечно, качество автоматического перевода все время растет. Вот уже и нейронный сети используются для анализа и адаптации переводимого текста. Но, живого человека пока еще заменить не удается. Да, с тривиальными текстами машинные переводчики справляются, но вот передавать сарказм или иронию такие переводчики еще долго не научатся. Так что прежде чем делать ставку на компьютерный перевод стоит подумать о возможных последствиях.

Машинный перевод как явление на сегодняшний день успешно входит в нашу жизнь и занимает довольно прочные позиции в отрасли переводов. С одной стороны преимущества его очевидны: установил соответствующую программу, загрузил необходимый текст и через определенный промежуток времени наслаждайся результатом. Экономия как времени, так и денежных средств. Ведь компьютеру, в отличие от бюро переводов не нужно платить заработную плату. Однако, как и у любой компьютерной программы, у машинного перевода есть свои недостатки.

Плюсы и минусы машинного перевода текста

Итак, что такое машинный перевод по своей сути? Это перевод текста с разных языков при помощи специально созданных компьютерных программ. Их на сегодняшний день насчитывается несколько, и по сравнению со своими прототипами они достаточно далеко продвинулись в своем развитии и совершенствовании. Машинный перевод нельзя сравнивать с обычными онлайн переводчиками, которые так часто попадаются нам в сети Интернет. Уровень их существенно выше.

Плюсы и минусы машинного перевода текста

Для того, чтобы машинному переводу можно было доверять, он должен работать в паре с человеком-переводчиком. И неважно, какое это взаимодействие – пост- или предредактирование, редактирование, смешанная система, любое солидное агентство переводов предложит вам комбинацию по вашему вкусу. Важно, что только при таком подходе сегодня можно добиться быстрого и качественного перевода.

Читайте также: