Заменят ли переводчиков машины

Окей, Google! Когда машины заменят синхронных переводчиков?

Синхронные переводчики необходимы на любом международном мероприятии. Именно от них зависит, поймут ли друг друга партнеры и экспоненты, найдет ли спикер общий язык со зрителями. Правда, уже сейчас умные программы для перевода умеют транслировать человеческую речь на разные языки за доли секунд. Но почему у них не всегда получается выполнить свое задание хорошо? Откажется ли ивент индустрия совсем от услуг переводческих бюро в будущем? Event LIVE выясняет у профессионалов.

Вот почему лингвисты и IT-специалисты так старательно учат искусственный интеллект синхронному переводу.

Как человек машины учил

Сначала машинные переводчики использовали в своей работе только установленные в их память грамматические правила и словари (Rule-Based Machine Translation). Из-за этого перевод выходил чересчур правильным, а иногда не выходил вовсе, потому что люди редко разговаривают так, как написано в учебниках. Тогда разработчики стали показывать машинам много параллельных текстов, в которых написано одно и то же на разных языках. Программы сравнивали тексты, делили их на слова и фразы, запоминали все возможные способы их перевода и оценивали частоту употребления каждого из них (Statistical machine translation).

В дальнейшем, переводя похожие примеры, программы анализировали статистику и подбирали самый подходящий вариант из своей «памяти». Такой способ хорошо подошел для перевода редких и сложных слов и фраз, технических и официально-деловых текстов.

Большинство программ машинного перевода до сих пор основано на синтезе этих двух подходов, например, так переводит сервис ПРОМТ. Оставалась какая-то мелочь – совместить эти разработки с программами анализа и синтеза речи, что и попытались сделать такие компании, как Google и Microsoft.

Однако разговорный язык более бессвязный, чем тексты, его грамматика – более гибкая, а еще добавились проблемы распознавания речи, в общем, синхронный перевод оказался машинам все еще не по зубам. Тогда люди подключили к работе электронных переводчиков нейронные сети, и вот тут началось самое интересное.

Как работает нейронная сеть

Как и статистические переводчики, нейронные сети тоже анализируют огромное количество параллельных текстов в поисках закономерностей и совпадений, а потом запоминают их.

Но нейросеть работает не со словами и фразами, а с предложениями, и это позволяет не потерять при переводе самое главное – смысл.

Например, раньше программы переводили так:

Can I have an exhibition ticket?

У меня может быть билет на выставку

Могу ли я иметь билет на выставку?

А так выглядит нейронный машинный перевод:

Can I have an exhibition ticket?

Можно мне билет на выставку?

Другими словами, нейросети переводят не так, как надо, а так, как говорит человек. Пока известно только пять компаний, использующих такие гибридные системы: Google и Microsoft начали внедрять их в работу своих сервисов перевода с 2016 года,

Яндекс.Переводчик уже год использует нейросети, переводя с русского на английский и обратно, а месяц назад аналогичную разработку представил китайский поисковик Baidu. Также похожую технологию разработала компания ABBYY для своего ABBYY Compreno. Программы для распознавания тоже стали намного лучше подавлять шумы и анализировать речь. В общем, автоматизированные переводчики вырвались на новый уровень. Правда, рядовые пользователи все еще жалуются на ошибки и неточности.

Читайте также:  Руководство по ремонту автомобиля audi a4 дизель

Мы в Event LIVE решили провести собственный эксперимент и протестировать доступные сервисы синхронного нейронного перевода, когда готовили материал для этой статьи

For many years, the “show” in this very word “show floor” was understood to be about the exhibitors showcasing their products and services. To the millennial and post-millennial generation, however, it is just as much about the “show” that a show organiser puts on around the show floor itself. (Kai Hattendorf, UFI CEO/ MD)

В течение многих лет «шоу “в этом самом слове” выставочный зал» понималось как выставка экспонентов, демонстрирующих свою продукцию и услуги. В тысячелетнем и пост-тысячелетнего поколения, однако, это так же о “показать”, что организатор ставит вокруг себя шоу.

В течение многих лет «шоу» в этом самом слове «выставочный зал» понималось как экспоненты, демонстрирующие свои продукты и услуги. Однако для тысячелетнего и посттысячного поколений речь идет о «шоу», которое организатор шоу устраивает вокруг самого выставочного зала.

Translator от Microsoft

На протяжении многих лет, «шоу» в этом самом слове «Показать слово» было понятно, о экспонентов демонстрации своих продуктов и услуг. Для тысячелетия и после поколения тысячелетия, однако, это так же много о «шоу», что организатор шоу ставит на вокруг шоу этаже себя

Как видите, термины выставочной деятельности запутали автоматизированных синхронистов. Ближе всех к смыслу подобрался сервис от Google, но вопросы поколений тоже сбили его с толку. Мы бы перевели этот отрывок так:

Кстати, с обратным переводом те же самые сервисы справляются куда лучше. Это связано с особенностями строя нашего языка, и его отличиями от английского с понятным и четким аналитическим строем. Но несмотря на все оправдания, выводы очевидны: пока живые синхронисты справляются со своими задачами куда лучше автоматизированных, и мало кто поспорит с этим.

Елена Кадурова, Центр легализации и переводов «Легализуем.ру»

Несмотря на простоту и широту использования, программы для перевода текстов с одного языка на другой на сегодняшнем уровне своего развития не способны полностью заменить человека. Любой текст, переведенный компьютером, требует профессиональной редактуры переводчика. Только он может сравнить оригинал с результатами машинного перевода, найти и исправить все ошибки, допущенные машиной.

Ксения Давара, Moscow Business School

В данный момент качественный синхронный перевод без участия человека невозможен. Например, голосовые помощники не всегда правильно распознают речь пользователей, не понимают, как использовать интонацию или расставлять ударения. А теперь представьте: важные международные переговоры, любая неточность может привести к недопониманию или конфликту. Можно ли доверить ответственность синхронного перевода искусственному интеллекту?

Анатолий Кицура, генеральный директор ООО «Бизнес Диалог»

В данном вопросе мы по-прежнему верны живым переводчикам. Помимо стандартных опасений относительно индивидуальных особенностей речи каждого человека и распространенного пренебрежения грамматикой языка в разговоре, большие вопросы вызывают культурные различия. Синхронный перевод – это огромный труд, при котором необходимо учитывать все тонкости и нюансы.

Тимофей Окроев, генеральный директор Группы РПК

Для проверки смысла и приведения текста, переведенного специальными программами, в надлежащий вид, над ним приходится немало покорпеть редактору. Но при устном переводе редактора нет.

Машина не человек — она не прощает ни акцента, ни нечеткой дикции, ни «эканья». К тому же устная речь спонтанна, и для ее корректной передачи требуется чутье и умение учитывать экстралингвистический контекст, которыми пока не может похвастать компьютер. Докладчики тоже люди, они могут ошибаться, поддаваться эмоциям и не знать культурных особенностей аудитории. В такой ситуации переводчику приходится проявлять чисто человеческие качества: такт, здравый смысл, чувство юмора, умение разрядить обстановку.

Читайте также:  Что такое радиус колеса автомобиля

Технологии развиваются, и раньше или позже эти проблемы могут быть решены. Но не исключено, что к этому времени машины смогут заменить не только переводчиков, но и самих докладчиков.

Так как все-таки относиться к автоматизированным синхронным переводчикам?

Пока возможности нейросетей сильно ограничены по сравнению с мозгом живого человека. Например, симуляция всего одной секунды активности 1% мозга заняла 40 минут на кластере из 82 944 процессоров. Однако мозг современного человека сформировался 25 тысяч лет назад, а технологии нейронных сетей разрабатываются в течение последних тридцати лет. У нейросетей есть преимущество – скорость, с которой они обучаются, чрезвычайно высока.

И если сейчас они еще делают ошибки, то что будет через каких-нибудь десять лет, когда автоматизированные переводчики смогут делать свою работу лучше любого человека?

Дэвид Талбот, глава сервиса Яндекс.Переводчик

Нет никакой угрозы для человека из гуманитарной среды со стороны сферы IT. Сфера искусственного интеллекта определенно сделает революцию в гуманитарных науках и станет для них инструментом, дополнением к человеческим возможностям.

Синхронный перевод — это очень нервная работа. Возможно, самая стрессовая и требующая максимальной аккуратности часть этой работы просто перейдет в руки компьютерам. Но всегда существует вероятность того, что ситуация потребует от человека дополнительных навыков, которые делают его незаменимым.

Например, можно легко представить ситуацию, когда переводчик на деловой встрече не просто переводит речь, а помогает преодолевать культурный барьер. То есть понимает и может предложить что-то обеим сторонам, понимает разницу между манерой их общения и культурой. И вот это, конечно, никуда не уйдет.

«Потрачено»: сможет ли машина заменить живого переводчика

Но пока «живые» специалисты не остаются без работы. Почему компьютер пока не может догнать человека? И может ли это все-таки произойти? Об этом мы расскажем в кратком изложении лекции Алексея Малова.

О спикере: Алексей Малов — практикующий переводчик-синхронист, кандидат филологических наук, координатор переводчиков и редакторов студии «Vert Dider».

Как работают современные автоматические системы перевода

В общих чертах, существует три системы:

Перевод на основе правил.

С этого начинались первые системы машинного перевода. Их проблема состоит в том, что машина, зачастую, переводит слишком дословно, строго следуя заданным параметрам и не используя синонимы, из-за чего текст оказывается некорректным. Примером могут служить меню кафе или странички в путеводителях где-нибудь за границей лет десять тому назад, где можно было встретить совершенно невероятные блюда вроде «овощей с нефтью» и рассказы о поездке на «говяжьей упряжке». Правда, вряд ли какая-то из существующих систем перевода на основе правил сейчас выдаст такую же ошибку, так как их постоянно совершенствуют.

Статистический перевод.

На настоящий момент существует множество параллельных текстов (на русском и иностранном языке), которые оцифрованы и загнаны на сервера и оформлены в параллельный корпус (текст оригинала и его перевод на другой язык выровнены так, что все фрагменты оригинала совпадают с соответствующими фрагментами перевода). С их помощью человек может понять, в каких случаях то или иное слово употреблялось, с какими зависимыми словами, в каком контексте и т.д. Задача системы в данном случае — найти максимально подходящее соответствие, которое уже перевели, и выдать этот вариант. Проблема: наиболее частый вариант перевода не всегда соответствует конкретной ситуации. Самый яркий пример — слово «wasted», всплывающее после смерти персонажа в игре GTA, которое на русский язык было неверно переведено как «потрачено».

Читайте также:  Можно ли разобрать арестованный автомобиль

Машинный перевод.

Машины хорошо учатся и уже обыгрывают нас в го и шахматы, рисуют картины, сочиняют песни и оценивают работы студентов не хуже преподавателей. Когда они заменят человека в вопросах перевода и заменят ли?

Они уже (чаще всего) разбираются в синонимах, и это, на первый взгляд, действительно создает угрозу «живым» специалистам. Но все не так просто.

Одна из проблем машинного перевода заключается в распознавании нюансов, оттенков эмоций и контекста. Во многом люди и сами не до конца умеют распознавать эти тонкости: учитывая, что машины пока обучаются людьми, говорить о полной замене переводчиков роботами некорректно.

Как научить машины распознавать эмоции, которые мы сами не всегда ясно определяем?

Можно обратиться к лингвистам и филологам, однако никто из них не даст точную оценку того, что конкретно считать яростью, что — гневом, а что — злостью. Но можно обратиться к нейропсихологам.

Существует квартетная теория человеческих эмоций, согласно которой в нашем мозге есть несколько зон, отвечающих за то, что мы чувствуем: ствол, диэнцефалон, гиппокамп и орбитофронтальная кора. Понимание того, как работают эти зоны, может существенно облегчить работу специалистов по машинному переводу. Идя дальше, можно проанализировать с помощью МРТ активность мозга различных людей, вызвав у них определенные эмоции и попросив описать то, что они при этом чувствуют, после чего сравнить результаты с ответами иностранных испытуемых. А эти данные уже подвергнуть оцифровке и использовать в обучении машин. Но МРТ — дорогая диагностика, используемая в медицине, и ее применение в лингвистических вопросах не всегда целесообразно. Однако Университет Беркли все же задался похожей целью: ученые зачитывали тексты испытуемым и мониторили их активность мозга, после чего сравнили слова, которые были зачитаны, с тем, какая часть мозга была активна в это время. В результате была составлена семантическая карта мозга.

Также в определении эмоций и последующем обучении этому машин может помочь скалярный подход (суть заключается в том, что любому эмоциональному стимулу, в том числе и вербальному, присваивается числовое значение по шкалам, каждая из которых отражает одну из характеристик). Эксперименты с его применением уже проводились: носителям разных языков называли определенные слова и просили оценить, используя шкалы, что они при этом чувствуют. С помощью этих опросов были сформированы несколько баз данных для разных языков, но русского там нет.

Проведя собственное исследование, Алексей выяснил интересную вещь: слова англоязычные и русскоязычные носители «чувствуют» с совершенно с разной интенсивностью. Его респондентам нужно было оценить то, насколько позитивную или негативную эмоцию они испытывают при упоминании слова «sad», то есть грусть, печаль. Англоговорящие респонденты оценили ее по шкале от 1 до 9 на 1,6, то есть это — почти самая негативная эмоция, которую они могли бы испытать. Русскоязычные участники исследования же оценили эмоцию примерно на 3,5. Вероятно, в нашем сознании сильны такие понятия как приятная грусть или светлая печаль. Это еще раз доказывает важность контекста, а также происхождения, опыта и эмоционального интеллекта конкретного человека.

Пока мы сами до конца не разобрались, как все это работает, мы не сможем научить этому машину. И пока ни одна из существующих систем перевода не лучше человека. Лишат ли они работы переводчиков в будущем? Плохих — скорее всего. Хороших — вряд ли.

Больше информации и новостей о трендах образования в нашем Telegram-канале. Подписывайтесь.

Оцените статью