Когда появился гугл переводчик
Перейти к содержимому

Когда появился гугл переводчик

  • автор:

Google Переводчик

Google Переводчик (англ.  Google Translate ) — веб-сервис компании Google, предназначенный для перевода части текста или веб-страницы на другой язык. Для некоторых языков пользователям предлагаются варианты переводов, например, для технических терминов, которые должны быть в будущем включены в обновления системы перевода.

В отличие от других сервисов перевода, таких как Babel Fish и AOL, которые используют технологию SYSTRAN (английский), Google, как и Translate.ru использует собственное программное обеспечение. Видимо, используется самообучаемый алгоритм статистического машинного перевода [1] .

Содержание

Возможности

Сервис включает в себя также перевод всей веб-страницы и даже одновременный поиск информации с переводом на другой язык. Для веб-дизайнеров сотрудниками компании был разработан скрипт, который позволяет организовать перевод сайта на все доступные языки [2] .

Google Переводчик, как и другие инструменты автоматического перевода, имеет свои ограничения. Этот инструмент может помочь читателю понять общий смысл содержания текста на иностранном языке, он не предоставляет точных переводов. Постоянно ведётся работа над качеством перевода, разрабатываются переводы на другие языки [3] .

Особенности

Из-за того, что выдача вариантов контролируется статистическим алгоритмом, при переводе обычных общеупотребительных слов Google Переводчик может предлагать в числе возможных вариантов нецензурные слова. На результат выдачи также можно повлиять, массово предлагая некий, в том числе, заведомо неверный вариант перевода.

См. также

Примечания

  1. Франц-Джозеф Ок (англ.  Franz-Josef Och) подтвердил это во время своей запланированной речи на 10-ом Саммите Машинного перевода, прошедшем в 2005 году, заявив, что они (Google) больше не нуждаются в правилах.
  2. Google переводчик радует нас новыми возможностями
  3. Современный «умный» онлайн переводчик

Ссылки

Председатель совета директоров: Эрик Шмидт • Директор, президент по технологиям и сооснователь: Сергей Брин • Главный исполнительный директор и сооснователь: Ларри Пейдж

Adscape • AdSense • Advertising Professional • AdWords • Analytics • Checkout • Click-to-Call • DoubleClick • Insights for Search • Trends • Wallet • Google Университет

Code • Dart • Gadgets API • GData • Go • Googlebot • Guice • GWS • Highly Open Participation Contest • Image Labeler • KML • MapReduce • Mediabot • Pinyin • SketchUp Ruby • Sitemaps (index) • Summer of Code • TechTalks • Web Toolkit • Website Optimizer

Alerts • Blogger • Bookmarks • Docs • FeedBurner • iGoogle • Jaiku • Knol • Library Project • Map Maker • Mashup Editor • Notebook • Page Creator • Sites • Video Marketplace • YouTube • Диск

Appliance • Audio • Books • Code • Desktop • GOOG-411 • Images • Maps (Mars • Moon • Ocean • Sky • Street View) • News • Patents • Products • Scholar • SearchWiki • Usenet • Video • Web

Поглощения • Цензура • Current • Критика • Earth Outreach • Foundation (Google.org) • Google China • Googleplex • История • Hoaxes • I’m Feeling Lucky • Labs • Logo • Lunar X Prize • I/O • Список сервисов и инструментов • WiFi • Zeitgeist • «Бомбы» • Гуглизм

  • Сайты по алфавиту
  • Автоматизированный перевод
  • Сервисы Google
  • Электронные словари

Wikimedia Foundation . 2010 .

Полезное

Смотреть что такое «Google Переводчик» в других словарях:

Google Toolbar — Тип Панель инструментов Разработчик Google Операционная система Microsoft Windows, Mac OS X, Linux Последняя версия 6.0.1411.1512 (Internet Explorer) 24 марта, 2009 7.1.20110316L (Firefox) 20 апреля … Википедия

Google Goggles — Тип Визуальная поисковая система, дополненная реальность Автор Google Inc. Разработчик Google Inc. Написана на Java … Википедия

Панель инструментов Google — Тип Панель инструментов Разработчик Google Операционная система Microsoft Windows, Mac OS X, Linux Последняя версия 6.0.1411.1512 (Internet Explorer) 24 марта, 2009 7.1.20110316L (Firefox) 20 а … Википедия

Компания Google — Google Inc. американская компания, владеющая первой по популярности в мире поисковой системой Google. По данным компании ComScore, в 2012 году рыночная доля Google в мире составила 65,2% (114,7 миллиарда поисковых запросов). Компания Google была… … Энциклопедия ньюсмейкеров

Translate.ru — первый российский веб сервис, предназначенный для перевода текста или веб страниц на другие языки. При переводе отдельного слова выдаёт словарную статью. Открыт 6 марта 1998 года компанией PROMT. Один из двух самых популярных онлайн… … Википедия

Яндекс.Перевод — Яндекс.Перевод … Википедия

Институт глобальных экономических мер — Эту статью следует викифицировать. Пожалуйста, оформите её согласно правилам оформления статей … Википедия

Creative Commons — Эта статья  о организации. О созданных ею лицензиях см. Лицензии Creative Commons. Корпорация Creative Commons (Creative Commons Corporation) … Википедия

Forvo — URL: http://ru.forvo.com Коммерческий: Нет Тип сайта: База произношений Регистрация … Википедия

WikiBhasha — Разработчик Microsoft Написана на Javascript, PHP Операционная система Windows, Linux Первый выпуск 18 октября 2010 Последняя версия 1.0.1 (25 октября … Википедия

Google Translate

Google объявил [1] о масштабном обновлении сервиса Google Translate: в основу работы переводчика будут положены нейросети. Для некоторых языков нейронный перевод начал использоваться с ноября 2016 года; другие, в том числе и русский, перейдут на новую технологию в ближайшее время. Разработчики утверждают, что нейросети значительно улучшают качество перевода, поскольку машины могут анализировать не отдельные слова и фразы, а законченные предложения и контекст [2] .

2016: Искусственный интеллект Google изобрел собственный язык

Искусственный интеллект сервиса Google Translate, начавший использовать в своей работе нейронные сети при переводах некоторых языковых пар, изобрел собственный язык, сообщает издание New Scientist со ссылкой на сотрудников Google [3] .

Специалисты Google полагают, что язык, который удалось создать их искусственному интеллекту, представляет собой аналог международного вспомогательного языка интерлингва.

Аналог интерлингвы

Интерлингва, разработанная Международной ассоциацией вспомогательного языка (IALA), включает в себя слова, имеющие латинские корни, а также международную лексику. Поскольку в языке используются не искусственно придуманные корни слов, как во многих других искусственных языках, а действительно существующие индоевропейские корни, интерлингва может быть понятна огромному числу людей из разных стран, в особенности тем, кто говорит на каком-либо романском языке.

Аналогично, как пишет New Scientist, искусственный интеллект Google создал для удобства перевода некий общий язык, объединив схожие по смыслу и написанию предложения и слова из разных языков.

При этом специалисты уточняют, что этот новый язык Google Translate все же пригоден исключительно для перевода и не подойдет для общения между людьми. По мнению экспертов, метод перевода Google, получивший название Zero-shot Translation, не способен сравниться с «человеческим» переводом, однако демонстрирует хороший потенциал.

Нейронный машинный перевод Google

В сентябре 2016 г. Google Translate начал работать по новой схеме с использованием нейронных сетей.

Сейчас эта схема распространяется на восемь языковых пар (к примеру, английский – китайский), с которыми работает Google Translate (всего переводчик поддерживает более 100 языков и порядка 10 тыс. языковых пар, ежедневно переводя примерно 140 млрд слов).

Детали алгоритма нейронного машинного перевода (Neural Machine Translation, NMT) были обнародованы на сайте научных работ arxiv.org. Авторы работы отмечали трудности метода – не только дороговизну использования NMT, но и проблемы с переводом редких слов.

В январе 2015 года Google представил обновленное приложение «Google Переводчик» для iOS и Android. В версии сервиса стал возможным мгновенный перевод надписей с английского на русский, французской, немецкий, итальянский, португальский и испанский языки, а также с этих языков на английский. Достаточно просто навести камеру на нужную вывеску или текст, и перевод сразу же отобразится на экране даже без интернет-подключения.

В конце 2014 года специалисты компании Google заканчивают работу над функцией синхронного перевода речи в Google Translate. Ожидается, что данная возможность будет реализована в версии, предназначенной для установки на мобильные устройства, построенные на базе операционной системы Android. По предварительной информации в скором будущем приобрести новинку можно будет в фирменном магазине Google Play. Планируется, что мобильное приложение будет распознавать речь на нескольких языках, а выдавать перевод будет в формате текстового сообщения. Аналогичный сервис уже используется в Google Translate, но новая версия предложит практически моментальную реакцию, расширяя возможности использования синхронизированного перевода.

Стоит отметить, что подобная возможность уже реализована в Skype Translator от компании Microsoft. Сервис начал действовать в режиме тестирования с декабря 2014 года для голосовых звонков, предлагая перевод в реальном времени, но пока действует только на двух языках (английский и испанский).

В апреле 2011 года компания Google представила экспериментальную функцию распознавания голоса в популярном онлайн-переводчике Google Translate, сообщил сайт Google Operating System.

Функция работает только в тестовых версиях браузера Google Chrome и может распознавать и переводить фразы только с английского языка. Тем не менее, поскольку система распознавания речи основана на наработках «Голосового поиска Google», в дальнейшем сервис будет поддерживать большее количество языков, включая русский.

Для работы сервиса используется система HTML Speech Input API, отвечающая за распознавание голоса в Google Chrome. Поддержка этой технологии, представленной в Chrome в марте, пока носит экспериментальный характер. В дальнейшем с ее помощью разработчики предполагают реализовать полное голосовое управление браузером.

HTML Speech Input API — сравнительно молодое расширение стандарта HTML5, разрабатываемое компанией Google. Спецификации еще не закончены, поэтому другие браузеры пока не внедряют поддержку этой технологии.

Технологии, необходимые для полноценной работы новой функции Google Translate, пока находятся на ранней стадии развития. По этой причине распознавание голоса часто не срабатывает нужным образом. Разработчики пока не сообщают, когда данная возможность будет пригодна для повседневного использования.

Lost in Google Translation: как менялся машинный перевод за последние 80 лет

Нейросети сейчас используют с самыми разными целями — и для обработки фотографий, и для создания новостей, и для перевода. Регулярно появляются новости о том, что скоро искусственный интеллект во многих вещах сможет заменить человека. Насколько это правда и сможет ли машинный перевод составить конкуренцию переводчикам, Skyeng Magazine разобрался вместе с фестивалем Geek Picnic.

Вначале было слово

Знаете о «вавилонской рыбке» из «Автостопом по галактике»? Это существо, которое можно было поместить себе в ухо и получить возможность понимать все-все-все языки. Учитывая, как трудно порой дается английский (а это не самый сложный язык), подобная штука была бы очень кстати. И над ее созданием люди начали биться еще до появления компьютеров.

Советский ученый Петр Смирнов-Троянский в 1933 году создал «машину для подбора и печатания слов при переводе с одного языка на другой». Она состояла из карточек со словами на четырех языках (русский, английский, немецкий, испанский), печатной машинки с лентой и фотоаппарата. Оператор брал слова из текста, находил карточку, фотографировал ее, а на машинке печатал, какая это часть речи, число и падеж. Получившуюся ленту лингвисты превращали в текст.

Изобретение Троянского посчитали ненужным. Почти никто не знал о нем, пока патенты ученого не нашли в архивах. Собственно, даже этого не случилось бы, если бы СССР не нужно было искать ответ на вызов американцев в Холодной войне.

А потом появился машинный перевод

В 1954 году в Нью-Йорке прошел Джорджтаунский эксперимент. Компьютер IBM 701 перевел 60 предложений с русского языка на английский. В СМИ сразу появились статьи о том, что вскоре компьютеры заменят переводчиков — ну, вы же знаете журналистов. Но они понятия не имели, что предложения были тщательно подобраны, чтобы избежать любых ошибок.

Тем не менее, это привело к появлению дальнейших разработок. Капиталистические и социалистические страны соревновались в шпионаже, поэтому над системами перевода думали много. На самом деле, благодаря этому у нас сейчас есть интернет: первоначально его придумали в военных целях.

Легендарный PROMT

Программисты пытались заимствовать идеи у лингвистов. Так появился rule-based machine translation (машинный перевод на основе правил). По сути, они брали словарь и набор правил под каждый язык. Известные примеры подобных разработок — PROMT и Systran. Не нужно рассказывать, что итоговый перевод получался далеким от идеала. Иногда и вовсе выходил бред.

Взять хотя бы великий русский перевод GTA San Andreas. В оригинале герой говорит: «She’s with me, cabron. So chill the fuck out. I treat her good». Если бы эту фразу переводил человек, то получилось бы примерно так: «Она со мной, козел. Так что остынь. Я хорошо с ней обращаюсь». Тем не менее, машина не понимала сленг и контекст. Испанское ругательство cabron он перепутала с carbon. В итоге получилось знаменитое «охладите траханье» и далее по списку.

Lost in Google Translation: как менялся машинный перевод за последние 80 лет

Но и в таких переводах была польза. Во-первых, это смешно. Во-вторых, это показывало, что машины едва ли заменят людей в ближайшее время, так что никакое восстание нам пока не грозит. Да и шпионы могли быть спокойны: ведь если в деле участвовал машинный перевод, значит, можно не беспокоиться — информация в безопасности.

Были и другие идеи. Например, японцы в 80-х придумали example-based machine translation (машинный перевод на примерах). Они предлагали использовать множество уже имеющихся переводов различных конструкций и заменять в них необходимые слова, используя словарь. И не нужно тратить время на попытки обучить машину правилам. Такой вариант был лучше прошлых. Но все же до идеала неблизко.

Рождение гугл-транслейта

В 90-е появился statistical machine translation (статистический машинный перевод), который лег в основу всех ныне существующих онлайн-переводчиков. Ученые отказались обучать компьютер правилам и лингвистике. Они вбили в программу тысячи одинаковых текстов на двух языках, чтобы она сама разобралась с закономерностями. Чем больше текстов, тем лучше качество — переводы становятся логичнее.

Вот только это не решало многих проблем, например, с артиклями, вспомогательными глаголами и порядком слов в предложении. А еще языком-посредником во многих переводах выступал английский. В итоге получался эффект сломанного телефона. Вспомните развлечение: вставить текст на русском, перевести на английский и обратно. Если сделать так раз пять, итоговый текст вы можете не узнать.

Новости про ошибки в машинном переводе обычно вызывают много смеха. Что уж там, Google даже в рекламе невольно показал, что пока что настоящий переводчик куда лучше алгоритмов. Во время Супербоула зрителям показали ролик с переводами на разные языки, и фраза «Imported black farm-raised caviar» по-русски выглядела как «Импортные черный фермы подняли икра». Как видите, человек тут бы точно пригодился (хотя и люди допускают перлы в переводах).

Нейросеть предсказывает Апокалипсис

В 2016 году о нейросетях начали говорить все чаще. Google, в свою очередь, начал внедрять их в свой переводчик. Используя методы deep-learning (глубокое обучение), нейросеть можно обучать. Потом она сама уже непрерывно учится на собственных обработанных операциях и заимствует опыт других цифровых окружений.

Сейчас Google использует механизм «рекуррентных нейронных сетей». То есть переводчик учитывает контекст и еще множество других параметров, прежде чем выдать вариант перевода.

Нейронный перевод уже выглядит как заявка на успех в дальнейшем переводе. Кроме того, благодаря нейросетям можно переводить языки напрямую. Также в онлайн-версию Google Translate пользователи могут добавлять и свои переводы, и если ее одобрят другие — переводчик будет выбирать ее. Это не уберегает алгоритм от шутников. Но теперь он очень точно переводит повседневные фразы.

«Яндекс.Переводчик» тоже внедряет в работу нейросети. При этом в компании заявили, что используют гибридную систему. Предложение переводится сразу двумя методами — статистическим и нейросетевым. Потом алгоритм выбирает подходящий. Кроме того, «Яндекс» развлекается, добавляя в свой переводчик эльфийский и язык эмодзи. Ну а почему бы и нет?

Но без ошибок нейросеть пока тоже не обходится. И даже не просто ошибок — порой при переводе простых слов с языков, которые считаются редкими, гугл-транслейт начинает предсказывать конец света и вообще вести себя странно. Про подобные перлы есть даже телеграм-канал Neural Machine. Его автор вбивает бессмысленные сочетания, а в ответ получает странные фразы, претендующие то ли на философию, то ли на безумие.

Lost in Google Translation: как менялся машинный перевод за последние 80 лет

Разработчики официально подобные случаи не комментируют, но, возможно, дело в том, что система просто пытается совместить бессмыслицу с имеющимся у нее корпусом текстов. Да и тексты для перевода с редких языков (таковыми считаются, к примеру, монгольский и казахский) Google собирает при помощи добровольцев. Мало ли что они туда загружают. Тем не менее, нейросети по сравнению с остальными способами перевода — это целая революция.

Сейчас в Google работают над синхронным голосовым переводчиком. Подобные наработки уже есть у Skype. Но идеальный машинный перевод, тем более речи — это пока мечта. Так что знание английского все равно пригодится.

На научном фестивале Geek Picnic пройдут лекции про искусственный интеллект, нейросети и машинное обучение. Приходите и послушайте лекции про то, как машины учатся понимать человеческий язык, чем искусственный интеллект полезен в маркетинге и какое его ждет будущее. Читателям Skyeng Magazine мы дарим скидку 15% на билеты по промокоду AIGP. Воспользоваться предложением можно до 2 июля.

Интервью с создателем Google Translate

Franz Josef Och — руководитель команды машинного перевода в компании Google и это именно тот человек, который стал “ударной силой” развития технологии Google Translate. Только не нужно сразу говорить, что мол переводчик от Google — это фигня фигней. Не забывайте, Google Translate используется на многих сайтах в качестве моментального перевода на ваш родной язык, и поверьте мне — это намного лучше, чем ничего. Разобраться с корявым русским переводом все же легче, чем с китайскими иероглифами, или вы поспорите с этим? Ну а теперь давайте почитаем интервью с данной личностью.

Как часто вы добавляете новые языки в словарь Google Translate?

Начиная с 2007 года процесс добавления новых языков стал привычным делом для моей команды. С запуском новых языков мы также обращаем внимание и на качество. Последние два с половиной года мы достигли рамки 52 разных языков и я думаю, мы сделали довольно неплохой шаг вперед в улучшении технологии машинного перевода.

Последний язык, который мы добавили был Haitian Creole. Честно скажу, мне самому довольно необычно осознавать, что мы можем использовать технологии машинного перевода для таких маленьких языков. Если бы вы спросили меня три года назад, когда появятся Haitian Creole, или Yiddish, я бы наверняка ответил, что в далеком далеком будущем, либо вообще никогда. Но сейчас, благодаря интернету и возможности достать практическую любую информацию с помощью разных алгоритмов, мы можем создавать системы машинного перевода и для маленьких языков и заставляем их работать довольно хорошо.

Как это вообще возможно, сделать систему для языка Yiddish, ведь в нем нет особого текста, чтобы забить базу в инструмент перевода?

Во первых, Yiddish очень похож на немецкий язык и имеет сходство с некоторыми словами Hebrew и польского языков. Для этих языков у нас есть огромная база текстов. Что мы делаем, так это изучаем особенности языков, которые у нас есть, а потом составляем базу для Yiddish.

Как компания Google сумела предвидеть (на таких ранних этапах), что перевод веба будет очень востребованным?

Интервью с создателем Google Translate

Языковый барьер — действительно большая проблема для процесса коммуникации. Это особенно выражено в регионах, где практически нереально найти достаточное количество информации на своем родном языке, в то время, когда на другом — есть практически все. Такой язык как Арабский, где только 1% информации в интернете предоставляется на арабском, создает преграду для населения узнать больше. Наша идея довольно проста — с помощью технологий разрушить ограничения в интернете, но вот сможем ли мы это сделать? Каждый имеет право пользоваться информацией в интернете.

Когда я стал работать в Google, Я позвонил Larry и высказал свою идею по поводу перевода сети. Я аргументировал свои домыслы тем, что кому как не поисковой системе это нужно больше всего. Чем больше людей сможет понимать язык информации, тем больше будет пользователей и самой поисковой системы. Он сказал, что это одна из самых главных миссий компании.

Идеальным будет следующая модель: если человека интересует какой-то вопрос и он вводит его на своем родном языке, результат выдачи должен быть многогранным. То есть, если не было найдено подходящего ответа например в русском Google, то мы должны направить на решение задачи в переводе с английского языка. Надеюсь, я не запутал вас.

Как близко вы приближаетесь к достижению такой цели?

Ну это сложный вопрос. В некоторой степени, мы уже сделали некий прогресс, ведь сейчас подходящее время для исследования науки машинного перевода. Судя по статистике, все больше и больше людей используют машинный перевод в интернете и это помогает им открывать совершенно новые просторы. Но с другой стороны, мы знаем, что у нас еще есть много проблем и задач в будущем. На данный момент мы работаем над качеством перевода машинных программ.

Таким образом, моя работа довольно таки долгосрочная. На протяжении многих лет будет что изменять и над чем работать. Хочется отметить, что для некоторых языков (испанский и португальский) качество машинного перевода достигло солидного уровня. Но вот с маленькими языками еще нужно работать и работать. Это будет “бесконечный” процесс улучшения.

Когда вы тестируете переводчик, вам нужно иметь так званные параллельные тексты, где есть как минимум два языка. Где вы достаете все эти формы?

Когда мы только начинали создавать нужную базу, мы брали стандартные формы, которые любезно предоставлял Linguistic Data Consortium — институт лингвистических исследований. Потом мы поняли, что есть такая потрясающая организация как Лига Наций, где каждый документ переведен на 6 языков. Перевод документов на таком уровне осуществляется очень профессиональном людьми, поэтому мы почерпнули много полезного из предоставляемых переводов.

Но с другой стороны, это и эффект “веба”. Все документы, которые есть в интернете в той или иной степени, являются переводом друг друга. Безусловно, качество перевода в некоторых случаях оставляет желать лучшего, но это и есть интересная задача для нас. Мы стараемся устранить самые дефектные переводы и оставить только самые адекватные.

Наши алгоритмы, практически все мои — это именно то, что делает перевод лучше.

Это некий тип аналогий, который используется пауком Google для считывания веб страниц?

Очень похоже на то. У нас есть два типа поисковых пауков: один отвечает за индексацию страниц в интернете, другой за наличие текстов, которые включают перевод. Задача второго — это попытаться найти тексты, которые были переведены на другой язык и найти соответственный адекватный перевод слов.

Вы используете информацию из книг Google как источник хорошего перевода?

Безусловно, книги являются хорошим источником полезной информации для машинного перевода. Классические произведения были переведены на несколько языков мира и перевод этот уж очень высокого качества. Но в каждом языке есть своя специфика, поэтому использовать все — будет просто неправильно. Мы подстраиваемся под каждый язык индивидуально. Отвечая на ваш вопрос — да, мы используем книги.

Версия для Андроида программы Google Translate позволяет пользователю проговорить слово, а потом автоматически переводит его. Как работает эта система?

Способ, которым мы распознаем речь, очень похож на принцип работы простого электронного переводчика. В основе обеих методов лежит ну просто громадный объем информации. Для машинного перевода нам нужно иметь перевод, для распознавания речи — специальные сигналы, которые есть в базе и сформированы по принципу транскрипции. Чем больше у нас есть транскрипции слов, тем лучше будет качество распознавания.

Это практически шаг в перед, в мир перевода в реальном времени, а-ля универсальный переводчик «Star Trek’s»?

У нас есть все необходимое оборудование и ресурсы, чтобы повысить уровень распознавания речи и машинного перевода до новых, невиданных ранее, рубежей. Все это дело времени, друзья, дело времени…

Добавить комментарий

Ваш адрес email не будет опубликован.