Перевод текста с изображения может понадобиться в самых разных ситуациях: например, в зарубежном ресторане нет даже англоязычного меню, или в коробку к электронному девайсу вложена инструкция только на китайском. С алфавитными языками дело обстоит проще: можно вбить нужный текст на латинице или кириллице. Но если нужно перевести иероглифы, без функции перевода изображений будет тяжело. К сожалению, она встроена не во все сервисы онлайн-перевода. Дело в том, что у таких переводчиков сразу две функции: OCR (optical character recognition, то есть оптическое распознавание символов) и собственно машинный перевод. «Лента.ру» протестировала лучшие онлайн-переводчики и делится результатами.
«Яндекс-переводчик»
Доступ: бесплатно Платформа: веб, компьютер, смартфон Количество поддерживаемых языков: 102 Поддерживаемые форматы: JPG, PNG, GIF Максимальный размер: 5 мегабайт Ограничение в день: нет Ссылка на официальный сайт: https://translate.yandex.ru/ Особенности: можно сохранить текст перевода и оригинала, а также картинку с переводом
Этот переводчик чаще всего используется в России. Он полностью бесплатен и доступен с русского IP. С помощью «Яндекс-переводчика» можно переводить тексты с изображений и в режиме реального времени, и с фото, сохраненных в галерее.
Для тестирования приложений для перевода текста с картинки «Лента.ру» использовала четыре изображения: меню на японском языке; рукописное письмо на английском языке; постер фильма на французском языке; инструкцию на китайском языке.
Меню на японском языке
Перевод меню получился на троечку: хотя смысл передать удалось, многие части текста остались на японском языке. Встроенная функция определения языка тоже сработала плохо, так что при использовании приложения придется не только выбирать язык, на который нужно сделать перевод, но и указывать язык оригинала.
Письмо на английском языке
Перевод рукописного текста на английском получился у «Яндекса» хуже всего: он не смог распознать курсив и перевел только несколько слов из текста.
Постер на французском языке
«Яндекс-переводчику» удалось считать почти весь текст с постера (за исключением символов внизу, которые сложно разобрать и человеку) и перевести его с сохранением смысла. Но для носителя русского языка не все фразы звучат естественно.
Инструкция на китайском языке
Весь текст инструкции был распознан успешно. В целом смысл перевода передан правильно, но слишком много неоднозначных моментов, мешающих понять нюансы. Кроме того, из-за мелкого шрифта трудно разобрать слова.
GPT-4o
Доступ: бесплатно, есть платная версия Платформа: веб, смартфон, десктоп-версия Количество поддерживаемых языков: более 50 Поддерживаемые форматы: JPG, PNG, GIF, WEBP Максимальный размер: 25 мегабайт Ограничение в день: да Ссылка на официальный сайт: https://chatgpt.com/ Особенности: можно уточнить или исправить перевод в переписке с чат-ботом, а также проанализировать текст или, например, попросить нейросеть написать его изложение
Чат GPT — это нашумевшая модель генеративного (порождающего) искусственного интеллекта. Перевод текста и распознавание текста с изображения — это лишь одна из его функций. Хотя GPT ограничен в языках, у него есть однозначные преимущества: например, можно уточнить контекст перевода или попросить его объяснить непонятные конструкции. GPT нельзя использовать с российского IP.
Меню на японском языке
Чат GPT распознал меню, верно его перевел и представил перевод в структурированном виде. Неудобно, что перевод не встраивается в оригинальное изображение, трудно сориентироваться.
Письмо на английском языке
Чат GPT не смог перевести письмо, так как функция распознавания курсива не включена.
Постер на французском языке
ChatGPT довольно хорошо перевел текст с афиши, к тому же он оставил непереведенными франкоязычные названия изданий. Из-за того, что пользователь получает в ответ текст без привязки к изображению, сориентироваться может быть непросто.
Инструкция на китайском языке
У GPT хорошо получилось перевести инструкцию. Она доступна для понимания и похожа на нормальный текст на русском языке.
«Google-переводчик»
Доступ: бесплатно Платформа: веб, компьютер, смартфон Количество поддерживаемых языков: 247 Поддерживаемые форматы: JPEG, JPG и PNG Максимальный размер: 10 мегабайт Ограничение в день: нет Ссылка на официальный сайт: https://translate.google.com/ Особенности: можно сохранить распознанный текст оригинала и перевод, а также картинку
«Гугл-переводчик» доступен в России, а еще он поддерживает две с половиной сотни языков. Как и «Яндекс-переводчик», приложение Google может работать в режиме реального времени: для этого нужно навести камеру на текст, который вы хотите перевести.
Меню на японском языке
С меню Google справился примерно на том же уровне, что и «Яндекс»: кое-где перевод хромает, при этом понятен состав каждого блюда, ясно, как оно называется. Переводчик смог распознать весь текст. Правда, текст сложно разобрать, поскольку у изображения с переводом слишком низкое разрешение.
Письмо на английском языке
Google полностью распознал курсив и перевел текст с сохранением смысла, но есть некоторые логические и синтаксические ошибки.
Постер на французском языке
Хотя почти весь текст удалось считать, перевод отдельных фраз оставляет желать лучшего.
Инструкция на китайском языке
В целом перевод инструкции получился хорошо, но из-за дефектов распознавания изображения некоторые конструкции оказались вне контекста и были переведены неверно. И снова очень мелкий шрифт.
DeepL
Доступ: бесплатно (тексты до 3000 знаков), есть платная про-версия (нельзя оплатить русской картой) Платформа: только смартфон (для перевода по фото) Количество поддерживаемых языков: 11 языков Поддерживаемые форматы: JPG, PNG, PDF Максимальный размер: 5 мегабайт (бесплатно) Ограничение в день: нет Ссылка на официальный сайт: https://www.deepl.com/ru/translator
DeepL (от английского Deep Learning — «машинное обучение») — это популярный переводчик на базе искусственного интеллекта, отличается высоким качеством перевода разных жанров и регистров. Хотя переводчик есть в качестве веб-, десктоп- и смартфон-приложений, перевод по фото возможен только в версии для андроида и айфона. Про-версию приложения нельзя оплатить российской картой.
Меню на японском языке
У DeepL получился очень плохой перевод меню. Почти все позиции были переведены неверно, и текст был распознан плохо.
Письмо на английском языке
DeepL сделал неудачный перевод рукописного письма: хотя смысл основного текста отдаленно похож на оригинал, границы предложений нарушены, многие слова вырваны из контекста.
Постер фильма на французском языке
То, что распозналось, переведено отлично, но опять подвел механизм распознавания.
Инструкция на китайском языке
Перевод инструкции оказался средним: в целом можно понять порядок действий, но смысл сильно искажен.
Image to Text
Доступ: бесплатно, есть платная про-версия (нельзя оплатить русской картой) Платформа: веб-приложение, Android, iOS Количество поддерживаемых языков: 106 Поддерживаемые форматы: JPG, PNG, TIFF, HEIC Максимальный размер: 5 мегабайт (бесплатно) Ограничение в день: нет Ссылка на официальный сайт: https://www.imagetotext.info/image-translator Особенности: распознавание текста и без перевода
Image to Text («изображение в текст») — приложение, специализирующееся на распознавании текста с картинки. Доступно бесплатно, а продвинутая версия позволяет обрабатывать картинки большего размера. Про-версию приложения нельзя оплатить российской картой.
Меню на японском языке
Сервис распознал и перевел текст на картинке средне, но, как и у Google, качество изображения сильно пострадало, и буквы сложно разобрать. Общий смысл передать удалось.
Письмо на английском языке
У Image to Text удалось лучше всех справиться с распознаванием рукописного текста, но в переводе есть ошибки.
Постер фильма на французском языке
Текст был переведен довольно хорошо, но распознавание сработало чуть хуже: так, фамилию главной героини сервис перевел без контекста, из-за чего она стала «жеребенком».
Инструкция на китайском языке
Текст на китайском языке был отлично распознан и переведен с сохранением смысла. Некоторые конструкции кажутся неестественными, но это не вредит пониманию. Очевидный минус — у перевода снова мелкий шрифт.
Результаты тестирования Лучше всего со всеми задачами справился ChatGPT, а еще ему можно давать инструкции для улучшения перевода или спрашивать значение конкретных слов. Из минусов — недоступность с российского IP, небольшой лимит на распознавание картинок в день, неудобство навигации по тексту перевода. Image to Text выдает стабильный хороший результат, поскольку распознавание текста — это главная функция сервиса. Переводчик от Google — самый оптимальный вариант в плане доступности и качества перевода. У «Яндекса» сильно отстает качество перевода и распознавания. У DeepL самая слабая система распознавания изображений, хотя качество перевода у него хорошее, он считается одним из самых эффективных переводчиков. Для лучшего качества перевода можно сначала попробовать распознать текст в стороннем приложении.