Программа для андроид распознавания текста: 12 программ для распознавания текста на Android [бесплатно] – Создание Android приложения для распознавания текста за 10 Минут. Mobile Vision CodeLab / Habr

Copy Paste Any Text Instantly


Copy Paste Any Text InstantlyCopy Paste Any Text Instantly для АндроидПриложение для распознавания текста с фото на Android


Copy Paste Any Text Instantly. Это не редактор, это простое приложение для распознавания текста с фото и последующего редактирования в специальном текстовом редакторе. Распознавание текста весьма трудоемкий процесс с точки зрения программных решений, но для пользователя все это не к чему, ведь ему главное, чтобы был понятный интерфейс и хорошее распознавание текста. Приложение Copy Paste Any Text Instantly может предложить и первое, и второе, и при этом не только на английском, но и на многих других языках, включая русский и украинский.

При первом запуске приложения вам нужно выбрать и дополнительно загрузить словари для приложения, хотя по умолчанию уже загружены русский и английский. После этого вернутся на главный экран, где выбрать язык распознавания. К сожалению, сделать более удобного процесса выбора перевода разработчики почему-то не удосужились, поэтому, каждый раз придется запускать приложение и менять его вручную.

А как же распознавать текст? Все очень просто! Вы сделали фотографию или скриншот с текстом, затем открываете его в галерее и нажимаете на кнопку “Поделиться”. После этого выбираете в списке название приложение, выделяете при помощи рамки область с текстом и ожидаете, пока приложение завершит свою работу. Со своей работой приложение справляется на отлично, распознается как русский, так и английский текст, ошибок минимум, хотя это в большинстве случаев будет зависеть от качество картинки, шрифта текста и некоторых других параметров. После распознавания вы на время увидите текст, а затем он исчезнет. Но переживать не стоит, поскольку, весь текст автоматически скопировался в буфер обмена. Теперь вам нужно запустить любой текстовый редактор и вставить текст. После этого его можно редактировать сколько угодно.

Настройки приложения находятся на главном экране приложения и в них вы можете изменить только язык распознавания и загрузить дополнительные словари. Copy Paste Any Text Instantly — это прекрасное приложение для распознавания текста, которое занимает очень мало места и предлагает хорошо работающий функционал.

Скачать приложение Copy Paste Any Text Instantly на Андроид вы можете по ссылке ниже.


Разработчик: TheSimplest.Net
Платформа: Android 2.3.3 и выше
Язык интерфейса: Английский
Состояние: Full (Полная версия)
Root: Не нужен



 

Как я создала прибыльное Android приложение по распознаванию текста / Habr

Всем привет. В прошлой статье я рассказывала, как заработать свои первые 100$ в Google Play Market. В этой статье я больше расскажу о разработке и управлении проектом.

Предмет статьи — Android приложение по распознаванию текста, которое в маркете 4 месяца и имеет почти 10 000 инсталлов, монетизируется посредством платных подписок, покупок в приложении и рекламы.

Приложение умеет распознавать текст (Google Vision OCR API), переводить распознанное (Bing Translate API), формировать Searchable PDF, хранить историю в Cloud.

Немного про распознавание, выбор API


Идея создать свое Android приложение по распознаванию текста возникла давно. Тематика была выбрана случайно. Я хотела содать OCR приложение на скорую руку, потому что уже имела готовый OCR функционал на базе Tesseract. Ранее на Хабре я писала, как создать простое OCR приложение на базе Tesseract. В то время мне казалось, что работа выполнена чуть ли не на половину, что стоит лишь быстро накатить красивую морду — и в продакшин! О, как я ошибалась.

В процессе работы стало понятно, что выполнять OCR на андроид устройстве — плохая идея, производительность устройства низкая, приходится долго ждать результат. Кроме этого Tesseract OCR модуль занимает много места на диске (17 МБ), и это только Light версия с минимальным словарем английского языка. Я приняла решение создать backend часть, и вынести туда OCR модуль. Качество распознавания увеличилось на 20-30% благодаря тому, что словари стали полнее, а так же появилась возможность использовать версию Tesseract посвежее (Java wrapper для Tesseract обновляется чаще, чем Android wrapper).

Но все равно качество распознавания было так сказать оупенсорсное :), что и следовало ожидать от оупенсорс библиотеки. Тогда один случайный знакомый с GitHub предложил мне затестить Google Vision OCR API. Библиотека не бесплатная, но у меня появилась психологическая готовность платить за API. Google Vision дал намного более точный результат и это именно то, что я сейчас использую. В месяц я плачу около 20 долларов за использование только этого API.

Google предлагает хорошую библиотеку и для переводов текста, но она показалась мне дорогой — перевод тянул в 2-3 раза больше денег, чем распознавание, и с целью экономии я перешла на Bing Translate API от Microsoft. Качество не упало, но в рекламе уже не могу кричать про 100+ языках для перевода, их тут всего 64. Бесплатных хороших API по переводу вроде нет.

Все остальные сервисы, которые я использую, гугловые. Google App Engine для хостинга приложения, Google Database, Google Storage для хранения данных.
Мне удобно использовать готовые решения — я работаю одна и времени на разработку мало (я молодая мама).

Немного про дизайн, управление командой


Разработку вела в одиночку, но привлекала дизайнера и Junior Android разработчика натянуть новый дизайн.

Хочу немного написать про поиск дизайнера. Дизайн приложения, иконки, промографика мне обошлись в 55 долларов. Я полагаю, это очень дешево и цена более чем соответствует качеству. Дизайнера нашла на русском фриланс сайте. У дизайнеров, которые берут мало есть общая особенность — они работают хорошо, только когда тз подробно расписано, вплоть до того, какой формы будет каждая кнопка и какой RGB код цвета этой кнопки. Это значит, что вам надо быть креативным директором и тратить свое время на подробное тз.

Junior Android девелопера нашла на Upwork. Просто хотела получить опыт работы со стороны заказчика. Дала ему простое задание — натянуть дизайн. Заплатила 70 долларов. Конечно, интереснее было бы нанять Senior dev-a, поручить оценить архитектуру приложения, научиться у него чему-то, но не рискнула много тратить денег.

Хочу отметить, что привлечение в проект других людей позволяет вам лучше контролировать проект. Когда вы планируете для других, ставить сроки — вы планируете и для себя, и вы вашу часть работы начинаете делать быстрее и осознаннее.

Немного про распространение


Когда приложение вышло в Play Market, я запустила рекламу на AdWords, привлекая пользователей со всех стран мира. Наибольшая часть пользователей пришла из Индии (15% от общего числа). При этом люди из этих стран ни разу не купили подписку. Они много раз оформляли подписку, но в течении 7 бесплатных пробных дней отменяли ее, что бы избежать платежей. Кроме этого их клики по рекламе не стояли почти ничего. Обслуживать таких пользователей оказалось не выгодно, ведь мне платить за API и я решила удалить приложение из стран, которые не входят в топ 30 по ВВП на душу населения, в том числе Россию и Украину.

Надеюсь мой опыт был полезен. Если вы занимаетесь похожими проектами или просто хотите обменяться опытом — пишите или добавляйтесь в linkedin.

OCR-сканеры: Android-приложения для сканирования документов

Чтобы отправить бумажный документ по электронной почте, вовсе необязательно использовать ПК в связке со сканером — достаточно воспользоваться камерой смартфона и сделать снимок. Если же необходимо внести коррективы — в таком случает не обойтись без программ, которые не только помогут оцифровать документ, но и обладают дополнительными возможностями. Такие мобильные сканеры на порядок проще и удобнее в использовании.


Мобильных сканеров в Play Store не так уж и мало. Но интерес вызывают те из них, которые имеют функцию оптического распознавания текста (OCR). Некоторые читатели могут возразить, что есть бесплатная возможность выполнить OCR в том же Google Drive. И будут правы… отчасти. Google и вправду предлагает замечательную функцию распознавания текста, преобразовывая PDF-файлы и изображения в текстовые документы, но здесь есть свои ограничения. К тому же, результат не всегда желаемый, а манипуляций приходится делать гораздо больше. В этой статье мы рассмотрим несколько достойных кандидатов на роль мобильного сканера с OCR-функцией.

 

Первым и, пожалуй, наиболее известным инструментом для распознавания текста можно считать приложение от компании ABBYY. Для мобильных платформ программа получила название ABBYY TextGrabber + Translator и объединила функции OCR и переводчика.

Интерфейс приложения содержит всего лишь две основные кнопки на экране, отвечающие за добавление изображения из галереи и создание снимка с помощью стоковой камеры устройства с поддержкой только одиночного режима сканирования. В приложении доступно более 60 языков, в том числе и украинский. Весь процесс распознавания занимает не больше минуты. Что касается распознанного текста – здесь не все однозначно, конечный результат очень сильно зависит от качества полученного изображения. К сожалению, никаких инструментов, кроме кадрирования, в приложении нет. Ко всему прочему, TextGrabber не содержит встроенных средств для исправления перспективы, настройки яркости и контраста. Лучше дела обстоят со скриншотами, которые программа распознает значительно уверенней, но также не идеально. Распознанный текст не сохраняет никакого форматирования оригинального документа. Его можно отредактировать, скопировать в буфер, передать в другие приложения, в том числе и социальные сети, отправить по SMS или электронной почте. Не очень приятным моментом при этом является то, что программа автоматически добавляет к тексту подпись «Captured by ABBYY TextGrabber». Ранее распознанные тексты сохраняются в приложении, их можно просмотреть в «Истории».

Бонусом в программе идет вторая часть функциональной нагрузки — Translator. Это перевод распознанного текста на более чем 40 языков мира благодаря интеграции с сервисом Google Translate. Такую возможность можно использовать, например, для перевода вывесок, надписей и небольших фрагментов текста. Для более объемной информации — польза весьма сомнительная. Работает переводчик при выполнении двух условий: хороший результат распознавания и подключение к интернету.

В результате ABBYY TextGrabber + Translator несколько разочаровал. Приложение имеет отличную скорость и стабильность работы, однако ему крайне не хватает дополнительных функций предобработки изображений, что, несомненно, улучшило бы конечный результат. ABBYY TextGrabber представлен только в платной версии. На текущий момент цена программы в Google Play неоправданно высокая и составляет 159 грн.

 

Самое популярное по количеству загрузок приложение-сканер. Это не просто утилита для сканирования изображений, а настоящий программный комплекс со множеством функций. CamScanner выгодно отличается наличием встроенной камеры, которая позволяет распознавать визитные карточки, текстовые документы и QR-коды в одиночном и пакетном режимах. Любопытной особенностью интерфейса камеры является опция, которая демонстрирует уровень наклона устройства.

Программа автоматически определяет границы документа, исправляет перспективу, но последнее слово за редактированием оставляет за пользователем, в распоряжении которого — полноценный редактор изображений с готовыми шаблонами и ручной регулировкой яркости, контрастности и детализации. Результат сканирования сохраняется в PDF-файл. Для каждого документа можно установить более детальные настройки. В приложении предусмотрена система тегов, с помощью которой можно легко сортировать отсканированные документы, если таковых накопилось немалое количество.

Основные функции программы доступны в бесплатной версии CamScanner. Ограничения коснулись загрузки в Evernote и OneDrive и возможности экспортировать распознанный текст, в сохраненных PDF-файлах присутствует водяной знак. Лицензионный ключ, стоимостью ~24 грн. (с учетом скидки), позволяет оценить возможности OCR. Как оказалось, среди языков распознавания отсутствует украинский и русский. Соответственно, на текущий момент практической пользы от OCR-функции для большинства украиноязычных и русскоязычных пользователей в приложении нет. На примере документа с английским текстом можно отметить, что процесс распознавания CamScanner – наиболее быстрый из всех рассматриваемых в данной статье программ с очень хорошим результатом и сохранением абзацев.

Стоить заметить, что некоторые функции приложения становятся доступны только после регистрации в сервисе. К таковым относится синхронизация с облачными хранилищами, включая собственное «облако» от CamScanner, и социальные функции, которые позволяют оставлять комментарии, открывать доступ к документам другим пользователям сервиса или делиться с ними ссылками. Среди дополнительных функций в программе есть резервное копирование и восстановление данных на SD-карте, установка пароля на просмотр защищенных документов, экспорт с возможностью загрузки в облако или печати с помощью виртуального принтера Google. В результате CamScanner — отличный инструмент для сканирования различных документов. К сожалению, удачно реализованная функция OCR не содержит ни украинского, ни русского языка, что может стать ключевым моментом при выборе OCR-сканера.

 

Mobile Document Scanner (MDScan) — программа, пришедшая из Nokia Ovi Store, которая по праву может считаться ветераном среди мобильных инструментов для оцифровки изображений. Приложение имеет собственный интерфейс камеры, поддерживает как одиночный, так и многостраничный режимы сканирования. Главной особенностью программы являются шаблоны предобработки и постобработки изображений. MDScan автоматически очищает документ, удаляя лишние элементы и фон. Возможность ручной коррекции яркости/контрастности здесь отсутствует, но и с готовыми шаблонами можно добиться вполне приличного результата. В автоматическом режиме программа не умеет корректно определять границы текста, а вручную это реализовано не очень удобно. Из инструментов постобработки в MDScan есть кисть для рисования и добавление подписи.

Оцифрованные страницы можно объединять, разъединять, передавать в другое приложение или отправлять на печать, а сам документ можно сохранить в ZIP и PDF-файл. Все вышеперечисленное доступно пользователю в бесплатной версии приложения. Правда, придется смириться с рекламой, водяным знаком на документах и ограничением на сканирование не более 4 страниц в пакетном режиме.

Что касается OCR-функции, то такая возможность появилась в последней версии MDScan и активируется после покупки программы (~16 грн.). Надо признать, на текущий момент распознавание текста выглядит очень сырым. Во-первых, найти эту функцию и воспользоваться ею оказалось не так просто. А во-вторых, сам процесс длится настолько долго, что не каждый пользователь дождется результата. Хотя сам результат, при условии хорошей читаемости текста, может оказаться вполне годным. Единственное, что хотелось бы отметить – это умение программы корректно выделять абзацы.

 

Основной задачей этого приложения является преобразование изображения в текст с последующим его редактированием. По своим возможностям программа очень похожа на ABBYY Text Grabber + Translator. Здесь также отсутствует пакетный режим сканирования, нет инструмента для исправления перспективы, но есть интеграция с сервисом Google Translate для перевода распознанного текста на другой язык. Однако, в отличие от приложения ABBYY, OCR Instantly все же предоставляет возможность вручную корректировать снимки с помощью функции Enhance. В данном случае это всего пара ползунков, отвечающих за настройку экспозиции и уменьшение шума.

OCR работает быстро и выдает неплохие результаты. Языковые пакеты, в том числе украинский и русский, загружаются в настройках. Программа хорошо распознает текст как со снимка, сделанного камерой устройства, так и со скриншота. Распознанный текст размещается под изображением с сохранением всех абзацев. Его можно скопировать в буфер обмена или передать в другое установленное на устройстве приложение через системное меню «Поделиться».

OCR Instantly имеет и платную версию (~75 грн.), которая отличается отсутствием рекламы, расширенным OCR, возможностью выбора нескольких языков распознавания и полноэкранным редактированием текста. Кроме того, в Pro-версии приложения можно найти несколько интересных дополнений. Например, черный и белый списки символов (на случай если есть проблема с распознаванием определенного символа) или инструмент Dewarp — для выравнивания строк текста. И, разумеется, платный OCR Instantly позволяет сохранять результаты распознавания в TXT, JPG и PDF файл.

 

Scanbot можно назвать по-настоящему мобильным сканером. Приложение выполнено в концепции Material Design, выглядит современно и не перегружено лишними функциями. Основное предназначение программы — сканирование различных видов документов с последующим сохранением в PDF или JPG файл. Главным преимуществом Scanbot перед конкурентами является собственный интеллектуальный интерфейс камеры. Достаточно навести камеру на объект, как программа тут же обнаруживает текстовый документ, QR или штрих-код, определяет его границы, корректирует перспективу и оптимизирует качество изображения. Все это происходит в автоматическом режиме. Если результат не устраивает, можно внести изменения вручную. Кроме того, независимо от источника добавления изображения — камеры или галереи, Scanbot поддерживает как одиночный, так и пакетный режимы сканирования. Еще одно достоинство приложения — работа с облачными хранилищами с поддержкой автоматической загрузки отсканированных документов в выбранное «облако». Результат сканирования также сохраняется на SD-карте.

OCR-функция присутствует в платной версии Scanbot Pro (~87 грн.) и доступна после установки языкового модуля, в котором содержатся украинский и русский языки. Процесс распознавания происходит очень долго, причем в автоматическом режиме. Соответственно, возможности выбрать язык вручную приложение не дает. Из-за этого текст документа может быть определен неправильно, и тогда на выходе получим бессмысленный набор символов. Хотя, в целом, результаты разнятся и могут быть как непригодными для восприятия, так и вполне хорошими. В Pro-версии также содержатся инструменты для редактирования отсканированного документа: создание подписи, заметки и маркер для выделения текста. Приятным бонусом идут темы оформления программы. К недостаткам Scanbot можно отнести длительный процесс создания многостраничного PDF-файла, отсутствие возможности добавлять или удалять отдельные страницы в документе, а также неудобная реализация сохранения отсканированного документа в файл.

 

Итоги

Подводя итоги, хочется обратить внимание на то, что все рассмотренные приложения в полной мере раскрывают свои функциональные возможности (в частности, OCR) в платных версиях. Это говорит о том, что весь этот софт является узкоспециализированным и нацелен в большинстве своем на тех пользователей, которые будут использовать его в своей профессиональной или учебной деятельности. Исключение — OCR Instantly, в котором OCR-функция представлена в бесплатной версии.

Что касается качества распознавания, то многое, разумеется, зависит от камеры мобильного устройства, условий, при которых делается снимок, и наличия в приложении инструментов для обработки этих снимков. Все программы показывают приблизительно одинаковый результат. Чуть хуже проявил себя ABBYY TextGrabber + Translator – в данном случае основной проблемой приложения является недостаточная функциональность и отсутствие каких-либо инструментов обработки изображения. В компании ABBYY нам сообщили, что позиционируют TextGrabber + Translator как базовое решение, но в этом году собираются выпустить для Android приложение FineScanner, в котором будет больше функций. CamScanner и вовсе не имеет украинского и русского языков распознавания, однако в целом оставил положительное впечатление. Scanbot и Mobile Document Scanner отметились долгоиграющим процессом распознавания. Не последнюю роль в выборе OCR-сканера играет их стоимость, которая сильно варьируется от символической до необоснованно высокой.

Mobile Document Capture и Real-Time Recognition SDK

ABBYY
  • Контакты
  • Интернет-магазин
  • Выберите регион
    Global
    Global Web Site English
    North America
    Canada English Mexico Español United States English
    South America
    Brazil Português South America Español

    Europe

    France Français Germany Deutsch Italy Italiano United Kingdom English Spain Español Western Europe English Central and Eastern Europe English Croatia Hrvatski Czech Republic Čeština Hungary Magyar Poland Polski Romania Română Russia Русский Slovakia Slovenčina Ukraine Українська
    Africa and Asia
    China 中文 India and SEA Countries English Israel עברית Japan 日本語 Middle East English South Korea 한국어 Turkey Türkçe
    Australia
    Australia English

Leave a comment