Google Docs умеет распознавать тексты на отсканированных документах с июня прошлого года, однако русский язык всё это время не поддерживался. Теперь эта проблема решена: помимо русского, добавлена поддержка ещё 28 языков, включая китайский упрощённый, ряд азиатских языков и т. д. Общее число поддерживаемых языков теперь составляет 34.
Распознавание работает очень просто: достаточно загрузить в Google Docs текст в графическом или PDF-формате, поставив соответствующую галочку и указав нужный язык. После этого документ будет доступен уже в собственном формате Google Docs.
Кроме добавления новых языков, улучшена поддержка распознавания уже существующих. Также улучшен алгоритм сохранения форматирования оригинального документа, включая шрифты и расположение текста на странице.
Приятно, что для иллюстрации новости разработчики воспользовались в своём блоге скриншотом русского языка, который мы и приводим ниже: