Google вече поддържа оптичното разпознаване на текст за над 200 езика

Системата за оптично разпознаване на текст (OCR) на Google Drive официално увеличи списъка с поддържаните езици и сега те са над 200. Разпознават се и 25 различни системи за писане на текст. За добавяне разпознаването на нови езици и подобряване на разпознаването на предишните, специалистите на Google прилагат марковски вериги, които се използват и за разпознаване на човешка реч и търсене с помощта на гласови команди.

Последователността на действията е елементарна: необходимо е да се подаде към онлайн-услугата файла със сканирания текст, който може да е изображение с JPG, PNG, GIF формати или PDF документ.

Следващата стъпка е неговото отваряне с помощта на Google Docs - в показания пример се използва фрагмент на хинди. Не е необходимо указването на езика, понеже системата го разпознава автоматично. Процесът е съвсем същият и за операционната система Android. Разпознатият текст се появява под сканираното изображение. Графичните файлове се обработват за около 30 секунди, а разпознаването на PDF-документи може да продължи около една минута.

Безплатно могат да се разпознават изображения с обем до 2 MB, а от PDF-документите се обработват първите десет страници.

Източник: kaldata.com

Видеа по темата

Facebook коментари

Коментари в сайта

Последни новини