Digitalizando documento via OCR

O que é OCR e quais são suas variações?

Reconhecimento Óptico de Caracteres, ou “Optical Character Recognition”, OCR é a tecnologia capaz de transformar imagens em textos. O primeiro software desse gênero foi desenvolvido em 1950 pela Agência de Segurança Nacional dos Estados Unidos, mas foi apenas em 1953 que a IBM lançou o termo como o conhecemos atualmente.

Para alcançar o objetivo dessa tecnologia são utilizadas técnicas como o reconhecimento de padrões, visão computacional e ainda machine learning para que o processo seja aprimorado constantemente. Além disso é necessário que a imagem ou documento, depois de ter passado por um método de digitalização (scanner, celular, uma máquina fotográfica digital ou similares) passe por algumas etapas para a extração do texto. A primeira é o pré-processamento. Nela a imagem passa por algumas adequações para que seja possível fazer a captura dos dados, como a retirada de sombras e de tudo que não é texto, e a conversão das cores em uma imagem binária para melhor compreensão do computador.

Em um segundo momento é feito o reconhecimento de caracteres, que pode ser feito de duas formas: comparando com uma base prévia de símbolos ou extraindo cada característica do texto (linhas, curvas) para compor cada formato e aí sim os identificar. Posterior a isso o material passa pela última etapa, o pós-processamento, onde os caracteres reconhecidos são comparados com uma base de palavras já cadastradas para aquele determinado contexto.

Com as diferentes formas de usabilidade da tecnologia, existem também 4 tipos de OCR que devem ser utilizadas conforme cada objetivo:

  • Full Text OCR

Nessa categoria é possível converter um documento inteiro para o formato de texto.

 

  • OCR Zonal

Esse tipo de OCR consegue identificar as áreas necessárias para conversão. Para isso o documento deve seguir um padrão para que seja possível essa seleção, como uma Carteira Nacional de Habilitação, onde todos os seus campos são padronizados e dessa forma a tecnologia reconheceria exatamente qual trecho do mesmo é preciso extrair e qual não.

 

  • OMR

O OMR não reconhece textos, mas apenas marcas. Seu uso é efetivo para correção de gabaritos de provas por exemplo, onde é necessário identificar apenas se determinada opção está marcada ou não.

 

  • ICR

Essa tecnologia é a mais complexa dentro das categorias de OCR, pois é utilizada para reconhecer escrita à mão, o que a torna também mais suscetível a erros já que cada caligrafia é diferente, e encontrar um padrão se torna mais difícil.

 

Benefícios do OCR

 

A tecnologia de OCR pode ser utilizada por diferentes segmentos para vários objetivos, como a digitalização de documentos para manipulação do mesmo de forma ágil e prática, evitando erros manuais de digitação. Melhor organização dos arquivos e agilidade para encontrá-los, diminuição do espaço necessário para arquivar documentos já que a imagem é convertida em um arquivo mais leve (texto), auxílio a pessoas cegas ou com dificuldades visuais, já que com a decodificação das imagens os leitores de tela conseguem fazer a leitura em voz alta do material, além da maior agilidade de toda a equipe que tem contato com tais documentos.

Quando nos referimos, porém, ao processo de onboarding de clientes, a tecnologia traz ainda mais agilidade, diminuindo o tempo necessário para o cadastro e consequentemente os índices de abandono do processo no meio do caminho. Aqui, quando o cliente tira foto de um documento de identificação por exemplo, a tecnologia OCR identifica e preenche automaticamente os campos dos formulários necessários com as informações que constam no documento digitalizado.

Nossas soluções para documentos incluem OCR também, além de documentoscopia digital, face match e tipificação. Deixe seu contato com a gente e descubra como a OITI pode transformar o seu negócio.