Subiendo y convirtiendo imágenes de texto a Google Docs

Reconocimiento óptico de caracteres

El reconocimiento óptico de caracteres (OCR, por sus siglas en inglés) permite convertir imágenes de texto en documentos editables. Logra esto con el uso de sofisticados algorítmos de computación. Las imágenes pueden ser procesadas individualmente o incluso en documentos PDF de múltiples páginas. Debajo, una lista de tipos de archivo compatibles con OCR:

Archivos PDF o imágenes obtenidos utilizando un escaner

Imágenes capturadas con cámaras digitales o dispositivos móbiles

Utilizando OCR en Google Docs

Google Docs toma los archivos PDF o imágenes, los escanea, y utiliza algorítmos de computación para transferir el archivo a un documento de Google.

Limitaciones y requisitos

Para los mejores resultados, las imágenes o documentos PDF deben cumplir con ciertos requisitos:

  • Imágenes de alta resolución. Para conseguir resultados eficientes, se recomienda el uso de imágenes de alta resolución. Cada renglón de texto debería tener al menos 10 pixeles de altura.
  • Se recomienda documentos con contenido de izquierda a derecha, que son mejor reconocidos. Si accidentalmente se escaneó el documento en una orientación diferente, puede ser necesario volver a escanearlo.
  • La mayoría de software OCR soporta fuentes y caracteres tradicionales así como un número de lenguajes (dependiendo del software OCR en uso). Por ejemplo, el motor OCR de Google Docs soporta un número de grupos de caracteres, pero el soporte de grupos de caracteres no-latinos es experimental. Por lo tanto, las posibilidades de obtener mejores resultados incrementan si el archivo o documento contiene fuentes comúnes como Times New Roman y Arial.
  • Las imágens de alta calidad (nítidas con iluminación pareja) funcionan mejor.
  • Un tamaño estandar de 2mb es recomendado tanto para imágenes como para archivos PDF.
  • Al procesar un documento, Google Docs da su mejor esfuerzo para mantener el formato original del texto (negrita, cursiva, tamaño, etcétera). Sin embargo, detalles tan intrincados pueden ser difíciles de detectar y puede no siempre ser exitóso.
  • Otros elementos de formato de texto tienen posibilidad de estar mal ubicados. Por ejemplo, listas con viñetas, así como numeradas, columnas de texto y notas al pie o al final.

El uso de tecnología de conversión de texto facilita la creación de copias editables de los documentos. Todo lo que hay que hacer es asegurarse de seguir las instrucciones necesarias y el intento de conversión de imágen a texto será exitoso.

Cómo usar Google OCR?