Qué es OCR?

Qué es OCR?

El Reconocimiento Óptico de Caracteres (u OCR, por sus siglas en inglés) es la conversión electrónica de una imagen escaneada al formato de texto. Es utilizado de forma extensa para convertir libros y documentos en archivos electrónicos, computarización de sistemas de registros, y publicación de textos en sitios web. Una aplicación OCR requiere calibración para la lectura de una fuente específica. Versiones anteriores necesitaban ser programadas con imágenes de cada caracter y funcionaban sobre una fuente por vez. OCR permite a los usuarios convertir imágenes a texto, editar texto, buscar una palabra o frase y aplicar sistemas como texto a voz, traducción por máquina y minado de texto al mismo.

Historia

Gustav Tauschek, de Alemania, fue el primer hombre en crear un documento oficial en OCR en 1929. En 1933, un americano, Paul. W. Handel, obtuvo una patente estadounidense para el OCR. Dos años después, Tauschek también recibió una patente estadounidense para su método - Patente estadounidense 2.026.329 (su máquina utilizaba plantillas y un fotodetector).

Más adelante, en 1949, ingenieros de RCA trabajaron en el primer, primitivo, OCR de tipo computadora para ayudar a los discapacitados visuales en la Asociación de Veteranos de los Estados Unidos. Sin embargo, su dispositivo convertía caracteres impresos a lenguaje de máquina y luego leía las letras, en lugar de únicamente convertirlas al lenguaje de máquina. Aunque el dispositivo fué una muestra tecnológica memorable, era demasiado caro y no fué perseguido tras las pruebas.

Finalmente, en 1950, David H Sherpard, un criptoanalista americano en la agencia de seguridad de las fuerzas armadas trató el problema de la conversión de caracteres impresos a lenguaje de máquinas para el procesado computacional construyendo una máquina que disolvía el problema. De ahí en adelante, la creación del primer sistema de OCR comercial estaba a sólo unos años de realizarse.

Software OCR de escritorio y servidores

La tecnología software OCR es un sistema de inteligencia analítica simulada que considera cadenas de caracteres en lugar de palabras completas o frases. Tras analizar lineas y curvas subsecuentes, la conclusión fué - una aplicación OCR realiza las "mejores estimaciones de caracteres". Logra esto utilizando tablas de consulta de base de datos para conectar o unir las cadenas de caracteres, que forman palabras.

WebOCR y OCR en línea

WebOCR u OCR en línea es un nuevo desarrollo iniciado para alcanzar un grupo de usuarios superior y de mayor volúmen. Las tecnologías de internet y banda ancha han hecho el OnlineOCR fácilmente accesible para usuarios individuales y corporaciones. Desde el 2000, algunos de los distribuidores OCR más populares comenzaron a ofrecer WebOCR y software de imágen a texto en línea.

OCR orientado a aplicaciones

Con la ámplia popularidad de los sitemas OCR en el ámbito de la conversión de imágenes, los sistemas comenzaron a afrontar una grán variedad de problemas respecto al formato original de varios documentos, como fondos complicados, imágenes degradadas, grán ruido, sesgo del papel, distorsión de imágen, baja resolución, perturbaciones por cuadrícula y renglones, imágenes de texto con fuentes especiales, símbolos, palabras de glosario y demás.

Todos estos aspectos afectaban la estabilidad de las aplicaciones OCR en la precisión del reconocimiento. Recientemente, importantes proveedores de tecnología OCR comenzaron a desarrollar sistemas OCR dedicados, para tipos específicos de imágen. Para mejorar la precisión del reconocimiento, unieron varias técnicas de optimización relacionadas a la imágen específica, como reglas de negocio, expresiones estandar, diccionario glosario e información rica contenida en imágen a color.

Esta estrategia en particular, es llamada "OCR orientado a aplicación" o "OCR personalizado". Es utilizado a gran escala en los campos de OCR tarjeta de negocios, facturas OCR, capturas de pantalla OCR, OCR de tarjeta de identificación, OCR de licencia para conducir, OCR de planta automotriz, y demás.

Conclusión

La tecnología de Reconocimiento Óptico de Caracteres de hoy en día puede leer y reconocer una gama de lenguajes y convertir archivos en una serie de formatos. A pesar de haberse desarrollado hace décadas, continúa siendo modificada, editada y mejorada. La aplicación de OCR es una herramienta adecuada para la conversión de texto y puede ser utilizada por diferentes personas en una variedad de entornos. Continúa siendo soportada por un ámplio rango de productos y sistemas, desde máquinas de primera línea, a soluciones fáciles de usar.