¿Qué es el OCR?
Aunque nos pueda parecer increíble, el término OCR, Optical Character Recognition, ya empezó a sonar nada menos que en 1929, con la primera patente registrada por Gustav Tauschek en Alemania.
Desde entonces, esta tecnología ha evolucionado para tratar de emular la capacidad del ojo humano para reconocer objetos. Concretamente, es un software que permite el reconocimiento óptico de numerosos tipos de fuentes de texto y caracteres de imprenta de máquinas de escribir y computadoras contenidos en una imagen (documento escaneado o fotografía), incluso pudiendo identificar escritura a mano.
¿Cómo funciona?
Al escanear o fotografiar un documento de texto (una factura o una página de un libro), el software inspecciona la imagen pixel a pixel, buscando formas que coincidan con los rasgos de los caracteres y fuentes disponibles en el programa. Por norma general, las imágenes deben tener una resolución mínima de 300 ppp para que el funcionamiento del software sea el correcto, pero depende del tipo de documento y de las características propias del programa.
Pero no solo se limitará a las fuentes que contenga, si no que también tratará de identificar los caracteres a través del análisis del resto de elementos del documento (bloques de texto, imágenes, tablas…), examinando los espacios en blanco y descomponiendo el texto en líneas, palabras y caracteres, de forma que el programa puede formular distintas hipótesis y cotejarlas con los diccionarios contenidos por el mismo (actualmente los programas contienen diccionarios en distintos idiomas), para formar palabras y textos completos.
Así logra que estos se vuelvan comprensibles o reconocibles para un ordenador, obteniendo como resultado un archivo en un formato editable por un procesador de textos (Microsoft Word), con opción de búsqueda. El formato del archivo de salida (txt, pdf, etc.) dependerá de las posibilidades que ofrezca el software.
¿Para qué sirve el OCR?
La documentación para una empresa y su buena organización es esencial. A diario se generan todo tipo de documentos, facturas, fichas técnicas, etc.…. y en formato físico, lo que hace que con su acumulación, cada vez sea más complicada su clasificación, consulta o manipulación. Aquí es donde la tecnología OCR nos puede ayudar.
Imaginemos que nos piden una factura de hace varios años, o necesitamos revisar un contrato que ni recordamos cuando fue, y nos encontramos con una pila de documentos en la que buscar estos documentos. Por muy ordenados que seamos, ¿Cuánto tiempo nos llevaría?
Sin embargo, teniendo estos documentos en formato digital, no solo podremos realizar una sencilla búsqueda en nuestro ordenador o servidor para encontrarlo, sino que además podremos llevarlo a nuestro editor de texto, y así podremos añadir datos nuevos, actualizar información anticuada o incluso borrar si es necesario directamente sobre el propio documento.
Pensemos también cuando manejamos datos sensibles. Documentos con un alto grado de confidencialidad, que requieren que esta información este correctamente protegida y que solo este accesible para aquellas personas que deban hacerlo. Con un archivo digital siempre podremos protegerlo a través de contraseñas o cifrados.
Pero no solo pensemos en aplicaciones documentales, por ejemplo, se puede aplicar para el reconocimiento de matrículas de automóvil en un parking o radar de tráfico. O como hemos comentado anteriormente, hoy en día es capaz de leer y reproducir las notas musicales de una partitura.
Además de lo comentado anteriormente, también encontramos como una gran ventaja la diferencia de peso de cualquier archivo de texto en comparación con imágenes. Con una simple página no vemos una gran diferencia, pero pensemos en documentos con numerosas páginas o un gran volumen de estos, y la importante reducción en el espacio de nuestros discos duros que conseguiríamos.
En cualquier caso y pese al avance de la tecnología, el sistema OCR aún se enfrenta a diversos retos, ya que con documentos más complejos como pueden ser: documentos manuscritos antiguos, diagramas, etc., sigue teniendo limitaciones: como cuando los caracteres aparecen demasiado juntos, el contraste de la imagen no es suficiente para distinguir donde empieza y acaba un carácter, … lo que en estos casos hace necesaria una posterior revisión y corrección manual del texto generado.