Lectura de matrículas: pasado, presente y (mucho) futuro
La lectura automática de matrículas (License Plate Recognition, LPR) es una tecnología que consiste en obtener los datos relacionados a la matrícula de un vehículo a partir de una imagen o grupo de imágenes. En los últimos años, el reconocimiento de matrículas ha sido un campo de la visión artificial (Computer Vision, CV) muy utilizado en distintos sectores relacionados con la vigilancia de vehículos: seguridad vial, control de accesos para parking o cobro automático de peajes y sistemas de aparcamiento, entre muchos otros.
¿Cómo y cuándo surge la necesidad del lector de matrículas?
Las primeras referencias existentes de un LPR se remontan a 1976, cuando la “Police Scientific Development Branch” del Reino Unido implementó el primer sistema, que se puso en marcha en 1979. Además de suponer un reto a nivel técnico, un hecho que suele acompañar a los investigadores, el objetivo de esta aplicación fue claro desde el principio: aumentar la seguridad. Desde entonces, ha habido una gran evolución tanto en los aspectos técnicos como en sus campos de aplicación.
¿Cuál ha sido la evolución de la tecnología de identificación de placas de vehículos a lo largo del tiempo?
En sus comienzos, estos sistemas estaban conformados por dos partes claramente diferenciadas: la primera constituía la óptica, con cámaras optimizadas para realizar una buena captura de la imagen; y la segunda constaba de una CPU externa con suficiente potencia de cálculo para procesar el reconocimiento óptico de caracteres (Optical Character Recognition, OCR) en un tiempo razonable. A pesar de que este primer modelo puede continuar siendo válido, la evolución de las CPUs hacia componentes cada vez más pequeños, potentes y económicos, hizo evolucionar los sistemas hacia dispositivos All-in-One, dándoles mucha más versatilidad.
Es un hecho que en los últimos años el mundo de la inteligencia artificial (Artificial Intelligence, AI) ha revolucionado el mundo de la programación. Aunque hablar de AI parece un concepto muy novedoso, las primeras referencias datan de los años 50 del siglo pasado. En 1956, durante la conferencia de Dartmouth, un grupo reducido de profesionales de diferentes materias se reunieron y centraron su atención en el incipiente mundo de los ordenadores y su capacidad potencial para exhibir un comportamiento inteligente.
Desde entonces se ha avanzado muchísimo en este campo y, durante la última década, una nueva tecnología ha revolucionado el mundo de la AI: el aprendizaje profundo (Deep Learning, DL). Esta metodología es una rama del Machine Learning que consiste en el aprendizaje mediante el ejemplo. Se crea un modelo que pueda evaluar ejemplos y una pequeña colección de instrucciones para modificar el modelo cuando se produzcan errores. El objetivo es que el sistema sea capaz de aprender de su propia experiencia de forma autónoma y que, durante el proceso de entrenamiento y aprendizaje, pueda extraer patrones que le permitan solucionar un problema complejo de una forma extremadamente precisa. Una de las técnicas más comunes de implementación del DL es utilizando redes neuronales.
¿Qué son las redes neuronales y cómo funcionan?
Las redes neuronales artificiales son un modelo inspirado en el funcionamiento del cerebro humano. Están formadas por un conjunto de nodos conocidos como neuronas artificiales, que se agrupan en capas, formando así una red neuronal. Los nodos están conectados entre sí de forma que una señal en la entrada se pueda transmitir hasta generar una salida. Cada neurona tiene un peso, que no es más que un valor numérico que modifica la entrada recibida. Los nuevos valores generados salen de las neuronas y continúan su camino por la red, obteniendo una salida que será la predicción calculada de ésta. Cuantas más capas tiene, más compleja es la red y, a su vez, más complejos serán los problemas que esta será capaz de resolver.
El principal objetivo de este modelo es que sea capaz de modificarse a sí mismo de forma que pueda realizar tareas complejas que no podrían ser programadas mediante una programación clásica basada en reglas. Este procedimiento se lleva a cabo durante el proceso de entrenamiento, donde se van introduciendo datos en la entrada y, en función del resultado obtenido, se modifican los pesos de las neuronas según el error obtenido. Este método es conocido como “Backpropagation”. Así se consigue que la red vaya aprendiendo de forma automática hasta obtener los resultados deseados, consiguiendo que sean muy precisos.
El Deep Learning aplicado a la tecnología de lectura de matrículas
Para los que nos dedicamos a la investigación y desarrollo en el campo de la identificación de placas vehiculares, nos encontramos muchos retos que debemos afrontar para que el proceso de lectura resulte efectivo. Por un lado, se precisa que el sistema sea rápido y efectivo bajo diferentes condiciones de captura de imágenes: condiciones lumínicas (día o noche), de posición y especificaciones de la cámara (ángulo, perspectiva, distancia o resolución). Por otro lado, la gran variedad de tipologías de matrículas que utilizan diferentes colores, tipografías y alfabetos, convierten la lectura de matrículas en un reto técnico complejo, a la vez que estimulante.
Últimamente la disciplina del DL está en plena ebullición gracias a su aplicación en el mundo del Big Data y el IoT. Este empujón evolucionista también se aplica al mundo del LPR para hacer lo que siempre se ha hecho en este sector: mejorar, buscar nuevos horizontes de perfección. Se debe tener en cuenta que las técnicas clásicas de CV han llegado hasta sus límites técnicos y no se encuentran entre las tecnologías punteras, al menos en escenarios no controlados, ya que no se pueden programar reglas que lidien con las infinitas combinaciones de los datos de entrada que se dan en el mundo real.
Así pues, si convertimos cada etapa del proceso de identificación de placas en un problema de optimización con una distribución compleja del error, es cuando podemos sacar beneficio del DL y llegar a tasas de acierto muy altas. Pero esto requiere una cantidad de memoria y tiempo de procesamiento diferentes de los que se habían utilizado hasta ahora. Por esta razón, para obtener tiempos de respuesta eficientes en modelos más o menos complejos, se utilizan unidades de procesamiento especiales como las unidades de procesamiento gráfico (Graphics Processing Units, GPUs), o las unidades de procesamiento neuronal (Neural Processing Units, NPUs).
La historia se repite
Ahora mismo estamos en un punto de inflexión similar al que estuvimos años atrás con las CPUs: la tecnología no es suficientemente barata como para poderla utilizar a gran escala. Esto abre la puerta principalmente a dos posibilidades: abrazar el reto de un sistema integrado All-in-One, en el que la evolución del hardware aún tiene (razonablemente) un largo camino por recorrer, o romper la filosofía del All-in-One realizando el procesamiento de DL en un servidor externo (o nube). La tecnología avanza muy rápidamente y lo que hoy es inviable por razones de coste puede resultar totalmente accesible en pocos meses. El futuro está lleno de posibilidades y lo que es cierto es que todas mejoran la calidad y la eficacia general de nuestros sistemas de reconocimiento de matrículas o LPR.
Un futuro que promete
En conclusión, la tecnología del LPR no está ni mucho menos estancada. La aparición del DL le está dando un nuevo impulso que nos puede permitir llegar a tasas de éxito extremadamente altas y, así, resolver situaciones complejas de una forma mucho más ágil a como se había hecho en tiempos pasados. Es un buen momento para seguir invirtiendo en investigación en este ámbito y, desde Quercus Technologies, queremos continuar por este camino para dar las mejores soluciones de aparcamiento a nuestros clientes y resolver sus problemas.
R&D Computer Vision Team Responsible en Quercus Technologies
Contacta con nosotros
Tanto si buscas respuestas, quieres más información, deseas resolver un problema o simplemente quieres decirnos qué tal lo hemos hecho, ponte en contacto con nosotros.
¡Estamos encantados de poder ayudarte!