Aretron: El camino pragmático hacia el primer Large Mobility Model de América Latina
En 2017, un grupo de investigadores de Google publicó un artículo científico titulado "Attention Is All You Need". Ese documento presentó al mundo la arquitectura Transformer, un modelo matemático basado en mecanismos de atención que permitía procesar secuencias de datos de forma paralela y profunda. Ese hito académico inició una carrera global por el desarrollo de inteligencia artificial generativa. Sin embargo, mientras los laboratorios de Silicon Valley celebraban la capacidad de sus modelos para redactar poemas o generar imágenes abstractas, los ingenieros de Areatec, en Araras, en el interior de São Paulo, miraban aquella tecnología con una pregunta pragmática: ¿cómo puede esta arquitectura matemática resolver el caos del tránsito en las ciudades brasileñas y latinoamericanas?
La respuesta convencional del mercado tecnológico sería sencilla. Muchas empresas optarían por contratar API de modelos de estantería desarrollados por grandes corporaciones norteamericanas, pagando por solicitud y enviando las imágenes capturadas en las calles para su procesamiento en servidores internacionales. Areatec rechazó ese camino fácil. El liderazgo técnico comprendió que las soluciones genéricas de inteligencia artificial están diseñadas para escenarios ideales de laboratorio. Fallan de forma sistemática cuando se exponen al polvo, a la lluvia torrencial, a las placas torcidas o cubiertas por ramas de árboles y a la inestabilidad crónica de las redes de telefonía móvil de Brasil. Para crear una tecnología que realmente funcione en las calles, la empresa decidió recorrer el camino complejo de entrenar su propio modelo, creando el primer Large Mobility Model (LMM) del continente con capacidad de inferencia local.
El abismo entre el laboratorio y el asfalto latinoamericano
Los modelos de inteligencia artificial de estantería disponibles en el mercado global se alimentan con bases de datos genéricas, compuestas mayoritariamente por imágenes de calles norteamericanas o europeas. Esas vías poseen señalización estandarizada, asfalto uniforme y condiciones de luminosidad previsibles. Cuando un algoritmo entrenado en ese entorno aséptico se pone a operar en una ciudad media del interior paulista o en una metrópoli latinoamericana, el índice de error hace inviable la operación. Placas de vehículos abolladas, caracteres desgastados por el sol, alumbrado público deficiente y la geometría caótica de las vías urbanas tropicales se transforman en un ruido insalvable para las inteligencias artificiales extranjeras.
Además de la barrera física de las calles, existe un obstáculo estructural de conectividad. Los modelos comerciales en la nube exigen que cada fotograma de video capturado por las cámaras de fiscalización se transmita por internet para que la inferencia ocurra. En zonas de sombra de señal celular, que son comunes en las periferias y vías expresas brasileñas, el sistema de fiscalización simplemente dejaría de funcionar. Para garantizar la continuidad del servicio público, Areatec estableció como premisa que el procesamiento debía ocurrir de forma embarcada, directamente en el hardware de los vehículos de patrulla Olho Vivo. Esto exigía un modelo altamente especializado, compacto y eficiente, capaz de funcionar sin ninguna dependencia de conexión a internet.
La arquitectura del Large Mobility Model de Areatec
El desarrollo del Large Mobility Model comenzó con la selección rigurosa del modelo de base. El equipo de ingeniería de Areatec evaluó diversas arquitecturas de redes neuronales profundas de código abierto, buscando un equilibrio preciso entre la capacidad de representación espacial y el consumo de recursos computacionales. La elección recayó sobre una arquitectura de visión por computadora basada en Transformers, optimizada para el procesamiento de secuencias temporales de imágenes de alta velocidad. Esa base fue desestructurada y reconstruida para enfocarse exclusivamente en las características geométricas y texturales relevantes para la movilidad urbana.
El entrenamiento de un modelo de esta envergadura exige la definición clara de qué tareas debe ejecutar con perfección matemática. En lugar de enseñar a la inteligencia artificial a reconocer millones de objetos inútiles para la gestión urbana, el modelo fue entrenado para enfocarse en elementos críticos. Aprendió a identificar la microgeometría de placas vehiculares en ángulos extremos, a mapear deformaciones milimétricas en el asfalto que indican el inicio de baches, a evaluar la integridad de señalizaciones verticales y horizontales y a detectar patrones de comportamiento del tráfico en cruces saturados. Ese enfoque quirúrgico permitió que el modelo alcanzara niveles de precisión superiores a los de cualquier sistema genérico, consumiendo una fracción del poder de procesamiento.
El desafío supremo de la calidad de los datos
En la ingeniería de inteligencia artificial, existe un consenso de que el algoritmo representa solo una pequeña parte del éxito del proyecto. El verdadero diferencial competitivo reside en la calidad de los datos utilizados para el entrenamiento. El mayor desafío del equipo de Areatec no fue escribir las líneas de código del compilador ni ajustar los hiperparámetros de la red neuronal, sino construir y curar una base de datos que reflejara con exactitud la realidad del tránsito brasileño. Enseñar al modelo a reconocer una placa limpia y nueva es una tarea sencilla. El desafío técnico reside en enseñarle a descifrar una placa Mercosur parcialmente cubierta de barro, bajo la llovizna fina del final de la tarde, en una calle de adoquines.
Para superar ese obstáculo, Areatec movilizó su historial de operación real, que procesa decenas de millones de transacciones mensuales. Cada imagen seleccionada para el entrenamiento pasó por un proceso riguroso de curaduría y etiquetado manual realizado por especialistas en tránsito. Se incorporaron escenarios de oclusión parcial, variaciones extremas de sombreado causadas por copas de árboles y distorsiones ópticas provocadas por la vibración de los vehículos de patrulla. Esa inversión en la calidad de la base de datos garantizó que el Large Mobility Model aprendiera a ignorar el ruido visual urbano y a enfocarse estrictamente en los vectores de información necesarios para generar evidencias robustas.
Soberanía de hardware y el rigor técnico de la LGPD
La decisión de mantener una infraestructura de servidores propia, ubicada en el centro de investigación y desarrollo en Araras, se fundamentó en razones técnicas y jurídicas ineludibles. La primera de ellas se refiere a la Ley General de Protección de Datos (LGPD). Las imágenes de vías públicas contienen datos personales sensibles, como rostros de peatones y placas de vehículos que pueden identificar a individuos. Al procesar esa información en nubes públicas de terceros, el controlador de los datos pierde el control físico sobre las fronteras de tráfico de la información, aumentando los riesgos de filtraciones y violaciones regulatorias. La infraestructura propia de Areatec garantiza que ningún dato no anonimizado salga del perímetro de seguridad física de la empresa, atendiendo a los requisitos de seguridad desde la concepción exigidos por la ley brasileña.
Además del cumplimiento jurídico, la propiedad de la infraestructura ofrece una ventaja técnica decisiva en la optimización del software. Al controlar directamente el hardware, los ingenieros de Areatec logran programar el código de inferencia para tocar directamente los registros y las instrucciones específicas de las unidades de procesamiento gráfico (GPU). Esa integración profunda entre software y hardware elimina las capas de abstracción comunes en servicios de nube genéricos, reduciendo la latencia de procesamiento a menos de cincuenta milisegundos por fotograma de video. Esa eficiencia energética y computacional es lo que viabiliza la ejecución del modelo de forma local y embarcada en los vehículos que patrullan las calles de las ciudades brasileñas.
Escala y entrenamiento continuo para el mundo real
La conclusión de un ciclo de entrenamiento no significa el fin del desarrollo del Large Mobility Model. La ciudad es un organismo vivo que cambia constantemente. Se lanzan nuevos modelos de vehículos, los patrones de señalización sufren alteraciones regulatorias y el propio desgaste de las vías urbanas presenta nuevas formas de degradación. Para mantener la eficacia de la tecnología, Areatec estructuró un flujo continuo de aprendizaje activo. Los datos recopilados en campo que presentan un bajo índice de confianza por parte del modelo son aislados automáticamente, higienizados en conformidad con las reglas de privacidad y enviados a la infraestructura de Araras para alimentar nuevos ciclos de fine-tuning.
Ese ciclo cerrado de mejora continua es lo que sostiene la reputación técnica de la empresa en el mercado GovTech. Mientras las soluciones teóricas de laboratorio pierden precisión a medida que se exponen a las variaciones del mundo real, el Large Mobility Model de Areatec se vuelve más robusto con cada kilómetro recorrido. Es esa ingeniería pragmática, anclada en la soberanía de datos y en el control directo sobre el hardware, la que permite a la empresa entregar soluciones de alta confiabilidad para la administración pública, consolidando su compromiso de desarrollar tecnología que funciona.
Marcio Alexandroni
Director de Ingeniería, Areatec