Volver al blog
Segurança e Autenticação 20 de febrero de 2026

AreaFace: reconocimiento facial embarcado para seguridad pública

Fábio Eduardo Cressoni Batistella

AreaFace: reconocimiento facial embarcado para seguridad pública

AreaFace: La Ciencia de la Certeza Matemática frente a la Fragilidad de la Fe Pública

La llovizna que caía sobre la Avenida Paulista aquella tarde de martes no era el mayor problema del agente de tránsito Marcos Silva. Bajo la capucha impermeable, sus ojos alternaban entre el flujo caótico de vehículos y la pantalla de un smartphone reforzado. Necesitaba registrar una multa por giro prohibido, un acto administrativo rutinario, pero que lleva consigo un peso invisible y secular del derecho brasileño: la fe pública. Jurídicamente, lo que Marcos escribía allí era la verdad del Estado. Pero, en la práctica de la calle, esa verdad dependía de una contraseña de cuatro dígitos tecleada por dedos mojados en una pantalla grasienta. Una vulnerabilidad silenciosa que la ingeniería de software estaba a punto de exponer y, finalmente, corregir.

Para Areatec, líder en tecnología de fiscalización que procesa más de cincuenta millones de transacciones mensuales, aquella escena representaba una incomodidad conceptual profunda. La empresa, moldeada bajo la filosofía de que el mundo real destruye las teorías de laboratorio, veía en la tradicional fe pública una cáscara jurídica frágil. Como ingenieros, el desafío no era aceptar que la palabra del agente basta porque la ley así lo determina. El verdadero desafío era probar, con la exactitud fría de las matemáticas, que aquel agente específico, en aquel exacto milisegundo, bajo aquella lluvia, fue el autor inequívoco del acto público.

El Mito de la Fe Pública y la Presunción de Legitimidad

En el derecho administrativo brasileño, la fe pública es frecuentemente invocada como un escudo infranqueable. Sin embargo, el análisis técnico revela que el término es, en gran parte, un concepto importado de forma imprecisa de la actividad notarial, regulada por la Ley Federal número 8.935 de 1994. Lo que el agente de tránsito realmente posee, fundamentado en el artículo 280 del Código de Tránsito Brasileño, es el atributo de la presunción de legitimidad y veracidad de los actos administrativos. Se trata de un pilar de la supremacía del interés público sobre el privado, teorizado por juristas clásicos como Hely Lopes Meirelles 1. Esta presunción establece que el acto del Estado es legal y verdadero hasta que se pruebe lo contrario.

Concepto Jurídico Atributo Técnico Fuerza Probatoria Carga de la Prueba
Fe Pública Atribución de autenticidad documental Absoluta en términos formales (notarial) Del impugnante
Presunción de Legitimidad Conformidad del acto con la ley Relativa (juris tantum) Del ciudadano (inicialmente)
Presunción de Veracidad Declaración de hechos como verdaderos Relativa (juris tantum) Dinámica en caso de impugnación

Esta ventaja procesal exime a la administración pública de comprobar, en el momento de la multa, la ocurrencia del hecho. El párrafo segundo del artículo 280 del Código de Tránsito Brasileño materializa esta dinámica al permitir que la infracción sea comprobada mediante la simple declaración del agente o por medios tecnológicos previamente reglamentados. Sin embargo, juristas contemporáneos como Maria Sylvia Zanella Di Pietro señalan que esa presunción es estrictamente relativa, o juris tantum 2.

Cuando el ciudadano impugna la multa en la esfera administrativa o judicial, el principio de la verdad real exige que el Estado instruya el proceso con elementos robustos. Si el ciudadano alega que el agente no estaba en el lugar, o que sus credenciales fueron usadas por terceros, la presunción unilateral comienza a derrumbarse. La doctrina moderna de Celso Antônio Bandeira de Mello argumenta que, ante una impugnación plausible, ocurre la distribución dinámica de la carga de la prueba 3. La administración no puede esconderse detrás de una firma digital frágil o de una contraseña que podría haber sido compartida. El Estado necesita probar la autoría del acto. Y fue en ese vacío entre la presunción jurídica y la certeza física donde Areatec decidió intervenir.

La Evolución Cronológica de la Autenticación en Campo

El recorrido para blindar la autoría del acto administrativo en campo pasó por cuatro eras distintas de seguridad de la información, cada una revelando sus propias limitaciones bajo la prueba implacable de la calle.

Al inicio de la digitalización de la fiscalización, la autenticación se basaba únicamente en contraseñas estáticas. El agente tecleaba un código numérico para firmar el acta de infracción. Bajo la óptica de la seguridad, era un escenario de vulnerabilidad extrema. Contraseñas escritas en cuadernos, compartidas entre colegas de turno para agilizar el servicio o visualizadas por terceros sobre los hombros de los agentes eran ocurrencias diarias. El criterio de seguridad era virtualmente nulo, y la impugnación jurídica de autoría era un riesgo inminente para los municipios.

Al percibir la fragilidad del modelo de factor único, la ingeniería avanzó hacia la implementación de dispositivos de seguridad vinculados a la contraseña, el doble factor de autenticación. El agente debía teclear su contraseña y, simultáneamente, el sistema validaba el identificador único del hardware del dispositivo móvil registrado. Aunque mitigó el robo de credenciales a distancia, el modelo aún fallaba en el "compartir físico": nada impedía que un agente entregara su smartphone funcional ya desbloqueado para que otro operara en su nombre, violando la personalidad del acto administrativo.

El paso siguiente fue la transición a la biometría, específicamente la lectura de huella dactilar. El nivel de seguridad parecía finalmente refinado. La huella es única, intransferible y difícil de clonar en condiciones normales. Sin embargo, el mundo real, aquel que Fabio Eduardo Cressoni Batistella suele evocar para desmontar certezas de laboratorio, impuso su barrera física. El agente de tránsito trabaja bajo sol abrasador, lluvia torrencial y polvo en suspensión. Dedos sudados, sucios de grasa o mojados por la lluvia impedían la lectura capacitiva de los sensores de los smartphones. La tasa de falso rechazo se disparaba, generando frustración operativa y obligando a los agentes a recurrir al mecanismo de contingencia: la vieja e insegura contraseña digital.

Había además un obstáculo económico y logístico infranqueable. La abrumadora mayoría de los smartphones de bajo costo proporcionados por las administraciones públicas o no poseía lector de huella dactilar, o contaba con sensores de bajísima precisión. Sin embargo, los ingenieros de Areatec observaron un patrón de hardware universal: prácticamente todos los dispositivos en operación en el mercado, del más básico al tope de línea, poseían una cámara frontal para selfies. La respuesta estaba allí, mirando de frente al equipo de desarrollo a través de la lente de silicio. El próximo paso natural era mover la autenticación al rostro del agente. Pero el camino entre la idea y la ejecución segura sería un thriller de ingeniería.

La Búsqueda del Algoritmo Perfecto: El Dilema del Desarrollo Propio

La primera reacción del equipo de Investigación y Desarrollo de Areatec fue buscar en el mercado global de biometría una solución de reconocimiento facial lista para integración. El objetivo era acelerar el tiempo de lanzamiento del producto. Analizaron SDKs de gigantes del sector de biometría, soluciones en la nube y bibliotecas de estantería. Sin embargo, a medida que las pruebas de estrés en campo avanzaban, las soluciones comerciales comenzaron a fallar sistemáticamente bajo los filtros de seguridad impuestos por la ingeniería de Areatec.

Muchas de las soluciones analizadas exigían conexión constante a internet para enviar las imágenes a servidores centrales donde se realizaba la inferencia. En zonas de sombra de señal celular, comunes en las periferias de las grandes ciudades brasileñas, el sistema simplemente se detenía. Otras soluciones, que afirmaban funcionar localmente, consumían tanta memoria RAM y poder de procesamiento que hacían que los smartphones corporativos se sobrecalentaran y se bloquearan tras pocas horas de uso bajo el sol. El peor escenario, sin embargo, era la vulnerabilidad a fraudes simples. Fotos impresas en papel, exhibidas en pantallas de otros móviles o incluso videos grabados del agente legítimo lograban burlar los algoritmos de detección de vivacidad de las soluciones comerciales.

Ante el riesgo de exponer la validez jurídica de millones de multas a fallas de seguridad, el liderazgo técnico de Areatec tomó la decisión más difícil y audaz: desarrollar toda la tecnología internamente. El proyecto, bautizado como AreaFace, no sería un collage de bibliotecas externas, sino una arquitectura propietaria escrita desde cero, proyectada específicamente para las condiciones severas del trabajo de calle.

La Ingeniería bajo el Capó: C++ y TensorFlow al Límite del Hardware

Para construir un motor de reconocimiento facial capaz de ejecutarse en smartphones de bajo costo, sin internet, en menos de doscientos milisegundos y con consumo despreciable de batería, el equipo de ingeniería tuvo que tomar decisiones arquitectónicas radicales. La primera de ellas fue desterrar Python del entorno de ejecución en producción. Aunque Python es el lenguaje hegemónico para la investigación en inteligencia artificial y el entrenamiento de modelos, su ejecución en dispositivos móviles introduce una latencia inaceptable debido al overhead del intérprete y a la gestión de memoria por garbage collection.

La solución fue escribir todo el motor de inferencia en C++ nativo, utilizando la API de bajo nivel de TensorFlow Lite (actualmente bajo la evolución de la especificación LiteRT) 4. El código C++ permitió el control milimétrico de la asignación de memoria en el heap, eliminando fugas de memoria y garantizando que el footprint del proceso permaneciera estable incluso tras miles de ejecuciones. La compilación nativa para las arquitecturas ARM64 utilizó optimizaciones NEON para la vectorización de instrucciones assembly, permitiendo que las operaciones matemáticas de multiplicación y acumulación de matrices de las redes neuronales se ejecutaran directamente en los registros del procesador del móvil.

// Ejemplo conceptual de la eficiencia de inferencia en C++ nativo utilizando TensorFlow Lite
#include "tensorflow/lite/interpreter.h"
#include "tensorflow/lite/kernels/register.h"
#include "tensorflow/lite/model.h"

class AreaFaceEngine {
private:
    std::unique_ptr<tflite::FlatBufferModel> model;
    std::unique_ptr<tflite::Interpreter> interpreter;
public:
    bool Initialize(const std::string& modelPath) {
        model = tflite::FlatBufferModel::BuildFromFile(modelPath.c_str());
        tflite::ops::builtin::BuiltinOpResolver resolver;
        tflite::InterpreterBuilder(*model, resolver)(&interpreter);

        // Asignación estática de tensores para evitar fragmentación de memoria en campo
        interpreter->AllocateTensors();
        return true;
    }

    float* ExtractEmbeddings(const uint8_t* alignedFaceBuffer) {
        float* inputTensor = interpreter->typed_input_tensor<float>(0);
        // Preprocesamiento ultrarrápido de normalización en C++
        for(int i = 0; i < 112 * 112 * 3; ++i) {
            inputTensor[i] = (alignedFaceBuffer[i] - 127.5f) / 128.0f;
        }
        interpreter->Invoke(); // Inferencia en bajo nivel (< 150ms en ARMv8)
        return interpreter->typed_output_tensor<float>(0);
    }
};

La arquitectura de red neuronal seleccionada y optimizada por Areatec se basó en los conceptos de ArcFace (Additive Angular Margin Loss), refinando los modelos clásicos de FaceNet 5 6. Mientras que la FaceNet original, desarrollada por Google en 2015, utilizaba la función de pérdida Triplet Loss para proyectar los rostros en un espacio euclidiano de 128 dimensiones, ArcFace optimizó ese proceso al introducir un margen angular aditivo directamente en la función de pérdida Softmax durante el entrenamiento.

Este enfoque obliga a la red neuronal a aprender representaciones faciales extremadamente discriminativas, maximizando la varianza entre clases diferentes (personas distintas) y minimizando la varianza intraclase (variaciones de la misma persona bajo diferentes ángulos o iluminación). El modelo matemático de AreaFace mapea el rostro del agente en un vector de características de alta dimensión (embedding). La comparación entre el rostro capturado en el momento del acto y el rostro registrado en la base de datos segura de Areatec se realiza mediante el cálculo de la distancia de coseno entre los dos vectores.

$$\text{Similitud Coseno} = \frac{\mathbf{A} \cdot \mathbf{B}}{|\mathbf{A}| |\mathbf{B}|} = \frac{\sum_{i=1}^{n} A_i B_i}{\sqrt{\sum_{i=1}^{n} A_i^2} \sqrt{\sum_{i=1}^{n} B_i^2}}$$

Si la similitud coseno es superior a un umbral matemático estrictamente calibrado (generalmente por encima de 0,85 para entornos de alta seguridad), la identidad es confirmada. De lo contrario, el acceso es denegado. La precisión matemática sustituye, así, la subjetividad de la mirada humana y la fragilidad de las contraseñas.

El Cerco contra el Fraude: Blindaje Extremo con Anti-Spoofing

Desarrollar un algoritmo capaz de reconocer un rostro era apenas la mitad de la batalla. La verdadera guerra de ingeniería de AreaFace se libró en la detección de vivacidad, el llamado anti-spoofing o Presentation Attack Detection (PAD), en conformidad con las directrices internacionales de la norma ISO/IEC 30107. Un sistema de reconocimiento facial en campo que pueda ser burlado por una fotografía impresa o por un video en una tableta es peor que un sistema sin biometría, pues genera una falsa sensación de seguridad jurídica.

El equipo de Areatec desarrolló un enfoque multicapa para garantizar que solo un rostro humano real, tridimensional y vivo pueda firmar un acto público. El sistema combina técnicas pasivas y activas de liveness detection que se ejecutan simultáneamente en el dispositivo móvil:

  1. Estimación de Profundidad por Visión Computacional (Depth Estimation): Utilizando redes neuronales convolucionales ligeras especializadas en geometría monocular, AreaFace reconstruye un mapa de profundidad tridimensional aproximado a partir del feed de video bidimensional de la cámara frontal. Una foto impresa o la pantalla de una tableta presentan un plano perfectamente plano (flat), mientras que un rostro humano real exhibe variaciones de profundidad características en la nariz, las órbitas oculares y el mentón. Si la desviación estándar del mapa de profundidad generado es cercana a cero, el ataque de presentación es detectado instantáneamente.
  2. Análisis de Micro-Textura de Piel (Texture Analysis): La piel humana posee propiedades ópticas únicas de reflexión, absorción y dispersión de luz (subsurface scattering). Las pantallas de dispositivos digitales, por otro lado, emiten luz a través de píxeles organizados en matrices, generando patrones de interferencia conocidos como efecto Moiré cuando son recapturados por otra cámara. AreaFace analiza el espectro de alta frecuencia de la imagen en busca de esos micro-patrones de ruido óptico y texturas artificiales de papel, bloqueando intentos de fraude con fotos o pantallas de alta resolución.
  3. Análisis de Frecuencia en el Dominio de Fourier: El algoritmo aplica la Transformada Rápida de Fourier (FFT) en regiones críticas del rostro para analizar la distribución de frecuencias espaciales. Superficies artificiales como papel o displays digitales exhiben firmas de frecuencia radicalmente diferentes de la topología compleja e irregular de la dermis humana.
  4. Validación por Infrarrojo (cuando está disponible): En los dispositivos que cuentan con sensores ópticos infrarrojos (comunes en terminales de fiscalización embarcados en los vehículos de la flota Olho Vivo Patrol), AreaFace realiza la validación espectral activa. La dermis humana absorbe y refleja la longitud de onda infrarroja de forma única, mientras que las máscaras de silicona, látex o impresiones de papel brillan o absorben la luz de manera uniforme, delatando la falsificación.
  5. Detección de Micro-Movimientos y Signos Vitales Pasivos: El motor de análisis temporal de AreaFace monitorea micro-variaciones de color en la región de la frente y las mejillas causadas por el flujo sanguíneo pulsátil, una técnica conocida como fotopletismografía remota (rPPG), además de detectar el parpadeo natural de los ojos y micro-ajustes pupilares ante la variación de luz de la pantalla.
Técnica Anti-Spoofing Vector de Ataque Bloqueado Procesamiento Requisito de Hardware
Depth Estimation Fotos impresas, máscaras planas Local (Red Neuronal) Cámara RGB Estándar
Texture Analysis Pantallas de alta definición (replays) Local (Filtros de Visión) Cámara RGB Estándar
Fourier FFT Impresiones de alta fidelidad Local (Matemático) Cámara RGB Estándar
Infrared Validation Máscaras 3D de silicona/látex Local (Espectral) Sensor IR Dedicado
rPPG (Fotopletismografía) Deepfakes de video en tiempo real Local (Análisis Temporal) Cámara RGB Estándar

El Resultado: La Inversión de la Prueba y la Certeza Matemática

El impacto de la implementación de AreaFace en el ecosistema de Areatec fue inmediato y profundo. Al integrar el reconocimiento facial nativo a la aplicación de campo de los agentes, la empresa cerró definitivamente el cerco probatorio del proceso administrativo de tránsito.

Cuando un agente firma digitalmente un acta de infracción utilizando AreaFace, el sistema no genera solo un registro de fecha y hora. Genera un paquete criptográfico firmado localmente que contiene el hash del embedding facial del agente, las coordenadas geográficas validadas por Provloc y el registro de transacción inmutable grabado en AreaChain.

Si un conductor multado recurre judicialmente alegando cualquier irregularidad en la autoría del acto, la alcaldía ya no necesita depender exclusivamente de la fragilidad jurídica de la presunción de legitimidad del agente. La defensa del municipio presenta ante el juez un dictamen técnico criptográfico de exactitud matemática incuestionable. La probabilidad de que otra persona haya firmado aquel acto es inferior a una en mil millones.

AreaFace transformó la antigua "fe pública" — una ficción jurídica necesaria para el funcionamiento del Estado analógico — en una certeza matemática absoluta para la era de las ciudades inteligentes. En la mesa de Fabio Eduardo Cressoni Batistella, el informe final del proyecto traía un gráfico simple, pero que representaba la victoria de la ingeniería sobre la teoría: la curva de falsos positivos en campo había sido aplanada a cero. La ciencia de la computación había, finalmente, blindado la autoridad de la ley en la calle.


Referencias Bibliográficas


Fábio Eduardo Cressoni Batistella


  1. MEIRELLES, Hely Lopes. Direito Administrativo Brasileiro. 30.ª ed. São Paulo: Malheiros, 2005. 

  2. DI PIETRO, Maria Sylvia Zanella. Curso de Direito Administrativo. 17.ª ed. São Paulo: Atlas, 2004. 

  3. BANDEIRA DE MELLO, Celso Antônio. Curso de Direito Administrativo. 15.ª ed. São Paulo: Malheiros, 2003. 

  4. GOOGLE. LiteRT: High-Performance On-Device Machine Learning Framework. Google AI Edge, 2026. Disponible en: https://ai.google.dev/edge/litert. Acceso el: 3 jun. 2026. 

  5. SCHROFF, Florian; KALENICHENKO, Dmitry; PHILBIN, James. FaceNet: A Unified Embedding for Face Recognition and Clustering. Google Inc., CVPR, 2015. Disponible en: https://arxiv.org/abs/1503.03832. Acceso el: 3 jun. 2026. 

  6. DENG, Jiankang; GUO, Jia; XUE, Niannan; ZAFEIRIOU, Stefanos. ArcFace: Additive Angular Margin Loss for Deep Face Recognition. CVPR, 2019. Disponible en: https://arxiv.org/abs/1801.07698. Acceso el: 3 jun. 2026.