IL PROGETTO
Edge computing e Deep Learning applicati a dispositivi multicamera
Il progetto per MOVYON – Gruppo Autostrade per l’Italia, ha previsto la realizzazione di un sistema di identificazione e monitoraggio degli spostamenti di singole persone, e le relazioni di queste con gli oggetti all’interno di uno spazio. Le nuove tecnologie dell’AI sono state applicate al fine di elaborare uno strumento che consentisse di:
- tracciare gli spostamenti delle singole persone in grandi aree;
- elaborare statistiche sulle zone maggiormente visitate;
- elaborare statistiche sui tempi di permanenza;
- ottimizzare la disposizione degli asset;
- ottimizzare il layout dell’area vendite;
- scoprire abitudini dei clienti e correlazioni tra prodotti acquistati.
Nel nostro caso specifico l’ambiente di lavoro era composto da 5 telecamere (3 interne all’edificio e 2 esterne) che si focalizzavano sulle aree di maggiore interesse in cui le persone transitano e si fermano, che includono, ad esempio, corridoi, sportelli, servizi igienici o aree di parcheggio.
QUAL È LA SFIDA DEL MULTICAMERA?
La sfida di un contesto multicamera è verificare che la persona identificata come X da una delle telecamere venga riconosciuta come tale anche dalle altre telecamere presenti nell’area, ossia gli venga assegnato lo stesso ID (con person reidentification si intende proprio l’identificazione della stessa persona in contesti scollegati tra di loro).
Che tecnologia abbiamo sfruttato per fare questo? Qui entra in gioco l’embedding.
PERSON DETECTION & PERSON EMBEDDING
A partire da ogni singolo frame di uno stream video, una rete neurale identifica la posizione delle persone nel campo visivo e le racchiude singolarmente in rettangoli chiamati “detection”. Il tutto avviene on edge, cioè all’interno della smart camera.
Una seconda rete neurale, anche questa installata e operante nel dispositivo IoT, produce una codifica anonima, non interpretabile e non reversibile delle detection raccolte dallo step precedente. Ogni rettangolo contenente una persona viene così convertito in una lista di numeri (embedding, vettore) non intellegibili, ma che possono essere utilizzati come sistema di coordinate. Gli embedding descrivono ogni persona e possono essere utilizzati dal back-end per ricostruire i percorsi della singola persona in totale anonimato.
Il flusso operativo: dai dispositivi alla piattaforma
PERSON MATCHING IN CONTESTI MULTICAMERA:
IL NOSTRO TEAM A LAVORO
PRIVACY COMPLIANT REIDENTIFICATION
Con l’edge computing i modelli di detection ed embedding girano sui dispositivi là dove il dato viene prodotto, questo offre non solo una soluzione altamente scalabile, ma risolve in particolare il problema della privacy, poiché i dispositivi (le camere) non salvano né inviano da nessuna parte le immagini delle persone localizzate nel loro campo visivo, piuttosto ne creano una codifica irreversibile e non intellegibile chiamata “embedding”, che viene inviata ad un back-end per ulteriori analisi senza portare con sé elementi identificativi delle persone. Nel video potete vedere il nostro team in azione, con riprese effettuate in due contesti diversi e l’identificazione e la ricostruzione del percorso di ciascuna persona.