Fujitsu ha annunciato un’innovazione rivoluzionaria nel campo dell’analisi video: un agente AI progettato per ottimizzare i processi nelle realtà operative di prima linea. Sfruttando dati video spaziali, immagini riprese da telecamere sul posto di lavoro e documentazione scritta come regolamenti e manuali, l’agente AI genera report e suggerimenti per migliorare la sicurezza e l’efficienza. Questa tecnologia sarà integrata nel servizio di intelligenza artificiale “Fujitsu Kozuchi“, con un ambiente di prova disponibile già nel 2024 e una implementazione interna pianificata per gennaio 2025.
Basata su un modello multimodale di linguaggio di grandi dimensioni (LLM), l’AI sviluppata da Fujitsu non si limita a “vedere” il contesto delle immagini, ma “comprende” il loro significato grazie a dati testuali. Questo approccio innovativo permette di superare i limiti tradizionali dell’analisi video, estendendo significativamente la durata dei contenuti elaborabili. La tecnologia di memoria contestuale seleziona e conserva solo le informazioni pertinenti, migliorando l’accuratezza e riducendo il carico computazionale.
Un aspetto distintivo di questa tecnologia è la sua capacità di interpretare ciò che il video da solo non può spiegare. Se, ad esempio, le immagini mostrano lavoratori in movimento, l’AI può integrare questa informazione con le regole di sicurezza scritte per determinare se il comportamento osservato è conforme alle normative aziendali.
Per garantire standard scientifici elevati, Fujitsu ha creato l’ambiente di valutazione FieldWorkArena in collaborazione con la Carnegie Mellon University. Questo ambiente dispone di una vasta banca dati di immagini e video reali provenienti da impianti industriali e magazzini, oltre a documenti tecnici e simulazioni di sistemi aziendali. Sarà aperto alla comunità scientifica a partire da dicembre 2024, con compiti specifici resi disponibili su GitHub e sul portale di ricerca Fujitsu.
La supervisione del progetto è affidata a docenti esperti della Carnegie Mellon University, inclusi il professor Graham Neubig e il professor Yonatan Bisk. Questo garantisce che l’AI venga testata e perfezionata in condizioni realistiche e con metodi di ricerca all’avanguardia.
Con questa innovazione, Fujitsu punta a ridefinire l’analisi video nei contesti operativi, rendendo i luoghi di lavoro più sicuri ed efficienti grazie a una comprensione integrata di immagini e dati testuali.
Newsletter – Non perderti le ultime novità sul mondo dell’Intelligenza Artificiale: iscriviti alla newsletter di Rivista.AI e accedi a un mondo di contenuti esclusivi direttamente nella tua casella di posta!