martedì 26 agosto 2014

La spir@le della conoscenza - Nuovi scenari per la ricerca visuale delle immagini

Negli ultimi tempi l’evoluzione della visione intelligente ha consentito lo sviluppo di una nuova forma di ricerca per immagini, definita ricerca visuale, che consente un’interazione più naturale con l’ambiente circostante e gli oggetti in esso contenuti. Con questa tecnologia innovativa è sufficiente inquadrare un oggetto per riconoscerlo, senza che vi sia apposto alcun marcatore.
Gli algoritmi di visione intelligente sfruttano le caratteristiche visive proprie degli elementi come appaiono al sensore d’immagine, mutuando comportamenti propri del cervello umano il quale non riconosce un oggetto analizzando tutti i dettagli che lo compongono ma solo quelli più rilevanti. Una tecnologia cosi innovativa è adatta a molteplici usi quali identificare un oggetto inquadrato da una camera per ricevere dei contenuti informativi, contribuire al calcolo visivo della posizione di un’automobile, analizzare il contenuto trasmesso dalle reti televisive.

Il gruppo ISO/IEC MPEG, autore da 25 anni degli standard più diffusi di compressione e trasmissione di audio, video, grafica e della rappresentazione di contenuti multimediali, grazie al lavoro un gruppo di esperti di visione artificiale ha sviluppato un nuovo standard, che sara’ rilasciato a ottobre 2014, dal nome "Compact Descriptors for Visual Search" (CDVS).
Tal standard ha definito una modalità standard per estrarre, comprimere e decomprimere le informazioni visive rilevanti per mezzo di sofisticati algoritmi di ricerca visuale. L’importanza di CDVS in questo campo è analoga all’importanza della codifica audio e video. Per estrarre questi dati, la prima operazione da eseguire consiste nello scartare le informazioni relative al colore, ottenendo un’immagine che contiene solo quella che è definita come luminanza della scena che rappresenta la stessa mediante scale di grigi.
Dopodiché su questa versione dell’immagine sono determinate le posizioni di alcuni punti, detti punti salienti, che identificano caratteristiche salienti degli oggetti, anche quando la scena è osservata da angolazioni differenti. A seguire per ognuno di questi punti è calcolato un descrittore locale, cioè un elemento che descrive come la luminosità dell’immagine varia nell’intorno del punto.

CDVS definisce due scenari di utilizzo, il primo in cui le informazioni compresse sono inviate a un server remoto e un secondo in cui le informazioni compresse sono usate localmente sul dispositivo mobile.
Nel primo scenario, i vantaggi forniti da CDVS sono la riduzione dei dati da inviare, con conseguente diminuzione dei tempi di attesa della risposta, il consumo della batteria del cellulare, dato che la trasmissione di dati richiede molta energia e una ridotta complessità nel server dato che i descrittori CDVS sono calcolati dallo smartphone. Infatti, il server non avendo l’onere dell’estrazione delle informazioni può gestire esclusivamente la parte di confronto, rendendo possibile la gestione di molte interrogazioni simultanee anche su sistemi di potenza computazionale limitata.
Nel secondo scenario, mediante lo standard CDVS è possibile memorizzare database con un elevato numero di elementi riconoscibili direttamente sul cellulare e il processo stesso di ricerca può essere eseguito in tempi ridotti grazie alla maggiore velocità ottenuta grazie ai confronti dei descrittori compressi. Questa caratteristica è anche utile quando non si ha una configurazione di sistema in cui è presente un terminale mobile. La velocità delle operazioni eseguite con lo standard CDVS si rivela molto utile anche nel caso in cui si elaborino dei contenuti multimediali, ad esempio, con un singolo server per eseguire la ricerca visuale CDVS in modo concorrente su diversi canali televisivi, determinando in quali istanti di tempo sono presenti gli elementi identificati.

Nessun commento:

Posta un commento