Computer Vision: definizione, funzionamento e applicazioni

07 April 2021 / Di Redazione Osservatori Digital Innovation / 0 Comments

La crescente capacità di indagine delle immagini fa sì che la Computer Vision sia una delle soluzioni software più promettenti nell’ambito dell’intelligenza artificiale. Anche se in Italia molte progettualità sono ancora allo stato preliminare, sono sempre di più le imprese che rivolgono l’attenzione a questa tecnologia. Con un occhio al futuro, vediamo come funzionano gli algoritmi di Computer Vision e quali opportunità possono offrire.

 

Che cos’è la Computer Vision

La Computer Vision o visione artificiale è un campo di studi interdisciplinare che studia algoritmi e tecniche per permettere ai computer di riprodurre funzioni e processi dell’apparato visivo umano. E non si tratta solo di riuscire a riconoscere oggetti, persone o animali all’interno di un’immagine singola o in sequenza (video), ma soprattutto di estrarre informazioni utili per la loro elaborazione, a livelli sempre più alti di astrazione e comprensione. In altre parole, si tratta della capacità di ricostruire un contesto intorno all’immagine, dandole un vero e proprio significato.

Per poter funzionare correttamente, i sistemi di Computer Vision hanno bisogno di essere addestrati con una grande quantità di immagini che, opportunamente etichettate, andranno a costituire il dataset che potrà rendere l’algoritmo realmente intelligente.

 

Come funziona la Computer Vision

Negli ultimi anni è fortemente cresciuta l’attenzione verso la Computer Vision, grazie all’avvento di tecniche sempre più avanzate di Machine Learning, che hanno permesso di raggiungere prestazioni paragonabili a quelle umane, e alla diffusione di immagini e video digitali.

Ma in cosa consistono queste tecniche di riconoscimento immagini e oggetti? Come avviene il riconoscimento immagini di una macchina? Gli algoritmi di Computer Vision possono effettuare indagini più o meno approfondite su un’immagine, a seconda delle tecniche utilizzate, della tipologia di immagine e del tipo di task effettuato. Tra i possibili task si individuano:

  • Image Classification: analisi del contenuto dell’immagine e attribuzione di un’etichetta (es. cane, gatto);
  • Object Detection: identificazione di una o più entità all’interno di un’immagine;
  • Image Segmentation: suddivisione dell’immagine in sezioni (es. per evidenziare i pixel di un referto medico in cui si riscontra un tumore);
  • Face Recognition: riconoscimento di volti di persone;
  • Action Recognition: identificazione di una o più entità e della loro relazione nel tempo e nello spazio, al fine di identificare e descrivere azioni specifiche (es. un calciatore che colpisce il pallone di testa);
  • Visual Relationship Detection: comprensione della relazione tra gli oggetti in un’immagine;
  • Emotion Recognition: rilevamento del sentiment di un’immagine;
  • Image Editing: modifiche a un’immagine (es. oscuramento di dati sensibili).

Tra queste, attualmente le imprese rivolgono l’attenzione principalmente a soluzioni di Image Classification e Object Detection. Ma lo sviluppo di soluzioni di Computer Vision comporta non poche difficoltà. Per esempio, nel caso della Image Classification l’immagine potrebbe essere ambigua ed essere associabile a più opzioni, quindi l’algoritmo deve essere in grado di attribuire l’etichetta più adeguata. O ancora, nel caso della Image Segmentation occorre non solo individuare le entità all’interno dell’immagine, ma anche delimitarle e analizzarle singolarmente.

Più in generale, tra le principali criticità nell’implementazione di progetti di Computer Vision si individuano:

  • creare un dataset sufficientemente ampio per l’addestramento dell’algoritmo;
  • insegnare all’algoritmo a comprendere l’immagine anche in presenza di trasformazioni (es. condizioni di luminosità non ottimale, deformazione o copertura parziale del soggetto, variazioni di scala).

 

Le applicazioni di Computer Vision

I sistemi di visione artificiale trovano numerose applicazioni. Si passa dal riconoscimento degli oggetti alla biometria, dalla smart surveillance (videocamere di sorveglianza intelligenti o in cloud per analizzare le immagini registrate e identificare infrazioni) al tracciamento di movimenti e analisi diagnostica in telemedicina.

Ma in Italia le soluzioni di Computer Vision hanno assunto un ruolo chiave soprattutto in ambito industriale e manifatturiero, grazie alla possibilità di essere integrate direttamente sulle linee di produzione e negli ambienti di fabbrica. Ecco alcuni esempi di come le imprese stanno sfruttando questa tecnologia:

  • Manutenzione predittiva: algoritmi di Computer Vision per il monitoraggio di asset industriali – principalmente macchinari – in ottica di manutenzione predittiva (evitare fermi macchina intervenendo su possibili guasti o malfunzionamenti);
  • Monitoraggio dei prodotti: sistemi per il controllo della qualità e l’analisi di eventuali difettosità dei prodotti, in modo da garantire il massimo livello di soddisfazione dei clienti e limitare eventuali problemi in fase di post-vendita;
  • Sicurezza nei luoghi di lavoro: sistemi per monitorare le immagini dell’impianto, dei lavoratori e delle loro azioni, in modo da individuare eventuali situazioni di rischio e/o incidenti dannosi per le persone o per l’ambiente.

Un esempio di Computer Vision in ambito manifatturiero

A corroborare quanto detto sulle applicazioni industriali della Computer Vision, riportiamo il caso della Gnutti Carlo S.P.A. azienda manifatturiera italiana, che di recente ha deciso di sviluppare un progetto di automazione per l’identificazione delle non conformità di un componente per motori automotive. Il processo di controllo, storicamente svolto da personale addestrato, risultava dispendioso; così, dopo aver sperimentato tecniche di visione classica, l’azienda ha scelto di sfruttare le potenzialità dell’intelligenza artificiale, adottando una soluzione di Computer Vision per identificare e classificare le anomalie presenti sulla superficie del componente meccanico. Il business.

L’Artificial Intelligence applicata in ambito manifatturiero: il caso Gnutti Carlo s.p.a.

Leggi il case study

 

Deep Learning e Computer Vision

I notevoli progressi che la Computer Vision sta registrando sono dovuti principalmente allo sviluppo delle tecniche di Deep Learning. Vediamo come.

Esistono diverse modalità con cui un’architettura di visione artificiale può estrarre informazioni dalle immaginiHand Crafted Features, Computer Vision Features e Data Driven Features – scelte singolarmente o combinate a seconda delle esigenze dell’analisi.

Il primo si basa sul concetto che gli algoritmi possano estrarre e definire ciò che è rilevante nell’immagine (es. uno specifico colore/forma, area, grandezza), mentre il secondo si fonda sulla suddivisione dell’immagine in piccole regioni per permettere un’analisi più approfondita. Ma la vera frontiera della Computer Vision sono le tecniche basate su Data Driven Features, che permettono il riconoscimento e la classificazione delle immagini (anche naturali) senza dover progettare la fase di estrazione delle features che viene svolta da particolari reti neurali: le reti neurali convoluzionali.

A loro volta, le reti neurali convoluzionali utilizzate per la classificazione delle immagini – che hanno contributo notevolmente allo sviluppo del Deep Learning– sono i principali esempi di Deep Neural Networks, reti costituite da un elevato numero di layer e che riescono a raggiungere dimensioni significative. E come si traduce questo in termini di comprensione delle immagini? Le reti deep sono altamente efficaci per l’analisi di immagini naturali e si prestano molto bene al transfer learning, un insieme di tecniche che permette di riutilizzare reti addestrate in precedenza su grandi asset di dati, per risolvere task differenti e tipicamente più specifici.

 

Approcci alla Computer Vision: vuoi approfondire le tecniche di riconoscimento immagini e il ruolo del Deep Learning?

Guarda il Webinar

Gli Osservatori Digital Innovation della School of Management del Politecnico di Milano nascono nel 1999 con l’obiettivo di fare cultura in tutti i principali ambiti di Innovazione Digitale. Oggi sono un punto di riferimento qualificato sull’Innovazione Digitale in Italia che integra attività di Ricerca, Comunicazione e Aggiornamento continuo.