Un recente rapporto del Global Market Insights rivela che il mercato della applicazioni di intelligenza artificiale in ambito sanitario nel 2016 ammontava a 750 milioni di dollari e crescerà fino al 2024.
Il campo dell’intelligenza artificiale può essere raffigurato attraverso un diagramma di Venn che mette in luce le relazioni concettuali tra le diverse tecniche.
Dal diagramma è possibile vedere che il deep learning è un caso particolare di apprendimento di rappresentazione, che a sua volta è un sottoinsieme del machine learning e il tutto è una sottodivisione delle tecnologie di intelligenza artificiale.
Con il termine machine learning si intende un insieme di tecniche e approcci destinati alla risoluzione di determinati tipi di problemi che prevedono che l’algoritmo impari da un certo set di dati.
Attualmente lo studio degli algoritmi di machine learning ha visto molti successi nell’ambito del riconoscimento di immagini e comprensione di linguaggio parlato.
In tali ambiti, infatti, vi sono problemi molto difficili da risolvere con programmi “hard coded”, il cui funzionamento non prevede un addestramento. In questo approccio i programmi esposti all’addestramento imparano una gerarchia di concetti dai dati (noti come rappresentazione dei dati).
Quando si apprendono rappresentazioni da altre rappresentazioni si parla di una stratificazione profonda dell’apprendimento: il deep learning.
APPLICAZIONI DELLE RETI NEURALI NELL’IMAGING MEDICO
Nell’ambito sanitario l’intelligenza artificiale trova largo impiego nell’imaging medico, in quanto consente una caratterizzazione migliore e un’identificazione più celere delle metastasi che possono migliorare gli esiti delle terapie. In particolare, le tecniche di deep learning vengono maggiormente utilizzate per gli aspetti legati all’imaging medico.
Classificazione di immagini o esami
Uno dei primi utilizzi degli algoritmi di deep learning nell’imaging medico riguarda la classificazione delle immagini. Solitamente si ha un certo numero di immagini come input e una singola variabile diagnostica in output (presenza/assenza della malattia). Per quanto riguarda i dataset sono molto più ristretti nell’imaging medico rispetto alla computer vision in generale (centinaia/migliaia di campioni contro milioni). Per questo motivo si utilizza spesso la tecnica del transfer learning, che consiste sostanzialmente nel pre-addestrare la rete neurale per aggirare il fabbisogno di dati per il training del programma. Vi sono due strategie di transfer learning maggiormente utilizzate:
- utilizzare una rete pre-addestrata come estrattrice di features
- ricalibrare (eseguire un”fine tuning”) un programma pre-addestrato sui dati medici
Entrambe le strategie sono state utilizzate con successo in molti casi, sebbene la seconda si stia dimostrando migliore.
Classificazione di un oggetto o di una lesione
La classificazione di una lesione significa classificare una piccola parte dell’immagine medica, come un tumore in uno specifico organo. A tal fine le informazioni locali della lesione e le informazioni globali sulla posizione della lesione sono importanti. Solitamente degli algoritmi di deep learning generici non sono adatti per questo tipo di compito, per cui un approccio utilizzato in molti casi è quello multistream. Alcuni studi hanno utilizzato delle reti convoluzionali multistream concatenate e anche una combinazione di reti convoluzionali e ricorrenti, l’utilizzo di componenti ricorrenti aiuta a rendere l’analisi indipendente dalla dimensione dell’immagine.
Nel caso di analisi di immagini 3D le reti invece devono essere riadattate. Oltre alle reti neurali convoluzionali anche altri tipi di architetture sono state utilizzate per lo scopo, tra cui RBM (Restricted Boltzmann Machine), SAEs (Stacked Autoencoders) e SAE (Convolutional Stacked Autoencoders), la cui differenza di quest’ultimo da una rete neurale convoluzionale è il preaddestramento non supervisionato con degli autoencoders sparsi. Un altro approccio interessante è anche il multiple instance learning (MIL) combinato con metodi deep learning. Questa procedura ottiene ottimi risultati in confronto all’estrazione di features a mano.
Rilevazione di organi e regioni
Nel pre-processo delle analisi di immagini mediche la rilevazione anatomica di oggetti è uno step molto importante. Nella rilevazione di oggetti in 2D le architetture più utilizzate sono le reti convoluzionali, dati i loro buoni risultati. Sembra che anche le RNNs possano raggiungere ottimi risultati in questo compito.
Rilevazione di lesioni
Uno dei problemi cruciali per la diagnosi è la rilevazione di lesioni nelle immagini mediche ovvero nell’individuare lesioni nell’immagine. Anche qui la maggior parte degli studi effettuati per questo scopo hanno fatto uso di reti neurali convoluzionali per analisi per pixel o voxel. Ci sono alcune differenze tecniche nella rilevazione e la classificazione di lesioni con reti neurali e, a parte queste la rilevazione e la classificazione sono risolti in modo piuttosto simile.
Segmentazione di organi o di sottostrutture
La segmentazione degli organi è una parte importante nei sistemi di diagnosi automatici e permette analisi quantitative di volume e forma delle regioni di interesse. Il compito consiste nell’identificare i pixel o voxel che formano il contorno, volume o superfice dell’oggetto desiderato. La maggior parte degli articoli sull’uso di algoritmi di deep learning applicati all’imaging medico si occupano di segmentazione. Per questo compito sono state implementate molte architetture basate sulla rete convoluzionale e la RNN. La più conosciuta delle reti convoluzionali implementate per la segmentazione è la rete neurale U-Net. Oltre alle reti convoluzionali, anche le reti RNN sono state utilizzate recentemente per la segmentazione.
Segmentazione di lesioni
La segmentazione delle lesioni è un approccio misto tra la rilevazione di oggetti e la segmentazione. Per questo compito si utilizzano architetture U-Net e simili per avere un’analisi di tipo globale e locale dell’immagine.
La registrazione
la registrazione delle immagini mediche consiste nel calcolo di una trasformazione di coordinate da un’immagine medica ad un’altra. I metodi più comunemente utilizzati sono due:
- utilizzare reti di deep learning per stimare una misura di similarità tra due immagini per una ottimizzazione iterativa
- predire direttamente i parametri della trasformazione con modelli di regressione
Anche in questo caso le architetture al momento utilizzate più spesso sono di tipo convoluzionale. Per il compito della registrazione delle immagini vengono utilizzate diverse architetture tra cui SAE e CNN, tuttavia non si è ancora ben compreso quale metodo sia il migliore.
CONCLUSIONE
Impiegando diversi algoritmi di deep learning, recenti studi hanno raggiunto risultati notevoli, dimostrando così l’efficacia di queste tecniche nei sistemi automatici di diagnosi. In futuro si prospettano ulteriori miglioramenti di performance e un sempre più diffuso ed efficace utilizzo. Grazie all’intelligenza artificiale è sempre più possibile automatizzare il rilevamento, il monitoraggio, la previsione della terapia e la risposta alla terapia stessa.