gruppo di frascati

Il progetto Giasone – nona parte

Notizie in… Controluce – giugno 2000 – nona parte

Progetto Giasone

Come riuscire a riprodurre, in una macchina, l’intelligenza dell’uomo

Intelligenza ed emulazione – Intelligenza Artificiale ed Emulatori: nuove prospettive e limiti dell’IA classica

di Tommaso Acquaviva

Le ricerche sull’Intelligenza Artificiale stanno attraversando un periodo rivoluzionario. Occorre, prima di procedere, fare delle considerazioni storiche sull’IA per poi valutarne i limiti ed i confini.

Alla domanda “Può una macchina pensare?” diversi teorici hanno fornito nel tempo molte ragioni per dare una risposta affermativa. Una delle prime e più profonde stava in due importanti risultati della teoria della computazione.

La prima è la tesi di Church, secondo cui “ogni funzione che sia effettivamente calcolabile è ricorsivamente computabile”. Effettivamente calcolabile significa che esiste una procedura “meccanica” per determinare, in un tempo finito, il valore o l’uscita della funzione per un dato argomento od ingresso. Ricorsivamente computabile significa in particolare che esiste un insieme finito di operazioni aritmetiche elementari che, applicate ad un dato argomento e poi ai risultati successivi di queste elaborazioni, consente di ottenere il valore della funzione in un tempo finito.

L’altro risultato importante è la dimostrazione di Alan Turing, secondo cui “ogni funzione ricorsivamente computabile può essere calcolata in un tempo finito da un tipo semplice di macchina manipolatrice di simboli”, detta successivamente macchina universale di Turing (MS). Essa è governata da un insieme di regole applicabili ricorsivamente, in grado di considerare l’identità, l’ordine e la disposizione dei simboli elementari in ingresso via via incontrati.

Questi due risultati comportano una conseguenza notevole: un calcolatore digitale tradizionale, purché abbia il programma giusto, una memoria abbastanza grande e tempo a sufficienza, può calcolare qualsiasi funzione tra ingresso ed uscita governata da regole. In particolare, i risultati comportano che una macchina manipolatrice di simboli (MS) adeguatamente programmata dovrebbe riuscire a superare il test di Turing per l’intelligenza cosciente. Nella versione originale del test di Turing, ciò che si introduce nella macchina MS sono domande ed osservazioni tipiche di una conversazione, battute su una tastiera da una persona qualsiasi, mentre le uscite sono riportate dattiloscritte, fornite dalla macchina MS. La macchina supera questo test per l’intelligenza se le sue risposte non possono essere distinte dalle risposte dattiloscritte di una persona umana. Naturalmente, al momento, nessuno conosce la funzione che produrrebbe in uscita il comportamento di una persona pensante, ma Church e Turing garantiscono che, qualsiasi sia questa funzione, una macchina MS adeguata potrebbe computarla. Una tale conclusione è importante, soprattutto perché l’interazione svolta solo mediante telescrivente ipotizzata da Turing è un vincolo superfluo. La stessa conclusione si ottiene anche se la macchina MS interagisce con il mondo esterno in modi più complessi: mediante visione diretta, o con dialoghi veri e propri ed altro ancora. L’unico problema che resta è quello di identificare la funzione complessa che governa la struttura delle risposte umane all’ambiente e poi scrivere il programma. Le macchine MS fornite di buoni programmi svolgono un’ampia gamma di attività cognitive, seguono istruzioni complicate, risolvono complessi problemi. L’Intelligenza Artificiale classica, basata sulla stesura di programmi, ha rappresentato un complesso di ricerche impegnative e riuscite sotto ogni punto di vista. Naturalmente, vi sono lati oscuri. Intanto, è evidente che le macchine MS non sono molto simili al cervello. Ma anche qui l’impostazione classica fornisce una risposta convincente. Innanzitutto, il materiale con cui una qualsiasi macchina MS è costruita non ha niente a che fare con la funzione calcolata, che è fissata dal programma. In secondo luogo, anche i particolari costruttivi dell’architettura funzionale della macchina sono irrilevanti, poiché architetture differenti potrebbero calcolare la stessa funzione ingresso-uscita. Di conseguenza, l’Intelligenza Artificiale ha cercato di trovare la funzione ingresso-uscita caratteristica dell’intelligenza ed il programma più efficace per calcolarla.

Agli inizi degli anni ’70, Dreyfus ha criticato le simulazioni dell’attività cognitiva, giudicandole insufficienti rispetto alla realtà cognitiva ed imputava a queste simulazioni un difetto sistematico. Ciò che mancava è il vasto cumulo di conoscenze di base inarticolate che ogni persona possiede e la capacità che ha il buon senso di sfruttare gli aspetti utili di tali conoscenze al mutare delle circostanze. Sempre in questo periodo, il tasso di rendimento cognitivo comincia a diminuire all’aumentare della velocità e della memoria. Per simulare il riconoscimento degli oggetti da parte del sistema visivo, si deve ricorrere ad una potenza di calcolo di livello inaspettato. I tempi di calcolo sono sempre più lunghi, molto di più di quelli richiesti da un sistema visivo reale. Tale lentezza è incomprensibile, poiché in un calcolatore la propagazione dei segnali è un milione di volte più veloce che nel cervello e la frequenza di clock supera qualsiasi frequenza presente nel cervello. Eppure, nei problemi reali, la tartaruga supera la lepre.

Negli anni ’80, John Searle ha concepito una critica abbastanza nuova, indirizzata all’assunto di fondo del programma di ricerca classico: ovvero, l’idea che una manipolazione adeguata di simboli strutturali tramite l’applicazione ricorsiva di regole che tengano conto della struttura possa produrre una intelligenza cosciente. Searle si basa su un esperimento concettuale avente due caratteristiche fondamentali. In primo luogo, la macchina MS deve attuare una funzione ingresso-uscita capace di sostenere una conversazione superando il test di Turing. In secondo luogo, la struttura interna della macchina è tale che, comunque essa si comporti, un osservatore ha la certezza che né la macchina, né alcuna sua parte capisce il linguaggio discorsivo.

Tutto ciò che la macchina contiene è una persona che parla solo l’inglese e che seguendo una serie di istruzioni scritte manipola i simboli cinesi che entrano ed escono. In breve, il sistema dovrebbe superare il test di Turing, pur non comprendendo né il cinese né il vero contenuto semantico del cinese. La conclusione generale di Searle è che un sistema che si limiti a manipolare simboli fisici che tengano conto della struttura sarà al massimo una vuota parodia dell’autentica intelligenza cosciente, poiché è impossibile generare la vera semantica semplicemente macinando una vuota sintassi. Gli elementi dell’intelligenza cosciente devono possedere un contenuto semantico reale.

gias-giasone01

L’IA verso Emulatori che riproducano il funzionamento del cervello

Il problema dell’intelligenza cosciente rimane irrisolto secondo le linee di ricerca dell’IA classica. L’architettura funzionale delle macchine MS classiche non è adatta a svolgere compiti molto impegnativi. Le nuove tendenze dell’IA sono rivolte alla conoscenza approfondita del cervello biologico ed alla costruzione di una nuova classe di modelli computazionali che si ispirano alla sua struttura. Sono soprattutto due le caratteristiche anatomiche per cui il cervello si differenzia profondamente dall’architettura dei calcolatori elettronici tradizionali.

In primo luogo, il sistema nervoso è una macchina parallela, nel senso che i segnali sono elaborati simultaneamente in milioni di canali diversi. La retina, ad esempio, presenta al cervello il suo complicato ingresso non in blocchi di 8, 16 o 32 elementi, come in un calcolatore da tavolo, bensì sotto forma di quasi un milione di segnali distinti che arrivano simultaneamente all’estremità del nervo ottico, il nucleo genicolato laterale, dove vengono elaborati collettivamente e simultaneamente.

In secondo luogo, l’unità di elaborazione fondamentale del cervello, il neurone, è relativamente semplice; inoltre, la sua risposta ai segnali in ingresso è analogica e non digitale, in quanto la frequenza degli impulsi in uscita varia con continuità in funzione dei segnali in ingresso. I modelli a rete semplificati sono utili per capire come potrebbero funzionare le reti di neuroni reali e per rilevare le proprietà comportamentali delle architetture parallele. In una rete a strati dove ogni neurone di uno strato è collegato a tutti i neuroni dello strato successivo mediante assoni, uno stimolo in ingresso produce un dato livello di attivazione in una certa unità di ingresso, la quale mediante il suo assone trasmette un segnale proporzionale al livello di attivazione alle molte connessione sinaptiche che collegano le unità nascoste. L’effetto complessivo è che una configurazione di attivazione nell’insieme delle unità di ingresso produce una configurazione di attivazione distinte nell’insieme delle unità nascoste. Lo stesso vale per le unità di uscita; una configurazione di attivazione delle unità nascoste produce una distinta configurazione di attivazione nelle unità di uscita.

Vantaggi di una struttura parallela

Per quanto semplifichi la struttura del cervello, il modello a rete presenta notevoli vantaggi importanti. Innanzitutto, un’architettura parallela consente un aumento radicale di velocità rispetto ad un calcolatore convenzionale, perché le molte sinapsi di ciascun livello compiono molti piccoli calcoli simultanei invece che in faticosa successione. Questo vantaggio aumenta d’importanza quando il numero di neuroni di ciascuno strato aumenta. Sorprendentemente, la velocità di elaborazione non dipende tanto dal numero di neuroni interessati in ciascuno strato quanto dalla complessità della funzione elaborata. In secondo luogo, un elevato grado di parallelismo comporta che il sistema resista ai danni mantenendo la propria funzionalità. La perdita di alcuni collegamenti ha un effetto trascurabile sul carattere della trasformazione complessiva dalla parte rimanente della rete.

gias-giasone06

In terzo luogo, un sistema parallelo immagazzina grandi quantità di informazione in modo distribuito, ed il tempo di accesso a ciascuna parte è dell’ordine del millesimo di secondo. Tali informazioni sono contenute nella specifica configurazione di intensità delle connessioni sinaptiche, generata dall’apprendimento precedente. Quando il vettore in ingresso attraversa quella configurazione di connessioni, e ne è trasformato, vengono liberate informazioni utili.

L’elaborazione parallela non è l’ideale per ogni tipo di calcolo. Con operazioni che richiedono soltanto un piccolo vettore in ingresso, con poche componenti, ma molti milioni di calcoli ricorsivi in rapida interazione, il cervello, come struttura parallela, lavora molto male, mentre le macchine MS tradizionali eccellono. Esiste tuttavia un’altrettanto estesa classe computazionale per la quale l’architettura del cervello è la migliore. Si tratta delle elaborazioni che in genere devono affrontare gli esseri viventi: riconoscere la sagoma di una persona in un ambiente disturbato, ricordare successivamente ed all’istante la sagoma stessa, distinguere gli individui con cui accoppiarsi da quelli con cui non è possibile. Sono tutte elaborazioni che presentano un numero elevato di ingressi, con altrettanti canali, ma che effettuano calcoli relativamente semplici.

Il cervello non può essere considerato solamente come una semplice macchina parallela con un elevato grado di architettura, ma anche sede dell’immaginazione e di memoria pregressa derivante da tutti i sistemi sensoriali.

Sulla base delle predette considerazioni, è stato ipotizzato da antonio e dal “gruppo di frascati”, nell’ENEA, un modello di funzionamento del cervello umano, che prende il nome di “giasone”. Con l’applicazione del modello “giasone” ai sistemi di controllo delle macchine industriali, si è aperto un nuovo fronte, chiamato intelligenza emulativa, che rappresenta un nuovo modo di considerare le macchine industriali, adesso governate da una struttura risonante intelligente basata sugli stessi meccanismi elementari con i quali il cervello biologico governa il corpo umano. Questo sviluppo tecnologico fornisce, come ritorno, nuovi elementi per la comprensione della complessa fenomenologia del cervello dell’uomo.

Tommaso Acquaviva

Copyright © 2015 Controluce - link a Notizie in... Controluce - link al sito dell'ENEA
Graphic Design: Armando Guidoni