Il Test di Turing

L’intelligenza è un concetto complesso e multidimensionale, generalmente definita come la capacità di apprendere dall’esperienza, adattarsi a nuove situazioni, comprendere e maneggiare astrazioni, e utilizzare la conoscenza per manipolare l’ambiente o pensare in modo astratto. L’intelligenza umana include diverse abilità come il ragionamento, la pianificazione, la soluzione di problemi, il pensiero astratto, la comprensione di idee complesse, l’apprendimento rapido e l’apprendimento dall’esperienza.

Quando si parla di intelligenza artificiale (IA), ci si riferisce alla simulazione delle capacità cognitive umane nei computer o nei sistemi informatici. Le attuali IA possono eseguire compiti specifici molto bene, talvolta superando persino le capacità umane, come nel gioco degli scacchi o in alcuni tipi di analisi dei dati. Tuttavia, queste IA sono generalmente considerate “deboli” o “strette“, nel senso che sono altamente specializzate per compiti specifici e non possiedono la vasta gamma di abilità cognitive o l’adattabilità dell’intelligenza umana.

La questione se le attuali IA siano realmente intelligenti dipende dalla definizione di intelligenza che si adotta. Se per intelligenza si intende la capacità di eseguire compiti specifici a livelli elevati di competenza, allora molte IA possono essere considerate intelligenti. Tuttavia, se l’intelligenza è definita in termini di capacità generali di ragionamento, apprendimento, e adattabilità in un’ampia gamma di ambienti e situazioni, allora le IA odierne non raggiungono ancora questo livello di intelligenza generale o “forte“.

Relativamente all’Intelligenza Artificiale ristretta a compiti specifici è possibile effettuare benchmark specifici e test formali per apprezzarne e valutarne il grado di capacità. I metodi disponibili sono numerosi e basati su criteri tecnici.

Ma come possiamo valutare e riconoscere un’Intelligenza Artificiale Forte o Genarale, cioè un’intelligenza assolutamente analoga a quella di un essere umano?

Potrà sembrarti strano, ma proprio su questo punto, ancora oggi l’unico criterio valido sembra essere quello del superamento di un test descritto nel 1950 dal matematico inglese Alan Turing nell’articolo “Computing Machinery and Intelligence“.



Ad oggi, non esistono software che abbiano superato il Test di Turing nel senso più ampio e completo inteso da Alan Turing.

In alcuni casi è accaduto che software specifici abbiano superato versioni semplificate o adattate del test in contesti limitati. Questi casi spesso riguardano chatbot progettati per simulare conversazioni umane in ambiti ristretti.

Uno degli esempi più noti è il software “Eugene Goostman”, un chatbot che si finge un ragazzo ucraino di 13 anni. Nel 2014, durante un evento all’Università di Reading, in Inghilterra, si è affermato che Eugene aveva superato il Test di Turing, convincendo il 33% dei giudici umani che fosse umano durante una serie di chat di cinque minuti. Tuttavia, questa affermazione è stata oggetto di dibattito e critica, poiché le condizioni dell’esperimento erano molto specifiche e non riflettono completamente l’ampio criterio proposto da Turing.

Il Test di Turing originale non specifica un contesto o un argomento limitato per le conversazioni e si basa sull’idea che una macchina possa esibire un’intelligenza indistinguibile da quella umana in qualsiasi area di conoscenza o discussione. Fino ad ora, nessun software è riuscito a raggiungere questo livello di capacità, dato che i sistemi di intelligenza artificiale attuali hanno limitazioni in termini di comprensione del mondo reale, creatività e empatia, che sono fondamentali per superare il test in tutte le sue sfaccettature.