Meccanismi che invocano l'attenzione selettiva

Stefano Bussolon

Il meccanismo di integrazione degli attributi fisici

Secondo la features integration theory la necessità di ricorrere all'attenzione selettiva spaziale deriva da un'ambiguità potenziale della codifica che può avvenire nelle reti parallele quando viene codificato più di uno stimolo: al fine di separare le congiunzioni corrette da quelle illusorie l'attenzione deve selezionare un oggetto (od un'area spaziale) alla volta entro una master map retinotopica in modo da codificare esclusivamente le caratteristiche dell'oggetto (Allport, 1992, pag. 185).

La features integration theory assume che differenti caratteristiche sensoriali, quali il colore, l'orientamento, la dimensione o la direzione di movimento siano codificate in parallelo, automaticamente e senza attenzione focalizzata, in modo da formare differenti mappe degli attributi (feature maps) per i differenti valori delle dimensioni che codifica (Treisman, 1988, pag. 203).

All'interno della suddivisione "via del where / via del what" le mappe degli attributi assumono una connotazione ambigua, in quanto preservano sia le informazioni relative alle caratteristiche fisiche dell'oggetto che quelle relative alla sua posizione. Il vincolo dell'invarianza spaziale impone che le informazioni codificate negli stadi successivi del modulo di identificazione perdano le loro connotazioni spaziali; questo effetto si ottiene, come abbiamo visto, ampliando il campo recettivo delle cellule dell'area IT. Tali unità costituiscono degli interruttori sintonizzati sugli specifici attributi fisici, in quanto si attivano in presenza di almeno uno stimolo nella corrispondente feature map, e la loro attività neuronale indica la presenza dell'attributo nell'intero emicampo visivo. Osservando il comportamento di queste unità possiamo stabilire se nell'emicampo vi è almeno uno stimolo che possiede l'attributo specificato, ma non possiamo sapere la locazione precisa di tale stimolo.

Nei compiti sperimentali in cui la consegna consiste nel verificare la presenza di almeno uno stimolo che abbia uno specifico attributo (es. presenza di stimoli neri) è sufficiente verificare che la mappa degli attributi neri non sia vuota, e dunque basta controllare che il corrispondente interruttore sia acceso: in caso positivo la risposta sarà affermativa, altrimenti il verdetto sarà negativo. In queste condizioni gli stimoli distrattori non sortiscono nessun effetto, in quanto se non possiedono l'attributo specificato (il colore nero) non saranno rappresentati nella mappa corrispondente; se, viceversa, condividono l'attributo, possono essere considerati dei distrattori impropri in quanto costituiscono a tutti gli effetti dei bersagli e la loro presenza può confermare (e rendere più veloce) la decisione corretta.

Nel caso in cui il target è definito in base ad una congiunzione di caratteristiche (es. stimoli neri verticali) questo meccanismo non funziona più. A prima vista, infatti, sembrerebbe sufficiente controllare che i due interruttori (presenza di stimoli neri e presenza di stimoli verticali) siano entrambi accesi, ovvero che nessuna delle due features map sia vuota. Esiste, però, la possibilità che il comportamento di queste cellule sia dovuto alla presenza di due stimoli diversi: uno stimolo orizzontale nero ed uno stimolo verticale bianco (vedi tabella 1B). Basandosi solamente sulle informazioni presenti in queste unità, dunque, si rischia di inferire delle congiunzioni illusorie.

Per ovviare a tali inconvenienti è necessario selezionare uno stimolo alla volta, attraverso l'attenzione selettiva spaziale, ed inibire tutti gli altri. In questo le features map codificheranno uno stimolo alla volta: se lo stimolo possiede la caratteristica codificata verrà rappresentato nella mappa, altrimenti tale mappa risulterà vuota. Gli interruttori dell'area IT si attiveranno solamente qualora le corrispondenti mappe non siano vuote e, dunque, soltanto se lo stimolo selezionato possiede le caratteristiche codificate. In questo modo per decidere se nell'ambiente vi sono oggetti neri verticali sarà necessario selezionare via via tutti gli stimoli e controllare se, per almeno uno di questi, l'interruttore nero e l'interruttore verticale sono contemporaneamente accesi, ovvero se entrambe le features map codificano l'oggetto selezionato.

In queste condizioni la procedura di ricerca dovrà essere seriale e dovrà invocare l'attenzione spaziale. I tempi di reazione saranno più elevati e mostreranno una correlazione con il numero di distrattori presenti. Nell'appendice A discuteremo del rapporto fra ricerca seriale ed inibizione di ritorno.

Nella teoria di Treisman l'algoritmo di ricerca seriale utilizzato nella ricerca di target caratterizzati dalla congiunzione di più caratteristiche è la seguente:

1) si sceglie una delle mappe di salienza che codificano gli attrinuti target (la mappa oggetti neri o la mappa oggetti orizzontali);

2) si inibiscono tutte mappe diverse da quella scelta; in questo modo nella master map gli oggetti che rispondono alla caratteristica prescelta avranno una salienza maggiore (Treisman & Sato, 1990, pag. 461);

3) per ognuno degli elementi così selezionati si applica la seguente procedura:

a) si focalizza l'attenzione spaziale attorno all'oggetto;

b) si controlla se tutti gli interruttori salienti sono accesi;

c) se la condizione precedente è soddisfatta, l'algoritmo termina rispondendo positivamente;

d) in caso contrario, la procedura ricomincia con un nuovo oggetto in una nuova locazione;

4) se, alla fine di un'analisi esaustiva di tutti gli oggetti, nessuno soddisfa le richieste del compito, l'algoritmo termina con una risposta negativa.

E' necessario precisare che, per alcuni passaggi, ci si basa soprattutto su congetture. Ad esempio non è affatto sicuro che le procedure seriali vengano effettuate solo su di un sottoinsieme di oggetti che soddisfa almeno una delle caratteristiche richieste: in altre parole, i passaggi 1 e 2 sono oggetto di discussione (Treisman & Sato, 1990). Se tali passaggi non fossero confermati, l'analisi seriale interesserebbe tutti gli stimoli presenti; in caso contrario (presenza dei passaggi 1 e 2) la ricerca seriale interesserebbe solo gli stimoli che possiedono almeno un attributo saliente, eliminando da subito quegli oggetti che, sicuramente, non rispondono alle caratteristiche invocate.

Secondo la features integration theory la detezione di stimoli definiti da un singolo attributo fisico avviene in parallelo (controllando lo stato dell'interruttore) mentre l'identificazione di stimoli definiti da una congiunzione di attributi fisici avviene in maniera sequenziale. Esistono numerosi esperimenti che confermano tale ipotesi (Bergen & Julesz, 1983; Sagi & Julesz, 1985; Treisman & Gelade, 1980; Treisman, 1988):

· nei compiti dove l'identificazione non presuppone la localizzazione i tempi di risposta sono indipendenti dal numero di distrattori; il compito viene dunque eseguito in modalità parallela;

· nei compiti dove l'identificazione presuppone la localizzazione i tempi sono direttamente proporzionali al numero di risposte; i tempi medi delle risposte negative sono inoltre doppi rispetto a quelli delle risposte positive, indice di procedura seriale autoterminante.

L'attenzione selettiva spaziale avrebbe dunque lo scopo di eliminare la rappresentazione di tutti gli oggetti tranne uno (quello, appunto, selezionato) rendendo in questo modo possibile una corretta identificazione dello stimolo nonostante il coarse coding.

Il meccanismo di programmazione dei movimenti oculari

Nei paragrafi precedenti abbiamo visto come l'attenzione spaziale abbia lo scopo di avvantaggiare un'area a scapito di altre. Questo effetto può essere ottenuto modificando la rappresentazione interna dello spazio; esiste però un altro sistema, molto potente, che può essere utilizzato: tale mezzo è dato dalla foveazione, ovvero dal movimento degli occhi verso il locus che si intende analizzare. Allo spostamento dovuto ai movimenti oculari viene dato il nome di overt orienting (orientamento scoperto), mentre quello ottenuto senza movimenti oculari viene definito covert orienting (orientamento coperto) in quanto lo spostamento dell'attenzione non è accompagnato da un comportamento osservabile.

Da un punto di vista logico il rapporto fra movimenti oculari ed attenzione spaziale può assumere tre diverse forme (Shepherd, Findlay, Hockey, 1986, pag. 476):

1) l'ipotesi di identità assume che il processo di foveazione e quello di selezione spaziale coincidano;

2) l'ipotesi di indipendenza assume che fra i due meccanismi non vi sia nessun legame;

3) l'ipotesi di interdipendenza assume che questi due processi condividano, a determinati livelli di esecuzione, delle risorse comuni: l'esecuzione di ognuno dei due processi potrebbe dunque venire facilitato od ostacolato dall'altro, a seconda dei rispettivi obbiettivi spaziali (Shepherd e coll. 1986, pag. 467).

La prima ipotesi può essere rigettata sulla base di esperimenti che dimostrano come si possa spostare l'attenzione senza muovere gli occhi; per quanto concerne le altre due ipotesi vi sono dati contrastanti, anche se le prove a favore dell'interdipendenza appaiono più convincenti (Umiltà, 1988, pag. 183).

Nel paragrafo relativo alle rappresentazioni topologiche si è accennato alle mappe motorie. Una mappa percettivo-motoria a rappresentazione vettoriale è presente nel collicolo superiore, area subcorticale deputata, in collaborazione con il frontal eye field, alla generazione dei movimenti oculari saccadici (Sparks & Mays, 1990, pag. 311).

In tale mappa la codifica dei movimenti, pur essendo organizzata topologicamente, avviene in maniera distribuita: ogni neurone scarica in occasione di un ampia gamma di movimenti e, dunque, una numerosa popolazione di neuroni scarica prima di ogni movimento (Sparks, Lee & Rohrer, 1990, pag. 805). Il computo dell'esatta direzione ed estensione del movimento saccadico avviene calcolando una media ponderata di tutti i neuroni attivi (Sparks, Lee & Rohrer, 1990, pag. 805). Questo tipo di rappresentazione deve però affrontare il problema di interferenza: se nella mappa del collicolo superiore vi sono due o più zone pragmaticamente salienti il vettore che risulterà dalla media ponderata cadrà in un punto intermedio fra le due aree (o, più precisamente, nel punto risultante dalla media vettoriale dei due punti: Lee, Rohrer & Sparks, 1988, pag. 358; Sparks, Lee, Rohrer, 1990, pag. 807).

Per evitare questo problema è necessario ricorrere ad un meccanismo che inibisca tutte le aree salienti tranne una: detto in altri termini, c'è bisogno dell'attenzione selettiva spaziale. Questo significa che, se il modello neuroanatomico della media ponderata è corretto, l'attenzione selettiva spaziale (covert orienting) è necessaria affinché si possa ottenere un corretto movimento oculare (overt orienting) verso un oggetto in presenza di stimoli distrattori.

Il problema dell'interferenza nella codifica sorge quando, nella mappa pragmatica del collicolo superiore, sono presenti due o più stimoli. Proviamo ad immaginare la situazione più semplice, in cui gli stimoli concorrenti sono due. Vi sono, in questo caso, tre possibili condizioni:

1) il target ed il distrattore sono collocati nello stesso emicampo visivo;

2) il target è collocato in un emicampo, il distrattore nell'altro;

3) il target è collocato in un emicampo mentre il distrattore si trova nel punto di fissazione attuale.

· La situazione più problematica è la seconda, in quanto i due stimoli elicitano movimenti contrapposti, rendendo di fatto il meccanismo incapace di spostarsi. Per risolvere il conflitto è però sufficiente inibire l'emicampo del distrattore ed eccitare quello del target: in questo modo la codifica è disambiguata e la programmazione motoria può avvenire in maniera corretta.

· La terza situazione sembra, dal punto di vista "vettoriale", meno drammatica. Non va pero dimenticato il vantaggio di cui dispone il distrattore per il fatto di cadere nella fovea: il rischio è quello di bloccare la foveazione su di un unico stimolo. Per evitare un simile problema occorre ipotizzare un meccanismo di inibizione a "orologeria", che scatti automaticamente verso quegli oggetti su cui l'attenzione focalizzata si è posata. Tale meccanismo è noto come inibizione di ritorno.

· La prima situazione (stesso emicampo) è la meno grave dal punto di vista vettoriale ma la più difficile da disambiguare:

· se i due stimoli giacciono ad una distanza minore del diametro della fovea l'errore è sostanzialmente trascurabile: il movimento porta gli occhi in un punto mediano rispetto ai due stimoli ma entrambi ricadono nella fovea e dunque lo scopo è in buona sostanza raggiunto;

· se la valenza pragmatica del target è molto maggiore di quella del distrattore dalla ponderazione dei due stimoli dovrebbe risultare un vettore molto vicino all'obbiettivo;

· in caso contrario (stimoli non vicinissimi con salienza simile) l'errore di stima del vettore nel movimento saccadico può essere tale da far cadere la fovea troppo distante dal target, obbligando il soggetto ad un nuovo movimento di correzione.

Per risolvere in maniera corretta il problema è sufficiente inibire tutto il campo visivo tranne l'area del target. Questo sistema, però, si basa su di un circolo vizioso: per eccitare l'area corrispondente allo stimolo ed inibire tutte le altre bisogna conoscere quella locazione spaziale che stiamo cercando.

Un'ipotesi alternativa consiste nell'innescare una competizione fra i due (o più) stimoli presenti nella mappa. In questo modo siamo sicuri che il vettore risultante dalla somma ponderata andrà cadere su di un oggetto. Se, però, la salienza del target non è sigificativamente maggiore di quella dei distrattori è probabile che lo stimolo selezionato non sia quello desiderato. Probabilmente, però, questo rischio non può essere evitato.