Codifica predittiva - Predictive coding
Il termine codifica predittiva è utilizzato in diverse discipline (incluse le tecnologie di elaborazione del segnale e la legge) in significati vagamente correlati o non correlati.
Nelle neuroscienze, la codifica predittiva (nota anche come elaborazione predittiva ) è una teoria della funzione cerebrale in cui il cervello genera e aggiorna costantemente un modello mentale dell'ambiente. Il modello viene utilizzato per generare previsioni di input sensoriali che vengono confrontate con input sensoriali effettivi. Questo confronto si traduce in errori di previsione che vengono poi utilizzati per aggiornare e rivedere il modello mentale.
Origini
Gli antenati teorici della codifica predittiva risalgono già al 1860 con il concetto di inferenza inconscia di Helmholtz . L'inferenza inconscia si riferisce all'idea che il cervello umano riempia le informazioni visive per dare un senso a una scena. Ad esempio, se qualcosa è relativamente più piccolo di un altro oggetto nel campo visivo, il cervello usa quell'informazione come probabile indizio di profondità, in modo tale che il percipiente alla fine (e involontariamente) sperimenti la profondità. La comprensione della percezione come interazione tra stimoli sensoriali (bottom-up) e conoscenza concettuale (top-down) continuò ad essere stabilita da Jerome Bruner che, a partire dagli anni Quaranta, studiò i modi in cui bisogni, motivazioni e aspettative influenzano la percezione, ricerca che divenne nota come psicologia del "New Look". Nel 1981, McClelland e Rumelhart nel loro articolo fondamentale hanno esaminato l'interazione tra le caratteristiche di elaborazione (linee e contorni) che formano le lettere, che a loro volta formano le parole. Sebbene le caratteristiche suggeriscano la presenza di una parola, hanno scoperto che quando le lettere erano situate nel contesto di una parola, le persone erano in grado di identificarle più velocemente rispetto a quando si trovavano in una non parola senza contesto semantico. Il modello di elaborazione parallela di McClelland e Rumelhart descrive la percezione come l'incontro di elementi top-down (concettuali) e bottom-up (sensoriali).
Alla fine degli anni '90, l'idea dell'elaborazione top-down e bottom-up è stata tradotta in un modello computazionale di visione da Rao e Ballard . Il loro articolo ha dimostrato che potrebbe esserci un modello generativo di una scena (elaborazione top-down), che riceverebbe feedback tramite segnali di errore (quanto l'input visivo variava dalla previsione), che successivamente porterebbe all'aggiornamento della previsione. Il modello computazionale è stato in grado di replicare effetti di campo recettivo ben consolidati, nonché effetti di campo recettivo extra-classici meno compresi come l' arresto finale . Oggi, i campi dell'informatica e della scienza cognitiva incorporano questi stessi concetti per creare i modelli generativi multistrato che sono alla base dell'apprendimento automatico e delle reti neurali.
Quadro generale
La maggior parte della letteratura di ricerca nel campo ha riguardato la percezione sensoriale , in particolare la visione, che è più facilmente concettualizzata. Tuttavia, il framework di codifica predittiva potrebbe essere applicato anche a diversi sistemi neurali. Prendendo il sistema sensoriale come esempio, il cervello risolve il problema apparentemente intrattabile di modellare le cause distali dell'input sensoriale attraverso una versione dell'inferenza bayesiana . Lo fa modellando le previsioni degli input sensoriali di livello inferiore tramite connessioni a ritroso da livelli relativamente più alti in una gerarchia corticale. Vincolato dalle regolarità statistiche del mondo esterno (e da alcune previsioni preparate evolutivamente ), il cervello codifica modelli generativi dall'alto verso il basso a varie scale temporali e spaziali al fine di prevedere e sopprimere efficacemente gli input sensoriali che salgono dai livelli inferiori. Un confronto tra le previsioni (priori) e l'input sensoriale (probabilità) produce una misura della differenza (ad es. errore di previsione, energia libera o sorpresa) che, se è sufficientemente grande oltre i livelli di rumore statistico previsto, farà sì che il modello generativo si aggiorni in modo che preveda meglio l'input sensoriale in futuro.
In generale, si può facilmente affermare che si tratta di minimizzare la quantità di sorpresa (la misura della differenza). Questo è anche il motivo di quello che oggi viene chiamato pregiudizio di conferma o quello che storicamente potrebbe essere pregiudizio (sebbene quest'ultimo abbia connotazioni più negative) poiché meglio si adatta alla propria esperienza individuale fatta finora e supporta la coerenza. Pertanto, questo risulta essere piuttosto uno svantaggio nel mondo di oggi.
Se, invece, il modello prevede accuratamente i segnali sensoriali di guida, l'attività a livelli più alti annulla l'attività a livelli più bassi e la probabilità a posteriori del modello è aumentata. Pertanto, la codifica predittiva inverte la visione convenzionale della percezione come un processo per lo più dal basso verso l'alto, suggerendo che è in gran parte vincolato da previsioni precedenti, in cui i segnali dal mondo esterno modellano la percezione solo nella misura in cui si propagano lungo la gerarchia corticale nel forma di errore di previsione.
Ponderazione di precisione
Le aspettative sulla precisione (o varianza inversa) dell'input sensoriale in ingresso sono cruciali per minimizzare efficacemente l'errore di previsione in quanto la precisione attesa di un dato errore di previsione può informare la fiducia in quell'errore, che influenza la misura in cui l'errore viene ponderato nell'aggiornamento delle previsioni . Dato che il mondo in cui viviamo è carico di rumore statistico , le aspettative di precisione devono essere rappresentate come parte dei modelli generativi del cervello e dovrebbero essere in grado di adattarsi in modo flessibile ai contesti mutevoli. Ad esempio, la precisione attesa degli errori di previsione visiva probabilmente varia tra l'alba e il tramonto, in modo tale che agli errori in pieno giorno viene assegnata una maggiore fiducia condizionale rispetto agli errori di previsione al calare della notte. È stato recentemente proposto che tale ponderazione degli errori di previsione in proporzione alla loro precisione stimata sia, in sostanza, attenzione, e che il processo di dedicare attenzione possa essere neurobiologicamente compiuto da sistemi di attivazione reticolare ascendente (ARAS) che ottimizzano il "guadagno" di previsione unità di errore.
Inferenza attiva
Lo stesso principio di minimizzazione dell'errore di previsione è stato utilizzato per fornire un resoconto del comportamento in cui le azioni motorie non sono comandi ma previsioni propriocettive discendenti. In questo schema di inferenza attiva , gli archi riflessi classici sono coordinati in modo da campionare selettivamente l'input sensoriale in modi che soddisfano meglio le previsioni, riducendo così al minimo gli errori di previsione propriocettiva. Infatti, Adams et al. (2013) esaminano le prove che suggeriscono che questa visione della codifica predittiva gerarchica nel sistema motorio fornisce un quadro di principio e neuralmente plausibile per spiegare l'organizzazione agranulare della corteccia motoria. Questo punto di vista suggerisce che “i sistemi percettivo e motorio non dovrebbero essere considerati separati ma invece come un'unica macchina di inferenza attiva che cerca di prevedere il suo input sensoriale in tutti i domini: visivo, uditivo, somatosensoriale, interocettivo e, nel caso del sistema motorio , propriocettivo."
Teoria neurale nella codifica predittiva
Valutare l'evidenza empirica che suggerisce una base neurologicamente plausibile per la codifica predittiva è un compito ampio e vario. Per prima cosa, e secondo il modello, la codifica predittiva si verifica in ogni fase iterativa dei processi percettivi e cognitivi; di conseguenza, le manifestazioni della codifica predittiva nel cervello includono la genetica, la citoarchitettura specifica delle cellule, le reti sistemiche di neuroni e le analisi dell'intero cervello. A causa di questa gamma di specificità, sono stati applicati diversi metodi di indagine dei meccanismi neurali della codifica predittiva, ove disponibili; più in generale, tuttavia, e almeno per quanto riguarda gli esseri umani, ci sono limitazioni metodologiche significative nell'investigare le potenziali prove e gran parte del lavoro si basa sulla modellazione computazionale dei microcircuiti nel cervello. Nonostante ciò, c'è stato un lavoro sostanziale (teorico) che è stato applicato alla comprensione dei meccanismi di codifica predittiva nel cervello. Questa sezione si concentrerà su prove specifiche in relazione al fenomeno della codifica predittiva, piuttosto che analoghi, come l'omeostasi (che sono, tuttavia, parte integrante della nostra comprensione generale dell'inferenza bayesiana ma già ampiamente supportate; vedi Clark per una recensione).
Gran parte dei primi lavori che applicavano una struttura di codifica predittiva ai meccanismi neurali proveniva dai neuroni sensoriali, in particolare nella corteccia visiva.
Più in generale, tuttavia, ciò che sembra essere richiesto dalla teoria sono (almeno) due tipi di neuroni (ad ogni livello della gerarchia percettiva): un insieme di neuroni che codificano l'input sensoriale in ingresso, le cosiddette proiezioni feed-forward; un insieme di neuroni che inviano previsioni, le cosiddette proiezioni feed-backward. È importante notare che questi neuroni devono avere anche proprietà di rilevamento degli errori; quale classe di neuroni abbia queste proprietà è ancora oggetto di dibattito. Questo tipo di neuroni ha trovato supporto nei neuroni piramidali superficiali e non superficiali.
A un livello più intero del cervello, ci sono prove che diversi strati corticali (noti anche come lamine) possono facilitare l'integrazione di proiezioni feedforward e feed-backward attraverso le gerarchie. Questi strati corticali, suddivisi in granulare, agranulare e disgranulare, che ospitano le sottopopolazioni di neuroni sopra menzionate, sono suddivisi in 6 strati principali. La citoarchitettura all'interno di questi strati è la stessa, ma differisce tra gli strati. Ad esempio, lo strato 4 della corteccia granulare contiene cellule granulari che sono eccitatorie e distribuiscono input talamocorticali al resto della corteccia. Secondo un modello:
“...i neuroni di predizione... negli strati profondi della corteccia agranulare guidano l'inferenza attiva inviando previsioni sensoriali tramite proiezioni...a strati sopragranulari di cortecce sensoriali disgranulari e granulari. I neuroni di errore di previsione ... negli strati sopragranulari della corteccia granulare calcolano la differenza tra il segnale sensoriale previsto e ricevuto e inviano segnali di errore di previsione tramite proiezioni ... indietro agli strati profondi delle regioni corticali agranulari. Le celle di precisione... sintonizzano dinamicamente il guadagno sulle previsioni e sull'errore di previsione, dando così a questi segnali un peso ridotto (o, in alcuni casi, maggiore) a seconda della fiducia relativa nelle previsioni discendenti o dell'affidabilità dei segnali sensoriali in arrivo.
Insomma, l'evidenza neurale è ancora agli inizi.
Applicazione della codifica predittiva
Percezione
L'evidenza empirica per la codifica predittiva è più robusta per l'elaborazione percettiva. Già nel 1999, Rao e Ballard hanno proposto un modello gerarchico di elaborazione visiva in cui l'area corticale visiva di ordine superiore invia previsioni e le connessioni feedforward portano gli errori residui tra le previsioni e le attività effettive di livello inferiore. Secondo questo modello, ogni livello nella rete del modello gerarchico (tranne il livello più basso, che rappresenta l'immagine) tenta di prevedere le risposte al livello inferiore successivo tramite connessioni di feedback e il segnale di errore viene utilizzato per correggere la stima dell'input segnale ad ogni livello contemporaneamente. Emberson et al. ha stabilito la modulazione top-down nei bambini utilizzando un paradigma di omissione audiovisiva cross-modale, determinando che anche i cervelli dei bambini hanno aspettative su futuri input sensoriali che vengono trasportati a valle dalle cortecce visive e sono in grado di feedback basati sulle aspettative. I dati della spettroscopia funzionale nel vicino infrarosso (fNIRS) hanno mostrato che la corteccia occipitale infantile ha risposto a un'omissione visiva inaspettata (senza input di informazioni visive) ma non all'omissione visiva prevista. Questi risultati stabiliscono che in un sistema di percezione organizzato gerarchicamente, i neuroni di ordine superiore inviano previsioni ai neuroni di ordine inferiore, che a loro volta rimandano il segnale di errore di previsione.
interocezione
Ci sono stati diversi modelli in competizione per il ruolo della codifica predittiva nell'interocezione .
Nel 2013, Anil Seth ha proposto che i nostri stati emotivi soggettivi, altrimenti noti come emozioni, siano generati da modelli predittivi che sono attivamente costruiti a partire da valutazioni interocettive causali. In relazione al modo in cui attribuiamo gli stati interni degli altri alle cause, Sasha Ondobaka, James Kilner e Karl Friston (2015) hanno proposto che il principio dell'energia libera richiede che il cervello produca una serie continua di previsioni con l'obiettivo di ridurre la quantità di previsione errore che si manifesta come “energia libera”. Questi errori vengono quindi utilizzati per modellare le informazioni anticipatrici su quale sarà lo stato del mondo esterno e le attribuzioni delle cause di quello stato mondiale, inclusa la comprensione delle cause del comportamento degli altri. Ciò è particolarmente necessario perché, per creare queste attribuzioni, i nostri sistemi sensoriali multimodali hanno bisogno di previsioni interocettive per organizzarsi. Pertanto, Ondobaka postula che la codifica predittiva è la chiave per comprendere gli stati interni delle altre persone.
Nel 2015, Lisa Feldman Barrett e W. Kyle Simmons (2015) hanno proposto il modello Embodied Predictive Interoception Coding, un framework che unifica i principi di inferenza attiva bayesiana con un framework fisiologico di connessioni corticocorticali. Utilizzando questo modello, hanno ipotizzato che le cortecce visceromotorie agranulari siano responsabili della generazione di previsioni sull'interocezione, definendo così l'esperienza dell'interocezione.
Nel 2017, contrariamente alla nozione induttiva secondo cui le categorie di emozioni sono biologicamente distinte, Barrett (2017) ha proposto la teoria dell'emozione costruita, che è il racconto che una categoria di emozione biologica è costruita sulla base di una categoria concettuale: l'accumulo di istanze che condividono un obiettivo . In un modello di codifica predittiva, Barrett ipotizza che, nell'interocezione, il nostro cervello regoli i nostri corpi attivando "simulazioni incarnate" (rappresentazioni corporee dell'esperienza sensoriale) per anticipare ciò che il nostro cervello prevede che il mondo esterno ci proietterà sensorialmente e come risponderemo con l'azione. Queste simulazioni o vengono conservate se, in base alle previsioni del nostro cervello, ci preparano bene a ciò che effettivamente successivamente accade nel mondo esterno, oppure esse, e le nostre previsioni, vengono regolate per compensare il loro errore rispetto a ciò che effettivamente accade nel mondo esterno. mondo e quanto eravamo preparati per questo. Quindi, in un processo di prova-errore-regolazione, i nostri corpi trovano somiglianze negli obiettivi tra alcune simulazioni anticipatrici di successo e li raggruppano sotto categorie concettuali. Ogni volta che si presenta una nuova esperienza, i nostri cervelli usano questa cronologia di aggiustamenti per tentativi-errori passati per abbinare la nuova esperienza a una delle categorie di simulazioni corrette accumulate con cui condivide la maggiore somiglianza. Quindi, applicano la simulazione corretta di quella categoria alla nuova esperienza nella speranza di preparare i nostri corpi per il resto dell'esperienza. In caso contrario, la previsione, la simulazione e forse i confini della categoria concettuale vengono rivisti nella speranza di una maggiore precisione la prossima volta e il processo continua. Barrett ipotizza che, quando l'errore di previsione per una certa categoria di simulazioni per esperienze di tipo x è ridotto al minimo, ciò che risulta è una simulazione informata sulla correzione che il corpo rievoca per ogni esperienza simile a x, risultando in una corposa e piena di informazioni sulla correzione. rappresentazione dell'esperienza sensoriale: un'emozione. In questo senso, Barrett propone di costruire le nostre emozioni perché la struttura di categorie concettuali che il nostro cervello usa per confrontare nuove esperienze e per scegliere la simulazione sensoriale predittiva appropriata da attivare, è costruita in movimento.
Sfide
Come teoria meccanicistica, la codifica predittiva non è stata mappata fisiologicamente a livello neuronale. Una delle maggiori sfide alla teoria è stata l'imprecisione di come funziona esattamente la minimizzazione dell'errore di previsione. In alcuni studi l'aumento del segnale BOLD è stato interpretato come segnale di errore mentre in altri indica cambiamenti nella rappresentazione in ingresso. Una domanda cruciale che deve essere affrontata è che cosa costituisce esattamente il segnale di errore e come viene calcolato a ciascun livello di elaborazione delle informazioni. Un'altra sfida che è stata posta è la trattabilità computazionale della codifica predittiva. Secondo Kwistout e van Rooij, la sottocomputazione in ogni livello del framework di codifica predittiva nasconde potenzialmente un problema computazionalmente intrattabile, che equivale a "ostacoli intrattabili" che i modellisti computazionali devono ancora superare. Ransom e Fazelpour (2015) indicano "Tre problemi per la teoria della codifica predittiva dell'attenzione".
La ricerca futura potrebbe concentrarsi sul chiarimento del meccanismo neurofisiologico e del modello computazionale della codifica predittiva.
Guarda anche
- Progetto Cervello Blu
- Biologia cognitiva
- Linguistica cognitiva
- Neuropsicologia cognitiva
- Neuroscienza cognitiva
- Scienza cognitiva
- Fusione concettuale
- Metafora concettuale
- Linguaggio bilingue incarnato
- Scienze cognitive incarnate
- Cognizione incorporata incarnata
- Cognizione musicale incarnata
- Enattivismo
- cognizione estesa
- Tesi della mente estesa
- Esternalismo
- Schema immagine
- Il paradosso di Moravec
- Neurocostruttivismo
- neuropsicologia
- Neurofenomenologia
- Filosofia della mente
- cognizione vegetale
- Practopoiesi
- cognizione situata
- Da dove viene la matematica?
Riferimenti
- ^ McClelland, JL & Rumelhart, DE (1981). "Un modello di attivazione interattivo degli effetti di contesto nella percezione della lettera: I. Un resoconto dei risultati di base". Revisione psicologica . 88 (5): 375–407. doi : 10.1037/0033-295X.88.5.375 .
- ^ a b c d Rajesh PN Rao & Dana H. Ballard. (1999). Codifica predittiva nella corteccia visiva: un'interpretazione funzionale di alcuni effetti di campo recettivo extra-classico. Nature Neuroscience 2, 79 - 87. doi : 10.1038/4580
- ^ Hinton, GE (2007). Imparare più livelli di rappresentazione. Tendenze nelle scienze cognitive, 11(10), 428-434. doi : 10.1016/j.tics.2007.09.004
- ^ a b Clark, A. (2013). Quale sarà il prossimo? Cervelli predittivi, agenti situati e il futuro della scienza cognitiva. Scienze comportamentali e cerebrali, 36(03), 181-204.
- ^ Kaaronen, RO (2018). "Una teoria della dissonanza predittiva: l'elaborazione predittiva presenta una nuova interpretazione della dissonanza cognitiva" . Frontiere in psicologia . 9 : 2218. doi : 10.3389/fpsyg.2018.02218 . PMC 6262368 . PMID 30524333 .
- ^ Feldman, H., & Friston, K. (2010). Attenzione, incertezza ed energia libera. Frontiere nelle neuroscienze umane, 4, 215.
- ^ Howwy, J. (2012). Attenzione e percezione cosciente nell'ipotesi che testa il cervello. Attenzione e coscienza in diversi sensi, 74.
- ^ a b Friston, K. (2009). Il principio dell'energia libera: una guida approssimativa al cervello?. Tendenze nelle scienze cognitive, 13(7), 293-301.
- ^ a b Adams, RA, Shipp, S., & Friston, KJ (2013). Previsioni non comandi: inferenza attiva nel sistema motorio. Struttura e funzione del cervello, 218 (3), 611-643.
- ^ Bolz, J., & Gilbert, CD (1986). Generazione di fine-inibizione nella corteccia visiva tramite connessioni interlaminari.
- ^ Koster-Hale, Jorie; Sax, Rebecca (2013-09-04). "Teoria della mente: un problema di previsione neurale" . Neurone . 79 (5): 836-848. doi : 10.1016/j.neuron.2013.08.020 . ISSN 0896-6273 . PMC 4041537 . PMID 24012000 .
- ^ a b Seth, AK (2013). Inferenza interocettiva, emozione e sé incarnato. Tendenze nelle scienze cognitive, 17(11), 565-573. doi : 10.1016/j.tics.2013.09.007
- ^ Barrett, LF, & Simmons, WK (2015). Previsioni interocettive nel cervello. Recensioni sulla natura Neuroscienze, 16 (7), 419-429. doi : 10.1038/nrn3950
- ^ Emberson, LL, Richards, JE e Aslin, RN (2015). Modulazione top-down nel cervello infantile: le aspettative indotte dall'apprendimento influenzano rapidamente la corteccia sensoriale a 6 mesi. Atti della National Academy of Sciences degli Stati Uniti d'America, 112(31), 9585-9590. doi : 10.1073/pnas.1510343112
- ^ Ondobaka, S., Kilner, J., & Friston, K. (2017). Il ruolo dell'inferenza interocettiva nella teoria della mente. Cervello e cognizione, 112, 64-68. doi : 10.1016/j.bandc.2015.08.002
- ^ Barrett, LF (2017). La teoria dell'emozione costruita: un resoconto di inferenza attiva dell'interocezione e della categorizzazione. Neuroscienze cognitive e affettive sociali, 12 (1), 1-23. doi : 10.1093/scan/nsw154
- ^ Barrett, LF (2017). Come nascono le emozioni: la vita segreta del cervello. New York: Houghton Mifflin Harcourt. ISBN 0544133315
- ^ a b Kogo, N., & Trengove, C. (2015). La teoria della codifica predittiva è abbastanza articolata da essere testabile? Frontiere nelle neuroscienze computazionali, 9, 111. doi : 10.3389/fncom.2015.00111
- ^ Bastos, AM, Usrey, WM, Adams, RA, Mangun, GR, Fries, P., & Friston, KJ (2012). Microcircuiti canonici per la codifica predittiva. Neurone 76, 695-711.
- ^ Kwistout, J., van Rooij, I. (2019). Richieste di risorse computazionali di un cervello bayesiano predittivo. Comportamento cerebrale computazionale. doi : 10.1007/s42113-019-00032-3
- ^ Ransom M. & Fazelpour S (2015). Tre problemi per la teoria della codifica predittiva dell'attenzione. http://mindsonline.philosophyofbrains.com/2015/session4/three-problems-for-the-predictive-coding-theory-of-attention/