Processamento de frases - Sentence processing

O processamento da frase ocorre sempre que um leitor ou ouvinte processa uma expressão verbal, seja isoladamente ou no contexto de uma conversa ou de um texto. Muitos estudos do processo de compreensão da linguagem humana têm se concentrado na leitura de enunciados únicos (sentenças) sem contexto. Uma extensa pesquisa mostrou que a compreensão da linguagem é afetada pelo contexto que antecede uma dada expressão, bem como por muitos outros fatores.

Ambiguidade

A compreensão de frases tem que lidar com a ambigüidade em enunciados falados e escritos, por exemplo , ambiguidades lexicais , estruturais e semânticas . A ambigüidade é onipresente, mas as pessoas geralmente a resolvem tão facilmente que nem percebem. Por exemplo, a frase O tempo voa como uma flecha tem (pelo menos) as interpretações O tempo se move tão rapidamente quanto uma flecha , Um tipo especial de mosca, chamado tempo voa, gosta de flechas e Meça a velocidade das moscas como se medisse a velocidade de uma flecha . Normalmente, os leitores estarão cientes apenas da primeira interpretação. No entanto, leitores instruídos pensam espontaneamente na seta do tempo, mas inibem essa interpretação porque ela se desvia da frase original e o lobo temporal atua como um interruptor.

As instâncias de ambigüidade podem ser classificadas como ambigüidades locais ou globais . Uma frase é globalmente ambígua se tiver duas interpretações distintas. Exemplos disso são sentenças como Alguém atirou no criado da atriz que estava na varanda (era o criado ou a atriz que estava na varanda?) Ou O policial perseguiu o criminoso com um carro rápido (o policial ou o criminoso tinha um carro rápido?). Os abrangentes podem ter uma interpretação preferencial para qualquer um desses casos, mas sintaticamente e semanticamente, nenhuma das interpretações possíveis pode ser descartada.

Ambigüidades locais persistem apenas por um curto período de tempo quando um enunciado é ouvido ou escrito e são resolvidas durante o curso do enunciado, de modo que o enunciado completo tem apenas uma interpretação. Os exemplos incluem frases como O crítico escreveu o livro foi esclarecedor , o que é ambíguo quando O crítico escreveu o livro foi encontrado, mas era esclarecedor ainda precisa ser processado. Em seguida, a frase poderia terminar, afirmando que o crítico é o autor do livro, ou poderia continuar esclarecendo que o crítico escreveu algo sobre um livro. A ambigüidade termina em foi esclarecedora , o que determina que a segunda alternativa está correta.

Quando os leitores processam uma ambigüidade local, eles se decidem por uma das interpretações possíveis imediatamente, sem esperar para ouvir ou ler mais palavras que possam ajudar a decidir qual interpretação é a correta (o comportamento é chamado de processamento incremental ). Se os leitores ficarem surpresos com a direção que a frase realmente toma, o processamento é lento e é visível, por exemplo, durante a leitura. Sentenças localmente ambíguas têm, portanto, sido usadas como casos de teste para investigar a influência de vários fatores diferentes no processamento de sentenças humanas. Se um fator ajuda os leitores a evitar dificuldades, é claro que o fator desempenha um fator importante no processamento da frase.

Teorias

A pesquisa experimental gerou um grande número de hipóteses sobre a arquitetura e os mecanismos de compreensão de frases. Questões como modularidade versus processamento interativo e computação serial versus paralela de análises têm sido divisões teóricas no campo.

Problemas arquitetônicos

Modular vs. interativo

Uma visão modular do processamento da frase assume que cada fator envolvido no processamento da frase é computado em seu próprio módulo, que tem meios de comunicação limitados com os outros módulos. Por exemplo, a criação da análise sintática ocorre sem entrada da análise semântica ou informações dependentes do contexto, que são processadas separadamente. Uma suposição comum de contas modulares é uma arquitetura de feed-forward em que a saída de uma etapa de processamento é passada para a próxima etapa sem mecanismos de feedback que permitiriam a saída do primeiro módulo a ser corrigida. O processamento sintático geralmente é considerado a etapa de análise mais básica, que alimenta o processamento semântico e a inclusão de outras informações. Um módulo mental separado analisa as sentenças e o acesso lexical ocorre primeiro. Então, uma hipótese sintática é considerada por vez. Não há influência inicial de significado ou semântica. O processamento de frases é suportado por uma rede temporo-frontal. Dentro da rede, as regiões temporais atendem a aspectos de identificação e as regiões frontais à construção de relações sintáticas e semânticas. As análises temporais da ativação do cérebro dentro desta rede suportam modelos de sintaxe primeiro porque revelam que a construção da estrutura sintática precede os processos semânticos e que estes interagem apenas durante um estágio posterior.

As contas interativas presumem que todas as informações disponíveis são processadas ao mesmo tempo e podem influenciar imediatamente o cálculo da análise final. No modelo interativo de processamento de frases, não há módulo separado para análise. Acesso léxico, atribuição de estrutura sintática e atribuição de significado acontecem ao mesmo tempo em paralelo. Várias hipóteses sintáticas podem ser consideradas ao mesmo tempo. O modelo interativo demonstra uma interação on-line entre os níveis estrutural, lexical e fonético de processamento de sentenças. Cada palavra, à medida que é ouvida no contexto do discurso normal, é imediatamente inserida no sistema de processamento em todos os níveis de descrição e é simultaneamente analisada em todos esses níveis à luz de qualquer informação disponível em cada nível naquele ponto em o processamento da sentença. Modelos interativos de processamento de linguagem pressupõem que a informação flui tanto de baixo para cima quanto de cima para baixo, de modo que as representações formadas em cada nível podem ser influenciadas por níveis superiores e inferiores. Uma estrutura chamada estrutura de ativação interativa que incorpora essa suposição-chave entre outras, incluindo a suposição de que as influências de diferentes fontes são combinadas de forma não linear. A não linearidade significa que as informações que podem ser decisivas em algumas circunstâncias podem ter pouco ou nenhum efeito em outras condições. Na estrutura de ativação interativa, o conhecimento que orienta o processamento é armazenado nas conexões entre unidades no mesmo nível e em níveis adjacentes. As unidades de processamento que elas conectam podem receber entrada de uma série de fontes diferentes, o que permite que o conhecimento que orienta o processamento seja completamente local, enquanto, ao mesmo tempo, permite que os resultados do processamento em um nível influenciem o processamento em outros níveis, ambos acima e abaixo. Uma suposição básica da estrutura é que as interações de processamento são sempre recíprocas; é essa característica bidirecional que torna o sistema interativo. As interações excitatórias bidirecionais entre os níveis permitem a restrição simultânea mútua entre os níveis adjacentes, e as interações inibitórias bidirecionais dentro de um nível permitem a competição entre interpretações mutuamente incompatíveis de uma parte de uma entrada. As interações excitatórias entre os níveis são capturadas nos modelos em conexões excitatórias bidirecionais entre unidades de processamento mutuamente compatíveis. Ambigüidades sintáticas são de fato baseadas no nível lexical. Além disso, estudos mais recentes com máquinas de rastreamento ocular mais sensíveis mostraram efeitos de contexto iniciais. A frequência e a informação contextual irão modular a ativação de alternativas mesmo quando elas são resolvidas em favor da interpretação simples. A simplicidade estrutural é cofundada com frequência, o que vai contra a teoria do caminho do jardim

Serial vs. paralelo

Relatos em série presumem que os humanos constroem apenas uma das interpretações possíveis no início e tentam outra apenas se a primeira se revelar errada. Relatos paralelos pressupõem a construção de múltiplas interpretações ao mesmo tempo. Para explicar por que os compreensores geralmente estão cientes de apenas uma análise possível do que ouvem, os modelos podem presumir que todas as análises são classificadas e a que está com a classificação mais alta é considerada.

Modelos

Existem vários modelos influentes de processamento de frases humanas que se baseiam em diferentes combinações de escolhas arquitetônicas.

Modelo de caminho de jardim

O modelo de caminho de jardim ( Frazier 1987 ) é um modelo de análise modular serial. Ele propõe que uma única análise seja construída por um módulo sintático. Fatores contextuais e semânticos influenciam o processamento em um estágio posterior e podem induzir a reanálise da análise sintática. A reanálise é cara e leva a uma desaceleração perceptível na leitura. Quando o analisador encontra uma ambigüidade, ele é guiado por dois princípios: fechamento tardio e fixação mínima. O modelo foi apoiado por pesquisas sobre a negatividade anterior esquerda inicial , um potencial relacionado a eventos frequentemente eliciado como uma resposta a violações de estrutura de frase .

O fechamento tardio faz com que novas palavras ou frases sejam anexadas à cláusula atual. Por exemplo, "John disse que iria embora ontem" seria analisado como John disse (ele iria embora ontem) , e não como John disse (ele iria embora) ontem (ou seja, ele falou ontem).

O anexo mínimo é uma estratégia de parcimônia: o analisador constrói a estrutura sintática mais simples possível (ou seja, aquela com o menor número de nós frasais).

Modelo baseado em restrições

As teorias de compreensão da linguagem baseadas em restrições enfatizam como as pessoas fazem uso da vasta quantidade de informações probabilísticas disponíveis no sinal linguístico. Por meio do aprendizado estatístico , as frequências e distribuição de eventos em ambientes linguísticos podem ser escolhidas, o que informa a compreensão da linguagem. Como tal, diz-se que os usuários da linguagem chegam a uma interpretação particular em detrimento de outra durante a compreensão de uma frase ambígua, integrando rapidamente essas restrições probabilísticas.

Teoria boa o suficiente

A abordagem boa o suficiente para a compreensão da linguagem, desenvolvida por Fernanda Ferreira e outros, pressupõe que os ouvintes nem sempre se envolvem no processamento completo e detalhado da entrada linguística. Em vez disso, o sistema tende a desenvolver representações superficiais e superficiais quando confrontado com alguma dificuldade. A teoria adota uma abordagem que de certa forma combina o modelo de caminho do jardim e o modelo baseado em restrições. A teoria se concentra em duas questões principais. A primeira é que as representações formadas a partir de materiais complexos ou difíceis são freqüentemente superficiais e incompletas. A segunda é que fontes de informação limitadas são freqüentemente consultadas nos casos em que o sistema de compreensão encontra dificuldade. A teoria pode ser posta à prova usando vários experimentos em psicolinguística que envolvem má interpretação de caminhos de jardim, etc.

Métodos

Tarefas comportamentais

Em estudos comportamentais, os sujeitos são frequentemente apresentados a estímulos linguísticos e solicitados a realizar uma ação. Por exemplo, eles podem ser solicitados a fazer um julgamento sobre uma palavra ( decisão lexical ), reproduzir o estímulo ou nomear uma palavra apresentada visualmente em voz alta. Velocidade (geralmente tempo de reação: tempo gasto para responder ao estímulo) e precisão (proporção de respostas corretas) são medidas comumente empregadas de desempenho em tarefas comportamentais. Os pesquisadores inferem que a natureza do (s) processo (s) subjacente (s) exigidos pela tarefa dá origem a diferenças; taxas mais lentas e menor precisão nessas tarefas são tomadas como medidas de maior dificuldade. Um componente importante de qualquer tarefa comportamental é que ela permanece relativamente fiel à compreensão "normal" da linguagem - a capacidade de generalizar os resultados de qualquer tarefa é restrita quando a tarefa tem pouco em comum com a forma como as pessoas realmente encontram a linguagem.

Um paradigma comportamental comum envolve efeitos de priming , em que os participantes são apresentados primeiro a um prime e, em seguida, a uma palavra-alvo. O tempo de resposta para a palavra de destino é afetado pela relação entre o primo e o destino. Por exemplo, Fischler (1977) investigou a codificação de palavras usando a tarefa de decisão lexical. Ela pediu aos participantes que decidissem se duas sequências de letras eram palavras em inglês. Às vezes, as cadeias de caracteres seriam palavras reais em inglês que exigiam uma resposta "sim" e, outras vezes, não seriam palavras que exigissem uma resposta "não". Um subconjunto de palavras lícitas foi relacionado semanticamente (por exemplo, cão-gato), enquanto outros não foram relacionados (por exemplo, bread-stem). Fischler descobriu que os pares de palavras relacionadas eram respondidos mais rapidamente quando comparados aos pares de palavras não relacionadas, o que sugere que a relação semântica pode facilitar a codificação de palavras.

Movimentos oculares

O rastreamento ocular tem sido usado para estudar o processamento de linguagem online. Este método tem sido influente em informar o conhecimento da leitura. Além disso, Tanenhaus et al. (1995) estabeleceram o paradigma do mundo visual, que aproveita os movimentos dos olhos para estudar o processamento da linguagem falada online. Esta área de pesquisa capitaliza a hipótese de vinculação de que os movimentos dos olhos estão intimamente ligados ao foco atual de atenção.

Neuroimagem e potenciais evocados

O surgimento de técnicas não invasivas oferece inúmeras oportunidades para examinar as bases cerebrais da compreensão da linguagem. Exemplos comuns incluem tomografia por emissão de pósitrons (PET), imagem por ressonância magnética funcional (fMRI), potenciais relacionados a eventos (ERPs) em eletroencefalografia (EEG) e magnetoencefalografia (MEG) e estimulação magnética transcraniana (TMS). Essas técnicas variam em suas resoluções espaciais e temporais (fMRI tem uma resolução de alguns milhares de neurônios por pixel, e ERP tem precisão de milissegundos), e cada tipo de metodologia apresenta um conjunto de vantagens e desvantagens para estudar um determinado problema de compreensão da linguagem.

Modelagem computacional

A modelagem computacional é outro meio de explorar a compreensão da linguagem. Modelos, como aqueles instanciados em redes neurais , são particularmente úteis porque requerem que os teóricos sejam explícitos em suas hipóteses e porque podem ser usados ​​para gerar previsões precisas para modelos teóricos que são tão complexos que tornam a análise discursiva não confiável. Um exemplo clássico de modelagem computacional em pesquisa de linguagem é o modelo TRACE de percepção de fala de McClelland e Elman . Um modelo de processamento de sentenças pode ser encontrado no analisador 'racional' Generalized Left Corner de Hale (2011). Este modelo deriva efeitos do caminho do jardim, bem como fenômenos de coerência local. A modelagem computacional também pode ajudar a relacionar o processamento de frases a outras funções da linguagem. Por exemplo, um modelo de efeitos ERP no processamento de frases (por exemplo, N400 e P600) argumenta que esses fenômenos surgem de processos de aprendizagem que apoiam a aquisição da linguagem e a adaptação linguística.

Veja também

Notas

Referências

Leitura adicional

  • Carroll, David, The Psychology of Language (Wadsworth Publishing, 2003))