D E M O C R A T O P I A

Comprensión del discurso

VERSIÓN 1.0

INTRODUCCIÓN

El discurso consiste en un conjunto de oraciones que mantienen una unidad de sentido o coherencia. El lector u oyente del discurso debe combinar el significado de múltiples oraciones, establecer la coherencia entre ellas, extraer las ideas principales o realizar inferencias aplicando su conocimiento del mundo y, todo ello se realiza de forma inmediata a medida que se procesan las palabras del discurso, es decir, «en línea».

Discurso oral y discurso escrito

El discurso es una forma natural del lenguaje que se produce tanto en el habla como en la escritura. Cuando alguien cuenta un relato, describe un episodio de su vida, comenta una noticia, da una charla en público, explica un argumento, etc., todas ellas son formas de discurso oral. Los ejemplos mencionados son formas de monólogo, pero incluso la conversación informal entre dos o más interlocutores es también discurso oral. En la conversación, los interlocutores se intercambian oraciones, pero no azarosamente sino que deben mantener cierta coherencia discursiva para que la comunicación sea posible. La conversación es un complejo ejercicio cognitivo, ya que los interlocutores deben alternar los procesos de comprensión y de producción del habla y, además, tener en cuenta lo que dice el otro, todo ello en línea y con poco tiempo para planificar.

Por su parte, el discurso escrito o texto tiene, generalmente, un carácter más formal y cuidado que el discurso oral. En el discurso escrito el lector no dispone de información contextual directa, mientras que el oyente suele compartir situación con quien produce el discurso.

Textos narrativos y textos expositivos

Los psicólogos del lenguaje suelen hacer una distinción gruesa entre textos narrativos y textos expositivos, que corresponden a dos formas típicas del pensamiento y de la comunicación humana.

Textos narrativosTextos expositivos
DescripciónSituaciones y episodios.Ideas. argumentos, demostraciones, datos, etc.
ContenidosPersonales: personajes, acciones, intenciones,
emociones, conflictos y relaciones.
Impersonales.
OrganizaciónEspacial, temporal, causal y motivacional.Conceptual o lógica.
FinalidadEntretener, emocionar, divertir, etc.Instruir, enseñar, informar, persuadir, etc.
Diferencias entre textos narrtivos y textos espositivos.

Los textos expositivos son productos culturales, generalmente asociados a la exposición de conocimientos técnicos, científicos o de otro tipo que suelen utilizarse como herramientas de aprendizaje. Este tipo de textos no es simplemente para «leer» sino para estudiar. Por este motivo, su investigación reviste especial interés para los pedagogos, los psicólogos educativos o los psicólogos instruccionales.

Los textos narrativos están próximos a la comunicación humana más básica, por ejemplo a los relatos orales o a las conversaciones. Las narraciones frecuentemente describen episodios que incluyen a personas que interactúan entre sí, tienen intenciones y metas, afrontan problemas u obstáculos, sienten emociones, etc. Además, la información tanto en los relatos orales como en los textos narrativos se organiza temporal, espacial y causalmente. Por estas razones, estudiar la comprensión de textos narrativos permite tener una visión bastante aproximada de los procesos de comprensión del discurso en general.

Métodos

¿Cómo investigar la comprensión de textos narrativos? Los investigadores suelen construir microtextos (a veces denominados humorísticamente «textoides»), en los que manipulan una o unas pocas variables para estudiar aspectos concretos de la comprensión. La mayoría de las investigaciones, en lugar de emplear (o además de ello) tareas de memoria realizadas a posteriori como hicieron Bransford y Johnson (1972), la mayoría tratan de capturar los procesos de comprensión sobre la marcha:

Bransford y Johnson (1972). Desarrollaron un experimento en el que algunos participantes recibían textos ambiguos como el del ejemplo, sin título alguno; a otros participantes se les proporcionaba el título antes de cada texto, y a otros, por último, se les daba el título después de haber leído cada texto. Los que recibieron el título juzgaron que habían comprendido mejor los textos que los que no recibieron el título. Más importante: los que conocían el título antes de cada historia recordaron significativamente más contenidos, en una prueba de memoria, que los que no lo conocían y que aquellos que lo recibieron después de la historia. En suma, este estudio demuestra con una manipulación muy sencilla (presencia/ ausencia de título) aplicada a microtextos artificiales, que la comprensión del discurso va más allá del procesamiento de las palabras y de las oraciones individuales: requiere que el lector sea capaz de entender el sentido general del texto, es decir, debe ser capaz de construir modelos de situación apropiados.

«La orilla del mar es mejor sitio que una calle. Al principio es mejor correr que caminar. Puede que tengas que intentarlo varias veces. Requiere bastante habilidad, pero es fácil de aprender. Incluso los niños pueden disfrutar con ello. Si tienes éxito, las complicaciones son mínimas. Los pájaros rara vez se acercan. Con la lluvia, sin embargo, se empapa rápidamente. Si hay mucha gente haciendo lo mismo esto puede causar problemas. Uno necesita mucho espacio. Si no hay complicaciones, es una actividad agradable. Una piedra puede servir como anclaje. Sin embargo, si se suelta no tendrás una segunda oportunidad.»
  • Un procedimiento es analizar los tiempos de lectura de las palabras u otras unidades del texto (sintagmas, cláusulas), mediante el registro de los movimientos oculares o la técnica de ventana móvil. Los tiempos de lectura nos dan una panorámica del coste cognitivo en cada momento de la lectura; así, los ojos se fijan más tiempo en las palabras que requieren procesos más complejos; por ejemplo, cuando el lector se encuentra una palabra poco familiar, cuando resuelve el antecedente de una anáfora ambigua, cuando realiza una inferencia o cuando se encuentra una incongruencia con el contexto previo. También se dedica más tiempo a la última palabra de cada cláusula, oración o párrafo, indicando que el lector realiza operaciones adicionales de «empaquetado» de información al final de cada segmento gramatical. Finalmente, el lector puede volver los ojos atrás para releer porciones anteriores del texto, lo cual nos informa sobre las dificultades de comprensión en segmentos determinados del texto.
  • También se utilizan profusamente medidas de activación intercaladas durante la lectura de un texto o bien al final de éste. Entre ellas son destacables la identificación de palabras, la tarea de decisión léxica o el nombrado de una palabra en voz alta. En la tarea de identificación se presenta una palabra de prueba, que el lector debe juzgar si estaba o no presente en el texto recién leído. Los tiempos de respuesta y la precisión de la respuesta indican el grado de activación o accesibilidad en la memoria a corto plazo de esa palabra o del concepto relacionado, en función de las variables manipuladas en el texto. Si en la condición experimental A se producen respuestas más rápidas a la palabra de prueba y con menos errores que en la condición B, ello indica mayor activación del concepto correspondiente en A que en B.

FENÓMENOS EMERGENTES EN EL DISCURSO

En la psicología del lenguaje, el estudio del procesamiento de las palabras incluye cuestiones como la percepción del habla, el reconocimiento de las palabras, su estructura morfológica, etc. En el estudio de la oración emergen los fenómenos del procesamiento sintáctico y el papel de los marcadores de cohesión. Por último, en el estudio del discurso surgen los fenómenos de coherencia, las inferencias y los modelos de situación.

Coherencia

Tom Givón (1992). Asegura que la coherencia no está en el texto sino en la mente, es decir, que es el fruto de operaciones cognitivas.

La coherencia depende tanto de las características del texto (estructura, marcadores de cohesión) como de la actividad del lector. Una función importante de los marcadores de cohesión (las anáforas, conectores y etc.) es indicar al lector que las oraciones sucesivas del texto incluyen algún concepto mencionado previamente. Los marcadores de cohesión y la correferencia son importantes, pero, finalmente, es el lector quien debe construir la coherencia utilizando las pistas proporcionadas por el texto y su propio conocimiento del mundo.

A partir del mismo texto, un lector puede construir una representación coherente, bien integrada y completa, y otro lector, no. Suele distinguirse entre coherencia local y coherencia global.

  • Coherencia local. La establece el lector entre contenidos próximos en el texto, por ejemplo, entre cláusulas consecutivas, y está frecuentemente guiada por la presencia de marcadores de cohesión como anáforas y conectores. La coherencia local es también favorecida por el hecho de que los contenidos vinculados están coactivados en la memoria de trabajo.
  • Coherencia global. Cuando leemos un texto extenso debemos ser capaces de establecer vínculos temáticos entre contenidos muy separados, es decir, debemos construir la coherencia global.

Inferencias

Mckoon y Ratcliff (1992). Hipótesis minimalista sobre las inferencias. Según ellos, los lectores realizan muy pocas inferencias de forma automática y sólo si se cumplen algunas condiciones muy estrictas.
Umberto Eco (1994). «Todo texto es una máquina perezosa que le pide al lector que haga parte de su trabajo. Pobre del texto si dijera todo lo que el destinatario debe entender: no acabaría nunca».
Graesser, Singer y Trabasso (1994). Hipótesis construccionista, ofrece una visión más optimista de las inferencias. La teoría, basada en multitud de investigaciones, propone que los lectores de narraciones construyen en línea y de forma automática inferencias explicativas para interpretar los sucesos y acciones. Así, infieren las motivaciones de los personajes, sus metas e intenciones, sus emociones y las causas o consecuencias de los obstáculos tanto físicos como sociales.
Graesser, Wiemer-Hastings y Wiemer-Hastings (2001). Las inferencias de los lectores no son muy diferentes de las que realizamos mientras vemos una película u observamos situaciones de la vida real.

El término «inferencia» es un tanto vago en psicolingüística. Desde luego, no se trata de las inferencias deductivas que estudia la lógica, derivadas necesariamente de las relaciones formales entre ciertas premisas. Más bien se trata de recuperar contenidos de la memoria, basados en nuestros conocimientos semánticos y pragmáticos del mundo.

Si interrumpimos a un lector varias veces durante la lectura de una narración y le preguntamos qué va a pasar a continuación, cómo o por qué motivo, nos ofrecerá una amplia variedad de inferencias. Si le pedimos que lea y comente en voz alta todo lo que le venga a la cabeza, mostrará igualmente unas sorprendentes capacidades inferenciales. Estos datos son engañosos, pues responder a preguntas o pensar en voz alta son tareas en las que el lector dispone de mucho tiempo para generar inferencias. Por el contrario, la lectura habitual es un proceso continuo que se desarrolla a gran velocidad (unas 250-400 palabras por minuto) y el lector no tiene tiempo ni recursos suficientes para generar todas las inferencias potenciales.

Estas limitaciones temporales y cognitivas llevaron a Mckoon y Ratcliff a plantear una hipótesis minimalista sobre las inferencias. La hipótesis minimalista tuvo en su momento un gran impacto, pero parece improbable que la gente no realice al menos algunas inferencias globales; éstas parecen necesarias para comprender el argumento de una narración compleja. La hipótesis construccionista de Graesser, Singer y Trabasso (1994) ofrece una visión más optimista de las inferencias. Así, infieren las motivaciones de los personajes, sus metas e intenciones, sus emociones y las causas o consecuencias de los obstáculos tanto físicos como sociales. Las inferencias de los lectores no son muy diferentes de las que realizamos mientras vemos una película u observamos situaciones de la vida real. Graesser y cols. consideran que los lectores no infieren, al menos de forma sistemática o automática, los detalles visuales del entorno espacial, de los objetos o de los personajes, ni los procedimientos específicos de las acciones.

¿Qué tipos de inferencias existen y cuándo se producen? Suele distinguirse entre inferencias puente e inferencias elaborativas. Las inferencias puente son necesarias para establecer la coherencia local entre dos cláusulas consecutivas; por ejemplo, cuando leemos: «El sol empezó a calentar. El muñeco de nieve empezó a derretirse», es muy probable que establezcamos un puente causal «el calor del sol derritió el muñeco», pues en caso contrario no habría modo de integrar ambas frases de modo coherente. Las inferencias elaborativas, por su parte, no son necesarias para establecer la coherencia local, sino que serían una actividad en cierto modo superflua del lector. En el ejemplo: «Pedro está comiendo sopa en el vagón restaurante del tren; de pronto, cuando acercaba cuidadosamente la cuchara a la boca, el tren frenó bruscamente». En este caso, el lector se encuentra con un texto coherente en sí mismo; sin embargo es probable que construya la inferencia elaborativa «la sopa se derramó».

En relación con el curso temporal de las inferencias, también existen diversas propuestas. De modo general, suele hablarse de inferencias proactivas, que son las que ocurren de forma anticipada en el curso de la lectura, e inferencias retroactivas, que ocurren hacia atrás, con el fin de establecer la coherencia local entre las partes del texto que acabamos de leer. A grandes rasgos, las inferencias proactivas suelen ser de carácter elaborativo, mientras que las inferencias retroactivas son habitualmente inferencias puente.

Niveles de representación

Van Dijk y Kintsch (1983). Aun defendiendo la existencia de modelos de situación, no consideran que éstos sean corpóreos sino que utilizarían el mismo formato proposicional que el texto base.
Kintsch, Welsch, Schmalhofer y Zimni (1990). Su experimento indica que el modelo de situación retiene la información esencial de la narración a lo largo del tiempo, mientras que los otros niveles de representación son mucho más transitorios. Esto coincide con la intuición: cuando recordamos una narración tendemos a olvidar las oraciones concretas y hasta la organización conceptual del texto, pero recordamos las situaciones a las que se refiere la narración (personajes, conflictos, acciones, etc.)
Glenberg y Kaschak, 2002; Zwaan (2004). Consideran que los modelos de situación son representaciones corpóreas, de modo que retienen aspectos propios de nuestra interacción sensoriomotora con las situaciones.

Durante la comprensión del discurso el lector genera al menos tres niveles de representación:

  • La forma superficial, que es una representación exacta de las palabras, sintagmas y estructuras sintácticas del texto.
  • El texto base, que retiene los conceptos y las relaciones semánticas, con independencia de las palabras.
  • El modelo de situación, que representa la situación descrita y es totalmente independiente de la estructura del texto.
Ilustración de los niveles de representación para la oración «Jaime hojeó el periódico».

Una forma de disociar estos niveles de representación es observando su persistencia en la memoria. El experimento de Kintsch, Welsch, Schmalhofer y Zimni (1990) indica que el modelo de situación retiene la información esencial de la narración a lo largo del tiempo, mientras que los otros niveles de representación son mucho más transitorios. Esto coincide con la intuición: cuando recordamos una narración tendemos a olvidar las oraciones concretas y hasta la organización conceptual del texto, pero recordamos las situaciones a las que se refiere la narración (personajes, conflictos, acciones, etc.). Pero ¿qué son los modelos de situación? Son representaciones que guardan más parecido con una experiencia que con las características gramaticales o estructurales del propio texto. Algunas características de los modelos de situación:
Representaciones de lo singular. Los modelos de situación son representaciones de patrones de información singulares o únicos, a diferencia de los esquemas o guiones (scripts), que son conocimientos semánticos, de carácter genérico. Supongamos que un amigo al que conocemos muy bien nos dice: «Ayer fui con mis hijos al restaurante Tokio, que tú me recomendaste, y nos encontramos con mi antigua pareja». Esta es una descripción de un episodio concreto, con una ubicación espacio-temporal determinada, que implica a personas específicas y con determinados vínculos entre sí, con estados motivacionales, de meta, etc. El modelo de situación que construimos de ese episodio es muy diferente de nuestras representaciones esquemáticas de los «restaurantes», de las «relaciones familiares» o de «las relaciones de pareja» en abstracto. Un esquema, por ejemplo el del «restaurante», es una especie de promedio estadístico o prototipo que resulta de procesar multitud de situaciones análogas, pero no representa ninguna situación particular. Como tal esquema, incluye información genérica sobre los objetos prototípicos del restaurante (mesas, sillas, barra, menú, etc.), los roles (camarero, cliente, cocinero, etc.) o las acciones características (pedir el menú, elegir plato, etc.). En cambio, el modelo de situación que se construye al entender un fragmento de discurso como el anterior, es una representación de un estado particular de sucesos, que incluye combinaciones únicas de parámetros del tipo «quién dijo qué (a quién)», «quién sabe qué», «dónde está qué o quién», etcétera.

Cálculo de la persistencia temporal, basa­ da en índices de discriminabilidad, de la forma superfi­ cial del texto, del texto base y del modelo de situación. Kintsch, Welsch, Schmalhofer y Zimni (1990). En un experimento clásico, presentaron a los participantes textos como el siguiente:
«Era la tarde del sábado y Jaime y Melisa se aburrían, de modo que decidieron ir al cine. Jaime hojeó el periódico. Vio que tenían el tiempo justo para ir a la función de las nueve donde habían estrenado una comedia romántica. Y se fueron».
Tras leer textos como el anterior, los participantes realizaron una prueba de memoria de reconocimiento, recibiendo una de las siguientes oraciones con instrucciones de juzgar si había aparecido en la historia o no:
Jaime hojeó el periódico (oración idéntica) [a]
Jaime echó un vistazo al periódico (paráfrasis: mismo significado) [b]
Jaime miró la cartelera de cine (inferencia) [c]
Jaime leyó los editoriales (control) [d]
Algunos participantes recibieron la prueba de memoria inmediatamente después de leer los textos, mientras que otros la recibieron 40 minutos, 2 días o 4 días más tarde. La respuesta correcta es «sí» en [a] y «no» en los demás casos. Sin embargo, las falsas alarmas (respuesta «sí» donde debería ser «no») también proporcionan una información muy útil sobre los niveles de representación. La repuesta «sí» en [a] tiene relación con la representación superficial del texto, en la paráfrasis [b] se relaciona con el texto base, y en la inferencia [c] se relaciona con el modelo de situación. Calculando índices de discriminabilidad a partir de las respuestas «sí» en los tres tipos de oraciones, en contraste con las oraciones de control, los autores estimaron la fuerza del trazo de memoria correspondiente a los tres tipos de representación.
Como se aprecia en la figura, la forma superficial tiene una persistencia de apenas unos minutos, el texto base se va debilitando a lo largo de las sesiones, y el modelo de situación se mantiene estable incluso al cabo de 4 días. Tomado de Kintsch et al. (1990)

Representaciones dinámicas. Todas las representaciones semánticas son en alguna medida dinámicas. Así, el concepto «psicóloga» no es igual para una persona cuando tiene 10 años que cuando tiene 20 años y estudia psicología, y el esquema del «restaurante» se altera también a lo largo de nuestra vida, a medida que disponemos de más experiencias con restaurantes particulares. Los modelos de situación se actualizan o «ponen al día» en fracciones de segundo, al tiempo que se procesa la propia situación cambiante o, en el caso del discurso, mientras se leen nuevas oraciones que describen cambios significativos en la situación.

Isomorfismo. Los modelos de situación se parecen a nuestra experiencia, es decir, mantienen cierto isomorfismo con las propias situaciones representadas y se diferencian, en cambio, de la estructura del texto superficial (lineal, sintáctica) o del texto base. La representación de una descripción espacial, por ejemplo, incluiría la ubicación y los desplazamientos de los objetos y personajes que se mencionan, y la accesibilidad de los conceptos dependería de suposición dentro de la situación y no de lo reciente de su mención en el texto superficial o en el texto base.

Dimensiones básicas. El número de situaciones posibles y de sus cambios dinámicos es infinito. Consecuentemente, el número de modelos de situación y sus estados también debe ser infinito. Sin embargo, la composición interna de los modelos se reduce a la combinación de unas cuantas dimensiones básicas, que constituyen lo que podríamos denominar sus «ladrillos» epistemológicos.

Formato de la representación

RatclifT y McKoon (1978). Quizás el estudio más notable sobre la realidad psicológica de las proposiciones mediante una tarea de memoria. Los participantes estudiaban listas de oraciones como: «El mausoleo que consagró el zar domina la plaza». Esta oración incluye dos proposiciones: «dominar [mausoleo, plaza]» y «consagrar [mausoleo, zar]». Posteriormente, los individuos recibían pares de palabras pertenecientes a las oraciones, observándose una mayor facilitación semántica o priming entre palabras pertenecientes a la misma proposición (domina-mausoleo), que a diferentes proposiciones (domina-zar). En otros experimentos posteriores se comprobó, asimismo, que los sujetos que recibían «domina» como índice de recuerdo, recordaban más frecuentemente «plaza» que «zar».
Kintsch (1998). Las proposiciones son simplemente esquemas predicado-argumento que subyacen al texto superficial, con el formato general: predicado [argumento 1, argumento 2… argumento N]. Cada vez que comprendemos una oración, lo que haríamos sería traducirla al lenguaje mental de las proposiciones. Así, la oración: «María le dio un beso a Juan» podría ser codificada como «dar» [agente: María; receptor: Juan; objeto: beso], o más simple: «dar» [María, Juan, beso].
Kintsch (1998). Cuanto mayor es el número de proposiciones implícitas en las oraciones, mayor es el tiempo de lectura, con independencia del número de palabras.

Hay bastante consenso sobre la existencia de los tres niveles de representación del discurso que se han mencionado. Sin embargo, los investigadores están divididos en cuanto al formato en que se representa el significado. Mientras que unos apuestan por representaciones simbólicas como el formato universal del significado, otros consideran que las representaciones, especialmente en el nivel de modelos de situación, son corpóreas o sensoriomotoras.

Proposiciones (representaciones simbólicas). Una idea dominante entre los simbolistas es que toda la información del discurso se representa en forma de proposiciones. La noción de proposiciones, procedente originalmente de la lógica, dista mucho de ser unitaria entre los investigadores. La adecuación de las proposiciones a diferentes paráfrasis es una propiedad psicológicamente relevante. Indica que las proposiciones no se limitan a reproducir el texto mismo, sino que abstraen las relaciones conceptuales subyacentes. En otras palabras, reflejan las características del texto base y no las del texto superficial. Respecto al modelo de situación, la validez de las representaciones proposicionales está menos clara. El carácter formal de las proposiciones las hace especialmente aptas para desarrollar modelos computacionales de los procesos del lenguaje. Sin embargo, no está claro en qué medida las proposiciones tienen «realidad psicológica».

¿Son una mera convención formal del científico para representar la información? o bien ¿son el modo en que el cerebro realmente codifica la información? Los estudios empíricos sobre esta cuestión son escasos, aunque hay cierta evidencia favorable a la funcionalidad de las proposiciones elaboradas durante la comprensión del lenguaje. Quizás el estudio más notable sobre la realidad psicológica de las proposiciones fue desarrollado por RatclifT y McKoon (1978), al demostrar que la estructura del significado no es igual que la estructura del texto, pero no indican nada sobre la naturaleza de las unidades de significado que podrían ser proposiciones, pero también escenas visuales o simulaciones mentales.

Simulaciones corpóreas. Las teorías corpóreas del significado se ajustan muy bien a las características de los modelos de situación. Proponen que el lenguaje está anclado en el mundo. Es decir, que los mismos mecanismos perceptivos, motores y emocionales del cerebro empleados en la construcción de la experiencia real participan, en cierto grado, en el procesamiento del significado lingüístico. Según el enfoque corpóreo, el significado consiste en la simulación mental (o neuronal) de los objetos, eventos y situaciones a los que se refieren las palabras. Por ejemplo, si leemos «Juan rasgueó las cuerdas de la guitarra», se activarían fugazmente en nuestra mente simulaciones visuales, auditivas, motoras y hasta emocionales de la escena. Más aun, si se registrase nuestra actividad cerebral, podríamos esperar «resonancias» neuronales en las cortezas visual, auditiva y motora que se solaparían con las que están involucradas en la observación de alguien tocando la guitarra e, incluso, en la acción real de tocar la guitarra. Las teorías corpóreas del significado no están formalmente tan bien articuladas como las que se basan en proposiciones. Sin embargo tienen un considerable apoyo empírico, basado en experimentos tanto conductuales como neurológicos.

¿Cuál de estas propuestas -proposicional o corpórea- es más válida? Existen aproximaciones híbridas que postulan que las representaciones del significado utilizan formatos múltiples, tanto simbólicos como corpóreos. Sin embargo, no está tan claro que el enfoque proposicional y el enfoque corpóreo sean reconciliables, puesto que parten de supuestos que entran directamente en conflicto.

Fortalezas y debilidades de los planteamientos simbólicos y corpóreos:

  • Proposiciones y símbolos:
    • Fortalezas:
      • Son computables, se pueden construir modelos formales a partir de ellos.
      • Reflejan propiedades relevantes del signifi­cado: la distinción predicado-argumento, el carácter abstracto del texto base, la distin­ ción entre categoría y ejemplar (type-token), la correferencia, etc.
      • Son representaciones universales: pueden describir la organización de la memoria semántica, la información de oraciones y de textos complejos, los modelos de situación, los procesos de razonamiento, etc.
    • Debilidades:
      • No se anclan en la experiencia sensorio­ motora. En general, los símbolos se refieren a otros símbolos (significado intensional), pero no se conectan con el mundo (significado extensional).
      • Su apoyo empírico es débil. No se ha demostrado su realidad psicológica.
      • La fundamentación neurológica de los símbolos es también débil. No hay un «módulo» semántico en el cerebro inde pendiente de los procesos sensoriomotores (una excepción es la teoría del hub de Patterson et al. [2007]).
  • Simulaciones corpóreas:
    • Fortalezas:
      • Están biológicamente motivadas: los mecanismos cerebrales sensoriomotores se reu­tilizarían para procesar el significado, sin necesidad de un «módulo» semántico nuevo.
      • Tienen un fuerte apoyo empírico, basado en experimentos conductuales y neurológicos.
      • Existen modelos neurológicos bastante detallados sobre la conectividad funcional entre áreas lingüísticas y áreas sensoriomo­ toras que apoyan la corporeidad.
      • Permiten una conexión directa entre el sig­nificado lingüístico y el mundo real. El signi­ficado corpóreo prepara para la acción y ayuda a especificar la referencia.
    • Debilidades:
      • No está claro que las activaciones sensoriomotoras en el cerebro sean funciona­les. Podrían ser meros epifenómenos, independientes del verdadero significado.
      • Los procesos corpóreos no se han forma­lizado en una teoría computacional deta­llada. El planteamiento es demasiado empírico.
      • El lenguaje es, en gran medida, abs­tracto. El significado de palabras como «idea», «proceso» o «nunca» no tienen nada de sensoriomotor.

Conclusiones

Los fenómenos del discurso descritos en este apartado están estrechamente relacionados entre sí. La construcción de la coherencia del texto requiere realizar inferencias locales y globales, ya que el lector debe utilizar activamente su conocimiento del mundo para completar la información siempre reducida del texto. A su vez, la coherencia y las inferencias son posibles gracias a las representaciones del texto base y a los modelos de situación que construye el lector u oyente sobre los referentes del texto.

Por otra parte, una dificultad que comparten muchos fenómenos del discurso es lo que podríamos denominar el problema computacional. La complejidad de las operaciones realizadas y la rapidez con que se ejecutan parecen llevar al límite los recursos cognitivos de nuestra memoria de trabajo. Sin embargo, algunos de los fenómenos del discurso mencionados, como la construcción de la coherencia global y la realización de inferencias globales, exceden aparentemente los recursos de la memoria de trabajo. ¿Cómo pueden combinarse fuentes de información no coactivadas en la memoria de trabajo? En la misma línea, ¿cómo es posible elaborar modelos de situación análogos a la experiencia sin producir una explosión computacional? La posición minimalista de McKoon y RatclifF (1992) simplemente niega la existencia de procesos de coherencia y de inferencias globales y rechaza también la noción de modelo de situación.

La mayoría de las investigaciones y teorías asumen que durante la comprensión del discurso se emplean los recursos cognitivos disponibles de modo muy eficiente. Lo cierto es que los modelos de situación son representaciones muy reducidas en comparación con la experiencia real. Por ejemplo, la información espacial en los modelos de situación es sumamente esquemática comparada con la información espacial en la experiencia perceptiva. Por otra parte, el número de inferencias realizadas en línea es relativamente escaso, incluso para las teorías construccionistas. Finalmente, durante la comprensión, los recursos atencionales recaen en cada instante sobre unas pocas entidades activadas en el foco del discurso, mientras que el resto de la información leída permanece en el fondo con activación reducida.

INVESTIGACIONES SOBRE MODELOS DE SITUACIÓN

Dimensión espacial

Glenberg, Meyer y Lindem (1987). Estudio clásico donde los participantes leían breves textos en los que un personaje realizaba una serie de acciones. Demuestra que el lector se representa una relación espacial muy simple entre un personaje y un objeto.
Graesser et al. (1994). Los modelos de situación espacial se elaboran con poco detalle en línea, lo cual coincide con la teoría constructivista de las inferencias mencionadas con anterioridad.
de Vega (1995). Los resultados de algunas de sus investigaciones parecen indicar que, durante la lectura, sólo en ciertas condiciones ocurren esos procesos de generación y actualización de un modelo espacial más o menos detallado y preciso.

La dimensión espacial fue la más investigada inicialmente en el ámbito de los modelos de situación. Es relativamente sencillo elaborar textos experimentales en los que la estructura superficial difieran totalmente de la estructura espacial de la situación a la que se refieren. Son textos en los que se favorecería la divergencia entre los «productos» de los distintos niveles de representación del discurso. De este modo es posible distinguir mejor su respectiva importancia en la comprensión. El estudio clásico de Glenberg, Meyer y Lindem (1987) ilustra perfectamente esta lógica experimental.

La intuición nos sugiere que el lector no construye una representación espacial detallada en línea, porque ello consumiría excesivos recursos cognitivos y porque la información espacial es sólo una de las dimensiones de la narración y no siempre la más relevante. Por ejemplo, si leemos una novela de Agatha Christie en la que se describe detalladamente el interior de una casa con varias habitaciones, incluida la escena del crimen, con multitud de detalles sobre los objetos y su posición espacial, es posible que el lector no se moleste en representarse toda esta información o lo haga de una forma muy incompleta. Por supuesto, podría construir un modelo detallado, elaborando imágenes mentales de los escenarios, pero seguramente tendría que leer y releer el texto y desarrollar procesos de razonamiento. Pero esto ya no sería comprensión en línea.

Hay investigaciones publicadas en las que se muestra que los participantes pueden elaborar representaciones detalladas de escenarios, a partir de descripciones de éstos, e incluso pueden inferir relaciones espaciales no explícitas en las descripciones. Pero no se considerarán aquí, puesto que no se trata de tareas de comprensión en línea, sino de tareas de aprendizaje a partir de textos.

Latencia de respuesta de reconocimiento ante la palabra de prueba («camiseta»). en la versión asociada y disociada. Tomado de Glenberg et al. (1987). En el estudio clásico de Glenberg, Meyer y Lindem (1987) los participantes leían breves textos en los que un personaje realizaba una serie de acciones. Cada texto incluía una frase crítica que establecía una asociación espacial entre el personaje y un objeto («se puso la camiseta») o bien una disociación entre ellos («se quitó la camiseta»). Por ejemplo:
John se entrenaba para una maratón.
Tras hacer unos ejercicios de calentamiento, se puso la camiseta y se fue a correr. [1]
Tras hacer unos ejercicios de calentamiento, se quitó la camiseta y se fue a correr. [1]
Corrió alrededor del lago sin dificultad. [2]
Más tarde empezó a tener dolor en los músculos. [3]

Palabra de prueba: camiseta.
En un momento determinado se presentaba una palabra de prueba (camiseta) referida al objeto asociado o disociado en la oración crítica. Los lectores debían simplemente identificarla como perteneciente o no al texto, y el ordenador registraba el tiempo de respuesta. La palabra de prueba se presentaba inmediatamente después de la oración crítica [1], después de una oración de relleno [2] o después de dos oraciones de relleno [3].

Como puede apreciarse en la figura, cuando la palabra de prueba se presentó inmediatamente (posición 1) no hubo diferencias significativas entre la versión asociada y la disociada, ya que en ambos casos la forma superficial de la oración está todavía activa en la memoria. Sin embargo, cuando se introdujeron una o dos oraciones de relleno, la forma superficial se desvanece y se observa una clara ventaja de la versión asociada sobre la disociada. ¿Cómo explicar este efecto? Obsérvese que entre la palabra «camiseta» que aparecía al comienzo del texto y la palabra de prueba al final, las oraciones de relleno intercaladas fueron idénticas en ambas versiones de la tarea. Asimismo, la estructura proposicional o texto base fue idéntica en los dos casos: «poner [John, camiseta]» en la versión asociada y «quitar [John, camiseta]» en la disociada. Las diferencias de activación halladas entre ambas condiciones de tarea, por lo tanto, sólo pueden deberse a la estructura espacial de la situación. En la versión asociada el objeto queda vinculado espacialmente al personaje, y mientras éste siga en el foco del discurso, el objeto será accesible. En la versión disociada el personaje está en el foco del discurso, pero el objeto ha quedado separado de éste y por consiguiente ya no resulta accesible. Ahora bien, el experimento de Glenberg et al. (1987) sólo demuestra que el lector se representa una relación espacial muy simple entre un personaje y un objeto.

Dimensión temporal

Zwaan (1996). Uno de los primeros estudios experimentales que verificó la temporalidad de los modelos de situación. Según Zwaan, lo importante es simplemente la ruptura de continuidad temporal en el modelo de situación .
Carreiras, Carriedo, Alonso y Fernández (1997). En un experimento, utilizaron un paradigma de activación para valorar cómo el aspecto verbal puede modular la accesibilidad de los conceptos en la lectura. Presentaron a los individuos breves textos que describían un evento en forma perfectiva o imperfectiva:
Juan trabaja de camarero en un restaurante.
María come allí todos los días.
Juan estaba terminando su turno de trabajo cuando María llegó al restaurante. [a]
Juan ha terminado su turno de trabajo cuando María llegó al restaurante. [b]
Ella pidió el plato del día.
Luego leyó el periódico mientras esperaba la comida.
Prueba: Juan

Los resultados mostraron que el nombre del personaje inicial (Juan) era más accesible en la versión imperfectiva o progresiva [a] que en la perfectiva [b], y esto ocurrió cuando la palabra de prueba se presentaba inmediatamente y también cuando se presentaba después de 1 ó 2 frases de relleno. Esto indica que en la versión imperfectiva se entiende que Juan permanece asociado, al igual que María, a la situación, mientras que en la versión perfectiva Juan ha quedado disociado del modelo de situación y sólo permanece en el foco María.

La estructura del lenguaje es temporal: los fonemas, las palabras y las oraciones se pronuncian y se comprenden secuencialmente. Dado que los sucesos en los modelos de situación también suelen tener una estructura secuencial, una estrategia muy común del lector u oyente es aplicar el principio de iconicidad temporal. Es decir, generalmente se asume que el orden de las cláusulas y oraciones corresponde al orden cronológico de los eventos en el mundo narrativo. Además del principio de iconicidad, que aplicamos por defecto, el lenguaje dispone de recursos léxicos y gramaticales para expresar diversos matices temporales. Por ejemplo, hay otros recursos lingüísticos, como los adverbios y las locuciones adverbiales, que indican al lector u oyente distintos matices temporales e, incluso, que no debe aplicar el principio de iconicidad. En este último caso, la comprensión tiene mayor coste cognitivo ya que el lector tiene que reordenar mentalmente los eventos prescindiendo de su orden de mención en el texto. Por ejemplo: El vigilante abrió la puerta después de mirar alrededor (violación de iconicidad ? la acción de la segunda oración ocurre en primer lugar).

Efectos de la discontinuidad temporal (una hora más tarde, un día más tarde) en comparación con la continuidad temporal (un momento más tarde). en los tiempos de lectura de una oración y en el reconocimiento de una palabra. Tomado de Zwaan (1996). Uno de los primeros estudios experimentales que verificó la temporalidad de los modelos de situación fue desarrollado por Zwaan . Se presentaba a los lectores microtextos que incluían una locución adverbial que indicaba continuidad (un momento después) o diferentes grados de distancia temporal (una hora después, un día después) entre los eventos. Por ejemplo:
Jaime se volvió hacia su ordenador y empezó a teclear.
Un momento después sonó el teléfono.
Una hora después sonó el teléfono.
Un día después sonó el teléfono.
Era su amigo Jorge que le invitó a jugar al golf…
Palabra de prueba: teclear.

Se registraron los tiempos de lectura de la oración adverbial «…después sonó el teléfono» y también el tiempo de identificación de una palabra de prueba, que en los ítems experimentales pertenecía a la primera cláusula. Esta última medida indicaba la activación de la situación inicial. Tanto los tiempos de lectura como la medida de activación fueron más rápidos cuando el adverbio indicaba continuidad, ya que el lector aplica el principio de iconicidad integrando el nuevo evento en la situación. En cambio, los adverbios que indicaban discontinuidad temporal produjeron lecturas y respuestas más lentas, lo cual sugiere que el lector deja de aplicar la iconicidad, introduciendo un cambio temporal. Curiosamente, no hubo diferencias entre la discontinuidad breve (una hora después), que no supone un cambio de escenario del personaje, y la discontinuidad larga (un día después), que implica un cambio de escenario. Según Zwaan, esto indica que lo importante es simplemente la ruptura de continuidad temporal en el modelo de situación.

La morfología de los verbos no sólo indica una ubicación temporal gruesa, sino que puede también situarnos en una perspectiva temporal subjetiva, modulando el foco atencional sobre los eventos. Concretamente, el aspecto verbal permite expresar, desde la perspectiva del hablante, los eventos pasados como ya culminados (perfectivo) o en curso de realización (imperfectivo o progresivo). En un experimento, Carreiras, Carriedo, Alonso y Fernández (1997) utilizaron un paradigma de activación para valorar cómo el aspecto verbal puede modular la accesibilidad de los conceptos en la lectura. Los resultados mostraron que el nombre del personaje inicial era más accesible en la versión imperfectiva o progresiva que en la perfectiva. El efecto es análogo al que encontraron Glenberg et al. (1987), con la asociación y disociación espacial, pero en este caso el factor determinante es la perspectiva temporal, ligada al aspecto verbal.

Dimensión emocional e interpersonal

Sanford, Moar y Garrod (1988). Investigaron cómo los lectores asignan diferente importancia narrativa a los personajes, teniendo en cuenta ciertos elementos léxicos del texto. Concretamente, observaron que cuando una frase incluye un protagonista mencionado por su nombre propio (Juan, María, etc.) y un personaje secundario descrito por su rol (el camarero, el profesor, etc.), el lector elige la perspectiva del protagonista y le dedica una atención preferencial. Los participantes recibían breves párrafos como los siguientes: [a] «El cura esperaba junto a la iglesia. María se dirigió hacia él», o [b] «El padre Benítez esperaba junto a la iglesia. La mujer se dirigió hacia él». La tarea de los lectores era completar la historia con una frase. Invariablemente los que recibían [a] eligieron «María» en lugar de «el cura» como sujeto de la oración, mientras que los que recibían [b] eligieron el padre Benítez como sujeto. Anderson, Garrod y Sanford(1983) también demostraron que el protagonista (citado por su nombre propio) no está ligado a un escenario particular en la narración, es decir, cuando el texto describe un cambio de lugar, el protagonista continúa accesible en la memoria del lector. Por el contrario, los personajes secundarios son dependientes de escenario: el camarero está ligado al restaurante, el profesor a la universidad, el futbolista al estadio, etc. Por lo tanto, cuando en el texto se produce un cambio de escenario, la accesibilidad (activación) del personaje secundario disminuye, mientras que la del protagonista con nombre propio se mantiene.
Gernsbacher et al. (1992). Presentaron a los participantes pequeñas historias en las que el protagonista se encontraba en una situación inductora de una emoción, aun cuando ésta no se nombraba explícitamente. Por ejemplo:
Joe trabajaba en una tienda para obtener dinero para sus gastos. Una noche, Tom, su mejor amigo, fue a comprar un refresco a la tienda. Joe tuvo que ir un momento al almacén. Mientras Joe estaba ausente, Tom se dio cuenta de que la caja registradora estaba abierta. Rápidamente cogió de su interior un billete de diez dólares. Al día siguiente, se enteró de que habían despedido a Joe porque había faltado dinero de la caja.
Pasaron semanas antes de que Tom dejara de sentirse culpable (coherente: tiempo de lectura: 2.600 ms). [a]
Pasaron semanas antes de que Tom dejara de sentirse orgulloso (incoherente: tiempo de lectura: 3.800 ms). [b]
Tras recibir el contexto inductor de la emoción, algunos participantes leían la oración [a] con una emoción coherente con el contexto, y otros leían la oración [b] con una emoción incoherente. Los tiempos de lectura fueron más rápidos en la versión coherente que en la incoherente, indicando que en el transcurso de la lectura de narraciones, y como parte del modelo de situación que el lector construye, se activa inmediatamente una representación del estado emocional de los protagonistas. Dicha representación emocional es relativamente precisa, es decir, no refleja sólo rasgos generales de dicho estado, como la valencia de la emoción, sino que es suficientemente rica como para distinguir entre estados emocionales relativamente próximos (entre «culpable» y «envidioso»), según demostraron Gernsbacher et al. en otro experimento. Además, no parece guiada por la presencia de etiquetas emocionales, sino que formaría parte de la comprensión de la cadena de acciones, metas y relaciones entre los personajes que constituyen una narración.
Holtgraves (1994). Presentó a los participantes breves textos con dos personajes que realizaban una tarea en colaboración y mantenían una relación de alto estatus y de subordinado [la] o una relación de igualdad de estatus [1b]. La última oración del texto consistía en una petición indirecta convencional de uno de los personajes al otro [2a], o bien un comentario negativo trivial, pero que en el contexto podía tener el carácter de una petición no convencional [2b]:
Marta y Luisa trabajan en la biblioteca universitaria.
Marta es la directora de la biblioteca y Luisa es su ayudante becaria. [1a]
Las dos son ayudantes becadas de la biblioteca. [1b]
Esta tarde tienen que catalogar algunos libros y piensan hacerlo en una sala de reuniones. La habitación no se usa habitualmente y la estufa está apagada. Por lo tanto, hace mucho frío. Poco después de empezar a trabajar Marta le dice a Luisa:
¿Podrías encender la estufa? [2a]
Parece que hace mucho frío aquí. [2b]
Los tiempos de lectura de la última oración mostraron que la petición convencional [2a] se comprendía fácilmente tanto en el contexto de alto estatus como de igualdad de estatus. Sin embargo, la petición no convencional [2b] se entendió con facilidad en el contexto de alto estatus, pero requirió un esfuerzo adicional en el contexto de igualdad de estatus. En otras palabras, las peticiones indirectas convencionales se comprenden inmediatamente cualquiera que sea el contexto interpersonal, pero los comentarios negativos como [2b] son muy ambiguos y el lector aplica su conocimiento pragmático de las relaciones de estatus para interpretarlos. Así, infiere con facilidad que [2b] es una petición pero sólo cuando quien lo pronuncia es un personaje de alto estatus.
De Vega, Díaz y León (1997). Estudiaron la capacidad de perspectivismo mental de los lectores en narraciones breves, similares a las utilizadas en los experimentos de emociones referidos anteriormente. Los resultados de dicho estudio indican que el lector es capaz de ponerse en el punto de vista mental del protagonista a pesar de que dispone de una información privilegiada sobre la situación.
El cuadro «La lectora sumisa», del pintor belga René Magritte, refleja perfectamente la implicación emocional de la lectora en el mundo narrativo.

Los seres humanos disponemos de mecanismos de empatía que nos permiten inferir y hasta compartir las emociones de los demás en nuestras relaciones interpersonales. Nos interesan las novelas, las películas o el teatro en gran medida porque producen en nosotros sentimientos y emociones vicarias, al identificarnos con la perspectiva de los protagonistas. Algunos estudios han tratado de verificar si, en efecto, los lectores son capaces de mantener la perspectiva emocional de los personajes de una narración. El primer trabajo sobre la comprensión de emociones en el discurso fue desarrollado por Gernsbacher et al. (1992), quienes demostraron que en el transcurso de la lectura de narraciones, y como parte del modelo de situación que el lector construye, se activa inmediatamente una representación del estado emocional de los protagonistas. Una representación emocional que no refleja sólo rasgos generales de dicho estado, como la valencia de la emoción, sino que es suficientemente rica como para distinguir entre estados emocionales relativamente próximos (entre «culpable» y «envidioso»). Además, no parece guiada por la presencia de etiquetas emocionales, sino que formaría parte de la comprensión de la cadena de acciones, metas y relaciones entre los personajes que constituyen una narración.

Sanford, Moar y Garrod (1988) investigaron cómo los lectores asignan diferente importancia narrativa a los personajes, encontraron que cuando en el texto se produce un cambio de escenario, la accesibilidad (activación) del personaje secundario disminuye, mientras que la del protagonista con nombre propio se mantiene. Los lectores también utilizan las relaciones de estatus entre los personajes para interpretar oraciones ambiguas. Holtgraves (1994) presentó a los participantes breves textos con dos personajes que realizaban una tarea en colaboración y mantenían una relación de alto estatus y de subordinado o una relación de igualdad de estatus, y encontro que las peticiones indirectas convencionales se comprenden inmediatamente cualquiera que sea el contexto interpersonal, pero los comentarios negativos son muy ambiguos y el lector aplica su conocimiento pragmático de las relaciones de estatus para interpretarlos.

No sólo los lectores se representan el estatus de los personajes, sino también sus estados mentales, incluido su grado de conocimiento sobre los eventos. Es frecuente en las narraciones que el protagonista «desconozca» un suceso de importancia crítica, mientras que otros personajes y el propio lector tiene un conocimiento privilegiado de dicho suceso. De Vega, Díaz y León (1997) estudiaron la capacidad de perspectivismo mental de los lectores en narraciones breves y encontraron que el lector es capaz de ponerse en el punto de vista mental del protagonista a pesar de que dispone de una información privilegiada sobre la situación.

Conclusiones

Los estudios empíricos revisados en este apartado demuestran que es posible capturar algunas de las características estructurales y funcionales de los modelos de situación, con métodos en línea.

  • Los modelos de situación incluyen una representación espacial muy simplificada, pero claramente diferenciada de la propia estructura del texto.
  • Los modelos de situación incluyen características temporales que están apuntaladas por numerosos índices morfológicos, léxicos y sintácticos del propio texto. La organización temporal es incluso más importante que la espacial dada la prioridad que tiene en el lenguaje. En realidad, el tiempo es una dimensión transversal que subyace a muchas facetas representadas en los modelos de situación, como las acciones motoras, las emociones, los eventos, etc.
  • Dado que las narraciones tratan especialmente de personas, de sus acciones y de las cosas que les suceden, los mecanismos propios de la cognición social, como la empatía y la teoría de la mente, intervienen activamente en su comprensión.

Gracias a estos mecanismos cognitivos, el lector de narraciones infiere y actualiza las emociones y los estados de conocimiento de los protagonistas, disociándolos de los propios, y entiende los vínculos interpersonales entre ellos.

TEORÍAS SOBRE LA COMPRENSIÓN DEL DISCURSO

Aportaciones de Walter Kintsch

Kintsch y Van Dijk (1978). Teoría de la macroestructura.
Kintsch (1988). Teoría de la construcción-integración.
Ericsson y Kintsch (1995). Teoría de la memoria de trabajo.

Walter Kintsch ha sido uno de los psicólogos cognitivos más influyentes en las últimas décadas. Sus contribuciones tienen implicaciones para la psicología de la memoria y del pensamiento, pero sobre todo para la psicología del discurso. A lo largo de los años ha desarrollado, junto a algunos colaboradores, varias formulaciones teóricas de gran impacto en la investigación básica y aplicada: la teoría de la macroestructura (1978), la teoría de la construcción-integración (1988) y la teoría de la memoria de trabajo (1995).

Teoría de la macroestructura
Kintsch y Van Dijk (1978). Durante la comprensión, el lector u oyente añade proposiciones que no se extraen directamente del texto, sino que proceden de la memoria a largo plazo. En otras palabras, algunas proposiciones son el resultado de inferencias que añaden información no explícita en el texto base.


La primera teoría sobre la comprensión del discurso (Kintsch y Van Dijk, 1978) proponía que durante el proceso se elaboran dos tipos de estructuras semánticas:

  • La microestructura. Corresponde a la organización local del discurso e incluye un conjunto de microproposiciones correferentes (con argumentos repetidos) extraídas a partir de las oraciones del texto, que mantienen una relación jerárquica entre sí.
  • La macroestructura. Es la organización global que le da unidad de sentido al discurso, lo que intuitivamente denominamos el argumento de una narración o el tema de una conversación. La macroestructura se describe en términos de macroproposiciones y se refiere a los mismos contenidos que la microestructura pero desde un punto de vista más global o «tópico». Cuando hemos comprendido correctamente un texto, la macroestructura es lo que retenemos en la memoria.

Según Kintsch y Van Dijk, la transformación de microestructura en macroestructura la consigue el lector u oyente aplicando las siguientes macrorreglas:

  • Borrado, si una proposición no tiene vinculación alguna como antecedente con las siguientes proposiciones, debe borrarse.
  • Generalización, una secuencia de proposiciones puede ser sustituida por la proposición general de orden superior.
  • Construcción, una secuencia de proposiciones puede ser sustituida por una proposición que denota un hecho global, del cual los hechos denotados por las proposiciones de microestructura son condiciones, componentes o consecuencias normales.

El lector puede utilizar de arriba-abajo su esquema de narración cuando lee una novela, su esquema de argumentación cuando lee un debate científico o su esquema de artículo cuando lee un artículo científico. Los esquemas de discurso operan de arriba-abajo, es decir, a partir de la memoria a largo plazo del lector. Por otra parte, aunque las macrorreglas son dispositivos de reducción de información, algunas proposiciones son el resultado de inferencias que añaden información no explícita en el texto base.

Las estructuras del texto son procesadas en ciclos de memoria de trabajo. Cada ciclo se inicia en los límites entre cláusulas o, cuando éstas son muy largas, entre sintagmas, extrayéndose las proposiciones de microestructura y aplicándose las macrorreglas para generar la macroestructura.

Teoría de la construcción-integración
Kintsch (1988). La nueva teoría de construcción-integración recoge importante características de la teoría de macroestructura. Supongamos que el homógrafo «banco» aparece en el siguiente texto:
«Ayer, un pistolero se llevó todo el dinero de un banco».
En la memoria del lector existirán para la palabra «banco» dos nodos conceptuales, cada uno de ellos con vínculos asociativos con otros nodos. Así, una acepción de banco (banco 1) tendrá conexiones asociativas con dinero, BBVA, Santander, La Caixa, comisiones abusivas, chorizos, cheque, cajero, hipotecas, asalto, robo, pistolero etc., mientras que la otra acepción (banco 2) tendrá conexiones con asiento, parque, acera, farola, descanso, etc. Además, habrá conexiones inhibitorias entre banco 1 y parque, asiento, etc., o entre banco 2 y dinero, hipoteca, etc. Kintsch propone que en la fase de construcción, inicialmente se activarán ambas acepciones, dando lugar a dos proposiciones en conflicto:
Llevarse [pistolero, dinero, banco 1]. [a]
Llevarse [pistolero, dinero, banco 2]. [b]
Inicialmente, toda esta información dará lugar a una red asociativa, pero los procesos de propagación de activación determinarán que las conexiones de banco 1 se refuercen, al estar éste vinculado con conceptos explícitos en el texto (dinero) o implícitos (asalto, robo, asociados a pistolero), mientras que banco 2 quedará aislado en la red, sin conexiones positivas con otros conceptos, e incluso con conexiones inhibidoras procedentes de los conceptos activados; por lo tanto, la proposición [a] se mantendrá y la proposición [b] se suprimirá. Lo interesante es que este proceso no es «inteligente», por ejemplo no se basa en la aplicación del esquema mental de «asalto al banco», y menos en razonamientos conscientes, sino que ocurre de abajo-arriba, basado en el propio texto. El mismo tipo de proceso conexionista de propagación de activación se aplica a gran escala, a grupos de oraciones y, en última instancia, al texto entero, determinando qué proposiciones constituirán la macroestructura integrada (mayor peso asociativo acumulado en la red) y cuáles no.

Las representaciones siguen siendo conceptuales o preposicionales. También sigue habiendo dos fases en la comprensión del discurso: la construcción relacionada con la extracción de proposiciones a partir del texto superficial (equivalente a la microestructura), y la integración, que supone una reducción de información para alcanzar la comprensión (equivalente a la macroestructura). En la teoría de la construcción-integración se eliminan las macrorreglas y, en su lugar, se proponen reglas débiles, reglas condicionales del tipo «si se dan las condiciones X, Y, Z ? realizar las operaciones A y B, y procesos de tipo conexionista en la red de información derivada del texto.

Proceso de construcción. A diferencia de la teoría macroestructural, en la que la microestructura estaba compuesta por proposiciones «correctas», la construcción en la teoría de la construcción-integración es un proceso promiscuo que da lugar a multitud de proposiciones, algunas apropiadas, pero también incompletas, redundantes e incluso contradictorias. Además, se establecen vínculos asociativos entre las proposiciones generadas, configurando una red de tipo conexionista. Un proceso automático y principalmente guiado por el texto, y el resultado inmediato, un tanto caótico, es insuficiente para obtener un significado coherente del texto. A cambio, permite una enorme flexibilidad y una rápida adaptación a la información contextual del texto.

Proceso de integración. La integración es un proceso que establece orden en el caos de información generado por la construcción. El mecanismo propuesto de satisfacción de constricciones es de tipo conexionista: la red activada anteriormente reajusta los pesos de sus conexiones, de modo que algunas se refuerzan, al acumular más vínculos positivos, y otras se debilitan y desaparecen. El resultado se integra a la macroestructura previamente elaborada, y es una representación coherente o, al menos, más coherente que el texto base previamente activado.

Teoría de la memoria de trabajo a largo plazo
Ericsson y Kintsch (1995). Teoría de la memoria de trabajo. Estos autores postularon que, además de la memoria de trabajo convencional (memoria de trabajo a corto plazo), existe una memoria de trabajo a largo plazo, que es específica de dominio y se adquiere mediante entrenamiento continuado. Las teorías de Kintsch ofrecen un gran avance para interpretar un fenómeno multidimensional y complejo como es la comprensión del discurso.

Las teorías clásicas de la memoria de trabajo, apoyadas por múltiples experimentos, postulan que sólo somos capaces de retener de forma inmediata entre 4 y 7 unidades de información. Sin embargo, estas limitaciones parecen contradecir el rendimiento de nuestra memoria en la comprensión de narraciones y en otras tareas. Esta teoría postula que además de la memoria de trabajo convencional (memoria de trabajo a corto plazo), existe una memoria de trabajo a largo plazo, que es específica de dominio y se adquiere mediante entrenamiento continuado. En el caso de la comprensión del discurso, también se aprecia el funcionamiento de la memoria de trabajo a largo plazo. Varias horas o días después de haber leído un capítulo retomamos la lectura y, tras leer algunas oraciones, recuperamos el contexto narrativo (macroestructura) con increíble facilidad.

Lo que hacen el experto y el lector de narraciones es utilizar estructuras de recuperación almacenadas en su memoria a largo plazo, que se activan cuando reciben ciertos índices. En el caso de la lectura de narraciones, el lector construye macroestructuras de proposiciones fuertemente integradas y, cuando tras la interrupción lee una oración (índice) que se relaciona con la macroestructura, recupera fácilmente la información relevante. La memoria de trabajo a largo plazo es un mecanismo que nos libera de los estrechos límites estructurales y funcionales de la memoria a corto plazo. Por otra parte, la memoria de trabajo a largo plazo es específica del dominio entrenado y probablemente no se generaliza a otros dominios.

Valoración de las aportaciones de Kintsch

Kintsch es muy consciente de los aspectos que quedan fuera de sus sucesivas teorías. Así, el análisis sintáctico de las oraciones o los procesos de codificación proposicional a partir del texto superficial no forman parte de las teorías, sino que se dan por supuestos. Los aspectos computacionales no están muy detallados. Por ejemplo, en la teoría de construcción-integración se menciona que la construcción se elabora aplicando reglas de producción, pero no se especifican ni siquiera hipotéticamente cuáles son esas reglas de producción. Asimismo, los procesos conexionistas que se aplican en la integración son más una «filosofía» que una propuesta formal de simulaciones efectivas. Da la impresión de que los mecanismos computacionales propuestos son herramientas provisionales más que aspectos esenciales en sus teorías. Prueba de ello es la facilidad con la que Kintsch adopta nuevas aproximaciones. El uso de las proposiciones como formato de representación es una decisión polémica, especialmente por su ausencia de anclaje en el mundo. La posición epistemológica de Kintsch parece ser: avancemos todo lo posible en una concepción general de la comprensión del discurso, aun dejando detalles sin resolver o con una solución provisional, que se podría revisar más adelante.

Teorías de modelos de situación

Estas propuestas son complementarias a las de Kintsch, al desarrollar con más detalle la idea de modelos de situación.

Modelos de continuidad situacional
Gernsbacher (1990). Enfoque de construcción de estructuras. Postula que cuando empezamos a leer una narración establecemos la «fundación de una estructura» (una forma un tanto aséptica de denominar un modelo de situación), activando «celdillas» de la memoria (una especie de nodos de memoria semántica).
Zwaan, Langston y Graesser (1995). Propusieron el modelo de indexación de eventos que, en realidad, es una variante de la propuesta de Gernsbacher, a la que añaden el protagonista y la intencionalidad como dimensiones de la situación. Según ellos, al procesar el primer evento de la historia, el lector establece cinco índices: temporalidad, espacialidad, causalidad, protagonista e intencionalidad.

La propuesta básica es que las oraciones de un texto generalmente mantienen continuidad en una serie de dimensiones situacionales, como el tiempo y el espacio, pero cuando se produce alguna discontinuidad en una o más de estas dimensiones hay un sobrecoste cognitivo. Según Gernsbacher, cuando empezamos a leer una narración establecemos la «fundación de una estructura» (una forma un tanto aséptica de denominar un modelo de situación), activando «celdillas» de la memoria (una especie de nodos de memoria semántica). La fundación de una estructura implica un coste cognitivo considerable, que se manifiesta en la lenta lectura de las primeras oraciones o párrafos de una historia. La siguiente operación es el proceso de «mapeado de estructura», es decir que, a medida que leemos nuevas oraciones, completamos o enriquecemos la estructura fundada, pero esto sólo ocurre si se mantiene la continuidad o coherencia temporal, espacial, causal y de correferencia. Sin embargo, cuando aparece algún indicador de discontinuidad en el texto, el lector realiza un «cambio de estructura», es decir, deja de implementar la estructura anterior y funda una nueva estructura o subestructura, activándose nuevas celdillas de memoria. El cambio de estructura implica un incremento del coste cognitivo que se manifiesta en una lectura más lenta en ese punto del texto. Una vez realizado el cambio de estructura, la estructura anterior pierde accesibilidad en la memoria. Esto podría explicar las diferencias individuales en comprensión, ya que los lectores menos eficientes tienden a realizar más cambios de estructura que los más eficientes.

Teoría de la experiencia de inmersión
Langacker (2001). Cada proceso de interpretación está sintonizado con una unidad de entonación del habla y se puede considerar un «marco atencional», es decir, los límites prosódicos del habla, muchas veces coincidentes con los de las cláusulas gramaticales, son marcadores lingüísticos naturales de los procesos de interpretación.
Zwaan (2004). Propuso la teoría de la experiencia de inmersión con un afán integrador. Así, la teoría incorpora muchas de las ideas de Kintsch y sus colaboradores sobre los procesos de comprensión del discurso, pero con una diferencia importante: sustituye las proposiciones de Kintsch por representaciones corpóreas como formato de los modelos de situación.

Esta teoría incorpora muchas de las ideas de Kintsch y sus colaboradores sobre los procesos de comprensión del discurso, pero con una diferencia importante: sustituye las proposiciones de Kintsch por representaciones corpóreas como formato de los modelos de situación. En este sentido también asume algunas características de las te orías de cambio de estructuras y del modelo de indexación de eventos, que acabamos de describir, e incluye asimismo ideas propias de la lingüística cognitiva. La experiencia de inmersión se basa en el supuesto según el cual la memoria de trabajo del lector u oyente refleja la accesibilidad de los objetos y eventos narrativos de modo muy similar a como lo hace en la experiencia real. Es decir, tenderán a mantenerse en memoria los objetos presentes en la situación más que los ausentes, las características presentes más que las ausentes, los objetos próximos más que los distantes, los eventos en curso más que los pasados, las metas actuales más que las pasadas o las entidades visibles más que las ocultas. Zwaan propone tres componentes en la comprensión: activación, interpretación e integración, que corresponden a grandes rasgos al procesamiento léxico, de la cláusula y del discurso, respectivamente.

  • La activación es un proceso que se dispara con cada palabra, es difusa y caótica. Sin embargo, a diferencia de Kintsch no son proposiciones las que se activan sino trazos de experiencia sensoriomotores.
  • La interpretación resulta de combinar las activaciones de las redes difusas activadas por las palabras de una cláusula, siguiendo un mecanismo de satisfacción de múltiples constricciones, análogo al mecanismo conexionista propuesto por Kintsch en su teoría de la construcción-integración. La interpretación es ya una simulación experiencial concreta. Una interpretación es como un plano cinematográfico, que implica una ubicación temporal y espacial de los personajes, objetos y eventos, y una perspectiva determinada (p. ej., la del protagonista) que proporciona mayor prominencia a unas entidades sobre las otras.
  • La integración ocurre a medida que avanza el texto, y el lector procede con la ejecución de nuevas interpretaciones derivadas de las cláusulas o unidades de entonación. La integración implica la transición de una interpretación a la siguiente. De nuevo se asume que esas transiciones se basan en la experiencia.

Teorías estadísticas: análisis semántico latente

Landauer y Dumais (1997). Elaboraron una teoría denominada análisis semántico latente (LSA), basada en la idea de que las pautas de uso del lenguaje revelan información semántica. La teoría analiza estadísticamente la coocurrencia de las palabras en textos naturales.
Kintsch (1998). Aplicó el LSA como una herramienta complementaria de su teoría de la construcción-integración. Los conceptos y las proposiciones derivadas del texto se expresan como vectores de LSA, y de este modo uno de los déficits de las proposiciones (la ausencia de un algoritmo que las codifique) queda subsanado: el conocimiento se puede extraer automáticamente a partir de los textos mediante un algoritmo de LSA.
Louwerse y Zwaan (2010). Aplicaron el LSA a 50 nombres de ciudades norteamericanas, a partir de un corpus de artículos del New York Times y de otros periódicos. A partir de las coocurrencias en los textos se obtuvieron los cosenos entre los vectores correspondientes a dichas ciudades, y posteriormente se aplicó a estos cosenos un análisis multidimensional. Lo sorprendente es que los valores dimensionales obtenidos para las ciudades correlacionaron con su longitud y latitud geográficas (0,368 y 0,413, respectivamente, a partir de los datos del New York Times), y aun más con la longitud y la latitud estimadas por un grupo de participantes (0,415 y 0,590, respectivamente).
Olmos et al. (2011). Crearon un algoritmo de LSA, que combina cosenos y longitud de los vectores, capaz de evaluar resúmenes de textos redactados por estudiantes de bachillerato. Los autores calcularon mediante el LSA la similitud entre los resúmenes y los textos originales, y también pidieron a un grupo de expertos que valorasen dichos resúmenes. Los resultados indicaron que los valores de LSA correlacionaron con la valoración de los expertos entre 0,41 y 0,63, dependiendo del tipo de texto.

Esta teoría analiza estadísticamente la coocurrencia de las palabras en textos naturales. Inicialmente, los autores registraron, mediante un programa de ordenador, las ocurrencias de unas 60.000 palabras en unos 30.000 textos, formando una inmensa matriz de palabras (filas) x textos (columnas), cuyas celdillas incluían las frecuencias de ocurrencia. Los cálculos matemáticos posteriores, mediante la técnica de descomposición en valores singulares, permiten reducir la matriz a un espacio vectorial de sólo unas 300 dimensiones. Las palabras están representadas en ese espacio como vectores, y las relaciones entre un par de palabras se calculan como el coseno del ángulo entre sus vectores. A su vez, la longitud de cada vector es un indicador de la riqueza semántica de la palabra. Lo interesante de este procedimiento es que los cosenos obtenidos matemáticamente tienen propiedades psicológicas emergentes. Por ejemplo, el coseno entre dos palabras predice los juicios de similitud de los participantes humanos, los efectos de priming, estima el grado de sinonimia entre las palabras, se relaciona con la edad de adquisición, etc. Más aun, los vectores de las palabras de una oración o de un texto pueden combinarse en nuevos vectores que representan estas unidades de discurso. Cuando se dispone de una interfaz apropiada, el usuario de LSA puede comprobar por sí mismo las relaciones semánticas (cosenos), no sólo entre palabras, sino entre oraciones o entre textos. Así, en castellano hay una aplicación LSA elaborada por José A. León y sus colaboradores de la Universidad Autónoma de Madrid.

El LSA es una herramienta estadística que explota datos procedentes de corpus lingüísticos. Sin embargo, Landauer y Dumais afirman que el LSA es una auténtica teoría del significado. Según ellos, los seres humanos funcionamos en gran medida como el LSA; así, el significado de la mayoría de las palabras se adquiere a partir de su relación con otras palabras en contextos puramente lingüísticos, por ejemplo durante la lectura. Un corpus amplio de textos en un determinado dominio sería análogo a la acumulación de experiencia de las personas en ese dominio; en otras palabras, el lenguaje es un espejo de la experiencia. Por lo tanto, las relaciones semánticas derivadas estadísticamente de los textos reflejan directamente el conocimiento de las personas. La información sobre el mundo contenida en la estadística de las palabras no es nada despreciable. El LSA pone el acento en un aspecto importante del procesamiento del lenguaje que puede tener relevancia psicológica: los lectores u oyentes podrían realizar un cómputo automático de la coocurrencia de las palabras, como una especie de atajo cognitivo que los lleva a realizar inferencias probables.

No debe olvidarse que el LSA no es una teoría completa de la comprensión del lenguaje. Así, el LSA no analiza las palabras gramaticales (pronombres, artículos, preposiciones, etc.), ni tampoco los procesos sintácticos, ni el orden de las palabras. Tampoco tiene en cuenta los mecanismos cognitivos implicados en la comprensión, como la memoria de trabajo, o los procesos atencionales.

Teorías neurológicas

Las teorías cognitivas sobre la comprensión del discurso se basan principalmente en estudios conductuales. Sin embargo, en los últimos años se ha incrementado el número de investigaciones neurocientíficas sobre la comprensión del discurso. Los datos neuroanatómicos, extraordinariamente ricos y multidimensionales, pueden por sí mismos contribuir a configurar teorías cognitivas nuevas.

Papel del hemisferio derecho
Mark Beeman (1998). Creador de la teoría más completa sobre el papel del hemisferio derecho. Postula que ambos hemisferios están especializados en diferentes procesos semánticos relacionados con la comprensión del lenguaje. Al procesar las palabras, el hemisferio izquierdo realiza una codificación semántica fina, es decir, activa intensamente campos semánticos reducidos, dominantes y relacionados con el contexto inmediato. El hemisferio derecho, en cambio, realiza una codificación semántica gruesa, activando débilmente campos semánticos mucho más amplios pero también difusos y mal estructurados.

La comprensión y la producción del lenguaje se han asociado tradicionalmente a la actividad del hemisferio cerebral izquierdo, en particular las áreas perisilvianas de Broca (corteza frontal inferior) y de Wernicke (corteza temporal superior, circunvolución angular). Sin embargo, los estudios neurocientíficos muestran que el hemisferio cerebral derecho desempeña un papel relevante en la comprensión, especialmente del discurso.Los pacientes con lesiones en el hemisferio derecho, aunque no presentan síntomas afásicos, tienen dificultades para extraer las ideas principales de una narración, realizar inferencias, comprender metáforas, etc.

Artículos indeterminadosArtículos determinados
Una abuela se sentó a una mesa
Un niño jugaba en un patio
Una madre hablaba en un teléfono
Un marido conducía un tractor
Un nieto gateó hacia una puerta
Un nene hacía pucheros y se aburría
Una abuela prometió cocinar una tarta
Una esposa miró hacia un campo
Unas nubes oscuras se acercaban rápidamente
Una madre se preocupaba por una cosecha Una abuela abrió una puerta
Empezó a caer alguna lluvia
Un día de trabajo terminó pronto
Una familia corrió sobre un campo mojado
La abuela se sentó a la mesa
El niño jugaba en el patio
La madre hablaba al teléfono
El marido conducía el tractor
El nieto gateó hacia la puerta
El nene hacía pucheros y se aburría
La abuela prometió cocinar tarta
La esposa miró hacia el campo
Las nubes oscuras se acercaban rápidamente
La madre se preocupaba por la cosecha
La abuela abrió la puerta
Empezó a caer la lluvia
El día de trabajo terminó pronto
La familia corrió sobre el campo mojado
Robertson et al. (2000) realizaron un estudio de neuroimagen en el que los participantes recibían conjuntos de oraciones que incluían artículos indeterminados o bien artículos determinados. La versión con artículos indeterminados se lee como un conjunto de oraciones independientes, mientras que las oraciones con artículos determinados son correferentes y, por lo tanto, se leen como una narración. Los resultados mostraron activaciones en las áreas perisilvianas del hemisferio izquierdo en ambas versiones, pero, además, en la versión de narración se activó la región del hemisferio derecho homologa del área de Broca, indicando que la integración del discurso requiere la colaboración del hemisferio derecho.

En la mayoría de las tareas del lenguaje (reconocimiento de palabras, comprensión de oraciones literales, inferencias prealmacenadas, etc.) el hemisferio izquierdo es más eficiente que el derecho, llevando a cabo un procesamiento rápido y apropiado. Sin embargo, cuando se trata de formas de lenguaje más sofisticadas, como capturar el sentido del discurso, entender metáforas nuevas, comprender el humor, o realizar inferencias elaborativas, el hemisferio derecho ofrece ventajas. En realidad, ambos hemisferios cooperan y combinan información a través de la rica conectividad proporcionada por el cuerpo calloso.
La teoría de Beeman se ajusta bastante bien a los procesos postulados por la teoría de la construcción-integración de Kintsch. La construcción, como proceso de activación difuso y caótico, responde casi exactamente al papel del hemisferio derecho, mientras que la integración como un proceso de constricciones múltiples que elimina activaciones irrelevantes es más propia del carácter selectivo del izquierdo. Sin embargo, la división del trabajo entre ambos hemisferios es un tanto gruesa y, según algunos autores, gran parte de las funciones lingüísticas atribuidas al hemisferio derecho podrían tener relación más bien con el lóbulo frontal en general o con el lóbulo temporal, sin una lateralización clara.

Papel de otras estructuras cerebrales
Ferstl et al. (2008). En un metaanálisis realizado sobre 23 estudios de neuroimagen que contrastaban la comprensión del discurso con la comprensión de oraciones inconexas o incoherentes, Ferstl et al. (2008) informaron de la existencia de activaciones compartidas en el área de Broca, pero también en áreas con una amplia distribución cerebral, incluyendo ambos hemisferios, por ejemplo, activaciones bilaterales en el lóbulo temporal anterior, la unión temporoparietal, el surco temporal superior y en estructuras de la corteza medial, como el precuneus y la corteza prefrontal dorsomedial.
Regiones activadas en la corteza en función del nivel de la tarea lingüística. Tomado de Xu et al. (2005).

Ferstl et al. (2008) informaron de la existencia de activaciones compartidas en el área de Broca, pero también en áreas con una amplia distribución cerebral, incluyendo ambos hemisferios, por ejemplo, activaciones bilaterales en el lóbulo temporal anterior, la unión temporoparietal, el surco temporal superior y en estructuras de la corteza medial, como el precuneus y la corteza prefrontal dorsomedial. Lo interesante es que muchas de estas regiones tienen que ver con la teoría de la mente, es decir, con la capacidad de entender los estados mentales de los demás. Esto es justamente lo que cabría esperar de la comprensión de narraciones que demandan una toma de perspectiva mentalista.
Otros estudios sugieren que también las estructuras cerebrales relacionadas con las emociones (ínsula, amígdala) o con las acciones motoras (corteza motora y premotora) se activan durante la comprensión de textos narrativos. De modo general, los datos neurológicos parecen avalar la noción de modelos de situación como representaciones experienciales o corpóreas, pero también confirman el protagonismo de las áreas perisilvianas clásicas situadas en el hemisferio izquierdo.

Conclusiones

Las teorías del discurso pueden parecer demasiadas y demasiado heterogéneas. La teoría de la construcción-integración de Kintsch es la más ambiciosa, cubriendo un amplio rango de fenómenos: los niveles de representación, la extracción de las ideas principales del discurso, la coherencia local y global, la funcionalidad de la memoria de trabajo en la comprensión o las inferencias. La teoría de construcción de estructuras de Gernsbacher hace hincapié en el funcionamiento de los procesos de coherencia (continuidad) y los efectos de las marcas de discontinuidad durante la comprensión en línea. También hace predicciones precisas sobre las consecuencias de la continuidad o la discontinuidad en el recuerdo del texto. La teoría de la experiencia de inmersión de Zwaan es, en cierta medida, un ensayo de reformulación de la teoría de la construcción-integración de Kintsch, pero incorporando mecanismos corpóreos o experienciales de representación del significado, en lugar de las proposiciones simbólicas. Sin duda, la teoría más divergente es el análisis semántico latente (LSA), puesto que se basa en el análisis computacional del discurso más que en el estudio del comportamiento del lector u oyente. A cambio ofrece una poderosa tecnología cognitiva, que tiene aplicaciones en el campo educativo e instruccional.

AUTOEVALUACIÓN

REFERENCIAS

  • Cuetos Vega, González Álvarez, Vega, and Vega, Manuel De. Psicología Del Lenguaje. 2ª Edición. ed. Madrid: Editorial Médica Panamericana, 2020.
  • PDF Profesor tutor Pedro R. Montoro

Deja un comentario

2 × 1 =

Ir al contenido