La Percepción del Lenguaje

INTRODUCCIÓN

El lenguaje consta de fenómenos públicos (estímulo físico observable y medible, compuesto de sonidos o trazos) y fenómenos privados (se infieren, son representaciones mentales con significado). El oyente/lector tiene que transformar los estímulos físicos de habla/escritura que recibe en una representación de sonidos/letras que componen la emisión verbal.
Diferencias entre la percepción del lenguaje oral y escrito:
Lenguaje Oral Lenguaje Escrito
- El sonido decae con el tiempo - No hay limitaciones temporales
- El habla es un estímulo continuo - La escritura se divide en unidades, palabras, etc.
- Afecta a la audición - Afecta a la visión

Propiedades del sistema humano de percepción del lenguaje: constancia, flexibilidad y automaticidad
La percepción del lenguaje se mantiene constante aun cuando ciertas propiedades físicas de la estimulación varíen (se reconocen como iguales secuencias de habla con distinta frecuencia, acento, etc.), mostrando un sistema de percepción que es altamente flexible y adaptativo, a la vez que automático.

PROBLEMAS FUNCAMENTALES EN ESTE CAMPO (PERCEPCIÓN DEL HABLA)

Constancias perceptivas en la tarea de conversión acústico-fonémica:
La percepción del habla es un proceso que permite la transformación de un patrón de energía acústica en una representación mental de la configuración estimular (fonemas y sonidos) que produce esa energía.
El sistema perceptivo extrae de estas variaciones sonoras unas constancias perceptivas que corresponden a las unidades lingüísticas (fonemas).

Propiedades físicas de los sonidos del habla. La espectrografía como técnica de análisis:
La espectrografía permite examinar las propiedades físicas de los sonidos. Permite obtener una representación visual del habla o espectrograma que recoge la composición de frecuencias de la voz en unidades de tiempo.
Algunas secuencias de sonidos de habla se descomponen en bandas de frecuencia (expresadas en hercios) denominados formantes. Los formantes constan de la transición del formante (que es curva, en la cual el valor de la frecuencia va modificándose progresivamente) y la parte estable del formante (que es plana).
Esta técnica ha demostrado que no siempre cada fonema corresponde al mismo conjunto de unidades acústicas, dando lugar al problema de segmentación y ausencia de invarianza.

Problema de la segmentación y de la ausencia de invarianza:
  • Segmentación: la señal del habla es continua, mientras que los sonidos del habla se perciben como discontinuos. Por ejemplo, si en una sílaba separamos el fragmento del espectro de consonante del espectro de vocal y presentamos al sujeto sólo la parte de la consonante, éste es capaz de adivinar la vocal.
  • Ausencia de invarianza: falta de correspondencia entre fragmentos de señal acústica y fonemas discretos. Los segmentos del habla son continuos, influidos por el contexto acústico. Carecen de propiedades invariantes, pese a ello los oyentes captan las constancias perceptivas e identifican los sonidos. Es decir, la señal física no tiene unas características iguales para los mismos fonemas, según el contexto las señales son diferentes, aunque el oyente identifica el mismo fonema.
Concepto de demandas co-articulatorias del habla:
Al pronunciar una secuencia de fonemas no se articula cada fonema por separado, sino que los órganos articulatorios ajustan su posición para producir el fonema anterior y posterior. Por ejemplo, al pronunciar el fonema /n/ la posición de la lengua es más contraída en co[n]trario, más en contacto con los alvéolos en co[n]ato, y más en reposo en co[n]vocatoria.
El concepto de demanda co-articulatoria del habla es el origen de los problemas de segmentación; de ausencia de invarianza; de la presencia indisociable en el habla de características acústicas como frecuencia fundamental que establece el tono de vos y la intensidad del habla; y de que la percepción del habla se mantiene intacta aun cuando se produzca una pérdida de información acústica por efecto del ruido.

PROCESOS BÁSICOS EN LA PERCEPCIÓN DEL HABLA

Etapas, basadas en consideraciones lingüísticas y no psicológicas. Problemas que esto plantea:
Análisis auditivo periférico: se produce una descodificación de las señales del habla en el sistema auditivo periférico. Los mecanismos de descodificación son de dos clases:
  1. Neuroacústicos: por ejemplo, patrones de descarga de fibras nerviosas que sintonizan con atributos de la señal de habla que se hayan presentes como las consonantes de principio de sílaba /pa/, /ga/, etc.
  2. Psiocacústicos: más abstractos, e independientes de sus correlatos fisiológicos. Por ejemplo los filtros paso-banda, que efectúan transformaciones de la señal mediante el análisis de sus componentes.
Análisis auditivo central: El cometido es extraer de la señal una serie de patrones espectrales (frecuencia fundamental, dirección, transiciones de formantes) y temporales (desfase entre eventos) y los almacena en la memoria ecoica. El análisis de estos patrones da lugar a claves acústicas que forman los fonemas.
Análisis acústico-fonético: Se efectúa un procesamiento lingüístico de la señal. Se trata de identificar los segmentos o fonemas del habla. Las claves acústicas se acoplan a los rasgos fonéticos que son representaciones abstractas mediadoras entre los planos físicos (acústico) y lingüístico (fonético).
  1. Permite descubrir las constancias perceptivas (categorización perceptiva del habla), que nos permiten identificar sonidos discretos, resolviéndose los problemas de segmentación y variabilidad.
  2. Existen en este nivel unos detectores de rasgos o mecanismos neurales especializados en la identificación de rasgos fonémicos distintivos (sonoridad, nasalidad, etc.).
Análisis fonológico: los rasgos y segmentos fonéticos identificados en la anterior etapa son convertidos en representaciones abstractas de los sonidos (segmentos fonológicos) que se combinan para formar unidades superiores, como sílabas y palabras.
  1. En este nivel ciertas distinciones fonéticas se convierten en variaciones alofónicas del mismo fonema, explicando así ciertos fenómenos de asimilación o transformación fonética.
  2. Como resultado del análisis fonológico aparece una secuencia lineal de fonemas, cuyos componentes están organizados jerárquicamente: el inicio u onset (grupo consonántico inicial optativo), y la rima o rime y la coda (terminación consonántica opcional).
Problemas que plantean las etapas consideradas lingüísticamente y no psicológica:
No hay acuerdo sobre la realidad psicológica de estas etapas.
No hay acuerdo sobre el curso temporal de los cuatro procesos y sus interacciones.

Enfoques teóricos que se derivan de la consideración de la representación fonética y fonológica como constructos lingüísticos:
Hay autores que niegan la existencia de un nivel independiente de representación fonética, debido a la dificultad de hallar un acoplamiento entre claves acústicas y segmentos fonéticos. Optan por aplazar la solución de la ausencia de invarianza hasta un nivel de procesamiento superior (proceso de acceso al léxico). Esto puede llevar a considerar que si eliminamos el nivel fonético no habrá razones para postular un nivel fonológico de procesamiento, pues se carecería de la representación de entrada a ese nivel. Se considera que las representaciones fonéticas y fonológicas no juegan un papel psicológicamente necesario durante el procesamiento de la señal, sino a posteriori, cuando el oyente hace uso de esta información.
Otros se centran en las explicaciones que sí postulan la transformación acústico-fonéticas. Estas representaciones no se encuentran presentes en la señal del habla, sino que son suministradas por el perceptor a partir de información de su memoria. Así, aunque los procesos de transformación acústico-fonética estén dirigidos inicialmente por propiedades de la señal (proceso abajo-arriba), también dependen del uso de información superior (proceso arriba-abajo).

TEORÍAS ACERCA DE LA INTEGRACIÓN ACÚSTICO-FONÉTICA

Teoría motora de la percepción del habla: (Lieberman y cols.)
La identificación fonética (percepción de señales) se efectúa mediante un sistema de procesamiento especializado en la percepción de sonidos de habla distinto del sistema empleado en la percepción de los restantes estímulos auditivos, lo que determina un modo específico de procesamiento (modo del habla) que sintoniza las señales auditivas con las propiedades acústicas y está adaptado a un código donde la estructura fonética del lenguaje se impone a las propiedades acústicas. Este código se define en términos de las propiedades articulatorias y coarticulatorias de los sonidos. Es decir, existe un vínculo directo entre los sistemas de percepción y producción del habla que permite al oyente determinar qué gestos articulatorios realiza el hablante y con ello cuáles son los segmentos fonéticos que produce. Por tanto, la idea central es que el habla se percibe gracias a nuestro conocimiento tácito o inconsciente del modo en que se produce.
Descripción del mecanismos de análisis por síntesis:
El mecanismo básico de la percepción en esta teoría es el análisis por síntesis, en el cual el análisis se refiere a los procesos de extracción de información de la señal, y síntesis a los procesos de generación interna de señales a partir de claves acústicas avanzadas y del conocimiento de las propiedades articulatorias de los sonidos. Este mecanismo explica los problemas de:
  1. Variabilidad: se resuelve por medio de la integración interactiva de claves acústicas con representaciones fonémicas discretas articulatorias.
  2. Procesamiento de propiedades globales del habla (niveles superiores de representación), como la estructura suprasegmental (acentos, entonación, etc.) y métrica (silabificación) que influyen en los procesos de integración acústico-fonética.
Pruebas a favor de esta teoría:
  1. Según Ladatoped y Broadbent el sistema perceptivo se ajusta a las características acústicas de la fuente de emisión. Así, los juicios varían en función de la información previa sobre las características de la voz.
  2. Según del fenómeno de percepción duplex las transiciones de los formantes, o variaciones en las bandas de frecuencias de los sonidos, sirven para discriminar entre categorías fonéticas diferentes. Así, cuando la transición del formante es percibida como el modo del habla se aprovecha para identificar fonemas, cuando no es así, es objeto de un análisis acústico en el sistema auditivo.
  3. Estudio con bebés: los oyentes, incluso bebés, emplean cualquier información sobre las propiedades articulatorias del habla. La información visual (imagen de una persona hablando) interactúa con la auditiva (señal acústica del hablante).
  4. Efecto de McGurk: cuando a un sujeto perceptor se le presentan estímulos auditivos y visuales contradictorios fonéticamente, adoptan de forma inconsciente una solución de compromiso entre ambas fuentes de estimulación.
Teoría auditiva de la percepción del habla:
Según esta teoría la percepción del habla no requiere ningún sistema especializado de procesamiento, sino que el habla se percibe por los mismos mecanismos que cualquier otro estímulo auditivo. Este no es un paradigma unificado, sino que reúne una variedad de modelos y explicaciones en cierta medida divergentes entre sí.
COMPARACIÓN ENTRE TEORÍA MOTORA Y TEORÍA AUDITIVA
TEORÍA MOTORA TEORÍA AUDITIVA
- La identificación fonética se efectúa por el sistema modo de habla, éste es específico de estímulos concretos y distinto al de otros estímulos. - La identificación fonética se lleva a cabo por mecanismos auditivos generales. No es un paradigma unificado, por lo que cada modelo puede proponer mecanismos diferentes.
- La percepción del habla es específica de dominio y específica de la especie. - Rechaza la idea de la percepción del habla como específica de dominio y de especie.
- Postula un mecanismo de análisis por síntesis para la extracción de la señal y generación interna de sonidos. - Rechaza los mecanismos de análisis por síntesis por otros más analíticos. Procesamiento más temprano de la señal, en niveles más auditivos.

Consecuencias de esta teoría:
  1. Hay autores para quienes la señal del habla no es tan variable, sino que existen propiedades invariantes que permiten un acoplamiento microestructural entre estímulos físicos y representaciones fonémicas.
  2. Otros autores sostienen que estas propiedades invariantes emergen en niveles macroestructurales, donde la señal del habla del habla estimula patrones neurosensitivos que representan formas léxicas de memoria.
Modelo de Klatt: sostiene que las propiedades invariantes de la señal acústica no emergen en el nivel microestructural, sino en niveles macroestructurales, y en concreto en el nivel léxico.
  1. Las representaciones léxicas están formadas por plantillas espectrales (la representación de una secuencia ideal de claves acústicas). A media que el oyente recibe fragmentos de la cadena hablada, va computando sobre la marcha representaciones espectrales de la señal (difonos). La característica fundamental (tanto de plantillas como de difonos) es que está influida por el contexto. Así se resuelve el problema de la ausencia de invarianza.
  2. Las representaciones no corresponden a unidades fonéticas discretas. Así, no existe ningún nivel de representación fonético/fonológico, sino que del nivel acústico se accede directamente al nivel léxico: acceso léxico a partir de espectros.
Si tenemos en cuenta que la percepción del habla forma parte de un conjunto de procesos orientados a la comprensión de mensajes lingüísticos con significado, los problemas serían:
  1. La segmentación fonémica.
  2. Ausencia de invarianza.
  3. Restricción suprasegmental
  4. Conocimiento léxico.
  5. Variables sintácticas y semánticas.
LA PERCEPCIÓN DEL HABLA CONTINUA

Debido a las restricciones de la coarticulación, el habla es percibida de forma continua. Se trata de un proceso activo determinado por información física, lingüística y extralingüística. Esto tiene ciertas consecuencias:
El procesamiento de la señal acústica no tiene que ser exhaustivo (identificación de todos y cada uno de los segmentos léxicos de la entrada sensorial) para acceder a niveles como reconocimiento de palabras.
A partir de niveles fonéticos se produce una interacción entre procesos de identificación de segmentos fonéticos a partir de claves acústicas y procesos de acceso léxico a partir de representaciones fonológicas.

Ejemplo de interacción entre procesos perceptivos y procesos lingüísticos de
orden superior:
El conocimiento de ciertas peculiaridades prosódicas y fonológicas de las secuencias fonéticas de castellano, como por ejemplo que las palabras de contenido tengan una sílaba tónica/acentuada permite al oyente anticipar eventos acústicos.
Es probable que información de orden superior (léxica, sintáctica, semántica) intervenga también en los procesos primarios de análisis de la señal. En el estudio de Pllack y Picket se presenta a los sujetos fragmentos de una conversación (palabras extraídas de una oración) y se les pide que identifiquen dichas palabras. No sobrepasan el 50% de palabras correctas. Parece debido a que la señal de habla permanece ininteligible hasta que el perceptor no dispone de suficiente información contextual par formular hipótesis sobre el contenido fonológico del mensaje.

Tres pruebas evidencian el influjo de los procesos superiores de reconocimiento sobre mecanismos de procesos perceptuales elementales:
  • Efecto de restauración de fonemas: sustitución inconsciente del material fonético, ausente de la señal acústica, por un estímulo de no habla presente en la señal.
  • Restauración de errores (tarea de seguimiento): el sujeto inconscientemente sustituye estímulos de habla erróneos por formas correctas. Parece ser que ello ocurre tanto con información léxica como sintáctica y fonética.
  • Fenómeno de escucha selectiva: cuando a un sujeto se le somete a una tarea de escucha dicótica se registran unos efectos originados por el material presentado por el oído no atendido (el sujeto no escucha el significado del mensaje, el mensaje no atendido puede provocar interferencias en la tarea, etc.)
Conclusiones:
Los procesos de reconocimiento del habla están abiertos a influencias de niveles superiores de procesamiento (información suprasegmental –prosódica y métrica–, léxica, sintáctica y semántica) que impone restricciones al habla continua, y que operan de forma automática e inconsciente.
De ello no se puede concluir que la percepción del habla sea un proceso distinto de la percepción de sonidos aislados, sino un proceso determinado por restricciones de las propiedades físicas de la señal y restricciones de las representaciones lingüísticas que se recuperan en niveles superiores.

Compartir