• La necesidad de crear modelos fonéticos variados con los que comparar los enunciados que llegan al reconocedor requiere de la selección de un elevado número de muestras de habla (88) procedente de diversos locutores y en diversas situaciones y que corresponderá al logopeda, o bien nos podemos servir de voces depositadas en la red, como las ofrecidas por la European Language Recources Associtation (ELRA) en:
    http://www.unilat.org/dtil/es/redes_inter_elra.htm; o los sonidos contenidos por el propio CNICE que ofrece voces, ruidos, sonidos en formato .wav y mp3 libres de uso, para poder disponer de las mismas en nuestros patrones de voz:

Tabla 3.4.a. Dr Speech versión 4.0

Dr. Speech 4.0

F 0

Maximo Tiempo de Fonación

Astronauta, fresa, insecto, girasol

Pitch

Variación de tonos

Barco – desierto, arboles, playa

Loudness

Subida y Bajada de tonos

Payaso, jirafa, luna, fuego.

Phonetic

Ejercicios de fonética

 

Voicing Onset

Trabajar con dos y tres tonos

Huevo, zapato, piscina, florecer

Voicing

Trabajar la nasalización y el soplo

Flor de loto, coche, habitación, oso

Aunque será también el mismo autor quien establezca otros aspectos positivos del uso de las nuevas tecnologías en la intervención de la voz:

  • La “retroalimentación visual” puede resultar interesante para muchos pacientes, puesto que será un complemento, no el único, a la corrección fonológica:
    • Potenciando actividades de imitación de modelos por aproximación sucesiva, potenciará el acercamiento al patrón vocal establecido o la tentativa para imitar los parámetros críticos (por ejemplo, los niveles de la amplitud, la tasa de discurso, la gama del tono, etc.) Entonces se pueden comparar visualmente y cuantitativamente, la repetición de audiofrecuencia permite el clínico y a cliente para escuchar críticamente conductas importantes de discurso/voz.
    • Acompañando el estimulo visual conjuntamente con el auditivo, tal y como sucede con el programa Sona-igual, Modelo 5127, de la casa Kay Pentax, (ver imagen), consistente en un programa de tiempo real que proporciona un feed-back del espectro de discurso, del espacio de vocal, y de los valores de formante, puesto que proporciona un gráfico y una audiofrecuencia de la reacción de las expresiones del objetivo y el paciente.
    • Realizando efectos (brillo, saturación de color) sobre imágenes animadas o en video, como sucede en la actividad “Scopeview” del Dr. Speech 4.0.
      La consecución del criterio de similaridad o umbral de aceptación, de modo que el reconocedor acepte enunciados más o menos parecidos al original, logrando la reducción de la “distancia” entre el modelo a imitar y la emisión propia (alineación o sincronización con el enunciado) (89).

Figura 3.4.d. Espectograma

Descripción de los elementos que definen los gráficos del espectrograma: tono o frecuencia, duración e intensidad

  • El reconocimiento del habla facilita al paciente una evaluación global de la pronunciación y una indicación de los fragmentos de su producción en la que se encuentran mayores discrepancias respecto al modelo propuesto. Aunque algunos programas no ofrecen ninguna indicación de cómo llegar a corregir sus errores, debiendo ser el propio logopeda quien haga dicha función.

88. Llisterri, J. (2003) hace mención a la creación de un hábeas a partir del cual extraer modelos de duración de cada uno de los alófonos, patrones melódicos, que puedan aplicarse según las características fonéticas, sintácticas, semánticas y pragmáticas del enunciado.

89. La profesora Nancy Aguas García, M.C. (2004) determina una serie de prescripciones que van a restringir el desarrollo del entrenado del sonido, haciendo referencia al lugar, a los Hhz en que se grabarán los ficheros .wav y a la creación de la base de datos o, mejor dicho,  de voces, así como el hecho de contener, tanto porciones de la señal de voz, pasando por las palabras y llegando a los fonemas.

retroceder avanzar