¡Vea nuestra tecnología en acción!
Está en: Inicio > Speech Analytics > Enfoques Tecnológicos

Speech Analytics

Historia

Enfoques Tecnológicos

ROI de Speech Analytics

Enfoques Tecnológicos para Speech Analytics

Son varios los enfoques tecnológicos aplicados al problema de analizar conversaciones entre personas para extraer su contenido hablado, lo que en ellas se dice. Fundamentalmente hay tres tipos de tecnologías en uso:

  • Puramente fonética: transforma el habla de las conversaciones en fonemas y, posteriormente, realiza las búsquedas sobre éstos.
  • Trascripción: realiza una conversión completa del audio en texto, que es lo que almacena y a lo que aplica después las búsquedas.
  • Escucha Deliberada (Deliberate Listening): analiza  las conversaciones con un objetivo en mente, es decir, sabiendo más o menos qué quiere encontrar.

Los resultados alcanzados con cada una de estas tecnologías difieren grandemente, sobre todo en lo tocante a la precisión con la que encuentran lo que se quiere saber.

  1. La tecnología fonética pura tiene un punto a su favor: la rapidez con la que analiza las llamadas. Todos los demás están en su contra: su precisión es muy baja y la complejidad de las búsquedas que permite es muy limitada, pues básicamente se reducen a buscar palabras sueltas (word-spotting), lo que no sirve prácticamente para nada.
  2. Las tecnologías de trascripción parecen la panacea: una vez en texto, la flexibilidad del tratamiento de las llamadas sería enorme. El problema es que la trascripción completa de audio independiente del hablante y con calidad telefónica ofrece una precisión muy pobre, nunca superior al 50%. Esta tecnología se basa en productos de dictado (los que permiten dictar cartas al PC, por ejemplo); éstos logran una precisión apenas aceptable en condiciones ideales: para un hablante concreto que ha entrenado el sistema y para calidad de audio multimedia (44 kHz en comparación con los 8 kHz del teléfono).
  3. La tecnología de Escucha Deliberada (patentada por Utopy) procesa y analiza las llamadas de una sola vez, mientras que las otras lo hacen en dos pasos (convertir a fonemas o a texto y luego buscar). En cada paso del proceso se pierde información, pues la tecnología de reconocimiento no es exacta sino estadística; en dos pasos se pierde mucho más que en uno. Por otro lado, dar expectativas sobre lo que se quiere encontrar al motor que analiza las llamadas aumenta muchísimo la precisión, pues puede dirigir su atención y dedicar más recursos de computación a las partes relevantes de la conversación.

Fonetic utiliza los productos de Utopy, basados en su tecnología de Escucha Deliberada. La precisión que alcanzamos está entre el 85 y el 99% para categorías bien definidas. Para la inmensa mayoría de las aplicaciones de Speech Analytics, en las que se analizan miles de llamadas todos los días, una precisión por encima del 85% es ya adecuada. Logramos una precisión tan alta porque le hemos dicho al analizador, más o menos, qué queremos buscar. Es como cuando estamos en una fiesta con mucha gente, si alguien dice nuestro nombre o cita un tema que nos interesa particularmente, es mucho más probable que le oigamos y prestemos atención que si habla de cualquier otra cosa.

 

¿Cómo se mide la precisión en Speech Analytics?

La exactitud de un sistema de Speech Analytics tiene dos componentes: lo preciso que es (“Precision”) y lo completo que es (“Recall”). La “Precision” nos dice, de entre todas las llamadas que hemos encontrado con un cierto evento, cuántas efectivamente lo contienen. El “Recall” nos dice, de entre todas las llamadas que existen con un evento, cuántas hemos encontrado correctamente. Por ejemplo, un día concreto hay 142 llamadas de cancelación a un Contact Center; el sistema de Speech Analytics ha categorizado 128 llamadas como de cancelación, de las cuales sólo 119 lo eran de verdad.  La “Precision” del sistema es del 93% (119/128), y su “Recall” del  83,8% (119/142).

Cuanta más “Precision” queramos, menor será el “Recall”, pues hemos de ser muy estrictos en el reconocimiento. Si relajamos la exigencia, identificaremos más llamadas, pero inevitablemente entrarán algunas que no deberían. La relación entre “Precision” y “Recall” sigue pautas que dependen de la tecnología empleada.

 

Aviso Legal - © 2009 Fonetic Solutions, S.L. Todos los derechos reservados.