Invstigadores
de DeepMind, empresa propiedad de Alphabet, anuncian un software que puede
revolucionar la forma en la que los procesos informáticos y automátizados se
relacionan con las personas gracias a un lenguaje más natural.
La
Inteligencia Artificial es muy controvertida. Existe un crudo debate acerca de
los posibles riesgos que puede provocar en un futuro y las ventajas que
posibilitan para el desarrollo de la economía. Los seres humanos ya se
comunican, desde hace tiempo, con las máquinas para determinados servicios y
trabajos. Y, en los últimos tiempos, gracias a asistentes virtuales como
Google Now, Cortana o Siri la sociedad ha tenido al alcance del bolsillo la
oportunidad de interaccionar por voz con los aparatos electrónicos.
Los avances
tecnológicos en esta materia no echan el freno de mano. De cara a materializar
un acercamiento de la voz artificial hacia la más natural, investigadores de
DeepMind, empresa propietaria del gigante de internet, han anunciado la creación de WaveNet, un programa
informático capaz de generar voz sintética basado en Inteligencia Artificial y
que se comporta de una similar a la de un ser humano, un paso importante para
hacer evolucionar las máquinas y los procesos automatizados. Según sus
creadores, puede permitir que una manera hable exactamente igual que una
persona.
Esta
plataforma, que funciona como un sistema neuronal, rompe con la tradicional
naturaleza robótica de la voz programada en los aparatos electrónicos para
dotarle de naturalidad y matices propios del ser humano. El equipo de
ingenieros asegura que el software puede «imitar a la perfección» una voz
humana. Las muestras de voz se ha impulsado en diversos programas informáticos
como Google Voice desde hace bastante tiempo, pero sintetizar y acercarse a una
mayor naturalidad está resultando un gran desafío. Hasta el momento, la técnica
común es una lectura virtual, es decir, una concatenación de texto a voz (TTS,
en sus siglas en inglés) que combina fragmentos de un discurso grabado para
generar las frases, que un sistema devuelve en función de la interacción
realizada.
El principal
problema -dicen- es que este método no es capaz de alterar y modificar la base
de datos y fragmentos existentes para crear algo desde cero, lo que provoca la
situación actual: una voz «robótica» y enlatada. Mientras, en otros procesos
informáticos se han basado en un método de texto a voz paramétrico que codifica
la voz. El resultado, sin embargo, es incluso menos natural, dicen los
investigadores. Y hacia la corrección de esta situación es adonde va WaveNet.
Para ello
utiliza un «enfoque totalmente diferente», ya que en lugar de analizar, cruzar
y devolver el audio almacenado en el software el sistema, basado en
Inteligencia Artificial, es capaz de aprender. La idea es que se mueva sobre un
contexto determinado, con sus matices lingüísticos, resolviendo incluso
modos de expresión como la ironía o el sarcasmo, tal y como funcionan los
sistemas neuronales. Logra este cometido al trabajar con 16.000 secuencias de
palabras por segundo, con lo que el sistema puede generar sus propias muestras
de audio, sin la intervención del ser humana. Utiliza una serie de estadísticas
para predecir realmente qué pieza de sonido necesita en cada situación.
Fuente: http://www.abc.es
www.conectareus.com
Fuente: http://www.abc.es
www.conectareus.com
Comentarios
Publicar un comentario