Ir al contenido principal

WaveNet, un sistema que ayuda a que las máquinas «hablen» como un ser humano



Invstigadores de DeepMind, empresa propiedad de Alphabet, anuncian un software que puede revolucionar la forma en la que los procesos informáticos y automátizados se relacionan con las personas gracias a un lenguaje más natural.

 
La Inteligencia Artificial es muy controvertida. Existe un crudo debate acerca de los posibles riesgos que puede provocar en un futuro y las ventajas que posibilitan para el desarrollo de la economía. Los seres humanos ya se comunican, desde hace tiempo, con las máquinas para determinados servicios y trabajos. Y, en los últimos tiempos, gracias a asistentes virtuales como Google Now, Cortana o Siri la sociedad ha tenido al alcance del bolsillo la oportunidad de interaccionar por voz con los aparatos electrónicos. 


Los avances tecnológicos en esta materia no echan el freno de mano. De cara a materializar un acercamiento de la voz artificial hacia la más natural, investigadores de DeepMind, empresa propietaria del gigante de internet, han anunciado la creación de WaveNet, un programa informático capaz de generar voz sintética basado en Inteligencia Artificial y que se comporta de una similar a la de un ser humano, un paso importante para hacer evolucionar las máquinas y los procesos automatizados. Según sus creadores, puede permitir que una manera hable exactamente igual que una persona.


Esta plataforma, que funciona como un sistema neuronal, rompe con la tradicional naturaleza robótica de la voz programada en los aparatos electrónicos para dotarle de naturalidad y matices propios del ser humano. El equipo de ingenieros asegura que el software puede «imitar a la perfección» una voz humana. Las muestras de voz se ha impulsado en diversos programas informáticos como Google Voice desde hace bastante tiempo, pero sintetizar y acercarse a una mayor naturalidad está resultando un gran desafío. Hasta el momento, la técnica común es una lectura virtual, es decir, una concatenación de texto a voz (TTS, en sus siglas en inglés) que combina fragmentos de un discurso grabado para generar las frases, que un sistema devuelve en función de la interacción realizada. 


El principal problema -dicen- es que este método no es capaz de alterar y modificar la base de datos y fragmentos existentes para crear algo desde cero, lo que provoca la situación actual: una voz «robótica» y enlatada. Mientras, en otros procesos informáticos se han basado en un método de texto a voz paramétrico que codifica la voz. El resultado, sin embargo, es incluso menos natural, dicen los investigadores. Y hacia la corrección de esta situación es adonde va WaveNet.


Para ello utiliza un «enfoque totalmente diferente», ya que en lugar de analizar, cruzar y devolver el audio almacenado en el software el sistema, basado en Inteligencia Artificial, es capaz de aprender. La idea es que se mueva sobre un contexto determinado, con sus matices lingüísticos, resolviendo incluso modos de expresión como la ironía o el sarcasmo, tal y como funcionan los sistemas neuronales. Logra este cometido al trabajar con 16.000 secuencias de palabras por segundo, con lo que el sistema puede generar sus propias muestras de audio, sin la intervención del ser humana. Utiliza una serie de estadísticas para predecir realmente qué pieza de sonido necesita en cada situación. 


Fuente: http://www.abc.es

www.conectareus.com


Comentarios

Entradas populares de este blog

«Hackeo» masivo a cajeros automáticos de Europa para que escupan dinero sin control

La firma rusa de seguridad cibernética Grupo IB desvela en un informe cómo la ciberdelincuencia ha conseguido atacar de forma remota varias máquinas en más de una docena de países europeos. Entre ellos, España. Hace tiempo que los cajeros automáticos son objetivo de los ciberdelincuentes. Y cada vez más, este tipo de ataques se diseñan y se ejecutan con las mejores técnicas. Muestra de ello es la última hazaña que ha descubierto la firma rusa de seguridad cibernética Grupo IB : la ciberdelincuencia ha conseguido atacar de forma remota varios cajeros automáticos en más de una docena de países europeos. Entre ellos, España. Los ataques se han producido a lo largo de este año mediante la utilización de un «software» malicioso que obliga a las máquinas a escupir dinero en efectivo, según ha explicado la compañía en una información que recoge la agencia Reuters. Diebold Nixdorf y NCR Corp, los dos mayores fabricantes de cajeros automáticos del mundo, han dicho que eran conscientes de lo

Zebra anuncia el TC51 y el TC56, Smartphones de corte industrial

¿Cómo es un Smartphone enfocado al uso industrial? Zebra Technologies ha anunciado sus nuevos TC5 Series, con sistema operativo Android y Zebra Mobility Extensions (Mx) para potenciar la seguridad. Zebra Technologies ha anunciado sus nuevos equipos ultra portátiles para entornos de trabajo de corte industrial, el TC51 y el TC56, ambos con sistema operativo Android y con toda una serie de especificaciones propias de condiciones laborables un tanto exigentes y específicas. ¿Qué cualidadades clave diferencian este tipo de terminales móviles comparado con Smartphones "corrientes" enfocados al gran consumo? · Resistencia ante caídas de hasta 1,5 metros. · Capacidad para funcionar entre -10ºC y +50ºC, y soportar condiciones de humedad entre un 5% y 85% sin condensación. · Soportar un shock termal comprendido entre -40ºC y 70ºC. · Active Edge Touch Zone, que permite lanzar funciones específicas mediante accesos directos creados en los bordes de

Así son los iPhone 6s y 6s Plus y sus pantallas 3D Touch

La nueva generación de iPhone no ha defraudado, con nuevos modelos que destacan por incorporar su nueva modalidad de manejo sobre sus pantallas multitáctiles con 3D Touch. Las aplicaciones comenzarán a sacar partido con acciones avanzadas al aplicar diferente presión sobre las pantallas. La  implementación   similar que Apple había llevado a cabo en el nuevo Macbook de 12 pulgadas de la firma, y extendido al touchpad de los MacBook Pro, ahora se ha hecho realidad en las pantallas táctiles de los nuevos iPhone 6s y iPhone 6s Plus. Se trata de pantallas con tecnología 3D Touch que van a permitir ejecutar acciones o desplegar accesos directos a determinadas aplicaciones que utilizamos en el día a día, como pueda ser Messages, Correo, Instagram y muchos otros. Para lanzar una determinada aplicación de manera rápida, una simple acción nos permitirá previsualizar una foto o abrir un enlace web. Phil Schiller, vicepresidente senior de marketing de Apple ha destacado durante su pres