Microsoft acaba de anunciar una nueva mejora en el sistema de reconocimiento de voz de Windows Phone vía Bing. En reciente post del blog de Bing se comentó que las características de voz a texto de Bing eran dos veces más rápidas y un 15% más exactas gracias al uso de inteligencia artificial basada en la biología.
En el vídeo que abre este artículo se puede ver la demostración y cómo tanto en situaciones normales como también en situaciones con ruido el nuevo motor de reconocimiento en Windows Phone se comporta mucho mejor, ofreciendo resultados correctos y de una manera mucho más rápida que su predecesor reseñó Xatakawindows.com .
Para ello no se han utilizado millones de muestras de voces con ruido que se intentan comparar en tiempo real sino que se ha enseñado a la máquina a entender la voz humana en cualquier situación. Para ello hacen uso de lo que se conoce como deep neural networks (DNN). Los científicos han hecho uso de cómo es el patrón de reconocimiento de nuestro cerebro y lo han utilizado como inspiración para implementar un sistema capaz de discernir qué se dice en cualquier situación.
Obviamente hace falta mucho más que eso, detrás de todo el sistema hay innumerables funciones matemáticas, superordenadores y muchas muestras de sonido hasta que se ha dado con el patrón exacto, pero la realidad final es, como se puede ver en el vídeo, un resultado impresionante.