Speech Synthesis Markup Language SSML - Parte 1
El software de traducción de voz a voz escrito por un equipo de Tailandia ganó la categoría principal de un concurso de desarrollo de software patrocinado por Microsoft para estudiantes, el Imagine Copa, el jueves.
Los cuatro estudiantes de la Universidad Kasetsart en Bangkok ganaron la categoría de diseño de software, por delante de otros seis finalistas. Trabajaron 12 horas al día durante seis meses para completar su entrada, confiando en una planificación estricta para resolver los problemas logísticos causados por los disturbios y la inestabilidad política en su país de origen.
Los participantes de Imagine Cup debían usar las plataformas de desarrollo de software de Microsoft para además, una o más de las Metas del Milenio de las Naciones Unidas, que incluyen reducir a la mitad la pobreza extrema, detener la propagación del VIH / SIDA y proporcionar educación primaria universal, todo en 2015.
El primer premio de la competencia, de $ 25,000, atrajo entradas de 325,000 estudiantes, de acuerdo con Microsoft. De ellos, 400 llegaron a la ronda final, que ofreció un premio total de $ 240,000 en cinco categorías de competencia y seis premios.
El software del equipo tailandés EyeFeel combina reconocimiento de voz, reconocimiento facial y animación de lenguaje de señas para ofrecer real traducción del tiempo para personas con problemas de audición.
"El módulo de reconocimiento de voz capta el discurso y convierte la oración para que encaje con la gramática del lenguaje de señas", dijo el capitán del Team Skeek Pichai Sodsai a IDG News Service. "El lenguaje de señas se anima en la pantalla, mientras que el reconocimiento facial se usa para distinguir diferentes hablantes". El software también incluye globos de texto como un cómic, todo en tiempo real.
Para que el software sea viable, el equipo necesitaba hacer un uso eficiente de los recursos. "Hacemos un uso extensivo del código de subprocesamiento múltiple para combinar todas las partes del software en una, que funcione en su totalidad", dijo Sodsai. "Cada parte debe funcionar junto a la otra. No podría hacerse sin eso."
Incluso ahora, hay algunos problemas con los que el equipo debe lidiar. El lenguaje de señas tiene problemas para mantenerse al día con el lenguaje hablado, y durante la demostración, la animación y el texto escrito se retrasaron significativamente.
"Es un gran desafío lidiar con eso", dijo Sodsai. "Nos ocupamos de la mayor parte del problema al permitir que el software acorte automáticamente la oración". Cada oración vuelve a su significado principal, lo que facilita que el software se mantenga al día. Otra limitación es que el software actualmente solo es compatible con el lenguaje de señas estadounidense y el inglés. "Cambiar de idioma sigue siendo una gran tarea", dijo Sodsai. "Tendríamos que escribir un módulo completo para eso".
Según Sodsai, los miembros del equipo tardarán un año más en perfeccionar el sistema. Hasta entonces, siguen buscando compradores potenciales.
"El diseño es muy modular, por lo que podemos agregar y eliminar funciones cuando sea necesario", dijo. "Estamos planeando utilizar un esquema de licencia basado en componentes básicos gratuitos y opciones adicionales pagas".
El equipo Skeek estimó que hay alrededor de 350 millones de personas en todo el mundo con problemas de audición. El principal mercado sería la educación, donde el software puede ser utilizado por personas sordas y casi sordas para seguir conferencias y presentaciones.
EyeFeel se adelantó a un equipo serbio que desarrolló una interfaz de navegación y navegación manos libres para personas con formas severas de parálisis. El tercer lugar fue tomado por Nueva Zelanda, con una aplicación para convertir archivos a sonidos que pueden ser transmitidos a largas distancias usando las bandas FM y AM a lugares donde hay poca o ninguna conectividad a Internet. Las computadoras portátiles OLPC (One Laptop Per Child) pueden recibir los archivos a través de una radio conectada y convertirlos a su forma original.
El equipo taiwanés SmarterME ganó la categoría de competencia Desarrollo integrado con un medidor de energía que rastrea el consumo de energía de los dispositivos individuales y electrodomésticos. La categoría Diseño de juegos fue ganada por un equipo de Filipinas.
No todos los proyectos tendrán un futuro comercial, según Jon Perera, gerente general de Microsoft Education Group.
"En términos de aplicabilidad en el mundo real, parte del software [tiene el potencial de] aterrizar en el mercado real y tendrá el impacto que los estudiantes quieren que tenga. Y, ciertamente, vemos una gran cantidad de software que no necesariamente se convertirá en una solución comercial o en una solución viable a largo plazo en el mercado ", dijo.
La exploración en sí misma es un punto de partida para las discusiones sobre el papel de la tecnología en la resolución de problemas, dijo Perera.
"Algunas soluciones ya están siendo utilizadas por los gobiernos. El equipo de Jordania construyó un 'sistema de seguimiento de la desertificación', que es placa de chipset empotrada que rastrea el crecimiento del desierto con el tiempo ", dijo. "El gobierno de Jordania se está asociando con ellos y está patrocinando al equipo para que rastree varios sitios".
Google ajusta la voz para mantener el correo de voz fuera de los resultados de la búsqueda
Google ha ajustado su servicio de voz para que las transcripciones del correo de voz indexados por los motores de búsqueda.
Microsoft Anna, el nuevo reemplazo de voz de Texto a voz, en Windows 7
Microsoft Anna es el nuevo texto- Remplazo de voz to-Speech en Windows Vista y Windows 7. Anteriormente en Windows XP o Windows 2000, tenía Microsoft SAM.
Use el reconocimiento de voz y voz Microsoft TellMe en Windows Phone
Windows Phone le permite usar voz para operar y realizar tareas simples pero útiles en su Windows Teléfono. Con esta función puede realizar una llamada, volver a marcar, enviar mensajes de texto SMS, llamar a su correo de voz, abrir una aplicación y buscar en la web.