Car-tech

Con S-Translator, Samsung apunta a alcanzar un viejo objetivo de la industria en tiempo real

Cómo recuperar un contacto borrado en Android

Cómo recuperar un contacto borrado en Android

Tabla de contenido:

Anonim

El Samsung Galaxy S4 se enviará a 155 países para el final del mes próximo, y su traducción de voz en tiempo real para ayudar a las personas a comunicarse a través de las fronteras puede ser una de sus características más ambiciosas.

Traducir conversaciones de voz en tiempo real ha sido un objetivo para los dispositivos y el software durante años, y Samsung afirma lo he alcanzado Con su aplicación S-Translator incorporada, el Galaxy S4 promete capturar las palabras habladas en un idioma y luego reproducirlas en otro idioma, todo a la velocidad de una conversación. Samsung dice que ofrecerá soporte para 10 idiomas tan pronto como el teléfono salga a la calle.

Hay una razón por la cual la traducción de voz en tiempo real ha estado en proceso por tanto tiempo. Implica tres procesos diferentes que todos son al menos moderadamente difíciles de hacer bien. En 2008, el coloso de redes Cisco Systems prometió su propio sistema de traducción en un año, diseñado para entrar en su plataforma de videoconferencia TelePresence. La compañía tuvo que dar marcha atrás en eso un año después, diciendo que el trabajo era más difícil de lo esperado. Cisco todavía está trabajando para esa característica hoy.

[Más información: los mejores teléfonos Android para todos los presupuestos.]

Aunque S-Translator y otras herramientas han mejorado y se volverán más inteligentes, la tecnología aún no ha eliminado la barrera del idioma, dicen analistas e investigadores. Los idiomas son demasiado complejos y pueden malinterpretarse.

"Incluso si los seres humanos están haciendo esto, la traducción en tiempo real sigue siendo bastante difícil, y no creo que hayamos visto un avance", dijo el analista de Opus Research Dan Miller.

Cómo funciona

S-Translator está diseñado para mensajes de texto, correo electrónico y voz, pero son los escenarios cara a cara los que generan el factor "sorpresa". En el lanzamiento de Galaxy S4 en Radio City Music Hall, los actores dramatizaron las capacidades de S-Translator con un sketch donde un mochilero estadounidense le preguntó a un hombre en Shanghai qué autobús llevar a un museo. El mochilero habló la pregunta en inglés en su Galaxy S4 y salió en mandarín hablado. Después de que el hombre escuchó la pregunta, pronunció una respuesta al teléfono y sus palabras se convirtieron en texto en inglés.

Traducir conversaciones requiere tres procesos separados: convertir el habla en texto, traducir esas palabras escritas a otro idioma y luego convertir el texto. tradujo el texto al discurso, dijo Ananth Sankar, un ingeniero distinguido en el Grupo de colaboración y tecnología de Cisco. El primero es una tuerca especialmente difícil de descifrar cuando se trata de conversaciones naturales, según Sankar.

Samsung

En el corazón del problema está la forma en que hablamos con las personas, en comparación con la forma en que hablamos con el público o a las computadoras, dijo Sankar. Está hablando de los "ums y ahhs", los inicios en falso y las autocorrecciones, que rompen la fluidez del habla natural. Hacen que sea mucho más difícil para el software interpretar una conversación que un comando o dictado, dijo.

La traducción de textos tiene otros desafíos, y varían según el idioma, dijo Sankar. Una forma común de refinar ese proceso es un enfoque estadístico, que compara los documentos de gran tamaño que los humanos han traducido entre dos idiomas. Pero algunos pares de idiomas tienen más documentos traducidos disponibles que otros, así que la precisión varía, dijo.

Donde la traducción en tiempo real está más cerca de la realidad es en áreas temáticas específicas, como negocios, tecnología, derecho y asistencia en viajes. Por ejemplo, la transcripción y traducción de discursos preparados que cubren ciertos temas es aproximadamente 90 por ciento precisa en tiempo real ahora, dijo Sankar. Impresionantemente, Samsung dice que el vocabulario de S-Translator no se limita a temas de viaje.

Otra advertencia sobre la traducción es que apoyar una larga lista de idiomas no necesariamente significa que el sistema puede traducir libremente entre todos. Como el proceso depende de las traducciones que ya se han realizado, lo que importa son los pares de idiomas. En S-Translator, el inglés de EE. UU. O el de EE. UU. Se puede traducir mutuamente con cada uno de los otros ocho idiomas incluidos: francés, alemán, italiano, español latinoamericano, portugués brasileño, coreano, mandarín y japonés. Además, el coreano, el mandarín y el japonés se pueden traducir mutuamente.

Rompiendo barreras

Para la traducción, S-Translator usa tecnología propia de Samsung, no Google Translate ni ninguna otra plataforma de terceros. Una limitación de la interpretación en tiempo real del sistema es que requiere una conexión de datos a un servidor de traducción en línea. Samsung no está solo en esto, según Miller en Opus Research. Eso puede ser un problema para una característica que se usa a menudo, como en el ejemplo de Samsung, mientras viaja.

"A menos que estén haciendo cosas localmente en el dispositivo, muchas compañías están ignorando el hecho de que tener una conexión de datos a veces resulta ser bastante caro ", dijo Miller. Una rara excepción es Jibbigo, una startup que crea una aplicación para iOS y Android. Jibbigo viene como una aplicación gratuita que llama a un servidor, pero los usuarios pueden comprar módulos para la traducción fuera de línea de conjuntos específicos de idiomas. S-Translator en el Galaxy S4 incluye traducciones de ciertas frases útiles integradas en el teléfono.

Tanto el reconocimiento de voz como la traducción están mejorando constantemente, dijeron Sankar y Miller. En primer lugar, el software basado en modelos estadísticos aprende de cada traducción que hace, dijo Miller.

Cisco ve la traducción en tiempo real de videoconferencias en el horizonte, dijo Sankar, aunque dentro de los límites de algo así como una discusión formal y preparada entre dos diplomáticos.

"Creemos aquí en Cisco que llegará el día en que podamos tener una conferencia web con alguien del otro lado del mundo, a través de los límites del idioma, en un estilo conversacional y fluido muy natural. ", Dijo Sankar. La mala noticia es que su pronóstico para ese logro es de cinco a 10 años.

"Solo tienes que mostrar paciencia y entender que no es perfecto, pero mejoran constantemente", dijo Miller.