En el año transcurrido desde el estallido de la epidemia, interpretación / Transcripción Ha pasado de ser una característica de nicho a ser un núcleo a medida que las conferencias globales avanzan en línea, y la tecnología se está poniendo al día.
A medida que el orador trabaja en una presentación, la traducción que se ejecuta en la parte inferior de la pantalla puede mantener a la audiencia comprometida en línea. No mucho si esta traducción sigue parpadeando.
Esto es algo que distrae de la vida. Dictado a texto Traducción: revisiones frecuentes del texto traducido donde se agregan palabras (habladas) a la oración de origen, cambiando el contexto de las palabras al comienzo de la traducción. La confianza en las palabras de origen que aún no se han pronunciado da como resultado un parpadeo continuo de la traducción.
Este fenómeno es lo que Google Espera reducir la actualización recién lanzada de Google Translate (es decir, la función de transcripción), según el 26 de enero de 2021 Google AI Entrada en el blog. La publicación fue escrita por dos científicos de Google Research. Naveen ArivazhajanIngeniero de software senior, W. Colin Sherry, Científico de Investigación de Personal.
Los modelos detrás de esta nueva actualización de Google Translate se discuten en artículos de investigación escritos en coautoría por los mismos dos científicos y publicados en el servidor de preimpresión arXiV. El primero trata de reducir la inestabilidad y la latencia de la traducción en vivo.
a «Estrategias de retraducción para traducciones de idiomas largas, simultáneas y habladasLos investigadores utilizaron TED Talks de datos de pruebas multilingües para crear un marco de evaluación utilizando tres métricas: Borrado, Retraso y BLEU Puntuación.
El segundo modelo es reducir este parpadeo que distrae. a «Retraducción versus transmisión para traducción simultánea, «Los científicos están reduciendo el borrado y haciendo una mejor compensación entre borrado / retraso / BLEU».
Además, reduce el flasheo, «al truncar un número de palabras de la traducción hasta que se anota el final de la frase original. Los autores explican en el blog que este proceso de encubrimiento sustituye la latencia por estabilidad, sin afectar la calidad».
Sin embargo, agregaron que «limitar el borrado es solo una parte de la historia» y están buscando desarrollar nueva tecnología que pueda reducir la latencia y «permitir una mejor transcripción cuando varias personas hablan».
Entre los casos de uso más notables de traducción en vivo para voz a texto que han sido ampliamente publicitados se encuentran reuniones y debates del Parlamento Europeo.
Como informó Slator en septiembre, Dos consorcios y Microsoft Bélgica Se les adjudicó un contrato para una herramienta que puede transcribir y traducir automáticamente debates parlamentarios multilingües en tiempo real en 24 idiomas.
More Stories
El código en los datos previos al entrenamiento mejora el rendimiento del LLM en tareas que no son de codificación
Un marco para resolver ecuaciones diferenciales parciales equivalentes puede guiar el procesamiento y la ingeniería de gráficos por computadora
Epiroc ha lanzado una nueva plataforma de perforación de producción de pozos largos