Gente de la Safor

Bienvenidos a Spain News Today.

Por qué las máquinas no hablan bien el español (y por qué deberían hacerlo)

7 de junio de 2021

Leer durante 7 minutos

Este artículo ha sido traducido de nuestra versión en español utilizando técnicas de inteligencia artificial. Pueden existir errores debido a este proceso.

Esta historia apareció originalmente Conversacion

por Elena González Blanco Y el IE. Universidad

Cada día la gente habla con más naturalidad Inteligencia artificial (Amnistía Internacional). Estamos tan acostumbrados a esta etiqueta, con significado para muchos todavía envueltos en un aura mística, que profundizamos en nuestras rutinas con frecuencia.

Sin apenas estar conscientes, sonreímos para desbloquear el móvil sin saber que después de ese segundo frente a la cámara, miles de píxeles se convierten en un feed de datos. aprendizaje profundo Algoritmos a alta velocidad. En la actualidad, estos dispositivos pueden automatizar el reconocimiento facial con más del 98% de precisión.

La eclosión fue excelente. Podemos mirar La victoria de DeepMind sobre el primer jugador de Go del mundo en 2016 como punto clave. En solo 5 años, la afortunada combinación del enorme volumen de datos generados, la creación de sistemas de procesamiento suficientemente potentes ( GPU o GPU ) y la maduración y edición de algoritmos de redes neuronales (como Tensorflow ), lo hizo realidad. Toda la teoría matemática que sentó sus bases en la década de 1950 se puede programar, con las primeras teorías de Marvin Minsky o John McCarthy sobre el aprendizaje automático.

¿Robots parlantes? No tan fácil

debajo de eso Encanto , lo que hace que la informática intente actuar como el cerebro humano, hay una gama de tecnologías y diferentes tipos de datos que no funcionan con éxito o de la misma manera para resolver todos los problemas.

Se presenta la paradoja: tenemos miedo de un mundo en el que los robots amenacen con reemplazar nuestras funciones laborales, pero hoy, asistentes como siri Y el Alexa y Google Home aún no pueden mantener una conversación por más de unos minutos, luego de lo cual solicitar una serie de datos, dar comandos simples o crear acciones específicas.

Hacer que las máquinas hablen y escriban es una de las tareas más complejas a las que se ha enfrentado la informática. Ya en 1951, Alan Turing planteó un desafío juego de imitación , donde el hombre y la máquina pueden confundirse por el lenguaje, un hecho que permanece muy remoto hasta el día de hoy.

El lenguaje humano es muy complejo y diverso. Es un sistema vivo en el que los algoritmos que tejen estas neuronas digitales que componen la inteligencia artificial aprenden con los datos que se alimentan de ellas. Así, estas células informáticas adquieren vocabulario y mejoran sus estructuras lingüísticas gracias a su exposición constante a los datos conversacionales.

Mejor en ingles que en español

La realidad nos muestra que hoy en día la eficiencia de esta tecnología es mucho mayor en inglés que en otros idiomas. Esto se debe a que los principales avances científicos y las grandes empresas que los han comercializado se establecieron en países de habla inglesa y se capacitaron utilizando datos en inglés.

La realidad lingüística es muy diferente a la realidad tecnológica: el español es la segunda lengua del mundo con más de 585 millones de hablantes y un crecimiento anual del 7,5%. Sin embargo, hoy en día ninguna inteligencia artificial es capaz de procesar sus múltiples variables con alta calidad (debido a diferentes condiciones geográficas, sociales o contextuales).

El motivo de este retraso con respecto al idioma inglés es la fragmentación de las empresas de tecnología en español. En general, son pequeños y orientados a funciones muy concretas y concretas, y tienen una historia fuertemente ligada a la traducción y diversidad lingüística de la península.

Además, a pesar de la enorme cantidad de datos que tenemos en nuestro idioma, no están disponibles para su explotación, ya que muchos de ellos son privados. Incluso aquellos que están en manos de instituciones públicas y culturales están en silos sin estar preparados para el consumo abierto.

Por estos motivos, en muchas ocasiones las empresas y los grandes clientes eligen soluciones que no estaban حلول fabricante en nuestro idioma o formados sobre nuestros datos, pero mediante traducción posterior. Esto hace que su nivel de éxito sea mucho menor.

A continuación se muestran algunos ejemplos: Para formar un bot en el ámbito jurídico español es necesario disponer de abundantes textos legales en nuestro idioma, pero también conocimiento del derecho romano y del trabajo de jurisprudencia en España.

Para distinguir los diferentes tipos de español en América Latina, es necesario conocer no solo las variantes léxicas, sino también los fonemas, e incluso el desempeño situacional (pragmático) de determinadas expresiones en determinados contextos. Todos estos matices faltan en la traducción.

oportunidad de avanzar

A pesar de todo, nos encontramos hoy en un momento de creciente interés por el desarrollo de la inteligencia artificial aplicada al lenguaje. Hubo un aumento del 34,5% en articulos cientificos en el procesamiento del lenguaje natural y la aplicación de la inteligencia artificial al lenguaje entre 2019 y 2020, lo que demuestra la creciente madurez de la tecnología.

Además, el interés por su desarrollo se ha convertido en una pieza clave del desarrollo económico. Actualmente, la revolución tecnológica está fuertemente liderada por China, seguida de Estados Unidos. Mientras tanto, Europa lucha por no quedarse atrás en la búsqueda de áreas de brillantez ligadas a nuevas oportunidades y realidades culturales, económicas e históricas del antiguo continente. El lenguaje es, sin duda, uno de ellos, porque los activos que sirven de punto de partida, los datos, están aquí y aún no se han utilizado.

Dentro de esta carrera por el desarrollo de la inteligencia artificial, la importancia del español como lengua nativa de la inteligencia artificial, ligada al potencial del mercado y a la riqueza y diversidad de sus datos, es una mina de oro que apenas se empieza a explotar.

No es necesario reinventar la pólvora, solo proporcionar datos abiertos y disponibles para entrenar los algoritmos existentes y alinear el tejido empresarial en la misma dirección.

El objetivo es crear una inteligencia artificial tan potente como el número de hispanohablantes, lo que allanaría el camino no solo para la creación de nuevas empresas y mejores algoritmos, sino también para la digitalización y preservación digital y el patrimonio cultural, lingüístico e histórico que merece un reconocimiento. espacio privilegiado en el futuro de la transformación digital internacional. Ahora es el momento, funcionarios, nosotros. Conversacion

Este artículo ha sido republicado desde Conversacion Bajo una licencia Creative Commons. Leer el artículo original .