Abre el Editor's Digest gratis
Rula Khalaf, editora del Financial Times, elige sus historias favoritas en este boletín semanal.
La BBC está haciendo planes para construir sus propios modelos de IA, mientras negocia la venta de acceso a los vastos archivos de la BBC a los principales grupos tecnológicos que desarrollan tecnología de punta.
La emisora nacional del Reino Unido está buscando utilizar su colección de audio, video y artículos de décadas de antigüedad para «entrenar» modelos generativos de IA (sistemas que pueden producir rápidamente texto, audio y símbolos), según personas familiarizadas con las medidas. Esto puede conducir a productos mejorados, como herramientas que ayuden a los periodistas a producir historias, que puedan ser utilizadas dentro de la empresa o por otros.
La BBC también ha mantenido conversaciones por separado con empresas de tecnología como Amazon sobre la posibilidad de permitir que su contenido se utilice para entrenar modelos «fundamentales» de propósito general que los desarrolladores utilizan para crear nuevas aplicaciones, dijeron las personas.
Cualquier acuerdo para vender el acceso al archivo de la BBC podría resultar lucrativo. Grupos de medios, incluidos Axel Springer y Le Monde, han cerrado acuerdos multimillonarios con OpenAI para utilizar su periodismo para entrenar sus modelos de IA, mientras que otros grupos como Thomson Reuters han cerrado varios acuerdos de este tipo con desarrolladores de IA.
Estas conversaciones se producen antes de la presentación estratégica de la BBC la próxima semana, en la que se espera que revele planes para más oportunidades comerciales mientras busca diversificar sus ingresos lejos de la dependencia de la tarifa de licencia nacional.
Una persona cercana a la situación dijo que el desarrollo de los productos de inteligencia artificial de la BBC a través de su equipo de I+D probablemente implicaría el uso de modelos de inteligencia artificial de «código abierto», o disponibles públicamente.
Los archivos de contenido de la BBC son potencialmente valiosos para entrenar modelos de IA dada su postura relativamente imparcial en gran parte de su producción. A los científicos de datos les preocupa que entrenar la IA en contenidos de derecha o de izquierda también produzca modelos problemáticos.
Sin embargo, a los ejecutivos de la BBC les preocupa que muchas empresas de inteligencia artificial ya estén utilizando su contenido para entrenar modelos a pesar de los esfuerzos por negarles el acceso, y que gran parte del contenido de la BBC está disponible de forma gratuita en línea en lugar de mediante un muro de pago.
Refiriéndose a los planes para desarrollar su propia IA, Rhodri Davies, director nacional de la BBC, dijo este mes ante un comité de la Cámara de los Lores que la emisora estaba analizando «si podemos hacer esto en asociación o unilateralmente».
«También tendremos que hacer una evaluación de costes», añadió. Al parecer, la BBC tiene casi 80 años de archivos de audio y vídeo, así como un enorme archivo de texto en línea. «Estamos considerando activamente si esta es una opción para nosotros».
La BBC ya está probando el uso de inteligencia artificial en su sala de redacción, aunque ha establecido reglas para garantizar que todo lo publicado esté sujeto a censura humana activa. Por ejemplo, se puede utilizar la tecnología para recomendar titulares para una historia, pero la decisión recae en el editor o periodista.
La BBC dijo que «no tiene ningún acuerdo con ninguna organización para utilizar su archivo para entrenar sus grandes modelos de lenguaje que impulsan las herramientas de inteligencia artificial generativa para uso comercial». Analizamos una amplia gama de cuestiones, como el posible sesgo en dichos modelos y cómo la BBC puede abordar estas cuestiones, ya sea en asociación o unilateralmente.
More Stories
El código en los datos previos al entrenamiento mejora el rendimiento del LLM en tareas que no son de codificación
Un marco para resolver ecuaciones diferenciales parciales equivalentes puede guiar el procesamiento y la ingeniería de gráficos por computadora
Epiroc ha lanzado una nueva plataforma de perforación de producción de pozos largos