Gente de la Safor

Bienvenidos a Spain News Today.

Entrenar la inteligencia artificial de forma sencilla: explicando los fundamentos de las matemáticas  Escrito por Christian Elgand |  julio 2024

Entrenar la inteligencia artificial de forma sencilla: explicando los fundamentos de las matemáticas Escrito por Christian Elgand | julio 2024

Foto del autor

Una descripción general ilustrada de la lógica matemática utilizada en el entrenamiento de la inteligencia artificial.

Siempre es útil entender cómo funcionan las cosas. En este artículo, proporcionaré una descripción general muy simple de la lógica matemática básica utilizada en el entrenamiento de modelos de IA. Le prometo que si tiene educación básica, los siguientes ejemplos serán comprensibles y obtendrá una comprensión ligeramente mejor del campo de la IA.

Digamos que queremos crear un nuevo modelo de IA para pronosticar los ingresos por ventas de nuestra empresa. Disponemos de datos sobre los ingresos por ventas de los últimos dos meses, los costes publicitarios y los precios de los productos.

Ilustración del autor

En otras palabras, queremos crear un modelo que nos diga cómo nuestros ingresos por ventas dependen del precio de nuestro producto y de los gastos de publicidad. Con una herramienta de este tipo, un especialista en marketing puede, por ejemplo, calcular los ingresos por ventas esperados si gasta 50 euros en publicidad y fija el precio del producto en 6 euros.

En esencia, la IA no es más que una fórmula matemática (o un conjunto de fórmulas). Nuestro ejemplo de previsión de ventas se puede presentar como una fórmula matemática como esta:

Ilustración del autor

La fórmula existe, pero no sabemos qué valores asignar a los parámetros del modelo myn. En otras palabras, no sabemos cómo el aumento de los costos de publicidad y los ajustes de precios de los productos afectarán nuestros ingresos por ventas.

Cuando comenzamos a entrenar una IA, podemos asignar valores aleatorios a los parámetros del modelo. Por ejemplo, inicialmente configuramos el parámetro Costo del anuncio en 2 y el parámetro Precio en -2.

Ilustración del autor

Ahora, simplemente intentémoslo. Si multiplicamos el costo de publicidad y el precio del producto por sus respectivos valores de parámetros, vemos que nuestro modelo inicial es demasiado optimista. En el primer mes, los ingresos por ventas reales fueron de 5 euros, pero nuestro modelo predijo 30 euros. En el segundo mes, los ingresos por ventas reales fueron de 18 € y nuestro modelo predijo 52 €.

Ilustración del autor

Si el error es 0El modelo es perfecto y no necesita ninguna modificación.

Si error > 0el modelo dio un resultado demasiado optimista:

  • Reduzca los pesos (parámetros) si la característica de entrada correspondiente (por ejemplo, costo de publicidad o precio del producto) tiene un valor positivo.
  • Aumente los pesos (parámetros) si la característica de entrada correspondiente tiene un valor negativo.

Si el error es es, entonces el modelo era demasiado pesimista:

  • Aumente los pesos (parámetros) si la característica de entrada correspondiente tiene un valor positivo.
  • Reduzca los pesos (parámetros) si la característica de entrada correspondiente tiene un valor negativo.

Siguiendo la regla de aprendizaje, debemos minimizar ambos coeficientes porque el costo de publicidad y el precio del producto tienen un valor positivo.. Por ejemplo, redujimos la ponderación del costo de publicidad de 2 a 1 y el factor de precio de -2 a -3.

Ilustración del autor

Si volvemos a calcular, vemos que nuestro modelo ahora predice con precisión. Genial, el primer modelo de IA entrenado manualmente está listo.

Ilustración del autor

Si cree que el modelo anterior es demasiado bueno para ser verdad, entonces tiene razón. Nuestro modelo funcionó perfectamente con los datos de entrenamiento. Para evaluar la precisión de un modelo, se debe probar con datos que no se utilizaron en el proceso de capacitación.

Entrenamos nuestro modelo con datos de enero y febrero. Ahora, comprobemos qué tan bien el modelo puede predecir los ingresos por ventas para los meses de marzo y abril.

Ilustración del autor

En la tabla anterior, vemos que el modelo predice unos ingresos por ventas para marzo de 28 € (24 € reales) y para abril de 21 € (18 € reales). En promedio, nuestro modelo comete un error de 3,5 € en datos nuevos, lo que podemos llamar precisión de nuestro modelo.

En conclusión, la IA es esencialmente una fórmula matemática. En nuestro ejemplo, la fórmula contenía dos parámetros; El modelo GPT-4 contiene más de un billón (1 billón = 1.000.000.000.000) los maestros. Ambos están entrenados según el mismo principio: ajustar gradualmente los parámetros del modelo para reducir el error.

También es importante recordar que la IA aprende de los datos del entrenamiento, pero su precisión sólo puede evaluarse utilizando datos que no se utilizan durante el entrenamiento (datos de prueba).