El chatbot Gemini AI de Google está recibiendo una interesante actualización que permitirá a los usuarios mejorar y personalizar fácilmente las imágenes generadas por IA. Esta característica, Fue descubierto escondido en el código. La versión beta de la última aplicación beta de Google para Android (v15.29.34.29 beta) cambiará las reglas del juego para aquellos que se han sentido frustrados por la falta de opciones de edición en Gemini. Actualmente, Gemini permite a los usuarios crear imágenes con indicaciones de texto únicamente, pero no hay forma de editar la imagen resultante. Si no le gustan ciertos detalles, debe crear una nueva imagen con un mensaje revisado, lo que puede llevar mucho tiempo.
La próxima actualización tiene como objetivo resolver este problema introduciendo dos nuevas formas de ajustar las imágenes generadas por IA. El primer método permitirá a Gemini comprender las indicaciones en lenguaje natural para editar imágenes existentes. Por ejemplo, si te gusta la foto en general pero quieres cambiar el fondo, simplemente puedes decirle a Gemini que lo haga sin tener que crear una foto completamente nueva.
El segundo método es más fácil de usar. Puedes usar tu dedo o un lápiz óptico para seleccionar la parte de la foto que deseas cambiar y luego decirle a Gemini qué ajustes deseas realizar. Esto elimina la necesidad de describir el área específica que deseas modificar, ya que Gemini entenderá automáticamente la parte específica del círculo.
Ejemplos de ediciones Gemini de imágenes creadas previamente | Crédito de la imagen: Autoridad de Android
Aunque esta característica todavía está en desarrollo y aún no está completamente operativa, es una adición prometedora a las capacidades de Gemini. Indica que Google se compromete a mejorar la experiencia del usuario proporcionando más control y flexibilidad en la creación de imágenes.
Puedo ver que esta actualización será especialmente útil para los profesionales creativos y aquellos que utilizan con frecuencia imágenes generadas por IA. Por ejemplo, para miniaturas de YouTube o títulos de artículos de blogs. Esto simplificará el proceso de edición y permitirá una mayor personalización, lo que en última instancia ahorrará tiempo y esfuerzo a los usuarios.
More Stories
El código en los datos previos al entrenamiento mejora el rendimiento del LLM en tareas que no son de codificación
Un marco para resolver ecuaciones diferenciales parciales equivalentes puede guiar el procesamiento y la ingeniería de gráficos por computadora
Epiroc ha lanzado una nueva plataforma de perforación de producción de pozos largos