Connect with us

Blogs

Google presenta una herramienta de Inteligencia Artificial que genera imágenes a partir de un texto

Published

on

Google presenta una herramienta de Inteligencia Artificial que genera imágenes a partir de un texto

Google Research, la división de proyectos de investigación del gigante de Internet, presentó Imagen, un sistema de IA que crea imágenes fotorrealistas a partir de una entrada de texto.

Para codificar el texto presentado al sistema, Imagen utiliza un codificador llamado T5-XXL. Lo que hace este sistema es, en base a los datos que domina, desarrollar un bosquejo de 64 x 64 píxeles. Posteriormente, mediante mecanismos de difusión, la IA amplía la resolución a 256 × 256 píxeles y posteriormente a 1024 × 1024 píxeles, obteniendo resultados nítidos y de aspecto realista, al retocar los detalles durante el proceso de ampliación.

Un aspecto interesante de este sistema es su capacidad de autocorrección. Mientras es refinada la imagen durante su proceso de ampliación, la IA es capaz de evaluar hasta qué punto los retoques aplicados establecen una relación entre la frase de referencia y el resultado obtenido.

Desde Google Research afirman que este es un desarrollo sin precedentes, destacando como logros el establecimiento de optimizaciones en el codificador de texto; el establecimiento de un nuevo difusor de umbral, para obtener imágenes de mayor resolución; la optimización del uso de memoria en los equipos que ejecuten este sistema; y la evaluación positiva del índice de correlaciones entre los textos de referencia y las imágenes generadas.

Las demostraciones de momento se limitan a los ejemplos compartidos por Google. Para evitar riesgos de uso indebido, aún no se ha liberado el uso de esta herramienta. “En este momento, hemos decidido no lanzar el código o una demostración pública. En trabajos futuros, exploraremos un marco para la externalización responsable que equilibre el valor de la auditoría externa con los riesgos del acceso abierto sin restricciones”, señala el equipo de Imagen en la web del proyecto.

Otro detalle destacado por el equipo de Imagen es que, para trabajos futuros, necesitarán refinar la muestra de datos con las que entrenan este sistema, para evitar sesgos, ofensas u otros problemas sociales o distorsiones de la realidad. En esta primera instancia, el foco estuvo puesto en el desarrollo de los aspectos más técnicos del sistema, trabajando con conjunto de datos extraídos de la web sin filtrar.

Una completa descripción técnica de este proyecto, junto a ejemplos que ilustran el potencial de esta herramienta, se encuentran disponibles en el sitio web de Google Research.

Te puede interesar

Advertisement

ONE Recomienda

AppsUser

Síguenos

Suscríbete para tener notificaciones

Suscríbete al Podcast

Copyright © 2003 - 2022 ONE DIGITAL

A %d blogueros les gusta esto: