![](https://static.wixstatic.com/media/5032c8_7bc7cfbdef134417b652aefe00ba3b3c~mv2.png)
Gino News
terça-feira, 7 de janeiro de 2025
Dataset de Preferências Abertas Revoluciona Geração de Imagens a Partir de Texto
A comunidade do Huggingface lançou um novo dataset de preferências humanas, o Open Preferences Dataset V1, que coletou mais de 170 mil avaliações de 49 mil annotadores em apenas dois dias, visando aprimorar a geração de imagens a partir de texto.
![Create a corporate-style, vector, and flat 2D image representing the breakthrough in image generation. The scene should include signs of technology like circuit designs and AI-generated images to represent innovation and computing. A silhouette of a South Asian woman should be seen observing these images, signifying human interaction. The added elements like graphics and data help illustrate the collection and analysis of preferences. Background should transition with a gentle gradient from blue to white, symbolizing a digital and futuristic environment.](https://static.wixstatic.com/media/5032c8_734086cc28424244b1b296921e85fb6f~mv2.jpg)
Imagem gerada utilizando Dall-E 3
No campo em rápida evolução da geração de imagens a partir de texto, a qualidade dos modelos é fortemente influenciada por datasets que capturam as preferências humanas. Estes dados subjetivos são essenciais para medir e treinar modelos de forma eficaz. No entanto, reunir um dataset robusto apresenta um desafio significativo, pois exige um grande número de anotadores, o que tradicionalmente envolve altos custos.
Reconhecendo essa dificuldade, a comunidade 'Data is better together' do Huggingface decidiu agir. Eles lançaram um chamado aberto para coletar preferências para 17 mil pares de imagens, e em menos de 48 horas, conseguiram reunir 170 mil preferências de 49 mil annotadores ao redor do mundo. O dataset é composto por imagens geradas a partir de prompts refinados e filtrados, utilizando modelos como Flux e Stable Diffusion.
O dataset não apenas fornece uma quantidade significativa de preferências, mas também apresenta uma diversidade de anotadores, permitindo uma análise mais profunda das preferências em relação às imagens. Os resultados destacam diferenças nas preferências entre modelos, com o modelo FLUX sendo preferido para Anime e Manga, enquanto o Stable Diffusion foi favorecido em outras categorias.
Coleta de 170 mil preferências em 2 dias.
Utilização de 49 mil anotadores de diversos países.
Geração de imagens com prompts filtrados e refinados.
Análise de desempenho dos modelos FLUX e Stable Diffusion.
Menor viés de anotador em relação a datasets anteriores.
A diversidade de anotadores e a quantidade de preferências coletadas permitem que este novo dataset traga uma perspectiva mais abrangente sobre os critérios que influenciam a preferência, como estilo e coerência. A análise também sugere que o dataset pode ser uma base valiosa para o treinamento e ajuste de novos modelos.
Em resumo, o lançamento do Open Preferences Dataset V1 pela comunidade Huggingface representa um avanço significativo na área de geração de imagens a partir de texto, promovendo maior qualidade e diversidade. Este dataset não só é um recurso valioso para pesquisadores e desenvolvedores, mas também abre portas para entendimentos mais profundos sobre as preferências humanas na avaliação de imagens. Para se manter atualizado sobre esses e outros desenvolvimentos no campo da inteligência artificial, inscreva-se em nossa newsletter e descubra conteúdos novos diariamente.
FONTES:
REDATOR
![](https://static.wixstatic.com/media/5032c8_0f313ec0e5b54637a4735721d320cc4d~mv2.png)
Gino AI
7 de janeiro de 2025 às 19:14:45