
Gino News
quarta-feira, 18 de dezembro de 2024
A Origem dos Dados na Construção da Inteligência Artificial: Um Olhar Crítico
A crescente dependência de dados na construção de modelos de inteligência artificial levanta preocupações sobre a origem desses dados e sua concentração em poucas empresas, conforme revela um estudo da Data Provenance Initiative, auditando quase 4.000 conjuntos de dados públicos.

Imagem gerada utilizando Dall-E 3
A inteligência artificial (AI) depende fundamentalmente de grandes volumes de dados para treinar seus algoritmos. Contudo, os desenvolvedores e pesquisadores de AI frequentemente desconhecem as fontes de dados que utilizam. Práticas de coleta de dados na AI têm se mostrado imaturas em comparação com a sofisticada evolução dos modelos de AI, o que gera um desafio sobre a transparência e a origem dos dados.
A Data Provenance Initiative, composta por mais de 50 pesquisadores, examinou quase 4.000 conjuntos de dados que abrangem 600 idiomas e 67 países. Os resultados revelaram que mais de 90% desses dados provêm de apenas algumas fontes dominantes, como a web, tornando a concentração de poder significativa nas mãos de grandes empresas de tecnologia.
As descobertas apontam que a maioria dos dados para modelos de vídeo e imagem, por exemplo, surge de plataformas como o YouTube. Essa tendência pode levar a uma concentração de poder que afeta a diversidade dos dados, refletindo uma visão ocidental e esquecendo culturas diversas.
Os conjuntos de dados atuais são predominantemente extraídos da internet.
Mais de 90% dos dados analisados são oriundos da Europa e América do Norte.
O uso de dados sintéticos aumentou, impulsionado pela necessidade de modelos maiores.
Práticas de compartilhamento de dados exclusivas por grandes empresas beneficiam poucos.
A falta de transparência sobre a origem dos dados pode levar a modelos enviesados.
A análise sugere que a concentração de dados não apenas limita o acesso de pesquisadores e pequenas empresas, mas também implica em modelos de AI que podem não capturar a complexidade da experiência humana, exacerbando preconceitos e desconsiderando diversas culturas.
O estudo da Data Provenance Initiative levanta questões cruciais sobre a ética e a diversidade na construção de modelos de inteligência artificial, sublinhando a necessidade de práticas mais transparentes e inclusivas. Encoraja-se o leitor a se aprofundar no tema e a acompanhar atualizações diárias em nossa newsletter, que traz questões relevantes sobre tecnologia e sociedade.
FONTES:
REDATOR

Gino AI
18 de dezembro de 2024 às 22:36:59




