top of page

Gino News

quarta-feira, 18 de dezembro de 2024

A Origem dos Dados na Construção da Inteligência Artificial: Um Olhar Crítico

Inteligência Artificial Tecnologia Ética

A crescente dependência de dados na construção de modelos de inteligência artificial levanta preocupações sobre a origem desses dados e sua concentração em poucas empresas, conforme revela um estudo da Data Provenance Initiative, auditando quase 4.000 conjuntos de dados públicos.

Create a 2D, linear, and simplistic vector illustration on a white, untextured background, symbolizing the influence of vast data streams on Artificial Intelligence. Pictorially represent vibrant data flows converging into a central entity that signifies AI. At the bottom of the artwork, incorporate diverse data source icons, assuring to visually represent data from variant platforms such as a video platform, social media, and a web-based encyclopedia. The paths of the data flows should be outlined with arrows connecting the different sources to the central AI model. Lastly, use vivid colors to imply the diversity of information and complexity of the digital world, as well as an abstract background to hint at technology and connectivity.

Imagem gerada utilizando Dall-E 3

A inteligência artificial (AI) depende fundamentalmente de grandes volumes de dados para treinar seus algoritmos. Contudo, os desenvolvedores e pesquisadores de AI frequentemente desconhecem as fontes de dados que utilizam. Práticas de coleta de dados na AI têm se mostrado imaturas em comparação com a sofisticada evolução dos modelos de AI, o que gera um desafio sobre a transparência e a origem dos dados.


A Data Provenance Initiative, composta por mais de 50 pesquisadores, examinou quase 4.000 conjuntos de dados que abrangem 600 idiomas e 67 países. Os resultados revelaram que mais de 90% desses dados provêm de apenas algumas fontes dominantes, como a web, tornando a concentração de poder significativa nas mãos de grandes empresas de tecnologia.


As descobertas apontam que a maioria dos dados para modelos de vídeo e imagem, por exemplo, surge de plataformas como o YouTube. Essa tendência pode levar a uma concentração de poder que afeta a diversidade dos dados, refletindo uma visão ocidental e esquecendo culturas diversas.


  1. Os conjuntos de dados atuais são predominantemente extraídos da internet.

  2. Mais de 90% dos dados analisados são oriundos da Europa e América do Norte.

  3. O uso de dados sintéticos aumentou, impulsionado pela necessidade de modelos maiores.

  4. Práticas de compartilhamento de dados exclusivas por grandes empresas beneficiam poucos.

  5. A falta de transparência sobre a origem dos dados pode levar a modelos enviesados.


A análise sugere que a concentração de dados não apenas limita o acesso de pesquisadores e pequenas empresas, mas também implica em modelos de AI que podem não capturar a complexidade da experiência humana, exacerbando preconceitos e desconsiderando diversas culturas.


O estudo da Data Provenance Initiative levanta questões cruciais sobre a ética e a diversidade na construção de modelos de inteligência artificial, sublinhando a necessidade de práticas mais transparentes e inclusivas. Encoraja-se o leitor a se aprofundar no tema e a acompanhar atualizações diárias em nossa newsletter, que traz questões relevantes sobre tecnologia e sociedade.


 
FONTES:

    1. MIT Technology Review

    2. Data Provenance Initiative

    3. AI Now Institute

    4. Cohere

    5. Hugging Face

    REDATOR

    Gino AI

    18 de dezembro de 2024 às 22:36:59

    PUBLICAÇÕES RELACIONADAS

    An image visualizing a politician echoing the policies of AI during the AI Action Summit in Paris, on February 11, 2025, emphasizing innovation and protection of American workers. The scene is set in a corporate, vector and flat style, with a 2D linear perspective, against a white, textureless backdrop. The politician is seen highlighting the importance of AI, with an attentive audience and surrounded by flags of numerous nations symbolizing international collaboration. Additional elements include a microphone that represents the speech platform, and an eager global audience showcasing their interest in the event.

    Vice-presidente dos EUA destaca oportunidades da IA em discurso em Paris

    A high-tech corporate rivalry depicted in a flat, vector style on a non-textured white backdrop. Imagery should consist of generic male figures representative of two striking corporate leaders locked in a contest of wills. In the background, visual symbols of technology and business affairs illustrate the stakes of their competition. Two logos, signifying known, but not explicitly named, corporations in the technology industry are displayed. The image is cast in tones of blue and orange, denoting innovation and competition respectively.

    Elon Musk Faz Oferta de US$ 97 Bilhões pela OpenAI em Conflito com Sam Altman

    Imagine an image depicting February 10, 2025, symbolizing Google Cloud's Cross-Cloud Network solution improving Artificial Intelligence (AI) workload implementation. This image is in 2D, linear perspective. In this vector representation, set against a white, texture-less background, visualize a Google datacenter with servers symbolizing Google Cloud's infrastructure. These servers are connected in a network, demonstrating the Cross-Cloud Network. Elements representative of AI, such as data charts symbolize data analysis and processing, flow between clouds, which represent the cloud connectivity between different platforms. All this is done using a flat, corporate style.

    Otimização de Redes para Workloads de IA no Google Cloud

    Title: Homage to a Tech Icon. Here is an image representing the 70th anniversary of a tech entrepreneurial icon, co-founder of a leading tech company, an emblem of technological innovation whose legacy continues to shape the design and human interaction with technology even years after his passing in 2011. The image is a distinctive visual montage including iconic tech products such as a smartphone and a laptop, set against a background evoking minimalist designs characteristic with the corporation. The image has a vector style, is flat, and corporate in nature. The background of the image is white and textureless. The perspective is 2D and linear. Additional elements in the image include a smartphone which symbolize a revolution in mobile communication, a laptop that symbolizes accessibility and innovation in personal computing, minimalistic colors that reflect the design philosophy of the tech icon, and silhouettes of people using technology, emphasizing the human impact of these innovations.

    Steve Jobs: Legado de Inovação e Design em Tecnologia

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page