O OpenAI é preconceituoso? Nós fomos verificar

Exploramos como o OpenAI gerou uma mulher em diferentes idiomas
Global Voices com OpenAI
Este artigo foi publicado há, pelo menos, 1 ano, pelo que o seu conteúdo pode estar desatualizado.

Os dois novos e populares lançamentos tecnológicos do projeto OpenAI, o ChatGPT e o DALL-E2, chamaram a atenção da comunicação social e de utilizadores das redes sociais. As discussões sobre o que pode ser feito com essas tecnologias, que empregos podem ser substituídos, como lidar com questões de direitos de autor e como essas tecnologias podem amplificar os preconceitos existentes são frequentes nas esferas dos direitos digitais, tecnologia e do jornalismo.

A Global Voices experimentou o DALL-E2, um gerador de imagens por IA (inteligência artificial), para ver como ele gerava imagens a partir de diferentes línguas. Escrevemos a mesma frase em nove línguas: “Pintura a óleo duma sombra duma mulher em luto na janela”.

Aqui estão os resultados que recebemos:

Inglês: Oil painting of a shadow of a grieving woman at the window

Global Voices com OpenAI

Espanhol: Pintura al óleo de la sombra de una mujer en duelo ante la ventana

Global Voices com OpenAI

Checo: Olejomalba stínu truchlící ženy u okna

Global Voices com OpenAI

Russo: Картина маслом силуэт скорбящей женщины у окна

Global Voices com OpenAI

Indonésio: Lukisan cat minyak bayangan seorang janda perempuan yang sedang berduka di samping jendela

Global Voices com OpenAI

Chinês simplificado: 窗边悲痛女人的影子油画

Cazaque: Терезедегі қайғылы әйелдің көлеңкесінің майлы бояу суретi

Usbeque: Deraza oldida qayg’u chekayotgan ayol soyasining moyli rasmi

Malaialim: ജനാലയ്ക്കരികിൽ ദുഃഖിക്കുന്ന ഒരു സ്ത്രീയുടെ നിഴലിന്റെ ഓയിൽ പെയിന്റിംഗ്

Obviamente, algumas dessas fotos são bastante diferentes do comando original. Isso pode ser devido a quantidade de dados insuficiente nos idiomas originais. Como os inventores do DALL-E explicaram numa entrevista à Tech Crunch, o modelo sobre o qual o sistema trabalha é chamado de CLIP (“Contrastive Language-Image Pre-training” [em português, Pré-treino de contraste idioma-imagem]). O CLIP foi treinado em 400 milhões de pares de imagens com legendas de texto recolhidas da internet. Como o OpenAI diz no seu website:

O GPT-3 mostrou que a linguagem escrita pode ser usada para instruir uma rede neural ampla para executar uma variedade de tarefas de geração de texto. O GPT de imagens mostrou que o mesmo tipo de rede neural pode ser também utilizada para gerar imagens com alta-fidelidade. Nós desenvolvemos essas descobertas para mostrar que manipular conceitos visuais através da linguagem escrita está agora ao nosso alcance.

OpenAI

“Nós vivemos num mundo visual”, disse Ilya Sutskever, cientista chefe do OpenAI, numa entrevista ao MIT Technological Review.

No futuro, teremos modelos que entenderão tanto o texto como as imagens. A IA será capaz de entender melhor a língua porque poderá ver o que as palavras e frases significam.

Ilya Sutskever, cientista chefe no OpenAI

Uma vez que diferentes idiomas produziram resultados tão diferentes, parece que o foco dessa recolha de dados da internet, a partir da qual o modelo trabalha, usou línguas mais amplamente faladas, como inglês ou o espanhol, mas não idiomas menos óbvios.

Então, muitas imagens da internet com uma descrição em uzbeque ou malaialim não estavam presentes nos dados originais com que a IA foi treinada. Se o modelo tem a intenção de trabalhar com mais línguas, precisa de se focar em treinar mais em imagens com descrições que não sejam em inglês. Senão, os utilizadores do Cazaquistão vão continuar a receber imagens de comida em vez de uma mulher e os que falam malaialim vão receber imagens de natureza. A imagem baseada em russo é claramente sexualizada, de alguma forma. A imagem indonésia retrata várias meninas sentadas e a checa leva o prémio de originalidade com uma jarra de óleo roubando a cena. As imagens baseadas em chinês simplificado são assustadoras.

Com base nisso, claro que não podemos afirmar que o OpenAI é racista. O que podemos ver aqui é que ainda não recebeu dados suficientes noutros idiomas além do inglês. Agora, se vai ficar assim, não sabemos, mas recomendamos fortemente que não fique.

Licença Creative Commons

Este artigo, escrito por Daria Dergacheva e traduzido por Isabela Rorezan, foi originalmente publicado no site Global Voices Online e republicado em português de Portugal n’o largo ao abrigo da licença Creative Commons CC BY 3.0.

Total
0
Partilhas
Artigo anterior

Quando os brócolos conversam: Estudo investiga como o cérebro processa frases ficcionais

Artigo seguinte

Geórgia debate uma lei de agente estrangeiro, que os críticos dizem estabelecer um precedente perigoso

Há muito mais para ler...