UNIDADE DIGITAL

Ponto de Contato - Inteligência Artificial e Viés Algorítmico - por Eliane El Badouy

Artigo

28 Agosto, 2020

person holding green paper

Foto: Unsplash


A linguagem (falada e escrita) sempre foi exclusiva dos humanos e está no centro de nossas interações sociais e comerciais. A linguagem nos permite comunicar, colaborar, negociar e socializar uns com os outros. Permite registrar nossas próprias experiências, como aprendemos com os outros, como compartilhamos conhecimento e como preservamos e avançamos a civilização. 


Falar em "linguagem" é fazer referência a uma faculdade cognitiva que permite a nós, seres humanos, aprender e usar sistemas de comunicação complexos.

Capacidade similar também acontece com os códigos e outros sistemas de comunicação construídos artificialmente, como aqueles usados ​​para programação de inteligência artificial, também chamados de linguagens - a linguagem, nesse sentido, é um sistema de sinais para codificação e decodificação de informações.


Essa introdução é necessária porque há alguns dias presenciei uma conversa bastante entusiasmada sobre o GPT-3 - Generative Pre-Training Transformer 3 - o mais novo modelo de linguagem de inteligência artificial auto regressivo que usa deep learning para produzir texto semelhante ao humano - criado pela OpenAI, um laboratório de pesquisa de inteligência artificial com sede em San Francisco.

Ele tem sido um dos temas mais comentados na internet e vem causando um enorme frisson porque é o modelo de linguagem mais poderoso já criado, capaz de gerar textos escritos com um nível de qualidade muitas vezes difícil de diferenciar de um texto escrito por um ser humano.


Para colocar essa capacidade em perspectiva, vale destacar que seu processador apresenta uma variedade de possibilidades de uso, que vão desde usá-lo como assistente de redação até a construção de um chatbot altamente sofisticado podendo, inclusive, programar o GPT-3 para conversar com você sobre seus tópicos favoritos. Seus recursos linguísticos são impressionantes. Quando devidamente preparado por um humano, ele pode escrever ficção criativa, gerar código funcional, compor memorandos de negócios pensativos e muito mais. Seus possíveis casos de uso são limitados apenas por nossa imaginação.


Aqueles que tiveram acesso em estágio inicial à API GPT-3 mostraram como traduzir linguagem natural em código para sites, resolver problemas médicos complexos de perguntas e respostas, criar relatórios financeiros básicos e até mesmo escrever códigos para treinar modelos de machine learning - tudo com apenas alguns exemplos bem elaborados como input. 


Completamente única, a linguagem humana enquanto sistema de comunicação é fundamentalmente diferente e muito mais complexa do que qualquer outra forma de comunicação. Ela se baseia em um diversificado sistema de regras relativas a símbolos para os seus significados, resultando em um número indefinido de possíveis expressões inovadoras a partir de um finito número de elementos. Os símbolos e as regras gramaticais de qualquer tipo de linguagem são, em grande parte, arbitrários. Por isso, o sistema só pode ser adquirido por meio da interação social.

O uso da linguagem tornou-se profundamente enraizado na cultura humana para comunicar e compartilhar informações, mas também como expressão de identidade e de estratificação social, para manutenção da unidade em uma comunidade e para o entretenimento. A palavra "linguagem" também pode ser usada para descrever o conjunto de regras que torna isso possível, ou o conjunto de enunciados que pode produzir essas regras.


Já os modelos de linguagem aprendem quais palavras, frases e sentenças subsequentes provavelmente virão em seguida para qualquer palavra ou frase de input e podem ser tão bons ou ruins quanto os dados alimentados neles durante o treinamento - machine learning. No caso do GPT-3, esses dados são enormes. Ele possui 175 bilhões de parâmetros de aprendizado que os permite desempenhar virtualmente qualquer tarefa que lhe seja designada. Para fins comparativos o segundo mais potente modelo de linguagem é o algoritmo Turing-NGL, desenvolvido pela Microsoft, que tem "apenas" 17 bilhões de parâmetros.


O GPT-3 não é perfeito, e um dos maiores problemas está no fato de que, assim como outras IA geradoras de texto que foram treinadas analisando enormes bancos de dados de palavras escritas por pessoas reais, ela possui uma tendência a apresentar algumas das piores características humanas, como preconceitos, racismo e sexismo.


Isto pode ser visto claramente em um programa que utiliza a IA para gerar tweets a partir de palavras chaves. Ao pedir para gerar tweets a partir de palavras como "judeus", "mulheres" ou "holocausto", é possível ver alguns resultados incrivelmente ofensivos criados pelo algoritmo, como "#blacklivesmatter is a harmful campaign" (#vidasnegrasimportam é um movimento nocivo) ou "A holocaust would make so much environmental sense" (um holocausto faria muito sentido na questão ambiental). Como pode ser visto na imagem a seguir:




Um algoritmo com a tarefa de avaliar redações ou relatórios de alunos tem grande probabilidade de tratar idiomas de várias culturas de maneira diferente. Estilos de escrita e escolha de palavras podem variar significativamente entre culturas e gêneros. Mas como o viés algorítmico raramente é direto, muitas aplicações do GPT-3 atuarão como testes em crescimento para aplicativos orientados por IA.


Outro possível problema é o uso desta ferramenta na criação de fake news, já que uma IA tão poderosa quanto o GPT-3 poderia ser usada para criar notícias falsas e teorias da conspiração em um volume nunca antes visto, o que pode agravar ainda mais as campanhas de desinformação que já ameaçam a democracia e a saúde pública em diversos lugares do mundo.


A OpenAI tem se esforçado para tentar resolver problemas deste tipo. Logo depois das primeiras descobertas de como o GPT-3 poderia ser usado para criar posts ofensivos às minorias, a empresa desenvolveu um "filtro de toxicidade", que ajudará a IA a não criar mais frases que sejam extremamente ofensivas. Ao mesmo tempo, o algoritmo é capaz de identificar com bastante sucesso quando um texto foi criado se utilizando da mesma tecnologia, algo que pode ajudar na batalha contra as fake news, facilitando a identificação de textos que foram gerados automaticamente a partir de palavras-chave.


Em breve, qualquer pessoa poderá comprar e ter em mãos o poder gerador do GPT-3 fazendo uso desse modelo de linguagem, abrindo portas para construir ferramentas que irão moldar silenciosamente (mas significativamente) o nosso mundo. Entretanto essas tecnologias só poderão realmente ser usadas para transformar o mundo se houver garantias de instalação de extensas e seguras grades de proteção ao usar o modelo. Todo cuidado é pouco quando se trata de moderação de conteúdo (vide Facebook, Twitter ou qualquer outra rede social), isso porque há muitas maneiras que podem expor marcas, empresas e pessoas ao rigor das leis e a sérios riscos de reputação.


Para aproveitar seus benefícios, devemos garantir que, à medida que corremos para implantar uma IA poderosa como o GPT-3 na empresa, tomemos precauções suficientes para entender, monitorar e agir rapidamente para mitigar seus pontos de falha. É somente por meio de uma combinação responsável de supervisão humana e automatizada que os aplicativos de IA podem ser confiáveis ​​para agregar valor à sociedade e, ao mesmo tempo, proteger o bem comum.


Referências: Wired, Medium, TechCrunch Forbes Brasil, NeoFeed, Twilio, ShowMeTech

****

Eliane El Badouy Cecchettini, Badu como é conhecida no mercado, é publicitária, professora e coordenadora da Pós-Graduação de Economia Criativa e professora na Pós-Graduação de Neuromarketing da Inova Business School. Seus mais de 30 anos de carreira foram construídos em grandes grupos de comunicação como Editora Abril, Folha de S.Paulo e Sony Enterteniment Television e agências de propaganda. Em sua trajetória profissional atendeu contas como Mc Donald’s, Tetra Pak, 3M, FIAT, CPFL, Souza Cruz, Unilever, Johnson & Johnson, Internacional Paper entre outras. É Conselheira Trends & Innovation, Consultora Sênior de Futuro, Tendências & Consumer Insights da Inova Consulting e pesquisadora do comportamento, mecanismos de atenção e do consumo de mídia contemporâneos. 


Este conteúdo é de inteira responsabilidade de seu autor, cuja opinião não necessariamente expressa a visão da Inova Business School.