Dona do ChatGPT diz que é ‘impossível’ treinar IA só com domínio público; entenda
11 de janeiro de 2024


Imagem de: Dona do ChatGPT diz que é 'impossível' treinar IA só com domínio público; entenda
Imagem: GettyImages

Não há como treinar um modelo de linguagem de alta complexidade apenas com materiais de domínio público. Quem afirma isso é a OpenAI, empresa responsável pelo chatbot de inteligência artificial ChatGPT.

A companhia usou esse argumento como forma de se defender ao parlamento do Reino Unido, de acordo com o jornal The Telegraph. Ela apelou ao legislativo da região na tentativa de ser liberada de usar materiais protegidos por direitos autorais, além de escapar de ações judiciais.

Segundo a companhia, plataformas como a GPT-4, que roda tanto no ChatGPT quanto no Microsoft Copilot, seriam bastante prejudicadas em questão de treinamento sem esse esse tipo de obra.

Modelo de linguagem da OpenAI depende de obras protegidas.

Modelo de linguagem da OpenAI depende de obras protegidas. Fonte:  GettyImages 

 

A OpenAI alega que direitos autorais hoje em dia cobrem “virtualmente qualquer forma de expressão humana”, incluindo livros, textos da internet, fotografias, códigos e documentos governamentais.

“Limitar o treinamento de dados a livros e desenhos de domínio público criados há mais de um século pode ser um experimento interessante, mas não faria com que os sistemas de IA atinjam as necessidades dos cidadãos de hoje em dia“, diz a empresa.

Na prática, isso significa que, caso utilizassem apenas materiais de domínio público ou devidamente autorizados pelos detentores, os chatbots seriam mais limitados na criação de conteúdo e no conhecimento geral.

OpenAI encara processos de escritores e jornais

A apelação da OpenAI ao governo é também uma forma de proteção contra processos que a empresa já encara. Ações judiciais sobre o uso de materiais protegidos por direitos autorais para alimentar IAs como o ChatGPT começaram em 2023 e devem se intensificar neste ano.

Jornal dos EUA é uma das empresas com processo em andamento contra a OpenAI.

Jornal dos EUA é uma das empresas com processo em andamento contra a OpenAI. Fonte:  GettyImages 

 

Em julho, artistas e escritores iniciaram ações judiciais contra Meta e OpenAI. A acusação é a mesma: os modelos de linguagem foram alimentados com trabalhos protegidos por direitos autorais, sem a devida autorização dos responsáveis.

Como resultado, a IA se torna não apenas especialista no assunto, mas capaz de criar conteúdos que replicam o estilo visual ou de escrita do autor. Em nota na época, a Microsoft confirmou que irá proteger consumidores acusados de violar direitos autorais por uso do Copilot.

Em um processo posterior aberto em dezembro de 2023, o jornal The New York Times também acusa a OpenAI de “uso ilegal” de seus materiais para treinar IAs sem qualquer compensação financeira.