Anthropic desenvolve inteligência artificial para evitar que o feitiço vire contra o feiticeiro (de novo)
Quando o tópico é inteligência artificial, imagina-se que não aconteçam erros, afinal, é para isso que ela foi criada. Porém, o problema é que, para que as IAs existam, elas ainda dependem de humanos — e humanos são famosos por seus erros.
No fim de março, a Anthropic, dona da IA Claude, divulgou por acidente um arquivo interno que continha partes do código fonte do modelo. Segundo a empresa de tecnologia, o erro não estava relacionado a um ataque, mas a um… erro humano.
A questão, por mais irônica que pareça, é preocupante para a companhia pois o grande risco do vazamento é a propriedade intelectual do seu principal produto.
Isso porque os concorrentes passaram a entender como a ferramenta foi construída e seu funcionamento.
Mas essa não foi a única novidade que originou do exposed da Anthropic.
Uma inteligência artificial para proteger outras IAs
Após a divulgação da notícia, a Anthropic confirmou e explicou sua mais nova iniciativa, o Project Glasswing, em parceria com empresas como a Amazon, Apple, Microsoft e Cisco System.
A ideia é dar o acesso a outras companhias de tecnologia a um modelo de inteligência artificial mais avançado, que ainda não foi lançado oficialmente. O diferencial da nova ferramenta é que ela ajudará na preparação contra possíveis ataques cibernéticos.
O Mythos tem como objetivo identificar falhas em seus produtos e compartilhar os resultados com outras empresas do setor.
Para a Anthropic, essa questão não é um problema individual, mas de toda a indústria. Ainda, eles argumentam que também é algo para que os governos devem olhar. A empresa já contatou autoridades dos Estados Unidos, mas não revelou quais agências.
E sua grande concorrente, a OpenAI, também identificou essa crescente preocupação com a segurança nos códigos-fontes. Por isso, a empresa de Sam Altman desenvolveu um programa piloto para colocar suas ferramentas “primeiro nas mãos de defensores”.
Até o momento, nenhuma das empresas pretende lançar as ferramentas ao público geral. Quem sabe assim, o feitiço não vire contra o feiticeiro — e o resto do mundo.