Imagem: Olhar Digital
Novo sistema de IA gera controvérsia entre especialistas em cibersegurança
A Anthropic lançou, na terça-feira, o Fable, uma versão pública e limitada do seu sistema voltado à segurança digital, conhecido como Mythos. O lançamento rapidamente se tornou alvo de críticas entre pesquisadores e profissionais da área, que consideram os bloqueios amplos demais para tarefas simples.
Contexto do lançamento
O Mythos foi introduzido pela Anthropic em abril, inicialmente com acesso restrito a um grupo limitado de empresas por meio do Projeto Glasswing, que tem foco na proteção de softwares e infraestruturas críticas. Recentemente, a empresa ampliou o acesso ao sistema para centenas de organizações em 15 países.
Principais pontos do fato
A nova IA, Fable, bloqueia qualquer requisição que possa ser relacionada a cibersegurança ou biologia, causando interrupções em conversas e retornando ao Claude Opus 4.8. Os usuários recebem mensagens informando que suas mensagens foram sinalizadas por tópicos sensíveis.
Críticos apontam que o Fable rejeita até tarefas consideradas inócuas, como ler postagens de blogs ou solicitar revisões de código. Valentina Palmiotti, pesquisadora na IBM X-Force, destacou que o sistema parece estar excessivamente restritivo.
Matt Suiche, da startup Tolmo, observou que o sistema classifica erros de solicitação baseados em palavras-chave, resultando em bloqueios desnecessários, enquanto entende a necessidade de precauções quanto ao uso indevido da tecnologia.
Impactos e consequências
Os bloqueios excessivos podem impactar a eficiência de profissionais de cibersegurança, dificultando a realização de tarefas cotidianas e limitando a inovação no setor. A situação levanta preocupações sobre a capacidade das ferramentas de IA em equilibrar segurança e funcionalidade.
Análise técnica e declarações de especialistas
Especialistas consideram que, embora as intenções da Anthropic sejam válidas, a execução dos filtros precisa ser aprimorada. Suiche acredita que as restrições poderão evoluir com o tempo, conforme a empresa aprende com as interações dos usuários.
Próximos passos e desdobramentos
A Anthropic deverá continuar ajustando os filtros do Fable, possivelmente relaxando restrições conforme a tecnologia avança e os feedbacks dos usuários são incorporados. Além disso, a empresa exige que profissionais da área se inscrevam no Cyber Verification Program para acesso a menos bloqueios, uma medida similar ao programa da OpenAI.









