Home / Tecnologia / Matemáticos testam IAs em Harvard e modelos são aprovados em 7 dos 10 problemas

Matemáticos testam IAs em Harvard e modelos são aprovados em 7 dos 10 problemas

Imagem: Olhar Digital

Iniciativa inovadora em Harvard

Trinta matemáticos se reuniram em Harvard esta semana para avaliar o desempenho de sistemas de inteligência artificial na resolução de problemas matemáticos. O projeto, denominado First Proof, foi criado para testar quatro modelos de IA em dez problemas que já haviam sido resolvidos por humanos, mas que nunca foram publicados anteriormente.

Resultados surpreendentes

Os resultados do teste, divulgados na semana passada, mostraram que sete dos dez problemas receberam ao menos uma solução correta, evidenciando o potencial das IAs em áreas complexas. Os sistemas utilizados incluíram predominantemente o GPT-5.5 Pro, da OpenAI, além do Gemini 3.1 Pro Preview, do Google, e o Claude Opus 4.7, da Anthropic.

Motivações por trás do teste

A criação do First Proof surgiu da insatisfação dos matemáticos com as narrativas frequentemente apresentadas pelas empresas de tecnologia. Os matemáticos argumentam que, embora as empresas anunciem grandes conquistas, a verificação das soluções apresentadas é complexa e os modelos frequentemente demonstram inconsistências.

Analogias sobre a abordagem humana e da IA

Terry Tao, medalhista Fields e professor na Universidade da Califórnia em Los Angeles, fez uma analogia entre matemáticos e alpinistas, que exploram o terreno de forma metódica, e as IAs, que se comportam como 'saltadores', alcançando alturas rapidamente, mas sem um processo refinado que leve a resultados úteis em tentativas fracassadas.

Limitações das IAs na matemática

Os matemáticos destacam que o verdadeiro desafio não é apenas resolver problemas, mas escolher quais problemas investigar. Essa escolha requer intuição e percepção do contexto, habilidades que a IA ainda não possui. Lauren Williams, professora em Harvard, exemplificou essa limitação ao afirmar que a IA não distingue entre perguntas válidas e interessantes.

Manifesto pela ética no uso da IA

Simultaneamente ao teste, uma Declaração de Leiden foi lançada, reunindo mais de 2.300 matemáticos que estabelecem diretrizes para o uso ético e transparente da IA na matemática. O manifesto ressalta os riscos associados à tecnologia, como a falta de crédito às ideias utilizadas pelos modelos e a falta de transparência nas conquistas reportadas pelas empresas.

Contexto histórico da matemática e a IA

O teste também se insere em um contexto mais amplo, especialmente após o anúncio da OpenAI em maio sobre um modelo que refutou uma conjectura de Paul Erdős que permaneceu sem solução por 80 anos. A iniciativa do First Proof reflete uma resposta organizada da comunidade científica, que busca estabelecer seus próprios critérios de avaliação em vez de se basear apenas nas alegações das empresas.

Próximos passos e desdobramentos

Os próximos passos incluem a continuidade na avaliação do desempenho das IAs em problemas matemáticos e o fortalecimento das diretrizes éticas estabelecidas na Declaração de Leiden. A comunidade matemática espera que esses esforços contribuam para um uso mais responsável e esclarecido da inteligência artificial no campo da matemática.

Marcado:

Deixe um Comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *