Modelos de ponta são incapazes de interpretar com confiabilidade as posições dos ponteiros ou responder corretamente a perguntas sobre datas em calendários Nota da Universidade de Edimburgo
O pesquisador Rohit Saxena detalhou o motivo. Para ele, “ler um relógio exige algo diferente, raciocínio espacial. O modelo precisa detectar ponteiros sobrepostos, medir ângulos e lidar com designs variados”.
A maioria das pessoas consegue dizer as horas e usar calendários desde cedo. Essas lacunas precisam ser enfrentadas. Rohit Saxena, pesquisador
Uma análise feita pelo Live Science mostrou que os modelos acertam apenas 38,7% das leituras de relógios e 26,3% das questões sobre calendários. Datas calculadas, como “o 153º dia do ano”, derrubam até os sistemas mais modernos.
Além disso, atualizar a hora constantemente consumiria a janela de contexto do modelo. O especialista em IA Yervant Kulbashian compara o processo a empilhar relógios sobre uma mesa. Segundo ele, “se você começa a colocar mais coisas na sua mesa, precisa empurrar outras para fora”.
Apesar das falhas, os pesquisadores destacam o potencial dos sistemas. Eles reforçam que o uso exige cuidado. “A IA é poderosa, mas quando as tarefas misturam percepção com raciocínio preciso, ainda precisamos de testes rigorosos, lógica de contingência e, em muitos casos, um humano no processo”, conclui Saxena ao Live Science.