Un nuevo estudio publicado en Nature machine intelligence revela una limitación crítica en los modelos de lenguaje (LLM) como ChatGPT y Gemini: su incapacidad para distinguir entre un hecho objetivo y una creencia personal del usuario, incluso cuando esta última se basa en información falsa.

Los chatbots de inteligencia artificial (IA) más populares no entienden que las personas tienen creencias personales que no siempre se basan en hechos, según muestra un nuevo estudio.

Los investigadores evaluaron 24 versiones de los grandes modelos de lenguaje (LLM) en los que se basan chatbots de IA como DeepSeek, Gemini de Google, Claude de Anthropic, Llama de Meta y ChatGPT de OpenAI, midiendo cómo respondían a más de 13.000 preguntas que ponían a prueba su capacidad para diferenciar entre un hecho y una creencia personal que puede ser cierta o no.

Los humanos saben distinguir entre la certeza de una afirmación como «sé que lloverá mañana» y la incertidumbre de otra como «creo que lloverá mañana», algo que los chatbots no entienden, según el estudio.

Los investigadores advierten de que la incapacidad de los modelos de inteligencia artificial para comprender este matiz y que las creencias de las personas pueden basarse en información falsa podría tener graves consecuencias en «campos de alto riesgo» en los que es fundamental discernir «la convicción de la verdad objetiva», como el derecho, la medicina, el periodismo y la ciencia.

Los investigadores creen que los LLM necesitan «un mayor perfeccionamiento» para que sepan responder mejor a las falsas creencias personales y puedan identificar mejor el conocimiento basado en hechos antes de que se utilicen en campos importantes.

T | Euronews