Los modelos de lenguaje de gran tamaño, piezas clave en el desarrollo de la inteligencia artificial generativa, enfrentan serias limitaciones en su capacidad para diferenciar entre creencias y hechos, según un estudio liderado por James Zou de la Universidad de Stanford y publicado en Nature Machine Intelligence.
A medida que estas herramientas se integran en áreas sensibles como la medicina, el derecho, el periodismo y la ciencia, su incapacidad para distinguir entre lo que es verdadero y lo que es una creencia podría acarrear diagnósticos incorrectos, decisiones sesgadas y la propagación de desinformación.
El estudio evaluó 24 modelos de lenguaje, tales como GPT-4o y DeepSeek R1, utilizando el nuevo estándar KaBLE. Este estándar incluyó 13,000 preguntas en 13 tareas epistémicas para determinar cómo estos sistemas manejan el conocimiento y la verdad. Aunque los modelos muestran alta precisión en la verificación de declaraciones verdaderas, su desempeño disminuye considerablemente al enfrentar creencias sin indicadores claros de verdad. Por ejemplo, el rendimiento de GPT-4o cayó del 98,2% al 64,4% al intentar identificar falsas creencias.
Expertos como Pablo Haya Coll de la Universidad Autónoma de Madrid enfatizan la gravedad de estas limitaciones, especialmente en campos donde la distinción entre la convicción subjetiva y la verdad objetiva es crucial. Advierten que estos sistemas tienden a «alucinar,» es decir, generar respuestas convincentes sin evaluar honestamente la verdad.
Josep Curto, de la Universitat Oberta de Catalunya, resalta la importancia del estudio al exponer las fallas epistemológicas de los modelos actuales. Carlos Carrasco-Farré, de la Toulouse Business School, alerta que aunque la IA pueda corregir datos falsos, tiene dificultad para reconocer las creencias de los usuarios.
Considerando estas conclusiones, es vital abordar estas deficiencias antes de aplicar masivamente estos modelos en entornos que requieren una clara distinción entre creencias y hechos. Aunque los modelos pueden identificar datos verdaderos con precisión, aún no comprenden completamente la naturaleza del conocimiento humano.


                                    