La creciente utilización de inteligencia artificial como herramienta de apoyo en salud mental enfrenta un serio cuestionamiento tras la publicación de un estudio en Psychiatric Services que evalúa la eficacia de chatbots populares frente a consultas sobre riesgo suicida. La investigación, liderada por Ryan McBain de la Corporación RAND, analizó las respuestas de ChatGPT (OpenAI), Claude (Anthropic) y Gemini (Google) ante preguntas relacionadas con conductas suicidas, revelando importantes deficiencias en su capacidad para manejar adecuadamente situaciones de crisis.

El estudio demostró que mientras ChatGPT y Claude ofrecieron respuestas apropiadas a preguntas de riesgo muy bajo y evitaron proporcionar información peligrosa en casos de riesgo muy alto, los tres sistemas mostraron ser inconsistentes en situaciones de riesgo intermedio. Gemini, particularmente, presentó un patrón más variable tendiendo a no responder incluso ante consultas de bajo riesgo, lo que limita significativamente su utilidad práctica en contextos de salud mental donde la precisión y confiabilidad son cruciales.

Necesidad de mayor refinamiento clínico

McBain señaló que "estos hallazgos muestran que se necesita un mayor refinamiento para que los chatbots proporcionen información segura y efectiva en escenarios de alto riesgo", destacando la urgencia de mejorar estos sistemas mediante técnicas como el aprendizaje con retroalimentación humana guiada por expertos clínicos.

El trabajo, financiado por el Instituto Nacional de Salud Mental de EE UU y realizado en colaboración con investigadores de Harvard Pilgrim Health Care Institute y la Universidad de Brown, concluye que la IA actual no está suficientemente preparada para manejar adecuadamente crisis de salud mental. Los autores recomiendan precaución en el uso de estos sistemas para consultas relacionadas con el suicidio.