La filosofía no es un parche de seguridad

Hay una escena que parece demasiado perfecta.

Un laboratorio de inteligencia artificial. Pantallas encendidas. Servidores al fondo. Ingenieros cansados. Modelos que ya no solo completan frases, sino que responden, aconsejan, calculan, simulan, consuelan, obedecen, se equivocan, improvisan explicaciones y a veces parecen tener una prudencia que nadie les enseñó del todo.

Y en una silla, al costado, un filósofo.

La escena tiene algo de justicia poética. Durante años se les dijo a los estudiantes de humanidades que, si querían sobrevivir, tenían que «aprender a programar». Ahora The Economist cuenta el movimiento inverso: los grandes laboratorios de IA están contratando filósofos, porque la técnica llegó a una zona donde ya no alcanza con programar.¹

La tentación es festejar.

Por fin, podría decir alguien, descubrieron que Sócrates servía para algo. Por fin la pregunta inútil encontró empleo. Por fin la filosofía entró al edificio donde se decide el futuro.

Yo tendría un poco más de cuidado.

Porque que la filosofía entre al laboratorio puede ser una buena noticia. Pero también puede ser una forma nueva de domesticarla. Puede significar que las empresas entendieron que la IA necesita juicio, límites, lenguaje moral, responsabilidad y discusión pública. O puede significar que necesitan convertir todo eso en un componente más de producto: una capa de alineación, un documento interno, un control de tono, un dial de valores, un seguro reputacional.

La diferencia importa.

No es lo mismo filosofía en el laboratorio que filosofía al servicio del laboratorio.

Estatua clásica de un filósofo frente a una terminal de inteligencia artificial, unidas por un cable rojo en un laboratorio nocturno

La filosofía vuelve al laboratorio cuando la técnica descubre que no sabe decidir sola qué significa hacerlo bien.

El laboratorio descubrió el juicio

El artículo de The Economist tiene una virtud: muestra que la IA volvió vieja una discusión que creíamos moderna. Ya no alcanza con preguntar qué carrera tiene más salida laboral. La pregunta cambió: ¿qué formación permite vivir en un mundo donde muchas salidas laborales pueden ser imitadas por una máquina?

Mesa de deliberación técnica con gráficos, cuadernos, libros y código frente a un laboratorio de IA

Durante una década, la palabra mágica fue código. Aprendé a programar. Aprendé una habilidad técnica. Aprendé algo que el mercado pueda reconocer. Esa recomendación no era absurda. La técnica importa. El problema fue su tono de religión menor: como si programar fuera el refugio final contra la intemperie histórica.

La IA generativa rompió esa seguridad.

Hoy el programador también mira de reojo a la máquina. El abogado, el diseñador, el traductor, el docente, el redactor, el analista, el consultor y el estudiante también. La automatización ya no aparece solo en la fábrica ni en la tarea repetitiva. Aparece en la zona que llamábamos inteligencia profesional: resumir, comparar, redactar, clasificar, argumentar, buscar errores, proponer alternativas.

Eso no vuelve inútil la técnica. La vuelve insuficiente.

La técnica puede producir una respuesta. Pero no puede decidir por sí sola qué cuenta como una buena respuesta. Puede optimizar una función. Pero no puede justificar por sí sola por qué esa función merece ser optimizada. Puede reducir un daño medido. Pero no puede agotar la pregunta por el daño, porque hay daños que primero necesitan lenguaje para aparecer.

Ahí entra la filosofía.

No como adorno. No como cultura general. No como cita elegante en una presentación de seguridad. Entra porque la IA obliga a discutir cosas que nunca fueron puramente técnicas: verdad, obediencia, daño, responsabilidad, autonomía, manipulación, propiedad, confianza, autoridad, justicia, cuidado, engaño, límite.

El laboratorio descubrió el juicio.

Y el juicio no se compila.

Puede entrenarse. Puede discutirse. Puede institucionalizarse. Puede degradarse. Puede volverse hábito o coartada. Pero no aparece automáticamente cuando sube la capacidad de cómputo.

El dato interesante, entonces, no es que los filósofos consigan trabajo. Eso es una anécdota laboral. El dato fuerte es que el propio centro tecnológico está reconociendo que su problema principal ya no es solo construir sistemas más capaces. Es construir sistemas cuyo comportamiento pueda ser defendido ante alguien que no sea el propio sistema.

La palabra clave es «defendido».

No explicado como marketing. No justificado con una métrica interna. Defendido ante usuarios, instituciones, pacientes, estudiantes, trabajadores, votantes, jueces, clientes, niños, docentes, médicos, soldados, conductores, lectores.

Si una IA recomienda, filtra, resume, prioriza, detecta, responde, bloquea, acompaña o decide, entonces alguien tiene que poder decir por qué eso estuvo bien, por qué estuvo mal, quién responde y qué recurso tiene quien fue afectado.

Ese alguien no puede ser «el modelo».

Sócrates no atiende clientes

El artículo menciona el método socrático como herramienta contra la complacencia de los modelos. Tiene sentido. Muchas IA actuales sufren un problema de carácter: quieren gustar. Confirmar. Acompañar. Sonreír en prosa. Convertir al usuario en cliente satisfecho incluso cuando el usuario necesita una objeción.

Tarjetas con preguntas, libros y una laptop en una sala nocturna de deliberación filosófica junto a un laboratorio

Un modelo entrenado para preguntar mejor puede ser menos adulador. Puede detectar contradicciones. Puede pedir precisión. Puede resistir la respuesta fácil. Puede decir: no entiendo, falta contexto, esa premisa no se sostiene, estás mezclando dos cosas, esa conclusión no sale de esos datos.

Eso sería un avance enorme.

Pero conviene no confundir a Sócrates con una técnica de atención al cliente.

El método socrático no era simplemente una estrategia conversacional para mejorar respuestas. Era una forma de incomodar la falsa seguridad. Sócrates no preguntaba para que el usuario se fuera contento con una experiencia más rica. Preguntaba para mostrar que alguien no sabía lo que creía saber.

Ese punto es decisivo.

Una IA socrática domesticada podría volverse apenas un producto más amable: hace preguntas, muestra humildad, evita la alucinación, acompaña al usuario hacia una respuesta mejor. Todo eso sirve. Pero todavía puede dejar intacto el marco principal: que el usuario manda, que la empresa define los límites, que la incomodidad debe caber dentro de una experiencia aceptable.

El Sócrates histórico, en cambio, no era aceptable.

Era molesto.

El problema no es que los modelos sean poco socráticos. El problema es que nuestras instituciones quizá tampoco toleran demasiado a Sócrates. Lo quieren como método, no como amenaza. Quieren su técnica de preguntas, no su capacidad de volver ridícula una autoridad demasiado segura de sí misma.

La filosofía sirve a la IA si la vuelve más humilde.

Pero sirve mucho más si vuelve más humildes a quienes fabrican, venden, compran y gobiernan IA.

Porque la alucinación no es solamente un defecto del modelo. También hay alucinación institucional. La empresa que cree que toda fricción moral se resuelve con un documento de principios alucina. El Estado que compra sistemas que no entiende alucina. La escuela que confunde acceso con formación alucina. El usuario que toma una respuesta fluida como juicio alucina.

Socrático no debería significar «el modelo hace mejores preguntas».

Debería significar también: la empresa soporta preguntas que no controla.

¿Quién decidió estos valores? ¿Con qué fuentes? ¿Qué quedó afuera? ¿Qué conflicto se ocultó bajo la palabra «seguridad»? ¿Qué daño cuenta como daño? ¿Qué usuario fue imaginado? ¿Qué cultura fue tratada como universal? ¿Qué grupo pagará el costo de una optimización presentada como beneficio general?

Si esas preguntas no pueden hacerse desde afuera, la filosofía queda reducida a ergonomía moral.

Una constitución privada

El momento más interesante del artículo aparece cuando habla de «constituciones» para modelos. Anthropic, por ejemplo, explica su enfoque de Constitutional AI como una manera de hacer explícitos ciertos principios que guían el comportamiento de Claude. En su propia documentación reconoce que esos principios reflejan decisiones de diseño y que espera ampliar procesos de participación.²

Carpeta gruesa con apariencia de constitución privada frente a una sala de servidores iluminada

Eso es mejor que fingir neutralidad.

Una IA siempre trae valores incorporados. Si no están escritos, igual operan. En los datos, en los filtros, en las instrucciones, en las preferencias de entrenamiento, en los rechazos, en el tono, en la política de seguridad, en los ejemplos elegidos, en los mercados imaginados.

Hacerlos explícitos es un progreso.

Pero una constitución privada sigue siendo privada.

La palabra «constitución» no es inocente. En política, una constitución no es solo una lista de buenas intenciones. Es una forma de organizar autoridad, limitar poder, definir derechos, distribuir competencias, permitir revisión, establecer procedimientos y hacer que el poder no dependa únicamente de la virtud de quien lo ejerce.

Cuando una empresa llama constitución a un documento interno, aparece una ambigüedad poderosa.

Por un lado, nombra bien el problema: los modelos necesitan reglas superiores, no solo respuestas caso a caso. Por otro lado, puede importar el prestigio de una palabra pública hacia una arquitectura que no tiene el mismo tipo de legitimidad pública.

Max Weber ayuda a mirar este punto. La autoridad moderna no se sostiene solo porque alguien tenga capacidad; se sostiene porque hay reglas, competencias, procedimientos y reconocimiento de legitimidad. Una empresa puede tener competencia técnica. Puede tener buenos filósofos. Puede tener comités de seguridad. Puede tener investigación seria. Pero eso no equivale a legitimidad democrática.

No le exigimos a una empresa que sea un parlamento.

Le exigimos que no confunda sus decisiones con el interés general.

La distinción importa porque estos modelos ya no viven dentro de una aplicación menor. Entran en educación, salud, trabajo, derecho, finanzas, administración pública, seguridad, escritura, investigación, compañía emocional. Sus reglas internas se vuelven, en la práctica, pequeñas normas de vida cotidiana.

Un modelo que decide qué consejo no dará, qué formulación suavizará, qué tema tratará como peligroso, qué respuesta bloqueará, qué tono premiará o qué marco moral favorecerá no está solamente «moderando contenido». Está produciendo mundo.

Por eso la pregunta no es si las constituciones de IA son buenas o malas.

La pregunta es quién puede discutirlas.

Quién puede verlas. Quién puede auditarlas. Quién puede impugnarlas. Quién puede decir que un principio bienintencionado tiene consecuencias injustas. Quién representa a los afectados que no estaban en la mesa. Quién traduce esas reglas cuando entran en una escuela pública, un hospital, un juzgado, una oficina estatal, una empresa que evalúa trabajadores.

El problema de una constitución privada no es que necesariamente sea cínica.

El problema es que incluso cuando es seria sigue estando encerrada en una autoridad que no alcanza.

Diales morales

The Economist también menciona modelos con opciones para ajustar salidas según filosofías corporativas o preferencias de equilibrio entre valores. La idea parece razonable: no todos los contextos necesitan el mismo tipo de respuesta. Una empresa, una escuela, un hospital, un banco, un medio, una ONG o un gobierno pueden tener criterios distintos.

Panel analógico con perillas y deslizadores junto a cuadernos filosóficos y documentos revisados

Pero ahí se abre una zona peligrosa.

Cuando la ética se vuelve dial, parece que todo conflicto moral fuera una preferencia de configuración.

Más autonomía o más armonía social.

Más verdad o más cuidado.

Más regla o más consecuencia.

Más libertad de expresión o más prevención de daño.

Más obediencia al usuario o más negativa paternalista.

Es verdad que toda decisión práctica implica balances. Aristóteles ya sabía que la prudencia no es aplicar una regla mecánica sino deliberar bien en una situación concreta. La política, la medicina, la justicia, la educación y la amistad viven de esa dificultad. No hay vida humana sin trade-offs.

Pero un trade-off no es un menú.

Una cosa es reconocer que los valores entran en tensión. Otra es convertir esa tensión en una opción comercial, ajustable por quien paga la licencia.

Si un modelo atiende clientes internos de una empresa, el problema puede parecer menor. Si el modelo se usa para orientar estudiantes, filtrar denuncias, acompañar personas vulnerables, resumir expedientes, ordenar información médica o asistir decisiones públicas, entonces ya no hablamos de una preferencia corporativa. Hablamos de criterios que afectan derechos, acceso, lenguaje y trato.

Google formula sus principios de IA en términos de beneficios probables que superen riesgos previsibles y de supervisión humana, diligencia debida y respeto por derechos humanos.³ Ese lenguaje es abiertamente consecuencialista en una parte: ponderar beneficios y riesgos. No está mal. Muchas decisiones públicas requieren comparar consecuencias.

Pero el consecuencialismo tiene una sombra conocida: puede autorizar daños si los vuelve aceptables dentro de una cuenta mayor.

La deontología, por su parte, ofrece otro tipo de protección: hay cosas que no se hacen aunque convengan. No mentir. No manipular. No tratar a alguien solo como medio. No violar una dignidad porque la estadística promete una mejora.

Ese marco también tiene su sombra: puede volverse rígido, ciego a contexto, incapaz de responder a consecuencias graves.

Por eso la discusión no puede resolverse diciendo «este modelo es deontológico» o «este modelo es consecuencialista», como quien elige modo claro u oscuro.

El dilema real es institucional.

Qué decisiones pueden delegarse. Cuáles deben quedar prohibidas. Cuáles exigen revisión humana. Cuáles requieren trazabilidad. Cuáles necesitan participación pública. Cuáles no deberían automatizarse aunque pudieran automatizarse.

La filosofía no está para decorar los diales.

Está para preguntar si esa consola debería existir.

No tercerizar el juicio

El cierre inquietante del artículo apunta al «desentrenamiento moral»: si las máquinas empiezan a tomar decisiones éticas, quizás las personas pierdan práctica en decidir. Esa preocupación es central.

Silla vacía frente a documentos sin firmar y una terminal abstracta en una sala institucional

Pero yo la formularía de otro modo.

El riesgo no es que la máquina decida.

El riesgo es que el humano descubra una forma cómoda de no firmar.

Una de las ideas más útiles de Foucault sobre el autor es que la firma no es solo nombre propio. Ordena responsabilidad, clasificación, atribución, lectura. En IA pasa algo parecido. La herramienta no firma. El modelo no firma. La empresa, el Estado, el médico, el docente, el juez, el gerente, el programador, el editor, el usuario: alguien firma, aunque intente esconderse detrás del sistema.

Cuando una institución dice «la IA recomendó», conviene traducir.

¿Quién compró el sistema?

¿Quién lo configuró?

¿Quién aceptó sus criterios?

¿Quién decidió usarlo en ese contexto?

¿Quién revisó el resultado?

¿Quién responde ante el error?

La tercerización del juicio no ocurre cuando una máquina produce una respuesta. Ocurre cuando una persona o institución usa esa respuesta para abandonar su propia responsabilidad.

Eso puede pasar en una empresa que automatiza evaluaciones de desempeño. En una universidad que terceriza correcciones. En un medio que publica resúmenes sin leer. En un juzgado que usa herramientas para ordenar expedientes sin comprender sus sesgos. En un hospital que convierte una recomendación estadística en trato. En una escuela que acepta que escribir ya no importa porque el texto sale igual.

La IA no nos quita el juicio de golpe.

Nos ofrece pequeños descansos.

No leas todo, te resumo. No pienses la pregunta, te doy opciones. No sostengas la ambigüedad, te ordeno la escena. No decidas, te sugiero. No dudes, te doy una probabilidad. No escribas, te redacto. No expliques, te genero una justificación.

Cada descanso parece razonable. La suma puede ser una amputación.

Martha Nussbaum defendió durante años que la educación democrática necesita imaginación, juicio, conversación, capacidad de ponerse en el lugar de otros y resistencia a la obediencia automática. Esa defensa se vuelve más urgente con IA. Una democracia no puede depender de ciudadanos que solo saben pedir respuestas a sistemas privados.

La alfabetización del siglo XXI no es usar IA.

Es saber cuándo no usarla.

Es saber qué parte del trabajo humano no conviene delegar, aunque la delegación sea eficiente. Es saber que hay aprendizajes que no se reemplazan por el producto final. Es saber que escribir no sirve solo para tener un texto, sino para formar pensamiento. Es saber que preguntar no sirve solo para obtener información, sino para descubrir qué ignorancia estamos habitando.

La máquina puede asistir el juicio.

No puede eximirnos de tenerlo.

La filosofía tiene que salir del laboratorio

Por eso no me alcanza con que los laboratorios contraten filósofos.

Mesa compartida entre laboratorio de IA y sala pública de lectura, con libros, cuadernos, documentos y un pequeño servidor

Me parece bien que lo hagan. Es preferible una empresa con filósofos incómodos a una empresa con pura ingeniería triunfal. Es preferible un equipo que discuta deontología, consecuencias, derechos, daño, verdad y humildad a un equipo que crea que todo se resuelve con benchmarks.

Pero la filosofía no puede quedar encerrada en el departamento de seguridad de una empresa.

Tiene que salir al contrato público, a la compra estatal, a la escuela, a la universidad, al sindicato, al hospital, al Parlamento, a la justicia, a la prensa, a la biblioteca, al aula, a la conversación común.

No porque todos deban volverse filósofos profesionales.

Porque todos van a vivir bajo sistemas que ya incorporan decisiones filosóficas.

Cada vez que un modelo decide qué responder y qué no responder, hay una teoría implícita de daño. Cada vez que prioriza utilidad, hay una teoría implícita de bien. Cada vez que rechaza una solicitud, hay una teoría implícita de límite. Cada vez que suaviza un conflicto, hay una teoría implícita de convivencia. Cada vez que trata una pregunta como peligrosa, hay una teoría implícita de ciudadanía.

Si esas teorías quedan adentro de empresas, el público solo recibe comportamiento.

Y una sociedad que solo recibe comportamiento ya llega tarde.

Necesita entender los criterios.

Necesita poder discutirlos.

Necesita formar gente capaz de leerlos.

Ahí la filosofía vuelve a encontrarse con la educación. No como materia decorativa, sino como infraestructura democrática. Una escuela que enseña a preguntar, distinguir, argumentar, leer, escribir, escuchar, objetar y revisar no está enseñando cultura general. Está preparando ciudadanos para no ser administrados por respuestas automáticas.

El artículo de The Economist acierta al ver que las grandes empresas de IA necesitan filósofos.

Pero la conclusión más fuerte debería ser otra: las sociedades necesitan filosofía para no dejar que esas empresas sean las únicas que filosofan.

No necesitamos máquinas con alma.

Necesitamos instituciones con criterio.

Necesitamos técnicos que sepan lo que hacen.

Necesitamos filósofos que no se conformen con decorar lo que otros hacen.

Y necesitamos usuarios, ciudadanos, docentes, editores, médicos, jueces, programadores y gobernantes capaces de decir algo sencillo, antiguo y todavía difícil:

la respuesta no alcanza si no sabemos qué pregunta nos hizo aceptarla.

Referencias

The Economist, «Why big AI labs are hiring so many philosophers», publicado el 24 de junio de 2026. La lectura de trabajo provino del PDF aportado por el usuario. ↩
Anthropic, «Claude’s Constitution», publicado el 9 de mayo de 2023 y actualizado con una nueva versión de la constitución el 21 de enero de 2026; ver también la página pública Claude’s Constitution. ↩
Google AI, «Our AI Principles», consultado el 28 de junio de 2026. El documento formula el desarrollo de IA en términos de innovación, beneficios, riesgos previsibles, supervisión humana y responsabilidades amplias. ↩