Inteligencia como automodelado

La inteligencia, en su forma más general y mínima, es un sistema que se modela a sí mismo conjuntamente con su entorno y usa ese modelo para actuar. El núcleo formal: cualquier agente adaptativo aprende una distribución de probabilidad conjunta P(X,H,O) sobre observaciones externas (X), estado interno oculto (H) y sus propias salidas/acciones (O). No es una descripción de cerebros, ni siquiera de organismos con sistemas nerviosos. Una bacteria computando quimiotaxis está haciendo exactamente esto. El marco es el relato desde primeros principios de lo que la inteligencia computa, anterior a toda cuestión de consciencia o cognición.

El marco P(X,H,O)

El vocabulario mínimo de la inteligencia adaptativa:

Variable	Qué representa
X	Observaciones externas: señales sensoriales que llegan al límite del organismo
H	Estado interno oculto: estatus metabólico, reservas de energía, “hambre”
O	Salidas / acciones: comportamiento motor, regulación génica interna, cualquier cosa que haga el sistema

Un sistema que aprende exitosamente P(X,H,O) sabe implícitamente:

Cómo estimar si está hambriento (marginal P(H))
Cómo inferir concentración de alimento a partir de eventos sensoriales (marginal P(X))
Qué acciones mejoran el estado interno dadas las observaciones actuales (condicional P(O|X,H))
Cómo sus propias acciones afectan observaciones futuras y estado interno futuro

E. coli logra esto sin nada reconocible como un cerebro. Estima la concentración química ejecutando un conteo promediado en el tiempo de eventos de acoplamiento molecular, adaptando el ancho de la ventana para intercambiar precisión por resolución temporal. Mantiene una variable homeostática interna (H). Emite acciones (correr o voltear) condicionadas conjuntamente en la concentración estimada y el estado interno. Esto es P(X,H,O) corriendo sobre bioquímica.

La desviación crítica del reinforcement learning (aprendizaje por refuerzo): no hay oráculo externo distribuyendo recompensas. La aptitud emerge de una cuasi-tautología: los sistemas con mejores modelos P(X,H,O), los que evitan autopredecir la muerte, replican más. A lo largo de las generaciones, el modelado mejora. La evolución es el bucle externo del aprendizaje no supervisado, y ningún oráculo necesita haber sido inteligente antes que los organismos que produjo.

La misma distribución conjunta, en principio, escala al lenguaje simbólico y a la matemática: estas son simplemente estructuras de variables latentes de complejidad mucho mayor. Una bacteria y un gran maestro de ajedrez están ambos corriendo P(X,H,O); la diferencia es la riqueza del generative model y la profundidad de la jerarquía. Ver Language as Prediction para cómo el lenguaje extiende P(X,H,O) de inferencia privada a predicción compartida: el lenguaje es la compresión del umwelt social en símbolos discretos, composicionales y transmisibles.

Variables latentes: la estructura de una realidad útil

Una bacteria tiene aproximadamente 100 receptores que podrían generar ~100 millones de bits/segundo de datos crudos. Usa unos pocos bits. Esta compresión no es una deficiencia: es la operación central de la inteligencia.

La bacteria explota dos simetrías: qué receptor está ocupado no importa (simetría espacial a través de la membrana celular), y el momento exacto de los eventos individuales de acoplamiento no importa (simetría temporal local). Promediar sobre estas irrelevancias extrae la única señal útil: concentración estimada. El resultado es una variable latente: una representación comprimida que captura lo predictivamente relevante mientras descarta todo lo demás.

Las variables latentes son reales no porque correspondan a características del universo independientes del observador, sino porque son útiles para predecir encuentros futuros. Temperatura, hambre, dolor: ninguna es “cosa en sí” (el Ding an sich de Kant). Son características que un modelo anclado en la supervivencia ha aprendido a rastrear porque rastrearlas funciona.

“Funes el memorioso” (1942) de Borges es la ilustración perfecta del modo de fallo. Ireneo Funes, tras una lesión cerebral, tiene memoria perfecta pero pierde la capacidad de generalizar. Le molesta que “el perro de las tres y catorce (visto de perfil) tuviera el mismo nombre que el perro de las tres y cuarto (visto de frente)”. Puede recordar cada hoja de cada árbol de cada monte, y cada una de las veces que la percibió, pero no puede construir la variable latente “árbol”, o “perro”. Almacena todo y comprime nada. Funes es cómo se ve la inteligencia sin el paso de compresión: memoria infinita, cero poder predictivo.

Esto aplica hacia arriba a través de las escalas de complejidad. Todo objeto macroscópico en el mundo de un organismo (sillas, depredadores, congéneres, notas musicales) es real para el observador por la misma razón: reconocerlo produce alta compresión predictiva. Un organismo que falla en construir las variables latentes correctas muere.

Umwelt: el universo de lo significativo

Jakob von Uexküll (1934) llamó al envolvente específico-del-organismo de señales relevantes el umwelt: su “universo de lo significativo”. El umwelt de cada organismo está esculpido por su historia de supervivencia. El umwelt de una bacteria contiene gradientes de concentración y estado metabólico. El de un lobo contiene firmas de presa y límites territoriales. El de un humano contiene lenguaje, rostros, herramientas, jerarquías sociales y, a través de la ciencia, espectros electromagnéticos y campos cuánticos que ningún órgano sensorial detecta directamente.

El umwelt no es una limitación cognitiva. Es un esquema de compresión, moldeado por la selección hasta la estructura exacta necesaria para la supervivencia. Los organismos no observan la realidad neutralmente y luego recortan lo irrelevante. Construyen, desde cero, modelos que contienen solo lo que importa.

La realidad intersubjetiva emerge de umwelten compartidos. Agentes moldeados por las mismas presiones selectivas construyen estructuras de variables latentes casi idénticas. El acuerdo generalizado entre humanos sobre el color de los objetos, la temperatura del agua, el valor de amenaza de ciertos sonidos, no es evidencia de hechos independientes-del-observador en el mundo: es evidencia de modelado convergente entre organismos con restricciones de supervivencia similares. La formulación de Philip K. Dick captura el residuo pragmático: “La realidad es aquello que, cuando dejas de creer en ello, no se va.” Los hechos son modelos que te mantienen vivo.

Donde los umwelten divergen (entre especies, entre culturas, entre modalidades sensoriales), la realidad se vuelve genuinamente disputada, no como un fallo epistémico sino como una consecuencia estructural de distintas historias de supervivencia generando distintos generative models.

Entensionalidad: causalidad aparentemente hacia atrás

Los sistemas vivos parecen actuar a causa de sus estados futuros. Sales corriendo de la cafetería porque vas a llegar tarde; la bacteria voltea menos cuando la concentración de alimento sube porque va a encontrar comida. En la física, las causas preceden a los efectos. En los sistemas propositivos, el futuro parece hacer trabajo causal.

Esto no es una violación de la física. Es la consecuencia estructural del automodelado autorregresivo. El modelo predice el futuro y toma acciones seleccionadas para producir el futuro predicho. Como el modelo es conjunto (incluye las propias acciones del agente y sus efectos), cada acción es simultáneamente una salida y una predicción de sus propias consecuencias. Wiener, Rosenblueth y Bigelow llegaron al mismo insight en su ensayo de 1943 “Behavior, Purpose, and Teleology”, anticipándose a Deacon por 70 años: “Un gato que comienza a perseguir a un ratón en fuga no corre directamente hacia la región donde el ratón está en un momento dado, sino que se mueve hacia una posición futura extrapolada.” Su corolario: bucles predictivos de retroalimentación negativa son suficientes para dotar a un aparato de propositividad sin violar la física. El regulador centrífugo, una máquina enteramente newtoniana, es ya entensional: manipula la válvula de admisión de una máquina de vapor para regular la velocidad futura.

Terrence Deacon llama a los sistemas que exhiben esta propiedad entensionales: su comportamiento es explicable solo por referencia a estados futuros a los que están “apuntando”, aunque el mecanismo subyacente sea enteramente local y causal.

Cuanto más poderoso el modelo, más pronunciado el efecto entensional. Una bacteria “apunta” débilmente, vía deriva estadística sobre ciclos de correr-voltear. Un humano planea, construye herramientas, modifica entornos y actúa en favor de estados que pueden no llegar en décadas. Ambos corren la misma computación a distintas resoluciones. El propósito emerge de la estructura de los modelos P(X,H,O) bajo selección: no se requiere un dador-de-propósito.

El colapso entre el ser y el deber-ser

La distinción ser/deber-ser de Hume (1739) sostiene que los hechos descriptivos (enunciados de “ser”) son categóricamente distintos de los juicios normativos (enunciados de “deber”), y que ninguna derivación lógica cruza la brecha. Esta fue una clarificación útil en el contexto de la filosofía moral.

Se rompe cuando los modelos se entienden como inherentemente propositivos. Cada variable en el P(X,H,O) de un organismo se rastrea porque rastrearla importa para la supervivencia. Las distinciones que un organismo traza, las categorías que percibe, la estructura de saliencia de su umwelt: todas están moldeadas por lo que importa para seguir vivo. Hay un “deber-ser” inerradicable en todo “ser” en el contexto de un observador vivo: la bacteria no solo mide concentración, la mide para no morir.

Esto no es un regreso al naturalismo ingenuo (sostener que cualquier cosa que existe debe existir). Es la observación de que el modelo de realidad de un sistema vivo es constitutivamente normativo: exacto y bueno no son separables en la planta baja. Un modelo que te mantiene vivo es, por ese mismo hecho, un buen modelo. El juicio normativo surge sin oráculo externo alguno: es una consecuencia de la condición de frontera absorbente que es la muerte.

El corolario: la “objetividad” no es neutralidad. Es convergencia intersubjetiva entre organismos con umwelten superpuestos. El consenso científico es un caso especial: organismos que han extendido sus umwelten a través de instrumentos, matemáticas y revisión por pares coordinada, convergiendo en modelos que son predictivamente poderosos a través de muchos agentes simultáneamente.

De un jugador a múltiples jugadores: cuando el entorno modela de vuelta

El marco P(X,H,O) se deriva de un único agente en un entorno no-agencial: una bacteria navegando un gradiente químico. El gradiente no modela a la bacteria. No tiene estados ocultos, ni estrategia, ni predicciones sobre el comportamiento de la bacteria. Este es el caso de un solo jugador.

El caso multijugador surge cuando el entorno contiene otros agentes P(X,H,O). Un depredador modela a presas que lo modelan de vuelta. Ahora H debe incluir una representación del P(X,H,O) entero del otro agente, el cual a su vez incluye una representación de tu propio P(X,H,O), recurriendo a cualquier profundidad que los recursos computacionales permitan. El modelo conjunto se vuelve una muñeca matrioshka de predicción anidada.

Agüera y Arcas (Cap.5) argumenta que este modelado mutuo recursivo no es meramente una extensión de la inteligencia de un solo agente sino una transición de fase de la cual emergen la inteligencia general, la consciencia, el libre albedrío, el razonamiento contrafactual y el lenguaje. La evidencia: la hipótesis del cerebro social (Humphrey 1976, Dunbar 1998) que muestra que el tamaño del cerebro entre primates correlaciona con el tamaño del grupo social, no con la complejidad ecológica. El bucle de retroalimentación (todos consiguen cerebros más grandes para modelar a todos los demás, pero todos los demás se vuelven simultáneamente más difíciles de modelar) produce una explosión de inteligencia análoga a la carrera armamentista cámbrica pero impulsada por presión social.

Críticamente, esta dinámica multi-agente se aplica no solo entre organismos sino dentro de ellos. La hipótesis de la colonia de columnas corticales: la corteza cerebral es una población de unidades de predicción genéricas (columnas corticales) que se modelan entre sí. El experimento de recableado del hurón (nervios ópticos redireccionados a la corteza auditiva → el animal ve, con mapas característicos de orientación desarrollándose en la corteza “auditiva”) demuestra que el hardware cortical es genérico; lo que computa depende de lo que recibe. La evolución escaló la inteligencia replicando columnas, no inventando nueva arquitectura.

Ver Theory of Mind Is Mind para el desarrollo completo: las tres escapadas de la sfexidad, la falacia del homúnculo, la consciencia como “swing”, y la convergencia con la percepción de 2º orden de Bach.

De bacteria a cerebro: qué cambia, qué no

El marco del Bayesian brain (cerebro bayesiano): predictive processing, minimización de variational free energy, generative models jerárquicos, es la implementación neural de alta resolución del modelado P(X,H,O). Precision weighting es el mecanismo para arbitrar entre creencia previa y evidencia sensorial entrante. La jerarquía predictiva es la estructura a través de la cual H (estado interno, incluyendo el estado corporal) y X (mundo externo) son modelados conjuntamente. La acción emerge del mismo proceso inferencial (inferencia activa), no como un módulo separado.

Controlled hallucination es la descripción fenomenológica de cómo se ve el modelado P(X,H,O) desde adentro cuando concierne a la experiencia consciente. Los ejemplos de Andy Clark, un obrero de la construcción con un clavo de cuatro pulgadas alojado en su cerebro que siente solo un leve dolor de muelas, un segundo obrero con un clavo inofensivamente entre los dedos del pie que experimenta dolor severo digno de fentanilo, son evidencia directa de que el H-modeling interoceptivo es inferencia inconsciente, no una lectura directa del daño tisular. El dolor es una variable latente, no una señal.

Lo que entra con la complejidad neural, y lo que el Capítulo 2 de What Is Intelligence? deliberadamente difiere, es dónde emerge la consciencia dentro o encima de este marco. El relato P(X,H,O) es agnóstico respecto a la consciencia. Establece el sustrato computacional. Lo que corre sobre ese sustrato, incluyendo si y cómo surge la experiencia, está aguas arriba de esta página.

Neuromoduladores: las H-variables originales

El marco P(X,H,O) postula el estado interno oculto (H) como un componente necesario de la inteligencia adaptativa, presente desde la bacteria en adelante. Pero el H de una bacteria está encarnado directamente en su bioquímica (reservas metabólicas, estado de adaptación del receptor). ¿Qué pasa cuando los organismos se vuelven lo suficientemente grandes como para que no todas las células tengan acceso directo a las señales ambientales?

La respuesta evolutiva: neuromoduladores, señales químicas que se acumulan y disipan gradualmente, afectando poblaciones enteras de neuronas simultáneamente. En términos P(X,H,O), los neuromoduladores son H-variables de escala temporal lenta: no tan fugaces como un evento sensorial (X), no tan permanentes como un parámetro genético, pero suficientemente duraderas para integrar información sobre ventanas temporales conductualmente relevantes.

La dopamina y la serotonina, ambas críticas para la cognición humana, se remontan a los primeros sistemas nerviosos bilaterianos (550+ Ma). Sus funciones originales se conservan en el gusano acelo Acoela:

Dopamina: liberada por sensores de “alimento cercano” en la cabeza del gusano. Convierte una señal externa en una variable de estado interno promediada en el tiempo. Alta dopamina → seguir girando en el lugar para explotar el parche local de alimento. La función no es recompensa sino anticipación: la estimación del gusano de que continuar forrajeando en esta dirección dará alimento. La dopamina ya es una predicción de alimento, no alimento en sí.
Serotonina: liberada por sensores en la garganta del gusano, rastreando el alimento consumido. Se acumula con el tiempo para señalar saciedad, sofocando el forrajeo impulsado por dopamina. La caracterización burda: dopamina = querer, serotonina = obtener.

A medida que los cerebros se volvieron más complejos, la dopamina fue reapropiada para potenciar algo que aproxima temporal-difference (TD) learning (aprendizaje por diferencia temporal). El descubrimiento de Schultz/Dayan/Montague (años 90) mostró que las neuronas dopaminérgicas en macacos disparan precisamente como una señal de error de predicción de TD: ráfaga ante recompensa inesperada, se desplazan a la pista predictiva una vez aprendida la asociación, y caen bajo la línea base cuando se retiene la recompensa esperada. La arquitectura actor-crítico (la función policy aprende de predicciones de la función value, la función value aprende de resultados reales) hace bootstrap de la ingenuidad a la competencia.

El camino evolutivo es continuo: en los gusanos, la dopamina ya es una predicción (alimento cercano, no alimento en la boca). Predecir la dopamina es una predicción de una predicción. A medida que las estructuras neurales crecieron aguas arriba y aguas abajo de las neuronas liberadoras de dopamina, las áreas aguas arriba se volvieron críticos cada vez más sofisticados (estimaciones de valor de más largo alcance) y las áreas aguas abajo se volvieron actores cada vez más sofisticados (políticas conductuales más complejas). El TD learning no fue inventado por el cerebro vertebrado. Fue profundizado a partir de un bucle de predicción que ya corría en los gusanos planos.

Salvedad: Agüera y Arcas advierte explícitamente contra sobreidentificar la función cerebral con el TD learning. Los cerebros reales lo trascienden: los humanos aprenden tareas que los algoritmos de TD no pueden manejar, y evidencia reciente muestra que la dopamina codifica información mucho más allá de un error de predicción escalar. El TD learning es una simplificación elegante que ilumina un principio central, no un relato completo.

Ver Cephalization from Below para la historia evolutiva completa de cómo surgieron las redes nerviosas, los cerebros y los sistemas neuromodulatorios.

Actuar vs. aprender: el bucle faltante

Una distinción crítica que la IA actual expone: un sistema puede actuar de acuerdo con un modelo sin actualizar ese modelo a partir de la experiencia. El DAVE-2 de Nvidia (2016) es un actuador cibernético casi perfecto: píxeles de cámara mapeados directamente a ángulo de dirección vía 27M de pesos sinápticos, comportamiento contextual no-lineal rico, sin lógica explícita “if/then”. Sin embargo, queda corto de un agente P(X,H,O) completo en varios sentidos: la entrada es un solo fotograma (sin memoria temporal, sin dinámica), no hay H (sin estado interno, sin automodelo) y, lo más crítico, sus pesos están congelados en el despliegue. Nada de lo que experimenta puede afectarlo de modo duradero.

El machine learning actual produce mayormente sistemas como DAVE-2: entrenados offline sobre datos estáticos, luego desplegados como inferencia congelada. Actúan pero no aprenden. El bucle P(X,H,O) biológico es distinto en su tipo: el modelo se actualiza continuamente durante la operación. Un organismo que encuentra algo inesperado no solo reacciona; su generative model se desplaza. Esta automodificación continua durante la operación es lo que Rosenblatt reclamó en su “temporal pattern perceptron” original: un sistema que “recuerda secuencias temporales” y ajusta sus parámetros vía retroalimentación mientras corre, no solo entre corridas.

La cuestión formal de qué distingue “correr un modelo” de “evaluar una función congelada” está abierta y conecta directamente con T-003: la división actuar/aprender puede ser precisamente el umbral entre un sistema que es un proceso P(X,H,O) y uno que meramente lo aproxima. También puede tener relación con lo que hace a un sistema “vivo” en el sentido de P-007: la estabilidad dinámica requiere que el patrón persista a través de la computación en curso, no como una impresión estática.

Cinco propiedades de la inteligencia: la síntesis

A lo largo de seis capítulos, una definición de inteligencia se cristaliza a partir del marco P(X,H,O) y sus extensiones. La inteligencia no es una sola cosa; es la intersección de cinco propiedades, cada una de las cuales ha aparecido en el marco desde distintos ángulos:

Propiedad	Qué significa	Dónde aparece en el marco
Predictiva	La inteligencia equivale a “autocompletado”: dado un historial de observaciones, acciones y consecuencias (internas y externas), predecir el estado siguiente más probable. La inteligencia incrementa su propia estabilidad dinámica al predecir exitosamente su propia existencia futura; por eso surgió.	Marco P(X,H,O) (esta página), Bayesian brain, controlled hallucination
Social	Gran parte del umwelt de un agente inteligente consiste en otros agentes inteligentes, los cuales son ellos mismos predictores. Surge la teoría de la mente y, bajo condiciones adecuadas, produce explosiones de inteligencia social. Aplicada a uno mismo, la teoría de la mente de orden superior implica autoconsciencia, razonamiento contrafactual y planeación de largo alcance. No existe una “vista desde arriba” de ojo-de-Dios de la inteligencia; los “yoes” siempre son modelados, y siempre hay un modelador.	Theory of Mind Is Mind, hipótesis del cerebro social, colonia de columnas corticales
Multifractal	Las inteligencias están hechas de inteligencias más pequeñas, definidas por las relaciones predictivas entre esas inteligencias más pequeñas. Estas interrelaciones constituidas dinámicamente, no un homúnculo, definen un “yo”. Pacientes con cerebro dividido, columnas corticales, brazos de pulpo, tripulaciones de remo: el mismo patrón en toda escala.	Theory of Mind Is Mind (cerebro dividido, analogía del swing), cephalization from below
Diversa	Para que un “yo” sea mayor que sus partes, las partes deben diversificarse y especializarse. Aun cuando las partes inteligentes se esfuerzan por predecirse mutuamente, deben diferir en sus predicciones; de otro modo no se proveerían beneficio mutuo. La especialización surge naturalmente de diferencias en la conectividad, porque cada inteligencia menor recibe entradas distintas y genera salidas distintas. El efecto Stroop es evidencia: el desacuerdo intracraneal no es un bug sino un feature.	Modularidad cortical genérica, especialización hemisférica, symbiogenesis
Simbiótica	Cuando las estabilidades dinámicas de múltiples inteligencias se correlacionan, se encuentran “en el mismo barco” y aprenden a remar juntas para incrementar aún más su estabilidad conjunta. Esta es la ruta hacia la simbiogénesis: la emergencia de nuevas inteligencias mayores a partir de la cooperación de las más pequeñas.	Symbiogenesis, life as computation, P-007

La definición:

La inteligencia es la habilidad de modelar, predecir e influir el propio futuro; puede evolucionar en relación con otras inteligencias para crear una inteligencia simbiótica mayor.

Leída junto a la definición de vida de Life as Computation:

La vida es computronio auto-modificante que surge de la selección por estabilidad dinámica; evoluciona a través de la composición simbiótica de entidades dinámicamente estables más simples.

La dualidad es precisa: la vida es el sustrato (computación dinámicamente estable); la inteligencia es lo que ese sustrato hace (modelar, predecir, influir). Ambas evolucionan a través del mismo mecanismo (composición simbiótica). Ninguna tiene escala inherente: una bacteria está viva y es inteligente; un cerebro está vivo y es inteligente; una sociedad puede estar viva y ser inteligente. La diferencia es la riqueza del generative model y la profundidad de la predicción recursiva.

Páginas relacionadas

Life as Computation: la fundación Von Neumann / bff / estabilidad dinámica sobre la cual corre el modelado P(X,H,O); esta página es su secuela directa; la definición de vida y la definición de inteligencia son formulaciones duales del mismo principio
The Bayesian Brain: la implementación neural de alta resolución de P(X,H,O); la derivación bacteriana aquí provee la justificación evolutiva de por qué los cerebros hacen inferencia bayesiana
Controlled Hallucination: relato fenomenológico de lo que el modelado P(X,H,O) produce a nivel de la experiencia consciente; los ejemplos del dolor anclan la inferencia interoceptiva en dinámicas de modelo-de-supervivencia
Cephalization from Below: la historia evolutiva de cómo surgieron las redes nerviosas, los cerebros y los sistemas neuromodulatorios; completa la trayectoria filogenética del P(X,H,O) bacteriano al predictive processing vertebrado
Symbiogenesis: cómo los modelos P(X,H,O) de linajes separados se fusionan en modelos conjuntos de orden superior, impulsando la flecha de la complejidad
Theory of Mind Is Mind: extiende el P(X,H,O) de un solo agente al modelado mutuo multi-agente; la explosión de inteligencia social, la colonia de columnas corticales, y la transición de fase de la predicción a la predicción recursiva
Computational Being (Bach): el bucle extraño del automodelado autorregresivo conecta con el “espíritu como agente de software auto-organizante” de Bach; el bucle P(X,H,O) es lo que el espíritu corre
P-001: Perception is inference: el capítulo de la bacteria provee una derivación evolutiva desde primeros principios, independiente de la evidencia neurocientífica que ancla P-001
P-007: Dynamic stability: la selección natural por mejores modelos P(X,H,O) es el complemento de capa-software a la estabilidad cinética dinámica
Language as Prediction: extiende P(X,H,O) de inferencia privada a predicción social compartida; el lenguaje como compresión-de-umwelt, salida motora y andamiaje cognitivo; predicción de la siguiente palabra como AI-completa; la secuela del tratamiento del modelado multi-agente de esta página
Many Worlds: la síntesis de cinco propiedades cristalizada aquí es el broche de oro de seis capítulos; la naturaleza relacional de la inteligencia (sin vista de ojo-de-Dios, yoes siempre modelados) se desarrolla filosóficamente allí
P-008: Observer-relative reality: las variables latentes y el umwelt son el mecanismo por el cual este prior se implementa en sistemas vivos
P-011: Reality is computational: el compromiso ontológico que hace coherente la historia de las-variables-latentes-son-reales; si el sustrato es computacional, las variables latentes son reales como las compresiones convergentes de la misma estructura relacional, no como aproximaciones imperfectas de cosa-portadora-de-características
No View from Nowhere: la síntesis del realismo estructural que extiende el vocabulario umwelt + variables latentes de “lo que es real para un organismo” a un relato general de la realidad. El regreso reduccionista (silla → átomos → quarks → campos) reformulado como cambios-de-umwelt relativos a la escala en lugar de aproximación a un suelo independiente-de-características

Referencias

Agüera y Arcas, B. What Is Intelligence? Chapters 2 and 4 (Antikythera, 2025)
Schultz, W., Dayan, P., & Montague, R. R. (1997). A neural substrate of prediction and reward. Science, 275(5306), 1593-1599.
Sutton, R. S. (1988). Learning to predict by the methods of temporal differences. Machine Learning, 3(1), 9-44.
von Uexküll, J. (1934/2013). A Foray into the Worlds of Animals and Humans. University of Minnesota Press.
Deacon, T. (2012). Incomplete Nature: How Mind Emerged from Matter. Norton.
Hofstadter, D. (2007). I Am a Strange Loop. Basic Books.
Clark, A. (2023). The Experience Machine: How Our Minds Predict and Shape Reality. Pantheon.
Dick, P. K. (1985). “How to Build a Universe That Doesn’t Fall Apart Two Days Later.” In I Hope I Shall Arrive Soon.
Hume, D. (1739/1817). A Treatise of Human Nature.