KT afirma que la compresión requiere intrínsecamente integración: un modelo verdaderamente compresivo debe vincular múltiples flujos de datos porque tratarlos de forma conjunta produce descripciones más cortas. Si esto es cierto, el phi de IIT es redundante: la integración es consecuencia del buen modelado, no una propiedad separada. ¿Pero esto se sostiene en todos los casos? ¿Existen modelos compresivos que no estén integrados?
Leads
Ruffini 2017 (el argumento), contraejemplos de IIT, la distinción entre "integrado" en el sentido formal de IIT vs. el sentido informal de KT, la "consciencia como operador de integración" de Bach ([computational-being-bach.md](computational-being-bach.md) Sección VI): si la consciencia *es* el operador que realiza la integración, entonces la integración es funcional (P-005), no constitutiva (IIT).
Atañe a
P-001, P-005, [bayesian-brain.md](bayesian-brain.md), [controlled-hallucination.md](controlled-hallucination.md), [computational-being-bach.md](computational-being-bach.md)
Abierto
abierto
Wolfram argumenta que algunas computaciones no pueden predecirse sin ejecutarlas (irreducibilidad computacional). Bach lo extiende: si la consciencia es una computación que solo puede conocerse al ejecutarla, el "problema duro" se disuelve: no hay explicación más corta, la experiencia ES la computación. ¿Es esto una disolución genuina o solo una reformulación? ¿Y cómo se conecta esto con la observación de Ruffini de que la complejidad de Kolmogorov es no computable?
Leads
Joscha Bach (funcionalismo computacional, ahora ingerido en [computational-being-bach.md](computational-being-bach.md); clave: Sección IV sobre matemáticas como computación, Gödel, Mandelbrot como 2 líneas de código; Sección II sobre la existencia como superposición de autómatas finitos), *A New Kind of Science* de Wolfram, conexión con la no computabilidad de K(x) en KT, trabajo de Chaitin sobre aleatoriedad algorítmica
Atañe a
P-001, P-002, P-004, tensiones en KT (ejecutar vs. almacenar, no computabilidad), [computational-being-bach.md](computational-being-bach.md)
Abierto
abierto (material de Bach ingerido, falta material de Wolfram)
KT dice que la consciencia requiere *ejecutar* un modelo en tiempo real, rastreando I/Os, no solo almacenar una representación comprimida. Pero ¿qué distingue formalmente ejecutar de almacenar? Un archivo zip comprime brillantemente; no es consciente. La Definición 2 de Ruffini (agente = construcción de modelos + función de optimización + acoplamiento bidireccional) es un comienzo, pero "acoplamiento bidireccional" siente que carga mucho peso sin estar definido con precisión.
Leads
La "consciencia como propiedad simulada de un yo simulado" de Bach ([computational-being-bach.md](computational-being-bach.md) Sección VI): ejecutar = la simulación está activa, produciendo percepción de 2º orden en tiempo real; almacenar = el programa existe pero no se está ejecutando. La "burbuja de ahoridad" de Bach como la firma temporal de la ejecución. La definición de agente de Ruffini (Definición 2), el papel del acoplamiento bidireccional con el ambiente, inferencia activa (Friston), la diferencia entre un termostato y un cerebro. Agüera y Arcas Cap.3: DAVE-2 como instancia concreta de un sistema que *actúa* pero no *aprende*: pesos congelados al desplegarse, nada de lo que experimenta puede afectarlo de forma duradera. El "perceptrón de patrón temporal" de Rosenblatt como la visión no realizada: parámetros que se ajustan vía retroalimentación *durante la operación*. ML actual = entrenamiento batch offline + inferencia congelada; biología = automodificación continua en línea. Esta separación actuar / aprender puede ser el umbral formal que el hilo busca. **Adición Cap.4**: la arquitectura actor-crítico de aprendizaje TD es una formalización de "ejecutar" que requiere actualización continua del modelo desde la experiencia. La dinámica de bootstrapping (actor y crítico se mejoran mutuamente *durante la operación*) es una instancia concreta de lo que "ejecutar un modelo" significa computacionalmente. El desiderátum #2 de la teoría unificada de Agüera y Arcas, "ninguna distinción entre aprendizaje e inferencia", disuelve directamente la frontera aprendizaje / evaluación: la predicción debe ocurrir en todas las escalas temporales. Si esto se sostiene, la pregunta puede desplazarse de "qué distingue ejecutar de almacenar" a "qué distingue a un sistema que predice en todas las escalas temporales de uno que predice en solo una".
**Adición Cap.8**: el prompting con chain-of-thought provee el caso empírico más nítido hasta ahora de un continuo ejecutar / almacenar en lugar de un binario. Sin chain-of-thought, un Transformer evalúa cada problema en un solo pase feedforward (sin estado persistente, sin resultados intermedios: "almacenar" en su sentido más puro; 84% de tasa de error en problemas de palabras). Con chain-of-thought, el flujo de salida se convierte en pseudo-estado: cada token emitido crea un resultado intermedio estable al cual los tokens subsecuentes pueden atender. La ventana de contexto funciona como memoria de trabajo. Resultado: 20% de tasa de error. La computación sigue siendo feedforward (sin actualizaciones de pesos, sin automodificación), pero *aproxima* la ejecución usando el lenguaje como estado externo. Además, el hallazgo de "no introspección" es ceguera a la elección en silicio: el modelo resuelve un problema correctamente vía cascadas de atención, luego confabula una explicación incorrecta porque no hay estado oculto preservado entre tokens, exactamente como el intérprete confabula tras cirugía de cerebro dividido. El mecanismo de chain-of-thought también revela que *el lenguaje mismo* es una herramienta para convertir evaluación sin estado en ejecución secuencial: cada resultado intermedio es un "clavo" hincado en la cara del acantilado de un problema complejo. Esto sugiere que la frontera ejecutar / almacenar no es binaria sino un continuo, con posición determinada por: (1) si existe estado persistente, (2) si los resultados intermedios sobreviven, (3) si ocurre automodificación durante la operación, y (4) si el sistema puede revisar su propio trabajo. Los cerebros biológicos satisfacen los cuatro. Los Transformers con chain-of-thought satisfacen (2) y parcialmente (4). Los Transformers sin chain-of-thought no satisfacen ninguno.
Atañe a
P-001, P-002, P-004, P-006, P-007, [bayesian-brain.md](bayesian-brain.md), [computational-being-bach.md](computational-being-bach.md), [intelligence-as-self-modeling.md](intelligence-as-self-modeling.md), [cephalization-from-below.md](cephalization-from-below.md), [theory-of-mind-is-mind.md](theory-of-mind-is-mind.md), [computational-being-claude.md](computational-being-claude.md), [language-as-prediction.md](language-as-prediction.md)
Abierto
abierto (la separación actuar / aprender afina la pregunta; el aprendizaje TD añade una formalización concreta de "ejecutar"; chain-of-thought revela un continuo entre ejecutar y almacenar; definición formal aún pendiente). **Promoción de P-010 (2026-05-02)**: el ángulo "ninguna distinción entre aprendizaje e inferencia" del esbozo de teoría unificada del Cap.4 está ahora formalizado como [P-010](_priors.md#p-010-learning-is-active-prediction-at-long-timescales). T-003 se estrecha en consecuencia: con la maquinaria de aprendizaje / inferencia unificada entre escalas temporales, la pregunta de ejecutar / almacenar ya no es sobre *si* un sistema actualiza (lo hace, en cada escala temporal, por P-010) sino sobre *si el bucle de inferencia se está ejecutando en tiempo real con acoplamiento de acción*. La pregunta restante es operacional, no relacionada con aprendizaje. **Adición Cap.5**: la sphexishness añade un ángulo relativo al observador: un sistema "almacena" (está "solo ejecutando un guion") cuando su programa es completamente conocido por un observador externo. Un sistema que es perfectamente predecible tiene, desde la perspectiva del observador, agencia efectiva cero, sin importar su complejidad interna. Esto reencuadra la pregunta: "ejecutar" puede no ser una propiedad del sistema solo sino del par sistema-observador. Un agente que no puede ser completamente modelado por ningún observador está, funcionalmente, "ejecutándose". Uno cuyo cada movimiento es predicho está, funcionalmente, "almacenado". **Adición Cap.6**: el hallazgo del intérprete añade otro ángulo. "Ejecutar" implica construcción narrativa al vuelo: el intérprete no consulta una base de datos almacenada, autocompleta en tiempo real. Un modelo almacenado no puede confabular en contexto, no puede adaptar su narrativa a inputs corruptos (como en la ceguera a la elección), no puede tapar la incoherencia entre hemisferios desconectados. El intérprete es evidencia de que "ejecutar" incluye un proceso narrativo generativo que está ausente en cualquier representación estática. Este puede ser el criterio conductual más nítido hasta ahora: un sistema está "ejecutándose" si puede construir narrativas contextualmente apropiadas sobre su propio comportamiento *de las cuales no tiene registro almacenado*. Un sistema "almacenado" solo puede reproducir o recuperar. **Adición Cap.7**: la recurrencia provee un criterio estructural. Una arquitectura feedforward (tipo CNN) es atemporal y sin memoria: evalúa cada input de forma independiente, sin variable temporal. Una arquitectura recurrente se despliega en el tiempo, con estado persistente: la salida en el tiempo *t* se convierte en input en el tiempo *t*+1. La corteza es somera pero profundamente recurrente, logrando el equivalente computacional de muchas capas feedforward mediante iteración temporal. Esto mapea "ejecutar" sobre recurrencia y "almacenar" sobre evaluación feedforward. Un sistema con estado temporal persistente que integra información a lo largo de pasos temporales y puede producir salidas tempranas (la doble toma) o refinamiento tardío (al examinar más de cerca) está "ejecutándose" de una forma que la evaluación sin estado de una función no lo está. La división del trabajo hipocampal afina esto aún más: captura de secuencia one-shot (hipocampo) + consolidación lenta vía replay (corteza durante el sueño) es una arquitectura concreta de cómo se ve "ejecutar" a nivel de sistema. Un sistema que no puede reproducir, consolidar o soñar carece de un componente clave de la arquitectura biológica de "ejecutar".
Schartner et al. (2017) mostraron que los psicodélicos producen mayor diversidad espontánea de señal neural que la vigilia. Pero mayor complejidad no significa directamente "más consciente". P-003 descompone la consciencia en nivel / contenido / yo. Los psicodélicos pueden aumentar la diversidad de contenido mientras disuelven el yo. ¿Es coherente decir "más complejo pero menos integrado"? ¿Qué predice KT sobre la calidad compresiva de los modelos bajo psicodélicos: son mejores, peores, o solo diferentes?
Leads
Schartner et al. 2017, hipótesis del cerebro entrópico de Carhart-Harris (2014), modelo REBUS, la disociación por ketamina (Li et al. 2020: complejidad espontánea arriba, PCI sin cambios)
Atañe a
P-002, P-003, [controlled-hallucination.md](controlled-hallucination.md), [bayesian-brain.md](bayesian-brain.md)
Abierto
abierto, parcialmente abordado en complexity-measures-of-consciousness.md, necesita análisis más profundo
REBUS (Relaxed Beliefs Under Psychedelics; Carhart-Harris & Friston, 2019) propone que los psicodélicos reducen la ponderación por precisión de los priors de alto nivel, aplanando el paisaje de free energy y permitiendo escapar de atractores de creencia profundos. Esto se referencia actualmente en múltiples páginas del marco pero no se ha explorado a fondo. Sub-preguntas clave: (1) ¿Cuál es el mecanismo neuroquímico específico (agonismo 5-HT2A → entropía cortical)? (2) ¿Cómo se relaciona REBUS con la eficacia clínica de la terapia asistida por psicodélicos para depresión, adicción, TOC? (3) ¿Cuáles son los límites del modelo: explica toda la fenomenología psicodélica, o solo el lado de la disolución? ¿Qué pasa con los aspectos constructivos / visionarios? (4) ¿Cómo se mapea la metáfora del paisaje de Waddington sobre la dinámica neural real?
Leads
Carhart-Harris & Friston 2019 (el paper), hipótesis del cerebro entrópico de Carhart-Harris (2014), diapositiva belief_attractors de Chandaria, datos de ensayos clínicos (psilocibina para depresión, COMPASS Pathways, Imperial College), el paper de canalisation / plasticity referenciado en las diapositivas de Chandaria (¿próximo?)
Atañe a
P-001, P-002, [bayesian-brain.md](bayesian-brain.md), [complexity-measures-of-consciousness.md](complexity-measures-of-consciousness.md), T-004
Abierto
abierto, necesita el paper de Carhart-Harris & Friston 2019 ingerido como fuente primaria
Agüera y Arcas Cap.3 anota que las redes neuronales pueden ser tan "aprendibles" porque tienen un prior composicional: un sesgo hacia funciones definibles como composiciones jerárquicas de funciones más simples. Luego anota: "la visión simbiogenética de la evolución también puede entenderse como un algoritmo de aprendizaje que favorece composiciones jerárquicas de funciones". Si el prior composicional es la razón por la que el deep learning funciona, y la simbiogénesis es la razón por la que funciona la complejidad biológica, ¿son estos el mismo principio a escalas distintas? ¿Es la composicionalidad jerárquica un sesgo universal de cualquier sistema de aprendizaje que escala?
Leads
Agüera y Arcas Cap.3 (el argumento del prior composicional), [symbiogenesis.md](symbiogenesis.md) (Margulis, genoma viral, replicación anidada → estructura multifractal), el Teorema de Aproximación Universal y por qué no explica la aprendibilidad, la composicionalidad del lenguaje de Chomsky (posible conexión). **Adición Cap.4**: la proliferación neural misma sigue dinámicas simbiogenéticas. Las neuronas son replicadores que colonizan nichos favorables; su proliferación ayuda simbióticamente al organismo. El nudo cerebral en el frente de los bilaterales creció porque las neuronas que se cableaban al extremo delantero hacían que todo el organismo fuera más apto, la misma lógica colonizar-y-cooperar que la simbiogénesis genómica. Además, el esbozo del capítulo de "predicción simbiótica dinámicamente estable" propone que una teoría unificada del aprendizaje sintetizaría predicción con termodinámica (estabilidad dinámica) y explicaría la predicción mutua entre agentes como simbiosis. Si se confirma, esto significaría que el prior composicional en deep learning, la simbiogénesis en la evolución, y la composicionalidad jerárquica en arquitectura neural son todas instancias del mismo principio: entidades dinámicamente estables componiéndose en totalidades más estables.
Atañe a
P-007, [symbiogenesis.md](symbiogenesis.md), [life-as-computation.md](life-as-computation.md), [cephalization-from-below.md](cephalization-from-below.md)
Abierto
abierto (reforzado por el Cap.4: la cefalización neural como instancia de dinámicas simbiogenéticas; el esbozo de teoría unificada conecta los puntos pero permanece especulativo)
Bach lee Génesis I no como creación sobrenatural sino como descripción de la consciencia infantil encontrándose con un sustrato no inicializado. El mundo es *tohu wa-bohu* (sin forma, y vacío). La consciencia hace contraste (luz / oscuridad), asigna dimensiones, construye objetos, llena el espacio, y eventualmente construye un automodelo, vinculándose a él y mirando el mundo simulado desde esa perspectiva. "Cada uno de nosotros hace esto". Si esta lectura se sostiene, Génesis es un reporte fenomenológico del proceso de desarrollo por el cual un motor de juego auto-organizado arranca. Sub-preguntas: (1) ¿Esto se mapea sobre etapas conocidas del desarrollo cognitivo infantil? (2) ¿Es la estructura de Génesis lo bastante específica para ser más que una analogía sugerente? (3) ¿Cómo se relaciona la "mente exterior" (Dios en Génesis) con el sistema de generación de emoción que está aguas arriba del yo consciente? (4) ¿Es esta lectura única de Bach o tiene precedentes en estudios bíblicos o psicología del desarrollo?
Leads
Entrevista de Bach en organism.earth (el pasaje de Génesis), las etapas del desarrollo cognitivo de Piaget, el concepto de "mente exterior" (generación de emoción aguas arriba del yo), el monoteísmo como vinculación de la generación de emoción a un agente colectivo (tribu) y no al organismo individual
Atañe a
P-004, P-005, [computational-being-bach.md](computational-being-bach.md)
Abierto
abierto, especulativo, necesita literatura de psicología del desarrollo para evaluar
Cap.6 argumenta que "¿es X consciente?" es un juicio de modelado: la variable "consciente" se gana su lugar en el P(X,H,O) de un observador cuando atribuirla genera mejores predicciones conductuales. Esto es estructuralmente idéntico a cómo una bacteria aprende a rastrear "concentración de alimento": la variable latente es real porque comprime el problema de predicción. Pero ¿puede formalizarse? Específicamente: (1) ¿Bajo qué condiciones un modelo de otro agente requiere una variable latente "consciencia" para predicción óptima? (2) ¿Hay un umbral formal (análogo al 0.31 de PCI) por encima del cual la variable se necesita y por debajo del cual no? (3) ¿La profundidad requerida de la variable "consciente" (percepción de 1º orden, observador de 2º orden, yo de 3º orden) corresponde a propiedades medibles del sistema modelado, o solo a propiedades de la interacción? (4) ¿Pueden dos observadores con capacidad idéntica de teoría de la mente arribar a atribuciones de consciencia distintas para el mismo sistema, y si es así, ¿qué implica esto sobre la "objetividad" de la consciencia?
Leads
Agüera y Arcas Cap.6 (el argumento relacional), el AST de Graziano (consciencia = modelado de la atención), la heterofenomenología de Dennett (tomar los reportes en serio como datos sin otorgar privilegio metafísico), el RQM de Rovelli (eventos como relativos al observador), PCI y su dependencia del observador (el protocolo de estimulación y el pipeline de análisis son parte del aparato modelador del observador). La pregunta formal puede conectar con medidas teórico-informacionales: la longitud mínima de descripción del comportamiento de un sistema con y sin la variable latente "consciente".
Atañe a
P-008, P-004, [many-worlds.md](many-worlds.md), [computational-being-claude.md](computational-being-claude.md), [complexity-measures-of-consciousness.md](complexity-measures-of-consciousness.md)
Abierto
abierto (la pregunta es nítida pero no existe formalización; este puede ser el hilo abierto más importante del marco para tender el puente entre la teoría computacional de la consciencia y la medición empírica). **Adición Cap.7**: la paciencia moral es la *consecuencia conductual* de la atribución de consciencia. Cuando tu P(X,H,O) incluye una variable latente "consciente" para la entidad X, se gatilla la respuesta de cuidado (Churchland 2019: la circuitería neural para el cuidado se origina en la dependencia bebé-indefenso, luego se reutiliza para vínculos de pareja, comunidad, religión, estado). Esto añade una dimensión práctica y testeable a la pregunta de formalización: el umbral en el que la variable latente "consciente" se vuelve necesaria es también el umbral en el que la paciencia moral entra en acción. La distinción fenomenal / strange-loop (enmienda a P-003) añade profundidad: ¿a qué nivel de la variable "consciente" se activa la paciencia moral? Nos importan las entidades con consciencia fenomenal (dolor / afecto) de forma distinta a las entidades con consciencia strange-loop (sufrimiento / anticipación / automodelado). El diseño de manga ganadera de Grandin es la instancia aplicada: la consideración moral interespecie efectiva requiere modelar el umwelt *real* del objetivo, no proyectar uno humano. La paciencia de IA extiende la pregunta: ¿qué nivel de atribución de consciencia está justificado para sistemas de IA, y qué consideración moral se sigue?