"Frontal love": monitoreo de la activación de un aprendizaje basado en la recompensa, seleccionado después de una inhibición

El frontal lobe (lóbulo frontal) es el verdadero frontal 'love' ("amor" frontal) de la Psicología. Más especialmente aún, su parte "prefrontal", la cual -aunque suene raro porque da la idea que está más allá del frontal, algo como "antes de la frente"-, está en el mismo lóbulo frontal, sólo que en su parte más anterior. Y no es para menos, pues es este componente el que quizás define nuestras características más humanas; es decir, es el que nos aleja un poco -pero sólo un poquito- de nuestra naturaleza animal. Por eso, hoy compartimos este artículo de revisión publicado en 2004 por Ridderinkhof y colaboradores. Con él, le rendimos tributo a esa "capacidad" en menor o mayor medida, de organizar nuestra conducta en dirección a una meta, de inhibir respuestas inapropiadas y de controlar y corregir nuestro comportamiento, entre otras. Aquí va. Con ustedes, su compleja majestad: la corteza (pre)frontal. 

Retrato de Phineas Gage, uno de los primeros pacientes
reportados con daño frontal.
Imagen tomada de: http://brainandspine.titololawoffice.com/
Introducción
En el comportamiento dirigido a las metas, la toma de decisiones -es decir, la decisión de cuál acción tomar- está sesgada por la anticipación del resultado de la acción.

La evidencia proveniente de la neurociencia cognitiva está comenzando a converger en contribuciones diferenciales de varias regiones de la corteza prefrontal (CPF), las cuales están al servicio del control cognitivo. Sin embargo, puntualizan Ridderinkhof et al., se conoce notablemente poco acerca de cómo el cerebro determina y comunica la necesidad de activar el control cognitivo y de cómo tales señales dan paso a la implementación de ajustes apropiados al desempeño.

Objetivo
Ridderinkhof et al. revisan la evidencia proveniente de reportes recientes sobre algunos de los principales procesos que constituyen el control cognitivo, tales como aquellos implicados en la toma de decisiones dinámica: 
- La selección de la acción dirigida a una meta, 
- La activación de una respuesta, 
- La inhibición de una respuesta, 
- El monitoreo del desempeño y 
- El aprendizaje basado en la recompensa. 

Los autores hacen la aclaración de que, por supuesto, el agente que selecciona, activa, inhibe, monitorea y aprende es el individuo y no la CPF.

Anatomía y conectividad de la CPF
Los principales giros o circunvoluciones de la CPF en humanos grosso modo comprenden tres divisiones anatómicas principales:

1. Los giros laterales (giros superior, medio e inferior)
2. Los giros orbitofrontales (medio y lateral)
3. La pared medial (giro frontal medial y giro cingulado).

Una partición citoarquitectónica más convencional, de la CPF, también resulta en tres divisiones principales: 

1. CPF lateral: CPF dorsolateral, ventrolateral y unión frontal inferior.
2. Corteza orbitofrontal (COF): Porciones medial, ventral, lateral y frontopolar.
3. Corteza frontal medial (CFM): Corteza cingulada anterior (CCA) y, hasta el extremo dorsal, el giro frontal medial. La CCA consta de las porciones ventrales y dorsocaudales. El giro frontal medial consiste en (de caudal a rostral) el área motora suplementaria (AMS) y pre-suplementaria (pre-AMS), los campos del ojo frontales (o frontal eye fields) y la CPF dorsomedial.


Esquema de la corteza prefrontal medial y orbitofrontal.
Imagen tomada de: http://rstb.royalsocietypublishing.org


Ridderinkhof et al. explican que la CPF es un sistema ricamente conectado con proyecciones extensas desde y hacia casi todas las otras partes del cerebro, lo que la convierte en especialmente útil para el control de muchos aspectos del comportamiento.

Especialización funcional dentro de la CPF
Según los autores, cuando la selección de una acción dirigida a una meta se necesita, la CPF entra en juego. ¿Cómo? La CPF envía señales a regiones cerebrales subcorticales y corticales posteriores para configurar, modular y dirigir el procesamiento en estas áreas de acuerdo con los objetivos presentes y las demandas de la tarea; este sesgo de arriba-abajo es especialmente importante cuando las vías que dirigen la acción deseada compiten para expresarse en el comportamiento, con vías concurrentes más habituales (Miller & Cohen, 2001).

Aun cuando se reconoce cierto grado de especialización funcional dentro de la CPF, no puede afirmarse que una región cualquiera dentro de la CPF sirva solamente a una función.

Con el fin de poder prever los resultados principales de una acción, los procesos de control cognitivo en la toma de decisiones, comprenden:
(a) Un componente regulatorio: responsable de la activación e implementación de procesos de control ejecutivo para coordinar y ajustar el comportamiento dirigido a una meta.
(b) Un componente evaluativo: responsable de monitorear la necesidad de control regulatorio y señalar cuando sean necesarios ajustes en el control. 

El componente el regulatorio se basa principalmente en la CPF lateral y la COF, mientras que el componente evaluativo implica predominantemente a la CFM.

Selección de la acción dirigida a una meta y aprendizaje asociativo basado en la recompensa
Mientras que la selección se refiere al compromiso final con una alternativa, la decisión se refiere a la deliberación precedente acerca de las alternativas, el proceso que da lugar a la selección particular. 

Aprendizaje asociativo
Al reforzar los patrones de actividad responsables de que se alcance una meta, se pueden formar asociaciones entre estímulos ambientales, acciones, reglas y la recompensa consecuente. De esa manera, cuando condiciones similares recurran en el futuro, las representaciones neurales apropiadas pueden rápidamente ser recuperadas y puestas en marcha para facilitar el proceso de toma de decisiones que da lugar a escogencias ventajosas. 

Corteza prefrontal medial
El proceso de aprendizaje en la toma de decisiones requiere la habilidad de predecir la recompensa y de perseguir las acciones que asegurarán procurarla. En animales, los sistemas dopaminérgicos ascendentes están críticamente implicados en respuestas a estímulos reforzadores; el estriado ventral, particularmente el núcleo accumbens, es probablemente la estructura más robustamente ligada a procesos relacionados con la recompensaEl monitoreo del desempeño en la CFM posterior media este aprendizaje, ya que selectivamente refuerza los patrones de actividad neural que predicen la recompensa y guían el comportamiento necesario para conseguirla.


Ilustración del núcleo accumbens (círculo rojo) en una representación del
cerebro humano. La corteza prefrontal medial (CFM) selectivamente refuerza
los patrones de actividad neural que predicen la recompensa y que guían
el comportamiento necesario para conseguirla. Imagen tomada de: http://lecerveau.mcgill.ca

Para seleccionar una acción específica basada en la recompensa anticipada, se necesita que se seleccione una representación neural del vínculo entre la recompensa anticipada y las acciones oculomotoras/motoras específicas. Las células en la CFM subgenual parecen representar tales vínculos específicos y, por tanto, parecen centrales al mecanismo neural de la toma de decisiones.

Corteza prefrontal ventrolateral
La CPF ventrolateral se ha relacionado con el recuerdo de asociaciones de estímulos visuales. Adicionalmente, la CPF lateral es responsable de mantener tales representaciones en un estado activo hasta que se logra la meta, frecuentemente haciéndole frente a otros eventos intervinientes, irrelevantes y potencialmente interferentes (Miller & Cohen, 2001).

Ilustración de la CPF ventromedial en vista lateral
del hemisferio derecho (arriba) y vista ventral (abajo).
Imagen tomada de: http://antroporama.net/
Corteza prefrontal ventromedial
Divisiones más ventromediales de la CPF (CPFvm) pueden mediar influencias menos deliberadas, dirigidas por la emoción, en la selección de la acción.

Ridderinkhof et al. explican que, mientras que los individuos normales experimentan un estado de activación (arousal) durante el tiempo de deliberación previo a la selección de opciones arriesgadas y no ventajosas, la insensibilidad a consecuencias futuras (“miopía para el futuro”) que se observa en pacientes con lesión en la CPFvm se presume que se deriva de su falla para experimentar este estado afectivo. Esta experiencia afectiva está normalmente acompañada de señales corporales y estados somáticos que han llegado a estar asociados con decisiones arriesgadas, probablemente derivadas de experiencias previas con la recompensa y el castigo. A través de esta asociación, estas señales somáticas constituyen un sesgo preconsciente contra "malas" opciones. En pacientes con daño en la CPFvm, tal señal de sesgo falla en generar el afecto que debería salvarlos de perseguir un curso de acción que no es ventajoso en el futuro (Bechara et al., 2000).

Corteza prefrontal dorsolateral
Algunos hallazgos apuntan hacia un papel integrador de la CPF dorsoteral en vincular las representaciones de la memoria de corto plazo en el comportamiento motor dirigido a una meta.

Mientras varias estructuras cerebrales están implicadas en el procesamiento de la recompensa en general (como los ganglios basales, la corteza parietal, la CPF dorsolateral y la CFM), unas pocas áreas (CPF dorsolateral, CPFvm y algunas regiones de la CFM) están dedicadas más específicamente a representar las propiedades hedónicas de la recompensa, enfocándose en aprender las contingencias acción-recompensa apropiadas y seleccionando aquellas acciones que potencialmente llevan a la recompensa.

Inhibición de la respuesta
La inhibición puede definirse como la “supresión de respuestas inapropiadas, mapeos estímulo-respuesta o conjuntos de tarea cuando el contexto cambia, así como la supresión de recuerdos interferentes durante el recuerdo” (Aaron et al., 2004).

El control inhibitorio es postulado como uno de los mecanismos por los cuales la corteza orbitofrontal (COF) ejerce sus efectos coordinadores sobre los procesos subsidiarios implementados por las regiones corticales posteriores y las regiones subcorticales para optimizar el comportamiento.

Algunos índices comportamentales del nivel de control inhibitorio son el porcentaje de errores de comisión (fallas para frenar una respuesta) en ensayos NoGo o “stop” y (en tareas de señal de stop) la duración del proceso de stop, (aproximado matemáticamente como el tiempo de reacción de la señal de stop o SSRT, del inglés stop signal reaction time).

En estudios de neuroimágenes, la comparación de ensayos incongruentes (aquellos que generan dos respuestas conflictivas) con ensayos congruentes (aquellos que dan lugar a sólo una respuesta) ha revelado activaciones específicas en la CPF ventrolateral.

Monitoreo del desempeño
Zona cingulada rostral
De acuerdo con revisiones recientes de estudios en humanos y primates, áreas cerebrales que se solapan ampliamente, específicamente en la zona cingulada rostral (ZCR), están implicadas en el monitoreo de resultados no favorables, errores de respuesta, conflicto de respuesta e incertidumbre en la decisión. Estas condiciones tienen en común que señalan que las metas no pueden ser alcanzadas o que las recompensas no pueden ser obtenidas, a no ser que el nivel de control cognitivo se incremente.

Adicionalmente, registros electrofisiológicos en el cuero cabelludo [EEG] han encontrado un potencial cerebral relacionado a eventos (ERP del inglés Event-Related Potential) que es sensible a errores, localizado en la zona cingulada rostral, y el cual está atenuado en pacientes con daño en la CCA dorsal. 

La zona cingulada rostral también puede estar implicada en el monitoreo del conflicto de respuesta, el cual ocurre cuando una tarea activa al mismo tiempo más de una tendencia de respuesta; por ejemplo, cuando el estímulo prepara para una respuesta prepotente pero incorrecta. Cuando la respuesta correcta está infra-determinada (por ejemplo, bajo condiciones que requieren la escogencia a partir de un set de respuestas, ninguna de las cuales es más convincente que las otras) ocurre la incertidumbre en la decisión, similar al conflicto de respuesta.

La función genérica de monitoreo del desempeño otorga a la ZCR la capacidad de señalizar la necesidad de un ajuste en el desempeño.


Esquema de la zona cingulada rostral (ZCR), una región altamente
implicada en el monitoreo del desempeño.
Imagen tomada de: http://www.connuestroperu.com/

Sistema dopaminérgico mesencefálico
Finalmente, los autores explican que los errores en la predicción de la recompensa son codificados por cambios fásicos en la actividad del sistema dopaminérgico mesencefálico: un incremento o decremento fásico cuando los eventos presentes son de repente mejores (incremento) o peores (decremento) de lo esperado. Estas señales dopaminérgicas fásicas están comunicadas con la ZCR, en donde se aplican principios básicos de refuerzo-aprendizaje, con el fin de usar las señales de dopamina para mejorar el desempeño de la tarea.

Referencia:
Ridderinkhof K.R., van den Wildenberg, W.P.M., Segalowitz, S.J., & Carter, C.S. (2004). Neurocognitive mechanisms of cognitive control: The role of prefrontal cortex in action selection, response inhibition, performance monitoring, and reward-based learning. Brain and Cognition, 56. pp. 129-140.


Comentario
Como tratamos de condensarlo en el título de esta entrada, de esto se trata el "amor" frontal de la Psicología: monitoreo del desempeño, activación e inhibición de respuesta, aprendizaje basado en la recompensa y selección de una acción (o grupo de acciones) que sirve(n) a un propósito o meta (desde agacharse a amarrarse los cordones del zapato hasta escribir la tesis para la universidad). 

Con esta revisión, Ridderinkhof y colaboradores nos ilustraron de manera muy amplia y clara cómo está organizada (tanto estructural como funcionalmente) la parte más anterior del lóbulo frontal (o corteza "prefrontal"). Quizás la complejidad de su organización va más allá de lo que las técnicas y métodos actuales nos permiten conocer, pero, según nos lo mostraron los autores, lo que se conoce hasta el momento es que la corteza prefrontal emite señales de sesgo (o sea de preferencia hacia un patrón de actividad en comparación con otro), además de que integra, mantiene y refuerza señales de otras áreas cerebrales. En el nivel comportamental, esta actividad frontal se evidencia en las funciones que ya mencionamos arriba.

Y bien, esperamos hayan disfrutado esta entrada tanto como nosotros y que este trabajo sirva para incrementar (o despertar) su frontal love por el frontal lobe ;) ¡Hasta una próxima oportunidad!



¿Te gustó o te pareció útil o interesante esta información? ¡No dudes en compartirla!

¿Más información, dudas, comentarios o sugerencias?
Comenta abajo, síguenos en Facebook o puedes contactarnos a través de un mensaje.

Comentarios