Información

7.6: Una pregunta interesante: ¿podemos incorporar la memoria en nuestro modelo? - biología

7.6: Una pregunta interesante: ¿podemos incorporar la memoria en nuestro modelo? - biología



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

La respuesta a esta pregunta es: ¡Sí, podemos! ¿Pero cómo? Recuerde que los modelos de Markov no tienen memoria. Pero, ¿qué pasa si queremos que nuestro modelo cuente las frecuencias de nucleótidos (para islas CpG1), o frecuencias de trinucleótidos (para codones), o frecuencias de dicodones que involucran seis nucleótidos? Necesitamos ampliar el número de estados.

Por ejemplo, el último nucleótido visto se puede incorporar en la "memoria" del HMM dividiendo los estados más y menos de nuestro HMM High-GC / Low-GC HMM en varios estados: uno para cada combinación de nucleótido / región, como en la Figura 7.18 .

Pasar de dos a ocho estados nos permite retener la memoria del último nucleótido observado, al mismo tiempo que distinguimos entre dos regiones distintas. Cuatro nuevos estados ahora corresponden a cada uno de los dos estados originales en el HMM de GC alto / bajo. Mientras que los pesos de transición en el HMM más pequeño se basaron puramente en las frecuencias de nucleótidos individuales, ahora en el más grande, se basan en frecuencias de dinucleótidos.

Con este poder adicional, ciertas secuencias de nucleótidos, como las islas CpG, pueden modelarse específicamente: la transición de C + a G + puede tener un peso mayor que la transición de A + a G +. Además, las transiciones entre + y - pueden modelarse más específicamente para reflejar la frecuencia (o infrecuencia) de secuencias de nucleótidos particulares dentro de una u otra.

El proceso de agregar memoria a un HMM se puede generalizar y se puede agregar más memoria para permitir el reconocimiento de secuencias de mayor longitud. Por ejemplo, podemos detectar tripletes de codones con 32 estados, o sextillizos de codones con 2048 estados. La memoria dentro del HMM permite una especificidad cada vez más personalizada en el escaneo.


1CpG significa C-fosfato-G. Entonces, la isla CpG se refiere a una región en la que aparecen los di-nucleótidos GC en la misma hebra.


¿Por qué obtengo CUDA sin memoria cuando ejecuto el modelo PyTorch [con suficiente memoria GPU]?

Hago esta pregunta porque estoy entrenando con éxito una red de segmentación en mi GTX 2070 en una computadora portátil con 8GB VRAM y uso exactamente el mismo código y exactamente las mismas bibliotecas de software instaladas en mi PC de escritorio con una GTX 1080TI y todavía se queda sin memoria.

¿Por qué sucede esto, considerando que:

Los mismos Windows 10 + CUDA 10.1 + CUDNN 7.6.5.32 + Nvidia Driver 418.96 (viene junto con CUDA 10.1) están tanto en la computadora portátil como en la PC.

El hecho de que el entrenamiento con TensorFlow 2.3 se ejecute sin problemas en la GPU de mi PC, sin embargo, falla al asignar memoria para el entrenamiento solo con PyTorch.

PyTorch reconoce la GPU (imprime GTX 1080 TI) a través del comando: print (torch.cuda.get_device_name (0))

PyTorch asigna memoria cuando se ejecuta este comando: torch.rand (20000, 20000) .cuda () # asignado 1,5 GB de VRAM.

¿Cuál es la solución a esto?


La verdad sobre la relación entre el cerebro izquierdo y el cerebro derecho

Es hora de repensar todo lo que pensaba que sabía sobre cómo funcionan juntos los hemisferios derecho e izquierdo del cerebro.

A veces, las ideas que se originan en la ciencia se filtran a la cultura más amplia y cobran vida propia. Todavía es común escuchar a la gente referida como "anal", una idea freudiana que ya no tiene mucha vigencia en la psicología contemporánea. Ideas como los agujeros negros y los saltos cuánticos desempeñan un papel metafórico que solo está vagamente ligado a sus significados científicos originales.

¿Qué pasa con la idea de que algunas personas son más de cerebro derecho y otras más de cerebro izquierdo? ¿O que hay un estilo de pensamiento analítico y verbal distintivo asociado con el hemisferio izquierdo del cerebro, y un estilo más holístico y creativo asociado con el derecho? ¿Son estos hechos científicos o ficciones culturales?

Una infografía reproducida el mes pasado en Lifehack.org, por ejemplo, promete explicar "por qué actúas de la manera en que lo haces" al revelar "qué lado de tu cerebro tiendes a usar más". Un artículo en Oprah.com explica "cómo aprovechar el pensamiento del cerebro derecho". Y décadas de investigación que utilizan técnicas conductuales y neurocientíficas revelan diferencias fascinantes y sistemáticas entre las regiones del cerebro.

Por otro lado, algunos titulares recientes desafían la dicotomía cerebro izquierdo / cerebro derecho. Un artículo muy publicitado, resumido en El guardián, no pudo encontrar evidencia de que los individuos tienden a tener redes cerebrales del lado izquierdo o derecho más fuertes. Un nuevo libro de Stephen M. Kosslyn y G. Wayne Miller sostiene que la división del cerebro izquierdo / derecho es en gran medida falsa y, en cambio, debería ser reemplazada por una distinción entre el cerebro superior y el cerebro inferior.

Entonces, si bien hay algo profundamente convincente en la clasificación clara del hemisferio derecho frente al izquierdo (¿o es solo mi hemisferio izquierdo el que habla?), Tenemos buenas razones para el escepticismo. La historia real, como era de esperar, es un poco más complicada, pero posiblemente más interesante, de lo que parecen sugerir las infografías y los titulares populares.

Para tener una idea más clara de lo que sabemos y lo que no sabemos sobre las diferencias cerebrales hemisféricas en los seres humanos, tuve la suerte de tener la oportunidad de entrevistar a una neurocientífica cognitiva líder, Kara D. Federmeier, cuya investigación se centra en el lenguaje, la memoria y las asimetrías hemisféricas. a lo largo de la vida útil. La Dra. Federmeier es profesora de psicología en la Universidad de Illinois en Urbana-Champaign, donde también está afiliada al Programa de Neurociencias y al Instituto Beckman de Ciencia y Tecnología Avanzadas. (Y, revelación completa, también fue una de mis primeras mentoras científicas y coautoras).

Una idea que se escucha a menudo en las discusiones populares sobre psicología es que el cerebro izquierdo es la sede del lenguaje y es más "lógico", mientras que el cerebro derecho es más creativo. ¿Hay algo de verdad en esta idea?

Un problema con la respuesta a esta pregunta es que primero tendríamos que ponernos de acuerdo sobre lo que significan incluso "lógico" y "creativo". Así que consideremos un caso (relativamente) más bien definido: las habilidades matemáticas, que a menudo se consideran parte de lo que el hemisferio izquierdo "lógico" sería bueno.

Hay diferentes tipos de habilidades matemáticas, que van desde poder estimar cuál de dos conjuntos de cosas tiene una mayor cantidad de elementos, hasta contar, y varios tipos de cálculos. La investigación muestra que, en general, las habilidades que componen las habilidades matemáticas surgen del procesamiento que tiene lugar en AMBOS hemisferios (especialmente el área del cerebro en cada hemisferio que se conoce como el surco intraparietal) y que el daño a cualquiera de los hemisferios puede causar dificultades con las matemáticas. Una ventaja del hemisferio izquierdo para las matemáticas se ve principalmente en tareas como contar y recitar las tablas de multiplicar, que dependen en gran medida de la información verbal memorizada (por lo tanto, ¡no es exactamente lo que consideramos "lógico"!). Y también existen ventajas para el hemisferio derecho en algunas tareas relacionadas con las matemáticas, especialmente en la estimación de la cantidad de un conjunto de objetos. Este tipo de patrón, en el que ambos hemisferios del cerebro hacen contribuciones críticas, se aplica a la mayoría de los tipos de habilidades cognitivas. Se necesita dos hemisferios para ser lógicos - o para ser creativos.

Sin embargo, la afirmación de que el hemisferio izquierdo es la sede del lenguaje es un poco diferente. Esa idea proviene de observaciones de que el daño en el hemisferio izquierdo (por ejemplo, debido a un derrame cerebral) a menudo se asocia con dificultades para producir el lenguaje, un problema conocido como afasia. Es mucho menos probable que un daño similar en el hemisferio derecho cause afasia. De hecho, para la mayoría de las personas, el hemisferio izquierdo juega un papel mucho más importante en la capacidad de hablar que el hemisferio derecho.

Sin embargo, esto no significa que el hemisferio derecho sea "no verbal". Mi laboratorio estudia la capacidad de los hemisferios para comprender (en lugar de producir) el lenguaje, y nosotros, como otros, hemos demostrado que ambos hemisferios pueden descubrir el significado de palabras y oraciones, y que tienen diferentes fortalezas y debilidades cuando se trata de comprender . Entonces, al igual que otras habilidades complejas, la capacidad de comprender lo que leemos o lo que alguien nos dice requiere que ambos hemisferios trabajen juntos y por separado.

Los primeros estudios de asimetrías hemisféricas a menudo se basaban en pacientes con "cerebro dividido" que tenían el cuerpo calloso (el haz de fibras neurales que conecta los dos hemisferios) cortado como tratamiento para la epilepsia grave. En tales estudios, la información podría proporcionarse a un solo hemisferio a la vez presentando a las personas información a un lado del campo visual, ya que el campo visual derecho es procesado por el hemisferio izquierdo y viceversa.

Su laboratorio utiliza técnicas neurocientíficas contemporáneas, como las medidas de la actividad de las ondas cerebrales (EEG y ERP) para investigar las asimetrías hemisféricas, y normalmente lo hace en personas con cerebros intactos. ¿Cómo lo hace? ¿Sus hallazgos corroboran o desafían inferencias anteriores hechas a partir del comportamiento de pacientes con cerebro dividido?

De hecho, utilizamos la misma técnica básica, conocida como "presentación visual de medio campo".

Como acotación al margen, debo señalar que muchas veces las personas malinterpretan y piensan que cada OJO está conectado a un hemisferio diferente. Eso no es cierto. (¡Haría nuestros estudios mucho más fáciles si lo fuera, ya que podríamos pedirle a la gente que cierre un ojo!) En cambio, la mitad de la información que llega a cada ojo va a cada uno de los hemisferios, con el resultado, como usted señala. , que si estás mirando hacia adelante, las cosas que ves a la derecha de donde miras son captadas inicialmente por tu hemisferio izquierdo y las cosas a la izquierda por tu hemisferio derecho.

Para observar las diferencias hemisféricas, pedimos a nuestros participantes, que suelen ser estudiantes universitarios o adultos jubilados, que miren el centro de la pantalla. Luego mostramos palabras (o imágenes u otros tipos de estímulos) con bastante rapidez, de modo que las personas no pueden mover los ojos lo suficientemente rápido como para fijarlos directamente, hacia el lado izquierdo o derecho de la pantalla de una computadora. Al comparar cómo responden las personas (por ejemplo, si pueden recordar con precisión una palabra) cuando fue procesada primero por el hemisferio izquierdo versus el hemisferio derecho, podemos probar ideas sobre lo que cada hemisferio es capaz de hacer y si un hemisferio tiene mejor, o habilidades diferentes en comparación con el otro.

A menudo, también medimos la actividad eléctrica del cerebro en estos experimentos porque eso proporciona información valiosa sobre cómo se desarrolla el procesamiento a lo largo del tiempo: podemos rastrear lo que sucede cuando los ojos envían información a las áreas de procesamiento visual en el cerebro, cuando las personas prestan atención a una palabra, acceden a su significado de la memoria y agregan esta nueva información a su comprensión de una oración, y a medida que las personas, en algunos casos, deciden cómo responder y luego se preparan para presionar un botón para registrar su respuesta. Con medidas electrofisiológicas podemos así descubrir no solo QUE los dos hemisferios hacen algo diferente sino CUÁNDO y CÓMO.

En general, los tipos de diferencias hemisféricas que se descubrieron en pacientes con cerebro dividido se han replicado (y luego ampliado) utilizando estas técnicas en personas con cerebros intactos. Esto a veces sorprende a la gente, incluidos mis compañeros neurocientíficos cognitivos. La idea de que los dos hemisferios perciben las cosas de manera diferente, atribuyen un significado diferente a las cosas, obtienen diferentes significados de los estímulos y, a veces, toman decisiones diferentes sobre qué hacer parece que debería ser un efecto secundario exótico de la condición del cerebro dividido. Cuando los hemisferios están conectados, ¿no comparten simplemente toda la información y operan de manera unificada?

La respuesta es no, no es así.

No lo hacen, en parte, porque no pueden. El procesamiento dentro de cada hemisferio se basa en una red de conexiones rica y densa. El cuerpo calloso que conecta los hemisferios es grande para un tracto de fibra, pero es pequeño en comparación con la red de conexiones dentro de cada hemisferio. Físicamente, entonces, no parece factible que los hemisferios compartan información por completo u operen de una manera completamente unificada. Además, en muchos casos, mantener las cosas separadas es (¡literalmente!) La forma más inteligente de que funcionen los hemisferios. Dividir las tareas y permitir que los hemisferios trabajen de forma semiindependiente y adopten diferentes enfoques para el mismo problema parece ser una buena estrategia para el cerebro. como sucede a menudo en las asociaciones entre personas.

Tiene sentido tener regiones cerebrales especializadas, al igual que tiene sentido tener divisiones del trabajo en otras áreas de la vida. Pero, ¿por qué tener hemisferios especializados? En otras palabras, ¿cree que se puede decir algo general sobre los tipos de procesamiento que ocurren en el hemisferio izquierdo frente al hemisferio derecho, o cada uno es simplemente una constelación de regiones especializadas algo distintas?

Específicamente, cómo y por qué difieren los hemisferios sigue siendo un misterio. En realidad, son notablemente similares físicamente, y esta es una de las razones por las que creo que estudiar las diferencias hemisféricas es fundamental para el campo.

Durante la última década más o menos, se ha realizado un gran esfuerzo para "mapear" el cerebro humano, es decir, vincular áreas que difieren anatómicamente (tienen diferentes entradas, salidas, tipos o disposiciones de neuronas y / o neurofarmacología) a diferentes funciones. De esto, esperamos poder aprender algo sobre cómo y por qué son importantes estas diferencias anatómicas. Sin embargo, al hacer esto, el campo también ha descubierto muchas asimetrías hemisféricas, casos en los que, por ejemplo, un área del cerebro del hemisferio izquierdo se activa y su homólogo del hemisferio derecho (con las MISMAS entradas, salidas básicas, etc.) es mucho mayor. menos activo (o viceversa). Esto realmente debería sorprendernos: aquí hay dos áreas del cerebro que son esencialmente iguales en todas las dimensiones en las que el campo está acostumbrado a pensar, pero que se comportan de manera sorprendentemente diferente. Debe haber diferencias físicas entre ellos, por supuesto, pero eso significa que esas diferencias "sutiles" son mucho más críticas para la función de lo que el campo ha apreciado.

Mi propia opinión es que los estudios de las diferencias hemisféricas ayudarán a alejar el campo del pensamiento en términos de funciones de mapeo en áreas cerebrales localizadas. Creo que las funciones cognitivas surgen de redes neuronales configuradas dinámicamente. Desde este punto de vista, el papel que desempeña una determinada área del cerebro es diferente según el estado de la red de la que forma parte actualmente, y la forma en que se desarrolla la actividad a lo largo del tiempo suele ser más importante que en qué parte del cerebro se encuentra.

¿Por qué se diferencian los hemisferios? Creo que se debe a que incluso pequeñas diferencias en algo como la fuerza con la que están conectadas las áreas pueden conducir a patrones dinámicos de activación muy diferentes a lo largo del tiempo y, por lo tanto, a funciones diferentes. Para la comprensión del lenguaje en particular, mi trabajo ha demostrado que el procesamiento del hemisferio izquierdo está más influenciado por lo que a veces se llama conexiones "de arriba hacia abajo", lo que significa que es más probable que el hemisferio izquierdo prediga qué palabra podría aparecer a continuación y tener su procesamiento afectado por esa predicción. El hemisferio derecho, en cambio, muestra un procesamiento más "feedforward": está menos influenciado por las predicciones (lo que puede hacer que su procesamiento sea menos eficiente) pero luego es más capaz de recordar detalles sobre las palabras que encontró. Debido a lo que probablemente sea una diferencia (posiblemente pequeña) en la eficacia de conexiones particulares dentro de cada hemisferio, las mismas áreas del cerebro en los dos interactúan de manera diferente, y esto conduce a asimetrías mensurables e importantes en cómo se perciben las palabras, se vinculan al significado, se recuerdan , y respondió.

Es poco probable que esta sea la única diferencia entre los hemisferios, por supuesto. Pero creo que la respuesta a su pregunta es que lo que vemos en el patrón de asimetrías no es una colección aleatoria de diferencias o divisiones no relacionadas basadas en uno o incluso un pequeño conjunto de principios funcionales (por ejemplo, el hemisferio izquierdo es "local" y el hemisferio derecho es "global". Otro popular). Más bien, parte de la biología subyacente está sesgada, y esto tiene consecuencias de gran alcance para los tipos de patrones que se pueden establecer con el tiempo en los dos hemisferios, lo que lleva a conjuntos de diferencias funcionales que, con suerte, eventualmente podemos vincular sistemáticamente a estos patrones biológicos subyacentes. causas, y por lo tanto profundizar nuestra comprensión de cómo funciona el cerebro.

¿Qué es lo que más le sorprendió de las asimetrías hemisféricas que ha encontrado (¡o no ha podido encontrar!) En su propia investigación?

Uno de mis hallazgos favoritos provino de un experimento en el que usamos adjetivos para cambiar el significado del mismo sustantivo. Por ejemplo, la palabra "libro" en "libro verde" se refiere a algo concreto, es decir, algo para lo que es fácil crear una imagen mental. Sin embargo, dado el "libro interesante", la gente ahora suele pensar en el contenido del libro en lugar de en su forma física, por lo que la misma palabra se ha vuelto más "abstracta" en su significado.

Muchas investigaciones muestran que las palabras concretas y abstractas se procesan de manera diferente en el cerebro. Queríamos ver si esas diferencias se podían encontrar exactamente para la misma palabra dependiendo de a qué se refería, y si los dos hemisferios se veían afectados de manera similar por la concreción. Descubrimos en este experimento, como lo habíamos hecho anteriormente en muchos otros, que el hemisferio izquierdo es muy sensible a la previsibilidad de las combinaciones de palabras. Menos sustantivos pueden ir con "verde" que con "interesante", y la actividad cerebral provocada en respuesta a "libro" reflejó esto cuando las palabras se presentaron inicialmente en el hemisferio izquierdo.

Sin embargo, para nuestra sorpresa, fue el Derecha hemisferio que provocó la actividad cerebral relacionada con las imágenes a "libro verde" en comparación con "libro interesante". Por lo tanto, aunque el hemisferio izquierdo es claramente importante para el procesamiento del lenguaje, el hemisferio derecho puede desempeñar un papel especial en la creación de la rica experiencia sensorial que a menudo acompaña a la comprensión del lenguaje. y eso hace que leer sea un placer.

Otra idea popular es que algunas personas tienen más "cerebro izquierdo" y otras más "cerebro derecho". ¿Existe alguna evidencia de diferencias individuales en la medida en que las personas dependen de un hemisferio frente a otro? De manera más general, ¿qué tipo de diferencias individuales ve en la especialización hemisférica?

Ciertamente existen diferencias individuales en la especialización hemisférica entre las personas, pero son muy difíciles de determinar de manera confiable. Donde esto es más importante es en contextos médicos: cuando las personas van a someterse a una cirugía cerebral (por ejemplo, para la epilepsia o la resección de un tumor), los médicos quieren asegurarse de que al extirpar cierto tejido cerebral no van a interrumpir funciones críticas como el lenguaje.

Como ya mencioné, la mayoría de las veces el hemisferio izquierdo es más importante para hablar, por ejemplo, pero eso no es cierto en absolutamente todo el mundo. Para determinar si el hemisferio izquierdo o derecho de una persona es más importante para la producción del lenguaje, los médicos usan cosas como la prueba WADA, en la que se inyecta un barbitúrico en un hemisferio para apagarlo temporalmente, lo que le permite al médico ver qué es cada hemisferio. puede hacer por su cuenta. Obviamente, esta es una prueba muy invasiva (y no perfecta en eso). Si, en cambio, fuera posible averiguar si alguien confiaba más en su hemisferio izquierdo o derecho haciendo que miran una figura que gira o respondan algunas preguntas, obviamente sería preferible. pero no funciona.

Hay, por supuesto, diferencias en cómo las personas aprenden y piensan, qué les gusta y cómo son (aunque, dado que el cerebro de todos es diferente, creo que las similitudes son en realidad más sorprendentes que las diferencias). Algunas de estas diferencias pueden surgir debido a diferencias individuales en cómo se organizan los hemisferios o qué hemisferio tiende a usarse en circunstancias particulares. Dado que los hemisferios operan de manera algo independiente, la cuestión de cómo se combina eventualmente su procesamiento independiente y / o qué hemisferio llega a "tomar el control" del procesamiento para una tarea en particular es algo que apenas estamos comenzando a comprender. (En algunos casos, las manos de los pacientes con el cerebro dividido, una controlada por cada hemisferio, literalmente lucharon por el control de una tarea en particular, ¡es intrigante imaginar que ese tipo de lucha tiene lugar de manera rutinaria internamente para todos los demás!)

Sin embargo, parece seguro decir que en su mayor parte todos usamos ambos lados de nuestro cerebro casi todo el tiempo. Conocemos algunos factores que influyen en cómo se lateralizan las funciones y cuánto se lateralizan. Por ejemplo, tener una lateralidad "invertida" (con, por ejemplo, control del habla en el hemisferio derecho en lugar del izquierdo) es más probable para las personas zurdas que para las diestras (aunque es importante no generalizar demasiado a partir de esto: la gran mayoría de las personas zurdas tienen el patrón de lateralización típico). Además, se han observado diferencias entre las personas diestras dependiendo de si tienen o no parientes biológicos zurdos, esto es algo que mi laboratorio está comenzando a explorar. Nuevamente, los pequeños cambios biológicos, causados ​​en parte por diferencias genéticas (complejas), pueden conducir a diferentes patrones funcionales, incluso si una función tiende a ser muy lateralizada o lograda por ambos hemisferios.

Terminaré con un último hecho sobre las diferencias hemisféricas que muchas personas pueden no conocer, y es que la lateralización de la función cambia con el envejecimiento normal. Los tipos de patrones lateralizados de actividad cerebral que mencioné anteriormente al hablar de estudios de mapas cerebrales son más comunes en los adultos jóvenes. En muchos tipos de tareas y muchas áreas del cerebro, estos patrones lateralizados tienden a cambiar a patrones bilaterales en adultos mayores sanos.

¿Es esto porque los adultos mayores han aprendido mejor a ser lógicos Y creativos? Quizás :-). En realidad, es difícil saber cuándo es útil este tipo de cambio, por ejemplo, si se aportan recursos de procesamiento adicionales para una tarea a fin de compensar las disminuciones funcionales relacionadas con la edad, en comparación con cuándo podría ser una señal de que el cerebro está simplemente menos activo. bueno para mantener una saludable división del trabajo. Por lo tanto, comprender la especialización hemisférica también es importante para descubrir formas de ayudarnos a todos a mantener un mejor funcionamiento cognitivo con la edad. Esto es algo que mi laboratorio investiga activamente, con la ayuda del apoyo del Instituto Nacional del Envejecimiento y de la Fundación James S. McDonnell.

Por último, ¿puede recomendar algún recurso accesible para los lectores que deseen aprender más sobre las asimetrías hemisféricas?

Mi propio interés por las diferencias hemisféricas fue provocado, en parte, por libros como Cerebro izquierdo, cerebro derecho por Sally Springer y Georg Deutsch y Asimetría hemisférica: lo que está bien y lo que queda por Joseph Hellige. Estos son libros accesibles escritos por científicos y bien fundamentados en la investigación, aunque ambos libros tienen ahora más de una década, por lo que no reflejan los desarrollos actuales en el campo. Desafortunadamente, no conozco libros más recientes que sean comparativamente confiables y accesibles.

Algunos lectores pueden estar interesados ​​en leer artículos de revistas sobre el tema. Por ejemplo, extraje parte de mi información sobre las matemáticas y los hemisferios del artículo "La aritmética y el cerebro" de Stanislas Dehaene, Nicolas Molko, Laurent Cohen y Anna J Wilson en la revista Opinión actual en neurobiología (2004 Volumen 14, páginas 218-224). Para aquellos interesados ​​en el lenguaje, yo (con los coautores Edward Wlotko y Aaron Meyer) he escrito una revisión bastante accesible llamada "Qué es" correcto "en la comprensión del lenguaje: los ERP revelan las capacidades del lenguaje del hemisferio derecho" publicado en Brújula de lenguaje y lingüística (2008 Volumen 2, páginas 1-17).

Puedes seguir más de lo que piensa Tania Lombrozo en Twitter: @TaniaLombrozo


Resultados

El modelo nominal

Suponemos que un modelo nominal de EDO

Se ha propuesto para describir la dinámica del sistema de consideración. El vector de estado contiene el norte variables dinámicas y es la derivada con respecto al tiempo t. El valor inicial del vector de estado es. Para una red de reacción bioquímica, a menudo es la concentración o abundancia de k-ésima especie. La función representa una entrada externa conocida al sistema. La dinámica de las variables de estado está determinada por la función y codifica los supuestos del modelo hechos en el modelo nominal. Esto se puede representar como un gráfico 20, donde cada nodo corresponde a una variable y un borde dirigido desde l para k indica que la derivada de tiempo de depende de (Fig. 1a). Si está directamente influenciado por una entrada conocida, lo ilustramos con una flecha verde en zigzag. Normalmente, no todas las variables de estado se pueden medir directamente. Las variables representan todas las salidas que son accesibles experimentalmente. En la ecuación (1b), asumimos que el mapeo h desde el Estado X a la salida y es conocida. Usamos una tilde para resaltar eso y, por lo tanto, generalmente no se conocen perfectamente debido a un conocimiento limitado o incierto sobre la verdadera dinámica subyacente.

Representación del error del modelo

La respuesta del sistema natural real a un estímulo de entrada conocido generalmente se mide en puntos de tiempo discretos y proporciona observaciones experimentales para la salida. Una parte de estos datos se suele utilizar para estimar los parámetros del modelo. Consideramos las estimaciones de los parámetros iniciales como parte de la especificación del modelo nominal en la ecuación (1a).

El modelo nominal es insatisfactorio cuando su salida no está suficientemente de acuerdo con los datos. Una fuente de error del modelo proviene de las entradas ocultas al sistema nominal, que son causadas por procesos dinámicos exógenos al sistema nominal (Fig. 1b). Además, puede haber interacciones erróneas o faltantes entre las variables de estado en el propio modelo nominal. Ambos tipos de error del modelo se pueden representar mediante entradas ocultas que actúan sobre los nodos del modelo nominal (Fig. 1c). La "verdadera" dinámica del sistema real se puede describir mediante

Aquí, el estado representa las mismas variables que el estado nominal, pero suprimimos la tilde para distinguir las soluciones de (2) de la del modelo nominal. El error del modelo es la diferencia entre la tasa de cambio del sistema verdadero y el sistema nominal, evaluada a lo largo de la trayectoria del estado verdadero. Por tanto, incorpora cualquier discrepancia entre el sistema verdadero y el sistema nominal. La entrada conocida tu y la función de salida h se supone que son idénticos al modelo nominal (1). Sin embargo, también discutiremos el impacto del ruido de medición a continuación.

El enfoque típico para la mejora del modelo es compensar el error del modelo mediante expresiones matemáticas explícitas, a menudo ecuaciones diferenciales adicionales. Esto aumenta el número de variables y parámetros en el modelo. Aquí, procedemos de manera diferente al estimar el error del modelo w a partir de los datos, lo que también nos permite corregir el sesgo de la estimación de estado incurrido por el modelo nominal.

Estimando la dinámica sin modelar

Para estimar el error del modelo, usamos el sistema de observador

que es una copia de las ecuaciones (2a) y (2b). El sombrero marca estimaciones del estado, de la salida y del error del modelo. Este último se obtiene minimizando el error funcional

El primer término en la ecuación (3c) es el error cuadrático medio ponderado entre las salidas medidas y las salidas del sistema del observador en las ecuaciones (3a) y (3b). La norma cuadrada ponderada

contiene la matriz de ponderación simétrica, que a menudo se elige en diagonal y se puede utilizar para transformar salidas de muy diferente magnitud a una escala común o para incorporar estimaciones de precisión de las mediciones en los diferentes puntos de tiempo. El plazo de regularización

Es necesario evitar el sobreajuste de los datos mediante estimaciones demasiado complejas. Los parámetros no negativos y determinan las contribuciones relativas de la norma en la ecuación (3f) y de la norma en (3g). La minimización de la ecuación (3c) bajo las restricciones de las ecuaciones (3a) y (3b) es un problema de control óptimo 21, 22, 23, que debe resolverse numéricamente (ver Métodos y texto complementario).

La regularización combinada en la ecuación (3e) recuerda la penalización de la red elástica utilizada en los modelos de regresión 18. Por lo tanto, denominamos a nuestro enfoque la red elástica dinámica. De manera análoga a la regresión, el término hace que algunos componentes del error estimado del modelo se reduzcan a cero (texto complementario). La cantidad de contracción está determinada por, que puede elegirse para suprimir pequeñas señales de error o ruido distribuido en muchos componentes de la estimación. La estimación dispersa resultante es útil, porque proporciona información sobre los estados del sistema que son el objetivo de los errores sistemáticos del modelo, representados por entradas ocultas.

A diferencia de la regresión, una regularización pura o de Lasso tipo 24 no es útil en el entorno dinámico, porque la solución para puede dar como resultado estimaciones ilimitadas de. Incluso cuando se imponen restricciones adicionales, la solución resultante no es uniforme ni cero o en los límites de las restricciones 25. Estos conocimientos sobre el problema de control óptimo se pueden obtener del principio mínimo 21,22 de Pontryagin, como se detalla en el texto complementario junto con algunas estrategias para elegir los parámetros de regularización adecuados y. Además de estimaciones escasas pero suaves del error del modelo, la red elástica dinámica proporciona automáticamente una estimación del estado. A menudo, esta información es muy interesante, cuando no todas las variables de estado son accesibles experimentalmente.

El problema de control óptimo en las ecuaciones (3a-c) para requiere la especificación de una condición inicial, que a menudo no se conoce o es incierta. Alternativamente, se puede agregar la restricción adicional

to (3a – c), donde es una tolerancia preestablecida dada para el ajuste de a en el tiempo. De manera similar, se puede prescribir una tolerancia al ajuste en el último punto de datos mediante

Los parámetros de tolerancia y de estas restricciones opcionales a menudo se pueden obtener de las barras de error de las mediciones.

Validación de la red elástica dinámica

Ejemplo de señalización JAK-STAT

Para ilustrar el estimador dinámico de red elástica para un modelo pequeño y comprensible, utilizamos datos experimentales establecidos para la vía de transducción de señales JAK-STAT 4. Las cuatro variables de estado del sistema representan STAT5 citoplasmático no fosforilado, STAT5 monomérico fosforilado, STAT5 dimérico fosforilado y STAT5 dimérico nuclear. El modelo nominal 4

describe la fosforilación de STAT5 citoplasmático tras la activación del receptor de eritropoyetina (entrada conocida tu), la dimerización de STAT5 fosforilado y la exportación al núcleo (Fig.2). Para calibrar los parámetros se utilizaron los datos 4 del curso temporal para la cantidad de STAT5 fosforilado citoplasmático y STAT5 citoplasmático total. Sin embargo, la presencia de error de modelo sistemático es evidente por la discrepancia inalterable entre los datos experimentales y el modelo nominal que incorpora valores de parámetros optimizados (Fig. 2b, c).

Estimación del error del modelo para la vía JAK-STAT.

(a) La entrada conocida viene dada por medidas de fosforilación interpoladas linealmente para el receptor 4 de eritropoyetina. (B,C) Las medidas de salida 4 (negro) para STAT5 fosforilado y STAT5 total en el citoplasma en comparación con las salidas del modelo nominal (azul) y el ajuste de la red elástica dinámica (rojo). (D) Gráfico del modelo nominal (azul) y del sistema observador (rojo) con las variables de estado STAT5 citoplasmático, STAT5 monomérico fosforilado, STAT5 dimérico fosforilado y STAT5 nuclear. (mi) Estimaciones dinámicas de red elástica del error del modelo y el área bajo la curva (AUC) para la magnitud de cada componente. (F) Las estimaciones estatales obtenidas del modelo nominal (azul) y del observador de red elástica dinámica (ver en rojo).

Para estimar este error de modelo, ajustamos numéricamente la red elástica dinámica (3) con el modelo nominal (4) a las medidas de salida. Para cuantificar la magnitud de los diferentes componentes, calculamos numéricamente el área bajo la curva (AUC) de cada uno, es decir. El AUC y el curso de tiempo estimado del error del modelo indican (Fig. 2e), que las contribuciones dominantes y del error del modelo se dirigen a los estados y, que representan la cantidad de STAT5 citoesplasmático no fosforilado y STAT5 nuclear. El segundo componente de la estimación dinámica de la red elástica es idénticamente cero para todo el intervalo de tiempo (Fig. 2e). Aparte de la pequeña señal iniciada después de aproximadamente 40 minutos, esto es consistente con el modelo de ciclo nucleocitoplasmático mejorado informado en 26, que se basa en los mismos datos 4 e incorpora la reubicación de moléculas STAT5 nucleares desfosforiladas en el citoplasma. Es importante destacar que la red elástica dinámica también proporciona estimaciones modificadas para las cuatro variables de estado STAT5 (Fig. 2f), que también están en buen acuerdo con el modelo de ciclo nucleocitoplasmático (Texto complementario).

Un problema importante con los enfoques de regularización es la elección de los parámetros de regularización y. Usamos y en la Fig. 2, pero encontramos empíricamente, que los valores de AUC indican claramente los puntos objetivo del error del modelo para una amplia gama de valores (Fig. Suplementaria S2). El parámetro se eligió para equilibrar la suavidad y la precisión del ajuste a las medidas de salida. Además, el sesgo inducido por la doble regularización 18 puede compensarse con una estrategia de umbral simple: dada una estimación inicial del error del modelo, reajustamos la red elástica dinámica restringiendo todos los componentes con AUC pequeño a cero. El umbral se conoce en el contexto de regresión 27 y encontramos que mejora las estimaciones de estado así como las estimaciones de curso temporal de los errores restantes del modelo (Fig. Suplementaria S3).

El impacto del ruido de medición y las incertidumbres de los parámetros

Para explorar la robustez de la red elástica dinámica contra el ruido de medición, agregamos perturbaciones aleatorias a los datos experimentales 4. Para un nivel de ruido dado, generamos 500 conjuntos de datos perturbados agregando números aleatorios gaussianos con una media de cero y una desviación estándar escalada por un múltiplo de la desviación estándar empírica (ver las barras de error en la Fig.2b, c) a cada punto de datos experimentales. Por tanto, el nivel de ruido se define como un múltiplo de la desviación estándar empírica. Luego se ajustó la red elástica dinámica a cada muestra de salida y se calculó el área correspondiente bajo la curva para cada componente del error estimado del modelo. Las gráficas de estos valores de AUC frente al nivel de ruido se muestran en la Fig. 3a. Los valores medianos del AUC para los componentes son en gran medida independientes del nivel de ruido, pero la variabilidad de las estimaciones del AUC aumenta con el ruido de medición. Sin embargo, los valores de AUC para y son siempre mucho mayores que cero, mientras que el AUC de y es cercano o incluso igual a cero para muchas muestras con mayor nivel de ruido. Esto aumenta la confianza de que los nodos y (Fig. 2d) del modelo nominal JAK-STAT (4) son los principales puntos objetivo del error del modelo.

El impacto del ruido de medición simulado y la incertidumbre de los parámetros en la estimación de la red elástica dinámica en el modelo JAK-STAT.

(a) Diagramas de caja que visualizan la variación del AUC de las estimaciones dinámicas de la red elástica causadas por el ruido de la medición (consulte el texto principal para obtener más detalles). Para facilitar la visualización, los diagramas de caja a un nivel de ruido dado están ligeramente desplazados. (B) La variación del AUC causada por la incertidumbre de los parámetros.

El impacto de la incertidumbre de los parámetros en el modelo nominal se evaluó de manera similar. Los algoritmos de estimación de parámetros 4,10,26 aplicados al modelo nominal utilizando los datos experimentales (Fig. 2b, c) proporcionan estimaciones puntuales e intervalos de confianza para cada componente del vector de parámetros. Estos intervalos de confianza se volvieron a escalar por el nivel de ruido, produciendo un intervalo para cada parámetro del que se extrajeron muestras aleatorias uniformes. Nuevamente, generamos 500 vectores de parámetros modificados por nivel de ruido. Para cada muestra de parámetro, se tomó el sistema (4) como modelo nominal y se registró el AUC de las estimaciones resultantes (Fig. 3b). Nuevamente, no existe una tendencia sistemática para el AUC de los diferentes componentes del error estimado. Sin embargo, la variación del AUC aumenta mucho más rápido que en la Fig. 3a. Aparte de las diferentes distribuciones muestrales utilizadas, este efecto está relacionado con la definición del error del modelo. w, que siempre se define con respecto al modelo nominal (confiera la ecuación 2a). Por lo tanto, el error estimado del modelo contiene contribuciones de errores de especificación tanto estructurales como de parámetros en el modelo nominal. Sin embargo, aún es posible inferir los componentes dominantes y con alta confianza. Se encontraron resultados similares para la sensibilidad frente al número de puntos de tiempo de medición (texto complementario, Fig. S6).

Ejemplo de señalización fotomorfogénica UV-B

Como caso de prueba para un sistema más grande, utilizamos un modelo reciente para la coordinación de la señalización UV-B fotomorfogénica en plantas 19. El modelo consta de 11 ODE que describen la dinámica de las concentraciones de proteínas acopladas por 10 reacciones químicas (Fig. 4). Consideramos este modelo como el modelo nominal para probar el método dinámico de red elástica para una situación en la que se conoce la verdad del terreno. El error del modelo se simuló agregando las entradas ocultas a los nodos y. La función de salida es una combinación lineal de 7 variables de estado diferentes (consulte el texto complementario para todas las ecuaciones). Se tomaron muestras de datos sintéticos en puntos de tiempo discretos a partir de las salidas del modelo verdadero y se agregaron perturbaciones aleatorias gaussianas para simular el ruido de medición (Fig. 4b-f). Se utilizó la red elástica dinámica con el modelo nominal para reconstruir el error del modelo y el estado real a partir de estos datos simulados. El área absoluta bajo la curva para cada componente de la estimación del error del modelo indica claramente que los estados y son el objetivo de entradas ocultas (Fig. 4g), mientras que todos los demás componentes son muy pequeños o incluso nulos. Esto ilustra la escasez de la estimación dinámica de la red elástica, que es una clara ventaja sobre la pura L2 regularización. La discrepancia entre el error del modelo y la estimación correspondiente relativa a la amplitud del error del modelo verdadero es como máximo del 10% (Fig. 4h) y se debe principalmente a inexactitudes numéricas. Más importante aún, la discrepancia entre la trayectoria del estado real y la estimada es casi cero (Fig. 4i), lo que indica el excelente desempeño de la red elástica dinámica como observador de estado.

El ejemplo de señalización fotomorfogénica UV-B.

(a) El gráfico (sin bucles propios) del modelo indica 19. Los puntos objetivo de los errores del modelo simulado se indican mediante flechas rojas. (BF) La salida simulada con barras de error (negro), la salida del modelo nominal (azul) y la salida de la red elástica dinámica (rojo). (gramo) El AUC de los errores absolutos del modelo. (h) Los componentes de relativo a la amplitud A del verdadero error del modelo. (I) La discrepancia entre el estado real y el estado del modelo nominal (azul) en comparación con la discrepancia de la red elástica dinámica (rojo).

Probando las limitaciones

Como para cualquier método inverso, existen limitaciones del método dinámico de red elástica. Algunos errores del modelo son inobservables, porque existe una función de entrada oculta diferente que genera una salida que es idéntica a la salida obtenida; consulte el texto complementario para ver un ejemplo simple. Otros errores del modelo pueden ser prácticamente inobservables, porque la salida de otra función de entrada oculta puede no ser distinguible dentro de los errores de medición. Un caso especial son los errores de modelo que no tienen ningún efecto o casi ningún efecto en la salida. Estos no se notarán durante el modelado y se aceptará el modelo nominal.

Para probar aún más la capacidad de la red elástica dinámica para inferir los estados objetivo del error del modelo, es decir, los componentes distintos de cero del error del modelo verdadero, simulamos sistemáticamente perturbaciones en diferentes nodos y pares de nodos. Primero, simulamos errores de modelo dirigidos a un solo nodo k de la misma forma que antes. Para los nodos y no hubo ningún efecto sobre la salida (ver nuevamente la Fig. 4b-f) y por lo tanto estos nodos se omitieron del análisis posterior. Además, simulamos entradas ocultas para todas las combinaciones de dos nodos restantes. Para cada uno de estos 36 modelos verdaderos simulados, probamos la capacidad de la red elástica dinámica para recuperar los nodos objetivo correctos del AUC del estimado. Consideramos que un nodo o un par de nodos se recuperaron correctamente, si su AUC era al menos el 85% del AUC total en todos los nodos. Según este estricto criterio, encontramos que dos errores de un solo nodo dirigidos a o no fueron detectados correctamente y se predijo que otro solo nodo sería el objetivo del error del modelo (Fig. 5a). Esto indica que estos errores del modelo no son observables y que los datos de salida observados pueden explicarse mediante diferentes entradas a diferentes nodos. Con dos excepciones ((8, 3) y (7, 6)), los errores cometidos por el algoritmo para los errores del modelo por pares simulados involucran estos dos nodos de estado 1 y 4. Sin embargo, con la excepción de la combinación (1, 4), al menos un nodo se predice correctamente.

Detección de los nodos objetivo de errores de modelos simulados en la red de señalización UV-B.

(a) Todos los nodos y todos los pares de nodos fueron perturbados por un error de modelo simulado. Los nodos y se omiten, ya que la señal de error simulada no tuvo ningún efecto en la salida. Las filas y las columnas corresponden a los verdaderos nodos objetivo del error del modelo y los números en las celdas son los nodos encontrados por la red elástica dinámica (NA significa que no se asignó un segundo nodo). Las celdas grises indican errores cometidos por la red elástica dinámica para errores de modelo no observables. (B) Un ejemplo de un error de modelo no observable. Los verdaderos nodos de destino del error del modelo son, pero la red elástica dinámica predice los nodos de destino. (C) El reajuste de la red elástica dinámica bajo la restricción proporciona una solución alternativa. Las otras dos combinaciones y de los nodos no se ajustaban a los datos de salida.

Estos resultados demuestran las limitaciones inherentes de cualquier intento de recuperar el error del modelo a partir de los resultados observados. Para un error de modelo no observable, el verdadero error de modelo podría corresponder a un valor ligeramente mayor del error funcional (3c) que el mínimo obtenido por la red elástica dinámica. Un enfoque heurístico para explorar algunas de estas soluciones ligeramente subóptimas es volver a ejecutar la red elástica dinámica con algunos de los nodos de destino estimados (de la primera ejecución) excluidos y verificar si los datos de salida pueden ajustarse satisfactoriamente con el mismo nivel de escasez. Esto se ilustra en la Fig. 5b para el par de nodos (9, 1), que se predijo que sería (9, 3) según nuestro criterio. El reajuste del elástico dinámico bajo la restricción identifica los nodos correctos (9, 1), ver Fig. 5c. Las otras dos combinaciones y no proporcionan un ajuste satisfactorio a los datos (Fig. Suplementaria S9). Para la red de señalización UVB, encontramos que las soluciones ligeramente subóptimas identificadas por esta heurística siempre contienen la configuración correcta del nodo objetivo. La explosión combinatoria de esta estrategia normalmente no debería ser un problema, gracias a la escasez de predicciones dinámicas de red elástica. La decisión sobre cuál de los conjuntos de nodos de destino predichos o cuál es el correcto en la práctica sólo se puede tomar cuando se miden estados adicionales. Sin embargo, este ejemplo muestra cómo la red elástica dinámica proporciona información útil para seleccionar estados adicionales para la observación experimental 20,28.


Propiedades

Siempre es bueno tener curiosidad sobre lo que sucede cuando intentas hacer algo extraño como conectar una fracción para el orden de diferenciación, ya que esa es, por supuesto, la cantidad de descubrimientos importantes que se hacen, pero cuando te diriges a un territorio inexplorado, debes estar preparado. abandonar gran parte de lo que ya sabe y dar por sentado que es natural y obvio.

Lo cual es básicamente una forma trillada de decir que muchas de las propiedades básicas de las derivadas e integrales ordinarias con las que todos estamos familiarizados y con las que nos sentimos cómodos, como la cadena y las reglas del producto, no funcionan. no se mantienen en general con derivadas fraccionarias e integrales, o adoptan formas complicadas. Sin embargo, la integral y la derivada de RL que hemos discutido no son los únicos posibles operadores integrales diferentes, de hecho, existe un universo entero de diferentes formas de generalizar la diferenciación y la integración a órdenes no enteros y es posible hacerlo de forma que conserven muchas de las propiedades clásicas. Sin embargo, en este artículo nos centramos en los operadores R-L porque, junto con los operadores Caputo estrechamente relacionados, son los más fáciles de entender y los más comunes en las aplicaciones.

Otra propiedad interesante del RLFD es la no localidad. Cuando calculamos el valor de una derivada de orden entero en un punto, el valor resultante depende solo de ese punto. Esta propiedad aparentemente obvia se llama localidad. Las cosas son diferentes con la derivada fraccionaria. La derivada fraccionaria se obtiene integrando sobre un rango completo de valores, y existe una dependencia no trivial en el límite inferior de la integración, por lo que deberíamos haber escrito correctamente la derivada fraccionaria como:

El caso donde a = 0 es común cuando se analizan sistemas físicos, porque a menudo la variable dependiente es el tiempo, y la derivada fraccionaria en un momento dado dependerá del estado del sistema en todos los tiempos anteriores, es decir, todos los instantes de tiempo desde el inicio del experimento en t = 0.

Esta no localidad es uno de los principales impulsores de interés en el cálculo fraccional en las aplicaciones. Hay muchos fenómenos físicos interesantes que tienen los llamados efectos de memoria, lo que significa que su estado no depende únicamente del tiempo y la posición, sino también de estados previos. Por ejemplo, uno puede imaginar un componente de circuito eléctrico cuya resistencia depende de toda la carga que ha pasado a través de él durante un período de tiempo fijo. Los sistemas con efectos de memoria pueden ser muy difíciles de modelar y analizar con ecuaciones diferenciales clásicas, pero la no localidad da a las derivadas fraccionarias una capacidad incorporada para incorporar efectos de memoria. Por tanto, el cálculo fraccional podría resultar una herramienta muy útil para analizar esta clase de sistemas.

La no localidad es también la razón por la que debemos tener cuidado al especificar que estamos discutiendo el RLFD izquierdo. También se puede cambiar el orden de integración para definir la derivada fraccionaria correcta:

El RLFD derecho es un objeto fundamentalmente diferente al izquierdo a pesar de su apariencia similar. Las derivadas fraccionarias derechas no se han estudiado tanto y no son tan útiles en el entorno aplicado. Para entender por qué, considere lo que significaba la propiedad de no localidad en el caso del RLFD izquierdo: significaba que el estado de un sistema físico dependía de su estado en tiempos anteriores. Si un RLFD correcto describiera un sistema físico, entonces el estado de ese sistema en un momento dado dependería de su estado futuro, que no es físicamente razonable. Dado que la mayor parte de la investigación sobre cálculo fraccional se centra en aplicaciones, las derivadas fraccionarias derechas son en su mayoría interesantes para los teóricos por ahora.


7.6: Una pregunta interesante: ¿podemos incorporar la memoria en nuestro modelo? - biología

Cuando mi cónyuge me dijo que se identificaban como mujeres (se les había asignado un hombre al nacer), no consideré cómo cambiaría mi práctica como profesora de biología en la escuela secundaria. Sin embargo, la entrada de mi cónyuge en la comunidad de lesbianas, gays, bisexuales, transgénero, queer, intersexuales y asexuales (LGBTQIA +) ha cambiado significativamente mi enfoque de enseñanza. Este artículo cuenta mi historia como una experiencia identificable y proporciona prácticas en el aula para ayudar a los maestros a interactuar con estudiantes trans de una manera socialmente justa. Les pido a los profesores que se alejen de una orientación pragmática a una más filosófica. Los maestros se preocupan por la mejor manera de enseñar, esto puede significar reflexionar sobre nuestras actitudes y el plan de estudios oculto en nuestra clase, y luego cambiarlos para mejor. (El plan de estudios oculto se refiere a las lecciones, valores y perspectivas no escritos, no oficiales y, a menudo, no intencionados que los estudiantes aprenden en la escuela).

Los profesores de biología tendrán más preguntas sobre las personas trans porque su contenido generalmente incluye herencia cromosómica y rasgos ligados al sexo (HS LS3.B, HS LS3.A) (NGSS Lead States 2013). Las personas trans, y específicamente los estudiantes trans, son la población más vulnerable en los Estados Unidos. El setenta y cinco por ciento de los jóvenes transgénero se sienten inseguros en la escuela, tienen GPA significativamente más bajos, tienen más probabilidades de faltar a la escuela debido a preocupaciones de seguridad y es menos probable que planeen continuar su educación (Kosciw et al. 2015).

Además, las personas lesbianas, gays, bisexuales, transgénero, interrogantes o queer (LGTBQ) tienen menos probabilidades de elegir carreras STEM. Un estudio de la Institución de Ingeniería y Tecnología encontró que el 29% de los jóvenes LGBTQIA + evitaron carreras en STEM por temor a ser discriminados (McDonald 2018).

Los docentes pueden tener sentimientos diversos sobre la identidad de género y los estudiantes de género complejo (aquellos que se están alejando de las definiciones sociales de género). Algunos educadores no creen en las definiciones más amplias de género por razones religiosas. Es posible que los educadores de las escuelas públicas no estén de acuerdo con las decisiones que toman los estudiantes, pero tendremos estudiantes transgénero en nuestras aulas, así como padres y colegas de género complejo. Las personas que conocen mis antecedentes me han pedido que les brinde orientación en un contexto específico para un profesor de ciencias. Antes de que podamos hacer cambios en nuestro salón de clases, debemos escuchar sin prejuicios para que haya un corazón detrás de nuestras acciones.

Introducción a las complejidades de género

La noción arraigada de que los estudiantes se identifican como transgénero para poder mirar al sexo opuesto en un vestuario es infundada. Para abordar esta idea, necesitamos introducir algunos antecedentes sobre la identidad de género. Primero, está el “sexo asignado al nacer”, que es la decisión que toman los médicos basándose en los genitales externos cuando nace un niño. Dado que los genitales son privados, no nos damos cuenta de que pueden tener una apariencia muy diversa. A veces, los médicos toman decisiones difíciles y a un niño se le puede asignar algo diferente a su identidad de género; esto a menudo se etiqueta como "intersexual".

Los estudiantes también pueden elegir la etiqueta intersexual según las diferencias hormonales o la anatomía interna. Se han documentado algunos ejemplos médicos de personas con testículos no descendidos y ovarios, pero no existe documentación médica moderna de "hermafroditas" (Schoenhaus et al. 2008).

El espectro de identidad de género incluye personas que se identifican como hombres, mujeres o no binarios. Las personas también pueden identificarse como "agender", lo que significa que no están en el espectro y no se identifican con ningún género. Expresión de género Implica cómo los individuos comunican su género a los demás. La expresión de género se puede comunicar a través de la ropa, el maquillaje, los peinados, el vello facial y los gestos, esto también puede fluctuar y cambiar dependiendo de cómo se sienta el individuo al descubrir su auténtica expresión de género. Por ejemplo, hubo una discusión importante en la sala de profesores de mi escuela: la amenaza percibida de un "hombre con barba" vestido con un vestido tratando de usar el baño de mujeres en un evento deportivo. Esta persona pudo haber estado averiguando si se sentía cómoda usando vestidos o sintió que la barba ayudó a expresar la parte masculina, mientras que el vestido ayudó a expresar la parte femenina. Cuando los estudiantes o colegas mencionan o actúan sobre estereotipos dañinos, es importante abordarlos y contrarrestarlos específicamente. (Ver Recursos en línea: Comisión de Derechos Humanos: Desmentir los mitos Salud y bienestar de las personas transgénero).

Siempre he hablado con mis alumnos sobre cómo nunca está bien burlarse de alguien por lo que usan, ya sea un símbolo religioso, comunique pobreza o represente un sentido diferente de la moda. Al igual que en los diálogos nacionales de ropa cultural y religiosa, la ropa que envía diferentes señales sobre el género no debe indicar una amenaza.

Cuando mi ahora ex-cónyuge hizo la transición, fue una experiencia difícil física, social, emocional y económicamente para los dos. En el Medio Oeste, las sesiones de terapia cuestan alrededor de $ 150 y se necesitan al menos dos veces al mes. Las sesiones de electrólisis para la depilación facial costaban $ 65 dólares por sesión y se necesitaban semanalmente. También hubo un cambio de vestuario completo. Como maestra de clase media y secretaria que también era responsable de pagar la guardería, era difícil cubrir estos costos.

Los estudiantes están limitados por gastos similares, aunque los bloqueadores de hormonas sexuales pueden ayudar a detener las características sexuales secundarias que los adultos pueden querer abordar. Esto puede incluir cirugía "superior" e "inferior", así como implantes mamarios, afeitado laríngeo, etc. Mi ex cónyuge decidió comprar inserciones de mastectomía (creadas originalmente para mujeres a las que se les extirpó un seno debido al cáncer) para crear un busto perfil. Finalmente, su régimen hormonal de estrógeno y espironolactona hizo que los insertos fueran innecesarios para ella (la espironolactona bloquea los receptores de hormonas sexuales masculinas (andrógenos) y puede suprimir la producción de testosterona).

Durante la transición de mi excónyuge, ellos (el pronombre preferido) intentaron suicidarse. Si una persona blanca mayor y privilegiada con una maestría no solo idea sino que intenta suicidarse, es notable que los adolescentes trans puedan sobrevivir a presiones sociales similares. Recuerdo muchas microagresiones durante ese tiempo. Mientras comprábamos comestibles, las miradas y las miradas dobles eran comunes. Los cajeros siempre parecían cometer errores en la caja registradora: estaban distraídos y trataban de averiguar el sexo de mi excónyuge y nuestra relación, mientras que al mismo tiempo se ocupaban de la cuenta. Recuerdo conversaciones repentinas en voz baja mientras pasábamos y conversaciones increíblemente difíciles con familiares y compañeros de trabajo. Las historias son infinitas y dan forma a cómo enseño ahora. Tenga en cuenta que no estoy contando estas historias para crear la idea de que las personas trans y / o los estudiantes son víctimas, o para fomentar una mentalidad deficiente en los maestros. Estoy contando estas historias para crear empatía y confiabilidad para que los maestros se muevan a la acción.

Lo que hago ahora en mi salón de clases

Mi plan de estudios ofrece una declaración de apoyo. Por ejemplo, “Me identifico como un aliado de la comunidad de lesbianas, gays, bisexuales, transgénero, queer, intersexuales y asexuales (LGBTQIA), y estoy disponible para escucharlos y apoyarlos de manera afirmativa. Comuníquese conmigo sobre cómo puedo satisfacer y apoyar sus necesidades. Sepa que sus consejeros y directores están comprometidos a apoyarlo ".

Continúo verbalmente con: “Todos son diferentes, todos son únicos y todos están luchando a su manera. Es importante, no importa lo que sea, que si una persona se ve o habla de manera diferente, sea siempre amable. Sea siempre amable. Trátelos como le gustaría que lo trataran a usted ". Si no lo dice, los estudiantes no lo asumirán.

Hago una tabla de asientos que tiene los nombres de los estudiantes de la lista y luego digo: “Si su nombre escrito no es el que desea que usemos yo y sus compañeros de clase, avíseme antes de mañana, ya sea después de clase o por correo electrónico. " Por lo general, esto significa cambiar "Elizabeth" por "Beth", pero este enfoque me da una manera de corregir la lista sin decir nombres y forzar una corrección improvisada.

Señalo los supuestos de género durante la instrucción directa. Por ejemplo, la mayoría de los estudiantes tienen la idea errónea de que los mamíferos más grandes son machos y los más pequeños son hembras. Para muchos organismos, es lo contrario, las hembras son más grandes que los machos, y hablamos de las razones durante la unidad de ecología. En algún momento, nuestras definiciones culturales de género se rompen en el mundo biológico.

Algunos estudiantes simplemente quieren "aprobar" (su identidad de género y apariencia física coinciden), en lugar de ser "cronometrados" (la apariencia física y la expresión de género son diferentes para el observador). Nunca hablo de la expresión o identidad de género de una persona en clase, y vigilo las interacciones grupales para que los estudiantes con complejo de género sepan que están a salvo.

Si no estoy seguro del sexo de un estudiante, pregunto: "¿Cuál es su pronombre preferido / afirmado?" Algunos pronombres preferidos pueden ser plurales como "They / Theirs" y "Ze / Zirs" (Pan 2018). Me aseguro de usar su pronombre preferido y me aseguro de que otros estudiantes en el aula lo usen.Usar el pronombre incorrecto es una microagresión: un comentario o una acción que expresa sutilmente ya menudo inconscientemente una actitud prejuiciosa hacia un miembro de un grupo marginado. Si confundes con alguien y te corrige, simplemente di "gracias por la corrección, lo haré mejor la próxima vez", en lugar de disculparte. Cuando alguien escucha disculpas constantes, puede inferir que su identidad de género es un peso o una carga.

Los estudiantes pueden o no cambiarse de ropa cuando llegan a la escuela o antes de regresar a casa. Los padres pueden desconocer por completo la identidad y expresión de género de sus hijos, o pueden brindar mucho apoyo y estar bien informados. Es importante tener en cuenta que los padres han pasado o están pasando por un proceso de duelo por perder las ideas que tenían sobre su hijo en relación con el sexo que se le asignó al nacer.

En algún momento, los padres pueden comenzar a ver las nuevas posibilidades y la emocionante realidad de que su hijo se convierta en su yo más auténtico. Me aseguro de mantener a los padres actualizados sobre cualquier síntoma que sea indicativo de un cambio en la salud mental. Una vez que me comunico, los padres suelen revelar lo que saben.

Una de las mejores preguntas que me han hecho es: "¿Qué le dices a un colega que se niega a usar los pronombres o nombres correctos para un estudiante?" Mi respuesta es: “Enseñamos a todo tipo de estudiantes con los que fundamentalmente no estamos de acuerdo, incluso los matones e intolerantes. Como profesores en la escuela pública, debemos satisfacer las necesidades de los estudiantes, no la ideología pedagógica de los profesores. Este estudiante ha hecho algunas solicitudes específicas y está pidiendo que lo traten amablemente al satisfacer esas solicitudes ".

La unidad de genética

Al comienzo de mi unidad de genética, hablo específicamente sobre la diferencia entre identidad cromosómica e identidad y expresión de género. Esta es probablemente la práctica más significativa si no se discute la identidad y expresión de género, no existe para los estudiantes y eso significa que la identidad de un estudiante puede borrarse, omitirse o ignorarse. Sin querer, esto puede causar mucho daño a los estudiantes (Miller 2019). A continuación se muestra cómo abordo la discusión en mi propia clase.

Cuando comienzo mi lección sobre los rasgos ligados al sexo, me aseguro de validar todas las estructuras familiares, incluidas las parejas de gays y lesbianas, y refuerzo la idea de que el sexo asignado al nacer / identidad cromosómica puede no coincidir con la identidad de género. Además, la investigación muestra que los gametos pueden manipularse, por lo que hay tres "padres" de un organismo. Actualmente se utiliza para la transferencia de ADN mitocondrial. (Consulte Recursos en línea).

Papel de las hormonas y otros factores.

Las causas de las diferencias de identidad de género son múltiples y complejas; sin embargo, una hipótesis común es que durante el desarrollo del útero el gen que desencadena la testosterona (SRY) falla o envía señales de forma incompleta. El Centro de Recursos Genómicos de la Organización Mundial de la Salud ofrece una discusión más completa (consulte Recursos en línea).

“Guevedoces” es un término en español que significa “pene a los 12” y es común en una comunidad de República Dominicana donde es común que a las “niñas” se les asigne un sexo al nacer como mujeres, pero en la pubertad suficiente testosterona inunda el sistema para para que crezcan los genitales masculinos externos. Hay varios videos sobre el fenómeno que ayudan a crear empatía, tal vez alejando las percepciones de los estudiantes de una narrativa de "elección" (consulte Recursos en línea).

La mayoría de los profesores enseñan una unidad de trastornos genéticos y pueden discutir la identidad trans en el contexto de la aneuploidía (síndrome de Turner, síndrome de Klinefelter). Los científicos estiman que hasta 1 de cada 100 personas pueden tener una diferencia / trastorno del desarrollo sexual o DSD (Ainsworth 2015). Ejemplos de esto serían una madre que tiene la mayoría de células XY o un abuelo que se sometió a una cirugía abdominal, solo para que los médicos encontraran un útero. Otras personas pueden nacer intersexuales: sus órganos sexuales no están definidos al nacer, por lo que los cirujanos asignan un sexo. Todas estas condiciones son interesantes y apropiadas para hablar en un aula de biología, pero no explican la experiencia trans. Los eventos biológicos y sociales que hacen que una persona se identifique como trans son indefinidos y múltiples, y continúan siendo investigados.

Antes de mi experiencia, presentaba los trastornos genéticos como extraños, geniales o macabros (piense en el Hombre Elefante o el síndrome del niño lobo / Ambras). Fue bien intencionado mostrar el poder de la genética y el ADN, sin embargo, ese tipo de lenguaje “otorgiza” y deshumaniza a las personas que están luchando. Una respuesta socialmente más constructiva es hacer que los estudiantes imaginen las adaptaciones que tendría que hacer un individuo para completar las tareas diarias. Además, puede ser apropiado hablar sobre lo que significa "tipicidad", en relación con las curvas de campana estadísticas. El hecho de que algo no sea típico no significa que sea aberrante.

Pruebas de sexo en los deportes

Hay recursos del HHMI que apoyan una discusión en el aula sobre sexo y género en el mundo del deporte (ver Recursos en línea). Es importante señalar a los estudiantes que el mundo del deporte asume que solo hay dos géneros y establece reglas y suposiciones como tales. Como profesores, debemos señalar que el mundo es más amplio que un sistema de dos géneros y que el deporte es un mundo separado de cultura y categoría. Lo justo y lo equitativo pueden ser dos cosas diferentes. Descubrir las definiciones de hombre y mujer en un foro deportivo no significa que esas definiciones se trasladen a toda la sociedad.

Género en otras culturas

Otras culturas además de la cultura estadounidense dominante tienen diferentes definiciones de género. Algunos pueblos de las Primeras Naciones (culturas nativas americanas) reconocen un espectro de géneros. Nepal agregó un tercer género a sus preguntas del censo en 2011 (Hill y Mays 2013). La investigación y la discusión de estas culturas pueden ayudar a los estudiantes a ver múltiples perspectivas y ayudar a inculcar una mentalidad global.

Modelado para todos los estudiantes

Muchos profesores pueden asumir que solo necesitan reconocer que el género es un espectro en la unidad de genética, y solo cuando hay un estudiante trans o de género complejo en la clase. Haciendo trans y
Los estudiantes con complejo de género se sienten reconocidos y seguros de ser ellos mismos auténticos es el objetivo principal, pero no es el único objetivo. Siento que cada estudiante cis-género (la identidad de género y la expresión de género coinciden culturalmente con el sexo asignado al nacer) también necesita escuchar y que los adultos modelen este reconocimiento. En el futuro, ya sea durante el próximo período de clases, en el próximo año, en la universidad o en la fuerza laboral, los estudiantes necesitan una base de comprensión. Luego, pueden corregir a otros cuando se produce una discriminación de género y ayudar a crear una cultura en la que la violencia y la discriminación contra las personas trans sean simplemente historia pasada.

Un llamado final a la bondad

Este artículo no pretende ser la última palabra en la investigación de un docente sobre la equidad y la inclusión de estudiantes trans, sino como punto de partida. Muchos maestros pueden dudar en explicar estos temas, responder preguntas o incorporar estas prácticas. Sin embargo, la gente está muriendo a causa de la discriminación trans. Veintiocho personas murieron en los Estados Unidos en 2017 por agresiones violentas debido a su identidad de género (Human Rights Campaign Staff 2018). No podemos seguir enseñando ignorando el daño que nuestro plan de estudios oculto hace al mundo exterior. Como profesores de biología, la gran mayoría de nosotros somos defensores de la justicia ambiental. Es un valor y una postura fáciles de defender. Pero estoy pidiendo justicia social, la que reconoce y respeta a todos los estudiantes en el aula.

Este comentario ha suscitado una valiosa discusión, que se publicará en la edición de julio / agosto de The Science Teacher. Obtenga una vista previa de la discusión aquí.

Elizabeth Hobbs ([email protected]) es estudiante de posgrado en línea en la Texas Tech University y enseña Física Conceptual y Oceanografía en Saint Louis, Missouri.

Sitios web que apoyan a los educadores científicos para la justicia social en la expresión de género

Educadores de ciencias de SEEDS para la equidad, la diversidad y la justicia social: http://seedsweb.org/

Sitios web que admiten géneros múltiples / diferentes / de espectro para la investigación de los estudiantes

Sitios web e investigaciones que apoyan específicamente la identidad transgénero desde una perspectiva científica

Centro de Recursos Genómicos de la Organización Mundial de la Salud: www.who.int/genomics/gender/en/

Recursos generales para comprender la complejidad de género

The Genderbook (Apropiado para sexto grado en adelante): www.thegenderbook.com/

Sitio web de Genderbread (apropiado para todas las edades, con recursos para estudiantes y maestros) www.genderbread.org/

Recursos educativos para estudiantes trans: www.transstudent.org/

Red de educación gay, lesbiana y heterosexual: www.glsen.org/

Recursos para futuros científicos

Sociedad Estadounidense para la Educación en Ingeniería, que promueve la igualdad LGBTQ en la educación STEM: https://lgbtq.asee.org/

Organización Nacional de Científicos y Profesionales Técnicos Gays y Lesbianas: www.noglstp.org/

En ciencia, tecnología, ingeniería, matemáticas: www.ostem.org/

Ainsworth, C. 2015. Sexo redefinido: la idea de dos sexos es simplista. Los biólogos ahora piensan que hay un espectro más amplio que ese. Naturaleza 518 (7539): 288–289.

Hill, M.R. y J. Mays. 2013. El libro de género. Houston: Marshall House Press.

James, S.E., J.L. Herman, S. Rankin, M. Keisling, L. Mottet y M. Anafi. 2016. El Informe de la Encuesta Transgénero de EE. UU. De 2015. Washington, DC: Centro Nacional para la Igualdad Transgénero.

Kosciw, J.G. y col. 2015. La Encuesta Nacional de Clima Escolar de 2015: Las experiencias de los jóvenes lesbianas, gays, bisexuales, transgénero y queer en las escuelas de nuestra nación. Washington, DC: GLSEN.

Miller, S. 2019. Acerca de la justicia de identidad de género en escuelas y comunidades. Nueva York: Teachers College Press.


Referencias

LeCun, Y., Bengio, Y. & amp Hinton, G. Aprendizaje profundo. Naturaleza 521, 436–444 (2015).

Krizhevsky, A., Hinton, G. E. & amp Sutskever, I. Clasificación de ImageNet con redes neuronales convolucionales profundas. Adv. Información neuronal. Proceso. Syst. 25, 1106–1114 (2012).

Eslami, S. M. A. et al. Representación y renderizado de escenas neuronales. Ciencias 360, 1204–1210 (2018).

Silver, D. et al. Dominar el juego de Go con redes neuronales profundas y búsqueda de árboles. Naturaleza 529, 484–489 (2016).

Mnih, V. y col. Control a nivel humano a través del aprendizaje por refuerzo profundo. Naturaleza 518, 529–533 (2015).

Hassabis, D., Kumaran, D., Summerfield, C. & amp Botvinick, M. Inteligencia artificial inspirada en la neurociencia. Neurona 95, 245–258 (2017).

Golan, T., Raju, P. C. & amp Kriegeskorte, N. Estímulos controvertidos: enfrentando las redes neuronales entre sí como modelos de reconocimiento humano. Preimpresión en arXiv https://arxiv.org/abs/1911.09288 (2020).

Flesch, T., Balaguer, J., Dekker, R., Nili, H. & amp Summerfield, C. Comparación del aprendizaje continuo de tareas en mentes y máquinas. Proc. Natl Acad. Sci. Estados Unidos 115, E10313 – E10322 (2018).

Geirhos, R. et al. Generalización en humanos y redes neuronales profundas. NeurIPS Proc. (2018).

Zhou, Z. & amp Firestone, C. Los seres humanos pueden descifrar imágenes adversas. Nat. Comun. 10, 1334 (2019).

Rajalingham, R. y col. Comparación a gran escala y de alta resolución del comportamiento de reconocimiento de objetos visuales centrales de humanos, monos y redes neuronales artificiales profundas de última generación. J. Neurosci. 38, 7255–7269 (2018).

Yamins, D. L. K. & amp DiCarlo, J. J. Uso de modelos de aprendizaje profundo impulsados ​​por objetivos para comprender la corteza sensorial. Nat. Neurosci. 19, 356–365 (2016).

Yamins, D. L. K. et al. Los modelos jerárquicos optimizados para el rendimiento predicen respuestas neuronales en la corteza visual superior. Proc. Natl Acad. Sci. Estados Unidos 111, 8619–8624 (2014).

Khaligh-Razavi, S.-M. & amp Kriegeskorte, N. Los modelos supervisados ​​en profundidad, pero no sin supervisión, pueden explicar la representación cortical de TI. PLoS Comput. Biol. 10, e1003915 (2014).

Kell, A. J. E., Yamins, D. L. K., Shook, E. N., Norman-Haignere, S. V. & amp McDermott, J. H. Una red neuronal optimizada para tareas replica el comportamiento auditivo humano, predice las respuestas cerebrales y revela una jerarquía de procesamiento cortical. Neurona 98, 630–644.e16 (2018).

Cichy, R. M., Khosla, A., Pantazis, D., Torralba, A. & amp Oliva, A. La comparación de redes neuronales profundas con la dinámica cortical espacio-temporal del reconocimiento de objetos visuales humanos revela una correspondencia jerárquica. Sci. Reps. 6, 27755 (2016).

Kar, K., Kubilius, J., Schmidt, K., Issa, E. B. & amp DiCarlo, J. J. Evidencia de que los circuitos recurrentes son fundamentales para la ejecución de la corriente ventral del comportamiento de reconocimiento de objetos centrales. Nat. Neurosci. 22, 974–983 (2019).

Kietzmann, T. C. et al. Se requiere recurrencia para capturar la dinámica de representación del sistema visual humano. Proc. Natl Acad. Sci. Estados Unidos 116, 21854–21863 (2019).

Guclu, U. & amp van Gerven, M. A. J. Las redes neuronales profundas revelan un gradiente en la complejidad de las representaciones neuronales a lo largo de la corriente ventral. J. Neurosci. 35, 10005–10014 (2015).

Elsayed, G. F. et al. Ejemplos de adversarios que engañan tanto a la visión por computadora como a los humanos con tiempo limitado. NeurIPS Proc. (2018).

Ullman, S., Assif, L., Fetaya, E. & amp Harari, D. Átomos de reconocimiento en la visión humana y por computadora. Proc. Natl Acad. Sci. Estados Unidos 113, 2744–2749 (2016).

Sinz, F. H., Pitkow, X., Reimer, J., Bethge, M. & amp Tolias, A. S. Ingeniería de una inteligencia menos artificial. Neurona 103, 967–979 (2019).

Marblestone, A. H., Wayne, G. & amp Kording, K. P. Hacia una integración del aprendizaje profundo y la neurociencia. Parte delantera. Computación. Neurosci. 10, 1–61 (2016).

Kell, A. J. & amp McDermott, J. H. Modelos de redes neuronales profundas de sistemas sensoriales: ventanas sobre el papel de las restricciones de tareas. Curr. Opin. Neurobiol. 55, 121–132 (2019).

Kriegeskorte, N. Redes neuronales profundas: un nuevo marco para modelar la visión biológica y el procesamiento de la información cerebral. Annu. Rev. Vis. Sci. 1, 417–446 (2015).

Bowers, J. S. Teoría del procesamiento distribuido en paralelo en la era de las redes profundas. Trends Cogn. Sci. 21, 950–961 (2017).

Cichy, R. M. & amp Kaiser, D. Redes neuronales profundas como modelos científicos. Trends Cogn. Sci. 23, 305–317 (2019).

Lake, B. M., Ullman, T. D., Tenenbaum, J. B. & amp Gershman, S. J. Construyendo máquinas que aprenden y piensan como personas. Behav. Ciencia del cerebro. 40, e253 (2017).

Lindsay, G. W. Redes neuronales convolucionales como modelo del sistema visual: pasado, presente y futuro. J. Cogn. Neurosci. https://doi.org/10.1162/jocn_a_01544 (2020).

Zador, A. M. Una crítica del aprendizaje puro y lo que las redes neuronales artificiales pueden aprender del cerebro de los animales. Nat. Comun. 10, 3770 (2019).

Rogers, T. T. & amp Mcclelland, J. L. Procesamiento distribuido en paralelo en 25: exploraciones adicionales en la microestructura de la cognición. Cogn. Sci. 38, 1024–1077 (2014).

Hasson, U., Nastase, S. A. & amp Goldstein, A. Ajuste directo a la naturaleza: una perspectiva evolutiva sobre redes neuronales biológicas y artificiales. Neurona 105, 416–434 (2020).

Richards, B. A. et al. Un marco de aprendizaje profundo para la neurociencia. Nat. Neurosci. 22, 1761–1770 (2019).

Lillicrap, T. P. & amp Kording, K. P. ¿Qué significa entender una red neuronal? Preimpresión en arXiv https://arxiv.org/abs/1907.06374 (2019).

Saxe, A., Bhand, M., Mudur, R., Suresh, B. & amp Ng, A. Y. Modelos de aprendizaje no supervisados ​​de campos receptivos corticales primarios y plasticidad del campo receptivo. Adv. Información neuronal. Proceso. Syst. 25, 1971–1979 (2011).

Stevenson, I. H. & amp Kording, K. P. Cómo los avances en la grabación neuronal afectan el análisis de datos. Nat. Neurosci. 14, 139–142 (2011).

Saxena, S. & amp Cunningham, J. P. Hacia la doctrina de la población neuronal. Curr. Opin. Neurobiol. 55, 103–111 (2019).

Fusi, S., Miller, E. K. & amp Rigotti, M. Por qué se mezclan las neuronas: alta dimensionalidad para una cognición superior. Curr. Opin. Neurobiol. 37, 66–74 (2016).

Rigotti, M. y col. La importancia de la selectividad mixta en tareas cognitivas complejas. Naturaleza 497, 585–590 (2013).

Johnston, W. J., Palmer, S. E. y Freedman, D. J. La selectividad mixta no lineal es compatible con la computación neuronal confiable. PLoS Comput. Biol. 16, e1007544 (2020).

Raposo, D., Kaufman, M. T. & amp Churchland, A. K. Una población neuronal sin categoría apoya las demandas en evolución durante la toma de decisiones. Nat. Neurosci. 17, 1784–1792 (2014).

Higgins, I. et al. El aprendizaje profundo no supervisado identifica el desenredo semántico en neuronas inferotemporales individuales. Preimpresión en arXiv https://arxiv.org/abs/2006.14304 (2020).

Park, I. M., Meister, M. L. R., Huk, A. C. & amp Pillow, J. W. Codificación y decodificación en la corteza parietal durante la toma de decisiones sensoriomotoras. Nat. Neurosci. 17, 1395–1403 (2014).

Mante, V., Sussillo, D., Shenoy, K. V. & amp Newsome, W. T. Cálculo dependiente del contexto mediante dinámicas recurrentes en la corteza prefrontal. Naturaleza 503, 78–84 (2013).

Chaisangmongkon, W., Swaminathan, S. K., Freedman, D. J. y Wang, X.-J. Computación por transitoriedad robusta: cómo la red fronto-parietal toma decisiones secuenciales basadas en categorías. Neurona 93, 1504-1517.e4 (2017).

Engel, T. A., Chaisangmongkon, W., Freedman, D. J. & amp Wang, X. J. Las fluctuaciones de actividad correlacionadas con la elección subyacen al aprendizaje de la representación de categorías neuronales. Nat. Comun. 6, 6454 (2015).

Remington, E. D., Egger, S. W., Narain, D., Wang, J. & amp Jazayeri, M. Una perspectiva de sistemas dinámicos sobre la sincronización del motor flexible. Trends Cogn. Sci. 22, 938–952 (2018).

Remington, E. D., Narain, D., Hosseini, E. A. & amp Jazayeri, M. Cálculos sensitivomotoras flexibles mediante la reconfiguración rápida de la dinámica cortical. Neurona 98, 1005–1019.e5 (2018).

Orhan, A. E. & amp Ma, W. J. Una diversa gama de factores afectan la naturaleza de las representaciones neuronales subyacentes a la memoria a corto plazo. Nat. Neurosci. 22, 275–283 (2019).

Masse, N. Y., Rosen, M. C. & amp Freedman, D. J. Reevaluación del papel de la actividad neuronal persistente en la memoria a corto plazo. Trends Cogn. Sci. 24, 242–258 (2020).

Masse, N. Y., Yang, G. R., Song, H. F., Wang, X.-J. & amp Freedman, D. J. Mecanismos de circuito para el mantenimiento y manipulación de información en la memoria de trabajo. Nat. Neurosci. 22, 1159–1167 (2019).

Lindsey, J., Ocko, S. A., Ganguli, S. & amp Deny, S. Una teoría unificada de las representaciones visuales tempranas desde la retina hasta la corteza a través de CNN profundas anatómicamente restringidas. Preimpresión en bioRxiv https://doi.org/10.1101/511535 (2019).

Rahwan, I. et al. Comportamiento de la máquina. Naturaleza 568, 477–486 (2019).

Thompson, J. A. F., Bengio, Y., Formisano, E. & amp Schönwiesner, M. ¿Cómo puede el aprendizaje profundo avanzar en el modelado computacional del procesamiento de información sensorial? Preimpresión en arXiv https://arxiv.org/abs/1810.08651 (2018).

Schrimpf, M. et al. Puntaje cerebral: ¿qué red neuronal artificial para el reconocimiento de objetos se parece más al cerebro? Preimpresión en bioRxiv https://doi.org/10.1101/407007 (2018).

Kriegeskorte, N. Análisis de similitud representacional: conexión de las ramas de la neurociencia de sistemas. Parte delantera. Syst. Neurosci. 2, 4 (2008).

Bashivan, P., Kar, K. y DiCarlo, J. J.Control de la población neuronal mediante síntesis profunda de imágenes. Ciencias 364, eaav9436 (2019).

Ponce, C. R. et al. La evolución de imágenes para neuronas visuales utilizando una red generativa profunda revela principios de codificación y preferencias neuronales. Celda 177, 999–1009.e10 (2019).

Krakauer, J. W., Ghazanfar, A. A., Gomez-Marin, A., MacIver, M. A. & amp Poeppel, D. La neurociencia necesita comportamiento: corregir un sesgo reduccionista. Neurona 93, 480–490 (2017).

Gomez-Marin, A. & amp Ghazanfar, A. A. La vida del comportamiento. Neurona 104, 25–36 (2019).

Rich, A. S. & amp Gureckis, T. M. Lecciones para la inteligencia artificial a partir del estudio de la estupidez natural. Nat. Mach. Intell. 1, 174–180 (2019).

Shenhav, A., Botvinick, M. M. & amp Cohen, J. D. El valor esperado del control: una teoría integradora de la función de la corteza cingulada anterior. Neurona 79, 217–240 (2013).

Deen, B. y col. Organización de la corteza visual de alto nivel en bebés humanos. Nat. Comun. 8, 13995 (2017).

Op de Beeck, H. P., Pillet, I. & amp Ritchie, J. B. Factores que determinan dónde emergen las áreas selectivas de categoría en la corteza visual. Trends Cogn. Sci. 23, 784–797 (2019).

Arcaro, M. J., Schade, P. F., Vincent, J. L., Ponce, C. R. y Livingstone, M. S. Ver caras es necesario para la formación de dominios faciales. Nat. Neurosci. 20, 1404–1412 (2017).

Olshausen, B. A. & amp Field, D. J. Surgimiento de las propiedades del campo receptivo de células simples al aprender un código escaso para imágenes naturales. Naturaleza 381, 607–609 (1996).

Simoncelli, E. P. & amp Olshausen, B. A. Estadísticas de imágenes naturales y representación neuronal. Annu. Rev. Neurosci. 24, 1193–1216 (2001).

Friston, K. J. El principio de la energía libre: ¿una teoría del cerebro unificada? Nat. Rev. Neurosci. 11, 127–138 (2010).

Kingma, D. P. & amp Welling, M. Bayes variacionales de codificación automática. Preimpresión en arXiv https://arxiv.org/abs/1312.6114 (2014).

Burgess, C. P. et al. MONet: descomposición y representación de escenas sin supervisión. Preimpresión en arXiv https://arxiv.org/abs/1901.11390 (2019).

Lillicrap, T. P., Cownden, D., Tweed, D. B. & amp Akerman, C. J. Los pesos de retroalimentación sináptica aleatoria apoyan la propagación inversa de errores para el aprendizaje profundo. Nat. Comun. 7, 13276 (2016).

Detorakis, G., Bartley, T. & amp Neftci, E. Aprendizaje hebbiano contrastante con pesos de retroalimentación aleatorios. Neural Netw. https://doi.org/10.1016/j.neunet.2019.01.008 (2019).

Saxe, A. Redes lineales profundas: una teoría del aprendizaje en el cerebro y la mente. Tesis, Universidad de Stanford. (2015).

Wenliang, L. K. & amp Seitz, A. R. Redes neuronales profundas para modelar el aprendizaje perceptivo visual. J. Neurosci. 38, 6028–6044 (2018).

Whittington, J. C. R. & amp Bogacz, R. Una aproximación del algoritmo de retropropagación de errores en una red de codificación predictiva con plasticidad sináptica local de Hebb. Computación neuronal. 29, 1229–1262 (2017).

Murphy, G. L. El gran libro de los conceptos (Prensa del MIT, 2002).

Graves, A. et al. Computación híbrida que utiliza una red neuronal con memoria externa dinámica. Naturaleza 538, 471–476 (2016).

Wayne, G. y col. Memoria predictiva no supervisada en un agente dirigido a objetivos. Preimpresión en arXiv https://arxiv.org/abs/1803.10760 (2018).

Moser, E. I., Kropff, E. y Moser, M.-B. Coloque celdas, celdas de cuadrícula y el sistema de representación espacial del cerebro. Annu. Rev. Neurosci. 31, 69–89 (2008).

Fee, M. S., Kozhevnikov, A. A. & amp Hahnloser, R. H. R. Mecanismos neuronales de generación de secuencias vocales en el pájaro cantor. Ana. N. Y. Acad. Sci. 1016, 153–170 (2004).

Hanes, D. P. & amp Schall, J. D. Control neuronal de la iniciación voluntaria del movimiento. Ciencias 274, 427–430 (1996).

Tenenbaum, J. B., Kemp, C., Griffiths, T. L. & amp Goodman, N. D. Cómo hacer crecer una mente: estadísticas, estructura y abstracción. Ciencias 331, 1279–1285 (2011).

Tervo, D. G. R., Tenenbaum, J. B. & amp Gershman, S. J. Hacia la implementación neuronal del aprendizaje de estructuras. Curr. Opin. Neurobiol. 37, 99–105 (2016).

Behrens, T. E. J. et al. ¿Qué es un mapa cognitivo? Organizar el conocimiento para un comportamiento flexible. Neurona 100, 490–509 (2018).

Penn, D. C., Holyoak, K. J. y Povinelli, D. J. El error de Darwin: explicar la discontinuidad entre las mentes humanas y no humanas. Behav. Brain Sci. 31, 109–130 (2008).

Schuck, N. W. & amp Niv, Y. Reproducción secuencial de estados de tareas no espaciales en el hipocampo humano. Ciencias 364, eaaw5181 (2019).

Kurth-Nelson, Z., Economides, M., Dolan, R. J. & amp Dayan, P. Secuencias rápidas de representaciones de estados no espaciales en humanos. Neurona 91, 194–204 (2016).

Liu, Y., Dolan, R. J., Kurth-Nelson, Z. & amp Behrens, T. E. J. La reproducción humana reorganiza espontáneamente la experiencia. Celda 178, 640–652.e14 (2019).

Barron, H. C. et al. Desenmascarar conexiones inhibitorias latentes en la corteza humana para revelar recuerdos corticales latentes. Neurona 90, 191–203 (2016).

Koolschijn, R. S. et al. El hipocampo y los engramas inhibidores neocorticales protegen contra la interferencia de la memoria. Neurona 101, 528–541.e6 (2019).

Doeller, C. F., Barry, C. & amp Burgess, N. Evidencia de celdas de cuadrícula en una red de memoria humana. Naturaleza 463, 657–661 (2010).

Constantinescu, A. O., OReilly, J. X. & amp Behrens, T. E. J. Organización del conocimiento conceptual en humanos con un código en forma de cuadrícula. Ciencias 352, 1464–1468 (2016).

Tsividis, P. A., Pouncy, T., Xu, J., Tenenbaum, J. B. & amp Gershman, S. J. Aprendizaje humano en Atari (AAAI, 2017).

Schapiro, A. C., Rogers, T. T., Cordova, N. I., Turk-Browne, N. B. & amp Botvinick, M. M. Las representaciones neuronales de eventos surgen de la estructura de la comunidad temporal. Nat. Neurosci. 16, 486–492 (2013).

O’Keefe, J. & amp Dostrovsky, J. El hipocampo como mapa espacial. Evidencia preliminar de la actividad unitaria en la rata que se mueve libremente. Brain Res. 34, 171–175 (1971).

Baraduc, P., Duhamel, J.-R. & amp Wirth, S. Células de esquema en el hipocampo de macacos. Ciencias 363, 635–639 (2019).

Miyashita, Y. Correlación neuronal de la memoria asociativa visual a largo plazo en la corteza temporal de primates. Naturaleza 335, 817–820 (1988).

Garvert, M. M., Dolan, R. J. & amp Behrens, T. E. Un mapa del conocimiento relacional abstracto en la corteza entorrinal hipocampal humana. eLife 6, e17086 (2017).

Schapiro, A. C., Kustner, L. V. & amp Turk-Browne, N. B. Modelado de representaciones de objetos en el lóbulo temporal medial humano basado en regularidades temporales. Curr. Biol. 22, 1622–1627 (2012).

Schapiro, A. C., Turk-Browne, N. B., Norman, K. A. & amp Botvinick, M. M. Aprendizaje estadístico de la estructura de la comunidad temporal en el hipocampo :. Hipocampo 26, 3–8 (2016).

Schlichting, M. L., Mumford, J. A. & amp Preston, A. R. Los cambios representacionales relacionados con el aprendizaje revelan firmas de integración y separación disociables en el hipocampo y la corteza prefrontal. Nat. Comun. 6, 8151 (2015).

Zeithamova, D., Dominick, A. L. & amp Preston, A. R. La activación prefrontal medial del hipocampo y ventral durante el aprendizaje mediado por recuperación apoya la inferencia novedosa. Neurona 75, 168–179 (2012).

Park, S. A., Miller, D. S., Nili, H., Ranganath, C. & amp Boorman, E. D. Elaboración de mapas: construcción, combinación e inferencia de mapas cognitivos abstractos. Neurona 107, 1226–1238.e8 (2020).

Kumaran, D., Banino, A., Blundell, C., Hassabis, D. & amp Dayan, P. Cálculos que subyacen al aprendizaje de la jerarquía social: distintos mecanismos neuronales para actualizar y representar información de relevancia personal. Neurona 92, 1135–1147 (2016).

Baram, A. B., Muller, T. H., Nili, H., Garvert, M. & amp Behrens, T. E. J. Cortezas prefrontales entorrinales y ventromediales abstraen y generalizan la estructura de los problemas de aprendizaje por refuerzo. Preimpresión en bioRxiv https://doi.org/10.1101/827253 (2019).

Dolan, R. J. y Dayan, P. Metas y hábitos en el cerebro. Neurona 80, 312–325 (2013).

Higgins, I. et al. Aprendizaje temprano de conceptos visuales con aprendizaje profundo sin supervisión. Preimpresión en arXiv https://arxiv.org/abs/1606.05579 (2016).

Higgins, I. et al. SCAN: aprendizaje de conceptos visuales composicionales jerárquicos. Preimpresión en arXiv https://arxiv.org/abs/1707.03389 (2018).

Hessel, M. y col. Rainbow: combinando mejoras en el aprendizaje por refuerzo profundo (AAAI, 2018).

Stachenfeld, K. L., Botvinick, M. M. & amp Gershman, S. J. Principios de diseño del mapa cognitivo del hipocampo. En t. Conf. Información neuronal. Proceso. Syst. 2, 2528–2536 (2014).

Whittington, J. C. et al. La máquina Tolman-Eichenbaum: unificando el espacio y la memoria relacional a través de la generalización en la formación del hipocampo. Preimpresión en bioRxiv https://doi.org/10.1101/770495 (2019).

Bellmund, J. L. S., Gärdenfors, P., Moser, E. I. & amp Doeller, C. F. Navegando la cognición: códigos espaciales para el pensamiento humano. Ciencias 362, eaat6766 (2018).

Cueva, C. J. y Wei, X.-X. Aparición de representaciones en forma de cuadrícula mediante el entrenamiento de redes neuronales recurrentes para realizar la localización espacial. Preimpresión en arXiv https://arxiv.org/abs/1803.07770 (2018).

Banino, A. et al. Navegación basada en vectores utilizando representaciones en forma de cuadrícula en agentes artificiales. Naturaleza 557, 429–433 (2018).

Parisi, G. I., Kemker, R., Part, J. L., Kanan, C. & amp Wermter, S. Aprendizaje continuo de por vida con redes neuronales: una revisión. Neural Netw. 113, 54–71 (2019).

Schapiro, A. C., Turk-Browne, N. B., Botvinick, M. M. & amp Norman, K. A. Sistemas de aprendizaje complementarios dentro del hipocampo: un enfoque de modelado de redes neuronales para reconciliar la memoria episódica con el aprendizaje estadístico. Phil. Trans. R. Soc. B 372, 20160049 (2017).

Francés, R. Olvido catastrófico en redes conexionistas. Trends Cogn. Sci. 3, 128–135 (1999).

McCloskey, M. & amp Cohen, N. J. Interferencia catastrófica en redes conexionistas: el problema del aprendizaje secuencial. en Psicología del aprendizaje y la motivación Vol. 24 109-165 (académico, 1989).

McClelland, J. L., McNaughton, B. L. & amp O’Reilly, R. C. Por qué hay sistemas de aprendizaje complementarios en el hipocampo y el neocórtex: conocimientos de los éxitos y fracasos de los modelos conexionistas de aprendizaje y memoria. Psychol. Rvdo. 102, 419–457 (1995).

O'Reilly, R. C., Bhattacharyya, R., Howard, M. D. & amp Ketz, N. Sistemas de aprendizaje complementarios. Cogn. Sci. 38, 1229–1248 (2014).

Tulving, E. Memoria episódica: de la mente al cerebro. Annu. Rev. Psychol. 53, 1–25 (2002).

Carr, M. F., Jadhav, S. P. & amp Frank, L. M. Reproducción del hipocampo en el estado de vigilia: un sustrato potencial para la consolidación y recuperación de la memoria. Nat. Neurosci. 14, 147–153 (2011).

Zola-Morgan, S. & amp Squire, L. La formación del hipocampo de primates: evidencia de un papel limitado en el tiempo en el almacenamiento de la memoria. Ciencias 250, 288–290 (1990).

Yonelinas, A. P. La naturaleza del recuerdo y la familiaridad: una revisión de 30 años de investigación. J. Mem. Lang. 46, 441–517 (2002).

van de Ven, G. M. & amp Tolias, A. S. Reproducción generativa con conexiones de retroalimentación como estrategia general para el aprendizaje continuo. Preimpresión en arXiv https://arxiv.org/abs/1809.10635 (2019).

Kumaran, D., Hassabis, D. & amp McClelland, J. L. ¿Qué sistemas de aprendizaje necesitan los agentes inteligentes? Actualización de la teoría de los sistemas complementarios de aprendizaje. Trends Cogn. Sci. 20, 512–534 (2016).

Qian, T. & amp Aslin, R. N. Aprender paquetes de estímulos hace que el orden de los estímulos sea una señal, no una confusión. Proc. Natl Acad. Sci. Estados Unidos 111, 14400–14405 (2014).

Collins, A. G. E. & amp Frank, M. J. Control cognitivo sobre el aprendizaje: creación, agrupación y generalización de la estructura del conjunto de tareas. Psychol. Rvdo. 120, 190–229 (2013).

Kirkpatrick, J. y col. Superar el olvido catastrófico en las redes neuronales. Proc. Natl Acad. Sci. Estados Unidos 114, 3521–3526 (2017).

Zenke, F., Poole, B. & amp Ganguli, S. Aprendizaje continuo a través de la inteligencia sináptica. Proc. Mach. Aprender. Res. 70, 3987–3995 (2017).

Masse, N. Y., Grant, G. D. & amp Freedman, D. J. Aliviar el olvido catastrófico mediante el uso de puerta dependiente del contexto y estabilización sináptica. Proc. Natl Acad. Sci. Estados Unidos 115, E10467 – E10475 (2018).

Zeng, G., Chen, Y., Cui, B. & amp Yu, S. Aprendizaje continuo del procesamiento dependiente del contexto en redes neuronales. Nat. Mach. Intell. 1, 364–372 (2019).

Bouchacourt, F., Palminteri, S., Koechlin, E. & amp Ostojic, S. Fragmentación temporal como mecanismo para el aprendizaje no supervisado de conjuntos de tareas. eLife 9, e50469 (2020).

Harvey, C. D., Coen, P. & amp Tank, D. W. Secuencias específicas de elección en la corteza parietal durante una tarea de decisión de navegación virtual. Naturaleza 484, 62–68 (2012).

Rule, M. E., O'Leary, T. & amp Harvey, C. D. Causas y consecuencias de la deriva representacional. Curr. Opin. Neurobiol. 58, 141–147 (2019).

Musslick, S. et al. Capacidad multitarea versus eficiencia de aprendizaje en arquitecturas de redes neuronales. en Reunión anual de la Sociedad de Ciencias Cognitivas 829–834 (Sociedad de Ciencias Cognitivas, 2017).

Bahri, Y. et al. Mecánica estadística del aprendizaje profundo. Annu. Rev. Condens. Matter Phys. 11, 501–528 (2020).

Saxe, A. M., McClelland, J. L. & amp Ganguli, S. Una teoría matemática del desarrollo semántico en redes neuronales profundas. Proc. Natl Acad. Sci. Estados Unidos 116, 11537–11546 (2019).

Saxe, A. M., McClelland, J. L. & amp Ganguli, S. Soluciones exactas a la dinámica no lineal del aprendizaje en redes neuronales lineales profundas. Preimpresión en arXiv https://arxiv.org/abs/1312.6120 (2014).

Seung, H. S., Sompolinsky, H. & amp Tishby, N. Mecánica estadística del aprendizaje a partir de ejemplos. Phys. Rev. A 45, 6056–6091 (1992).

Goldt, S., Advani, M. S., Saxe, A. M., Krzakala, F. & amp Zdeborová, L.Dinámica del descenso de gradiente estocástico para redes neuronales de dos capas en la configuración profesor-alumno. NeurIPS Proc. (2019).

Jacot, A., Gabriel, F. & amp Hongler, C.Núcleo tangente neuronal: convergencia y generalización en redes neuronales. NeurIPS Proc. (2018).

Lee, J. y col. Las redes neuronales amplias de cualquier profundidad evolucionan como modelos lineales bajo pendiente de gradiente. NeurIPS Proc. (2019).

Advani, M. S. & amp Saxe, A. M. Dinámica de alta dimensión del error de generalización en redes neuronales. Preimpresión en arXiv https://arxiv.org/abs/1710.03667 (2017).

Krogh, A. & amp Hertz, J. A. Generalización en un perceptrón lineal en presencia de ruido. J. Phys. Matemáticas. Gen. 25, 1135–1147 (1992).

Dauphin, Y. et al. Identificar y atacar el problema del punto silla en la optimización no convexa de alta dimensión. NeurIPS Proc. (2014).

Carey, S. Précis de "El origen de los conceptos". Behav. Brain Sci. 34, 113–124 (2011).

Rogers, T. T. y McClelland, J. L. Cognición semántica: un enfoque de procesamiento distribuido paralelo (Prensa del MIT, 2004).

Walker, E. Y. et al. Los bucles de inicio descubren qué es lo que más excita a las neuronas utilizando modelos predictivos profundos. Nat. Neurosci. 22, 2060–2065 (2019).

Schoups, A., Vogels, R., Qian, N. & amp Orban, G. La práctica de la identificación de la orientación mejora la codificación de la orientación en las neuronas V1. Naturaleza 412, 549–553 (2001).

Belkin, M., Hsu, D., Ma, S. & amp Mandal, S. Reconciliación de la práctica moderna del aprendizaje automático y el equilibrio clásico entre sesgo y varianza. Proc. Natl Acad. Sci. Estados Unidos 116, 15849–15854 (2019).


2 Modelo de memoria asociativa

En esta sección, presentamos nuestra notación principal, el modelo de memorias asociativas y ruido. También explicamos los algoritmos de recuperación.

2.1 Notación y estructura básica

En nuestro modelo, una neurona puede asumir un estado de valor entero del conjunto ⁠, interpretado como la tasa de activación a corto plazo de las neuronas. Una neurona actualiza su estado en función de los estados de su vecina de la siguiente manera. Primero calcula una suma ponderada ⁠, donde wI es el peso del enlace de sI y es el ruido interno, y luego aplica una función no lineal a h.

Una memoria asociativa está representada por un gráfico bipartito ponderado, GRAMO, con neuronas de patrón y neuronas de restricción. Cada patrón es un vector de longitud norte, donde ⁠, ⁠. Siguiendo a Karbasi et al. (2013), la atención se centra en recordar patrones con una fuerte correlación local entre las entradas. Por lo tanto, dividimos las entradas de cada patrón. X dentro L subpatrones superpuestos de longitudes ⁠. Debido a las superposiciones, una neurona patrón puede ser miembro de múltiples subpatrones, como se muestra en la Figura 1a. los IEl subpatrón se denota ⁠, y se supone que las correlaciones locales están en forma de subespacios, es decir, los subpatrones forman un subespacio de dimensión ⁠.


2 Modelo de memoria asociativa

En esta sección, presentamos nuestra notación principal, el modelo de memorias asociativas y ruido. También explicamos los algoritmos de recuperación.

2.1 Notación y estructura básica

En nuestro modelo, una neurona puede asumir un estado de valor entero del conjunto ⁠, interpretado como la tasa de activación a corto plazo de las neuronas. Una neurona actualiza su estado en función de los estados de su vecina de la siguiente manera. Primero calcula una suma ponderada ⁠, donde wI es el peso del enlace de sI y es el ruido interno, y luego aplica una función no lineal a h.

Una memoria asociativa está representada por un gráfico bipartito ponderado, GRAMO, con neuronas de patrón y neuronas de restricción. Cada patrón es un vector de longitud norte, donde ⁠, ⁠. Siguiendo a Karbasi et al. (2013), la atención se centra en recordar patrones con una fuerte correlación local entre las entradas. Por lo tanto, dividimos las entradas de cada patrón. X dentro L subpatrones superpuestos de longitudes ⁠. Debido a las superposiciones, una neurona patrón puede ser miembro de múltiples subpatrones, como se muestra en la Figura 1a. los IEl subpatrón se denota ⁠, y se supone que las correlaciones locales tienen la forma de subespacios, es decir, los subpatrones forman un subespacio de dimensión ⁠.


Cómo utilizar Chunking

La próxima vez que intente recordar elementos de una lista, comience por formarlos en grupos. Si está trabajando con una lista de palabras de vocabulario, por ejemplo, puede crear pequeños grupos de palabras que sean similares o relacionadas entre sí. Una lista de compras se puede dividir en grupos más pequeños en función de si los artículos de la lista son verduras, frutas, productos lácteos o cereales.

La fragmentación se puede utilizar como un potenciador de la memoria diaria, pero los investigadores también han descubierto que puede mejorar su capacidad para fragmentar la información de forma eficaz.

Bor relata la historia de un participante en un experimento de memoria que se desafió a sí mismo a mejorar la cantidad de elementos que podía recordar. Si bien inicialmente pudo recordar siete elementos, aumentó esto a 80 unidades de información en el transcurso de 20 meses. Dedicaba una hora al día, aproximadamente cuatro días a la semana a esta tarea.

Si bien es posible que no pueda dedicar una concentración tan intensa a mejorar su memoria, hay cosas que puede hacer para aprovechar al máximo la tendencia natural de su cerebro a buscar patrones e información grupal.

Práctica

Desafíate a recordar una serie de elementos, ya sea tu lista de compras, palabras de vocabulario o fechas importantes. A medida que mejore su capacidad para recordar grandes cantidades de información, desafíese a recordar aún más.

Busque conexiones

Mientras crea agrupaciones, busque formas de relacionar las unidades entre sí de manera significativa. ¿Qué tienen en común los elementos? Puede agrupar elementos porque cada uno está escrito con cuatro letras, porque comienzan con la misma letra o porque comparten un propósito similar.

Hacer asociaciones

Vincular grupos de elementos a cosas de su memoria también puede ayudar a que sean más memorables.Es más probable que recuerde que necesita huevos, bicarbonato de sodio y chispas de chocolate si asocia los elementos con las deliciosas galletas que solía hacer su madre.

Incorporar otras estrategias de memoria

Por ejemplo, puede usar mnemónicos como una forma de fragmentar diferentes unidades de información. Si va al supermercado y necesita plátanos, huevos, nectarinas y té, puede crear una palabra con las primeras letras de cada artículo que necesite: BENT. Una vez que recuerde la palabra clave, podrá recordar mejor los elementos representados por cada letra del acrónimo.


Ver el vídeo: PSICOLOGÍA - Memoria Ciclo FREE (Agosto 2022).