Estimación de la entropía durante la transición conformacional del lazo 36 de la hemaglutinina

Klever David Cajamarca Sacta; Laura Esther Muñoz Escobar; Sandra Elizabeth Tenelanda Cudco; Norma Isabel Allauca Sandoval

��

Estimaci�n de la entrop�a durante la transici�n conformacional del lazo 36 de la hemaglutinina

Estimation of entropy during the conformational transition of loop 36 of hemagglutinin

Estimativa da entropia durante a transi��o conformacional da al�a 36 da hemaglutinina

Correspondencia: klever.cajamarca@unach.edu.ec

Ciencias de la Educaci�n

Art�culo de Investigaci�n

* Recibido: 10 de marzo de 2024 *Aceptado: 09 de abril de 2024 * Publicado: �22 de mayo de 2024

I. Facultad Ciencias de la Educaci�n, Humanas y Tecnolog�as, Pedagog�a de las Ciencias Experimentales Matem�ticas y la F�sica, Universidad Nacional de Chimborazo, Riobamba, Ecuador.

II. Facultad Ciencias de la Educaci�n, Humanas y Tecnolog�as, Pedagog�a de las Ciencias Experimentales Matem�ticas y la F�sica, Universidad Nacional de Chimborazo, Riobamba, Ecuador.

III. Facultad Ciencias de la Educaci�n, Humanas y Tecnolog�as, Pedagog�a de las Ciencias Experimentales Matem�ticas y la F�sica, Universidad Nacional de Chimborazo, Riobamba, Ecuador.

IV. Facultad Ciencias de la Educaci�n, Humanas y Tecnolog�as, Pedagog�a de las Ciencias Experimentales Matem�ticas y la F�sica, Universidad Nacional de Chimborazo, Riobamba, Ecuador.

Resumen

La evoluci�n de la entrop�a durante la transici�n entre las conformaciones no-fusog�nica y fusog�nica del lazo 36 de la cadena HA2 de la Hemaglutinina ha sido estudiada utilizando trayectorias de simulaciones de din�mica molecular y la llamada aproximaci�n quasi-arm�nica. Para el c�lculo de la entrop�a de las conformaciones intermedias se aplic� un an�lisis de componentes principales al conjunto de estructuras asociadas a cada conformaci�n. Las varianzas de estas componentes principales pueden considerarse asociadas a un conjunto de osciladores independientes cuya entrop�a puede calcularse. Los valores de entrop�a obtenidos se encuentran en el orden de 17 kcal/mol K, los cuales son mayores en un orden de magnitud a los resultados obtenidos en trabajos anteriores. Adicionalmente, se comprob� que el t�rmino -TS contribuye de forma no despreciable a la energ�a libre. El t�rmino de energ�a interna se estim� a partir del promedio sobre el ensamble, aplicado sobre las trayectorias de din�mica molecular de equilibrar�an para cada conformaci�n intermedia, como resultado la altura de la barrera energ�tica para la transici�n se estim� en 189.75 kcal/mol.

Palabras clave: Hemaglutinina; Entrop�a; Aproximaci�n Quasi-Arm�nica; Din�mica Molecular.

Abstract

The evolution of entropy during the transition between the non-fusogenic and fusogenic conformations of loop 36 of the HA2 chain of Hemagglutinin has been studied using trajectories of molecular dynamics simulations and the so-called quasi-harmonic approximation. To calculate the entropy of the intermediate conformations, a principal component analysis was applied to the set of structures associated with each conformation. The variances of these principal components can be considered associated with a set of independent oscillators whose entropy can be calculated. The entropy values obtained are in the order of 17 kcal/mol K, which are greater by an order of magnitude than the results obtained in previous works. Additionally, it was proven that the -TS term contributes in a non-negligible way to the free energy. The internal energy term was estimated from the average over the ensemble, applied to the equilibrium molecular dynamics trajectories for each intermediate conformation, as a result the height of the energy barrier for the transition was estimated at 189.75 kcal/mol.

Keywords: Hemagglutinin; Entropy; Quasi-Harmonic Approach; Molecular Dynamics.

Resumo

A evolu��o da entropia durante a transi��o entre as conforma��es n�o fusog�nicas e fusog�nicas da al�a 36 da cadeia HA2 da Hemaglutinina foi estudada usando trajet�rias de simula��es de din�mica molecular e a chamada aproxima��o quase harm�nica. Para calcular a entropia das conforma��es intermedi�rias, foi aplicada uma an�lise de componentes principais ao conjunto de estruturas associadas a cada conforma��o. As vari�ncias destes componentes principais podem ser consideradas associadas a um conjunto de osciladores independentes cuja entropia pode ser calculada. Os valores de entropia obtidos s�o da ordem de 17 kcal/mol K, valores que s�o uma ordem de grandeza superiores aos resultados obtidos em trabalhos anteriores. Adicionalmente, foi comprovado que o termo -TS contribui de forma n�o desprez�vel para a energia livre. O termo de energia interna foi estimado a partir da m�dia do conjunto, aplicada �s trajet�rias de din�mica molecular de equil�brio para cada conforma��o intermedi�ria, como resultado a altura da barreira de energia para a transi��o foi estimada em 189,75 kcal/mol.

Palavras-chave: Hemaglutinina; Entropia; Abordagem Quase Harm�nica; Din�mica Molecular.

Introducci�n

La Hemaglutinina (HA) es una prote�na presente en la superficie del virus de la influenza, siendo parte fundamental del mecanismo de adhesi�n y fusi�n del virus a la membrana celular (Bullough et al., 1994; Carr y Kim, 1993). La Hemaglutinina est� formada por dos subunidades HA1 y HA2. La estructura molecular de la Hemaglutinina ha sido caracterizada completamente de forma experimental (Bullough et al., 1994; Sauter et al., 1992), y la informaci�n completa de su composici�n y estructura molecular se encuentran libremente disponibles en el Protein Data Bank (PDB) (Berman et al., 2000) tanto para la configuraci�n no-fusog�nica como para la fusog�nica.

Figura 1: (A) La Hemaglutinina, on sus subunidades HA1 y HA2, el lazo 36 se encuentra en la subunidad HA, imagen generada mediante el software VMD a partir del registro 1HTM del PDB. (B) La Hemaglutinina en la superficie del virus de la influenza

De particular inter�s resulta la din�mica del cambio conformacional que sufre el llamado Lazo 36, el cual corresponde a la regi�n comprendida entre los residuos 54 y 89 de la cadena HA. El modelo con mayor aceptaci�n para la descripci�n de la transici�n conformacional es el conocido como Spring-Loaded (Carr y Kim, 1993) el cual plantea que la estructura nativa de la Hemaglutinina est� atrapada en un estado metaestable, y que la disminuci�n del pH la desestabiliza produciendo la transici�n. El cambio ocurre desde su conformaci�n inicial no-fusog�nica a pH 7 hasta una conformaci�n final fusog�nica a pH 5. Se ha planteado que el movimiento lineal producido por esta transici�n conformacional, pueda ser aprovechado como un nanomotor lineal (Banta et al., 2007; Dubey et al., 2003).

Figura 2: Estructura Secundaria del Lazo 36: (A) Conformaci�n no-fusog�nica a pH 7, imag�n generada a partir del registro 1HGF del PDB utilizando el software VMD. (B) Conformaci�n fusog�nica a pH 5, imagen generada a partir del registro 1HTM del PDB,

La transici�n conformacional del lazo 36 de la Hemaglutinina es un proceso que, por su simplicidad, permite estudiar el plegado prote�nico. Los detalles at�micos de la transici�n accesibles directamente con las simulaciones de din�mica molecular, permiten el c�lculo de la energ�a, as� como de la entrop�a involucradas en el proceso. Esta informaci�n permitir� establecer relaciones cuantitativas entre estas dos magnitudes durante un proceso de plegado. Adicionalmente, el entendimiento de los mecanismos at�micos asociados a la transici�n conformacional del lazo 36 de la Hemaglutinina tiene potenciales aplicaciones biom�dicas y biotecnol�gicas.

En un trabajo precedente se utiliz� simulaciones TMD para explorar la transici�n del lazo 36 (Calder�n, 2015). A partir de la trayectoria obtenida se aplic� an�lisis de grupos para identificar posibles conformaciones intermedias, obteni�ndose 13 grupos. A partir de estos datos se realiz� una descripci�n estad�stica del proceso, la cual estim� la entrop�a con un m�todo simple de conteo de estados accesibles. Por ello se consider� necesario un an�lisis alternativo de los datos.

En este trabajo, se realiz� un nuevo an�lisis de los datos, tanto para la trayectoria TMD como para las trayectorias de equilibraci�n de cada conformaci�n intermedia. Para este nuevo an�lisis en primer lugar se compar� los resultados del m�todo de agrupamiento desarrollado en (Calder�n, 2015) con los resultados de un agrupamiento basado en la similitud de estructuras secundarias en el espacio de Ramachandran, posteriormente se estim� la entrop�a del lazo 36 de la HA utilizando el m�todo de la Aproximaci�n Quasi-Arm�nica y finalmente caracteriz� la barrera energ�tica asociada a la transici�n conformacional.

Metodolog�a

Estructuras

En el trabajo de Calder�n J., se realiz� una simulaci�n de din�mica molecular tipo TMD, donde la estructura del lazo 36 en su conformaci�n no-fusog�nica se utiliz� como estructura inicial, y como estructura final u objetivo se utiliz� la estructura fusog�nica. Esta simulaci�n produjo una trayectoria compuesta por 10000 estructuras. Las estructuras de la trayectoria TMD fueron sometidas a un an�lisis de grupos, obteni�ndose 13 conformaciones intermedias correspondientes a 11 conformaciones representativas, cuyas estructuras representativas se muestran en la fig. 3, adem�s de las conformaciones correspondientes a la conformaci�n no-fusog�nica y fusog�nica.

Figura 3: Las 11 estructuras representativas intermedias identificadas en (Calder�n, 2015), imagen reproducida del trabajo citado.

Para la simulaci�n de equilibraci�n, se parti� de las estructuras representativas de cada conformaci�n, las cuales se dejaron evolucionar mediante din�mica molecular, durante un tiempo total de 6 ns, con condiciones de frontera esf�ricas. Estas trayectorias son las que se utilizar�n para el c�lculo de la entrop�a. Cada trayectoria tiene un total de 12000 estructuras, correspondiendo cada estructura a 20 ps de tiempo en la equilibraci�n.

Mapas de Ramachandran

Los �ngulos de Ramachandran (Ramachandran et al., 1968) representan la orientaci�n de los amino�cidos unidos mediante enlaces pept�dicos en un polip�ptido o prote�na. Estos �ngulos permiten describir las rotaciones del backbone o esqueleto� del polip�ptido en torno a los enlaces N-Ca (llamado f) y Ca-C (llamado y).

La representaci�n en un plano de f vs y, se conoce como mapa de Ramachandran,� y permite observar la distribuci�n de los �ngulos de torsi�n en una estructura de la prote�na. Tambi�n proporciona una visi�n general de las regiones excluidas, que muestran que ciertas rotaciones del polip�ptido no est�n permitidas, debido a las interacciones entre los �tomos de los amino�cidos. Finalmente, en el mapa de Ramachandran se pueden identificar regiones correspondientes a motivos de la estructura secundaria de una prote�na, tal como las regiones correspondientes a los denominados a-h�lices y hojas-b.

El pol�gono que encierra a la regi�n correspondiente a un a-h�lice en el mapa de Ramachandran est� determinada por los puntos indicados en la siguiente tabla (Br�nd�n y Tooze, 1999)

Tabla 1: Puntos del pol�gono que encierra la regi�n correspondiente a un

a-h�lice en el mapa de Ramachandran (Br�nd�n y Tooze, 1999).

f [grados]	y [grados]
-180,0	-34,9
-164,3	-42,9
-133,0	-42,9
-109,4	-32,2
-106,9	-21,4
-44,3	-21,4
-44,3	-71,1
-180,0	-71,1

Aproximaci�n Quasi-Arm�nica

Dado que no existe un m�todo exacto para calcular la entrop�a de una biomol�cula a partir de los datos de din�mica molecular, es necesario realizar una estimaci�n de la misma. La estrategia que su utiliz� en este trabajo para estimar la entrop�a, es la llamada Aproximaci�n Quasi-Arm�nica (QHA) (Karplus y Kushick, 1981), la cual provee un l�mite superior a la entrop�a conformacional de una biomol�cula en t�rminos de osciladores arm�nicos independientes asociados a sus grados de libertad, identificados con un an�lisis de componentes principales (Jolliffe, 1986).

El An�lisis de Componentes Principales es una t�cnica estad�stica, utilizada para analizar datos multivariantes. Los objetivos pr�cticos de la utilizaci�n del an�lisis de componentes principales han sido enumerados en (Jeffers, 1967), siendo de inter�s examinar la correlaci�n entre las variables de un conjunto de datos, ya que para la aplicaci�n de la aproximaci�n quasi-arm�nica para el c�lculo de la entrop�a es necesario tener variables no-correlacionadas.

Componentes principales de una macromol�cula derivadas de trayectorias de din�mica molecular

A partir de trayectorias de simulaciones de din�mica molecular, en las cuales se han eliminado los �tomos del solvente, se puede plantear una matriz de trayectoria R la cual tiene dimensiones 3Na x nf siendo Na el n�mero de �tomos y nf la cantidad de trayectorias de simulaci�n que se consideran para el an�lisis, es decir:

A partir de trayectorias de simulaciones de din�mica molecular, en las cuales se han eliminado los �tomos del solvente, se puede plantear una matriz de trayectoria R la cual tiene dimensiones 3Na x n_f siendo Na el n�mero de �tomos y n_f la cantidad de trayectorias de simulaci�n que se consideran para el an�lisis, es decir:

�� (1)

donde �corresponde a la estructura i-�sima, la cual contiene las coordenadas de cada �tomo, arregladas en un vector con 3Na componentes:

�� (2)

Para considerar las masas de los �tomos ubicados en cada posici�n , se aplic� a la matriz de trayectoria R la transformaci�n (Schlitter, 1993):

�� (3)

donde la matriz �de dimensiones 3Na x 3Na viene dada por la matriz diagonal conformada por la ra�z cuadrada de las masas de cada �tomo.

Sobre esta matriz �se aplica el an�lisis de componentes principales, para lo cual primero se obtiene la matriz de covarianza de :

�� (4)

Se aplica la descomposici�n de valor singular (SVD) a la matriz , obteniendo un conjunto de 3Na autovalores l, los cuales debido a la ponderaci�n realizada a trav�s de la matriz M contienen valores de masa que son combinaci�n de las originales (Schlitter, 1993; Schafer et al., 2000), por lo cual los autovalores pueden representarse de la forma:

��  (6)

donde cada autovalor �es la desviaci�n est�ndar de las componentes principales obtenidas, las cuales debido a la ponderaci�n realizada contienen un factor �el cual es una funci�n de las masas at�micas .

Frecuencias Asociadas a las Componentes Principales

Es un resultado conocido que para un sistema con desviaci�n est�ndar nula �y varianza conocida , el valor m�ximo de la entrop�a se presenta cuando las energ�as y las varianzas para cada estado son proporcionales, excepto por una constante aditiva. Esta condici�n es satisfecha por el Hamiltoniano de un oscilador arm�nico (Schlitter, 1993; Schafer et al., 2000), es decir:

�� (7)

donde p es el momento can�nico asociado a x.

Para este tipo de sistemas es de inter�s encontrar la frecuencia a partir de la varianza . Para ello se puede utilizar la siguiente aproximaci�n (Schlitter, 1993):

�� (8)

Est� expresi�n se cumple tambi�n en el r�gimen cl�sico, debido al teorema de equipartici�n.

Una generalizaci�n propuesta para el caso n-dimensional es a trav�s de la matriz de covarianza (Schlitter, 1993), de forma que la expresi�n anterior se puede representar como:

�� (9)

Las varianzas �pueden estimarse con simulaciones de din�mica molecular del sistema. Este tipo de simulaciones de din�mica molecular, se realizan usualmente en un sistema de coordenadas cartesiano, por lo cual varias de sus coordenadas estar�n correlacionadas. Con el fin de obtener una transformaci�n de coordenadas, las cuales sean independientes, se puede aplicar una transformaci�n ortogonal, tal como el an�lisis de coordenadas principales, las cuales adem�s est�n ordenadas desde la que contiene la mayor cantidad de varianza del sistema, hasta la que contiene la menor, de forma que:

�� (10)

Esta expresi�n corresponde a la hip�tesis fundamental de la aproximaci�n Quasi-Arm�nica, la cual considera que los autovalores obtenidos a partir del an�lisis de componentes principales, corresponden a un conjunto de osciladores arm�nicos cu�nticos no-correlacionados (Meirovitch et al., 2009; Bar�n et al., 2009).

Desarrollando la ecuaci�n anterior, para cada autovalor se puede obtener una frecuencia :

�� (11)

La �ltima ecuaci�n asigna un valor de frecuencia a cada autovalor obtenido mediante el an�lisis de componentes principales.

Estimaci�n de la Entrop�a

Las trayectorias disponibles, se encuentran en un formato binario (DCD), por lo cual se exportaron a coordenadas del tipo x,y,z, utilizando el software VMD (Humphrey et al., 1996), las coordenadas exportadas se organizaron en una matriz, utilizando el lenguaje de programaci�n Python (Van Rossum y Drake Jr., 1995), la estructura de la matriz es:

�� (13)

donde , i indica el n�mero de estructura y j el n�mero de �tomo, de forma que la matriz tiene dimensiones �, siendo �el n�mero de �tomos, y �el n�mero de estructuras en cada trayectoria de equilibraci�n.

Sobre la trayectoria de din�mica molecular de equilibraci�n representada por esta matriz se aplic� el an�lisis de componentes principales (PCA), mediante un script en R (R Core Team, 2015). A partir de los autovalores (desviaciones est�ndar) de las componentes principales obtenidas, se encontraron las frecuencias correspondientes a trav�s de la Aproximaci�n Quasi-Arm�nica, con estas frecuencias se estim� la entrop�a mediante la expresi�n (Schlitter, 1993; Schafer et al., 2000):

�� (12)

Energ�a libre de gibbs y barrera energ�tica

Para estimar la energ�a libre de Gibbs , se requiere de dos componentes, la diferencia de energ�a interna , y la contribuci�n de la entrop�a . La diferencia de energ�a interna puede obtenerse a partir de los valores de energ�a obtenidos durante las simulaciones de din�mica molecular, y la contribuci�n de la entrop�a se puede obtener a partir del valor calculado con el m�todo expuesto en la secci�n anterior.

Para describir la barrera energ�tica, se probaron coordenadas de reacci�n, que describan el comportamiento energ�tico durante la transici�n. Como candidato a coordenada de reacci�n se utiliz� la primera coordenada principal resultante de la aplicaci�n del PCA.� Otra posible coordenada es el RMSD entre las posiciones de los �tomos en las estructuras, calculado con respecto a la estructura inicial (no-fusog�nica), y a la estructura final (fusog�nica), el RMSD se calcul� mediante la herramienta "RMSD Calculator" disponible en el software VMD (Humphrey et al., 1996).

Resultados y discusi�n

An�lisis de Grupos en el Espacio de Ramachandran

Para explorar la posibilidad de la existencia de grupos adicionales, se realiz� un nuevo an�lisis de grupos sobre cada conjunto de estructuras de la trayectoria TMD clasificadas dentro de un grupo de acuerdo al criterio del RMSD, utilizando como par�metro la distancia eucl�dea de los �ngulos de torsi�n entre las estructuras del grupo. De forma que se obtuvieron 11 dendogramas, correspondientes a cada grupo, los cuales se muestran en la fig. 4.

Figura 4: Dendogramas para cada grupo.

A distancias de corte representativas, tales como 10, 12 y 14 grados, se obtiene un n�mero de grupos comparable para cada dendograma. Los resultados de este an�lisis se reportan en la siguiente tabla.

Tabla 2: N�mero de grupos para distancias de corte espec�ficas.

Grupo	Distancia de Corte
	14	12	10
	N�mero de Grupos
1	1	2	2
2	1	2	2
3	1	1	1
4	1	1	1
5	1	1	1
6	1	5	5
7	3	7	9
8	4	4	11
9	1	2	2
10	1	1	2
11	1	2	5

Se puede comprobar que los grupos 3,4 y 5 no tienen subgrupos para las distancias de corte consideradas, por ello se puede afirmar que est�n bien definidos de acuerdo a los dos criterios utilizados (RMSD y distancia en el espacio de Ramachandran). Por otra parte, los grupos 7 y 8 son los que m�s subgrupos presentan para las distancias de corte consideradas.

Entrop�a conformacional

Frecuencias de los osciladores arm�nicos

En la fig. 5, se muestran las frecuencias de los osciladores arm�nicos en la aproximaci�n Quasi-Arm�nica, correspondientes a las componentes principales, para cada una de las conformaciones intermedias.

��

Figura 5: Frecuencias de los osciladores arm�nicos de la aproximaci�n quasi-arm�nica, correspondientes a las componentes principales.

Figura 6: Histograma de las frecuencias de los osciladores arm�nicos correspondientes a las componentes principales, cada color est� asociado a una conformaci�n.

A partir de los histogramas, se puede observar que las frecuencias de los osciladores arm�nicos, se encuentran mayoritariamente en el rango entre �y . Considerando que la frecuencia de oscilaci�n de las vibraciones moleculares se encuentran en el orden de entre �y �(Barth, 2007; Dill y Broomberg, 2010) se puede observar que las frecuencias obtenidas son cercanas a este rango.

Por otra parte, en los histogramas se puede apreciar la presencia de frecuencias en un rango bajo, las cuales corresponden a las �ltimas frecuencias obtenidas mediante la aproximaci�n quasi-arm�nica, como se puede observar en la fig. 7.

Figura 7: Frecuencias de los �ltimos osciladores arm�nicos, correspondientes a las �ltimas componentes principales, los 6 �ltimos valores presentan una variaci�n significativa con respecto a los anteriores, para todos los grupos.

Para explicar la presencia de estas frecuencias, en primera instancia se analiz� la posibilidad de existencia de oscilaciones del centro de masa de la mol�cula, para lo cual se calcularon las posiciones del centro de masa a lo largo de la trayectoria TMD. Para caracterizar estas oscilaciones del centro de Masa, se procedi� a obtener la transformada de Fourier mediante el m�todo FFT de las posiciones del centro de masa, considerando adem�s que dado que se tiene en total 12000 estructuras correspondientes a 6 [ns] de tiempo de simulaci�n, el tiempo de muestreo ser�a de 500 [ps], lo cual nos permite obtener el rango de frecuencias para la FFT. Los resultados de este an�lisis se muestran en la fig. 8.

Figura 8: Transformada de Fourier de las coordenadas del centro de masa para la trayectoria de equilibraci�n de la conformaci�n no-Fusog�nica

A partir de la figura anterior, se puede observar que la mayor componente de frecuencia se encuentra en el rango entre �y , para cada coordenada analizada, lo cual permite explicar 3 de los 6 valores de la fig. 7.

Entrop�a Absoluta

Para estimar la entrop�a, a partir de las frecuencias de los osciladores arm�nicos de la aproximaci�n quasi-arm�nica, se utiliz� la ecuaci�n (ec. 12). Este procedimiento se realiz� para cada conformaci�n intermedia, obteni�ndose en total 13 valores de entrop�a, los cuales se encuentran en el orden de 17 [kcal/mol �K].

Figura 9: Entrop�a absoluta obtenida mediante la Aproximaci�n Quasi-Arm�nica, el valor m�ximo de entrop�a 18.021 [kcal/mol �K] ocurre para la conformaci�n 12 cuya estructura representativa es la 9240, en tanto que disminuye para la conformaci�n fusog�nica, aproxim�ndose al valor� 17.597 [kcal/mol �K] semejante al de la conformaci�n inicial (no-fusog�nica).

A partir de los valores obtenidos de entrop�a absoluta, se puede determinar la diferencia de entrop�a entre conformaciones, obteni�ndose 12 valores de diferencia de entrop�a, y tomando como valor de referencia el primer valor de entrop�a, el cual corresponde a la conformaci�n no-fusog�nica.

Figura 10: Diferencia de entrop�a entre conformaciones, tomando como referencia la entrop�a de la conformaci�n inicial (no-fusog�nica), el valor m�ximo de la diferencia de entrop�a es de 0.4622 [kcal/mol �K]

Energ�a Libre

A partir de la estimaci�n de la diferencia de entrop�a, cuyo resultado se present� en la secci�n anterior, se puede determinar el t�rmino de contribuci�n de la entrop�a a la energ�a libre , dada la temperatura T=300 K a la que se realiz� la din�mica molecular.

Figura 11. Contribuci�n de la entrop�a a la energ�a libre.

Energ�a interna en la trayectoria TMD

La energ�a interna se estim� utilizando el plugin �Namd-Energy� incluido en el software VMD (Humphrey et al., 1996), sobre la trayectoria TMD al igual que en (Calder�n, 2015). Como resultado se obtienen 10000 valores de energ�a, correspondientes a cada estructura de la trayectoria, como se muestra en la siguiente figura:

Figura 12. Energ�a interna U, estimada a partir de la trayectoria TMD.

Para el an�lisis se tom� el valor de la energ�a interna para la estructura representativa de cada grupo, a�adi�ndole la contribuci�n de la entrop�a, para as� obtener la energ�a libre de Gibbs; los resultados de esta aproximaci�n se muestran en la siguiente figura:

Figura 13: Energ�a libre de Gibbs, estimada utilizando la energ�a interna de la estructura representativa, obtenida a partir de la trayectoria TMD.

Se puede observar, que el valor m�ximo de energ�a libre 74 [kcal/mol] se presenta para el grupo 1(538), y se mantiene relativamente estable, despu�s se reduce dr�sticamente, hasta el m�nimo -280.77 [kcal/mol] en la estructura correspondiente al grupo 11(9240), despu�s incrementa levemente hasta la estructura correspondiente a la conformaci�n fusog�nica.

Estimaci�n utilizando las trayectorias de equilibraci�n para cada conformaci�n intermedia

Para estimar la energ�a interna, se utilizaron las trayectorias de equilibraci�n para cada grupo, suponiendo que todas las estructuras son equivalentes y por tanto pertenecientes a una conformaci�n, de forma que cada trayectoria se puede considerar como un ensamble, y por tanto la energ�a interna se puede estimar mediante la siguiente expresi�n (Thijssen, 2007):

�� (14)

donde M es el total de estructuras en el ensamble (trayectoria), y n es la n-�sima estructura.

Para el an�lisis, resulta conveniente tomar un subconjunto de estructuras de la trayectoria de equilibraci�n, las que tengan un valor de RMSD estable, para lo cual resulta conveniente analizar el RMSD de la trayectoria de equilibraci�n de la estructura no-Fusog�nica, por tanto, se decidi� tomar las �ltimas 2000 estructuras de las trayectorias de equilibraci�n para cada grupo para el c�lculo de la energ�a interna, considerando adem�s que .

En la siguiente figura, se muestra la energ�a libre de Gibbs adem�s de las componentes que la constituyen: la energ�a interna , y la contribuci�n de la entrop�a .

Figura 14: Energ�a libre de Gibbs, utilizando el promedio obtenido a partir de las trayectorias de equilibraci�n para la energ�a interna.

A partir de la figura, se puede comprobar que el valor m�ximo de energ�a libre 189.75 [kcal/mol] se presenta para el grupo 6(5396), y se tienen dos valores m�nimos, uno de -234.55 [kcal/mol] correspondiente al grupo 3(2474), y un m�nimo global de -404.72 [kcal/mol] correspondiente al grupo 11(9240), el cual por lo tanto corresponde a la conformaci�n intermedia m�s estable.

Comparaci�n de los valores de Energ�a Libre obtenidos mediante los dos m�todos

La energ�a libre obtenida directamente a partir del valor de la energ�a libre de la estructura representativa en la trayectoria TMD, fluct�a considerablemente en comparaci�n con la obtenida a partir del promedio sobre el ensamble generado a partir de las trayectorias de equilibraci�n.

Figura 15: Comparaci�n de la energ�a libre de Gibbs, obtenida mediante los dos m�todos anteriores.

Barrera Energ�tica

A continuaci�n se presentan los valores de energ�a libre asociados a las diferentes conformaciones en funci�n de la primera coordenada principal del PCA, el RMSD₀, y el RMSD_f.

Figura 16: PCA, obtenido de la aplicaci�n del an�lisis de componentes principales a las estructuras de la trayectoria TMD, se ha aplicado la transformaci�n PCA' = max(PCA) - PCA de forma que se muestre el incremento de la variable.

Figura 17: RMSD0, este par�metro fue calculado con respecto a la estructura no-fusog�nica.

Tanto para el PCA como para el RMSD0 como coordenadas de reacci�n, se puede ver el m�nimo local de energ�a libre correspondiente a la cuarta conformaci�n intermedia, en tanto que las conformaciones {10, 11, 12 y 13} se encuentran muy pr�ximas en el eje correspondiente tanto al PCA como al RMSD0, por lo cual se puede ver una correlaci�n entre las dos posibles coordenadas de reacci�n.

�

Figura 18: RMSD_f calculado con respecto a la estructura fusog�nica, se ha aplicado la transformaci�n: RMSD'_f = max(RMSD_f) � RMSD_f, de forma que se muestre el incremento de la variable.

Por otra parte, para el RMSDf se puede observar que las conformaciones {10, 11, 12 y 13} est�n mejor espaciadas, y se manifiesta una posible transici�n natural entre las conformaciones {8, 9, 10, 11, 12}.

Conclusiones

En este art�culo se ha investigado la evoluci�n de la entrop�a para la transici�n conformacional del lazo 36 de la Hemaglutinina, para lo cual primero se evalu� la pertinencia de las conformaciones determinadas mediante an�lisis de grupos en el espacio de Ramachandran, posteriormente se obtuvieron frecuencias a trav�s de la aproximaci�n quasi-arm�nica con las cuales se pudo estimar la entrop�a, y a la vez estimar la contribuci�n de entr�pica de la energ�a libre, y con ello describir la barrera energ�tica asociada a la transici�n conformacional.

El an�lisis de grupos en el plano de Ramachandran para cada grupo, muestra que los grupos 3, 4 y 5 no tienen subgrupos para las distancias de corte consideradas, por ello se puede afirmar que est�n bien definidos de acuerdo a los dos criterios utilizados (RMSD y distancia en el espacio de Ramachandran). Por otra parte los grupos 7 y 8 son los que m�s subgrupos presentan para las distancias de corte consideradas y reafirma la posibilidad de existencia de grupos adicionales.

Las frecuencias obtenidas a trav�s de la aproximaci�n quasi-arm�nica se encuentra en el rango entre �y , con la mayor�a de frecuencias en el rango entre � y , lo cual permite establecer una relaci�n directa entre las frecuencias encontradas y el comportamiento molecular, ya que coinciden con el rango de las frecuencias de vibraci�n molecular. Por otra parte, se comprob� que las frecuencias de menor valor, corresponden a modos colectivos de vibraci�n, entre los cuales se analiz� la oscilaci�n del centro de masa, y se comprob� que esta oscilaci�n tiene un m�ximo de frecuencia en torno a . De esta forma se puede verificar que la aproximaci�n quasi-arm�nica, produce resultados consistentes con los resultados experimentales (Bullough et al., 1994).

La estimaci�n de la entrop�a a trav�s de la aproximaci�n quasi-arm�nica, provee valores de entrop�a del orden de , y valores de diferencia de entrop�a con un m�ximo de , lo cual produce una contribuci�n energ�tica de la entrop�a m�xima de , este valor difiere en 2 �rdenes de magnitud del valor reportado en trabajos anteriores (Calder�n, 2015); sin embargo la distribuci�n de los valores obtenidos, siguen una tendencia similar, con un cambio abrupto de �en la conformaci�n 12 cuya estructura representativa es la 9240.

Para la descripci�n de la barrera energ�tica se probaron 3 posibles coordenadas de reacci�n, tanto para la primera coordenada principal como para el �se tiene un comportamiento similar, por lo cual se puede ver una posible correlaci�n entre las dos coordenadas de reacci�n. Por otra parte, la coordenada que mejor describe el sistema es , ya que permite apreciar la barrera energ�tica durante todas las etapas de la transici�n.

En el futuro, ser�a relevante utilizar las estructuras representativas encontradas mediante an�lisis de grupos, considerando como par�metros tanto el RMSD como la distancia eucl�dea en el plano de Ramachandran, ya que los resultados de utilizar los dos criterios se pueden considerar como complementarios. Esto permitir�a adem�s encontrar valores adicionales de entrop�a, utilizando los mismos datos de simulaciones de din�mica molecular para cada conformaci�n, ya que se podr�a aplicar la aproximaci�n quasi-arm�nica sobre particiones de la trayectoria en subconjuntos de estructuras, que correspondan a los grupos adicionales. Otro aspecto a tomar en cuenta es que, en la aproximaci�n quasi-arm�nica, la componente de frecuencias bajas contribuyen mayoritariamente a la entrop�a, por ello resultar�a relevante ampliar el an�lisis espectral presentado en la secci�n 3.2.1, de modo que incluya no solo la oscilaci�n del centro de masa, sino tambi�n otros aspectos, por ejemplo, la rotaci�n de la mol�cula.

Referencias

1. Banta, Scott et al. (2007). �Engineering protein and peptide building blocks for nanotechnology�. Journal of Nanoscience and Nanotechnology, 7(2), 387-401.

2. Baron, Riccardo et al. (2009). �Absolute single-molecule entropies from quasi-harmonic analysis of microsecond molecular dynamics: correction terms and convergence properties�. Journal of Chemical Theory and Computation, 5(12), 3150-3160.

3. Barth, Andreas (2007). �Infrared spectroscopy of proteins�. Biochimica et Biophysica Acta (BBA)-Bioenergetics, 1767(9), 1073-1101.

4. Berman, Helen M et al. (2000). �The protein data bank�. Nucleic Acids Research, 28(1), 235-242.

5. Br�nd�n, Carl-Ivar y John Tooze (1999). �Introduction to Protein Structure�. Taylor & Francis.

6. Bullough, Per A et al. (1994). �Structure of influenza haemagglutinin at the pH of membrane fusion�. Nature, 371(6492), 37-43.

7. Calder�n, Jaime Rodrigo (2015). �Descripci�n estad�stica del proceso de plegamiento del lazo 36 de la cadena AH2 de la Hemaglutinina�. Tesis EPN.

8. Carr, Chavela M. y Peter S. Kim (1993). �A spring-loaded mechanism for the conformational change of influenza hemagglutinin�. Cell, 73(4), 823-832.

9. Dill, Ken y Sarina Bromberg (2010). �Molecular driving forces: statistical thermodynamics in biology, chemistry, physics, and nanoscience. � Garland Science.

10. Dubey, A et al. (2003). �Viral protein linear (VPL) nano-actuators�., Third IEEE Conference on Nanotechnology 2003, 1, 140-143.

11. Humphrey, William et al. (1996). �VMD: visual molecular dynamics�. Journal of molecular graphics, 14(1), 33-38.

12. Jeffers, J. N. R. (1967). �Two Case Studies in the Application of Principal

Component Analysis�. Journal of the Royal Statistical Society. Series

C (Applied Statistics), 16(3), 225-236.

13. Jolliffe, Ian T. (1986). �Principal Component Analysis. � Springer.

14. Karplus, Martin y Joseph N Kushick (1981). �Method for estimating the

configurational entropy of macromolecules�. Macromolecules, 14(2), 325-332.

15. Meirovitch, Hagai et al. (2009). �Methods for calculating the entropy and

free energy and their application to problems involving protein flexibility

and ligand binding�. Current Protein and Peptide Science, 10(3), 229-243.

16. Morales, Hern�n y Marco Bayas (2013). �Efecto de mutaciones puntuales en las transiciones conformacionales de un nanomotor biol�gico�. Revista Polit�cnica, 32(3), 63-70.

17. Numata, J et al. (2007). �Conformational entropy of biomolecules: beyond

the quasi-harmonic approximation. � Genome informatics. International

Conference on Genome Informatics, 18, 192.

18. Phillips, James C et al. (2005). �Scalable molecular dynamics with NAMD�.

Journal of computational chemistry, 26(16), 1781-1802.

19. R Core Team (2015). �R: A Language and Environment for Statistical Computing. � R Foundation for Statistical Computing. Vienna, Austria.

20. Ramachandran, G. y V. Sasisekharan (1968). �Conformation of polypeptides

and proteins�. Advances in protein chemistry, 23, 283-437.

21. Sauter, Nicholas K. et al. (1992). �Binding of influenza virus hemagglutinin to analogs of its cell-surface receptor, sialic acid: analysis by proton nuclear magnetic resonance spectroscopy and X-ray crystallography�. Biochemistry, 31(40), 9609-9621.

22. Sch�fer, Heiko et al. (2000). �Absolute entropies from molecular dynamics

simulation trajectories�. The Journal of Chemical Physics, 113(18), 7809-7817.

23. Schlitter, Jürgen (1993). �Estimation of absolute and relative entropies of macromolecules using the covariance matrix�. Chemical Physics Letters, 215(6), 617-621.

24. Thijssen, Jos (2007). �Computational physics�. Cambridge university press.

25. Van Rossum, Guido y Fred L Drake Jr (1995). �Python reference manual�. Centrum voor Wiskunde en Informatica Amsterdam.

26. Zhou, Yu et al. (2014). �Exploring the early stages of the pH-induced conformational change of influenza hemagglutinin�. Proteins: Structure, Function, and Bioinformatics, 82(10), 2412-2428.

� 2024 por los autores. Este art�culo es de acceso abierto y distribuido seg�n los t�rminos y condiciones de la licencia Creative Commons Atribuci�n-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)

(https://creativecommons.org/licenses/by-nc-sa/4.0/).

��

Enlaces de Referencia

Por el momento, no existen enlaces de referencia

Polo del Conocimiento

Revista Científico-Académica Multidisciplinaria

ISSN: 2550-682X

Casa Editora del Polo

Manta - Ecuador

Dirección: Ciudadela El Palmar, II Etapa, Manta - Manabí - Ecuador.

Código Postal: 130801

Teléfonos: 056051775/0991871420

Email: polodelconocimientorevista@gmail.com / director@polodelconocimiento.com

URL: https://www.polodelconocimiento.com/

Normas para los Autores

Manual para subir artículos en OJS

REGÍSTRATE

INFORMACIÓN

Enlaces de Referencia

Nombre de usuario
Clave
Recordar mis datos