����������������������������������������������������������������������������������
Estimaci�n de la entrop�a durante la transici�n conformacional del lazo 36 de la hemaglutinina
Estimation of entropy during the conformational transition of loop 36 of hemagglutinin
Estimativa da entropia durante a transi��o conformacional da al�a 36 da hemaglutinina
![]() |
|||
![]() |
Correspondencia: klever.cajamarca@unach.edu.ec
Ciencias de la Educaci�n
Art�culo de Investigaci�n
* Recibido: 10 de marzo de 2024 *Aceptado: 09 de abril de 2024 * Publicado: �22 de mayo de 2024
I. Facultad Ciencias de la Educaci�n, Humanas y Tecnolog�as, Pedagog�a de las Ciencias Experimentales Matem�ticas y la F�sica, Universidad Nacional de Chimborazo, Riobamba, Ecuador.
II. Facultad Ciencias de la Educaci�n, Humanas y Tecnolog�as, Pedagog�a de las Ciencias Experimentales Matem�ticas y la F�sica, Universidad Nacional de Chimborazo, Riobamba, Ecuador.
III. Facultad Ciencias de la Educaci�n, Humanas y Tecnolog�as, Pedagog�a de las Ciencias Experimentales Matem�ticas y la F�sica, Universidad Nacional de Chimborazo, Riobamba, Ecuador.
IV. Facultad Ciencias de la Educaci�n, Humanas y Tecnolog�as, Pedagog�a de las Ciencias Experimentales Matem�ticas y la F�sica, Universidad Nacional de Chimborazo, Riobamba, Ecuador.
Resumen
La evoluci�n de la entrop�a durante la transici�n entre las conformaciones no-fusog�nica y fusog�nica del lazo 36 de la cadena HA2 de la Hemaglutinina ha sido estudiada utilizando trayectorias de simulaciones de din�mica molecular y la llamada aproximaci�n quasi-arm�nica. Para el c�lculo de la entrop�a de las conformaciones intermedias se aplic� un an�lisis de componentes principales al conjunto de estructuras asociadas a cada conformaci�n. Las varianzas de estas componentes principales pueden considerarse asociadas a un conjunto de osciladores independientes cuya entrop�a puede calcularse. Los valores de entrop�a obtenidos se encuentran en el orden de 17 kcal/mol K, los cuales son mayores en un orden de magnitud a los resultados obtenidos en trabajos anteriores. Adicionalmente, se comprob� que el t�rmino -TS contribuye de forma no despreciable a la energ�a libre. El t�rmino de energ�a interna se estim� a partir del promedio sobre el ensamble, aplicado sobre las trayectorias de din�mica molecular de equilibrar�an para cada conformaci�n intermedia, como resultado la altura de la barrera energ�tica para la transici�n se estim� en 189.75 kcal/mol.
Palabras clave: Hemaglutinina; Entrop�a; Aproximaci�n Quasi-Arm�nica; Din�mica Molecular.
Abstract
The evolution of entropy during the transition between the non-fusogenic and fusogenic conformations of loop 36 of the HA2 chain of Hemagglutinin has been studied using trajectories of molecular dynamics simulations and the so-called quasi-harmonic approximation. To calculate the entropy of the intermediate conformations, a principal component analysis was applied to the set of structures associated with each conformation. The variances of these principal components can be considered associated with a set of independent oscillators whose entropy can be calculated. The entropy values obtained are in the order of 17 kcal/mol K, which are greater by an order of magnitude than the results obtained in previous works. Additionally, it was proven that the -TS term contributes in a non-negligible way to the free energy. The internal energy term was estimated from the average over the ensemble, applied to the equilibrium molecular dynamics trajectories for each intermediate conformation, as a result the height of the energy barrier for the transition was estimated at 189.75 kcal/mol.
Keywords: Hemagglutinin; Entropy; Quasi-Harmonic Approach; Molecular Dynamics.
Resumo
A evolu��o da entropia durante a transi��o entre as conforma��es n�o fusog�nicas e fusog�nicas da al�a 36 da cadeia HA2 da Hemaglutinina foi estudada usando trajet�rias de simula��es de din�mica molecular e a chamada aproxima��o quase harm�nica. Para calcular a entropia das conforma��es intermedi�rias, foi aplicada uma an�lise de componentes principais ao conjunto de estruturas associadas a cada conforma��o. As vari�ncias destes componentes principais podem ser consideradas associadas a um conjunto de osciladores independentes cuja entropia pode ser calculada. Os valores de entropia obtidos s�o da ordem de 17 kcal/mol K, valores que s�o uma ordem de grandeza superiores aos resultados obtidos em trabalhos anteriores. Adicionalmente, foi comprovado que o termo -TS contribui de forma n�o desprez�vel para a energia livre. O termo de energia interna foi estimado a partir da m�dia do conjunto, aplicada �s trajet�rias de din�mica molecular de equil�brio para cada conforma��o intermedi�ria, como resultado a altura da barreira de energia para a transi��o foi estimada em 189,75 kcal/mol.
Palavras-chave: Hemaglutinina; Entropia; Abordagem Quase Harm�nica; Din�mica Molecular.
Introducci�n
La Hemaglutinina (HA) es una prote�na presente en la superficie del virus de la influenza, siendo parte fundamental del mecanismo de adhesi�n y fusi�n del virus a la membrana celular (Bullough et al., 1994; Carr y Kim, 1993). La Hemaglutinina est� formada por dos subunidades HA1 y HA2. La estructura molecular de la Hemaglutinina ha sido caracterizada completamente de forma experimental (Bullough et al., 1994; Sauter et al., 1992), y la informaci�n completa de su composici�n y estructura molecular se encuentran libremente disponibles en el Protein Data Bank (PDB) (Berman et al., 2000) tanto para la configuraci�n no-fusog�nica como para la fusog�nica.
Figura 1: (A) La Hemaglutinina, on sus subunidades HA1 y HA2, el lazo 36 se encuentra en la subunidad HA, imagen generada mediante el software VMD a partir del registro 1HTM del PDB. (B) La Hemaglutinina en la superficie del virus de la influenza
De particular inter�s resulta la din�mica del cambio conformacional que sufre el llamado Lazo 36, el cual corresponde a la regi�n comprendida entre los residuos 54 y 89 de la cadena HA. El modelo con mayor aceptaci�n para la descripci�n de la transici�n conformacional es el conocido como Spring-Loaded (Carr y Kim, 1993) el cual plantea que la estructura nativa de la Hemaglutinina est� atrapada en un estado metaestable, y que la disminuci�n del pH la desestabiliza produciendo la transici�n. El cambio ocurre desde su conformaci�n inicial no-fusog�nica a pH 7 hasta una conformaci�n final fusog�nica a pH 5. Se ha planteado que el movimiento lineal producido por esta transici�n conformacional, pueda ser aprovechado como un nanomotor lineal (Banta et al., 2007; Dubey et al., 2003).
Figura 2: Estructura Secundaria del Lazo 36: (A) Conformaci�n no-fusog�nica a pH 7, imag�n generada a partir del registro 1HGF del PDB utilizando el software VMD. (B) Conformaci�n fusog�nica a pH 5, imagen generada a partir del registro 1HTM del PDB,
La transici�n conformacional del lazo 36 de la Hemaglutinina es un proceso que, por su simplicidad, permite estudiar el plegado prote�nico. Los detalles at�micos de la transici�n accesibles directamente con las simulaciones de din�mica molecular, permiten el c�lculo de la energ�a, as� como de la entrop�a involucradas en el proceso. Esta informaci�n permitir� establecer relaciones cuantitativas entre estas dos magnitudes durante un proceso de plegado. Adicionalmente, el entendimiento de los mecanismos at�micos asociados a la transici�n conformacional del lazo 36 de la Hemaglutinina tiene potenciales aplicaciones biom�dicas y biotecnol�gicas.
En un trabajo precedente se utiliz� simulaciones TMD para explorar la transici�n del lazo 36 (Calder�n, 2015). A partir de la trayectoria obtenida se aplic� an�lisis de grupos para identificar posibles conformaciones intermedias, obteni�ndose 13 grupos. A partir de estos datos se realiz� una descripci�n estad�stica del proceso, la cual estim� la entrop�a con un m�todo simple de conteo de estados accesibles. Por ello se consider� necesario un an�lisis alternativo de los datos.
En este trabajo, se realiz� un nuevo an�lisis de los datos, tanto para la trayectoria TMD como para las trayectorias de equilibraci�n de cada conformaci�n intermedia. Para este nuevo an�lisis en primer lugar se compar� los resultados del m�todo de agrupamiento desarrollado en (Calder�n, 2015) con los resultados de un agrupamiento basado en la similitud de estructuras secundarias en el espacio de Ramachandran, posteriormente se estim� la entrop�a del lazo 36 de la HA utilizando el m�todo de la Aproximaci�n Quasi-Arm�nica y finalmente caracteriz� la barrera energ�tica asociada a la transici�n conformacional.
Metodolog�a
Estructuras
En el trabajo de Calder�n J., se realiz� una simulaci�n de din�mica molecular tipo TMD, donde la estructura del lazo 36 en su conformaci�n no-fusog�nica se utiliz� como estructura inicial, y como estructura final u objetivo se utiliz� la estructura fusog�nica. Esta simulaci�n produjo una trayectoria compuesta por 10000 estructuras. Las estructuras de la trayectoria TMD fueron sometidas a un an�lisis de grupos, obteni�ndose 13 conformaciones intermedias correspondientes a 11 conformaciones representativas, cuyas estructuras representativas se muestran en la fig. 3, adem�s de las conformaciones correspondientes a la conformaci�n no-fusog�nica y fusog�nica.
Figura 3: Las 11 estructuras representativas intermedias identificadas en (Calder�n, 2015), imagen reproducida del trabajo citado.
Para la simulaci�n de equilibraci�n, se parti� de las estructuras representativas de cada conformaci�n, las cuales se dejaron evolucionar mediante din�mica molecular, durante un tiempo total de 6 ns, con condiciones de frontera esf�ricas. Estas trayectorias son las que se utilizar�n para el c�lculo de la entrop�a. Cada trayectoria tiene un total de 12000 estructuras, correspondiendo cada estructura a 20 ps de tiempo en la equilibraci�n.
Mapas de Ramachandran
Los �ngulos de Ramachandran (Ramachandran et al., 1968) representan la orientaci�n de los amino�cidos unidos mediante enlaces pept�dicos en un polip�ptido o prote�na. Estos �ngulos permiten describir las rotaciones del backbone o esqueleto� del polip�ptido en torno a los enlaces N-Ca (llamado f) y Ca-C (llamado y).
La representaci�n en un plano de f vs y, se conoce como mapa de Ramachandran,� y permite observar la distribuci�n de los �ngulos de torsi�n en una estructura de la prote�na. Tambi�n proporciona una visi�n general de las regiones excluidas, que muestran que ciertas rotaciones del polip�ptido no est�n permitidas, debido a las interacciones entre los �tomos de los amino�cidos. Finalmente, en el mapa de Ramachandran se pueden identificar regiones correspondientes a motivos de la estructura secundaria de una prote�na, tal como las regiones correspondientes a los denominados a-h�lices y hojas-b.
El pol�gono que encierra a la regi�n correspondiente a un a-h�lice en el mapa de Ramachandran est� determinada por los puntos indicados en la siguiente tabla (Br�nd�n y Tooze, 1999)
Tabla 1: Puntos del pol�gono que encierra la regi�n correspondiente a un
a-h�lice en el mapa de Ramachandran (Br�nd�n y Tooze, 1999).
f [grados] |
y [grados] |
-180,0 |
-34,9 |
-164,3 |
-42,9 |
-133,0 |
-42,9 |
-109,4 |
-32,2 |
-106,9 |
-21,4 |
-44,3 |
-21,4 |
-44,3 |
-71,1 |
-180,0 |
-71,1 |
Aproximaci�n Quasi-Arm�nica
Dado que no existe un m�todo exacto para calcular la entrop�a de una biomol�cula a partir de los datos de din�mica molecular, es necesario realizar una estimaci�n de la misma. La estrategia que su utiliz� en este trabajo para estimar la entrop�a, es la llamada Aproximaci�n Quasi-Arm�nica (QHA) (Karplus y Kushick, 1981), la cual provee un l�mite superior a la entrop�a conformacional de una biomol�cula en t�rminos de osciladores arm�nicos independientes asociados a sus grados de libertad, identificados con un an�lisis de componentes principales (Jolliffe, 1986).
El An�lisis de Componentes Principales es una t�cnica estad�stica, utilizada para analizar datos multivariantes. Los objetivos pr�cticos de la utilizaci�n del an�lisis de componentes principales han sido enumerados en (Jeffers, 1967), siendo de inter�s examinar la correlaci�n entre las variables de un conjunto de datos, ya que para la aplicaci�n de la aproximaci�n quasi-arm�nica para el c�lculo de la entrop�a es necesario tener variables no-correlacionadas.
Componentes principales de una macromol�cula derivadas de trayectorias de din�mica molecular
A partir de trayectorias de simulaciones de din�mica molecular, en las cuales se han eliminado los �tomos del solvente, se puede plantear una matriz de trayectoria R la cual tiene dimensiones 3Na x nf siendo Na el n�mero de �tomos y nf la cantidad de trayectorias de simulaci�n que se consideran para el an�lisis, es decir:
A partir de trayectorias de simulaciones de din�mica molecular, en las cuales se han eliminado los �tomos del solvente, se puede plantear una matriz de trayectoria R la cual tiene dimensiones 3Na x nf siendo Na el n�mero de �tomos y nf la cantidad de trayectorias de simulaci�n que se consideran para el an�lisis, es decir:
��� (1)
donde
�corresponde
a la estructura i-�sima, la cual contiene las coordenadas de cada �tomo,
arregladas en un vector con 3Na componentes:
�� ��
(2)
Para
considerar las masas de los �tomos ubicados en cada posici�n ,
se aplic� a la matriz de trayectoria R la transformaci�n (Schlitter,
1993):
�� (3)
donde
la matriz �de
dimensiones 3Na x 3Na viene dada por la matriz diagonal conformada por la ra�z
cuadrada de las masas de cada �tomo.
Sobre
esta matriz �se
aplica el an�lisis de componentes principales, para lo cual primero se obtiene
la matriz de covarianza de
:
�� ���(4)
Se
aplica la descomposici�n de valor singular (SVD) a la matriz ,
obteniendo un conjunto de 3Na autovalores l, los cuales debido a la
ponderaci�n realizada a trav�s de la matriz M contienen valores de masa
que son combinaci�n de las originales (Schlitter, 1993; Schafer et al., 2000),
por lo cual los autovalores pueden representarse de la forma:
���������� ��
(6)
donde
cada autovalor �es
la desviaci�n est�ndar de las componentes principales obtenidas, las cuales
debido a la ponderaci�n realizada contienen un factor
�el
cual es una funci�n de las masas at�micas
.
Frecuencias Asociadas a las Componentes Principales
Es
un resultado conocido que para un sistema con desviaci�n est�ndar nula �y
varianza conocida
,
el valor m�ximo de la entrop�a se presenta cuando las energ�as y las varianzas
para cada estado son proporcionales, excepto por una constante aditiva. Esta
condici�n es satisfecha por el Hamiltoniano de un oscilador arm�nico
(Schlitter, 1993; Schafer et al., 2000), es decir:
��
(7)
donde p es el momento can�nico asociado a x.
Para
este tipo de sistemas es de inter�s encontrar la frecuencia a partir de la
varianza .
Para ello se puede utilizar la siguiente aproximaci�n (Schlitter, 1993):
����
(8)
Est� expresi�n se cumple tambi�n en el r�gimen cl�sico, debido al teorema de equipartici�n.
Una generalizaci�n propuesta para el caso n-dimensional es a trav�s de la matriz de covarianza (Schlitter, 1993), de forma que la expresi�n anterior se puede representar como:
����
(9)
Las
varianzas �pueden
estimarse con simulaciones de din�mica molecular del sistema. Este tipo de
simulaciones de din�mica molecular, se realizan usualmente en un sistema de
coordenadas cartesiano, por lo cual varias de sus coordenadas estar�n
correlacionadas. Con el fin de obtener una transformaci�n de coordenadas, las
cuales sean independientes, se puede aplicar una transformaci�n ortogonal, tal
como el an�lisis de coordenadas principales, las cuales adem�s est�n ordenadas
desde la que contiene la mayor cantidad de varianza del sistema, hasta la que contiene
la menor, de forma que:
����
(10)
Esta expresi�n corresponde a la hip�tesis fundamental de la aproximaci�n Quasi-Arm�nica, la cual considera que los autovalores obtenidos a partir del an�lisis de componentes principales, corresponden a un conjunto de osciladores arm�nicos cu�nticos no-correlacionados (Meirovitch et al., 2009; Bar�n et al., 2009).
Desarrollando
la ecuaci�n anterior, para cada autovalor se puede obtener una frecuencia :
����
(11)
La �ltima ecuaci�n asigna un valor de frecuencia a cada autovalor obtenido mediante el an�lisis de componentes principales.
Estimaci�n de la Entrop�a
Las trayectorias disponibles, se encuentran en un formato binario (DCD), por lo cual se exportaron a coordenadas del tipo x,y,z, utilizando el software VMD (Humphrey et al., 1996), las coordenadas exportadas se organizaron en una matriz, utilizando el lenguaje de programaci�n Python (Van Rossum y Drake Jr., 1995), la estructura de la matriz es:
���
(13)
donde
,
i indica el n�mero de estructura y j el n�mero de �tomo, de forma
que la matriz tiene dimensiones
�,
siendo
�el
n�mero de �tomos, y
�el
n�mero de estructuras en cada trayectoria de equilibraci�n.
Sobre la trayectoria de din�mica molecular de equilibraci�n representada por esta matriz se aplic� el an�lisis de componentes principales (PCA), mediante un script en R (R Core Team, 2015). A partir de los autovalores (desviaciones est�ndar) de las componentes principales obtenidas, se encontraron las frecuencias correspondientes a trav�s de la Aproximaci�n Quasi-Arm�nica, con estas frecuencias se estim� la entrop�a mediante la expresi�n (Schlitter, 1993; Schafer et al., 2000):
����
(12)
Energ�a libre de gibbs y barrera energ�tica
Para
estimar la energ�a libre de Gibbs ,
se requiere de dos componentes, la diferencia de energ�a interna
,
y la contribuci�n de la entrop�a
.
La diferencia de energ�a interna puede obtenerse a partir de los valores de
energ�a obtenidos durante las simulaciones de din�mica molecular, y la
contribuci�n de la entrop�a se puede obtener a partir del valor calculado con
el m�todo expuesto en la secci�n anterior.
Para describir la barrera energ�tica, se probaron coordenadas de reacci�n, que describan el comportamiento energ�tico durante la transici�n. Como candidato a coordenada de reacci�n se utiliz� la primera coordenada principal resultante de la aplicaci�n del PCA.� Otra posible coordenada es el RMSD entre las posiciones de los �tomos en las estructuras, calculado con respecto a la estructura inicial (no-fusog�nica), y a la estructura final (fusog�nica), el RMSD se calcul� mediante la herramienta "RMSD Calculator" disponible en el software VMD (Humphrey et al., 1996).
Resultados y discusi�n
An�lisis de Grupos en el Espacio de Ramachandran
Para explorar la posibilidad de la existencia de grupos adicionales, se realiz� un nuevo an�lisis de grupos sobre cada conjunto de estructuras de la trayectoria TMD clasificadas dentro de un grupo de acuerdo al criterio del RMSD, utilizando como par�metro la distancia eucl�dea de los �ngulos de torsi�n entre las estructuras del grupo. De forma que se obtuvieron 11 dendogramas, correspondientes a cada grupo, los cuales se muestran en la fig. 4.
Figura 4: Dendogramas para cada grupo.
A distancias de corte representativas, tales como 10, 12 y 14 grados, se obtiene un n�mero de grupos comparable para cada dendograma. Los resultados de este an�lisis se reportan en la siguiente tabla.
Tabla 2: N�mero de grupos para distancias de corte espec�ficas.
Grupo |
Distancia de Corte |
||
|
14 |
12 |
10 |
|
N�mero de Grupos |
||
1 |
1 |
2 |
2 |
2 |
1 |
2 |
2 |
3 |
1 |
1 |
1 |
4 |
1 |
1 |
1 |
5 |
1 |
1 |
1 |
6 |
1 |
5 |
5 |
7 |
3 |
7 |
9 |
8 |
4 |
4 |
11 |
9 |
1 |
2 |
2 |
10 |
1 |
1 |
2 |
11 |
1 |
2 |
5 |
Se puede comprobar que los grupos 3,4 y 5 no tienen subgrupos para las distancias de corte consideradas, por ello se puede afirmar que est�n bien definidos de acuerdo a los dos criterios utilizados (RMSD y distancia en el espacio de Ramachandran). Por otra parte, los grupos 7 y 8 son los que m�s subgrupos presentan para las distancias de corte consideradas.
Entrop�a conformacional
Frecuencias de los osciladores arm�nicos
En la fig. 5, se muestran las frecuencias de los osciladores arm�nicos en la aproximaci�n Quasi-Arm�nica, correspondientes a las componentes principales, para cada una de las conformaciones intermedias.
�����������
Figura 5: Frecuencias de los osciladores arm�nicos de la aproximaci�n quasi-arm�nica, correspondientes a las componentes principales.
Figura 6: Histograma de las frecuencias de los osciladores arm�nicos correspondientes a las componentes principales, cada color est� asociado a una conformaci�n.
A
partir de los histogramas, se puede observar que las frecuencias de los
osciladores arm�nicos, se encuentran mayoritariamente en el rango entre �y
.
Considerando que la frecuencia de oscilaci�n de las vibraciones moleculares se
encuentran en el orden de entre
�y
�(Barth,
2007; Dill y Broomberg, 2010) se puede observar que las frecuencias obtenidas
son cercanas a este rango.
Por otra parte, en los histogramas se puede apreciar la presencia de frecuencias en un rango bajo, las cuales corresponden a las �ltimas frecuencias obtenidas mediante la aproximaci�n quasi-arm�nica, como se puede observar en la fig. 7.
Figura 7: Frecuencias de los �ltimos osciladores arm�nicos, correspondientes a las �ltimas componentes principales, los 6 �ltimos valores presentan una variaci�n significativa con respecto a los anteriores, para todos los grupos.
Para explicar la presencia de estas frecuencias, en primera instancia se analiz� la posibilidad de existencia de oscilaciones del centro de masa de la mol�cula, para lo cual se calcularon las posiciones del centro de masa a lo largo de la trayectoria TMD. Para caracterizar estas oscilaciones del centro de Masa, se procedi� a obtener la transformada de Fourier mediante el m�todo FFT de las posiciones del centro de masa, considerando adem�s que dado que se tiene en total 12000 estructuras correspondientes a 6 [ns] de tiempo de simulaci�n, el tiempo de muestreo ser�a de 500 [ps], lo cual nos permite obtener el rango de frecuencias para la FFT. Los resultados de este an�lisis se muestran en la fig. 8.
Figura 8: Transformada de Fourier de las coordenadas del centro de masa para la trayectoria de equilibraci�n de la conformaci�n no-Fusog�nica
A
partir de la figura anterior, se puede observar que la mayor componente de
frecuencia se encuentra en el rango entre �y
,
para cada coordenada analizada, lo cual permite explicar 3 de los 6 valores de
la fig. 7.
Entrop�a Absoluta
Para estimar la entrop�a, a partir de las frecuencias de los osciladores arm�nicos de la aproximaci�n quasi-arm�nica, se utiliz� la ecuaci�n (ec. 12). Este procedimiento se realiz� para cada conformaci�n intermedia, obteni�ndose en total 13 valores de entrop�a, los cuales se encuentran en el orden de 17 [kcal/mol �K].
Figura 9: Entrop�a absoluta obtenida mediante la Aproximaci�n Quasi-Arm�nica, el valor m�ximo de entrop�a 18.021 [kcal/mol �K] ocurre para la conformaci�n 12 cuya estructura representativa es la 9240, en tanto que disminuye para la conformaci�n fusog�nica, aproxim�ndose al valor� 17.597 [kcal/mol �K] semejante al de la conformaci�n inicial (no-fusog�nica).
A partir de los valores obtenidos de entrop�a absoluta, se puede determinar la diferencia de entrop�a entre conformaciones, obteni�ndose 12 valores de diferencia de entrop�a, y tomando como valor de referencia el primer valor de entrop�a, el cual corresponde a la conformaci�n no-fusog�nica.
Figura 10: Diferencia de entrop�a entre conformaciones, tomando como referencia la entrop�a de la conformaci�n inicial (no-fusog�nica), el valor m�ximo de la diferencia de entrop�a es de 0.4622 [kcal/mol �K]
Energ�a Libre
A
partir de la estimaci�n de la diferencia de entrop�a, cuyo resultado se
present� en la secci�n anterior, se puede determinar el t�rmino de contribuci�n
de la entrop�a a la energ�a libre ,
dada la temperatura T=300 K a la que se realiz� la din�mica molecular.
Figura 11. Contribuci�n de la entrop�a a la energ�a libre.
Energ�a interna en la trayectoria TMD
La energ�a interna se estim� utilizando el plugin �Namd-Energy� incluido en el software VMD (Humphrey et al., 1996), sobre la trayectoria TMD al igual que en (Calder�n, 2015). Como resultado se obtienen 10000 valores de energ�a, correspondientes a cada estructura de la trayectoria, como se muestra en la siguiente figura:
Figura 12. Energ�a interna U, estimada a partir de la trayectoria TMD.
Para el an�lisis se tom� el valor de la energ�a interna para la estructura representativa de cada grupo, a�adi�ndole la contribuci�n de la entrop�a, para as� obtener la energ�a libre de Gibbs; los resultados de esta aproximaci�n se muestran en la siguiente figura:
Figura 13: Energ�a libre de Gibbs, estimada utilizando la energ�a interna de la estructura representativa, obtenida a partir de la trayectoria TMD.
Se puede observar, que el valor m�ximo de energ�a libre 74 [kcal/mol] se presenta para el grupo 1(538), y se mantiene relativamente estable, despu�s se reduce dr�sticamente, hasta el m�nimo -280.77 [kcal/mol] en la estructura correspondiente al grupo 11(9240), despu�s incrementa levemente hasta la estructura correspondiente a la conformaci�n fusog�nica.
Estimaci�n utilizando las trayectorias de equilibraci�n para cada conformaci�n intermedia
Para estimar la energ�a interna, se utilizaron las trayectorias de equilibraci�n para cada grupo, suponiendo que todas las estructuras son equivalentes y por tanto pertenecientes a una conformaci�n, de forma que cada trayectoria se puede considerar como un ensamble, y por tanto la energ�a interna se puede estimar mediante la siguiente expresi�n (Thijssen, 2007):
����
(14)
donde M es el total de estructuras en el ensamble (trayectoria), y n es la n-�sima estructura.
Para
el an�lisis, resulta conveniente tomar un subconjunto de estructuras de la
trayectoria de equilibraci�n, las que tengan un valor de RMSD estable, para lo
cual resulta conveniente analizar el RMSD de la trayectoria de equilibraci�n de
la estructura no-Fusog�nica, por tanto, se decidi� tomar las �ltimas 2000
estructuras de las trayectorias de equilibraci�n para cada grupo para el
c�lculo de la energ�a interna, considerando adem�s que .
En
la siguiente figura, se muestra la energ�a libre de Gibbs adem�s
de las componentes que la constituyen: la energ�a interna
,
y la contribuci�n de la entrop�a
.
Figura 14: Energ�a libre de Gibbs, utilizando el promedio obtenido a partir de las trayectorias de equilibraci�n para la energ�a interna.
A partir de la figura, se puede comprobar que el valor m�ximo de energ�a libre 189.75 [kcal/mol] se presenta para el grupo 6(5396), y se tienen dos valores m�nimos, uno de -234.55 [kcal/mol] correspondiente al grupo 3(2474), y un m�nimo global de -404.72 [kcal/mol] correspondiente al grupo 11(9240), el cual por lo tanto corresponde a la conformaci�n intermedia m�s estable.
Comparaci�n de los valores de Energ�a Libre obtenidos mediante los dos m�todos
La energ�a libre obtenida directamente a partir del valor de la energ�a libre de la estructura representativa en la trayectoria TMD, fluct�a considerablemente en comparaci�n con la obtenida a partir del promedio sobre el ensamble generado a partir de las trayectorias de equilibraci�n.
Figura 15: Comparaci�n de la energ�a libre de Gibbs, obtenida mediante los dos m�todos anteriores.
Barrera Energ�tica
A continuaci�n se presentan los valores de energ�a libre asociados a las diferentes conformaciones en funci�n de la primera coordenada principal del PCA, el RMSD0, y el RMSDf.
Figura 16: PCA, obtenido de la aplicaci�n del an�lisis de componentes principales a las estructuras de la trayectoria TMD, se ha aplicado la transformaci�n PCA' = max(PCA) - PCA de forma que se muestre el incremento de la variable.
Figura 17: RMSD0, este par�metro fue calculado con respecto a la estructura no-fusog�nica.
Tanto para el PCA como para el RMSD0 como coordenadas de reacci�n, se puede ver el m�nimo local de energ�a libre correspondiente a la cuarta conformaci�n intermedia, en tanto que las conformaciones {10, 11, 12 y 13} se encuentran muy pr�ximas en el eje correspondiente tanto al PCA como al RMSD0, por lo cual se puede ver una correlaci�n entre las dos posibles coordenadas de reacci�n.
�
Figura 18: RMSDf calculado con respecto a la estructura fusog�nica, se ha aplicado la transformaci�n: RMSD'f = max(RMSDf) � RMSDf, de forma que se muestre el incremento de la variable.
Por otra parte, para el RMSDf se puede observar que las conformaciones {10, 11, 12 y 13} est�n mejor espaciadas, y se manifiesta una posible transici�n natural entre las conformaciones {8, 9, 10, 11, 12}.
Conclusiones
En este art�culo se ha investigado la evoluci�n de la entrop�a para la transici�n conformacional del lazo 36 de la Hemaglutinina, para lo cual primero se evalu� la pertinencia de las conformaciones determinadas mediante an�lisis de grupos en el espacio de Ramachandran, posteriormente se obtuvieron frecuencias a trav�s de la aproximaci�n quasi-arm�nica con las cuales se pudo estimar la entrop�a, y a la vez estimar la contribuci�n de entr�pica de la energ�a libre, y con ello describir la barrera energ�tica asociada a la transici�n conformacional.
El an�lisis de grupos en el plano de Ramachandran para cada grupo, muestra que los grupos 3, 4 y 5 no tienen subgrupos para las distancias de corte consideradas, por ello se puede afirmar que est�n bien definidos de acuerdo a los dos criterios utilizados (RMSD y distancia en el espacio de Ramachandran). Por otra parte los grupos 7 y 8 son los que m�s subgrupos presentan para las distancias de corte consideradas y reafirma la posibilidad de existencia de grupos adicionales.
Las
frecuencias obtenidas a trav�s de la aproximaci�n quasi-arm�nica se encuentra
en el rango entre �y
,
con la mayor�a de frecuencias en el rango entre
�
y
,
lo cual permite establecer una relaci�n directa entre las frecuencias
encontradas y el comportamiento molecular, ya que coinciden con el rango de las
frecuencias de vibraci�n molecular. Por otra parte, se comprob� que las
frecuencias de menor valor, corresponden a modos colectivos de vibraci�n, entre
los cuales se analiz� la oscilaci�n del centro de masa, y se comprob� que esta
oscilaci�n tiene un m�ximo de frecuencia en torno a
.
De esta forma se puede verificar que la aproximaci�n quasi-arm�nica, produce
resultados consistentes con los resultados experimentales (Bullough et al.,
1994).
La
estimaci�n de la entrop�a a trav�s de la aproximaci�n quasi-arm�nica, provee
valores de entrop�a del orden de ,
y valores de diferencia de entrop�a con un m�ximo de
,
lo cual produce una contribuci�n energ�tica de la entrop�a m�xima de
,
este valor difiere en 2 �rdenes de magnitud del valor reportado en trabajos
anteriores (Calder�n, 2015); sin embargo la distribuci�n de los valores
obtenidos, siguen una tendencia similar, con un cambio abrupto de
�en
la conformaci�n 12 cuya estructura representativa es la 9240.
Para
la descripci�n de la barrera energ�tica se probaron 3 posibles coordenadas de
reacci�n, tanto para la primera coordenada principal como para el �se
tiene un comportamiento similar, por lo cual se puede ver una posible
correlaci�n entre las dos coordenadas de reacci�n. Por otra parte, la
coordenada que mejor describe el sistema es
,
ya que permite apreciar la barrera energ�tica durante todas las etapas de la
transici�n.
En el futuro, ser�a relevante utilizar las estructuras representativas encontradas mediante an�lisis de grupos, considerando como par�metros tanto el RMSD como la distancia eucl�dea en el plano de Ramachandran, ya que los resultados de utilizar los dos criterios se pueden considerar como complementarios. Esto permitir�a adem�s encontrar valores adicionales de entrop�a, utilizando los mismos datos de simulaciones de din�mica molecular para cada conformaci�n, ya que se podr�a aplicar la aproximaci�n quasi-arm�nica sobre particiones de la trayectoria en subconjuntos de estructuras, que correspondan a los grupos adicionales. Otro aspecto a tomar en cuenta es que, en la aproximaci�n quasi-arm�nica, la componente de frecuencias bajas contribuyen mayoritariamente a la entrop�a, por ello resultar�a relevante ampliar el an�lisis espectral presentado en la secci�n 3.2.1, de modo que incluya no solo la oscilaci�n del centro de masa, sino tambi�n otros aspectos, por ejemplo, la rotaci�n de la mol�cula.
Referencias
1. Banta, Scott et al. (2007). �Engineering protein and peptide building blocks for nanotechnology�. Journal of Nanoscience and Nanotechnology, 7(2), 387-401.
2. Baron, Riccardo et al. (2009). �Absolute single-molecule entropies from quasi-harmonic analysis of microsecond molecular dynamics: correction terms and convergence properties�. Journal of Chemical Theory and Computation, 5(12), 3150-3160.
3. Barth, Andreas (2007). �Infrared spectroscopy of proteins�. Biochimica et Biophysica Acta (BBA)-Bioenergetics, 1767(9), 1073-1101.
4. Berman, Helen M et al. (2000). �The protein data bank�. Nucleic Acids Research, 28(1), 235-242.
5. Br�nd�n, Carl-Ivar y John Tooze (1999). �Introduction to Protein Structure�. Taylor & Francis.
6. Bullough, Per A et al. (1994). �Structure of influenza haemagglutinin at the pH of membrane fusion�. Nature, 371(6492), 37-43.
7. Calder�n, Jaime Rodrigo (2015). �Descripci�n estad�stica del proceso de plegamiento del lazo 36 de la cadena AH2 de la Hemaglutinina�. Tesis EPN.
8. Carr, Chavela M. y Peter S. Kim (1993). �A spring-loaded mechanism for the conformational change of influenza hemagglutinin�. Cell, 73(4), 823-832.
9. Dill, Ken y Sarina Bromberg (2010). �Molecular driving forces: statistical thermodynamics in biology, chemistry, physics, and nanoscience. � Garland Science.
10. Dubey, A et al. (2003). �Viral protein linear (VPL) nano-actuators�., Third IEEE Conference on Nanotechnology 2003, 1, 140-143.
11. Humphrey, William et al. (1996). �VMD: visual molecular dynamics�. Journal of molecular graphics, 14(1), 33-38.
12. Jeffers, J. N. R. (1967). �Two Case Studies in the Application of Principal
Component Analysis�. Journal of the Royal Statistical Society. Series
C (Applied Statistics), 16(3), 225-236.
13. Jolliffe, Ian T. (1986). �Principal Component Analysis. � Springer.
14. Karplus, Martin y Joseph N Kushick (1981). �Method for estimating the
configurational entropy of macromolecules�. Macromolecules, 14(2), 325-332.
15. Meirovitch, Hagai et al. (2009). �Methods for calculating the entropy and
free energy and their application to problems involving protein flexibility
and ligand binding�. Current Protein and Peptide Science, 10(3), 229-243.
16. Morales, Hern�n y Marco Bayas (2013). �Efecto de mutaciones puntuales en las transiciones conformacionales de un nanomotor biol�gico�. Revista Polit�cnica, 32(3), 63-70.
17. Numata, J et al. (2007). �Conformational entropy of biomolecules: beyond
the quasi-harmonic approximation. � Genome informatics. International
Conference on Genome Informatics, 18, 192.
18. Phillips, James C et al. (2005). �Scalable molecular dynamics with NAMD�.
Journal of computational chemistry, 26(16), 1781-1802.
19. R Core Team (2015). �R: A Language and Environment for Statistical Computing. � R Foundation for Statistical Computing. Vienna, Austria.
20. Ramachandran, G. y V. Sasisekharan (1968). �Conformation of polypeptides
and proteins�. Advances in protein chemistry, 23, 283-437.
21. Sauter, Nicholas K. et al. (1992). �Binding of influenza virus hemagglutinin to analogs of its cell-surface receptor, sialic acid: analysis by proton nuclear magnetic resonance spectroscopy and X-ray crystallography�. Biochemistry, 31(40), 9609-9621.
22. Sch�fer, Heiko et al. (2000). �Absolute entropies from molecular dynamics
simulation trajectories�. The Journal of Chemical Physics, 113(18), 7809-7817.
23. Schlitter, Jürgen (1993). �Estimation of absolute and relative entropies of macromolecules using the covariance matrix�. Chemical Physics Letters, 215(6), 617-621.
24. Thijssen, Jos (2007). �Computational physics�. Cambridge university press.
25. Van Rossum, Guido y Fred L Drake Jr (1995). �Python reference manual�. Centrum voor Wiskunde en Informatica Amsterdam.
26. Zhou, Yu et al. (2014). �Exploring the early stages of the pH-induced conformational change of influenza hemagglutinin�. Proteins: Structure, Function, and Bioinformatics, 82(10), 2412-2428.
� 2024 por los autores. Este art�culo es de acceso abierto y distribuido seg�n los t�rminos y condiciones de la licencia Creative Commons Atribuci�n-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)
(https://creativecommons.org/licenses/by-nc-sa/4.0/).
�������������������������������������������������������������������������������������������������������������������������
Enlaces de Referencia
- Por el momento, no existen enlaces de referencia
Polo del Conocimiento
Revista Científico-Académica Multidisciplinaria
ISSN: 2550-682X
Casa Editora del Polo
Manta - Ecuador
Dirección: Ciudadela El Palmar, II Etapa, Manta - Manabí - Ecuador.
Código Postal: 130801
Teléfonos: 056051775/0991871420
Email: polodelconocimientorevista@gmail.com / director@polodelconocimiento.com
URL: https://www.polodelconocimiento.com/