Folding in silico I: Dinâmica molecular

De acordo com Christian Anfinsen, se conhecermos a totalidade das interacções que se estabelecem entre os átomos de uma proteína, devemos, em princípio, poder prever qual será a estrutura tridimensional adoptada pela cadeia de aminoácidos que contém esses átomos. Mas será fácil essa tarefa?

Em condições fisiológicas a estrutura nativa é determinada pela totalidade de interacções entre os aminoácidos...


Hemoglobina
Hemoglobina

De uma forma simplificada podemos dizer que as interacções entre os átomos são de natureza electrostática e quântica. É claro que dentro das interacções electrostáticas temos que distinguir várias categorias (interacções de Lennard-Jones, de van der Waals, pontes de hidrogénio, de solvatação com as moléculas de água etc.). Uma proteína como a hemoglobina (à direita), que transporta o oxigénio dos alvéolos pulmonares, contém cerca de 4000 átomos que podem, em princípio, interagir durante o processo de folding. Para todos os pares de interacção possíveis é então preciso saber quanto valem os parâmetros de interacção correspondentes. O cálculo rigoroso destas quantidades requer um tratamento quântico e não é de todo trivial. Para além disso, há que ter em conta que o resultado do cálculo depende não só do tipo de átomo, mas também do ambiente químico em que se encontram os átomos participantes na interacção, o que gera complicações adicionais. Geralmente este tipo de cálculo faz-se com recurso a computadores no contexto das simulações por dinâmica molecular (DM).

Chip de computador.
A partir dos anos 90 do séc.XX, com o aumento da capacidade de cálculo dos computadores, começou a estudar-se o folding de proteínas no contexto de simulações computacionais por dinâmica molecular (DM).

As simulações por DM são simulações deterministas que modelam a proteína como sendo um sistema newtoniano de átomos ligados por molas. Por isso, para além das interacções electrostáticas entre os átomos, há ainda a considerar o cálculo dos parâmetros relativos às energias de alongamento, de torsão e de dobragem da ligação química.

Representação do alongamento, dobragem e torsão das ligações entre os átomos.
Representação do alongamento, dobragem e torsão das ligações entre os átomos.

Tudo isto implica o cálculo de um número extraordinariamente grande de parâmetros, que devem ser testados e refinados através de simulações que reproduzam a dinâmica do folding. Se o conjunto de parâmetros for bom, a molécula, que na simulação é lançada de uma conformação inicial arbitrária, deverá ser capaz de encontrar a sua estrutura nativa ao fim de um certo tempo.

As simulações por DM são extremamente exigentes do ponto de vista computacional. Se pensarmos que precisamos de um dia de CPU para simular um nanossegundo do processo de folding, o que é uma estimativa razoável tendo em conta as capacidades de cálculo dos computadores de que dispomos actualmente, se uma proteína consumir 10 000 nanossegundos para encontrar o seu estado nativo, então precisaríamos de 10 000 dias de CPU, ou seja cerca de 30 anos, para simular o processo de folding na totalidade. Isto é obviamente muito tempo para se esperar por apenas um resultado!

É claro que existem super-computadores capazes de simular mais do que um nanossegundo por dia e foi a eles que os dois cientistas americanos Yong Duan e Peter Kollman recorreram em 1998 para fazerem a simulação por DM que é ainda hoje considerada o estado da arte nesta área. Estes investigadores simularam, ainda que apenas parcialmente, o processo de folding de uma pequena proteína com 36 resíduos (villin headpiece) e doze mil átomos, na presença de água, durante 1000 ns o que correspondeu, na prática, à utilização de quatro meses de cálculo de CPU.

Instantâneos da simulação por dinâmica molecular do folding da villin headpiece levada a cabo por Duan e Kollman em 1998.
Instantâneos da simulação por dinâmica molecular do folding da villin headpiece levada a cabo por Duan e Kollman em 1998.

O Blue gene é um super-computador construído pela IBM para estudar folding de proteínas. Esta máquina ocupa metade de um campo de ténis. A 14 de Novembro de 2005 executava 280.6 x 10 12 operações matemáticas por segundo.

Blue gene.
Blue gene. Um super-computador criado pela IBM para estudar folding de proteínas por dinâmica molecular.

Do que foi exposto acima fica claro que se uma simulação por DM for bem sucedida conduzindo a proteína para o estado nativo então ficamos a conhecer, para aquela proteína específica, a relação sequência-estrutura. Para qualquer outra proteína teremos que fazer um estudo semelhante se quisermos modelar as interacções reais entre os átomos que a compõem. Apesar de ser importante, este tipo de estudo tem, para além da desvantagem de ser muito exigente do ponto de vista computacional, a desvantagem de não permitir identificar os princípios gerais (universais) envolvidos no folding de proteínas. Para tal devemos recorrer a modelos muito mais simples do que os usados em MD, os chamados modelos de rede.