O que é o AlphaGenome, nova ferramenta do Google

Ler Resumo
O Google deu mais um passo importante na compreensão do genoma humano com o lançamento do AlphaGenome, uma ferramenta de Inteligência Artificial divulgada na quarta-feira, 28, na revista Nature. Diferentemente das abordagens anteriores, esta nova tecnologia se concentra em analisar como determinadas partes do DNA regulam a atividade dos genes nas células, abrindo caminho para uma compreensão mais profunda da “gramática” da vida.
Pushmeet Kohli, vice-presidente de pesquisas da Google DeepMind, explicou na apresentação que, embora a decodificação completa do genoma humano em 2003 tenha nos dado “o livro da vida”, lê-lo continua sendo um desafio monumental. “Temos o texto” — a sucessão de 3 bilhões de pares de nucleotídeos A, T, C e G que compõem o DNA —, mas “compreender a gramática e a forma como ela governa a vida constitui a próxima grande fronteira da pesquisa”, ressaltou.
A importância do AlphaGenome reside no seu foco nas sequências “não codificantes” do DNA, que representam 98% do genoma humano. Enquanto apenas 2% das sequências codificam diretamente proteínas indispensáveis ao funcionamento dos organismos vivos, os 98% restantes desempenham o papel de “maestro”: coordenam, protegem e regulam a expressão da informação genética em cada uma de nossas células. Estas sequências não codificantes contêm numerosas variantes associadas a doenças, tornando sua compreensão fundamental para a medicina.
O AlphaGenome complementa outros modelos desenvolvidos pelo laboratório de IA do Google, incluindo o AlphaMissense, que analisa as sequências codificantes do DNA, o AlphaProteo, voltado ao design de proteínas, e o AlphaFold, que prediz a estrutura de proteínas e recebeu o Prêmio Nobel de Química em 2024. Este modelo de aprendizagem profunda, em que uma rede neural aprende a reconhecer automaticamente padrões complexos, foi treinado com dados procedentes de grandes consórcios públicos que mediram experimentalmente essas propriedades em centenas de tipos de células e tecidos em humanos e ratos. A ferramenta é capaz de analisar uma longa sequência de DNA e prever a influência de cada par de nucleotídeos em diferentes processos biológicos da célula.
Um dos principais diferenciais do AlphaGenome em relação a modelos anteriores é sua capacidade de superar o compromisso que precisava ser feito entre o comprimento das sequências analisadas e a precisão da resolução. Segundo Žiga Avsec, um dos coautores do projeto, uma sequência longa de até um milhão de pares de nucleotídeos é necessária para compreender o ambiente regulatório completo de um único gene. A precisão da resolução, por sua vez, permite estudar o efeito de variantes genéticas comparando as previsões de sequências mutadas com as de sequências não mutadas. Além disso, o AlphaGenome modela simultaneamente a influência da sequência em 11 processos biológicos, enquanto até agora os cientistas precisavam utilizar vários modelos diferentes para essa análise.
Natasha Latysheva, também coautora do projeto, estima que esta ferramenta “pode acelerar a nossa compreensão do genoma ao ajudar a cartografar a localização dos elementos funcionais e a determinar seus papéis a nível molecular”. Kohli acrescentou que espera que os pesquisadores enriqueçam o modelo com mais dados e modalidades. O AlphaGenome já foi testado por 3.000 cientistas de 160 países e agora está disponível em código aberto para pesquisa não comercial.
A comunidade científica recebeu a ferramenta com cautela. Ben Lehner, responsável pela genômica generativa e sintética no Wellcome Sanger Institute em Cambridge, observou que “identificar com precisão as diferenças em nossos genomas que nos tornam mais ou menos suscetíveis a desenvolver milhares de doenças é um passo crucial rumo a melhores tratamentos”. O pesquisador, que não participou no projeto mas testou o modelo, considera-o “muito eficaz”, embora ainda “longe de ser perfeito”. Lehner explicou ao britânico Science Media Center que “os modelos de IA são tão bons quanto os dados usados para treiná-los”, e a maioria dos conjuntos de dados existentes “são muito pequenos e não estão suficientemente padronizados”.
Robert Goldstone, responsável pela genômica no Francis Crick Institute, concorda que o AlphaGenome não é uma “solução milagrosa para todas as questões biológicas”, já que a expressão dos genes é influenciada por fatores ambientais complexos. No entanto, ele considera a ferramenta fundamental e acredita que ela permitirá aos cientistas “estudar e simular de maneira programática as bases genéticas das doenças complexas”, representando um avanço significativo na busca por tratamentos mais eficazes para condições médicas que há muito desafiam a ciência.
(Com AFP)
Compartilhe essa matéria via:
