Esta nova inteligência artificial (IA) funciona de forma semelhante aos modelos de linguagem, como o ChatGPT, que utilizam um conjunto de dados de treino para identificar padrões subjacentes e, em seguida, aplicar essas regras inferidas a novas situações.
Neste caso, foi utilizado um modelo de aprendizagem denominado GET com dados de mais de 1,3 milhões de células de 213 tipos obtidas a partir de tecido humano saudável. Por detrás desta nova IA estão cientistas da Universidade de Colúmbia.
Os detalhes do GET (transformador geral de expressão genética) foram recentemente publicados na revista Nature e o espanhol Raúl Rabadán, especialista em biologia de sistemas e genómica do cancro, confirmou à agência Efe que o algoritmo é público e está disponível para toda a comunidade científica.
“O GET é o início, o meu grupo na Columbia está agora a expandir o método para mais de 50 milhões de células, e com aplicações no estudo de diferentes tipos de cancro (tumores cerebrais, linfomas, entre outros). As aplicações são enormes”, realçou.
As ferramentas tradicionais de investigação em biologia são boas para revelar como as células fazem o seu trabalho ou reagem a perturbações, mas não conseguem prever como as células funcionam ou como responderiam a uma alteração, como uma mutação causadora de cancro.
“Ter a capacidade de prever com precisão as atividades de uma célula transformaria a nossa compreensão dos processos biológicos fundamentais”, vincou o investigador, citado num comunicado da universidade.
Nos últimos anos, a acumulação de grandes quantidades de dados celulares e de poderosos modelos de IA, como o AlphaFold da Google ou o ESMFold da Meta, concebidos para revelar a estrutura das proteínas, estão a começar a transformar a biologia numa ciência mais preditiva.
O Prémio Nobel da Química de 2024 foi atribuído a investigadores pelo seu trabalho pioneiro na utilização da IA para prever com precisão as estruturas das proteínas, blocos de construção da vida.
Usar estes métodos para prever as atividades dos genes e das proteínas dentro das células tem-se revelado mais difícil.
Para avançar neste campo, Rabadán e a sua equipa conceberam a nova IA para prever quais os genes ativos em células específicas.
Esta informação sobre a expressão genética — o processo pelo qual as proteínas são obtidas a partir dos genes — pode indicar a identidade da célula e a forma como desempenha as suas funções.
E todas as células do corpo têm o mesmo ADN, mas funções diferentes. O que muda e determina a sua função (ou quando não funcionam) são os genes que são expressos, ou seja, a quantidade de proteínas que são geradas em cada célula.
“A expressão é como o volume de cada gene, alguns são desligados e outros são altamente expressos. Há genes que são altamente expressos numa célula e pouco noutra. O que o GET aprende é a ‘gramática’ de que genes são expressos em cada célula”, detalhou Rabadán à Efe.
Após o treino com dados de mais de 1,3 milhões de células humanas, o sistema foi suficientemente preciso para prever a expressão genética em tipos de células nunca antes vistos, com resultados muito semelhantes às experiências realizadas posteriormente em laboratório.
“Podemos, por exemplo, treinar o modelo sem que ele nunca tenha visto um astrócito e pedir-lhe que faça previsões sobre a expressão de todos os genes nessas células nervosas”, acrescentou.
LUSA/HN
0 Comments