“Pipeline de pipelines” melhora reconstrução de genomas virais em contexto clínico

“Pipeline de pipelines” melhora reconstrução de genomas virais em contexto clínico

Investigadores da Universidade de Aveiro (UA) lideram estudo internacional que propõe nova abordagem para melhorar a reconstrução de genomas virais humanos a partir de dados genómicos, um passo crítico para o diagnóstico, a estratificação de risco e a vigilância em saúde pública.

Esta imagem não tem texto alternativo. O nome do ficheiro é: genoma


O trabalho, desenvolvido pelo Instituto de Engenharia Electrónica e Informática de Aveiro (IEETA) e pelo Departamento de Electrónica, Telecomunicações e Informática (DETI), em colaboração com a Universidade de Helsínquia, foi publicado na revista científica GigaScience.

A investigação apresenta um inovador “pipeline de pipelines”, materializado num benchmark aberto e totalmente reprodutível, concebido para avaliar e comparar programas de reconstrução de genomas virais em contexto clínico.

Esta ferramenta pretende responder a um desafio crescente na área da genómica: a multiplicação de pipelines disponíveis, atualmente cerca de 30, e a dificuldade em selecionar soluções que conciliem rigor científico, eficiência computacional e aplicabilidade clínica.

A deteção de vírus humanos desempenha um papel fundamental na prática clínica, apoiando o diagnóstico de infeções agudas e persistentes, a deteção precoce de patologias associadas, como o cancro, a orientação de decisões terapêuticas e a monitorização da resposta ao tratamento. É igualmente determinante para a vigilância epidemiológica e a resposta a surtos e epidemias, como ficou demonstrado durante a pandemia de Covid-19.

No entanto, a reconstrução de genomas virais a partir de amostras humanas é tecnicamente exigente. As amostras contêm frequentemente material genético diverso, os sinais virais podem surgir em baixa abundância e existem regiões de baixa complexidade que dificultam a análise. “É como tentar montar um puzzle gigante com peças muito pequenas, misturadas com fragmentos de outros puzzles”, explica Maria Sousa, doutoranda da UA e primeira autora do estudo.

Além da complexidade dos dados, muitos dos pipelines existentes não são verdadeiramente “prontos a usar”, exigindo ajustes específicos consoante o tipo de amostra. Quando não é possível recorrer a uma solução adequada, a deteção pode ficar limitada a métodos como o PCR, eficazes para confirmar a presença do vírus, mas menos informativos para caracterizar o genoma e identificar variantes com impacto clínico.

O estudo agora publicado resulta de cerca de três anos de trabalho computacional intensivo, combinando uma revisão sistemática de ferramentas open-source com uma avaliação quantitativa do seu desempenho, testada em cenários controlados e em dados reais. “Foi necessário compreender em profundidade como cada pipeline funciona, interligar ferramentas e, em muitos casos, adaptar código”, refere Maria Sousa.

A infraestrutura desenvolvida permite agora que grupos de investigação, centros clínicos e hospitais utilizem este benchmark para comparar ferramentas e selecionar a solução mais adequada a cada contexto, com base em critérios de precisão, robustez e custos computacionais. O trabalho oferece ainda recomendações práticas que apoiam a tomada de decisão em diferentes cenários de reconstrução de genomas virais, contribuindo para uma aplicação mais eficaz da genómica na prática clínica.