“Pipeline de pipelines” melhora reconstrução de genomas virais em contexto clínico
Investigadores da Universidade de Aveiro (UA) lideram estudo internacional que propõe nova abordagem para melhorar a reconstrução de genomas virais humanos a partir de dados genómicos, um passo crítico para o diagnóstico, a estratificação de risco e a vigilância em saúde pública.

O trabalho, desenvolvido pelo Instituto de Engenharia Electrónica e Informática de Aveiro (IEETA) e pelo Departamento de Electrónica, Telecomunicações e Informática (DETI), em colaboração com a Universidade de Helsínquia, foi publicado na revista científica GigaScience.
A investigação apresenta um inovador “pipeline de pipelines”, materializado num benchmark aberto e totalmente reprodutível, concebido para avaliar e comparar programas de reconstrução de genomas virais em contexto clínico.
Esta ferramenta pretende responder a um desafio crescente na área da genómica: a multiplicação de pipelines disponíveis, atualmente cerca de 30, e a dificuldade em selecionar soluções que conciliem rigor científico, eficiência computacional e aplicabilidade clínica.
A deteção de vírus humanos desempenha um papel fundamental na prática clínica, apoiando o diagnóstico de infeções agudas e persistentes, a deteção precoce de patologias associadas, como o cancro, a orientação de decisões terapêuticas e a monitorização da resposta ao tratamento. É igualmente determinante para a vigilância epidemiológica e a resposta a surtos e epidemias, como ficou demonstrado durante a pandemia de Covid-19.
No entanto, a reconstrução de genomas virais a partir de amostras humanas é tecnicamente exigente. As amostras contêm frequentemente material genético diverso, os sinais virais podem surgir em baixa abundância e existem regiões de baixa complexidade que dificultam a análise. “É como tentar montar um puzzle gigante com peças muito pequenas, misturadas com fragmentos de outros puzzles”, explica Maria Sousa, doutoranda da UA e primeira autora do estudo.
Além da complexidade dos dados, muitos dos pipelines existentes não são verdadeiramente “prontos a usar”, exigindo ajustes específicos consoante o tipo de amostra. Quando não é possível recorrer a uma solução adequada, a deteção pode ficar limitada a métodos como o PCR, eficazes para confirmar a presença do vírus, mas menos informativos para caracterizar o genoma e identificar variantes com impacto clínico.
O estudo agora publicado resulta de cerca de três anos de trabalho computacional intensivo, combinando uma revisão sistemática de ferramentas open-source com uma avaliação quantitativa do seu desempenho, testada em cenários controlados e em dados reais. “Foi necessário compreender em profundidade como cada pipeline funciona, interligar ferramentas e, em muitos casos, adaptar código”, refere Maria Sousa.
A infraestrutura desenvolvida permite agora que grupos de investigação, centros clínicos e hospitais utilizem este benchmark para comparar ferramentas e selecionar a solução mais adequada a cada contexto, com base em critérios de precisão, robustez e custos computacionais. O trabalho oferece ainda recomendações práticas que apoiam a tomada de decisão em diferentes cenários de reconstrução de genomas virais, contribuindo para uma aplicação mais eficaz da genómica na prática clínica.


