Genoma humano inteiro foi sequenciado pela primeira vez. Mistério Resumo.

Gabrielle Hartley - candidata a doutorado em biologia molecular e celular na Universidade de Connecticut - analisa mais de perto esse feito impressionante e como foi alcançado.

Quando o Projeto anunciou que havia completado o primeiro genoma humano em 2003, foi uma conquista importante - pela primeira vez, o projeto de DNA da vida humana foi desbloqueado. Mas veio com um problema - eles não foram realmente capazes de reunir todas as informações genéticas no genoma. Havia lacunas: regiões não preenchidas, muitas vezes repetitivas, que eram confusas demais para serem reunidas.

Com os avanços na tecnologia que poderiam lidar com essas sequências repetitivas, os cientistas finalmente preencheram essas lacunas em maio de 2021, e o primeiro genoma humano de ponta a ponta foi publicado oficialmente em 31 de março de 2022.

As peças do quebra-cabeça que faltavam 

O botânico alemão Hans Winkler cunhou a palavra "genoma" em 1920, combinando a palavra "gene" com o sufixo "-ome", que significa "conjunto completo", para descrever a sequência completa de DNA contida em cada célula. Os pesquisadores ainda usam essa palavra um século depois para se referir ao material genético que compõe um organismo.

Uma maneira de descrever a aparência de um genoma é compará-lo a um livro de referência. Nesta analogia, um genoma é uma antologia que contém as instruções do DNA para a vida. É composto por uma vasta gama de nucleotídeos (letras) que são empacotados em cromossomos (capítulos). Cada cromossomo contém genes (parágrafos) que são regiões do DNA que codificam as proteínas específicas que permitem que um organismo funcione.

Embora todo organismo vivo tenha um genoma, o tamanho desse genoma varia de espécie para espécie. Um elefante usa a mesma forma de informação genética que a grama que come e as bactérias em seu intestino. Mas não há dois genomas exatamente iguais. Alguns são curtos, como o genoma da bactéria que vive em insetos Nasuia deltocephalinicola, com apenas 137 genes em 112.000 nucleotídeos. Alguns, como os 149 bilhões de nucleotídeos da planta com flores Paris japonica, são tão longos que é difícil ter uma noção de quantos genes estão contidos neles.

Mas os genes como tradicionalmente são entendidos - como trechos de DNA que codificam proteínas - são apenas uma pequena parte do genoma de um organismo. Na verdade, eles representam menos de 2% do DNA humano.

O genoma humano contém cerca de 3 bilhões de nucleotídeos e pouco menos de 20.000 genes codificadores de proteínas - cerca de 1% do comprimento total do genoma. Os 99% restantes são sequências de DNA não codificantes que não produzem proteínas. Alguns são componentes reguladores que funcionam como um painel de controle para controlar como outros genes funcionam. Outros são pseudogenes, ou relíquias genômicas que perderam sua capacidade de funcionar.

E mais da metade do genoma humano é repetitivo, com várias cópias de sequências quase idênticas.

O que é DNA repetitivo?

A forma mais simples de DNA repetitivo são blocos de DNA repetidos várias vezes em conjunto chamados satélites. Embora a quantidade de DNA satélite de um determinado genoma varie de pessoa para pessoa, eles geralmente se agrupam nas extremidades dos cromossomos em regiões chamadas telômeros. Essas regiões protegem os cromossomos da degradação durante a replicação do DNA. Eles também são encontrados nos centrômeros dos cromossomos, uma região que ajuda a manter a informação genética intacta quando as células se dividem.

Os pesquisadores ainda carecem de uma compreensão clara de todas as funções do DNA de satélite. Mas como o DNA de satélite forma padrões únicos em cada pessoa, biólogos forenses e genealogistas usam essa "impressão digital" genômica para combinar amostras da cena do crime e rastrear ancestralidade. Mais de 50 doenças genéticas estão ligadas a variações no DNA satélite, incluindo 'Huntington'.

Outro tipo abundante de DNA repetitivo são os elementos transponíveis, ou sequências que podem se mover pelo genoma.

Alguns cientistas os descreveram como DNA egoísta porque podem se inserir em qualquer lugar do genoma, independentemente das consequências. À medida que o genoma humano evoluiu, muitas sequências transponíveis coletaram mutações reprimindo sua capacidade de se mover para evitar interrupções prejudiciais. Mas alguns provavelmente ainda podem se mover. Por exemplo, as inserções de elementos transponíveis estão ligadas a vários casos de hemofilia A, um distúrbio genético de sangramento.

Mas os elementos transponíveis não são apenas disruptivos. Eles podem ter funções reguladoras que ajudam a controlar a expressão de outras sequências de DNA. Quando estão concentrados nos centrômeros, também podem ajudar a manter a integridade dos genes fundamentais para a sobrevivência das células.

Eles também podem contribuir para a evolução. Pesquisadores descobriram recentemente que a inserção de um elemento transponível em um gene importante para o desenvolvimento pode ser o motivo pelo qual alguns primatas, incluindo humanos, não têm mais caudas. Rearranjos cromossômicos devido a elementos transponíveis estão ligados à gênese de novas espécies como os gibões do sudeste da Ásia e os cangurus da Austrália.

Completando o quebra-cabeça genômico

Até recentemente, muitas dessas regiões complexas podiam ser comparadas ao outro lado da lua: conhecido por existir, mas invisível.

Quando o Projeto Genoma Humano foi lançado pela primeira vez em 1990, limitações tecnológicas impossibilitaram a descoberta completa de regiões repetitivas no genoma. A tecnologia de sequenciamento disponível só podia ler cerca de 500 nucleotídeos por vez, e esses fragmentos curtos precisavam se sobrepor para recriar a sequência completa. Os pesquisadores usaram esses segmentos sobrepostos para identificar os próximos nucleotídeos na sequência, estendendo incrementalmente a montagem do genoma um fragmento de cada vez.

Essas regiões de lacunas repetitivas eram como montar um quebra-cabeça de 1.000 peças de um céu nublado: quando cada peça parece a mesma, como você sabe onde uma nuvem começa e outra termina? Com trechos sobrepostos quase idênticos em muitos pontos, o sequenciamento completo do genoma por partes tornou-se inviável. Milhões de nucleotídeos permaneceram ocultos na primeira iteração do genoma humano.

Desde então, os patches de sequência preencheram gradualmente as lacunas do genoma humano, pouco a pouco. E em 2021, o Consórcio Telomere-to-Telomere (T2T), um consórcio internacional de cientistas que trabalha para completar a montagem do genoma humano de ponta a ponta, anunciou que todas as lacunas restantes foram finalmente preenchidas.

Isso foi possível graças à tecnologia de sequenciamento aprimorada capaz de ler sequências mais longas com milhares de nucleotídeos de comprimento. Com mais informações para situar sequências repetitivas dentro de uma imagem maior, ficou mais fácil identificar seu lugar apropriado no genoma. Assim como simplificar um quebra-cabeça de 1.000 peças para um quebra-cabeça de 100 peças, as sequências de leitura longa tornaram possível montar grandes regiões repetitivas pela primeira vez.

Com o crescente poder da tecnologia de sequenciamento de DNA de leitura longa, os geneticistas estão posicionados para explorar uma nova era da genômica, desvendando sequências repetitivas complexas em populações e espécies pela primeira vez. E um genoma humano completo e livre de lacunas fornece um recurso inestimável para pesquisadores investigarem regiões repetitivas que moldam a estrutura e variação genética, a evolução das espécies e a saúde humana.

Mas um genoma completo não captura tudo. Os esforços continuam a criar diversas referências genômicas que representam plenamente a população humana e a vida na Terra. Com referências genômicas mais completas, "telômero a telômero", a compreensão dos cientistas sobre a matéria escura repetitiva do DNA se tornará mais clara.

[Unexplained]

Postagem mais recente Postagem mais antiga
 
});