"Identificação de regiões genômicas seguras para aplicações de biologia sintética"
Porto Seguro Genômico, Python, S. cerevisiae, Biologia sintética
Desde o início da engenharia genética, a inserção de genes exógenos em células hospedeiras apresentou desafios, seja pelo aumento do tamanho das inserções, seja pelo desafio de direcionamento preciso para integração em regiões do genoma permissivas para transcrição. Com o advento da Biologia Sintética, há um aumento da complexidade para a inserção, não apenas de um gene, mas de diversos genes componentes de vias metabólicas e circuitos genéticos, além da necessidade de estudos mais refinados de organização, estruturação e regulação genômica. A fim de evitar integração aleatória no genoma que possa gerar expressões instáveis ou fenótipos imprevisíveis, é demandado integração específica sem modificação da expressão de genes endógenos codificadores de proteínas essenciais. Uma abordagem comum é direcionar as inserções para regiões intragênicas ou intergênicas capazes de acomodar a expressão esperada do inserto sem alterações adversas ao hospedeiro, denominadas Porto Genômico seguro (do inglês, Genomic Safe Harbor, GSH). GSHs foram encontrados em humanos, camundongos, macacos e Cryptococcus, porém em sua maioria estão em regiões com alta densidade gênica e no caso de humanos próximos a genes relacionados ao câncer. Com o objetivo de expandir o número de GSHs disponíveis em diferentes organismos, a presente proposta visou o desenvolvimento de um programa de identificação de prováveis GSHs com uma abordagem otimizada seguindo critérios definidos para refinar a busca por novas regiões extragênicas de inserção em três organismos eucarióticos: humano, camundongo e Saccharomyces cerevisiae. Esse programa, SHIP (do inglês, Safe Harbor Identification Program), foi desenvolvido na linguagem Python e utilizou como entrada arquivos de anotação gênica do organismo estudado aliado a informações de características regulatórias de expressão gênica, como potencial de metilação do DNA, locais de ligação de fator de transcrição e sítios de alterações de histonas, identificando 6 pGSHs em Saccharomyces cerevisiae, 16 em Homo sapiens e 11 em Mus musculus. Adicionalmente, essa proposta validou in vivo 5 GSHs identificados pelo programa SHIP no organismo modelo S. cerevisiae. Desta maneira, o programa SHIP é o primeiro algoritmo, disponível e validado experimentalmente, userfriendly e capaz de identificar pGSHs em qualquer organismo Eucarioto com anotação genômica.