Brincando de Comparar Códons

Sou daquelas pessoas que simplesmente não conseguem dormir direito com um mistério. Essa é uma obsessão que provavelmente muitos cientisas (e “wannabe scientists”, como eu) têm. Às vezes ficamos obcecados com uma coisa muito importante, às vezes com uma coisa banal e muitas vezes com algo que você nunca parou para pensar direito. O mais emocionante é que qualquer resposta de uma dúvida tem aquela probabilidade mágica de revelar algo impressionante ou bem útil. Hoje (dia dessa postagem), fiquei obcecado por tentar entender “na prática” qual é a grande ideia da otimização de códons e o quanto os organismos podem ter preferências de códons diferentes.  Aqui está o registro da investigação do pequeno mistério de hoje!

Códons, Otimizações e Preferências

Antes de discorrer sobre o que andei brincando. Uma pequena contextualização ao intrépido viajante sobre o que são códons, porque eles precisam ser otimizados e o que diabos é essa “preferência de códons”.

Códons são os trios de combinações de letrinhas A,T,C e G do DNA (os nucleotídeos) que, depois de transcritos a RNA (em que a grande diferença é que os “T’s” são substituídos por “U’s”), são literalmente traduzidos em aminoácidos; ou seja: três nucleotídeos codificam um  aminoácido. A grande coisa dos códons é que eles são redundantes: existe mais de uma maneira de um aminoácido específico ser traduzido à partir dos trios de nucleotídeos. Os cientistas fizeram uma tabela espertinha que “decodifica” nucleotídeos em aminoácidos:

codons_aminoacids_table
Comece lendo do centro até às bordas do círculo combinando as letras que você for olhando pelo caminho. Por exemplo: U+A+C = Tyr, abreviação de Tirosina.

 Mas aí você se pergunta: “Querida Natureza, qual é o propósito disso!?”. A redundância da leitura de aminoácidos tem uma implicação muito importante na conservação do código genético; ela é a última barreira espertinha da contra mutações no DNA. Imagine que o “C” do códon UAC que traduz uma Tirosina fosse mutado e virasse um “U” (dando UAU): graças à redundância de tradução, o aminoácido Tirosina ainda continua sendo traduzido! Pra  se ter uma ideia de como isso é importante, uma única substituição de aminoácidos (o que pode acontecer com uma única mutação de nucleotídeos) já pode gerar doenças (pesquise sobre Anemia Falciforme).

Enfim, concluindo: existem muitos códons que podem ser traduzidos em diferentes tipos de aminoácidos. Como existem muitas opções, diferentes organismos costumam a ter preferências por diferentes códons para traduzir aminoácidos específicos – por exemplo: nós Humanos adoramos traduzir Arginina como AGA e AGG, já uma das bactérias do nosso cocô, a E.coli, acha muito mais interessante traduzir Arginina como CGU e CGC. Vai entender esses procariotos viu!

Mas porque isso acontece? Porque evolutivamente cada espécie foi selecionada em um ambiente particular, o que implica em diferentes necessidades de estabilidade do DNA em diferentes contextos, e portanto diferentes porcentagens de C e G, e A e T no genoma. Essas porcentagens direcionam quais códons os organismos preferem.

Por causa de tudo isso, quando algum cientista vai fazer o design de um pedaço de DNA, é preciso colocar a sequência no contexto do organismo a ser utilizado, deixando os códons “otimizados” para cada ser vivo – caso contrário, os genes inseridos no organismo serão pouco ou nada expressos.

Investigando leveduras

Mais profundamente, resolvi brincar dessas coisas querendo responder uma pergunta: “O quão compatível os códigos genéticos de duas espécies de leveduras podem ser?”. No caso, Pichia pastoris e Saccharomyces cerevisiae.

Primeiramente eu entrei no “Codon Usage Database“. Procurando por Pichia e Saccharomyces, o site dá uma tabela com a frequência de se encontrar determinado códon a cada mil pares de base. Eu peguei os resultados e coloquei num site chamado “Text Diff“ - ele compara dois textos e mostra as diferenças e igualdades entre os dois. Com a comparação, dei print screen e destaquei as frequências mais discrepantes entre as duas espécies de levedura, obtendo o seguinte diagrama:

Comparação Pichia e Saccharomyces - códons
Texto em vermelho: Pichia. Texto em Verde: Saccharomyces. Laranja – diferença de 4 a 5; Rosa – diferença de 6 a 9; Amarelo – diferença acima de 10; Códons circulados – frequências iguais.

Fui atrás de cada códon, procurando o que codifica. Cheguei na seguinte tabela:

 Pichia Versus Saccharomyces Table

Eu chamei de “eficiência de códons” o quão os códons de Pichia funcionam em Saccharomyces, tomando como “códons incompatíveis” aqueles com diferença de no mínimo 4 entre as frequências de códon em cada espécie (a marcação em amarelo na imagem de comparação das frequências) – também estou tomando como hipótese que há uma relação direta entre frequência de códon e a preferência do mesmo por determinada espécie. Cheguei nesses valores através da porcentagem do número de códons “compatíveis” (totais -  incompatíveis). De 20 aminoácidos possíveis, apenas 7 seriam seus códons prontamente compatíveis.

Ambas as espécies são leveduras, e por isso eu esperava uma maior compatibilidade natural. O problema é que eu não tenho um controle para saber se a usagem de códons de cada levedura é realmente discrepante. Por isso, fiz a mesma comparação entre Pichia e E.coli. Como esses organismos são bem mais diferentes (um é eucarioto e outro procarioto), esperei uma diferença bem maior. (veja imagem abaixo)

Comparação Pichia e Ecoli - códons
Texto em vermelho: Pichia. Texto em Verde: E.coli. Laranja – diferença de 4 a 5; Rosa – diferença de 6 a 9; Amarelo – diferença acima de 10; Códons circulados – frequências iguais.

Legenda: Laranja – diferença de 4 a 5; Rosa – diferença de 6 a 9; Amarelo – diferença acima de 10; Códons circulados – frequências iguais.

Como esperado, dá pra ver claramente o quanto E.coli e Pichia são diferentes em comparação com Pichia e Sccharomyces. Nesse panorama, eu diria em Pichia e Saccharomyces são bem parecidas. Quanto mais comparações forem feitas mais certeza se terá do quão um organismo se parece com outro.

Otimização de Códons

Apesar de eu não ter certeza da relação direta entre frequência e preferência de códon, consegui observar coisas muito interessantes: a única inviabilidade de tradução correta entre Pichia e Saccharomyces de aminoácido é o Glutamato, em que as frequências de todas as possibilidades de códons não entram na minha classificação de “códons compatíveis” (diferença de frequência menor que 3). O resto dos códons podem ser compatibilizados entre espécies usando-se versões alternativas de códon para um mesmo aminoácio! :)

Quando se otimizam códons para deixar um plasmídeo compatível em diferentes plataformas, faz-se exatamente isso. O problema é que mesmo assim a expressão ainda não é ótima, então em geral prefere-se “sacrificar” a compatibilidade do plasmídeo em diferentes espécies para se ter um plasmídeo com os melhores códons em cada bichinho.

Existem vários programas que fazer essa otimização de códons rapidamente, mas em geral as empresas que sintetizam DNA já incluem isso (de graça ou não) no planejamento do plasmídeo a ser sintetizado.

Conclusão

Por fim, a conclusão que tirei disso tudo é: eu ACHO que um gene de Pichia funcionaria suficientemente bem em Saccharomyes e vice-versa. No caso de não conseguirmos sintetizar os genes que precisamos já códon-atimizados, talvez valha a pena fazer uma mistureba de DNA interespécies – mas só para as leveduras!

Aventuras em Biologia Sintética

Texto escrito por: Marcelo Boareto

Eu considero os quadrinhos como uma das formas mais interessantes de se narrar uma história. São também uma ótima forma de divulgar ciência de uma maneira didática e divertida.

Drew Endy um dos pais da biologia sintética (e do Registry of Parts), juntamente com Isadora Deese (ambos do MIT) elaboraram o quadrinho Adventures in Synthetic Biology. E tem mais: o quadrinho foi publicado no website da prestigiada revista Nature.

Confira Adventures in Synthetic Biology e aprenda de maneira didática o que são biobrickPoPs, entre outros conceitos básicos.

Links possivelmente interessantes:

Espetáculo da ciência

We’ve arranged a global civilization in which most crucial elements profoundly depend on science and technology. We have also arranged things so that almost no one understands science and technology. This is a prescription for disaster. We might get away with it for a while, but sooner or later this combustible mixture of ignorance and power is going to blow up in our faces.”

(Carl Sagan, The Demon-Haunted World: Science as a Candle in the Dark )

Caixa preta é um conceito que designa um sistema cujos detalhes de funcionamento são desconhecidos ou mesmo ignorados. Computadores, micro-ondas, aparelho celulares são alguns dos vários exemplos de objetos que são amplamente usados pela sociedade mas que, em geral, não há uma preocupação maior por parte dos usuários com relação ao seu funcionamento.

Grande parte da população brasileira não tem acesso à educação científica, fazendo com que os avanços tecnológicos que a ciência promove apareçam aos olhos do cidadão sob uma forma não muito diferente de um espetáculo mágico. Tem-se uma sociedade industrializada derivada dos avanços na ciência e tecnologia (sem mais discussões apontarei estas duas como indissociáveis) sentada na platéia de olho apenas para o output de uma caixa preta cuja única razão de ser é a geração de mais aplicações tecnológicas. Já o enigmático e estereotipado personagem que manipula a caixa, o cientista, faz parte de uma pequena porcentagem que detém os saberes do que está por trás do funcionamento da mesma.

Apesar de atualmente haver uma maior mobilização relacionada à divulgação científica no Brasil (como o scienceblogs), maior cobertura em revistas e jornais televisivos e principalmente na internet, o quadro ainda é frágil. A mídia, não raramente, apresenta a ciência como um empreendimento espetacular, realizado por pessoas super-dotadas, gênios que nunca cometem equívocos e que fornecem informações cem por cento confiáveis. Consequência dessa mídia exagerada é uma visão distorcida de como funciona a ciência, exemplo recente (e trágico em todos sentidos) foi o ocorrido com cientistas italianos que foram condenados por não preverem um terremoto. É dado uma grande ênfase as aplicações da ciência mas o processo de sua produção, seu contexto, suas limitações e incertezas são ignorados.

Essa falta de compreensão, reflexão e educação cientifica no entanto não impede que tenhamos uma sociedade aberta à ciência (sim!!), e como vimos bem confiante no saber tecnocientífico que superficialmente lhe é apresentada. Não é incomum, por exemplo, comerciais de televisão usarem dessa confiança no conhecimento cientifico afim de ganhar os clientes, do tipo “está comprovada cientificamente a eficácia do produto…”. Ficamos diante de uma sociedade impaciente, exigente e que aguarda cada vez mais da ciência mas que muitas vezes não consegue filtrar as informações sensacionalistas e contraditórias que lhe são apresentadas (Parece milagre! Novo remédio faz emagrecer 7 a 12 quilos em cinco meses. E sem grandes efeitos colaterais!!).

A sociedade comanda direta e indiretamente o que é produzido e proposto cientificamente. A ciência, que antes tinha somente o papel investigativo e sociologicamente marginal, tornou-se hoje o centro da sociedade humana controlada pelos poderes econômicos, estatais e subjulgada a exigências dessa  sociedade. Portanto, ao mesmo tempo que a ciência possui autoridade e é dominadora, ela também é dominada por essa demanda da sociedade meramente usuária. Isso é perigoso, vamos olhar como exemplo para um cenário particular de interesse aqui do blog; a biologia sintética é hoje uma área onde a sociedade está depositando muito de suas expectativas (e dinheiro). Esta pressão social por inovações pode ser bastante trágica nesta área, uma vez que pequenos bugs num produto biológico pode apresentar consequências drásticas.

O ponto principal a ser pensado aqui é a importância e necessidade que TODOS tenhamos consciência do que estamos criando e para que isto está sendo feito frente ao avanço cientifico e tecnológico. Para os envolvidos diretamente com ciência resta pensar no poder do que produzem, um poder pelo qual muitas vezes pode-se perder o poder. Instala-se a necessidade de uma verdadeira reflexão sobre os caminhos que os cientistas e o conhecimento científico podem seguir para que se tornem mais acessíveis. O avanço na divulgação científica tem que continuar crescendo, no entanto, prezando pela boa qualidade. Para os não envolvidos ansiosos pelas novidades do ano, pelos produtos recém-saídos do forno, embalados e “pronto para consumo” resta tomar uma postura crítica maior com relação a mudanças que afetam diretamente as suas vidas. Abrir caixas pretas é uma tarefa árdua mas o primeiro passo é se dar conta de que existem. Vale a tentativa(!!!) uma vez que o progresso da ciência e por sua vez de toda sociedade depende disso, depende das ideias inovadoras, das discussões, das críticas. Dependemos do conhecimento.

Autoria: Carolina Menezes Silvério e Marcelo Boareto.

Calculadora para sítios de ligação com ribossomos (RBS)

RBSUm objetivo central da biologia sintética é programar células para desenvolver funções valiosas. À medida que se constroem sistemas genéticas maiores e mais complexos (como os de escala genômica), serão necessários modelos e técnicas para combinar as partes genéticas de maneira eficiente para se atingir um comportamento específico. Para isso, serão necessários modelos biofísicos que descrevam a relação de uma sequência de DNA que a sua função.

Um passo muito importante nesse sentido foi dado pelo Grupo do Prof. Howard Salis, pesquisador que eu tenho o prazer de trabalhar dentro do Synberc, com o desenvolvimento da calculadora de RBS (ribossomal binding site ou sítio de ligação com o ribossomo).

Engenharia genética de microrganismos é um processo tempo intensivo (por ex. o desenvolvimento de uma nova rota metabólica para a produção de um produto químico pode levar de 5 a 10 anos de P&D para chegar a etapa industrial) que normalmente requer múltiplas rodadas de tentativas e erro utilizando mutações aleatórias. À medida que se torna possível construir sistemas gênicos cada vez mais complexo (incluindo genomas completos), métodos automatizados para montagem desses sistemas e para otimização de vias metabólicas se tornam necessários para diminuir custos e tempo de desenvolvimento. Além disso, com o aumento da complexidade do sistema, a aplicação de métodos de tentativa e erro para sua otimização se torna cada mais difícil e ineficaz.

Uma maneira de otimizar um sistema gênico é através da variação da sequencia de seus elementos regulatórios para controlar os níveis de expressão de suas proteínas codificadoras. Cada passo limitante na expressão de um gene oferece a oportunidade para modular racionalmente os níveis de expressão proteica. Em bactérias, sítios de ligação do ribossomo  e outras sequencias regulatórias de RNA são elementos de controle eficientes para o início da tradução. Como consequência, essas sequências são comumente modificadas para a otimização de circuitos genéticos. Vias metabólicas e expressão de proteínas recombinantes. Assita um video bem interessante no Youtube sobre tradução. Não é mostrado no video (e não consegui encontrar um melhor) o RBS é uma sequencia do RNA que direciona o ribossomo para o start codon, ele complementar a região do rRNA 16S que é parte da subunidade pequena 30S do ribossomo. Basicamente, quando mais complementar o RBS é ao 16S rRNA, maior é a afinidade e maior é a taxa de tradução. 

Como foi descrito no video, a tradução em bactérias (procariotos) consiste em quatro fases: iniciação, elongamento, terminação e o turnover do ribossomo (na verdade, esta última fase não foi mostrada no video). Na maioria dos casos, o início da transcrição é o gargalo do processo inteiro. O taxa de iniciação de transcrição se dá pela combinação de diferentes efeitos moleculares: incluindo a hibridação do rRNA 16S  com a sequencia do RBS, a ligação do tRNA formilmetionina ao start codon, a distância entre o síto de ligação do rRNA 16S e o start códon, e a presença de estruturas secundárias de RNA que podem obstruir o RBS ou o start codon.    

Para o otimização de expressão de genes, é muito comum o desenvolvimento de bibliotecas de sequencias de RBS com o objetivo de otimização de funções de sistemas gênicos. Porém, a construção e seleção de bibliotecas de sequências se torna impraticável com o aumento de proteínas no sistema. Por exemplo, para realizar mutações randômicas em 4 nucleotídeos para um RBS resulta em uma biblioteca de 256 sequencias. O tamanho da biblioteca aumenta combinatoriamente com o número de proteínas do sistema, ou seja, 16,7 milhões de sequências para um sistema com 3 proteínas e 2,8 x 1014 sequencias para um sistemas com 6 proteínas). Dessa maneira, se torna necessários processos mais racionais para avaliar sequencias de RBS.

A calculadora de RBS utiliza um modelo estatístico termodinâmico para predizer a taxa de iniciação de tradução de uma proteína. Dado um RBS e a região codificadora da proteína, o modelo é capaz de calcular a mudança de energia livre durante a montagem do complexo ribossomal 30S no RNAm (ΔGTOT). Depois, o modelo estatístico é capaz de correlacionar a taxa de início de transcrição com o ΔGTOT. Dessa maneira, o modelo biofísico preenche uma lacuna de desenho racional de RBS, criando uma relação quantitativa entre um sequencia de letras (As, Gs, Cs e Us) e um número (taxa de iniciação de tradução).

A calculadora de RBS, portanto, combina um modelo biofísico com otimização estocástica para identificar uma sequência sintética (não natural) de RBS que irá proporcionar a taxa de início de tradução desejada. É importante destacar que esta relação também depende dos 35 nucleotídeos iniciais da região codificadora da proteína e que o RBS sintético precisa ser desenhada com esta sequencia incluída.
A calculadora de RBS está disponível do site do laboratório do Salis . E é muito simples de utilizar, basta criar uma conta de usuário, recortar e colar as sequências, e definir uma ou mais taxas de iniciação de transcrição.

RBS calculator

Outras ferramentas para controle de transcrição também estão disponíveis como a Small RNA Calculator.

Bons experimentos!

Salis, H., Mirsky, E., & Voigt, C. (2009). Automated design of synthetic ribosome binding sites to control protein expression Nature Biotechnology, 27 (10), 946-950 DOI: 10.1038/nbt.1568

Polimerase Por Segundo

ResearchBlogging.orgA Biologia é imprecisa por natureza, e vice versa. Isso é uma grande dificuldade ao se fazer design de sistemas biológicos sintéticos; aquilo que é muito bonito no papel às vezes nunca pode ser feito por motivos obscuros e por excesso de ruído dos sinais do sistema. Não dá pra prever. Na tentativa de deixar dispositivos sintéticos mais previsíveis, a Biologia Sintética tenta padronizar não somente partes biológicas, mas também os sinais que a compõem a dinâmica de seu sistema. Esses sinais são justamente a passagem de informação entre DNA e o fenótipo desejado, mas… como diabos deixar isso mais preciso e medir a velocidade dessa passagem de informação? Como medir “Polimerases Por Segundo”?

Padronização da Transmissão de Informação

Independente do que um aparelho elétrico faça, existem sinais “universais” que pertencem a todos eles: variações na diferença de potencial, na corrente, no campo elétrico e etc. A transmissão de informação entre os dispositivos eletrônicos que compõem esse aparelho são dadas justamente através desses sinais, fazendo todo o sistema elétrico funcionar. Em circuitos genéticos, sinais análogos à corrente elétrica são as taxas de transcrição e tradução, ou mais especificamente, a velocidade com que – respectivamente – uma polimerase e um ribossomo “leêm” seus nucleotídeos. O problema é que esses sinais (as taxas de transcrição e tradução) não são bons como transmissores de sinais. Entenda o porquê:

PoPS e RiPS: Qual é o sentido disso!?

Para que um transmissor de sinal seja bom, ele precisa facilitar com que dispositivos possam ser facilmente combinados em um sistema – além de ser algo “universal”, como foi dito anteriormente. Foi aí então que, usando experiências da engenharia, os biólogos sintéticos cunharam o termo “PoPS” (Polimerase Per Second - Polimerase Por Segundo) e “RiPS” (Ribossome Per Second - Ribossomo Por Segundo). Muitos pesquisadores acham que a criação desses novos termos é como “reinventar a roda”: qual seria a grande diferença entre isso e as clássicas taxas de transcrição e tradução? A diferença é a abrangência da nova medida. Quando se trata de um sítio operador, um RBS, um RNAm e o próprio gene sendo “lido”, não há diferença alguma em se medir uma taxa de transcrição e o “PoPS” ou uma taxa de tradução e o “RiPS”. Mas faz sentido se medir a taxa de transcrição de um sítio terminador por exemplo!? Esse elemento de DNA, que teoricamente não é transcrito (é ele quem justamente para a transcrição), ainda pode eventualmente ter um “leak” e permitir a passagem de uma polimerase. Usar a expressão “… a taxa de transcrição de um sítio terminador …” não faz sentido nenhum, mas acontece. Se usarmos PoPS, que por definição é o número de vezes que uma RNA polimerase passa por um ponto específico de uma molécula de DNA por unidade de tempo, ainda há sentido, pois nessa definição não importa qual a região do DNA a Polimerase passa. É esse tipo de generalidade que permite o fácil uso e novas combinações de dispositivos sintéticos.

Hierarquia de Abstração

Com a criação de sistemas fáceis de se integrar, os engenheiros biológicos podem se beneficiar de métodos largamente praticados em qualquer campo da engenharia, como a hierarquia de abstração. Com isso é mais simples se lidar com a complexidade de sistemas biológicos quando se omite informações desnecessárias. Desse modo (ver imagem abaixo), alguém trabalhando no nível de abstração das partes biológicas não precisa se preocupar com o design e síntese do DNA que usará, do mesmo modo, alguém trabalhando no nível sistêmico precisa pensar em apenas quais dispositivos incluir e como conectá-los para realizar uma função desejada, sem precisar se preocupar com os outros níveis de abstração.

Imagem retirada de: D. Baker, G. Church, J. Collins, D. Endy, J. Jacobson, J. Keasling, P. Modrich, C. Smolke, and R. Weiss. ENGINEERING LIFE: Building a FAB for biology. Scientific American, pages 44–51, June 2006.

Como medir PoPS?

A maioria dos sistemas criados e estudados hoje em dia em Biologia Sintética envolve controle transcricional da atividade genética, o que faz do PoPS a variável mais difundida na área, principalmente pelas pesquisas envolvendo lógica booleana em sistemas genéticos (portanto não é muito comum encontrar “RiPS” em artigos por aí).
Não existe um método direto para se medir PoPS, mas é possível chegar em seu valor indiretamente através de medições de fluorescência de genes reporter. É possível – se você puder encontrar os parâmetros na literatura ou medí-los – encontrar o PoPS de um dispositivo em cinco passos:

Cinco Passos Para o PoPS

1. Ligação de um Gene Repórter como Output

Antes de mais nada, será preciso de um fluorímetro (é claro) e demum espectofotômetro para medir densidade celular. Como exemplo, vamos observar a parte BBa_F2620:

Esse BioBrick tem como “entrada” a substância de quorum sensing 3-oxohexanoil-homoserina lactona e tem como “saída” PoPS. Em presença de 3OC6HSL, o gene que produz o fator de transcrição luxR promove a transcrição de genes após o Lux pR, na parte final do BioBrick BBa_F2620. Para mensurar o quão ativo o luxpR fica, liga-se outro BioBrick no final do dispositivo para mudar o output do sistema colocando-se o BBa_E0240 - a ORF (Open Reading Frame) do GFP (Green Fluorescent Protein):

Assim tem-se uma nova parte, o BioBrick BBa_T9002:

2. Medição da Fluorescência e Absorbância e Subtração do Background

Para medir a fluorescência do GFP e a absorbância da amostra de células, é preciso criar dois controles: um da absorbância (A) e outro da fluorescência (G). O controle da fluorescência será o próprio BBa_T9002 sem ser induzido pela substância de quorum sensing (G_não-induzido), enquanto o controle da absorbância é feita da maneira trivial, verificando somente a absorbância do meio de cultura (A_background). Para se obter os reais valores de Fluorescência induzida por 3OC6HSL e da densidade celular, basta então subtrair esses valores de background com os valores medidos durante a indução pela substância de quorum sensing:

3. Correlação com a Curva Padrão

Com as correções em mãos, outro procedimento trivial a ser feito é encontrar a curva padrão de fluorescência versus GFP e de absorbância versus número de células. Por exemplo, experimentos feitos em laboratório chegaram a essas retas de correlação de valores:

Em que UFC é “Unidade Formadora de Colônia” – o número de células na amostra. E “GFP” seria o número de moléculas de GFP medidas.

4. Interpolar a Curva de GFP versus Tempo Obtida na Medição

A síntese total de GFP por célula (S_célula) é dada pela taxa de produção de GFP total (S_total) dividida pelo número de células (UFC):

Para encontrar a derivada de [GFP] por tempo, basta plotar os dados de GFP obtidos por tempo e interpolar com uma função logística (provavelmente) para obter a equação que melhor descreve a variação de GFP no tempo.

5. Colocar os Valores Nessa Equação Aqui

Depois de determinada a função Scélula, basta colocá-la nessa fórmula e encontrar o PoPS:

Em que:
a = Taxa de maturação do GFP – 1/s
GammaM = Constante de degradação do RNA – 1/s
GammaI = Constante de degradação do GFP imaturo – 1/s
Rô = Constante de síntese proteica por RNAm (RiPS) – [Proteína]/[RNAm].s
PoPS = Polimerase por segundo – [mRNA]/[DNA].s

CUIDADO: Conteúdo Matemático – Prossiga com Cuidado (Ou não…)

Chega-se nessa expressão através de um pequeno sistema de equações diferenciais:

As equações expressam uma dinâmica simplificada de um sistema de transcrição e tradução de uma informação genética. Para chegar na expressão de PoPS, basta substituir a última equação na segunda e isolar M. Com a expressão resultante, basta substituir a variável M na primeira equação e sua derivada em dM/dt.

ATENÇÃO: Aqui acaba o conteúdo matemático. Está tudo bem agora.

E essa é a história de como você pode encontrar o PoPS – essa variável estranha! – no seu próprio laboratório (ou ao menos entender do que se trata). Assim como um circuito elétrico, que pode ser montado da melhor maneira possível e mesmo assim não funcionar por razões obscuras, sistemas biológicos têm muito mais esse problemático costume de não se comportar como esperado. Contudo essa abordagem mais generalista da atividade transcricional de uma célula é uma boa maneira de se tentar enfrentar o grande desafio de se deixar a biologia mais “engenheirável” e mais “precisa”. Não que essa seja a coisa mais fácil do mundo, mas ela nunca será se ninguém tentar. E estamos aos poucos conseguindo.

Referências:

Entenda a Engenharia Metabólica

ResearchBlogging.orgUma das grandes maravilhas da humanidade – objeto de grande satisfação entre os químicos – é uma tabela que nos diz tudo o que existe no universo, os cerca de 120 elementos que formam tudo aquilo que o ser humano conseguiu perceber. Usando essa mesma ideia, cientistas conseguiram determinar 12 substâncias principais que podem produzir tudo… o que existe dentro de uma célula! Esse é um dos princípios fundamentais da Engenharia Metabólica, entenda o porquê:

Os 12 Precursores Principais

Tudo o que uma célula consome sempre produz compostos que chamamos de “precursores principais”. São esses precursores que podem gerar tudo dentro da célula: desde seu DNA até às membranas celulares. Na bactéria E.coli, por exemplo, existem 12 dessas substâncias principais: Eritrose 4-fosfato, o famoso Acetil CoA,  Frutose 6-fosfato, Glucose 6-fosfato, Alfa-cetoglutarato, Oxaloacetato, Ribose 5-fosfato, Fosfoenolpiruvato, 3-fosfoglicerato, Piruvato (esse carinha é famoso também), Triose-fosfato e Succinil CoA. Isso quer dizer que a grande maioria de todas a milhares de reações dentro da E.coli em algum momento formam e/ou consomem essas substâncias em suas etapas de reação.

Assim, ao melhor estilo dos antigos alquimistas, pesquisadores – em especial FC Neidhardt - dissecaram células de E.coli de modo a determinar a quantidade desses precursores que seria necessária para “construir” uma bactéria (ver infográfico acima):

Ou seja, todos os precusores somados às moléculas para se realizar oxidações (NAD), reduções (NADPH) e fornecer energia (ATP), resultam em 1 mol de “XR”, que é a quantidade de biomassa produzida com esses compostos, ou “1 mol de células” (definida aqui como a quantidade de células em 10^6g). XR seria um arcabouço que abarca todas as proteínas,  lipídeos e  nucleotídeos da célula; por isso não podemos dizer que essa é de fato uma equação química, mas uma “pseudo-equação química”, afinal dá pra ver claramente que as quantidades das substâncias não se conservam em termos estequiométricos – pra falar a verdade, não há nem a representação de elementos, são só siglas.

Enfim, esse é o mais próximo que chegamos do desejo dos alquimistas de obter uma receita para a vida como eles idealizaram, mas apesar de parecer pouco, essa pseudo-reação global de “construção de células” nos permite contabilizar literalmente quais são os recursos que as bactérias têm para produzir coisas que não produzem natualmente, ou seja, nos mostram quais são as cartas em jogo quando se altera um organismo geneticamente. E o nome desse jogo é fluxo, fluxo metabólico.

O Fluxoma

Uma célula é como se fosse uma mini indústria: seus operários são enzimas, a chefia é a informação genética e a matéria prima são os metabólitos externos com o qual se produzem as peças – que são os 12 metabólitos principais – para a linha de montagem: as etapas de reações bioquímicas. Essa pequena empresa é um empreendimento talhado pelo mercado competitivo, ditado pela economia minimizadora de enegia, seguindo a lógica da seleção natural. Igualzinho às empresas de verdade. Mas enfim, a grande pergunta é: o que acontece quando a chefia muda? O que acontece quando modificamos geneticamente um microrganismo? Apenas colocar uma informação genética não natural na “chefia” é o mesmo que colocar um administrador inexperiente no comando de todo um processo produtivo que ele não conhece. É ir contra milhares de anos de seleção natural.

Arte de Pedro Pantai. Visite http://meninodacaixadesapato.blogspot.com.br/

Por exemplo, imagine que a nossa célula é uma fábrica de motos. Depois de muitos anos existindo, decidem colocar uma nova chefia adjunta no comando. O novo chefe adjunto decide colocar uma nova maquinaria e funcionários no chão de fábrica, pois quer ampliar a gama de produtos que a empresa fabrica. A indústria de motos então passa a produzir triciclos; nada mal. O problema é que a nova chefia SÓ faz isso. Ele não comunica os antigos funcionários sobre a nova produção, não compra mais matéria prima e, apesar de desejar que o carro chefe da empresa seja triciclos, não move uma palha para que isso aconteça. Em outras palavras: temos uma fábrica de motos que improvisa na fabricação de triciclos. É aí que entra o engenheiro de produç… Ops, o “engenheiro metabólico”.

O grande problema da nossa indústria de motos é apenas de distribuição das peças, afinal – simplificadamente – a grande diferença do produto antigo para o novo é apenas uma roda. Da mesma maneira, em uma célula a grande diferença entre os componentes que ela já produz para existir (o “XR” da pseudo-reação acima) e as novas substâncias que queremos que ela produza (por modificações genéticas) é apenas uma combinação de quantidades diferentes dos 12 precursores principais que levem às reações de síntese que queremos. Para ter controle dessas reações que levam à XR e/ou ao bioproduto desejado, cria-se o chamado “fluxoma”, a contabilização de todos as taxas de reação (os fluxos) de dentro da célula – da mesma forma que o genoma é a contabilização de toda a informação genética de uma célula.

ATENÇÃO: se a matemática não é sua amiga, tome cuidado com o conteúdo a seguir.

Fluxos Metabólicos

A teoria que se aplica para a determinação desses fluxos baseia-se na simples conservação de masa em um sistema fechado, no caso uma célula ou um compartimento celular fechado com metabólitos; especificando a reversibilidade das reações e quais metabólitos são considerados como internos e externos. A equação geral que descreve a conservação de massa de metabólitos em um sisema de volume definido pode ser escrita como:

Em que C (mol/L) é um vetor da concentração de m metabólitos internos; r ((mol/L)/h) é o vetor do grau de reação, ou seja o fluxo,  de n reações que convertem metabólitos; S é a matriz estequiométrica de dimensões  m x n cujos elementos sij representam o coeficiente estequiométrico do elemento i envolvido na reação j; e μ (1/h) é o grau específico de diluição associado com a mudança no volume de um sistema, o que é muito importante considerar no modelo, pois o graus de diluição afetam diretamente as velocidades de reação. Como em uma célula o grau de diluição é muito baixo quando comparado com os graus de reação, as mudanças de volume no sistema são consideradas negligenciáveis. Temos portanto a equação mais simplificada:

Em um estado estacionário, que é o que se considera na análise de um fluxo metabólico, não há acúmulo de metabólitos, e portanto suas concentrações, bem como a população bacteriana, tornam-se constantes, fazendo com que dC/dt = 0:

A caracterização de reações reversíveis é realizada através da detreminação do sinal de ri, em que ri < 0 delimita a reação ocorrendo no sentido oposto, ri = 0 informa a sua não-ocorrência e ri > 0 indica uma reação ocorrendo no sentido esperado.

Uma outra maneira mais simplista de se entender o mesmo raciocínio, partindo do mesmo princípio de conservação de massa, pode ser:

O que é o mesmo que S.r = 0. Considerando as substâncias envolvidas em várias reações, teremos o mesmo resultado:

OBSERVAÇÃO: Aqui acaba o conteúdo matemático. Pode continuar a ler abaixo, já passou…!

Análise de Vias Metabólicas

Então, como dá pra perceber, tudo se resume a encontrar um sistema de equações – sim, os sisteminhas de equações que você aprende a resolver na escola – que descreva o metabolismo da célula envolvendo os metabólitos principais. É exatamente aqui que entram os dados da pseudo-reação global comentada no início, é ela que define, junto com dados experimentais de consumo de substratos, o conjunto de soluções desse sistema de equações (chamados de “modos elementares”). Os sistemas de equações obtidos por análise das vias metabólicas são sempre indeterminados, uma vez que o número de reações bioquímicas as envolvendo é muito maior que o número de espécies de metabólitos, ou seja: tem-se mais equações que variáveis. A tarefa de programas de análise de vias metabólicas é encontrar possíveis soluções para esse sistema que digam quais são os possíveis fluxos de todas as reações envolvidas, com isso é possível analisar qual modo elementar é o que possui maior rendimento de produção do bioproduto desejado, e portanto quais reações que devem ocorrer no sistema em detrimento de outras.

Por exemplo, vejamos o exemplo da produção de Lisina em Corynebacterium glutamicum. Esse aminoácido é naturalmente produzido em nível basal na célula para manutenção da atividade celular, apenas super-expressando os genes envolvidos nas vias de produção de lisina e nocauteando outros genes que produzem enzimas competidoras (essas são grandes maneiras de se alterar os fluxos metabólicos) da biosíntese de lisina é possível aumentar cerca de 11 vezes a produtividade. Isso pode ser feito sem análise nenhuma. Mas se analisando os fluxos metabólicos (imagem abaixo), vemos que é possível quase dobrar a produção industrial de Lisina à partir da mesma quantidade de glicose. Assim como na analogia entre a indústria e a célula, única diferença foi a distribuição dos fluxos entre os precursores principais da C. Glutamicum, ou seja uma combinação diferente de quantidades dos precursores em diferentes reações.

No caso, um aumento do fluxo metabólico pela via das pentoses (formando Ribulose 5-fosfato) em um processo sem produção de CO2 – realizando o ciclo do glioxilato - aumenta a produção por gerar mais NADPH, necessário na biosíntese de Lisina, e que não é produzida na via “normal” de degradação da glicose (via de Embden-Meyerhoff-Parnas).

O Futuro da Engenharia Metabólica

Muitos dizem que a engenharia metabólica será tão eficiente em otimizar os processos biotecnológicos que substituirá completamente os processos químicos orgânicos no futuro, afinal esse é o grande entrave para termos toda uma indústria baseada em uma bioprodução: os processos químicos são muito mais eficientes. Ter toda a indústria química baseada na produção de materiais por organismos nos daria um mundo mais ecológico e renovável. O grande passo para isso já foi dado com a “synthia“, a bactéria sintética de Craig Venter e seu grupo. O desafio de se fazer engenharia metabólica é justamente o problema que foi eliminado – EDITED: OK, não eliminado, mas amenizado – quando se nocauteou todos os genes não essenciais para a sobrevivência na bactéria produzida por Venter, pois qualquer nova via colocada no microrganismo já estaria quase completamente otimizada, uma vez que não existiriam fluxos “não essenciais” em que a bactéria poderia estar “desperdiçando” energia em vez produzir o bioproduto dos genes com que foi modificada. Assim, como um upgrade da engenharia genética, a engenharia metabólica faz aquilo que torna a Biologia Sintética algo simples e bonito: apenas uma mudança inteligente de como a informação é transmitida; uma mudança de design. No final das contas, mais do que pseudo-realizar os sonhos dos alquimistas, entender os fluxos metabólicos é mudar a maneira como os químicos atuais sonham com o futuro, afinal, porque reinventar como produzir substâncias orgânicas se os próprios organismos podem fazer isso pela gente!? Já está mais do que na hora de reinventarmos nossa indústria.

Referências

Vallino JJ, & Stephanopoulos G (2000). Metabolic flux distributions in Corynebacterium glutamicum during growth and lysine overproduction. Reprinted from Biotechnology and Bioengineering, Vol. 41, Pp 633-646 (1993). Biotechnology and bioengineering, 67 (6), 872-85 PMID: 10699864

Neidhardt, F. C., J. Ingraham, and M. Schaechter. 1990. Physiology of the Bacterial Cell: A Molecular Approach. Sinauer Associates, Sunderland, MA.

A Incrível Sociedade dos Microrganismos


ResearchBlogging.orgÉ bem óbvio que um ser humano não existiria sozinho. Não só porque ele não poderia ser gerado, mas porque dificilmente conseguiria sobreviver. Já reparou na quantidade de pessoas que permitem (e permitiram) que você tivesse o dia de hoje como você tem? Cada parafuso, tecido, metal, tijolo e etc que permite você estudar, trabalhar, andar de automóvel, comer e ler esse texto foram pensados, feitos, montados, transportados e vendidos por alguém. Não é possível portanto tentar entender os humanos, bem como a maneira com que eles se comunicam, isoladamente. É preciso olhá-los sistemicamente, como seres sociais. As bactérias também. É cada vez mais reconhecido que as bactérias não existem como células solitárias, mas são como um “organismo colonizador” que elabora complexos sistemas de comunicação que facilitam a sua adaptação às recorrentes mudanças ambientais. E elas nascem poliglotas. A seleção natural esculpiu em diferentes espécies diversos genes que as permitem se comunicar cooperativamente e repressivamente entre espécies e até mesmo entre reinos (como por exemplo em bactérias patogênicas). Damos à essa comunicação bacteriana o nome de “quorum sensing” (“detecção em quórum” – tradução livre).

Quorum Sensing

O termo “quorum sensing” foi cunhado devido à habilidade dos microorganismos expressarem ou aumentarem a expressão de certos genes quando em grande população, podendo dessa forma monitorar a densidade celular (quantidade de células ao seu redor) antes de manifestar algum fenótipo. Um dos exemplos mais ilustrativos disso é da Dictyostelium discoideum, um protozoário que passa uma das fases do seu ciclo de vida produzindo um corpo multicelular. Tem um vídeo bem legal mostrando a formação de um corpo de frutificação através de várias células individuais de Dictyostelium:

Reparem rapidamente em 00:30 min as células se locomovendo em “pulsos”, na direção de um local em que todas estão se agregando (é difícil de perceber!). Esse local inicial é em geral onde um grupo de bactérias encontrou alguma fonte de nutrientes. A “pulsação” da locomoção das bactérias acontece devido à substância de quorum sensing que é difundida pelo espaço vinda das células do local de agregação; um pulso inicial provoca – quando em uma população não muito grande, para ser perceptível – um comportamento oscilatório de resposta das células: quando uma célula recebe um sinal (do tipo “Ei, tem comida aqui!”), ela emite um de volta (como se etivesse gritando “Caramba, tem comida lá!”), que é recebido pelas células que mandaram o sinal incialmente (o que seria um “Ótimo! Estou indo praí!”) e por outras ao seu redor, propagando o sinal. Como a transmissão de informação com as substâncias não é imediata e nem totalmente contínua, observa-se os “pulsos”, que são resultado do “gap” entre enviar e receber informações pela difusão de moléculas.

As diferentes Línguas das bactérias

As “línguas”, ou simplesmente certas coisas que as bactérias querem “dizer” (como “Estou afim de dar uma reproduzida!” ou “Fujam, eles estão vindo!”) são “ditas” através de diferentes tipos de substâncias que os microorganismos produzem. No caso da Dictyostelium ali em cima, a substância é AMP cíclico (é quase um ATP, só que duas vezes menos fosfatado… e cíclico, é claro), mas se tratando de bactérias – que ainda é a principal plataforma de aplicação da Biologia Sintética – existem três tipos principais de substâncias de quorum sensing: as acil-homoserinas lactonas (HSL ou AHL), auto-indutores 2 (AI-2) e pequenos ácidos graxos, chamados de “DSF”s (Diffusible Signal Factor – do inglês: Fator Sinalizador Difusível). Existem ainda outras famílias de substâncias de QS, mas aparentemente menos comuns que essas três principais.

O Mecanismo Gênico

Para um microrganismo ganhar a abilidade de “falar em outra língua”, em geral são necessários apenas três elementos de DNA: um gene que gere uma enzima que produza uma substância de QS, outro gene que produza o “receptor” dessa substância – que em geral é um fator de transcrição – e um promotor, no qual o fator de transcrição (após se associar à substância de QS) se liga para controlar a expressão gênica (imagem ao lado).

Se uma bactéria (por exemplo) “fala” a mesma “língua” que suas companheiras de colônia, como ela diferenciaria então um sinal próprio (a própria substância de QS sendo produzida) de um sinal de outras células (substância de QS externa)!? Isso é importante, porque se a bactéria receber o próprio sinal que envia, ela entrará em um processo autocatalítico que resultará em uma contínua auto-ativação da célula independente do sinal das bactérias ao seu redor. Acontece que uma bactéria não produz níveis suficientes de QS para “se ouvir”. Sem o sinal externo, a transcrição de genes pelo sistema de quorum sensing é fraca e insuficiente para iniciar um feedback positivo; apenas em alta densidade celular se consegue alcançar uma concentração crítica de substâncias de QS para estimular a transcrição dos genes que o QS controla.

Quorum Sensing no iGEM

Apesar de não ser um meio de transmissão de informação tão rápido e eficiente como o dos light switches, os sistemas de QS são bastante utilizados em dispositivos sintéticos devido à sua especificidade e falta de “falsos sinais” – afinal, é extremamente fácil estimular não-intencionalmente uma célula sensível à luz. No Registry of Parts existem cerca de 6 sistemas de QS completos, padronizados e disponíveis para construção, todos usando (em geral) diferentes AHLs, usados tanto na ativação e inibição da expressão de genes.

Exemplos de utilização desse sistema de transmissão de informação não faltam no iGEM. Já tratamos no blog de um dos inúmeros projetos do iGEM que utilizam quorum sensing, o da Unicamp de 2009. Em seu projeto, o time brasileiro utilizou sinais de AI-2 como um “sistema de alerta” em bactérias produtoras de bioprodutos em um bioreator. Quando um microrganismo contanimante surgisse (produzindo AI-2), o sistema de QS atuaria para comunicar sua presença a todas as bactérias ao redor do organismo invasor, iniciando gatilhos gênicos para produção de substâncias nocivas ao contaminante, afim de exterminá-lo do bioreator.

Parte do vídeo explicativo do time da Unicamp de 2009. Uma pequena esquematização de como usaram quorum sensing.

Aprender como uma população de microrganismos de comunica é extremamente útil para saber como ela se comporta, e no caso da biologia sintética, muito útil para conseguir controlar esse comportamento para transmitir informações em um dispositivo gênico sintético. Mas é claro que prever todo um comportamento de um sistema biológico não é nada fácil. Como já salientava Asimov, há algo em comum no comportamento de humanos e átomos: ambos são muito previsíveis singularmente, mas praticamente caóticos quando em coletivo. Apesar de mais simples, populações de microrganismos também se comportam assim, o que é uma das razões que tornam o trabalho em laboratório muitas vezes frustante e cansativo. Um guia nesse caos é essa compreensão sistêmica da comunicação entre bactérias (que origina certas resistências a antibióticos inesperadas e outras coisas bizarras), que assim como seres humanos, as torna seres mais sociais do que você possa imaginar.

Referências

  1. Whitehead, N. (2001). Quorum-sensing in Gram-negative bacteria FEMS Microbiology Reviews, 25 (4), 365-404 DOI: 10.1016/S0168-6445(01)00059-6
  2. Atkinson, S., & Williams, P. (2009). Quorum sensing and social networking in the microbial world Journal of The Royal Society Interface, 6 (40), 959-978 DOI: 10.1098/rsif.2009.0203
  3. He YW, & Zhang LH (2008). Quorum sensing and virulence regulation in Xanthomonas campestris. FEMS microbiology reviews, 32 (5), 842-57 PMID: 18557946

Ligações Improváveis: RNA antisense, Sudoku e Redes Neurais

A ciência é cheia de ligações improváveis.

Veja por exemplo o estudo das partículas subatômicas e seus spins: quem diria que conhecer isso poderia permitir uma revolução na neurociência? Entendendo como o núcleo atômico dos átomos se comporta em um campo magnético foi possível construir o aparelho que permite literalmente olhar dentro de nosso cérebro, passando bem longe de um desconfortável bisturi: o aparelho de Ressonância Magnética Nuclear Funcional (geralmente os hospitais e clínicas tiram o “Nuclear” do nome porque isso assusta os pacientes; é sério!).

Chamamos essas ligações de “improváveis” principalmente por causa da sua contra-intuitividade, afinal quem pensaria em analisar o comportamento de cérebros ao se estudar algumas das menores coisas do universo!? Fazer essas pontes é o que se precisa para criar inovação, e é exatamente na busca desse tipo de coisa que nas últimas reuniões do Clube de Biologia Sintética começamos a fazer algumas ligações (não necessariamente na ordem do título) que “do lado de fora” têm uma aparência improvável, mas que no fundo talvez só sejam contra-intuitivas.

Tudo começou, ou melhor, tudo deveria ter começado (para amenizar a aparente desconexão) falando-se da mais novinha regulação de expressão gênica no mundo das descobertas científicas:

O RNA de Interferência

Representação do funcionamento dos RNAs antisense: quando se ligam à uma fita de RNA mensageiro com alto grau de complementariedade entre as fitas (diz-se "complementariedade" entre duas fitas de DNA (ou RNA) quando o código genético de ambas têm sequências de nucleotídeos que ligam-se entre si através dos pares A-T (U em RNAs) e C-G formados entre as fitas), há o bloqueiro da atuação da RNA polimerase, impedindo a tradução do RNA em proteína. Se não houver muita correspondência entre as fitas de RNA a traduação continua normalmente.

É mais uma daquelas descobertas “nobélicas”, estudada pelos pesquisadores americanos Andrew Fire e Craig Mello em 1998, ganhando o prêmio em 2006. A grande ideia dos RNAs de interferência (iRNA) é o pareamento  de pequenos segmentos de RNA – que não são codificados em proteínas – com RNAs mensageiros, impedindo que sejam traduzidos por “bloquear” o ribossomo . Esse sistema de inibição gênica envolve várias enzimas (se quiser saber mais veja esse ótimo vídeo) e é um pouco mais complexo do que o sistema de regulação gênica daquilo que chamamos de RNA antisense, mas na essência funcionam do mesmo jeito: bloqueio da tradução através de um RNA antisense complementar. A grande diferença entre os RNAs antisense e os de interferência, que são comumente confundindos com sinônimos, é que os iRNA atuam através de toda uma via de reações enzimáticas em eucariotos, enquanto os RNA antisense são mais característicos de seres procarióticos e não precisam de uma via enzimática para regularem a expressão gênica.

Diferentemente dos outros tipos de regulação mediados por inibidores, que são basicamente proteínas que se ligam ao DNA inibindo a transcrição gênica, com os RNAs antisense têm-se uma gama muito maior de inibidores da expressão gênica. Imagine que você quer controlar uns 2 ou 3 genes em uma bactéria: existem muitos metabólitos que podem fazer esse trabalho (por exemplo IPTG, galactose, TetR e etc.), mas e se você quiser ter um controle de mais genes, digamos, uns 20!? Dá-lhe repressores! Por outro lado, se for possível usar RNAs de interferência suficientemente eficientes, poderia se fazer um vetor de transformação bem mais enxuto (em relação aos sítios repressores) além de poder construir um mecanismo de repressão mais orientado ao “alvo” de repressão: basta construir um RNA mensageiro complementar. É exatamente essa versatilidade que torna possível contruir uma…

 Bactéria Resolvedora de Sudoku

Legal: Sudoku, Bactérias e RNA antisense… O que essas coisas têm a ver!?

Essa grande ideia veio do time japonês UT-Tokyo do iGEM de 2010, e além de usar RNAs antisense, também usou do dispositivo gênico baseado em recombinases semelhante ao que o time da Unicamp usou em 2009 para a mesma finalidade, que é diferenciar diferentes populações de bactérias. O sistema que eles criaram funciona basicamente assim:

Populações Diferentes

Diferentes tipos de Populações

Eles representaram (em um sudoku 4×4) cada posição por uma população específica de E.coli’s. Cada posição tem algo em seu DNA que a torna diferente de todas.

Diferentes Estados

Estados das Populações

Cada população pode se diferenciar em quatro tipos diferentes de E.coli’s correspondentes à cada número que um sudoku 4×4 permite (1, 2, 3 e 4).

Comunicação entre as Posições (Populações)

Comunicação viral entre as posições (populações) do sudoku

As populações devem se comunicar para transmitir a informação de suas posições para as outras posições; afinal é assim que se resolve um sudoku: podemos dizer que uma posição é 1, 2, 3 ou 4 depois de recebermos as informações de quais números existem no quadrado, linha e coluna correspondente à posição em questão.

Essa comunicação é feita através de vetores virais, que são vírus que as bactérias produzem para infectar as outras populações correspondentes às outras posições, transmitindo as informações que possuem (como sua “posição” e “estado”: 1, 2, 3 ou 4).

Diferenciação dos Estados

Diferenciação dos estados

Para o sudoku funcionar, quando uma posição identificar qual é o estado de suas vizinhas, ela deve se diferenciar justamente no estado que não recebeu sinal. Por exemplo (imagem ao lado), se a posição (1,1) (linha 1, coluna 1) receber as informações de que certas posições em seu quadrado, linha e coluna já estão diferenciadas nos estados 3, 2 e 1, ela deve se diferenciar em 4. Para conseguir fazer isso, os japoneses usaram o dispositivo chamado “4C3 leak switch”, que se baseia na probabilidade de uma polimerase em “ignorar” os sítios terminadores de transcrição. Para entender melhor, veja a imagem abaixo:

Cada gene codifica um tipo de recombinase (as setinhas apontando para a esquerda: Hin, flpe, Ligand 3 e Ligand 4). Quando a E.coli for infectada por um vírus de uma posição com que se comunica, ele inserirá um plasmídeo que expressa uma dessas 4 recombinases, agindo nas posições que flanqueam o mesmo gene na bactéria. Por exemplo, na imagem da diferenciação dos estados, a posição (2,2) envia um vírus à (1,1) passando a informação de que possui o estado “2″, expressando a recombinase flpe e retirando o respectivo gene do plasmídeo bacteriano através das posições FTR que flanqueiam o gene (ver imagem acima). Ao fazer isso, também retirará o sítio terminador que fica entra os FTR, aumentando a probabilidade da polimerase atravessar todas as sequências de recombinases de sequências invertidas e expressar a cre recombinase (setinha cinza apontando para a direita). Depois, se a posição (1,1) receber mais dois vírus diferentes, ele perderá 3 genes de recombinase e três sítios terminadores, restando apenas um sítio terminador entre o promotor pT7 e o gene cre. Nesse estágio, a probablilidade de a polimerase ultrapassar o sítio terminador (daí que vem o “leak”) é considerável, e quando o faz, transcreve a cre recombinase, que retira seu próprio gene e os dois sítios terminadores duplos depois dele, conectando o gene de recombinase que não foi retirado do plasmídeo junto dos genes que também estão em sentido reverso, transcritos pelo promotor pSP6. Além disso promove a produção de vírus através da retirada dos dois sítios de parada que separam o segundo promotor pT7  do gene que transcreve a polimerase que atua no promotor pSP6 e o gene que produz o capsídeo do vírus. O empacotamento das sequências genéticas no vírus acontecem após a loading sequence (retângulo rosa). Isso faz com que a posição 1 passe também a “emitir” vírus informando seu estado e posição.

Para entender de verdade, vale assistir o vídeo (começa mesmo aos 24 seg) que o próprio time japonês fez para mostrar o funcionamento do sistema (percebam o sotaque!):

Restrição de Posições

Para isso dar certo é preciso que somente as populações da respectiva linha, coluna e quadrado comuniquem-se entre si, ou seja, deve have uma restrição à comunicação entre as populações de posições não-relacionadas segundo o sudoku. Como isso é feito!? Sim! RNAs antisense!

Tudo isso só consegue funcionar graças à atuação dos RNAs antisense que coordenam o fluxo de informação entre as diferentes populações associadas às diferentes posições do sudoku. Na imagem do 4C3 leak switch são as location sequence que contém todas as sequências codificantes dos RNAs de interferência de cada posição. Com isso é possível construir uma tabela de correspondência de antisense que dirá quais antisense uma posição deve fazer para inibir a atuação dos vírus de outras posições não-relacionadas:

Mas espera aí! O sudoku é uma tabela 2D, como é possível separar as diferentes populações, uma em cada posição característica, e assim fazer a transferência de informação!? É preciso construir algo físico – uma tabela de sudoku de verdade – para esse sistema sintético!? Resposta: não é preciso “separar” as populações, a interação entre os RNAs antisense dos vírus de cada população que remete à uma posição dá conta do recado. Você pode misturar todas a populações em um tubo de ensaio (com o input, é claro) e depois analisar os estados de cada bactéria pertencente à um tipo de população (por sequenciamento) e assim saber o resultado do sudoku.

Esse conceito de restrição de informação por RNAs antisense, e esse fluxo de informação por vírus é essencial para se entender o que estávamos discutindo no clube de biologia sintética, sobre como fazer em um sistema bactériano uma…

Rede Neural

Por fim: rede neural! Como fazer um dispositivo biológico sintético que imite uma rede neural!?

Bem, abstratamente falando, uma rede neural pode ser simbolizada através da imagem ao lado: os neurônios (as bolinhas) e suas ligações. O que temos em comum entre esses sistema e o sudoku são que temos posições espaciais trocando informações e seguindo um padrão. No sudoku o que restringe o fluxo de informação são as regras que pré-estabelecemos para o jogo, no sistema neuronal o que restringe a comunicação é apenas o espaço (existe um número finito de ligações axônicas que os neurônios podem fazer devido à limitação de espaço), além de outro fator: o “peso” dessas interações, que associa uma intensidade de fluxo de informação entre neurônios (o aumento desses “pesos” durante o tempo devido a um estímulo é o que chamamos de aprendizado).

Rede de Hopfield

Para querer fazer o design de um sistema sintético que se comporte como uma rede
neural devemos usar um modelo que represente uma rede neural! Existem vários deles, mas um mais simples e talvez o mais interessante para usarmos é a Rede de Hopfield, muito usada em computadores para reconhecimento de padrões. Hopfield é chama de uma rede de memória associativa pois consegue armazemar memória através da associação de informações existentes na comunicação entre vários neurônios. Uma das implicações disso é a capacidade de recuperar esse padrão mesmo quando dado um padrão incompleto.

Exemplo do Funcionamento

Imaginemos que, semelhantemente ao sudoku, também tenhamos uma matriz com posições, só que agora 3×3 e tendo apenas dois estados: “preenchida” ou “ativada”(denotada por 1), e “não-preenchida” ou “inativada” (denotada por 0). Podemos construir então “letras” preenchendo essas posições. Queremos que nosso sistema reconheça o padrão incompleto dessas letras e complete-o com sua memória:

Legal, mas como funciona o algoritmo disso!? Basicamente é com a definição das conexões que esses dois padrões têm. Partindo da hipótese que somente as posições próximas podem se comunicar (assim como neurônios, em um modelo simplificado), no padrão que pré-estabelecemos para o sistema, a comunicação entre duas posições preenchidas é considerada excitatória, ou seja, uma posição influencia a outra a permanecer ativada; já quando uma posição não-preenchida se comunica com uma preenchida, a comunicação é considerada inibitória; e por fim, quando duas posições não-preenchidas estão uma ao lado da outra, há indiferença e não há ativação ou inibição entre si (ver imagem abaixo). Com isso podemos criar uma rede de comunicação  característica de cada figura com os pesos dos padrões.

Para a rede reconhecer ambos os padrões, deve-se somar os pesos dos padrões L e T:

Cada peso de comunicação da soma dos pesos é computada para reestabelecer um dos padrões da memória dado um padrão incompleto. Vejamos o exemplo da imagem abaixo: um L incompleto. Para decidir se a posição não-preenchida se preencherá é preciso computar o padrão incial em relação aos pesos na “memória da rede” com a expressão abaixo, em que wik é o peso da interação entre a posição em questão (denotada por i) e uma determinada posição k.

Então somando-se os produtos entre os estados xk (das k posições comunicando-se com a posição incompleta) e os pesos wik das interações entre as k posições e a posição incompleta, define-se o estado que a posição incompleta deve ter: se é de fato um estado inativado ou ativado (preenchido):

x(3,1) = 1 . 1 + 0 . 1

x(3,1) = 1

Portanto, segundo a interação associativa da rede, a posição (3,1) torna-se em um estado ativado (1) completando a letra L. Para diferentes inputs o cálculo é o mesmo e (com algumas exceções) o sistema sempre se ajusta à um dos dois padrões de sua memória: ou um L ou um T.

Como Fazer isso com Bactérias

Assim comom no sudoku, podemos criar diferentes populações de bactérias para cada posição além de – pelo mesmo mecanismo – uma rede de transmissão de RNAs antisense por vírus baseando-se na tabela de pesos das interações entre as populações existentes (a “memória” do sistema), de modo que cada posição tenha os antisense corretos para reprimir ou estimular a produção de uma determinada proteína repórter para cada posição! O que se diferenciaria do sudoku é que precisaríamos construir um aparelho literal do sistema que queremos construir, ou seja: é preciso separar as diferentes populações para discernir os outputs para saber ao certo qual população referente emitiu luz verde por GFP, por exemplo. O input também poderia ser luz, feito através de um light switch.

E assim o ciclo das relações um tanto improváveis se fecha. Mas como a ciência é extremamente mutável vários outros assuntos podem se juntar nessa ciranda e dar origem a outras “improbabilidades”. Você, leitor, também pode fazer parte desse trabalho ou pelo menos acompanhar de perto e conhecer um pouco melhor sobre essas coisas que andam rolando nas discussões do clube de biologia sintética através das reuniões gravadas, em especial (sobre como fazer uma rede neural artificial em bactérias)  essa aqui no nosso canal no LiveStream.

Quem sabe possamos colocar em prática tudo isso!? Vejamos em 2012!

Light Switches: Um Review

ResearchBlogging.orgJá tratamos nesse blog de um dispositivo simples, mas engenhoso, para a transdução de um sinal luminoso em uma resposta genética desejada, no caso um switch de luz vermelha. Mas podemos abranger o conceito de switch de luz para uma variada gama de mecanismos que a própria natureza esculpiu durante os milhares de anos que teve para se divertir sozinha antes que nós aprendêssemos a modificá-la.

Os mecanismos mais óbvios, que conhecemos bem antes de termos conhecimento da existência de uma célula, são os das plantas. Apesar de pensarmos nesses seres vivos como a fonte mais provável das ferramentas que precisamos para construir um light switch, a biologia sintética utilizou até agora principalmente os dispositivos fotossensíveis de microorganismos fototróficos e quimiotróficos, presentes em uma grande quantidade de bactérias.

As funções de muitos fotorreceptores ainda não são muito claras, mas alguns exemplos na natureza da atividade desses mecanismos vão desde a regulação da motilidade celular, formação de pigmentos, reparo de DNA, resposta ao stress , à até “comportamentos multicelulares”, como a formação de biofilmes e de corpos de frutificação, como por exemplo a Stigmantella aurantiaca.

Corpo de frutificação da Stigmantella aurantiaca.

Corpo de frutificação de Stigmantella aurantiaca. Retirado da publicação de van der Hornst et al, mencionada no final do post.

A grande maioria das proteínas fotossensíveis que a seleção natural pôde criar nesses milhões de anos, e que até agora conhecemos, pode ser classificada em seis famílias bem definidas, baseada na estrutura do cromóforo absorvedor de luz, que podem ser: as famosas rodopsinas, os aqui já conhecidos fitocromos, as xantopsinas, os criptocromos, as também famosas fotropinas e as proteínas de domínio BLUF (blue light sensing using flavin (FAD), domínio utilizador de flavina sensível à luz azul).

A natureza é sutil; ela parte de princípios básicos e com eles (utilizando um bocado de tempo) cria as mais variadas soluções para um mesmo problema. Com os fotorreceptores não é diferente. Uma procura de similaridade de sequências que codificam esses seis tipos de fotorreceptores no mecanismo de busca protein BLAST do NCBI revela uma grande quantidade de sequências similares nos genomas de diferentes espécies, indicando um vasto número de receptores ainda não caracterizados em diversos microorganismos. Um exemplo dessa busca pode ser visto da lista deste link: Chemotrophic organisms containing protein photoreceptor domains.

O princípio básico dos fotorreceptores é: uma estrutura molecular que contenha um ou mais domínios que captam a luz (input) e outro(s) que transforme(m) isso em um sinal intracelular (output). Os domínios de input ligam-se a cofatores ou cromóforos, resultando em uma molécula capaz de absorver luz UV ou visível. O domínio do output pode possuir uma atividade enzimática, proteína-ligante, ou DNA-ligante.  Vejamos alguns domínios de input e de output comumente encontrados in natura.

Domínios de Input Domínios de Output
AppA: Anti-repressor de pigmentos fotossintéticos. O AppA foi a primeira proteína com domínio BLUF caracterizada em Rhodobacter sphaeroides. Absorve na região dos 446 nm com o seu cromóforo FAD. Além de sensível à luz, está envolvida em reações redox.BLUF: Um domínio presente em várias proteínas fotoativas, sua estrutura é similar, mas com um mecanismo funcional totalmente diferente, ao domínio PAS.

LOV: Uma subclasse do domínio PAS, nomeado LOV devido ao tipo de sinal que esse domínio detecta: Luz-Oxigênio-Voltagem (light-oxygen-voltage). Esse tipo de domínio foi descoberto em fototropinas de plantas e mais recentemente em proteínas bacterianas. Um tipo de domínio bem “popular”.

PAS: De “Per-Arnt-Sim”, três reguladores transcricionais que contêm esse tipo de domínio. Outro tipo de domínio bem “popular” no quesito receptor de luz. Muitas proteínas com domínio PAS são conhecidas por transmitir o seu sinal associando-se a cofatores.

Fitocromo: Receptor de luz vermelha e infravermelho encontrado em plantas e bactérias, ligando-se em uma cromóforo de bilina (Lembra do red light switch? A Ficocianobilina é um desses cromóforos).

PYP: De photoactive yellow protein (proteína fotoativa amarela). Um receptor de luz citoplasmático que usa ácido p-coumárico como seu cromóforo. Sua absorção máxima é em 446 nm.

Rodopsina: Proteína composta por um conjunto de sete hélices intermembrana (ver imagem na tabela abaixo), ligando-se a um cofator retinal em seu centro hidrofóbico, absorvendo em maior parte luz verde. Há uma grande quantidade de estudo sobre ela.

YtvA: Um bem caracterizado domínio fotoreceptor de luz azul em Bacillus subitilis. Possui um domínio LOV que se liga ao cromóforo monoflavina (FMN), o que resulta numa absorção máxima em torno de 449 nm.

EAL: Domínio com atividade enzimática diguanilato-fosfodiesterase (traduzindo: envolvido na hidrólise de di-GMP cíclico, um importante sinalizador intracelular). Chama-se EAL por causa de sua sequência conservada de resíduos, mas também conhecido como DUF2.GAF: Domínio com atividade de adenilato-ciclase, guanilato-ciclase, e fosfodiesterase. Liga-se à um cofator bilina em alguns fitocromos.GGDEF: Similar ao EAL, possui atividade de ciclase em diguanilatos (di-GMP). Também possui seu nome devido à sua sequência conservada, conhecido também por DUF1.

HisKA: Domínio fosfoaceptor e dimerizador de proteínas histidina-quinases, importantes proteínas na sinalização intracelular.

HTH: Domínio de ligação ao DNA de reguladores de transcrição bacterianos. Eles se ligam ao DNA via seu motivo (sequência específica de aminoácidos) helix-turn-helix (hélice-dobra-hélice).

STAS: O domínio STAS, cujo nome significa domínio transportador de sulfato e antagonista de fatores anti-sigma (traduzindo: promove a atividade do tal fator de transcrição sigma), é o domínio de output do bem caracterizado YtvA, mas também encontrado em outros fotoreceptores.

Sabendo como as coisas são naturalmente, é possível juntar diferentes peças desse zoológico de domínios proteicos e formar diferentes light switches. Vejamos por exemplo o red light switch: basta juntar um domínio input de fitocromo e um output de ligação ao DNA, no caso o GAL4. Para sintetizar um switch de luz azul, verde, amarelo, e etc, o princípio fundamental é o mesmo: basta montar um input e um output desejados. O resto é pura metodologia e testes. Alguns exemplos de construções naturais podem ser:

Combinações naturais de diferentes domínios Input e Output.

Imagem modificada retirada da referência deste post (van der Hornst et al.).
 

Como se pode ver, o domínio de input LOV parece ser o mais versátil, o que talvez explique a sua “popularidade” no mundo bacteriano dos domínios fotossensíveis. Encontra-se um LOV input ligado à vários tipos diferentes de outputs.

Uma coisa interessante a se levar em conta nessas construções naturais é o tempo de alternância entre os diferentes estados dos fotorreceptores, que como vimos no red light switch, se resume (na maioria dos casos) a um estado “ativo” quando exposto a luz e um “inativo” quando no escuro ou quando passado certo tempo de exposição. Quando o ciclo de mudança do estado ativo para o inativo é um pouco lento, ele é geralmente compatível com regulações na expressão gênica, enquanto graus rápidos de mudança são relacionados com uma regulação comportamental (que não envolve diretamente uma regulação gênica, como por exemplo o aumento da taxa de motilidade de uma bactéria quando exposta à luz). Um ciclo de mudança ainda mais rápido sugere funções bioenergéticas para o fotoreceptor. Isso é um parâmetro importante a se levar em conta no design de dispositivos sintéticos fotossensíveis.

No fundo, talvez grande parte da própria biologia  sintética se resume ao que discutimos aqui: mudança de informação com recombinação. Caímos então no ponto recursivo da biologia. À diferentes níveis e abordagens sempre teremos  a mesma simples metáfora dos blocos de montar: os blocos sempre são os mesmos, o que muda é a informação que colocamos neles ao fazermos diferentes estruturas com diferentes combinações das unidades. Quer um light switch específico que ainda não foi feito? Já está pronto, só basta combinar informação.

Em posts futuros mostraremos como combinar inputs e outputs para criar light switches de outras cores, novamente, com as construções feitas pelos de times de edições passadas do iGEM. Para maiores e melhores informações sobre fotorreceptores, vale consultar o ótimo review de Michael van der Hornst et al:

van der Horst MA, Key J, & Hellingwerf KJ (2007). Photosensing in chemotrophic, non-phototrophic bacteria: let there be light sensing too. Trends in microbiology, 15 (12), 554-62 PMID: 18024131