Este esquema ilustra o gene eucarioto com relação à estrutura doDNA e um cromossoma (direita).
Gene, embiologia, é a unidade fundamental dahereditariedade. Cada gene é formado por uma sequência específica e ordenada deácidos nucleicos (ADN eARN) que codifica um produto funcional específico (isto é, umaproteína ou molécula deRNA).[1] Acreditava-se que o ser humano possuía aproximadamente 100 000 genes em seus 46cromossomos,[2] porém estudos atuais sobre o genoma identificaram entre 20 000 e 25 000 genes.[3]
Durante aexpressão genética, o ADN é primeiro copiado em ARN. O ARN pode ser diretamente funcional ou ser o modelo intermediário para uma proteína que desempenha uma função. A transmissão de genes à descendência de um organismo é a base da herança dos traçosfenotípicos. Esses genes formam diferentes sequências de ADN, denominadasgenótipos que, juntamente com os fatores ambientais e de desenvolvimento, determinam quais serão os fenótipos. A maioria das características biológicas está sob a influência depoligenes (muitos genes diferentes), bem como de interações gene-ambiente. Algumas características genéticas são instantaneamente visíveis, como a cor dos olhos ou o número de membros, e outras não, como o tipo de sangue, a susceptibilidade à doenças específicas, ou os milhares de processos bioquímicos básicos que constituem a vida.
O gene é um segmento de um cromossomo a que corresponde um código distinto, uma informação para produzir uma determinadaproteína ou controlar uma característica, por exemplo, a cor dosolhos. Os genes podem adquirirmutações em sua sequência, levando a diferentes variantes, conhecidas comoalelos, na população . Esses alelos codificam versões ligeiramente diferentes de uma proteína, que causam diferentes características fenotípicas.[4]
O termo "gene" foi introduzido pelo botânico e geneticista dinamarquêsWilhem Ludvig Johannsen em 1909 e, desde então, muitas definições de gene foram propostas. Atualmente, diz-se que um gene é um segmento de DNA que leva à produção de uma cadeia polipeptídica e inclui regiões que antecedem e que seguem a região codificadora, bem como sequências que não são traduzidas (íntrons) que se intercalam aos segmentos codificadores individuais (éxons), que são traduzidos.
O conceito de gene continua a ser refinado à medida que novos fenômenos são descobertos.[5] Por exemplo, as regiões regulatórias de um gene podem ser bem removidas de suas regiões codificantes, e as regiões codificantes podem ser divididas em váriosexons. Algunsvírus armazenam seu genoma em ARN em vez de ADN, e alguns produtos gênicos sãoARNs não codificantes funcionais. Portanto, uma definição ampla e moderna de trabalho de um gene é qualquerlócus discreto de sequência genômica hereditária, que afeta as características de um organismo ao ser expresso como um produto funcional ou pela regulação da expressão do gene.[6]
A existência de unidades herdáveis discretas foi sugerida pela primeira vez porGregor Mendel (1822–1884).[7]
De 1857 a 1864, emBrno,Império Austríaco (atualRepública Tcheca), ele estudou os padrões de herança em 8 000 plantas de ervilha comestíveis comuns, rastreando características distintas desde os pais até os filhos. Ele descreveu isso matematicamente como 2n combinações, onde n é o número de características diferentes nas ervilhas originais. Embora não tenha usado o termogene, ele explicou seus resultados em termos de unidades herdadas discretas que dão origem a características físicas observáveis. Esta descrição prefigurou a distinção deWilhelm Johannsen entregenótipo (o material genético de um organismo) efenótipo (as características observáveis desse organismo). Mendel também foi o primeiro a demonstrar asegregação independente, a distinção entre traçosdominantes erecessivos, a distinção entre umheterozigoto ehomozigoto, e o fenômeno da herança descontínua.
Antes do trabalho de Mendel, a teoria dominante da hereditariedade era a da herança combinada, que sugeria que cada pai contribuía com fluidos para o processo de fertilização e que as características dos pais se misturavam para produzir a prole.Charles Darwin desenvolveu uma teoria da herança que ele denominoupangênese, dogregopan ("tudo, todo") egênese ("nascimento")/genos ("origem").[8] Darwin usou o termogemula para descrever partículas hipotéticas que se misturariam durante a reprodução.
O trabalho de Mendel passou despercebido após sua primeira publicação em 1866, mas foi redescoberto no final do século 19 porHugo de Vries,Carl Correns eErich von Tschermak, que (alegadamente) teriam chegado a conclusões semelhantes em suas próprias pesquisas.
Wilhelm Johannsen
Dezesseis anos depois, em 1905,Wilhelm Johannsen introduziu o termo 'gene' eWilliam Bateson o termo 'genética', enquantoEduard Strasburger e outros ainda usavam o termo 'pangene' para a unidade física e funcional fundamental de hereditariedade.
Os primeiros indícios experimentais de que os genes atuam por meio do controle da síntese das enzimas foram em meados da década de 1930. Os pesquisadoresGeorge Beadle (1903–1989),Edward Lawrie Tatum (1909–1975) mostraram que a cor alterada do olho mutante da moscaDrosophila melanogaster devia-se à incapacidade do inseto realizar uma reação química específica na via metabólica da síntese de um pigmento visual.[9]
Entusiasmado com os resultados obtidos com o estudo da mosca, mas cientes de que aquele organismo muito complexo para o teste de sua hipótese, Beadle e Tatum resolveram utilizar um organismo mais simples em seus experimentos: o bolor rosado do pão,Neurospora crassa.[10]
Os avanços na compreensão dos genes e da herança continuaram ao longo do século XX. O ácido desoxirribonucléico (ADN) mostrou ser o repositório molecular da informação genética por experimentos nas décadas de 1940 a 1950.[11][12] A estrutura do DNA foi estudada por Rosalind Franklin e Maurice Wilkins usando cristalografia de raios-X, o que levou James D. Watson e Francis Crick a publicar um modelo da molécula de DNA de fita dupla cujas bases de nucleotídeos emparelhadas indicaram uma hipótese convincente para o mecanismo de replicação genética.[13][14]
No início da década de 1950, a visão predominante era que os genes em um cromossomo agiam como entidades discretas, indivisíveis por recombinação e organizadas como contas em um cordão. Os experimentos de Benzer usando mutantes defeituosos na região rII do bacteriófago T4 (1955–1959) mostraram que genes individuais têm uma estrutura linear simples e provavelmente são equivalentes a uma seção linear de ADN.[15][16]
Coletivamente, esse corpo de pesquisa estabeleceu odogma central da biologia molecular, que afirma que as proteínas são traduzidas do ARN, que é transcrito do ADN. Este dogma, desde então, mostrou ter exceções, como a transcrição reversa em retrovírus. O estudo moderno da genética no nível do ADN é conhecido comogenética molecular.
Em 1972, Walter Fiers e sua equipe foram os primeiros a determinar a sequência de um gene: o da proteína capsidial do bacteriófago MS[17] O desenvolvimento subsequente do sequenciamento de DNA de terminação de cadeia em 1977 porFrederick Sanger melhorou a eficiência do sequenciamento e o transformou em uma ferramenta de laboratório de rotina.[18] Uma versão automatizada do método Sanger foi usada nas fases iniciais doProjeto Genoma Humano.[19]
As teorias desenvolvidas no início do século XX para integrar agenética mendeliana com aevolução darwiniana são chamadas desíntese evolutiva moderna, um termo introduzido porJulian Huxley.[20] Os biólogos evolucionistas posteriormente modificaram esse conceito, como a visão da evolução centrada no gene deGeorge C. Williams. Ele propôs um conceito evolucionário do gene como uma unidade de seleção natural com a definição: "aquilo que segregou e recombina com frequência apreciável."[21] Nessa visão, o gene molecular se transcreve como uma unidade, e o gene evolucionário herda como uma unidade. Ideias relacionadas enfatizando a centralidade dos genes na evolução foram popularizadas porRichard Dawkins.[22][23] Foram encontrados indícios de que os genes podem desempenhar um papel importante em gostos pessoais, em áreas como a alimentação, orientação sexual e até opinião política.[24]
Na maioria dos organismos, a informação genética é armazenada noDNA (ácido desoxirribonucleico). Uma molécula de DNA consiste em duas longas cadeias polipeptídicas compostas por quatro tipos de subunidadesnucleotídicas. Cada nucleotídeo é composto de uma molécula de açúcar-fosfato ligada a uma base nitrogenada. As bases são de quatro tipos (adenina, guanina, citosina e timina).[25]
As cadeias de DNA são antiparalelas entre si, unidas por ligações de hidrogênio entre a porção base dos nucleotídeos, formando umadupla hélice de DNA, com nucleotídeoscovalentemente ligados por açúcares e fosfatos, os quais formam a estrutura principal alternada de açúcar-fosfato-açúcar-fosfato. A especificidade do emparelhamento de bases ocorre porque a adenina e a timina se alinham para formar duasligações de hidrogênio, enquanto a citosina e a guanina formam três ligações de hidrogênio. As duas fitas em uma dupla hélice devem, portanto, ser complementares.
Devido à orientação do açúcardesoxirribose (que é umapentose), as fitas de DNA possuem umadirecionalidade. Uma das extremidades de um polímero de DNA contém um grupohidroxila (extremidade 3'), a outra contém um grupofosfato (extremidade 5'). As duas fitas de uma dupla-hélice correm em direções opostas (antiparalelas). A síntese de ácido nucleico, incluindo areplicação e atranscrição, ocorre na direção 5 '→ 3', porque novos nucleotídeos são adicionados por meio de umareação de desidratação, que usa a hidroxila 3' como umnucleófilo.[26] Cada fita de uma molécula de DNA contém uma sequência de nucleotídeos que é exatamente complementar à sequência de nucleotídeos da outra fita.[25]
Aexpressão dos genes codificados no DNA começa pelatranscrição do gene emRNA, um segundo tipo de ácido nucleico que é muito semelhante ao DNA, mas cujo monômeros contêm açúcarribose em vez dedesoxirribose. O RNA também contém a baseuracila no lugar datimina. As moléculas de RNA são menos estáveis do que o DNA e são tipicamente de fita simples. Os genes que codificam proteínas são compostos por uma série de trêsnucleotídeos sequências chamadascódon s, que servem como "palavras" na "linguagem" genética. Ocódigo genético especifica a correspondência durante atradução de proteínas entre códons eaminoácidos. O código genético é quase o mesmo para todos os organismos conhecidos.[25]
Imagem de microscopia fluorescente de uma fêmea humanacariótipo, mostrando 23 pares de cromossomos. O DNA é tingido de vermelho, com regiões ricas emgenes de manutenção coradas em verde.[27]
O conjunto total degenes em um organismo ou célula é conhecido como seugenoma, que pode ser armazenado em um ou maiscromossomos. Cada cromossomo consiste em uma única e longa molécula deDNA, na qual milhares de genes são codificados.[28] A região do cromossomo em que um determinado gene está localizado é chamada delócus. Cada lócus contém umalelo de um gene; no entanto, os membros de uma população podem ter alelos diferentes no lócus, cada um com uma sequência de genes ligeiramente diferente.
A maioria dos genes eucarióticos são armazenados em um grande conjunto de cromossomos lineares, que são empacotados dentro do núcleo em um complexo com proteínas chamadashistonas, formando uma unidade chamadanucleossoma. O DNA empacotado e condensado é chamado decromatina. A maneira como o DNA é armazenado nas histonas, bem como as modificações químicas da própria histona, regulam se uma região particular do DNA é acessível paraexpressão gênica. Além dos genes, os cromossomos eucarióticos contêm sequências envolvidas em garantir que o DNA seja copiado sem degradação das regiões finais e classificado em células-filhas durante a divisão celular:origem de replicação s,telômero se oscentrômero.
As origens de replicação são as regiões de sequência onde areplicação do DNA é iniciada para fazer duas cópias do cromossomo. Telômeros são trechos longos de sequências repetitivas que cobrem as extremidades dos cromossomos lineares e evitam a degradação das regiões codificantes e regulatórias durante a replicação do DNA. O comprimento dos telômeros diminui cada vez que o genoma é replicado e foi implicado no processo deenvelhecimento.[29] O centrômero é necessário para a ligação dasfibras do fuso para separar ascromátides irmãs em células-filhas durante adivisão celular.
Procariontes (bactérias earqueas) normalmente armazenam seus genomas em um único e grandecromossomo circular. Da mesma forma, algumasorganelas eucarióticas, como asmitocôndrias e oscromossomos, contêm um cromossomo circular remanescente com um pequeno número de genes. Os procariontes às vezes complementam seu cromossomo com pequenos círculos adicionais de DNA chamadosplasmídeos, que geralmente codificam apenas alguns genes e são transferíveis entre indivíduos. Por exemplo, os genes pararesistência a antibióticos são geralmente codificados em plasmídeos bacterianos e podem ser passados entre células individuais, mesmo aquelas de espécies diferentes, viatransferência horizontal de genes.[30]
Enquanto os cromossomos dos procariontes são relativamente densos em genes, os dos eucariotos geralmente contêm regiões de DNA que não desempenham nenhuma função óbvia. Os eucariotos unicelulares simples têm quantidades relativamente pequenas de tal DNA, enquanto os genomas deorganismos multicelulares complexos, incluindo humanos, contêm uma maioria absoluta de DNA sem uma função identificada (cerca de 98,5% do genoma humano não codifica proteínas, em contraste com 11% do genoma da bactéria E. coli).[25][31]
Este DNA tem sido referido como "DNA lixo", todavia, análises mais recentes sugerem que, embora o DNA codificador de proteínas constitua apenas 2% dogenoma humano, cerca de 80% das bases do genoma podem ser expressas, portanto, o termo "DNA lixo" pode ser um nome impróprio.[6]
Uma célula normalmente expressa somente uma fração dos seus genes, e os diferentes tipos de células em organismos multicelulares surgem porque diferentes conjuntos de genes são expressos. A estrutura de um gene consiste em muitos elementos, dos quais a sequência codificadora costuma ser apenas uma pequena parte. Estes incluem regiões de DNA que não são transcritas, bem como regiões não traduzidas do RNA.[28]
Cada gene contém um conjunto particular de sequências reguladoras, necessárias para sua expressão. Primeiro, os genes requerem uma sequência promotora, que é a sequência de nucleotídeos do DNA onde os fatores de transcrição se associam e auxiliam a RNA-polimerase a se ligar à região para iniciar a transcrição.[25]
O reconhecimento ocorre tipicamente como uma sequência de consenso, como acaixa TATA. Um gene pode ter mais de um promotor, resultando em RNAs mensageiros que diferem na extensão em que se estendem na extremidade 5'.[32] Genes altamente transcritos têm sequências promotoras "fortes" que formam fortes associações com fatores de transcrição, iniciando assim uma alta taxa de transcrição. Outros genes têm promotores "fracos" que formam associações fracas com fatores de transcrição e iniciam a transcrição com menos frequência.[25] As regiões promotoras eucarióticas são muito mais complexas e difíceis de identificar do que os promotores procarióticos.[25]
Definir exatamente qual seção de uma sequência de DNA compreende um gene é difícil.[33] As regiões regulatórias de um gene, como os potenciadores, não precisam necessariamente estar próximas da sequência de codificação na molécula linear porque o DNA interveniente pode ser executado em loop para trazer o gene e sua região reguladora para a proximidade. Da mesma forma, os íntrons de um gene podem ser muito maiores do que seus exons. As regiões regulatórias podem até estar em cromossomos totalmente diferentes e operar em trans para permitir que as regiões regulatórias de um cromossomo entrem em contato com genes-alvo em outro cromossomo.[34][35]
Os primeiros trabalhos em genética molecular sugeriram o conceito de que um gene produz uma proteína. Este conceito (originalmente chamado dehipótese um gene-uma enzima) surgiu de um influente artigo de 1941 deGeorge Beadle eEdward Tatum sobre experimentos com mutantes do fungoNeurospora crassa.[36] O conceito de um gene e uma proteína foi refinado desde a descoberta de genes que podem codificar várias proteínas por alternativas sequências de splicing e codificação divididas em seção curta em todo o genoma cujos mRNAs são concatenados por trans-splicing.[6][37][38]
Uma definição operacional ampla às vezes é usada para abranger a complexidade desses diversos fenômenos, onde um gene é definido como uma união de sequências genômicas que codificam um conjunto coerente de produtos funcionais potencialmente sobrepostos.[39] Essa definição categoriza genes por seus produtos funcionais (proteínas ou RNA) em vez de seus loci de DNA específicos, com elementos regulatórios classificados como regiões associadas a genes.[39]
Em todos os organismos, duas etapas são necessárias para ler as informações codificadas no DNA de um gene e produzir a proteína que ele especifica. Primeiro, o DNA do gene étranscrito para RNA mensageiro (RNAm).[25] Em segundo lugar, esse mRNA étraduzido para proteína. Os genes codificadores de RNA ainda devem passar pela primeira etapa, mas não são traduzidos em proteína. O processo de produção de uma molécula biologicamente funcional de RNA ou proteína é chamado deexpressão gênica, e a molécula resultante é chamada de produto gênico.
A sequência de nucleotídeos do DNA de um gene especifica a sequência de aminoácidos de uma proteína por meio docódigo genético. Conjuntos de três nucleotídeos, conhecidos comocodons, cada um corresponde a um aminoácido específico.[25] O princípio de que três bases sequenciais do código de DNA para cada aminoácido foi demonstrado em 1961 usandomutações por mudança da matriz de leitura no gene rIIB dobacteriófago T4.[40]
Além disso, um "códon de início" e três "códons de parada" indicam o início e o fim daregião de codificação da proteína. Existem 64 códons possíveis (quatro nucleotídeos possíveis em cada uma das três posições, portanto, 43 códons possíveis) e apenas 20 aminoácidos padrão; portanto, o código é redundante e vários códons podem especificar o mesmo aminoácido. A correspondência entre códons e aminoácidos é quase universal entre todos os organismos vivos conhecidos.[41]
Atranscrição produz uma molécula deRNA de fita simples conhecida comoRNA mensageiro, cuja sequência de nucleotídeos é complementar ao DNA a partir do qual foi transcrita. O mRNA atua como um intermediário entre o gene do DNA e seu produto proteico final. O DNA do gene é usado como molde para gerar um mRNA complementar. O mRNA corresponde à sequência do DNA do genecadeia codogênica porque é sintetizado como o complemento dafita modelo. A transcrição é realizada por umaenzima chamadaRNA polimerase, que lê a fita modelo na direção3' para5' e sintetiza o RNA de 5' a 3'. Para iniciar a transcrição, a polimerase primeiro reconhece e se liga a uma regiãopromotora do gene. Assim, um dos principais mecanismos deregulação gênica é o bloqueio ou sequestro da região promotora, seja por ligação forte por moléculasrepressoras que bloqueiam fisicamente a polimerase ou organizam o DNA de forma que a região promotora não seja acessível.[25]
Emprocariontes, a transcrição ocorre nocitoplasma; para transcrições muito longas, a tradução pode começar na extremidade 5' do RNA, enquanto a extremidade 3' ainda está sendo transcrita. Emeucariotos, a transcrição ocorre no núcleo, onde o DNA da célula é armazenado. A molécula de RNA produzida pela polimerase é conhecida comotranscrito primário e sofremodificações pós-transcricionais antes de ser exportada para o citoplasma para tradução. Uma das modificações realizadas é osplicing deintrons, que são sequências na região transcrita que não codificam uma proteína. Os mecanismos desplicing alternativo podem resultar em transcritos maduros do mesmo gene com sequências diferentes e, portanto, codificando para proteínas diferentes. Esta é a principal forma de regulação em células eucarióticas e também ocorre em alguns procariotos.[25][42][25]
Os genes que codificam proteínas são transcritos para um intermediáriomRNA e, em seguida, traduzidos para umaproteína funcional. Genes codificadores de RNA são transcritos para um funcionalRNA não codificante. (PDB3BSE)
Tradução é o processo pelo qual uma molécula de RNA mensageiro maduro é utilizada como um modelo para sintetizar uma novaproteína. A tradução é realizada porribossomos, grandes complexos de RNA e proteínas responsáveis por realizar as reações químicas para adicionar novosaminoácidos a umacadeia polipeptídica crescente pela formação deligações peptídicas. O código genético é lido três nucleotídeos por vez, em unidades chamadascodons, por meio de interações com moléculas de RNA especializadas chamadasRNA transportador (tRNA). Cada tRNA tem três bases desemparelhadas conhecidas comoanticódon que são complementares ao códon que ele lê no mRNA. O tRNA também écovalentemente ligado ao aminoácido especificado pelo códon complementar. Quando o tRNA se liga ao seu códon complementar em uma fita de mRNA, o ribossomo anexa sua carga de aminoácidos à nova cadeia polipeptídica, que é sintetizada deamino-terminal paraC-terminal. Durante e após a síntese, a maioria das novas proteínas devedobrar para suaestrutura tridimensional ativa antes que possam realizar suas funções celulares.
Algunsvírus armazenam seus genomas inteiros na forma deRNA e não contêm nenhum DNA.[45][46] Por usarem RNA para armazenar genes, seus hospedeiros celulares podem sintetizar suas proteínas assim que forem infectados e sem o atraso da espera pela transcrição.[47] Por outro lado,retrovírus de RNA, como oHIV, requerem atranscrição reversa de seugenoma do RNA para o DNA antes que suas proteínas possam ser sintetizadas. A herançaepigenética mediada por RNA também foi observada em plantas e muito raramente em animais.[48]
Diferenças entre genes bacterianos e genes eucarióticos
Embactérias, a sequência de aminoácidos de um polipeptídio corresponde exatamente à sequência de bases do segmento deDNA subsequente que foi transcrito para oRNA.
Nos organismos eucarióticos, a situação é diferente; a maioria das cadeias polipeptídicas não é perfeitamente colinear à sequência de bases do DNA que as codifica. A razão disso é que a instrução para a síntese de proteínas nos genes eucarióticos é geralmente interrompida por trechos da molécula que não codificam aminoácidos.
Uma analogia pode ajudar a compreender esses conceitos de genes interrompidos e genes não-interrompidos. Imagine o texto de um livro, que contenha uma dada informação e que possa ser lido sem interrupções; podemos compara-lo a uma instrução bacteriana, em que a sequência de bases do DNA corresponde exatamente à sequência de aminoácido da proteína. Imagine agora o que acontece se introduzimos, em determinados pontos desse texto, palavras, frases ou parágrafos sem sentido; a informação original continua lá, mas interrompida por trechos sem significado, que têm de ser eliminada para que a informação seja compreendida. Essa segunda situação é análoga aos genes eucarióticos, nos quais a instrução genética é interrompida por sequências de nucleotídeos desprovidos de qualquer informação para síntese de polipeptídios.
Em uma unidade de transição de um organismo eucariótico, há trechos que serão traduzidos em sequência de aminoácidos e trechos intercalares, que não serão traduzidos. Em1978, ogeneticista norte-americanoWalter Gilbert propôs os termos "exão" (do inglêsexon, deexpressed region, região em que são traduzidas em sequências de aminoácidos) e "intrão" (do inglêsintron, deintragenic region, região intragênica, para designar as regiões não traduzidas entre os exãos).
O processo de definição de intrãos e exãos por parte dos genes para definir quais trechos serão transcritos em uma cadeia de RNA guarda uma admirável complexidade. Desde os anos 1980 já se sabe que alguns genes são capazes de selecionar trechos distintos de exãos, produzindo, dessa forma, diferentes proteínas. Pesquisas recentes têm revelado que esse tipo de ocorrência, longe de ser uma exceção, é a regra no funcionamento dos genes, chegando a um número estimado médio de 5,7 variações possíveis transcrições de uma dada área codificadora. Um determinado gene seria capaz de produzir diferentes transcrições para diferentes tipos de células. Mesmo transcrições obtidas entre exãos de genes diferentes ou mesmo de cromossomos distintos estão sendo consideradas possíveis.
Essas observações têm levado a novas considerações sobre a definição de gene e a novos paradigmas quanto à forma de organização do genoma e da herança genética.[49]
A pseudogenização ocorre quando são formadas cópias não funcionais de um determinado gene. Um pseudogene possui forte semelhança a uma sequência de um gene conhecido, mas apresenta diferenciações que o tornam não funcional; além disso, alguns pseudogenes não podem ser transcritos devido a ausência de promotores e íntrons, os quais são necessários para a transcrição. Há um acúmulo de mutações nos pseudogenes por conta de uma baixa pressão seletiva.[50]
↑Noble, Denis (13 de setembro de 2008).«Genes and causation».Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences (1878): 3001–3015.doi:10.1098/rsta.2008.0086. Consultado em 12 de outubro de 2020
↑Judson H (1979).The Eighth Day of Creation: Makers of the Revolution in Biology. [S.l.]: Cold Spring Harbor Laboratory Press. pp. 51–169.ISBN978-0-87969-477-7
↑Min Jou W, Haegeman G, Ysebaert M, Fiers W (maio de 1972). «Nucleotide sequence of the gene coding for the bacteriophage MS2 coat protein». Nature.237 (5350): 82–8.Bibcode:1972Natur.237...82J.PMID4555447.doi:10.1038/237082a0 !CS1 manut: Usa parâmetro autores (link)
↑Sullivan, Bill (setembro de 2019). Goldberg, Susan, ed. «Porque você gosta disso?». Embarque. São Paulo: ContentStuff.National Geographic Brasil (232): 17–20.ISSN1517-7211|acessodata= requer|url= (ajuda)
↑abcdefghijklAlberts, B.; et al. (2017).Biologia Molecular da Célula 6 ed. Porto Alegre: Artmed Editora.ISBN978-85-8271-423-2 !CS1 manut: Uso explícito de et al. (link)
↑Stryer L, Berg JM, Tymoczko JL (2002).Bioquímica 5ª ed. San Francisco: W.H. Freeman.ISBN978-0-7167-4955-4 !CS1 manut: Usa parâmetro autores (link)
↑abAlberts, Bruce; et al. (2017).Fundamentos da Biologia Celular 4 ed. Porto Alegre: Artmed Editora.ISBN9788582714065 !CS1 manut: Uso explícito de et al. (link)
↑Braig M, Schmitt CA (março de 2006). «Oncogene-induced senescence: putting the brakes on tumor development». Cancer Research.66 (6): 2881–4.PMID16540631.doi:10.1158/0008-5472.CAN-05-4006 !CS1 manut: Usa parâmetro autores (link)
↑Gericke NM, Hagberg M (5 de dezembro de 2006). «Definition of historical models of gene function and their relation to students' understanding of genetics». Science & Education.16 (7–8): 849–881.Bibcode:2007Sc&Ed..16..849G.doi:10.1007/s11191-006-9064-4
↑Spilianakis CG, Lalioti MD, Town T, Lee GR, Flavell RA (2005). «Interchromosomal associations between alternatively expressed loci». Nature.435 (7042): 637–45.Bibcode:2005Natur.435..637S.PMID15880101.doi:10.1038/nature03574 !CS1 manut: Usa parâmetro autores (link)
↑abGerstein MB, Bruce C, Rozowsky JS, Zheng D, Du J, Korbel JO, Emanuelsson O, Zhang ZD, Weissman S, Snyder M (junho de 2007). «What is a gene, post-ENCODE? History and updatad definition». Genome Research.17 (6): 669–81.PMID17567988.doi:10.1101/gr.6339607 !CS1 manut: Usa parâmetro autores (link) !CS1 manut: número-autores (link)
↑Woodson SA (maio de 1998). «Ironing out the kinks: splicing and translation in bacteria».Genes & Development.12 (9): 1243–7.PMID9573040.doi:10.1101/gad.12.9.1243 !CS1 manut: Usa parâmetro autores (link)
↑Jacob F, Monod J (Junho de 1961). «Genetic regulatory mechanisms in the synthesis of proteins».Journal of molecular biology.3 (3): 318–56.PMID13718526.doi:10.1016/s0022-2836(61)80072-7 !CS1 manut: Usa parâmetro autores (link)
↑Eddy SR (dezembro de 2001). «Non-coding RNA genes and the modern RNA world».Nature Reviews Genetics.2 (12): 919–29.PMID11733745.doi:10.1038/35103511 !CS1 manut: Usa parâmetro autores (link)
↑Koonin EV, Dolja VV (1993). «Evolution and taxonomy of positive-strand RNA viruses: implications of comparative analysis of amino acid sequences».Critical Reviews in Biochemistry and Molecular Biology.28 (5): 375–430.PMID8269709.doi:10.3109/10409239309078440 !CS1 manut: Usa parâmetro autores (link)
↑Domingo E, Escarmís C, Sevilla N, Moya A, Elena SF, Quer J, Novella IS, Holland JJ (1996). «Basic concepts in RNA virus evolution».FASEB jornal.10 (8): 859–64.PMID8666162.doi:10.1096/fasebj.10.8.8666162 !CS1 manut: Usa parâmetro autores (link) !CS1 manut: número-autores (link)
↑RIDLEY, Mark (2007).Evolution, Third Edition. [S.l.]: Wiley-Blackwell. p. 206.ISBN1405103450
↑Souza, Diego Trindade De.Origem de genes recentes, uma abordagem com PSSMs deterioradas e arquiteturas de domínio proteico / Diego Trindade de Souza; orientador Sergio Russo Matioli. - São Paulo, 2002. 74 páginas. Tese (Doutorado) –Programa Interunidades em Bioinformática da Universidade de São Paulo, 2016.