Etgen er en funksjonell enhet av arvelighet bestående av en sekvensnukleinsyrer som okkuperer et spesieltlocus på etkromosom. Som regel koder denne funksjonelle enheten for etpeptid. På den måten inneholder genene informasjon om hvordanceller bygges og vedlikeholdes[1][2]. De fleste organismer arver to forekomster av hvert gen: ett fra mor og ett fra far. Genene vil sammen danne etgenetisk rammeverk, som vil avgjøre hvordan en organisme vil se ut, fungere, hvilke sykdommer den er disponert for og hvor mye egenskaper kan bli forbedret/trent opp. Derfor ligner avkom mye på sine foreldre, som ligner på foreldrene sine igjen.
Eksistensen av genene ble først foreslått av augustinerkorherrenGregor Mendel (1822–1884), en katolsk prest som i 1860 studerte arv hos erteplanter og satte fram en hypotese om en faktor som formidler trekk fra foreldre til avkom. Selv om han ikke brukte begrepet «gen», forklarte han sine resultater i form av nedarvede egenskaper. Mendel var også den første som skilte mellomdominante og recessive egenskaper, oppdaget forskjellen mellomheterozygote oghomozygote organismer, og forskjellen mellom det som senere skulle bli beskrevet somgenotypen (arvestoffet til en organisme) ogfenotypen (de synlige trekkene til en organisme).
Mendels nedarvede egenskaper fikk navnet «pangen» avHugo de Vries i 1889, «den minste partikkel [som representerer] en arvelig egenskap».[3]
Den danske botanikerenWilhelm Johannsen var den første som brukte ordet «gen», i 1909.[1]
Det totale settet av gener i en organisme eller celle kalles etgenom. Iprokaryote celler er genene vanligvis lokalisert på ettkromosom av sirkulært DNA.Eukaryota har gener på flere lineære DNA-tråder pakket inn i tett DNA-proteinkomplekser som kalles kromosomer. Noen organismer har flere kopier av genomet sitt i hver celle. Celler eller organismer som har bare ett eksemplar av hvert kromosom kalleshaploide. De som har to kallesdiploide og de med flere enn to erpolyploide. Menneskeceller, unntatt kjønnsceller, har 2 kopier av genomet (diploid) organisert i 23 kromosomer hver.
Dersom genene finnes i flere varianter, kalles dissealleler. Hver celle i menneskekroppen, unntatt kjønnscellene, inneholder et helt sett av gener fra begge foreldre (unntatt for gener på kjønnskromosomene hos menn). Det betyr at hvert gen har to eksemplarer: ett fra mor og ett fra far. Gener nedarves codominant.Fenotyper (de egenskapene vi observerer hos et individ) kan arves dominant, recessivt eller kjønnsbundet. Andre, sjeldne arvemåter finnes. Dominante alleler er observerbare ifenotype. Om en organisme har ulike alleler eller varianter av et gen kalles denheterozygot for dette genet, om ikke kalles denhomozygot.
La oss si at Ola og Kari har to barn som heter Pål og Maia. Ola har brunt hår og Kari er blond. Faren til Ola har rødt hår og moren hans har brunt hår. Det vil si at Ola arvet et gen som koder for rødt hår fra faren sin og et som koder brunt hår fra moren sin. Genet for brunt hår er dominant og dermed har Ola brunt hår selv om han bærer en kopi som koder rødt hår også. En av Karis foreldre var også rødhåret og hun har to kopier av hårfargegenet: blondt og rødt. Blondt er dominant i forhold til rødt, så er Kari blond. Både Ola og Kari erheterozygoter.Pål, barnet til Ola og Kari, arvet to rødhårgenkopier fra begge foreldre og er rødhåret. Han erhomozygot. Maia arvet en rødhårgenkopi fra faren sin og blondhårkopien fra moren sin. Derfor er hunheterozygot og hennes hår blir blondt.Dette eksempelet viser hvorfor man i noen tilfeller ikke ligner på foreldrene, men på besteforeldre eller oldeforeldre.
Struktur av et eukaryotisk gen og molekylærbiologiens grunnprinsipp
Imolekylærbiologi er et gen en del av DNA-tråd som koder forRNA-molekyl. Sekvensen avnukleotider (altså DNA-byggeblokker ellerbasepar) utgjør en funksjonell enhet som ofte er spredt over et større segment av DNA. I genets DNA-segment finnes det kodende delene av genet (ekson) innimellom ikke-kodende områder (intron).
Gener koder for forskjellige RNA molekyler, somrRNA,tRNA,miRNA ogbudbringer-RNA (eller mRNA etter engelsk messenger RNA). De som koder for mRNA er kalt protein-kodende gener. Et protein-kodende gen inneholder informasjon om hvordan et bestemtprotein (eller et sett av proteiner, sealternativ spleising) i en celle skal bygges opp. For å få produsert et protein blir et gen lest av et spesieltenzym (kaltRNA polymerase) og enRNA-sekvens som tilsvarer genets DNA-sekvens blir produsert. Prosessen kallesRNA transkripsjon (eller syntese) og resulterer resulterer i et primærtranskript som kalles forløper-mRNA (precursor-mRNA ellerpre-mRNA). mRNA-transkriptet (laget icellekjernen) transporteres så tilcytoplasma. Underveis blir transkriptet modifisert og gjort om til mRNA, før transkriptet havner hosribosomet. På ribosomet produseres proteinet. Hele prosessen, altså veien fra DNA via RNA til proteiner, kalles ofte molekylærbiologiens grunnprinsipp eller dogme.
Prokaryote genstruktur
Prokaryote gener er ganske enkle i forhold til eukaryotiske gener (se nedenfor). Et prokaryotisk gen koder for bare et protein og det er regulert på en enkel måte. Foran i genet sitter enpromotor som signaliserer hvor transkripsjon av genet skal starte. Veldig ofte er flere prokaryotiske gener som koder for proteiner med beslektede funksjoner transkribert sammen. De er gruppert sammen langs DNA-trådene og har en felles promotor. Denne gengruppen kallesoperon.
Eukaryote genstruktur
Eukaryote gener kan være svært kompliserte og inneholde elementer som:
intron – DNA-sekvenser som etter transkripsjon blir fjernet fra RNA-tråden
utranslaterte regioner (UTR) – deler av ekson-sekvenser som blir transkribert (til pre-mRNA) men ikke translatert. UTR-regioner finnes enten i begynnelsen eller i slutten av et ekson
promotor – et område av DNA som signaliserer hvor transkripsjon av et gen skal starte. Promotoren befinner seg som oftest rett før genet
enhancere ogsilencere – områder i DNA som ved aktivering regulerer hvor ofte et gen blir transkribert.
Det er ikke enighet om hva et gen er. Et eksempel på en definisjon av et gen er et DNA-fragment som koder for etprotein. Ifølge denne definisjonen inneholder et gen bare de kodende fragmentene av DNA (altsåekson). Hvis genet defineres som en genomisk sekvens som blir representert ipre-mRNA transkriptet, hører ogsåintron og andre ikke oversatte (men transkriberte) sekvenser til genet. Den nyeste og mest vidtfavnende definisjonen sier at genet er "en region i en genomisk sekvens som tilsvarer en enhet avarv, som er knyttet til regulatoriske regioner, transkriberte regioner, og andre funksjonelle sekvensregioner".[7] Det vil si at alle de elementene som bidrar tilgenuttrykket også omfattes av definisjonen. Denne definisjonen passer også med historiske betraktninger om arv, se avsnittetHistorikk.
Når en celle deler seg i to, blir DNA-et kopiert til to eksemplarer – en kopi for hver celle. Prosessen kallesDNA-replikasjon. Det er svært viktig at DNA replikeres nøyaktig. Spontane feil ved replikasjon oppstår veldig sjelden. Hos prokaryoter skjer det i gjennomsnitt 7 feil per 107 (Bakteriofag M13) til hvert 1011 replikerte basepar(i soppenNeurospora crassa). Hos eukaryoter som har enda bedre DNA-reparasjonsmekanismer oppstår feil en gang hvert 1010-1011 basepar.[8] Feil som oppstår under replikasjon kalles mutasjoner. Noen mutasjoner er spontane feil som skjer ved replikasjon, mens andre skyldes at DNA-et blir eksponert for mutagener som UV, stråling og mutagene kjemikalier.
Mutasjoner som ikke er dødelige akkumuleres i DNA. De fører til økt genetisk variasjon. Dersom mutasjonen er gunstig, blir den beholdt i befolkningen. For eksempel kan en sommerfugl produsere avkom med nye mutasjoner. De fleste av disse mutasjonene vil ikke ha noen effekt, men dersom fargen på et av avkommene til sommerfuglen endres, kan dette gjøre det vanskeligere (eller lettere) for rovdyrene å se. Dersom fargeendringen er fordelaktig er sjansen for at denne sommerfuglen overlever og produserer sine egne avkom litt bedre – den er bedre tilpasset til miljøet. Over tid vil antall sommerfulger med denne mutasjonen øke.
En måte å klassifisere mutasjoner i gener er påvirkningen på produsert protein:
stille mutasjon – mutasjon som ikke fører til endring avaminosyren (protein-byggeblokk)
missense-mutasjon – mutasjon som fører til endring av en aminosyre i proteinet
nonsense-mutasjon – resulterer i et tidlig stopp-kodon (stopp-kodonet signaliserer slutt av transkripsjon og fører til kortere proteinkjede i proteinet)
leseramme-mutasjon (eng.frameshift) – Tre nukleotider koder for en aminosyre. Dersom noen nukleotider er fjernet (eng.deletion) eller lagt til DNA (eng.insertion) blir leserammen i genet forskjøvet (med mindre antall nukleotider fjernet eller lagt til er muliplum av 3). Noen av nukleotidene som kodet for en aminosyre hører da til et annet kodon, og dette kan føre til at det ferdige proteinproduktet er helt annerledes enn før mutasjonen.
^Mark B. Gerstein et al., "What is a gene, post-ENCODE? History and updated definition," Genome Research 17(6) (2007): 669-681
^Steinman RM, Moberg CL (February 1994). "A triple tribute to the experiment that transformed biology". J. Exp. Med. 179 (2): 379–84. doi:10.1084/jem.179.2.379.PMID 8294854
^Min Jou W, Haegeman G, Ysebaert M, Fiers W (1972). "Nucleotide sequence of the gene coding for the bacteriophage MS2 coat protein". Nature 237 (5350): 82–8. doi:10.1038/237082a0.PMID 4555447
^Group of the Sequence Ontology consortium, coordinated by K. Eilbeck, cited in H. Pearson. (2006). Genetics: what is a gene? Nature, 441, 398-401
^Rates of Spontaneous Mutation Drake et al. Genetics, 1998