Gen med exon och intron. Resten av kromosomen syns hopsnurrad till höger.
Genen är en enhet för information omärftliga egenskaper, som ärvs frånföräldrar tillavkomman. En biologisk gen kodar för ett visstprotein; genen är ett slags recept på ett visst protein.Människan har ca 22 000 gener, fördelade på de olikakromosomerna. En gen består av en viss sekvensnukleotider som genom dengenetiska koden beskriver en sekvens avaminosyror, vilka i sin tur bygger upp ettprotein. Informationen iDNA-molekylen översätts,transkriberas, till olika former avRNA, som styr tillverkningen,syntesen, av proteinet i cellensribosomer. Ibland räknas även vissaDNA-sträckor som harregulatoriska funktioner, det vill säga bestämmer när det ska tillverkas protein och hur mycket, till genen.
Hos vissavirus består generna ibland avRNA-segment istället för DNA. Dessa RNA-gener utgör antingen direkt ett underlag förproteinsyntesen ivärdcellen som viruset infekterat, eller så, som hosretrovirus, måste informationen i virusets RNA först översättas till DNA innan det kan användas förproteintillverkning. I vissa fall är inte genens slutprodukt ett protein, utan det stannar på RNA-stadiet. Detta förekommer främst i RNA-molekyler som ingår ienzymer som kallasribozymer, och i vissa av cellensorganeller såsomribosomerna.
Generna ingår i jättemolekyler vars namn förkortasDNA. Dessa liknar långa, spiralvridna stegar. Varje gen motsvarar ett bestämt avsnitt av en sådan DNA-stege. En DNA-molekyl har alltså plats för många gener, kanske 1000 stycken. Varje ”stegpinne” i en DNA-molekyl består av två så kallade kvävebaser. Dessa passar mot varandra ungefär som pusselbitar. I DNA finns fyra olika sorters kvävebaser som betecknas A, T, C och G.
Generna styrcellensfunktion genom de olika proteiner som de kodar för. I enflercellig organism kontrollerar generna också utvecklingen från den förstabefruktadeäggcellen till den färdigaorganismen. Olika gener samverkar i ett kompliceratreglersystem, där vissa proteiner reglerar vilka andra gener som för tillfället ska vara aktiva. Trots att allakroppsceller innehåller samma gener, är olika gener aktiva i olika celler beroende på vilken roll cellen har, i vilketutvecklingsstadium cellen befinner sig och vilkastimuli den utsätts för. Reglering avgenuttryck sker främst genom att olika former av proteiner binder till bestämda ställen på denregulatoriska sträcka DNA som hör till genen, och ger upphov till, ger större mängder av eller hindrar transkriberingen till RNA. När ingentranskribering sker på en sträcka avkromosomen ligger den inaktiv, ihoppackad tillsammans med speciella proteiner,histoner, tillkromatin i cellkärnanskromosomer. I allmänhet ligger största delen avgenomet inaktivt och hoppackat på detta vis, medan en mindre del av generna används.
I de flesta högre organismer kodar endast en mycket liten del avnukleotidsekvensen i DNA-molekylerna för något protein. Mellan de egentliga generna finns ofta långa sekvenser av vad som tidigare kalladesskräp-DNA (eng.junk DNA). Idag vet man att det så kallade skräp-DNA:t harregulatoriska funktioner, och även är viktigt för hoppackningen till kromatin. Inom en gen finns oftast avsnitt av nukelotid-sekvenser,intron, som inte kodar för någraaminosyror. De delar av DNA-molekylen som kodar för - utgör receptet på - ett protein kallasexon.
Den totala mängden DNA i en cell är hos de flesta organismer fördelad mellan ett antalkromosomer som i de flesta fall finns i två upplagor, där ett exemplar kommer frånmodern och den andra kommer frånfadern. Undantaget ärkönskromosomerna,X-kromosomen ochY-kromosomen, som sinsemellan är helt olika och ansvarar för de proteiner som reglerar desexuella skillnaderna mellankönen. De vanliga kromosomerna, som inte är könskromosomer kallasautosomer. En gens placering,locus, på en kromosom är för det mesta väldefinierad för varje enskild art, även om det förekommer att funktionella gener kan finnas på ett helt annat ställe på kromosomen eller till och med på en helt annan kromosom. Generna är inte placerade i de olika kromosomerna enligt något systematiskt mönster; de gener som ligger nära varandra har i allmänhet inte något samband med varandra utan kan ingå i helt obesläktade processer i cellen.
När cellen delar sig, måste DNA-molekylerna replikeras, fördubblas. Då uppstår ibland spontana fel,mutationer, där nukleotidsekvensen inom en gen förändras så att aminosyresekvensen i det protein som kodas blir en annan. Ibland har denna förändring ingen betydelse för proteinets funktion, men ibland förändras eller förhindras proteinets funktion. Detta leder till en genetisk variation; en viss gen kan förekomma i en mängd olika varianter,alleler. De två upplagorna av en gen som finns i en normal kroppscell kan alltså vara olika. Individer som har två likadana varianter av en gen sägs varahomozygoter med avseende på denna gen. Individer som har två olika varianter av genen sägs varaheterozygoter. En genetisk variant som slår igenom även om den bara finns i ett exemplar kallasdominant, och en allel som måste finnas i två exemplar för att den ska få någon praktisk betydelse kallasrecessiv.
Det finns ingen inbyggd fysiologisk eller cellulär mekanism som kan avläsa behovet av nya gener, utan sådana uppstår som en spontan och slumpmässig process underevolutionen. Oftast uppstår nya gener som ett resultat av att en gammal gen dupliceras. Det kan ske som ett misstag underreplikationen av cellens genetiska material, även biologiskavirus kan vara ansvariga för att överföra gener från en organism till en annan.
Den förste som beskrev konceptet gener, varmunkenGregor Mendel som studerade olikaplantorsärftliga egenskaper. Även om han inte använde ordetgen så förklarade han resultatet av sina experiment med förekomsten av ärftliga faktorer som fördes över mellangenerationerna i odelbara bitar. Dettagenbegrepp utgår från egenskaper som kan observeras, ochpostulerar den ärftliga faktorn som förklaring. Mendel var också den förste som beskrevarv i form av dominanta och recessiva anlag och skillnaden mellan homozygota och heterozygota individer.
1941 visadeGeorge Wells Beadle ochEdward Lawrie Tatum att mutationer i gener förorsakade felaktigheter i vissaämnesomsättningsprocesser. Detta visade att specifika gener kodade specifika proteiner, vilket ledde till den s.k. "en gen - ett enzym" -hypotesen. 1953 framladeJames Watson ochFrancis Crick en modell förDNA-molekylens struktur som grundades påRosalind Franklins arbete med röntgendiffraktions-bilder och förklarade hur genetisk information kunde överföras från en generation till en annan.