kuinka monta geeniä genomissa on?

Reader-Tilassa

Olemme jo tutkineet suuri monimuotoisuus genomin kokoa koko elollista maailmaa (ks. Taulukko vinjetin ”Kuinka iso on genomeja?”). Ensimmäisenä askeleena näiden genomien informaatiosisällön ymmärtämisessä tarvitsemme käsityksen niiden sisältämien geenien määrästä. Kun puhumme geeneistä, meidän tulee ajatella, proteiini koodaus geenien ilman alati laajeneva kokoelma RNA koodaus alueiden geenit.,

Kuva 1: Määrä geenejä funktiona genomin kokoa. Kuvassa on tietoja erilaisista bakteereista ja arkaheasta, ja datalinjan kaltevuus vahvistaa yksinkertaisen nyrkkisäännön, joka liittyy genomin kokoon ja geenien lukumäärään. (Muokattu M. Lynchistä, Genomiarkkitehtuurin alkuperästä.,)

koko puu elämän, vaikka genomin koot vaihtelevat yhtä paljon kuin 8 suuruusluokkaa (alkaen <2 kb Hepatiitti D-virus (BNID 105570), jotta >100 Gbp varten Marmoroitu keuhko kala (BNID 100597) ja tiettyjä kukkia Fritillaria (BNID 102726)), alueella geenien määrä vaihtelee vähemmän kuin 5 suuruusluokkaa (viruksia kuten MS2 ja QB bakteriofagit ottaa vain 4 geenejä noin sata tuhatta vehnä). Monilla bakteereilla on useita tuhansia geenejä., Tämä geenipitoisuus on verrannollinen genomin kokoon ja proteiinin kokoon alla esitetyllä tavalla. Mielenkiintoista, eukaryoottisesta genomin, jotka ovat usein tuhat kertaa tai enemmän suurempi kuin prokaryootit, sisältävät vain kertaluokkaa enemmän geenit kuin heidän prokaryoottiset kollegansa. Kyvyttömyys onnistuneesti arvio määrä geenejä eukaryooteissa perustuu tietoon geeni sisältö prokaryootit oli yksi odottamattomia käänteitä modernin biologian.,

Taulukko 1: vertailu määrä geenien organismi ja naiivi arvio, joka perustuu genomin koko jaettuna jatkuva tekijä 1000bp/geeni, eli ennustettu määrä geenejä = genomin koko/1000. Yksi toteaa, että tämä karkea nyrkkisääntö toimii yllättävän hyvin monien bakteerien ja arkkien, mutta epäonnistuu surkeasti sillä monisoluisten organismien.

yksinkertaisin lukumäärä, arvio geenit genomin etenee olettamalla, että koko genomin koodit geenit kiinnostavat., Mahdollisuuden edetä arvio, meidän täytyy mitata määrä aminohappoja tyypillinen proteiinia, jonka otamme olevan noin 300, tietoisena kuitenkin siitä, että, kuten geenit, proteiinit tulevat laaja valikoima kokoja itseään paljastuu vinjetti, että aihe, ”mitä ovat koot proteiineja?”. Tämän niukan oletuksen perusteella näemme, että tyypillisen proteiinimme koodaamiseen tarvittavien emästen määrä on noin 1000 (3 emäsparia aminohappoa kohti)., Näin ollen tässä ajattelutavassa genomin sisältämien geenien määräksi arvioidaan genomin koko/1000. Bakteerien genomeille tämä strategia toimii yllättävän hyvin, kuten taulukoista 1 ja kuvasta 1. Esimerkiksi, kun levitetään E. coli K-12, genomin 4.6 x 106 bp, tämä nyrkkisääntö johtaa arvio 4600 geenejä, joita voidaan verrata nykyiseen paras tieto tästä määrä, joka on 4225. Kun käydään läpi tusina edustavaa bakteeria ja arkkiherneitä taulukossa, havaitaan yhtä silmiinpistävää ennustavaa tehoa noin 10%: n tarkkuudella., Toisaalta, tämä strategia epäonnistuu näyttävästi, kun käytämme sitä eukaryoottisesta genomin, jolloin esimerkiksi arvioivat, että määrä geenien ihmisen genomin pitäisi olla 3,000,000, brutto yliarvioida. Epäluotettavuus tämä arvio auttaa selittämään olemassaolon Genesweep vedonlyönti allas, joka niin äskettäin kuin 2000-luvun alussa oli ihmisiä, vedonlyönti määrä geenien ihmisen genomin, että ihmisten arviot vaihtelevat enemmän kuin kymmenen kertaa.,

Kuva 2: eri järjestyksessä osat muodostavat ihmisen genomin. Noin 1,5% genomin koostuu ≈20,000 proteiini-koodausta sekvenssit, jotka ovat välissä ei koodaus intronit, mikä on noin 26%. Transposonien ovat suurin osa (40-50%), mukaan lukien esimerkiksi pitkä välissä ydinaseiden elementtejä (Viivat), ja lyhyt välissä ydinaseiden elementtejä (SINEs). Useimmat transposonien ovat genomista jäänteitä, jotka ovat tällä hetkellä haudattu. (BNID 110283, sovitettu T. R. Gregory Nat Rev Genet., 9: 699-708, 2005 based on International Human Genome Sequencing Consortium. Ihmisen genomin ensimmäinen sekvensointi ja analysointi. Luonto 409: 860 2001.)

Mikä selittää tämän epäonnistumisen kaikkein naiivi arvio ja mitä se opettaa meille siitä tiedot järjestetty genomeja? Eukaryoottisesta genomin, erityisesti ne, jotka liittyvät monisoluisten organismien, on ominaista lukuisia kiehtova ominaisuudet jotka häiritsevät yksinkertainen koodaus kuvan hyväksi naiivi arvio., Näitä eroja genomin käyttö on esitelty kuvallisesti Kuviossa 2, joka osoittaa, prosenttiosuus genomin käyttää muihin tarkoituksiin kuin proteiini koodaus. Kuten on nähtävissä Kuvassa 1, prokaryootit voivat tehokkaasti kompakti heidän proteiinin koodausta sekvenssit siten, että ne ovat lähes jatkuvaa ja johtaa vähemmän kuin 10% niiden genomit on määritetty ei koodaus DNA (12% E. coli, BNID 105750) toteaa, että ihmisillä yli 98% (BNID 103748) on ei proteiini koodaus.,

löytö näistä muista käyttää genomin ovat joitakin tärkeimpiä oivalluksia DNA, ja biologian yleisemmin, viimeisen 60 vuoden aikana. Yksi näistä vaihtoehtoisista käyttää genomista kiinteistö on sääntelyn genomin, eli tapa, jolla suuri paloina genomin käytetään tavoitteet sitova sääntely proteiineja, jotka aiheuttavat kombinatoriset ohjaus niin tyypillistä genomien vuonna monisoluisten organismien., Toinen tärkeimmät ominaisuudet eukaryoottisesta genomin on organisaation niiden geenien intronit ja eksonien, jossa ilmaistaan eksonien on paljon pienempi kuin muuna ja intronit saumattu. Lisäksi nämä ominaisuudet, on olemassa endogeeniset retrovirukset, fossiilisia jäänteitä entisen virusinfektioiden ja silmiinpistävän yli 50% perimässä on otettu, että on olemassa toistuvia elementtejä ja transposonien, eri muotoja, jotka voidaan kenties tulkita niin itsekkäitä geenejä, jotka ovat mekanismeja lisääntyä isäntä genomin., Jotkut näistä toistuvia elementtejä ja transposonien on edelleen aktiivinen tänään, kun taas toiset ovat pysyneet jäänne sen jälkeen, kun menettää kyky edelleen lisääntyä genomissa.

johtopäätöksenä genomit voidaan jakaa kahteen pääluokkaan: kompaktiin ja ekspansiiviseen. Ensin mainitut ovat geenitiheitä, sillä vain noin 10% koodaamattomasta alueesta ja genomin koon ja genomiluvun tiukka suhteellisuus. Tämä ryhmä ulottuu genomien koko enintään noin 10 Mbp, joka kattaa virukset, bakteerit, arkkieliöt ja joitakin yksisoluisia eukaryooteissa., Jälkimmäinen luokka osoittaa välillä ei ole selkeää korrelaatiota genomin koon ja gene numero, koostuu enimmäkseen ei-koodausta elementtejä ja kattaa kaikki monisoluiset organismit.

67733 Yhteensä Näkymät 4 Näkemyksiä Tänään.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *