hány gén van egy genomban?
Reader Mode
már megvizsgáltuk a genomméretek nagy sokféleségét az élő világban (lásd a táblázatot a ” mennyire nagyok a genomok?”). Első lépésként a genomok információtartalmának megértésének finomításához szükségünk van az általuk birtokolt gének számának érzékelésére. Amikor génekre utalunk, fehérjekódoló génekre gondolunk, kivéve a genomokban az RNS-kódoló régiók egyre bővülő gyűjteményét.,
1.ábra: a gének száma a genomméret függvényében. Az ábrán számos baktérium és archaea adatait mutatjuk be, az adatsor meredekségével megerősítve a genomméretre és a génszámra vonatkozó egyszerű hüvelykujjszabályt. (Adaptált M. Lynch, az eredete Genom építészet.,)
az egész élet fája, bár genom méretben tér el egymástól annyira, mint 8 nagyságrenddel (a <2 kb Hepatitis D vírus (BNID 105570), hogy a >100 Gbp a Márványos lungfish (BNID 100597), valamint bizonyos Fritillaria virágok (BNID 102726)), a tartomány száma gének függően eltérő lehet kevesebb, mint 5 nagyságrenddel (a vírusok, mint MS2 pedig QB bakteriofágok, hogy csak 4 gének mintegy száz ezer búza). Sok baktériumnak több ezer génje van., Ez a géntartalom arányos a genom méretével és a fehérje méretével az alábbiak szerint. Érdekes, hogy az eukarióta genomok, amelyek gyakran ezerszer vagy annál nagyobbak, mint a prokariótákban, csak nagyságrenddel több gént tartalmaznak, mint prokarióta társaik. A modern biológia egyik váratlan fordulata az volt, hogy a prokarióták géntartalmának ismerete alapján nem sikerült megbecsülni az eukarióták génjeinek számát.,
1.táblázat: a gének számának összehasonlítása egy szervezetben, és egy naiv becslés alapján a genom mérete osztva egy állandó tényező 1000bp/gén, azaz előre jelzett gének száma = genomméret / 1000. Az ember úgy találja, hogy ez a nyers ökölszabály meglepően jól működik sok baktérium és archaea, de nem szerencsétlenül többsejtű organizmusok.
a genomban lévő gének számának legegyszerűbb becslése azzal a feltételezéssel bontakozik ki, hogy az érdeklődésre számot tartó gének genomkódjainak teljes része., További előrelépés, hogy a becslés, meg kell mérni a szám az aminosavak egy tipikus fehérje, amely meg fogja venni, hogy nagyjából 300 ismerő, azonban az a tény, hogy mint a genom szekvenciát jelent, fehérjék jön a legkülönbözőbb méretű magukat, mint kiderült, a matrica, hogy a téma, hogy “mi méretű fehérjék?”. E csekély feltételezés alapján azt látjuk, hogy a tipikus fehérjénk kódolásához szükséges bázisok száma nagyjából 1000 (aminosavanként 3 bázispár)., Ezért ebben a gondolkodásmódban a genomban található gének száma a becslések szerint a genom mérete/1000. A bakteriális genomok esetében ez a stratégia meglepően jól működik, amint az az 1. táblázatban és az 1. ábrán látható. Például, ha az E. coli K-12-re, a 4,6 x 106 bp genomjára alkalmazzák, ez a hüvelykujjszabály 4600 gén becsléséhez vezet, ami összehasonlítható ennek a mennyiségnek a jelenlegi legjobb ismeretével, amely 4225. A táblázatban egy tucat reprezentatív baktérium és archeális Genom között egy hasonlóan feltűnő prediktív erő figyelhető meg körülbelül 10% – on belül., Másrészt, ez a stratégia nem látványosan, amikor alkalmazni, hogy az eukarióta genom szekvenciát jelent, ami például a becslés, hogy a számos gén az emberi genom kell 3,000,000, egy bruttó túlbecsülni. Ennek a becslésnek a megbízhatatlansága segít megmagyarázni a Genesweep fogadási medence létezését, amely a közelmúltban, a 2000-es évek elején az emberek az emberi genomban lévő gének számára fogadtak, az emberek becslései több mint tíz tényezővel változtak.,
2.ábra: az emberi genomot alkotó különböző szekvenciaösszetevők. A genom mintegy 1,5% – a a ≈20 000 fehérjekódoló szekvenciából áll, amelyeket a nem kódoló intronok kereszteznek, mintegy 26% – ot téve ki. Transposable elemek a legnagyobb frakció (40-50%), beleértve például hosszú tarkított nukleáris elemek (Vonalak), majd rövid tarkított nukleáris elemek (SINEs). A legtöbb transzpozálható elem genomikus maradványok, amelyek jelenleg megszűnnek. (BNID 110283, adaptált T. R. Gregory Nat Rev Genet., 9:699-708, 2005 alapján nemzetközi Humán Genom szekvenálás konzorcium. Az emberi genom kezdeti szekvenálása és elemzése. Természet 409: 860 2001.)
mi magyarázza a legnaivabb becslés látványos kudarcát, és mit tanít nekünk a genomokban szervezett információkról? Az eukarióta genomokat, különösen a többsejtű organizmusokhoz kapcsolódókat, számos érdekes tulajdonság jellemzi, amelyek megzavarják a naiv becslésben kihasznált egyszerű kódolási képet., Ezeket a genomhasználati különbségeket a 2. ábrán pictoriálisan ábrázoljuk, amely megmutatja a fehérjekódoláson kívüli más célokra használt Genom százalékos arányát. Ahogy nyilvánvaló az 1. Ábra prokaryotes lehet hatékonyan kompakt a fehérjét kódoló szekvenciák ilyen, hogy szinte folyamatos, valamint az eredmény kevesebb, mint 10% – a genom szekvenciát jelent, hogy célhoz, hogy a nem kódoló DNS (12%, az E. coli, BNID 105750) mivel az emberek 98% (BNID 103748) nem fehérje kódoló.,
a genom ezen egyéb felhasználásainak felfedezése az elmúlt 60 év egyik legfontosabb betekintését képezi a DNS-be, és általában a biológiába. A genomi ingatlanok egyik alternatív felhasználása a szabályozó Genom, nevezetesen az a mód, ahogyan a genom nagy darabjait használják olyan szabályozó fehérjék kötésének céljaként, amelyek a többsejtű organizmusok genomjaira jellemző kombinatorikus kontrollt eredményeznek., Az eukarióta genomok egyik fő jellemzője, hogy génjeiket intronokba és exonokba szervezik, az expresszált exonok pedig sokkal kisebbek, mint a beavatkozó és összekapcsolt intronok. Ezeken a tulajdonságokon túl vannak endogén retrovírusok, a korábbi vírusfertőzések fosszilis emlékei és feltűnően a genom több mint 50% – át ismétlődő elemek és transzpozonok alkotják, amelyek különböző formái talán önző génekként értelmezhetők, amelyek mechanizmusokkal rendelkeznek a gazdaszervezet genomjában való szaporodáshoz., Ezeknek az ismétlődő elemeknek és transzpozonoknak egy része ma is aktív, míg mások ereklye maradtak, miután elvesztették a genom további proliferációjának képességét.
összefoglalva, a genomok két fő osztályba oszthatók: kompakt és expanzív. Az előbbiek gén sűrűek, a nem kódoló régiónak csak mintegy 10%-át teszik ki, és szigorúan arányosak a genomméret és a genomszám között. Ez a csoport körülbelül 10 Mbp méretű genomokra terjed ki, amelyek vírusokat, baktériumokat, archaeákat és néhány egysejtű eukariótát fednek le., Ez utóbbi osztály nem mutat egyértelmű összefüggést a genom mérete és a génszám között, többnyire nem kódoló elemekből áll, és minden többsejtű organizmusra kiterjed.