Самый Первый Ген

Автор Иван Антонович, мая 07, 2013, 13:26:37

« назад - далее »

Как произошли гены?

Из одного гена методом дупликации с последующими мутациями, до нужной функции
4 (44.4%)
Неизвестным пока науке способом
5 (55.6%)

Проголосовало пользователей: 9

Дж. Тайсаев

Шматина глины не знатней орангутанга (Алексей Толстой).

Иван Антонович

И самая большая на мой взглят логическая проблема в синхронных мутациях. Например существуют такие молекулы как титин. Аминокислот в этом белке 35000, экспрессия осуществляется исключительно в кардиомиоцитах, трансляция занимает около 10 часов времени. 365 экзонов, в зависимости от варианта, длина гена 360000 бп. У бактерий нет, элементы титина встречаются у насекомых, но с 35000 а.к.только у млекопитающих. Титин главный белок саркомера, и привязан к другим кардиоспецифическим белкам типа актинин. То есть, чтобы получить саркомер, нам нужны мутации в регуляторной областти, потом серия дупликаций в рамке считывания, чтобы получить титин 35000 ак, плюс  нужны мутации во всех других белках, которые образуют саркомер, чтобы они могли связаться определенным образом с титином. Для этого кардиомиоциты должны терпеть 10 часовую трансляцию титина, при чем до сих пор неизвестно, как она точно происходит. Предполагается, что траснляция начинается до полного процессинга этого гена. Я уж не говорю о пространственных трудностях с размещением такой большой молекулы в кардиомиоците. Сколько нужно было провести согласованных дупликаций, потом серия мутаций, чтобы подогнать открытую рамку считывания для всех этих дупликаций и только затем, синхронные мутации в сопровождающих белках и одновременно мутации в промоторной области, чтобы запустить эти гены исключительно в мышечной или кардио ткани. Меня это несколько напрягает, синхронные мутации, цепь последовательных дупликаций, и каждый раз подкоректировка, чтобы сохранялась рамка считывания. Для клетки это ввобще жуткая энергетическая нагрузка транслировать такую РНК, один разрыв и полноценного белка не получить, начинай все сначала. Протяженность большая, одна нуклеотидная вставка или делеция и опять весь белок разваливается.

Иван Антонович

Потом с дупликацией генов есть тоже некоторые неувязки. У нас есть изначально функциональная система.В какай то момент, один или несколько генов дуплицируются, те которые работали продолжают хорошо работать, система жизнеспособна. Мутации не трогают изначальных генов. Они хорошо законсервированы. Только дупликатам разрешено мутировать, но изначальная система была адаптирована, как останавливается этот мутационный эксперимент на дупликатах? Как germ line узнает, что все, с этим дупликатом мы больше не экспериментируем. Ну например, как в случае с титином, как это происходит в половых клетках, что этот дупликат достиг оптимума мутаций, если изначальная система была и так оптимальна для этой среды обитания, а все мутации на ген-дупликатах на жизнеспособность исходного организма никак не влияли. Что дает сигнал всей системе, все дупликаты оптимальны, их не надо больше изменять?? Когда начинается консервация генов?

catty

Извините, я тут задам свой небольшой вопросик: как получаются новые гены в общих чертах ясно. Но мне совершенно не понятно, как они "уходят". Вот Марков в книге "Рождение сложности" пишет про то, что геном птиц кардинально уменьшался. Но как это возможно?

Иван Антонович

Уважаемый Питер,

Вы мне дали очень хорошую ссылку по сравнению геномов, так как раньше я делал все исключительно по ncbi. Вы дали ссылку как раз на прекрасный пример инсерции. Ее Вы можете сами посмотреть здесь

http://www.ensembl.org/Homo_sapiens/Location/Compara_Alignments?align=559;db=core;g=ENSG00000182873;q=RP11-181G12.2;r=1:2113233-2115828#r=1:2614531-3614530

Последовательность на многие килобазы не прочитана, но перед серией NNNNNNNN есть вполне осмысленная последовательность, она продолжается и дальше. В общем я нашел контиг длинной считая NNNNNN... в 90 кб.
Если у Вас будут проблемы с открытием этого  линка, могу сбросить последовательность на маил.


Это инсерция уникальна для человека. У Pan troglodytes ее нет. Я провел еще анализ на expressed sequencing tags (ESTs) и нашел несколько просеквенированных РНК из этой области
Несколько из STS здесь, полностью уникальные последовательности для человека, которые экспремируются, к сожалению пока есть только STS, полной мРНК нет  :(

http://www.ncbi.nlm.nih.gov/nucest/12273189?rid=szu5ma9201r&blast_rank=1&log$=nuclalign&report=genbank

http://www.ncbi.nlm.nih.gov/nucest/12273185?rid=szu5ma9201r&blast_rank=3&log$=nuclalign&report=genbank

http://www.ncbi.nlm.nih.gov/nucest/31129166?rid=szu5ma9201r&blast_rank=4&log$=nuclalign&report=genbank

http://www.ncbi.nlm.nih.gov/nucest/52665586?rid=szu5ma9201r&blast_rank=7&log$=nuclalign&report=genbank
внизу эта последовательность, я не смог найти гомологов по всем базам данных, кроме как у человека.

  1 gcgctaagtg aactgctccg agacccacag gcgagcatct gacggcctgg aacagcaccc
       61 acacccccta ggtgagcatt ggacatgcct ggagcagcac ccacaacccc aggcgggcaa
      121 ccgacaacct ggagcatcac ccacacccac agttgagcat ctgacttcgt ggagcataac
      181 ccaacacgca caggtgagca tctgacagcc cggagctgca cccacaccct caggtgagtc
      241 tctgacagcc tggaacagca ccctgcacac ccaggtgagc atccgacagc ctggagcagc
      301 atccacaccc ccagttgagc aactgatggt ctggagcagc acccacaacc acaggtgaac
      361 atcagagagt ctgggagcag gcgccgaaaa gcccaggcga gcatctgaca gcctggagca
      421 agtgcccaaa cacccaggtt agcatctgac agca

В любом случае спасибо за хороший сайт, там можно спокойно пройтись по всем инсерциям и поискат; новые человеческие гены, пока что то с этим у молекулярщиков туго.

Я буду благодарен, за любые данные если Вы найдете гомологии для этих участков у других животных и обьяснение, как они произошли, хотя там есть повторящиеся элементы, но в других организмах, пока аналогов не нашел.

Иван Антонович

Еще несколько  замечаний по поводу тРНК из википедии.

Без тРНК невозможен синтез белка, но для правильного распознания генетического кода нужно 80 разных
Аминоацил-тРНК-синтетаз. И вот вопрос, что первично????

Аминоацил-тРНК-синтетаза (АРСаза) — фермент синтетаза, катализирующий образование аминоацил-тРНК в реакции этерификации определенной аминокислоты с соответствующей ей молекулой тРНК. Для каждой аминокислоты существует своя аминоацил-тРНК-синтетаза.

АРСазы обеспечивают соответствие нуклеотидным триплетам генетического кода (антикодону тРНК) встраиваемых в белок аминокислот, и, таким образом, обеспечивают правильность происходящего в дальнейшем считывания генетической информации с мРНК при синтезе белков на рибосомах.

Питер

Цитата: Иван Антонович от мая 12, 2013, 21:18:00
Уважаемый Питер. Спасибо за ссылки. Действительно этот белок, если делать blastx on ncbi server дает гомологию с ДНК шимпанзе. Я в по скорому сделал только blastp, белок не был анотирован у шимпанзе и не вылез. Насчет транслируется он или нет, пока нихего не известно, то что он лежит в анитсенс позиции еще не говорит, что его собственная трансляция невозможна.
Сейчас по тем данным которые есть, у нас 1 процент от генома человека отличается на SNP  и 3 процента indel's то есть вставки и делеции. то есть около 90 миллионов нуклетидов предтсавляют вставки или делеции.  Из  них многие вставки протяженностью несколько тысяч нуклеотидов. Если исходить, из того, что около 1 процента кодирующих, то мы должны ожидать примерно 900000 нуклеотидов (1 процент от 90 миллионов), которые  отвечают за синтез генов. При средней длине гена 2000 нуклеотидов, мы должны были бы иметь 450 уникальных для обоих видов генов.
Проблема  только в  том,  что  этих  генов  нет.   Знаете  как  было  бы    здорово  -   вот  появился  новый  ген  и    шимп   стал  человеком.  Но  -  не  получается. Да,   есть    специфичные    для  человека  инсерции  ретроэлементов   -  но  их  же  нельзя  считать  новыми  генами   в  смысле  "такого   никогда  не  было  -  и  вот". 
По  поводу    гена  -    там  нет  белка.  Есть     транскрипт, причем  крайне       слабо  экспрессирующийся.  И в  геноме  шимпа   -  как  вы  сами  признали  -  он  есть.
Насчет  снипов  и    инсерций-делеций.   Так  и  мы  между  собой  сильно  отличаемся  и  по   инс-делам,  и  по  снипам. Что,  у  разных  людей  тоже  будут  новые  гены  ?
Ну  и еще  одно  общее   замечание.  Бласт  -  плохой  механизм   для  работы  с  длинными  последовательностями.   
Насчет  стабильности  РНК.   Где  она  нестабильна  ?   При выделении ?  Извините,  фигня  -        работать  надо  уметь,  28  и 18S   РНК  выделяются     великолепно.  И  Прочие  РНК   -   тоже,   Нозерны   без    шмеров  с  транскриптами в  5000-7000   пар  показать ?
В  клетке  ?   Ну  там  этот  процесс  строго     регулируется   -  и  если  нужна  стабильная   РНК,  она  будет  стабильной. 
А  оно  вам  надо  ?

Иван Антонович

Питер
Проблема  только в  том,  что  этих  генов  нет.   Знаете  как  было  бы    здорово  -   вот  появился  новый  ген  и    шимп   стал  человеком.  Но  -  не  получается. Да,   есть    специфичные    для  человека  инсерции  ретроэлементов   -  но  их  же  нельзя  считать  новыми  генами   в  смысле  "такого   никогда  не  было  -  и  вот".
По  поводу    гена  -    там  нет  белка.  Есть     транскрипт, причем  крайне       слабо  экспрессирующийся.  И в  геноме  шимпа   -  как  вы  сами  признали  -  он  есть.
Насчет  снипов  и    инсерций-делеций.   Так  и  мы  между  собой  сильно  отличаемся  и  по   инс-делам,  и  по  снипам. Что,  у  разных  людей  тоже  будут  новые  гены  ?
Ну  и еще  одно  общее   замечание.  Бласт  -  плохой  механизм   для  работы  с  длинными  последовательностями.   
Насчет  стабильности  РНК.   Где  она  нестабильна  ?   При выделении ?  Извините,  фигня  -        работать  надо  уметь,  28  и 18S   РНК  выделяются     великолепно.  И  Прочие  РНК   -   тоже,   Нозерны   без    шмеров  с  транскриптами в  5000-7000   пар  показать ?
В  клетке  ?   Ну  там  этот  процесс  строго     регулируется   -  и  если  нужна  стабильная   РНК,  она  будет  стабильной. 

Вам удалось посмотртеть последовательности которые я Вам прислал?
Что 16 С РНК хорошо видно на блоте, так это и понятно ее очень много, и она все время вылезает, когда ее и не нужно. Потом не забывайте, для выделения РНК мы используем разные реактивы, которые предохраняют РНК от деградации, без них просто лизируя клетку SDS вряд ли Вы получите хорошую не деградированную РНК.

Насчет нахождения кодирующей области одного гена в 3 некодириующей области другого гена, так это встречается довольно часто, а слабая экспрессия, тоже довольно распространенная вешь, в особенности для мастер генов.

Посмотрите новые последовательности, причем с Вашего сайта. Буду благодарен за анализ и за меьанизмы как эти ЕST произошли.

Иван Антонович

Питеру

Я прошу дать какую то модель для происхождения этих РНК, из чего они произошли, это регион про который я уже писал 110000 бп, инсерция специфичная для человека. А внизу даны короткие просеквенированные фрагменты мРНК имеющие открытую рамку считывания, несколько из них специфичны для нейронов. Я не нашел никаких гомологий для этих последовательностей в базах данных, буду рад если Вы меня подкорректируете.

В любом случае прошу механизм, как эти РНК появились


http://www.ncbi.nlm.nih.gov/nucest/12273189?rid=szu5ma9201r&blast_rank=1&log$=nuclalign&report=genbank

http://www.ncbi.nlm.nih.gov/nucest/12273185?rid=szu5ma9201r&blast_rank=3&log$=nuclalign&report=genbank

http://www.ncbi.nlm.nih.gov/nucest/31129166?rid=szu5ma9201r&blast_rank=4&log$=nuclalign&report=genbank

http://www.ncbi.nlm.nih.gov/nucest/52665586?rid=szu5ma9201r&blast_rank=7&log$=nuclalign&report=genbank
внизу эта последовательность, я не смог найти гомологов по всем базам данных, кроме как у человека.


Питер

Прогнал  случайные      200    нуклеотидов  из  геномной  последовательности  человека  из  вашего  поста.  По  которым   нет   по   вашим  словам  гомологии  ни с  чем.    Тупо в    blastn   -   и  нашел примерно  80%    гомологии с    хромосомой    16    шимпанзе,  хромосомой  16   человека  и   каким-то  клоном  макаки.   То  есть    опять  же  нет  ничего   принципиально    нового.
Теперь  по  поводу  EST.    Первое,  что    надо  показать  -    что  эти  транскрипты   есть в  реальности.    Блот,     ПЦР  -  что  угодно.   По  одной  простой  причине   - в  базе   данных  EST   царил  и  царит  бардак.  По  самому  механизму  их    получения  в  библиотеки  EST  попадает  все  - в  том  числе        короткие  фрагменты  геномной  ДНК.  Далее    все  сиквенсы   выкладываем  в    базу  без  какой-либо  верификации.   В  итоге   базы   EST   полны  мусором.   
А  оно  вам  надо  ?

Питер

http://blast.ncbi.nlm.nih.gov/Blast.cgi#485043614

Это  blastn  анализ  вашего   последнего   транскрипта.  Первые   120   пар.    В  частности хорошая  гомология  с  мРНК  макаки.
Но     по  сути  повторюсь  -     это    мусор. 

http://blast.ncbi.nlm.nih.gov/Blast.cgi#34638504
Это  тоже   бласт  -  но   по EST.   Как  вам  гомология  с  шистосомой ?

В  первую  очередь  это  к  тому,  что  гомологии   есть    -   и с  геномами,  и с  транскриптами.  Ничего  из  ничего  не   возникает  -    даже   экспериментальный   мусор  возникает  из  чего-то.
А  оно  вам  надо  ?

Питер

Цитата: catty от мая 13, 2013, 00:15:21
Извините, я тут задам свой небольшой вопросик: как получаются новые гены в общих чертах ясно. Но мне совершенно не понятно, как они "уходят". Вот Марков в книге "Рождение сложности" пишет про то, что геном птиц кардинально уменьшался. Но как это возможно?
[/quoteков.
Уменьшение  генома   -   это  не  всегда   уход  генов.   Это    уход   межгенных  участков  в  первую  очередь.
А  оно  вам  надо  ?

Иван Антонович

К сожалению, я не не смог открыть ваших blast анализов, никак не могу найти гомологий с макаками.
http://blast.ncbi.nlm.nih.gov/Blast.cgi#485043614

и


http://blast.ncbi.nlm.nih.gov/Blast.cgi#34638504

У меня обе эти ссылки не открываются.



Можете прислать accession number для последовательностей макак?

Все эти EST хорошо лежат на  геномной последовательности, и и меют протяженную открытую рамку, что еще нужно.

Вот анализ BLASТ по последней последовательности, никаких последовательностей он не выдает в других видах как в человеке.

Select for downloading or viewing reports    Description      Max score       Total score       Query cover       E value      Max ident     Accession
1    
Human DNA sequence from clone RP13-436F16 on chromosome 1, complete sequence
   728    47701    98%    0.0   96%    AL831784.17
2    
Homo sapiens FOSMID clone ABC14-1188822O7 from chromosome 1, complete sequence
   547    15964    98%    3e-152   90%    AC242022.2
3    
Homo sapiens FOSMID clone ABC12-49050800J17 from chromosome 1, complete sequence
   446    22494    98%    1e-121   85%    AC234231.3
4    
Homo sapiens FOSMID clone ABC10-44448000P11 from chromosome 1, complete sequence
   405    29379    98%    2e-109   84%    AC243314.3
5    
Homo sapiens FOSMID clone ABC10-1608270N3 from chromosome 1, complete sequence
   370    8951    98%    6e-99   83%    AC243771.3
6    
Human DNA sequence from clone RP11-740P5 on chromosome 1, complete sequence
   355    3768    96%    2e-94   82%    AL592464.24
7    
Homo sapiens DNA, clone:pHGC32
   316    1318    94%    8e-83   82%    D88108.1

Иван Антонович

Питер

Я нашел что Вы имели ввиду.

Очень низкая гомология, но она есть у макак. Уровень гомологии намного ниже, чем по другим последовательностям..

Но с этим белком


MEPPFTRLEGRMSRRAAPFGASQDGAGWVQLVKRNAAPQPLQTKPNSPARGWITGHPAAAFPPEEPRRLP
RPEMPPVWLCLSPVPRQLGGSIPKQMHPAHDGTPGTPILRTLQSFKLELAGFCLYRHRLQSLRCCLAGKC
RAGGAGPQLEAPRCSPPLHCRAQGGQEQPQQQQKPNWERNRGKNPHRLLGTYKEMPTSILLTWHLLTWHL
LGCHKTDKSFHVRLDTCQGGVSKLGHRQHPRPGHWVEETVLGRSRREGPGLFP

У макак он есть, но отсутствует у всех других видов!!!!

У макак этот белок тоже находится в мРНК. Очень хорошая гомология на белковом уровне.

Но вопрос как возник этот ген. и этот белок????

Я не стал бы его просто так выкидыват; как артефакт.



Про EST которые я посылал они все попадают на РНК макак, хотя уровень гомологии всего 83 процента, что очень мало для таких родственных видов.


Буд искать уникальные гены дальше  ;D

Питер

Еще  раз  повторяю  -  простой  прогон  по    базе  данных   не  дает в  принципе  ответа  на   вопрос,  экспрессируется   ли  эта последовательность в  реальности.   И    как.   Понимаете,  геном  в  целом  "подтекакет "   и в  принципе  если   долго   мучиться    можно  найти  в  составе   РНК   любую     геномную    последовательность.   Но   надо  подтвердить  реальность   транскрипта   -     клонировать  полноразмерную  мРНК  (  а  не  кусочки),      оценить     уровень  экспрессии.       

Ну  и   хочу  напомнить,  с  чего    начинали.   С  уникальности        последовательности в  геноме  человека.   Теперь    с  уникальностью  все.   У  макаки  она  есть.   Если  будет  больше  информации  по  шимпу,  горилле  и   прочим  приматам  -   будет  и  там.


А  оно  вам  надо  ?