Происхождение эукариот

Автор Комбинатор, сентября 08, 2014, 00:49:25

« назад - далее »

Комбинатор

Цитата: Limfil от сентября 09, 2014, 21:37:09
потому - не то что палеонтологические, а даже и морфологические, взятые от нынеживущих организмов, которые можно взять, повертеть как угодно, а зачастую тонко порезать, могут только уложится или нет в молекулярное дерево (обычно всё-таки укладываются), но никак не подтвердить его... всё как раз наоборот.

Не могу согласиться с этим тезисом. В последнее время было сделано достаточно много открытий о родстве различных таксонов, основанных именно на молекулярных данных, хотя морфологически они выглядели весьма непохожими. Тем не менее, научное сообщество в таких случаях склонно верить именно выводам, основанным на сходстве геномов, а не морфологии.


Limfil

Цитата: Комбинатор от сентября 09, 2014, 22:37:28В последнее время было сделано достаточно много открытий о родстве различных таксонов, основанных именно на молекулярных данных, хотя морфологически они выглядели весьма непохожими. Тем не менее, научное сообщество в таких случаях склонно верить именно выводам, основанным на сходстве геномов, а не морфологии.
ну... а с чем же вы не можите согласится? да, есть организмы не похожие морфологически, но близкие молекулярно. (у самого такое было и даже "почти" два раза) хотя часто тут правильнее говорить - не не похожие, а трактование структур ошибочно/неоднозначно (один и ещё один мене чёткий подобный случай). как же с такими примерами палео-данные могут подтвердить мол-дерево?

Комбинатор

Цитата: Limfil от сентября 10, 2014, 02:46:45
ну... а с чем же вы не можите согласится? да, есть организмы не похожие морфологически, но близкие молекулярно. (у самого такое было и даже "почти" два раза) хотя часто тут правильнее говорить - не не похожие, а трактование структур ошибочно/неоднозначно (один и ещё один мене чёткий подобный случай). как же с такими примерами палео-данные могут подтвердить мол-дерево?

Ну так Вы же сами выше пишите про случаи из своей практики, когда на основе молекулярных данных был сделан вывод об ошибочности/неоднозначности морфологических данных, а отнюдь не наоборот. То есть, при прочих данных им Вы доверяете больше, чем морфологии! Да и поговорка соответствующая есть - (редкие) исключения лишь подтверждают правило.


Питер

Цитата: Питер от сентября 09, 2014, 12:16:47
И  сразу  опять  же ясно,  что  это  скажем  так  мало  корректно.  Взят  белок   целиком,  без учета   наличия  консервативных  доменов.  Гораздо   адекватнее  вариант  с  редактированием  исходной  последовательности  с выделением  области каталитического  домена (что-то  типа 2500-3000 ак).  Но  пока   речь  идет  только  о  параметрах    собственно  бласта  и  их  влиянии  на  результаты. 

По поводу параметров - см. выше. Длина данного протеина у человека - порядка 3130 вминокислот, так что, его ручное укорачивание на величину порядка 10%, по моему не принципиально. Более того, я лично противник ручного редактирования последовательностей, ибо, во первых, Бласт всё равно сам автоматически детектирует консервативные каталитические области гена, а во-вторых при таком подходе возрастает роль пресловутого человеческого фактора  (если возможны несколько вариантов редактирования, меняющие результат в ту или иную сторону, то учёный иногда осознанно или неосознанно выбирает именно тот вариант, который лучше соотносится с его гипотезой). Примеров подобного рода манипулирования при ручной обработке данных в науке достаточно. Пусть уж лучше это за него делает не имеющий субъективных предпочтений компьютер!

[/quote]

Поиграл    -  все  равно  отличия    остаются,  можете  тоже  поиграть.
Насчет    обрезания  - я  как  раз  предлагал  оставить   зону  в  примерно  500  ак  около каталитического  домена (то  есть  1\6  от  исходного  белка) ,   вести  анализ  гомологии  по функциональной  части   белка  как  наиболее      по  идее    древней   его  части.
И в  любом  случае  почему-то  бласт  не является    программой  выбора у  геносистематиков.   Я  -  не   из   их числа,  но   вот Limfil    явно  оттуда  и  тоже     сильно  сомневается в  правомочности  использования бласта.   
А  оно  вам  надо  ?

Комбинатор

#19
Цитата: Питер от сентября 10, 2014, 10:17:11
Поиграл    -  все  равно  отличия    остаются,  можете  тоже  поиграть.

Если бы результаты поучились абсолютно одинаковыми, это было бы чудо. Зачем тогда вообще применять более трудоёмкий алгоритм, если более быстрый даёт во всех деталях тот же результат? Основной вопрос - в существенности различий. На мой взгляд, они малосущественны, особенно, учитывая, что Вы сравниваете результаты алгоритма средней сложности и совсем упрощённного, а для оценки точности первого его результаты нужно сравнивать с более сложным, а не более простым.

Цитата: Питер от сентября 09, 2014, 12:16:47
Насчет    обрезания  - я  как  раз  предлагал  оставить   зону  в  примерно  500  ак  около каталитического  домена

Вот прямое цитирование Вашего поста: "Гораздо   адекватнее  вариант  с  редактированием  исходной  последовательности  с выделением  области каталитического  домена (что-то  типа 2500-3000 ак)."

Цитата: Питер от сентября 09, 2014, 12:16:47
(то  есть  1\6  от  исходного  белка) ,   вести  анализ  гомологии  по функциональной  части   белка  как  наиболее      по  идее    древней   его  части.

Обычно белок состоит из нескольких  функциональных доменов, каждый их которых отвечает за свой участок работы. При этом, на сегодняшний день мы не можем быть уверенными, что для каждого белка знаем все эти участки. Таким образом, занимаясь "обрезанием" мы вместе с водой можем выплеснуть и младенца. Зачем такие риски и сложности? Да и, вообще, на практике, так почти никто не делает. Попробуйте найти хотя бы несколько работ по построению филогенетических деревьев по какому-либо гену, в которых его исходная последовательносчть обкрамсывалась бы в 5-6 раз от исходной длины.

Цитата: Питер от сентября 09, 2014, 12:16:47
И в  любом  случае  почему-то  бласт  не является    программой  выбора у  геносистематиков.

Бласт лишь имплементирует разные варианты алгоритмов, это просто некий тулз для работы с базой данных и алгоритмами построения деревьев, не более. Гораздо важнее для конечного результата выбор конкретного алгоритма. Вот что пишет, например, Кунин по поводу алгоритма объединения ближайщих соседей,  используемого Бластом
======================
Neighbor-joining (NJ). A more sophisticated bottom-up clustering method based on the minimum evolution criterion (the shortest total length of the tree branches). Sensitive to LBA and much less accurate than maximum likelihood methods, but highly computationally efficient and fast. Not used to generate definitive phylogenies, but could be the only phylogenetic method practically suitable for analyzing very large numbers of sequences..
======================
Выделенное жирным - как раз наш случай. Кроме того, задача данного исследования отнюдь не геносистематика.

Цитата: Питер от сентября 09, 2014, 12:16:47
Я  -  не   из   их числа,  но   вот Limfil    явно  оттуда  и  тоже     сильно  сомневается в  правомочности  использования бласта.   

Я ему уже предложил ввести те же исходные данные в ту программу, которая ему больше нравится, и сравнить результаты. Но он что-то пока не торопится. :)

Питер

У  того   же  Кунина в  той  же  фразе   можно выделить  и  другую  часть - "Sensitive to LBA and much less accurate than maximum likelihood methods, but highly computationally efficient and fast. Not used to generate definitive phylogenies, but could be the only phylogenetic method practically suitable for analyzing very large numbers of sequences" .  Что     можно    перевести  и  так  -   хотите  сделать  точную  филогению,   используйте  метод  максимального  правдоподобия  и  купите  хороший мощный комп.   

Насчет  использования  части  белка  или  целого  белка  -  вопрос  сложный, с  учетом    всей   эволюционной  истории.  Исходно    функциональный  домен   для   осуществления  той  или  иной  функции (коровый  домен)   был  очевидно  не  очень  большой. Потом  на  него   было  навешано  куча  допфункций,  регуляция  -  и  получается  монстр  в 3200  аминокислот.  Не   уйдем  ли  мы  в  сторону,  если  будем  анализировать весь   белок  -  а  не каталитический  домен  полимеразы ?  Хотя  риск есть  -  надо  и  правда  точно  знать  домен.  Но   вот  как  раз  тут  быстро вырезать   домен  вполне  можно  бластом.

А  оно  вам  надо  ?

Комбинатор

Цитата: Питер от сентября 10, 2014, 13:09:39
У  того   же  Кунина в  той  же  фразе   можно выделить  и  другую  часть - "Sensitive to LBA and much less accurate than maximum likelihood methods, but highly computationally efficient and fast. Not used to generate definitive phylogenies, but could be the only phylogenetic method practically suitable for analyzing very large numbers of sequences" .  Что     можно    перевести  и  так  -   хотите  сделать  точную  филогению,   используйте  метод  максимального  правдоподобия  и  купите  хороший мощный комп.   

Мне не нужна точная филогения, оставим её систематикам. В данной статье меня интересует лишь район, в котором пересекаются линии паралогов, локализующий место предполагаемой дупликации. И никакой "более мощный комп." тут не спасёт (по крайней мере, до появления квантовых компьютеров), ибо время вычислений для остальных методов  растёт гораздо быстрее, чем полиномиально (как это имеет место для метода ближайших соседей). Не зря Кунин упоминает, что для выборок большого объёма это, по сути, единственный приемлимый метод.

Кстати, в этой же книге он описывает, как аналогичный (в плане использования паралогов) метод был применён для локализации корня жизни в области бактерий:
==============================
Two groups independently developed an ingenious idea to inject a root position into the rootless tree of the kind shown in Figure 2-3. To this end, one can use ancient paralogs that are represented in (nearly) all organisms and thus can be confidently inferred to have evolved via a duplication antedating the Last Universal Common Ancestor (LUCA). When a tree is constructed jointly for two paralogous sets of ancient orthologs, the position of the root between them is certain, so the root can be inferred for each of the orthologous sets as well (see Figure 2-4; Gogarten, et al., 1989; Iwabe, et al., 1989). The results of analysis of two
pairs of primordial paralogs, translation factors, and membrane ATPase subunits were fully congruent and placed the root on the bacterial branch, thus establishing an archaeal-eukaryote clade (see Figure 2-4).
==============================

Питер

Если   посмотреть  на  эти  статьи более  внимательно,   то  мы  увидим а) выделение   консервативных  регионов  и анализ     только  их ;  б)  использование  широкого  круга  методов  анализа.
http://www.pnas.org/content/86/17/6661.long   Это Gogarten
http://www.pnas.org/content/86/23/9355.long   Это    Iwabe
И  смотрим  на    год   и вспоминаем  про    мощности  компов  того  времени.
А  оно  вам  надо  ?

Limfil

Цитата: Комбинатор от сентября 10, 2014, 06:34:29
То есть, при прочих данных им Вы доверяете больше, чем морфологии
ну да. тем боеле когда речь о таких дистанциях как тут. где важна не столько сама по себе морфология, сколько её интерпретация. то есть как же тогда можно обосновывать молекулярное дерево морфологией? может быть конечно другое - когда мол данные дают не однозначные ветви и тогда надо выбрать между полученными деревьями - вот тогда обосновать выбор можно с помощью морфологии. приттом, что тут тоже могут быть точные нумерические анализы
что же касается домейн vs белок... однозначно сказать трудно. но составлять классификацию по домейнам... как-то не знаю. откуда там будут нейтральные мутации? то есть будут, но куда меньше, чем если мы возьмём всё... можно конечно посмотреть какие там участкие, а какие менее вариабельны... и ещё учесть что где сидит в трёхмерной структуре - чтобы давать одним больший, а другим меньший вес, и ещё учесть (хотя тут это очень проблематично в виду глубокого расхождения ветвей) предпочтения нуклеотидов разнами организмами... тогда ветвеления будут куда более достоверны. но и работы куда больше.
Цитата: Комбинатор от сентября 10, 2014, 13:42:38Мне не нужна точная филогения, оставим её систематикам.
да, но вы же говорите про эволюцию. а там нужная ещё точнее - для систематики часто важно показать два организма сидят в одной ветви или совсем в разным, а уж когда они разделились и кто там между ними - нередко уже не суть важно, а вот если речь об эволюции - то критично. потмоу именно достоверность каждого ветвления и чрезвычайно важна

Комбинатор

Цитата: Питер от сентября 10, 2014, 15:57:00
Если   посмотреть  на  эти  статьи более  внимательно,   то  мы  увидим а) выделение   консервативных  регионов  и анализ     только  их ;

Да, четверть века назад, в эру зарождения молекулярной биологии, когда количество видов с отдельными секвенированными протеинами не превышало пары десятков, выделение их каталитических областей и выравнивание делались вручную. Но ныне, при наличии тысяч секвенированных геномов, это весьма затруднительно.

Цитата: Питер от сентября 10, 2014, 15:57:00
б)  использование  широкого  круга  методов  анализа.
http://www.pnas.org/content/86/17/6661.long   Это Gogarten
http://www.pnas.org/content/86/23/9355.long   Это    Iwabe
И  смотрим  на    год   и вспоминаем  про    мощности  компов  того  времени.

Так же вспоминаем закон Мура, который декларирует экспоненциальный характер роста скорости компьютеров от времени. Число секвенированных геномов тоже растёт экспоненциально, но время работы всех методов, кроме ближнего соседа, растёт относительно числа исследуемых видов гиперэкспоненциально.

Прошу прощения у Вас и Limfil, но сегодня ночью улетаю в отпуск где у меня, вероятно, не будет постоянного доступа в и-нет, так что, дискуссию придётся прервать минимум на пару недель.
 


grumbler

Жаль, что автор в отпуску. Потому что совершенно непонятно, откуда в его статье возникает связь со "спорулирующими бактериями", т.е. каким образом микроспоридии по мысли автора связаны с клостридиями и бациллами.

Комбинатор

Цитата: grumbler от сентября 25, 2014, 14:07:31
Жаль, что автор в отпуску. Потому что совершенно непонятно, откуда в его статье возникает связь со "спорулирующими бактериями", т.е. каким образом микроспоридии по мысли автора связаны с клостридиями и бациллами.

Если говорить кратко, то микроспородии, как и некоторые клостридии, размножаются исключительно спорами. Более подробно можно обсудить завтра, когда я вернусь из отпуска.

Комбинатор


Комбинатор