Комплементарность по одной цепочке ДНК

Автор BorysB, марта 27, 2007, 10:44:16

« назад - далее »

Комбинатор

#45
На мой взгляд, второе правило Чаргаффа руководствуясь заветами старика Оккама можно пытаться объяснять довольно прозаическими причинами.
1. Как известно, свзяь C-G более прочная, чем A-T. Стало быть, например, при высоких температурах среды обитания она для участков ДНК, кодирующих рРНК, тРНК, микроРНК и т.д. должна преобладать.
2. По тем же причнинам у организмов, обитающих в средах с высокими температурами, должны преобладать триплеты, кодирующие более термоустойчивые аминокислоты (так называемая группа IVYWREL).
3. В зависимости от условий обитания, могут проявляться и другие закономерности, например, связанные с оптимальным соотношением гидрофобных и гидрофильных аминоксислот.
4. Для некоторых участков ДНК, например, связанных с промоторами, оптимальна как раз облегчённая связь (скажем, характерный мотив ТАТА в промоторах бактерий). Стало быть, исследуемое соотношение будет зависеть и от соотношения кодирующей и некодирующей частей генома и средней длины одного гена.

Наверное, если побольше помедитировать на эту тему, можно и ещё что-нибудь нарыть, но основаная идея такова, что закономерности типа указанных выше на достаточно большом статистическом материале обеспечивают статистически устойчивые различия в частотах встречаемости олигонуклеотидов.


Galicarnax

#46
2Комбинатор

Гипотеза о том, что оптимальная для данного организма температура определяет GC-содержание его генома, была опровергнута еще 10 лет назад:
High guanine-cytosine content is not an adaptation to high temperature: a comparative analysis amongst prokaryotes.

Как выяснилось, с температурой коррелирует лишь GC-контент именно функциональных молекул РНК (как вы и указали), но не всего генома, и даже не третьих (наиболее свободных) положений в кодонах кодирующих областей.

PS
Впрочем, даже если бы температура определяло GC-содержание, как бы это прояснило второе правило?

Комбинатор

#47
Цитата: Galicarnax от мая 03, 2010, 13:44:58
Гипотеза о том, что оптимальная для данного организма температура определяет GC-содержание его генома, была опровергнута еще 10 лет назад:
High guanine-cytosine content is not an adaptation to high temperature: a comparative analysis amongst prokaryotes.

Как выяснилось, с температурой коррелирует лишь GC-контент именно функциональных молекул РНК (как вы и указали), но не всего генома, и даже не третьих (наиболее свободных) положений в кодонах кодирующих областей.

Да, я и написал, именно про функциональные РНК. Соответственно, и Ваше замечание про 3-е положения кодонов мне не очень понятно, ибо функциональные РНК кодируются отюдь не триплетами. К тому же, не забывайте, что это лишь одна из названных мною совершенно навскидку 4-х возможных причин.


Цитата: Galicarnax от мая 03, 2010, 13:44:58
PS
Впрочем, даже если бы температура определяло GC-содержание, как бы это прояснило второе правило?

Я так понимаю, что имеется в виду ДНК, а не РНК?
ДНК-цепочка должна быть, с одной стороны, достаточно прочной, что бы быть устойчивой
при высоких температурах, с другой стороны - достаточно легко (то есть, с минимальными затратами свободной энергии) разьединяться в области часто используемых кодирующих последовательностей. Соответственно, в зависимости от внешних условий, в которых живёт организм, для него должна существовать некая точка равновесия, в которой соотношение пар CG и AT оптимально. Ну а к перестановкам местами в ДНК типа G <=> C и A <=> T указанные выше свойства ДНК инвариантны (ну, или как сказал бы Алекс_63 - наблюдается соответсвующая симметрия). Примерно как то так.


RNAoid

Может это поможет в объяснении? Матрица Адамара
Для чего используются матрицы Адамара. Получаемые в ее строках последовательности обладают тем свойством, что максимально отличны от любой другой строки матрицы. Это обеспечивает наилучшую помехозащищенность при передачи сигналов на базисе таких последовательностей. Если учесть, что для ДНК помехозащищенность жизненна важна и поддерживается отбором, то и второе правило Чаргаффа отсюда и получается. Достаточно нули и единицы заменить на нуклеотиды.

Galicarnax

Цитата: Комбинатор от мая 03, 2010, 14:38:32
и Ваше замечание про 3-е положения кодонов мне не очень понятно, ибо функциональные РНК кодируются отюдь не триплетами.
Ну я-то говорил в том числе и про области, кодирующие белки.
Вообще, я не совсем понял Вашу идею. Если забыть про второе правило, и говорить о GC-содержании, то да - оно коррелирует с температоурой для РНК-генов. Но эти РНК-гены занимают очень малую долю генома. Второе правило же говорит именно о глобальных характеристиках геномов.

Далее,
Цитата: Комбинатор от мая 03, 2010, 14:38:32
Я так понимаю, что имеется в виду ДНК, а не РНК?
ДНК-цепочка должна быть, с одной стороны, достаточно прочной, что бы быть устойчивой при высоких температурах, с другой стороны - достаточно легко (то есть, с минимальными затратами свободной энергии) разьединяться в области часто используемых кодирующих последовательностей
Я все-таки не понимаю, как прочная связь между двумя цепочками или легкость их разъединения может быть связана со вторым правилом Чаргаффа? Оно ведь имеет дело с отдельными нитями. С первым правилом Чаргаффа, имеющим дело с обеими цепочками, - да, может быть связана (но, как я сказал выше, и этого не обнаружилось).

По поводу остальных комментов - я попал на форум по теории эволюции или системотехнике?  :o

RNAoid

Цитата: Galicarnax от мая 03, 2010, 16:31:55
По поводу остальных комментов - я попал на форум по теории эволюции или системотехнике?  :o
Это скорее к передачи информации отношение имеет. :)

Комбинатор

Цитата: Galicarnax от мая 03, 2010, 16:31:55
Ну я-то говорил в том числе и про области, кодирующие белки.
Вообще, я не совсем понял Вашу идею. Если забыть про второе правило, и говорить о GC-содержании, то да - оно коррелирует с температоурой для РНК-генов. Но эти РНК-гены занимают очень малую долю генома. Второе правило же говорит именно о глобальных характеристиках геномов.

Геном состоит из разнордных участков, и глобальные закономерности встречаемости в нём нуклеотидов зависят от специфики всех этих участков. Да, участки, кодирующие функциональные РНК составляют небольшую часть генома, но я привёл аналогичные соображения и для других участков (см. п. 2, 3, 4).

Цитата: Galicarnax от мая 03, 2010, 16:31:55
Я все-таки не понимаю, как прочная связь между двумя цепочками или легкость их разъединения может быть связана со вторым правилом Чаргаффа? Оно ведь имеет дело с отдельными нитями. С первым правилом Чаргаффа, имеющим дело с обеими цепочками, - да, может быть связана (но, как я сказал выше, и этого не обнаружилось).

Дело в том, что нити комплиментарны, и от того, что Вы их разьединили, связь между ними никуда не пропадает. Если Вы обнаружили на каком-то месте C, то будтье уверены, на другой нити против неё стояло G, аналогично для всех 4-х нуклеотидов.

Galicarnax

Цитата: Комбинатор от мая 03, 2010, 17:44:46
Если Вы обнаружили на каком-то месте C, то будтье уверены, на другой нити против неё стояло G, аналогично для всех 4-х нуклеотидов.
:)
Я не стараюсь опровергнуть ваши идеи... Я просто не понимаю, при чем тут второе правило :)
То, что в цитате - это по первому правилу. Во втором ничто нигде не стоит напротив... причем тут разъединение цепей?

Мне кажется, Вы все же имеете ввиду первое правило Чаргаффа, или я совсем ничего не понимаю  :'(

Комбинатор

Цитата: Galicarnax от мая 03, 2010, 18:36:12
Я не стараюсь опровергнуть ваши идеи... Я просто не понимаю, при чем тут второе правило :)
То, что в цитате - это по первому правилу. Во втором ничто нигде не стоит напротив... причем тут разъединение цепей?

Мне кажется, Вы все же имеете ввиду первое правило Чаргаффа, или я совсем ничего не понимаю  :'(


Из Вашей же ссылки:
*******************************
Суть второго правила Чаргаффа так же проста, как и первого. Собственно, второе правило и представляет собой первое правило, только в применении к единичной цепи ДНК. То есть оно гласит, что в отдельной цепи ДНК количество A ≈  количеству T, количество G ≈ количеству C.
*******************************

Представьте, что у Вас есть двухцепочечная ДНК. В силу каких-то причин (например, баланса термойстойкость - энергозатратность расплетения) в ней количество пар C-G  составляет, положим, 40% а T-A, соответственно, 60%. Теперь вы её разрезаете на две нити. Если она достаточно длинная, а в парах CG и TA нуклеотиды равноправны, то по теории вероятностей в каждой из нитей останется то же соотношение TA - 40%, CG - 60%.
Если это слишком сложно, можно объяснить и по другому. Давайте вообще абстрагируемся от разницы в частотах встречаемости  TA - CG. Рассмотрим идеальный случай, когда их физико-химические свойства абсолютно идентичны. В этом случае соотношение по статистике будет 50 на 50 как для двух цепочек, так и для одной (или, иными словами, доля каждого отдельного основания будет равна 25%). Но Вас ведь это ничуть не удивляет, не так ли? Почему же Вас удивляет, что при соотношении 60 на 40 (для случая разных физико-химических свойств пар TA и CG) Т и A будет по 30%, а C и G по 20% ?

Galicarnax

#54
Цитата: Комбинатор от мая 03, 2010, 19:00:26
Если она достаточно длинная, а в парах CG и TA нуклеотиды равноправны, то по теории вероятностей в каждой из нитей останется то же соотношение TA - 40%, CG - 60%.

Так Вы уже говорите о равенстве в парах TA и GC как о заведомо заданном :)

ИМХО, вовсе не обязательно должно остаться такое же соотношение.
Вот пример:

Верхняя нить: G = 20%, C = 10%, A = 30%, T = 40%
Нижняя нить:  C = 20%, G = 10%, T = 30%, A = 40%

Для целой молекулы ДНК, понятно %G=%C, %T=%A, и их соотношение GC:AT = 30:70.
Но для отдельных цепей кол-во T не равно A, G не равно C и соотношение не сохраняется при разделении цепей.

ЦитироватьГде можно ознакомиться с этими данными?
Для каких хромосом человека указаны отклонения?
С данными можно ознакомиться в статьях, или можно просчитать самому - все геномы доступны, для подсчета нужны самые поверхностные знания программирования.

Комбинатор

#55
Цитата: Galicarnax от мая 04, 2010, 03:13:55

Так Вы уже говорите о равенстве в парах TA и GC как о заведомо заданном :)

ИМХО, вовсе не обязательно должно остаться такое же соотношение.
Вот пример:

Верхняя нить: G = 20%, C = 10%, A = 30%, T = 40%
Нижняя нить:  C = 20%, G = 10%, T = 30%, A = 40%

Для целой молекулы ДНК, понятно %G=%C, %T=%A, и их соотношение GC:AT = 30:70.

В этом и заключается наше с вами недопонимание. Почему если С и G, А и Т по своим физико-химическим свойствам для клетки идентичны, их количество в ДНК должно отличаться? В сущности, отличие должно быть не больше, чем отличие числа выпадений орла и решки при подбрасывании монетки. По теории вероятностей с увеличением числа бросаний эта разница в процентном отношении стремится к нулю пропорционально еденице, делённой на квадратный корень числа испытаний (так называемый закон больших чисел). А для ДНК даже для бактериий число оснований измеряется сотнями тысяч.

Цитата: Galicarnax от мая 04, 2010, 03:13:55
Но для отдельных цепей кол-во T не равно A, G не равно C и соотношение не сохраняется при разделении цепей.

Как же не равно, если именно про это равенство и говорит второе правило!!!? Вы уж всё же определитесь, оно справедливо, или нет. :)




Galicarnax

Цитата: Комбинатор от мая 04, 2010, 09:58:12
Как же не равно, если именно про это равенство и говорит второе правило!!!? Вы уж всё же определитесь, оно справедливо, или нет. :)
Оно справедливо в реальных геномах. Я привел случай гипотетического генома, в котором правило не работает. Вопрос в том, почему таких геномов не бывает в реальности. В том, что утверждаете Вы, я вижу попытку обоснования перекоса между GC- и AT-содержанием в целой молекуле ДНК (это следует и из последнего вашего поста), но вовсе не второго правила Чаргаффа. Думаю, для дальнейшего без третьего мнения не обойтись (кто-нибудь скажет, что понимает/не понимает Ваши доводы).

Алекс_63

Цитата: Galicarnax от мая 04, 2010, 22:37:27
без третьего мнения не обойтись
Galicarnax абсолютно прав.
Комбинатору надо проделать ту комбинацию о которой здесь идёт речь.
Тогда он всё поймёт сам, если конечно он умышленно не пытается заболтать тему.
Белый Ягуар

Комбинатор

Цитата: Galicarnax от мая 04, 2010, 22:37:27
В том, что утверждаете Вы, я вижу попытку обоснования перекоса между GC- и AT-содержанием в целой молекуле ДНК (это следует и из последнего вашего поста), но вовсе не второго правила Чаргаффа. Думаю, для дальнейшего без третьего мнения не обойтись (кто-нибудь скажет, что понимает/не понимает Ваши доводы).

Нет, я имел в виду именно одну цепочу ДНК. Чисто ради любопытства, я написал тривиальную программку, генерирующую с использованием датчика случайных чисел случайную последоватиьельность букв 'C' и 'G' миллион раз подряд, а потом вычисляющую разность числа выпадений  'C' и 'G' , делённую на миллилон. Ниже результат 20 случайных серий (в процентах):

-0.05
-0.16
+0.05
+0.17
+0.03
-0.02
-0.20
-0.07
-0.28
-0.13
+0.15
-0.04
+0.26
+0.07
-0.16
-0.07
-0.02
-0.04
-0.26
+0.03

Как видите, разница ни разу не превысила трёх десятых процента.


Комбинатор

Цитата: Алекс_63 от мая 04, 2010, 23:07:15
Цитата: Galicarnax от мая 04, 2010, 22:37:27
без третьего мнения не обойтись
Galicarnax абсолютно прав.
Комбинатору надо проделать ту комбинацию о которой здесь идёт речь.
Тогда он всё поймёт сам, если конечно он умышленно не пытается заболтать тему.

Только что проделал (результат см. выше). Если я моделировал что-то неправильно, поясните конкретно что, плиз.