Комплементарность по одной цепочке ДНК

BorysB · марта 27, 2007, 10:44:16

Здравствуйте, случайно встретил ваш форум и решил поинтересоваться, может кто-то знает как с помощью неодарвинизма объяснить комплементарность по ОДНОЙ цепочке ДНК. Т.е. кол-во нуклеотидов А почти совпадает с количеством нуклеотидов Т по одной цепочке ДНК. Для C и G -- соответственно. Выполняется для пар, троек и т.д. (в зависимости от размера генома).

Gilgamesh · марта 27, 2007, 12:03:35

2 BorysB
Скажите, что значит в данном контексте "по ОДНОЙ цепочке ", учитывая, что комплементарность проявляется во взаимодополнимости двух цепоцек одной двойной спирали ДНК.

BorysB · марта 27, 2007, 13:30:48

Комплементарность по одной цепочке почти ничего общего со стандартным законом комплементарности не имеет, водородные связи не образовываются. Это не химический закон, это, скорее, статистическая закономерность. Заключается она в следующем: если взять ОДНУ цепочку ДНК и подсчитать количество нуклеотидов A, то их количество с точностью до долей процента совпалает с кол-вом T на этой же цепочке. То же самое для C и G.
Это не вытекает из стандартного закона комплементарности. Можно просто привести контрпример, в котором обычная комплементарность есть, а комплементарности по одной чепочке нету. Например на одной цепочке 20-A, 40-T, 60-G и 80-C. Тогда на кмплементарной цепочке ДНК будет 40-A, 20-T, 80-G и 60-C. В живой природе было бы одинаковое количество A и T для каждой отдельной цепочки.
Комплементарность по одной цепочке четко проявляется на уровне всей хромосомы, локольно места не имеет. Закономерность имеет место во всех исследованых геномах (от бактерий до высших эукариот), кроме вирусных.
Как я писал, пары, тройки и т.д. нуклеотидов также подчиняются этой закономерности.
Вопрос в следующем, если геномы изменяются вследствие случайных мутаций, то каковы механизмы сохранения этой закономерности учитывая, что отношение(A+T) / (G+C) разное для всех видов.

Gilgamesh · марта 27, 2007, 13:43:11

Надо же, как интересно. Может хоть покажете, где Вы нашли такую информацию? Пока похоже (если не сказать - очевидно), что вопрос основан на неправильном понимании некорректно написанного. Почему Вы считаете, что речь идёт не о двойной цепочке ДНК, пожалуйста дословно источником...

BorysB · марта 27, 2007, 14:09:53

Этот факт, действительно, не так известен. Во всяком случае в ведущих журналах (Нейче и Сайнс) об этом факте не упоминается. В некоторых учебниках я встречал его с формулировкой "для достаточно длинных последовательностей ДНК выполняется закономерность..." и называли его, если не ошибають, вторым законом(или правилом) Чарграфа.
Я встречал несколько статей об этой закономерности в геномах бактерий в журнале BMC Bioinformatics, ссылки на соответствующие статьи я в ближайшее время постараюсь опубликовать.
В нашем отделе в свое время исследовались геномы многих организмов и эти закономерности везде четко проявлялись. Я лично проделывал это более чем для 50 бактерий и архей и для растений: арабидопсиса и риса. Другие сотрудники подсчитывали геномы человека, шимпанзе, рыбы... и я точно знаю что для других организмов это делалось (вобщем, все что удавалось выкачать).
Все геномы мы сами выкачивали и сами писали соответствующие компьютерные программы, поэтому, я ручаюсь, что закон выполняется именно по одной цепочке ДНК.

BorysB · марта 27, 2007, 14:19:23

Вот ссылка на Биоинформатикс в Оксфорд Джорналс.

http://bioinformatics.oxfordjournals.org/cgi/reprint/18/8/1021

Но я помню, что была еще одна статья в BMC Bioinformatics, ее названия я не помню, поэтому найти ее будет сложно. Но если будет интересно, я могу посмотреть дома в своих статьях, там я точно ссылаюсь и на эти работы.

Марков Александр · марта 27, 2007, 14:32:14

Хорошо, когда утверждение можно проверить за 10 минут, не отходя от компьютера.
Удивительно, но факт.
Взял наугад геном из интернета (Ricketsia prowazekii, возбудитель эпидемического сыпного тифа). По определению, это последовательность нуклеотидов в ОДНОЙ цепочке ДНК. Написал программу для подсчета a,t,g,c:

Dim CountA As Long, CountT As Long, CountC As Long, CountG As Long
Open "r_prow.txt" For Input As #1
Do Until EOF(1)
Input #1, a
For i = 1 To Len(a)
Select Case Mid(a, i, 1)
Case "a"
CountA = CountA + 1
Case "t"
CountT = CountT + 1
Case "g"
CountG = CountG + 1
Case "c"
CountC = CountC + 1
End Select
Next i
Loop

MsgBox "A " & CountA & vbCrLf & "T " & CountT & vbCrLf & "G " & CountG & vbCrLf & "C " & CountC & vbCrLf

Вот результат:

A 393194
T 395984
G 162512
C 159833

что полностью подтверждает утверждение BorysB.

Действительно - ПОЧЕМУ количество A в одной цепочке очень близко к количеству T, а C - к G?

Вариант ответа: из-за постоянно происходящих мелких и крупных инверсий. Действительно, гены, кодирующие последовательности которых располагаются на одной или другой цепочке, расположены вперемежку, и тех и других примерно поровну. Постоянные инверсии "перемешивают" распределение нуклеотидов по цепочкам, и таким образом характерное для данного генома соотношение нуклеотидов поддерживается на обеих цепочках одинаковым.

Например, "высокоупорядоченное" распределение (на одной цепочке сплошные А, на другой - сплошные Т:

АТ
АТ
АТ
АТ

После любой инверсии станет менее упорядоченным, например:

АТ
ТА
ТА
АТ

Gilgamesh · марта 27, 2007, 14:53:25

"После любой инверсии станет менее упорядоченным, например: "
А как это совместимо с сохранением функциональности кодирующих последовательностей?
И где можно разжиться этими геномами?
=====
Тему отделил, до выяснения обстоятельств. Т.к. вопрос частный и обособленный

Марков Александр · марта 27, 2007, 15:12:25

ЦитироватьА как это совместимо с сохранением функциональности кодирующих последовательностей?

Конечно, фиксируются (за редчайшими исключениями) только те инверсии, которые не разрывают ген, у которых точки разрыва - между генами. Но этого, вероятно, достаточно для достижения эффекта перемешивания, о котором идет речь.

ЦитироватьИ где можно разжиться этими геномами?

На сайте http://www.ncbi.nlm.nih.gov

Все микробные геномы - здесь:
http://www.ncbi.nlm.nih.gov/genomes/lproks.cgi?view=1
Там надо кликнуть на ссылке в колонке, обозначенной "RefSeq", а в открывшемся окне - еще раз кликнуть, опять на "RefSeq". Тогда открывается геном: сверху аннотации белков, а внизу сиквенс.

Gilgamesh · марта 27, 2007, 16:08:03

Т.е. там взята кольцевая двуцепочечная ДНК, расплетена и одна цепочка секвенирована? Именно так? А если посчитать соотношение у одноцепочечных вирусов?

BorysB · марта 27, 2007, 16:35:20

Я просто хотел услышать, как эта закономерность объясняется неодарвинизмом, т.к. лично я объяснения не знаю. Поэтому вопрос для меня остается открытым.

Если Вам интересно, то это - не единственная нетривиальная особенность геномов.
Я уже упоминал что закономерность выполняется также для комплементарных нуклеотидных последовательностей (олигонуклеотидов). Чем больше размер генома тем точнее выполняется эта закономерность. У бактерий она выполняется для единичных нуклеотидов, пар, троек,..., вплоть до девяток. У человека -- где-то вплоть до последовательностей из 50 нуклеотидов.

У вирусов эта закономерность наверняка не выполняется: я обсчитывал несколько десятков вирусных геномов и нигде не заметил этой закономерности.

Много интересных моментов проявляются если анализировать геномы с точки зрения информации. Например, геном очень удобно моделировать с помощью цепей Маркова. Так вот, если подсчитать переходные вероятности или даже просто вероятность каждого отдельного нуклеотида по одной цепочке ДНК, то они окажуться очень близкими для разных хромосом одного и того же организма. Например, у человека вероятности(частоты) нуклеотидов длявсех хромосом оказываются почти одинаковыми. Вопрос, как объяснить, что независимые молекулы (хромосомы) имеющие разную длинну и различный генный состав и изменяющиеся вследствие случайных мутаций, сохраняют очень близкие вероятности отдельных нуклеотидов и переходные вероятности. Очевидно, задействована какая-то общая процедура записи информации (мое личное мнение).
Некоторые бактерии имеют несколько хромосом (2 или 3). Там это не так ярко выражено, хотя тенденция есть, видимо из-за того, что размеры бактериальных геномов -- малы.

BorysB · марта 27, 2007, 16:39:30

Кстати, кто знает, где именно распиливаются кольцевые молекулы ДНК бактерий перед тем как они попадают в базу данных? Я боюсь ошибиться, но я где-то читал, что в точке инициации репликации, может ли кто-то подтвердить или опровергнуть: я никак не могу вспомнить где именно я это читал.

Gilgamesh · марта 27, 2007, 16:49:26

"Например, у человека вероятности(частоты) нуклеотидов длявсех хромосом оказываются почти одинаковыми"
Т.е. количество того или иного нуклеотида? Попробуйте сделать вот что: посчитать частоты букв в разных главах больших произведений, в "Войне и мире" Толстого, например. Предположу, что частоты будут стабильными несмотря на явную осмысленность текста и отсутствие "некодирующих" элементов. Всё дело в больших (большущих!) числах. Т.о. эта закономерность, ИМХО, далеко не так интересна, как второе правило Чаргаффа. В учебниках я этого вообще не видел.
Поясните ситуацию с олигонуклеотидами, как это выглядит?

BorysB · марта 27, 2007, 17:24:14

Частоты и переходные вероятности очень сильно отличаются для геномов различных организмов, но тем не менее очень близки для разных хромосом одного организма. Вместе с комплементарностью по одной цепочке, это означает, что количество информации на каждой из цепочек -- одинакова. Мое личное мнение, частоты и переходные вероятности -- момент значимый, но, снова таки, никому ничего навязыватья не хочу.

Относительно комплементарности последовательностей. Для примера рассмотрим случай с тройками: Пусть x, y, z -- некие нуклеотиды, а x*, y*, z* -- соответствующие комплементарные нуклеотиды. Тогда, если подсчитать количество подпоследовательностей (xyz) по одной цепочке ДНК, сдвигая каждый раз рамку на 1, то она будет почти совпадать с количеством комплементарных подпоследовательностей ( z* y* x*) по э. Для бактерий это выполняетмя вплоть до подпоследовательностей длинной 9. Понятно, что для подпоследовательностей четной длины будет существовать подмножество самокомплементарных подпоследовательностей (AT или ATAT), для которых это утверждение не имеет смысла.

Сергей · марта 27, 2007, 17:34:28

Цитата: "BorysB"Вопрос, как объяснить, что независимые молекулы (хромосомы) имеющие разную длинну и различный генный состав и изменяющиеся вследствие случайных мутаций, сохраняют очень близкие вероятности отдельных нуклеотидов и переходные вероятности. Очевидно, задействована какая-то общая процедура записи информации (мое личное мнение).

Дело тут, скорее всего, в физических свойствах молекулы двухспиральной ДНК. ''Идеальная'' В-форма ДНК, для работы с которой, очевидно, и оптимизированы клеточные белки, получается, когда пурины и пиримидины чередуются случайным образом. Если же пурины или пиримидины находятся только в одной из цепей, или если они чередуются монотонно, например CGCGCGCG, то свойства таких спиралей оказываются необычными: они склонны образовывать триплексы, квадруплексы, кресты или Z-форму. Такие структуры также необходимы для нормального функционтрования генома, но, чем больше геном, тем меньше их доля, и тем больше вероятность, что такое распределение пуринов и пиримидинов будет встречаться в одной и той же цепи.