Комплементарность по одной цепочке ДНК

Автор BorysB, марта 27, 2007, 10:44:16

« назад - далее »

BorysB

ЦитироватьДействительно, гены, кодирующие последовательности которых располагаются на одной или другой цепочке, расположены вперемежку, и тех и других примерно поровну.

Как я уже писал, в геномах оч. много нетривиальных особенностей, если подходить с точки зрения информации. С вашего позволения я опишу еще одну. Речь дальше пойдет о геномах прокариот. Рассмотрим одну цепочку ДНК кольцевой хромосомы бактерии. В большинстве случаев можно наблюдать следуещее: эта цепочка условно будет разбита на два равных участка. На каждом из них будут преобладать  определенные из комплементарных нуклеотидов. Например в первой части преобладают нуклеотиды A и G, а на второй -- C и T. Несмотря на локальные несоответствия, количества комплементарных нуклеотидов по всей длинне практически совпадают. Так вот, гены записанные в разных направлениях (на разных цепочках ДНК) также концентрируются в соответствии с этим разбиением. Поясню, например, в одной из частей цепочки преобладают A и G, на этом же участке будут преобладать гены записанные "прямо". На другом участке преобладают C и T и гены, записанные в "обратном" направлении. Таким образом, кол-во комплементарных оснований уравновешивается по всей цепочке. Также и уравновешивается количество генов записанных в каждом из направлений (на каждой из цепочек ДНК). Т.е. кол-во (и суммарная длинна) генов, записанных на одной цепочке почти совпадает с соответствующими показателями по комплементарной цепочке. Плюс кол-во информации по каждой из цепочек одинакова.

Непонятно, является ли распределение направлений записи генов в ДНК следствием или причиной распределения комплементарных нуклеотидов.

Мое личное мнение: в этих статистических закономерностях проявляется механизм записи информации в ДНК, своего рода, почерк.

DNAoidea

Дело тут, по-моему в работе систем репарации. Когда они ремнтируют Мисматч, они же не знаю в какой из цепей заменять нуклеотид, поэтому количество их в одной цепи выравнвается. Что же касается кодирующих участков, то у генетического кода есть одно интересное свойство - когда аминокилота кодируется более, чем двумя триплетами, то как раз различие между ними будет ли пара AT ли CG. А не АТ и TA.

Alexy

Статья "A test of Chargaff's second rule" David Mitchell, Robert Bridge
Biochemical and Biophysical Research Communications 340 (2006) 90–94

"We found that:
(1) with the exception of the organellar DNA, this parity rule holds for all types of double stranded DNA genomes and
(2) that this rule fails to hold for other types of genomes."

Т.е. для вирусов с двухцепочной ДНК, правило тоже выполняется.
Но не выполняется для хромосом органелл эукариот (а это тоже двухцепочные ДНК), одноцепочных-ДНК-вирусов и РНК-вирусов.

Вместо этого  геномы органелл (митохондрий, а у растений еще и хлоропластов) и вирусы с одноцепочной ДНК "obey a different rule. The hepatoviruses obey the GC parity rule but not the AT parity rule.

In the double stranded RNA sequences, C + T is approximately 50% but the parity rule is not obeyed.

No identifiable parity rule applies to the remaining types of genomes."

Марков Александр

ЦитироватьРассмотрим одну цепочку ДНК кольцевой хромосомы бактерии. В большинстве случаев можно наблюдать следуещее: эта цепочка условно будет разбита на два равных участка. На каждом из них будут преобладать определенные из комплементарных нуклеотидов. Например в первой части преобладают нуклеотиды A и G, а на второй -- C и T.

Ага, с этим я сталкивался. Надо только добавить, что эти "два равных участка" симметричны относительно оси начало-конец репликации. То есть если расположить кольцевую хромосому точкой начала репликации вверх, а точкой конца репликации вниз, то "два равных участка" будут, соответственно, левой и правой половинками кольца. И это действительно "почерк", только почерк не неведомой силы, "записывающей" информацию на ДНК, а механизмов репликации.

Дело в том, что репликация у прокариот начинается в одной точке и движется от нее в обе стороны. При этом, как известно, одна из цепей реплицируется подряд, сплошняком, в направлении, совпадающем с направлением расплетания. А комплементарная цепь реплицируется короткими фрагментами, в обратном направлении. Эти два способа репликации различаются по частоте определенных ошибок. Таким образом, если мы возьмем одну из нитей, то выяснится, что ее, допустим, левая половинка всегда синтезируется подряд, а правая - кусочками. Поэтому в левой и правой половинках накапливаются разные мутации, т.е. вполне определенные нуклеотидные замены. Например, слева будет больше А и Г, а справа - Ц и Т. Об этом есть куча литературы (напр. Freeman JM, Plasterer TN, Smith TF, Mohr SC (1998) Patterns of genome organization in bacteria. Science 279; или вот тут много ссылок: http://www.biomedcentral.com/1471-2105/8/21 ).

Что касается расположения генов, то они, действительно, несколько чаще располагаются в направлении, совпадающем с направлением "прямой" репликации. Видимо, это дает какие-то преимущества, правда небольшие, т.к. эта закономерность очень нестрогая. Ну, например, в случае "прямого" расположения гена его можно начинать транскрибировать еще до того, как закончилась его репликация.

Что же касается изначального вопроса - о причинах примерного равенства А и Т, Г и Ц в одной цепочке ДНК, - то по-моему это достаточно хорошо объясняется постоянно идущими случайными геномными перестройками, о чем я уже говорил. Это обычное случайное перемешивание, процесс подобен диффузии. Данное явление не более удивительно, чем примерное равенство числа молекул газа в двух одинаковых по объему сообщающихся емкостях.

В общем, не следует искать "код да Винчи" там, где возможны более простые объяснения - или сначала надо эти простые объяснения опровергнуть.

Несколько настораживают повторяющиеся упоминания "неодарвинизма". При чем тут неодарвинизм? Что хочет автор темы - найти ответы на интересующие его вопросы или уесть "неодарвинистов", к коим он себя явно не причисляет?

Alexy

Правило же не только для единичных нуклеотидов:
БорисБ писал
" Пусть x, y, z -- некие нуклеотиды, а x*, y*, z* -- соответствующие комплементарные нуклеотиды. Тогда, если подсчитать количество подпоследовательностей (xyz) по одной цепочке ДНК, сдвигая каждый раз рамку на 1, то она будет почти совпадать с количеством комплементарных подпоследовательностей ( z* y* x*) по э. Для бактерий это выполняетмя вплоть до подпоследовательностей длинной 9"
.

Марков Александр

ЦитироватьПусть x, y, z -- некие нуклеотиды, а x*, y*, z* -- соответствующие комплементарные нуклеотиды. Тогда, если подсчитать количество подпоследовательностей (xyz) по одной цепочке ДНК, сдвигая каждый раз рамку на 1, то она будет почти совпадать с количеством комплементарных подпоследовательностей ( z* y* x*)

По-моему, это следует из предыдущего.
Допустим, частоты встречаемости нуклеотидов в геноме такие: А 0.3, Т 0.3, Г 0.2, Ц 0.2.
При хаотическом расположении нуклеотидов вероятность того, что произвольно выбранная двойка нуклеотидов будет, например, АГ, равна 0.3*0.2 = 0.06.
Вероятность того, что выбранная двойка будет комплементарной (ТЦ), равна тому же числу. Отсюда и примерно равное количество тех и других.

Alexy

Так количества ТЦ и ЦТ не равны.

BorysB

Спасибо за статьи.

ЦитироватьПри хаотическом расположении нуклеотидов вероятность того, что произвольно выбранная двойка нуклеотидов будет, например, АГ, равна 0.3*0.2 = 0.06.

Не могу с Вами согласиться, ключевой особеностью нуклеотидных (и аминокислотных) последовательностей явлеется то, что p(xy) не равно p(x)*p(y), где x,y-нуклеотиды, а p() -- вероятность собития.

Это значит, что события зависимые. И для подсчета вероятности p(xy) необходимо использовать формулу условной вероятности.

Интересно, что эта история с вероятностями -- это не последствия каких-то квантовомеханических эффектов, которые вырвались на высший уровень, т.к. эти вероятности сильно варьируют для геномов разных видов.

BorysB

ЦитироватьНесколько настораживают повторяющиеся упоминания "неодарвинизма". При чем тут неодарвинизм? Что хочет автор темы - найти ответы на интересующие его вопросы или уесть "неодарвинистов", к коим он себя явно не причисляет?
Пожалуйста, не принимайте на свой счет, просто первое сообщение было в теме "Неодарвинизм под вопросом" или как-то там, а потом ветка была перенесена в отдельную тему.
Я решил задать этот вопрос, т.к. неодарвинизм -- единственная теория (из тех, что я знаю), которая пытается объяснить изменения геномов.
Священные войны меня не интересуют (тем более, что я не биолог), ни к неодарвинистом ни к их противникам, я не отношусь.

DNAoidea

Цитата: "Марков Александр"Таким образом, если мы возьмем одну из нитей, то выяснится, что ее, допустим, левая половинка всегда синтезируется подряд, а правая - кусочками. Поэтому в левой и правой половинках накапливаются разные мутации, т.е. вполне определенные нуклеотидные замены.
Но ведь полимера всё равно работает в одном и том же направлении в обеих цепях. Как же она различает где лидирующая, а где отстающая?

plantago

Википедия рулит, как всегда: "http://en.wikipedia.org/wiki/Chargaff's_rules"
===
... Albrecht-Buehler has suggested that this rule is the consequence of genomes evolving by a process of inversion and transposition. This process does not appear to have acted on the mitochondrial genomes.
A connection between the Fibonacci numbers and Chargaff's second rule in the human genome has been proposed.
===
С уважением,
plantago

Gilgamesh

BorysB
Цитироватьединственная теория (из тех, что я знаю), которая пытается объяснить изменения геномов
Неодарвинизм занимается видообразованием, происхождением адаптаций, генетическими процессами в популяциях. А заявленная тема несколько в стороне от компетенции неодарвинизма (Вы понимаете под ним СТЭ?). Разумеется, такое противоречие несколько насторожило.
Начала Вселенной - атомы и пустота, все же остальное существует лишь в мнении (с) Демокрит

В конце будет наноассемблер

DNAoidea

Цитата: "plantago"Википедия рулит, как всегда: "http://en.wikipedia.org/wiki/Chargaff's_rules"
===
... Albrecht-Buehler has suggested that this rule is the consequence of genomes evolving by a process of inversion and transposition. This process does not appear to have acted on the mitochondrial genomes.
A connection between the Fibonacci numbers and Chargaff's second rule in the human genome has been proposed.
===
Убидительно. А что с цифрами Фибоначи?

Марков Александр

Цитата: "DNAoidea"
Цитата: "Марков Александр"Таким образом, если мы возьмем одну из нитей, то выяснится, что ее, допустим, левая половинка всегда синтезируется подряд, а правая - кусочками. Поэтому в левой и правой половинках накапливаются разные мутации, т.е. вполне определенные нуклеотидные замены.
Но ведь полимера всё равно работает в одном и том же направлении в обеих цепях. Как же она различает где лидирующая, а где отстающая?

Наверное, разные мутации возникают с разной частотой из-за того, что на отстающей цепи приходится проделывать особую операцию - сшивку кусочков. Впрочем, точно не знаю, посмотрите в литературе, ее много.

Марков Александр

Цитата: "Марков Александр"
ЦитироватьПусть x, y, z -- некие нуклеотиды, а x*, y*, z* -- соответствующие комплементарные нуклеотиды. Тогда, если подсчитать количество подпоследовательностей (xyz) по одной цепочке ДНК, сдвигая каждый раз рамку на 1, то она будет почти совпадать с количеством комплементарных подпоследовательностей ( z* y* x*)

По-моему, это следует из предыдущего.
Допустим, частоты встречаемости нуклеотидов в геноме такие: А 0.3, Т 0.3, Г 0.2, Ц 0.2.
При хаотическом расположении нуклеотидов вероятность того, что произвольно выбранная двойка нуклеотидов будет, например, АГ, равна 0.3*0.2 = 0.06.
Вероятность того, что выбранная двойка будет комплементарной (ТЦ), равна тому же числу. Отсюда и примерно равное количество тех и других.

Действительно, это объяснение не работает, как справедливо отметили участники дискуссии. Количества ТЦ и ЦТ действительно не равны.

Но, однако, работает объяснение, связанное с инверсиями (как мы теперь видим, для одиночных нуклеотидов это объяснение и в википедии прописано).

Так вот, прежде всего, действительно, закономерность есть, и выглядит на первый взгляд удивительно. Я подсчитал для той же R.prowazekii (для ОДНОЙ цепи):
AG 61213
GA 52431
CT 60097
TC 51714

Как видим, AG примерно равно CT, а GA примерно равно TC. Однако AG не равно TC, и TC не равно CT. Выглядит, правда, загадочно. Однако "инверсионное" объяснение работает и здесь.

Допустим, исходно было "высокоупорядоченное" состояние:
AG----AG----AG----AG
TC----TC----TC----TC

После любой инверсии распределение выравнивается, причем именно так, как в реальности:
AG----CT----CT----AG
TC----GA----GA----TC