RNAInSpace/Общие описание корреляционно-иерархического поиска: различия между версиями

Содержимое удалено Содержимое добавлено
Нет описания правки
Нет описания правки
Строка 1:
 
== Параллельный ход сворачивания ==
{{Пояснение| Будем исходить из предположения, что глобальный минимум лежит в рамках ''специально отобранных'' локальных решений. }}
 
{{Внимание| Выдвинута '''рабочая биологическая гипотеза''': ''важно не просто уменьшение энергии, но в траектории важно выстроить повороты в такой последовательности, чтобы каждый следующий поворот падал в энергетическую яму начиная от наибольшего скачка и постепенно все меньших.'' }}
== Вводный пример ==
 
Гипотеза выше направляет сворачивание в правильную сторону, но только оно приводит к скатыванию с локальному минимуму, дальше которого сворачивание не происходит. Необходимо учесть, что идет параллельное сворачивание нуклеотидов, которое вынужденно моделируется последовательно (см. [[Дискуссия: Биологические аспекты сворачивания РНК]] ).
 
Вычислительные мощности позволят учесть (построить энергетическую поверхность) одновременно согласованные повороты только 2-х нуклеотидов.
 
Проблема состоит в том, что конечное состояние цепи (глобальный энергетический минимум) одновременно определяется поворотами всех нуклеотидов. То есть нельзя последовательно подойти к определению как должен быть повернут тот или иной нуклеотид.
 
Проводилось изучение энергетической поверхности самых коротких РНК-цепей. Например, отобрав те повороты которые наиболее выгодны для достижения минимума цепи '''ga''', эти же повороты не будут способствовать достижению минимума в цепи '''gaa'''.
 
== Методы приближения к глобальному минимуму на сложной энергетической поверхности ==
 
{{Пояснение| Будем исходить из предположения, что глобальный минимум лежит в рамках ''специально отобранных'' локальных решений. }}
 
Чтобы пояснить проблематику/сложность нахождения глобального энергетического минимума, создающей цепочкой РНК рассмотрим один вырожденный пример. Возьмем последовательность из трех нуклеотидов '''gaa'''. Для каждого нуклеотида возможны 1526 различных поворотов. Поэтому уже для такой короткой цепочки, чтобы полностью перебрать все варианты требуется порядка 2 недель 6-процессорной машины. Полный перебор не был сделан, но частичный (были отобраны 316, 196, 116 вариантов поворотов для соответствующего нуклеотида) позволил найти энергетический минимум -13.87 (1 - №496; 2 - №939; 3 - №50).
Строка 8 ⟶ 20 :
Были разработаны два достаточно простых метода, для предварительной оценки энергетического минимума.
 
=== Метод „Быстрое охлаждение“ ===
 
# Для каждого нуклеотида проверяем какой из поворотов дает наибольшее понижение энергии
Строка 23 ⟶ 35 :
Это положение соответствует энергии -9.41. Как видим, оно далеко до полученного ранее энергетического минимум (-13.87). Причина этого состоит в том, что данный метод не учитывает возможные корреляции положений двух или более нуклеотидов, попав в которые только одновременно происходит понижение энергии.
 
=== Метод „Попарная корреляция“ ===
 
В отличии от метода „Быстрого охлаждения“, данный метод пытается учесть корреляции положений. Но так как уже для трех положений это требует значительных вычислительных затрат, данный метод перебирает только положения для 2 нуклеотидов (1526*1526 ≈ 2.3 млн.).
Строка 34 ⟶ 46 :
Этот метод позволил найти локальный минимум в -10.91. Как видим он ближе к нашему глобальному, но тем не менее не достаточен.
 
=== Метод „Иерархичная корреляция“ ===
 
Итак, в методе „Попарная корреляция“ мы можем учесть только попарные корреляции. Корреляции же всех, в данном случае 3 нуклеотидов перебрать технически не можем (слишком долго). Искать случайным образом (Монте-Карло) также бесперспективно, так как вероятность попасть именно в глобальный минимум сразу делая три поворота - крайне мала. А последовательно, что показали два выше описанных метода это сделать не возможно.