Исправление оценки VDW

Эта статья — часть материалов: проекта RNAFoldingAI


rA - 27 rC - 28 rU - 29 rG - 26
1 P - 1 P - 1 P - 1 P - 1
2 O1P (OP1) O1P O1P O1P
3 O2P (OP2) O2P O2P O2P
4 O5* O5* O5* O5*
5 C5* - 2 C5* - 2 C5* - 2 C5* - 2
6 C4* C4* C4* C4*
7 O4* O4* O4* O4*
8 C3* - 4 C3* - 4 C3* - 4 C3* - 4
9 O3* O3* O3* O3*
10 C2* C2* C2* - 9 C2*
11 O2* - 9 O2* - 9 O2* O2* - 9
12 C1* - 3 C1* - 3 C1* - 3 C1* - 3
13 N1 - 8 N1 - 8 N1 - 8 N1 - 8
14 C2 C2 C2 C2
15 N3 O2 - 6 O2 - 6 N2 - 6
16 C4 - 6 N3 N3 N3
17 C5 C4 C4 C4
18 C6 N4 - 5 O4 - 5 C5
19 N6 - 5 C5 C5 C6
20 N7 C6 - 7 C6 - 7 O6 - 5
21 C8 - 7 1H5* 1H5* N7 - 7
22 N9 2H5* 2H5* C8
23 1H5* H4* H4* N9
24 2H5* H3* H3* 1H5*
25 H4* 1H2* 1H2* 2H5*
26 H3* 2HO* 2HO* H4*
27 1H2* H1* H1* H3*
28 2HO* 1H4 H3 1H2*
29 H1* 2H4 H5 H1*
30 H2 H5 H6 2HO*
31 1H6 H6 H1
32 2H6 1H2
33 H8 2H2
34 H8

Как рассчитывается оценка радиусов Ван-дер-Ваальса (VDW) описано в Энергия связей аденин-урацил в РНК. Нам нужно уточнить эту оценку, т.к. она в некоторых случаях не различает запрещенные состояния от разрешенных. Из-за этого общая оценка энергии может быть неверной, и в итоге локальный минимум может быть более правильный чем глобальный. И в таком случае нельзя поставить задачу нахождения глобального минимума, т.к. его поиск не приведет нас к результату.

В качестве параметров (Rna vdw parameter.dat) используется наибольшая замеченная величина соответствующих пар нуклеотидов, которые находятся на расстоянии <12 Å, взятых из большой рибосомной подединицы Haloarcula marismortui (1FFK).

В работе Автоматизированное предсказание de novo третичной структуры РНК для оценки VDW используются только по 9 атомов из нуклеотидов, изображенных ниже в таблице желтым цветом. Данных о расположении водородных атомов в структуре 1FFK нету (изображены серым цветом).

Необходимо сделать следующие уточнения:

  1. Учитывать для всех доступных атомов (20-23 шт.) нуклеотидов из 1FFK.pdb наибольшие расстояния между парами нуклеотидов, которые находятся на расстоянии <12 Å
  2. Учитывать для всех атомов (C, N, H, O) образование ковалентных связей, которых в структуре РНК быть не должно [1]


Учет близости большего числа атомов

править

Для этого были перевычислены параметры (Rna vdw parameter.dat) наибольшего расстояния пар нуклеотидов, которые находятся на расстоянии <12 Å, взятых из большой рибосомной подединицы Haloarcula marismortui (1FFK).

Для этого нужно было:

  1. Переформатировать файл 1FFK, так как названия атомов и нуклеотидов не совпадают с принятыми в ПО Rosseta
  2. Используя ПО Rosseta (функция rna_vdw_pdb_stas [in pose_rna_pdbstats.cc ]), был получен файл 0,8 Гбайт, содержащий расстояния атомов для пар нуклеотидов, которые находятся на расстоянии <12 Å
  3. Используя ПО RNAFoldingAI, данный файл был прочитан, и найдены максимальные значения, был создан файл аналогичный Rna vdw parameter.dat
  4. Из-за того, что учитывается большее число атомов по сравнению с ПО Rosseta, с одной стороны уменьшили коэффициент масштаба с 1.0 до 0.2, но убрали лишний коэффициент 0.8 (имеющийся в ПО Rosseta), на который умножался конечный результат оценки VDW

Окончательно используется следующая функция оценки энергии:

SCORE = (VDW * 3.0 + RG) + (RNA_BS + RNA_BP_W + RNA_BP_H + RNA_BP_S) + (RNA_NONB * 1.5 + RNA_O2ST + RNA_PHOS) + (RNA_AXIS*0.2 + RNA_STAG * 0.5 )

Вес для VDW = 3.0 подобран из примерного расчета, чтобы оценка энергии, найденных путем полного перебора лучших состояний для пар нуклеотидов разных видов (16 вариантов), была бы меньше нуля.

Определение наличия ковалентных связей между атомами

править

Радиусы:

'C' = 1.50, 'N' = 1.40, 'O' = 1.30, 'H' = 1.00, 'F' = 1.20, 'S' = 1.90

Связь создается всякий раз, когда два атома находятся в пределах (R1 + R2) * 0.6 друг от друга, где R1 и R2 - соответствующие радиусы атомов[2].

C-C		(1.5+1.5)*0.6 = 1.80
C-N (N-C)	(1.5+1.4)*0.6 = 1.74
C-O (O-C)	(1.5+1.3)*0.6 = 1.68
C-H (H-C)	(1.5+1.0)*0.6 = 1.50
N-N		(1.4+1.4)*0.6 = 1.68
N-O (O-N)	(1.4+1.3)*0.6 = 1.62
N-H (H-N)	(1.4+1.0)*0.6 = 1.44
O-O 		(1.3+1.3)*0.6 = 1.56
O-H (H-O)	(1.3+1.0)*0.6 = 1.38
H-H 		(1.0+1.0)*0.6 = 1.20

При расположении атомов на расстоянии, при котором образуется ковалентная связь, вводятся большие штрафы увеличивающие оценку VDW на 10 единиц.


Примечания

править
  1. Естественно, за исключением фосфора (P), посредством которого соединяются между собой нуклеотиды
  2. Согласно моделированию в VMD