Исправление оценки VDW
№ | rA - 27 | rC - 28 | rU - 29 | rG - 26 |
---|---|---|---|---|
1 | P - 1 | P - 1 | P - 1 | P - 1 |
2 | O1P (OP1) | O1P | O1P | O1P |
3 | O2P (OP2) | O2P | O2P | O2P |
4 | O5* | O5* | O5* | O5* |
5 | C5* - 2 | C5* - 2 | C5* - 2 | C5* - 2 |
6 | C4* | C4* | C4* | C4* |
7 | O4* | O4* | O4* | O4* |
8 | C3* - 4 | C3* - 4 | C3* - 4 | C3* - 4 |
9 | O3* | O3* | O3* | O3* |
10 | C2* | C2* | C2* - 9 | C2* |
11 | O2* - 9 | O2* - 9 | O2* | O2* - 9 |
12 | C1* - 3 | C1* - 3 | C1* - 3 | C1* - 3 |
13 | N1 - 8 | N1 - 8 | N1 - 8 | N1 - 8 |
14 | C2 | C2 | C2 | C2 |
15 | N3 | O2 - 6 | O2 - 6 | N2 - 6 |
16 | C4 - 6 | N3 | N3 | N3 |
17 | C5 | C4 | C4 | C4 |
18 | C6 | N4 - 5 | O4 - 5 | C5 |
19 | N6 - 5 | C5 | C5 | C6 |
20 | N7 | C6 - 7 | C6 - 7 | O6 - 5 |
21 | C8 - 7 | 1H5* | 1H5* | N7 - 7 |
22 | N9 | 2H5* | 2H5* | C8 |
23 | 1H5* | H4* | H4* | N9 |
24 | 2H5* | H3* | H3* | 1H5* |
25 | H4* | 1H2* | 1H2* | 2H5* |
26 | H3* | 2HO* | 2HO* | H4* |
27 | 1H2* | H1* | H1* | H3* |
28 | 2HO* | 1H4 | H3 | 1H2* |
29 | H1* | 2H4 | H5 | H1* |
30 | H2 | H5 | H6 | 2HO* |
31 | 1H6 | H6 | H1 | |
32 | 2H6 | 1H2 | ||
33 | H8 | 2H2 | ||
34 | H8 |
Как рассчитывается оценка радиусов Ван-дер-Ваальса (VDW) описано в Энергия связей аденин-урацил в РНК. Нам нужно уточнить эту оценку, т.к. она в некоторых случаях не различает запрещенные состояния от разрешенных. Из-за этого общая оценка энергии может быть неверной, и в итоге локальный минимум может быть более правильный чем глобальный. И в таком случае нельзя поставить задачу нахождения глобального минимума, т.к. его поиск не приведет нас к результату.
В качестве параметров (Rna vdw parameter.dat) используется наибольшая замеченная величина соответствующих пар нуклеотидов, которые находятся на расстоянии <12 Å, взятых из большой рибосомной подединицы Haloarcula marismortui (1FFK).
В работе Автоматизированное предсказание de novo третичной структуры РНК для оценки VDW используются только по 9 атомов из нуклеотидов, изображенных ниже в таблице желтым цветом. Данных о расположении водородных атомов в структуре 1FFK нету (изображены серым цветом).
Необходимо сделать следующие уточнения:
- Учитывать для всех доступных атомов (20-23 шт.) нуклеотидов из 1FFK.pdb наибольшие расстояния между парами нуклеотидов, которые находятся на расстоянии <12 Å
- Учитывать для всех атомов (C, N, H, O) образование ковалентных связей, которых в структуре РНК быть не должно [1]
Учет близости большего числа атомов
правитьДля этого были перевычислены параметры (Rna vdw parameter.dat) наибольшего расстояния пар нуклеотидов, которые находятся на расстоянии <12 Å, взятых из большой рибосомной подединицы Haloarcula marismortui (1FFK).
Для этого нужно было:
- Переформатировать файл 1FFK, так как названия атомов и нуклеотидов не совпадают с принятыми в ПО Rosseta
- Используя ПО Rosseta (функция rna_vdw_pdb_stas [in pose_rna_pdbstats.cc ]), был получен файл 0,8 Гбайт, содержащий расстояния атомов для пар нуклеотидов, которые находятся на расстоянии <12 Å
- Используя ПО RNAFoldingAI, данный файл был прочитан, и найдены максимальные значения, был создан файл аналогичный Rna vdw parameter.dat
- Из-за того, что учитывается большее число атомов по сравнению с ПО Rosseta, с одной стороны уменьшили коэффициент масштаба с 1.0 до 0.2, но убрали лишний коэффициент 0.8 (имеющийся в ПО Rosseta), на который умножался конечный результат оценки VDW
Окончательно используется следующая функция оценки энергии:
SCORE = (VDW * 3.0 + RG) + (RNA_BS + RNA_BP_W + RNA_BP_H + RNA_BP_S) + (RNA_NONB * 1.5 + RNA_O2ST + RNA_PHOS) + (RNA_AXIS*0.2 + RNA_STAG * 0.5 )
Вес для VDW = 3.0 подобран из примерного расчета, чтобы оценка энергии, найденных путем полного перебора лучших состояний для пар нуклеотидов разных видов (16 вариантов), была бы меньше нуля.
Определение наличия ковалентных связей между атомами
правитьРадиусы:
- 'C' = 1.50, 'N' = 1.40, 'O' = 1.30, 'H' = 1.00, 'F' = 1.20, 'S' = 1.90
Связь создается всякий раз, когда два атома находятся в пределах (R1 + R2) * 0.6 друг от друга, где R1 и R2 - соответствующие радиусы атомов[2].
C-C (1.5+1.5)*0.6 = 1.80 C-N (N-C) (1.5+1.4)*0.6 = 1.74 C-O (O-C) (1.5+1.3)*0.6 = 1.68 C-H (H-C) (1.5+1.0)*0.6 = 1.50 N-N (1.4+1.4)*0.6 = 1.68 N-O (O-N) (1.4+1.3)*0.6 = 1.62 N-H (H-N) (1.4+1.0)*0.6 = 1.44O-O (1.3+1.3)*0.6 = 1.56O-H (H-O) (1.3+1.0)*0.6 = 1.38H-H (1.0+1.0)*0.6 = 1.20
При расположении атомов на расстоянии, при котором образуется ковалентная связь, вводятся большие штрафы увеличивающие оценку VDW на 10 единиц.