Lab.6 IITP RAS logo
28/03/24
12:00:05

Лаборатория математических методов и моделей в биоинформатике
Института проблем передачи информации им. А.А. Харкевича
Российской академии наук

« back

Модель РНК-овой регуляции у бактерий

[ Вызвать модель ] [ Загрузить локальную версию ]

Детальное описание модели, особенности реализации и примеры ее использования приведены в [1-3,5,6]. Моделирование ведется методом Монте-Карло с большим числом повторений, поэтому модель реализована как консольное приложение для среды Windows или Linux, ориентированное на запуск в пакетном режиме. Данный сайт позволяет запускать модель непосредственно на сервере; он предназначен для ознакомления с моделью и проведения предварительных экспериментов с рядом ограничений. Для проведения реальных экспериментов рекомендуется запускать локальную версию модели на мощной рабочей станции для обработки в пакетном режиме.

В модели предусмотрено большое число параметров и ключей для управления режимами работы и выдачи результатов; значительная часть этих аргументов доступна из Web-интерфейса, который открывается при вызове модели. Ниже приводится перечень органов управления, имеющихся в интерфейсной форме, с их содержательным объяснением, где даются ссылки на номера формул из [5]. Описание полного набора параметров, доступного в локальной версии, входит в дистрибутивный комплект программы.

Вся форма состоит из следующих трех частей, разделенных горизонтальными линиями.

Верхняя часть интерфейсной формы: постановка задачи

Примеры
Для удобства тестирования здесь приведен список нескольких участков лидерных областей различных оперонов ряда бактерий. Каждая последовательность начинается от инициирующего кодона лидерного пептида и завершается U-богатым участком. Представлены как природные геномы, так и два мутанта, полученные из кишечной палочки заменой нуклеотида G на A в позициях 75 и 132 от старта транскрипции. (Описание этих мутантов и имеющиеся для них экспериментальные данные представлены в [4] ). Выбрав интересующий пример, необходимо нажать кнопку "Выбрать организм", после чего соответствующий участок автоматически вносится в поле "Последовательность", а прочие аргументы принимают значения по умолчанию.
Последовательность
В этом поле при необходимости можно ввести мутации или указать целиком нуклеотидную последовательность, отсутствующую в списке. Регистр букв значения не имеет, буквы T и U считаются эквивалентными. Помимо букв G, C, A, T, U, последовательность не должна содержать никаких посторонних или служебных символов - пробелов, дефисов, знаков препинания, табуляции, перевода строки и др. В противном случае при попытке запуска модели будет выдано сообщение об ошибке с указанием номера ошибочной позиции.
Аминокислота
Этот список служит для выбора той аминокислоты, от концентрации которой зависит экспрессия рассматриваемого гена. В списке возможен множественный выбор (с клавишей Ctrl), что позволяет изучать случаи разветвленных аминокислот.
Концентрация
Здесь задается относительная величина концентрации аминокислоты, выбранной в первом списке. Должно быть указано число в диапазоне [0,1]. (Здесь и далее в качестве разделителя целой и дробной части числа должна использоваться точка. При записи числа в показательной форме основание 10 указывается латинской буквой E или e, например, 2.0e-3 = 0.002). При каждом запуске процесс моделируется заданное число раз для указанного значения концентрации, поэтому для получения зависимости в диапазоне концентраций необходимо запускать модель несколько раз, меняя содержимое этого поля. Локальная версия программы позволяет автоматизировать этот процесс.
Исключая позиции
В этом поле при желании перечисляются участки данной последовательности, которые не могут участвовать в комплементарной связи (например, из-за связи с лигандом). Каждый участок задается парой чисел через запятую. Первое число - номер позиции начала участка во входной последовательности (начиная с 1), второе число - длина участка (число нуклеотидов). Всего можно указать до 6 таких участков, перечисляя их через запятую в произвольном порядке. Поле не должно содержать пробелы или другие символы, помимо цифр и запятых.

Средняя часть интерфейсной формы: параметры модели

Строка "Расчет энергии":
α, lmax
Эти параметры позволяют ввести поправку для энергии связи микросостояния по формуле (26). По умолчанию α=0 и поправка не применяется.
Bloop, Bbulge, Bintloop, C
Параметры B и C для расчета энергии петель микросостояния по формуле (2), соответственно, для концевой петли шпильки, одностороннего выпячивания и внутренней петли (двустороннего выпячивания). Значение С одинаковое во всех трех случаях.
Термодинамическая температура среды.

Строка "Переходы":

Формула
Вариант используемой формулы для скорости переходов между макросостояниями - симметричная (6) или асимметричная (4,5). В вариантах с пометкой "+q" используется добавочный весовой коэффициент, описанный в [5, раздел 4.1, п.5-с]. Этот коэффициент, который экспоненциально убывает с ростом частоты встречаемости результирующего макросостояния, в некоторых случаях помогает ускорить моделирование за счет сокращения циклов колебаний.
MAX #
Максимально допустимое число медленных переходов (смен макросостояния) в окне. При достижении этого порога производится принудительное изменение окна, т.е. сдвиг рибосомы или полимеразы, либо срыв полимеразы (исход разыгрывается обычным способом, но без учета вариантов, связанных с переходом в новое макросостояние).
κ
Константа замыкания, значение которой соответствует представлению о "вязкости" цитоплазмы.
λpol
Константа скорости перехода полимеразы на следующий нуклеотид (при отсутствии замедления под влиянием вторичной структуры в окне).
λrib
Константа скорости перехода рибосомы на следующий кодон (на нерегуляторных кодонах).
λura
Константа скорости срыва полимеразы с нуклеотидов, находящихся на U-богатом участке.
q
Параметр, определяющий скорость убывания весового коэффициента для скорости перехода (см. выше параметр "Формула"). Учитывается, только если выбран вариант формулы с пометкой "+q".
Spol
Положение полимеразы в начале моделирования: номер позиции нуклеотида последовательности, после которого начинается 5´-край полимеразы.
Srib
Положение рибосомы в начале моделирования: номер позиции нуклеотида последовательности, с которым связан Р-участок рибосомы.

Строка "Замедление полимеразы":

β
Добавочный множитель к аргументу тангенса в уравнении (16). По умолчанию равен 1, т.е. не используется.
L1, p0, r0, δ
Эти параметры используются в формуле (14), описывающей величину "силы" замедления шпилькой полимеразы.
Шпилька
Выбор варианта алгоритма с использованием формулы (20) или (21), т.е. учет суммарного замедления от всех шпилек вторичной структуры (SUM) или только от одной шпильки, максимально действующей на полимеразу (MAX).
MAXbulge, MAXintloop
Пороговые значения, соответственно, размера выпячивания и внутренней петли, которыми пренебрегаем при выделении черенка шпильки (задается числом нуклеотидов).

Строка "Пределы":

Helix
Минимально допустимая длина плеча спирали (число нуклеотидов).
Hypoelix
Минимально допустимая длина плеча гипоспирали (число нуклеотидов).
MINloop, MAXloop
Соответственно, минимально и максимально допустимая длина петли спирали (число нуклеотидов).
Lpol
"Размер" полимеразы от места выхода цепи РНК до точки транскрипции (число нуклеотидов).
Lrib
"Размер" рибосомы от ее P-участка до ее 3´-края (число нуклеотидов).
Uminlen
Минимально допустимая длина U-богатого участка или минимальное число нуклеотидов U/T в нем, в зависимости от значения параметра Ufraction.
Ufraction
Минимально допустимая доля букв U/Т в U-богатом участке (если указано число от 0 до 1) или максимальная дилна промежутка из других букв между соседними U (если указано число ≥1).
Ulast #
Число учитываемых U-богатых участков, считая от 3´-края последовательности. По умолчанию 1, т.е. учитывается только самый последний U-богатый участок, а прочие игнорируются.

Нижняя часть интерфейсной формы: параметры запуска

Повторений
В этом поле указывается число последовательных прогонов модели, по результатам которых оценивается вероятность терминации. Для серверной версии максимальное число прогонов ограничено 100. Число повторений учитывается, только если параметром "Выдача" (см. ниже) выбран стандартный ("std") или расширенный ("more") режим. В максимальном режимe "most" выполняется только одиночный запуск модели. В режиме нахождения установившейся вторичной структуры (см. ниже) в этом поле можно указать максимальное число выдаваемых структур (по умолчанию 20).
Seed
По умолчанию имеющийся в модели высококачественный датчик псевдослучайной последовательности инициализируется в момент запуска на основании значения таймера машины. Для получения воспроизводимых результатов можно указать в этом поле некоторое ненулевое значение, которое будет использоваться для инициализации датчика вместо значения таймера.
Lic.
Поле зарезервировано для служебных целей.
Очистить
Нажатие этой кнопки позволяет отменить сделанные изменения и вернуть интерфейсную форму в исходное состояние.
Равновесие
Нажатием этой кнопки производится запуск модели в особом режиме (с неподвижными рибосомой и полимеразой) с целью нахождения установившейся вторичной структуры РНК. Внимание! После нажатия кнопки остановить работу или изменить режим невозможно.
Запуск
Нажатием этой кнопки запускается работа модели в обычном режиме, после чего остановить ее или изменить значения аргументов невозможно.
Выдача
Предусмотрено три режима выдачи:
std
Стандартный режим выдачи, при котором результаты каждого прогона модели представляются в протоколе одной строкой с указанием исхода моделирования (была терминация или нет) и ряда добавочных характеристик процесса.
more
Расширенный режим выдачи, при котором дополнительно формируется отдельный файл, содержащий финальное макросостояние и исход каждой траектории моделирования.
most
Максимальный режим выдачи, иллюстрирующий ход моделирования для одного запуска модели. При выборе этого варианта число повторений принимается равным 1, и наоборот, этот режим автоматически устанавливается при выборе числа повторений 1. Помимо файла с текстовой информацией о каждом сдвиге рибосомы или полимеразы, формируется отдельный файл, который графически представляет траекторию движения модели прямо на исходной последовательности (выделяя текущее окно и плечи гипоспиралей с помощью цветового кодирования). При этом возникающие на траектории циклы любой глубины для лучшей обозримости представляются лишь однократно. Тем не менее, формируемые файлы результатов могут достигать значительных объемов, поэтому для серверной версии выдается только начало и конец траектории.

После нажатия кнопки "Запуск" или "Равновесное состояние" интерфейсная форма исчезает и, при отсутствии ошибок в аргументах, через короткое время на экране появляется сообщение "Your request has been accepted with ID: xxxxx", информирующее о том, что запрос принят и ему присвоен указанный идентификатор. Ниже дается ссылка "view results", по которой можно будет получить результаты моделирования, когда они будут готовы. Время выполнения запроса меняется в широких пределах в зависимости от исходной последовательности, параметров модели и загруженности сервера. По окончании выполнения будет выдано сообщение "Request successfully completed", после чего можно будет обратиться по ссылке "view results". Как альтернатива, можно не дожидаться окончания обработки запроса, а сохранить эту ссылку и закрыть окно. В этом случае информацию о готовности результатов можно будет получить только путем обращения к сохраненной ссылке и изучения имеющихся на тот момент результатов.

По ссылке "view results" открывается новое окно с содержимым текстового выходного файла, которое определяется выбранным в интерфейсной форме режимом выдачи. Вверху и внизу страницы имеется кнопка "Delete result", нажатием на которую можно удалить все файлы данных и результатов, относящихся к этому запросу. Кроме того, в режимах выдачи "more" и "most" там же имеется ссылка для просмотра (в другом окне) графического представления множества финальных состояний или одной траектории модели. Настоятельно рекомендуется сразу же сохранить обе страницы в локальных файлах на компьютере пользователя, после чего нажать на кнопку "Delete result" (при этом содержимое окон останется вплоть до обновления страницы). В противном случае результаты могут быть без предупреждения автоматически удалены сервером, что не позволит их в дальнейшем сохранить, если это потребуется.

За дополнительной информацией о модели следует обращаться по электронной почте.

Литература

  1. V. Lyubetsky, L. Rubanov, A. Seliverstov, S. Pirogov. Model of gene expression regulation in bacteria via formation of RNA secondary structures. Molecular Biology. Vol.40, 3, 2006, p. 440-453.
  2. В.А. Любецкий, К.Ю. Горбунов, С.А. Пирогов, Л.И. Рубанов, А.В. Селиверстов. Алгоритм и результаты счета для модели регуляции экспрессии генов у бактерий на основе формирования вторичных структур РНК. Информационные процессы. Том 5, 5, 2005, стр. 337-366. http://www.jip.ru/2005/337-366.pdf
  3. В.А. Любецкий, А.В. Селиверстов. Вычисление эффективности регуляции биосинтеза триптофана у бактерий на основе модели классической аттенюации. Информационные процессы. Том 6, 1, 2006, стр. 55-57. http://www.jip.ru/2006/55-57-2006.pdf
  4. Das A., Crawford I.P., Yanofsky C. Regulation of tryptophan operon expression by attenuation in cellfree extracts of Escherichia coli. The Journal of Biological Chemistry. V. 257, 15, 1982, p. 8795-8798. http://www.jbc.org/cgi/reprint/257/15/8795.pdf
  5. Lyubetsky V., Pirogov S., Rubanov L., Seliverstov A. Modeling Classic Attenuation Regulation of Gene Expression in Bacteria. Journal of Bioinformatics and Computational Biology. Vol.5, 1, 2007, p. 155-180.
  6. Lev Rubanov and Vassily Lyubetsky. RNAmodel Web Server: Modeling Classic Attenuation in Bacteria. In Silico Biology. Vol.7, 3, 2007, p. 285-308.

[ Вызвать модель ] [ Загрузить локальную версию ]
« back