Home » Chordates Protein Clusters

Инструкции по применению

Поиск кластеров по профилю

Для поиска кластеров, соответствующих заданному филогенетическому профилю, используется страница Profile search. Профиль задаётся таблицей: напротив имени каждого представленного в ней организма выбирается один из знаков: +, , ?. Первый из знаков показывает, что в искомом кластере требуется наличие хотя бы одного белка из этого организма; второй из них — отсутствие такого белка; третий — не накладывает дополнительных ограничений. Для быстрой расстановки одного из знаков по всему столбцу используются одноимённые кнопки, расположенными в верхней части таблицы.

После заполнения таблицы и нажатия кнопки » в правой части страницы отображается (возможно, с небольшой задержкой) результат поиска: число кластеров, удовлетворяющих запросу, и список их идентификаторов либо сообщение об отсутствии подходящих кластеров. Каждый идентификатор является ссылкой, при нажатии на которую в отдельном окне отображается список белков, составляющих кластер. Ссылки, расположенные в первых трёх столбцах таблицы с белками, позволяют быстро перейти к информации о соответствующих последовательностях (белках, транскриптах и генах) на сайте Ensembl.

Поиск кластера по идентификатору последовательности

Для поиска кластера, содержащего заданный белок, трансркипт или ген, используется страница ID lookup. Для этого требуется поместить в соответствующее поле ввода идентификатор искомого белка, транскрипта или гена в базе данных Ensembl и отправить запрос, нажав кнопку » рядом с соответствующим полем ввода (или клавишу Enter). Например, для поиска гена and3 рыбы Danio rerio можно ввести в поле “Ensemble Protein ID” идентификатор ENSDARP00000073905, или ввести в поле “Ensemble Transcript ID” идентификатор ENSDART00000079449, или ввести в поле “Ensemble Gene ID” идентификатор ENSDARG00000056873). Во всех трёх случаях будет найден кластер and3.

Если искомый объект входит в кластеризацию, отображается (возможно, с небольшой задержкой) страница соответствующего кластера (см. выше). Иначе — выдаётся сообщение “Nothing found” и пользователю предоставляется возможность повторить запрос. Следует учитывать, что по техническим причинам (см. ниже) из текущей версии базы данных исключены тривиальные кластеры, так что ответ “Nothing found” может означать, что указанный объект образует синглетон или входит в кластер, полностью состоящий из белков одного организма.

Замечание о производительности

В данный момент в связи с аппаратными ограничениями из базы данных удалены белки, кластеры которых не содержат белков из других организмов. Это позволяет снизить нагрузку на сервер и сократить ожидание выполнения запросов, не накладывая существенных ограничений на функциональность. Однако скорость оставляет желать лучшего. Мы надеемся исправить ситуацию за счёт дальнейшей оптимизации програмного обеспечения, а также планируемого в скором времени обновления аппаратной части сервера.

© 2014-2015 Lab.No6, IITP RAS