Lab.6 IITP RAS logo
19/03/24
07:21:44

Лаборатория математических методов и моделей в биоинформатике
Института проблем передачи информации им. А.А. Харкевича
Российской академии наук

« back

Программа поиска белка с филогенетическим профилем, наиболее соответствующим профилю пары заданных списков геномов

Программа «Protfile» предназначена для поиска белков по заданному филогенетическому профилю, который определяется по двум заданным спискам геномов. Алгоритм определяет белок, наиболее соответствующий этим спискам, т.е. белок, гомологи которого присутствуют во всех геномах из первого списка («плюс-список»), но в тоже время лучший гомолог в каждом геноме из второго списка («минус-список») имеет меньшее сходство с данным белком, чем лучший гомолог из любого генома, принадлежащего первому списку. Точнее, алгоритм ищет несколько лучших («субоптимальных») белков, удовлетворяющих этому условию. На практике так могут искаться регуляторные белки по их потенциальным сайтам связывания с ДНК или РНК, когда плюс-список состоит из геномов, содержащих хотя бы один регуляторный сайт рассматриваемого типа, а минус-список состоит из геномов, не содержащих такого сайта. Другим примером является применение этого алгоритма для поиска белков, кодирующих характерные признаки организма (наличие/отсутствие жгутика или фотосистем и т.д.).

Детальное описание программы дано в её документации. Программа реализована в виде CLI-скрипта на языке PHP с бинарным вычислительным ядром, скомпилированным для 32-битной среды Windows. Исходный код допускает сборку в операционных системах симейства UNIX/Linux.

« back