05/02/25
09:45:59 Лаборатория математических методов и моделей в биоинформатике
|
|||||||||||||||||||||||||||||||||
Русский :: English
|
« back
Поиск высококонсервативных элементов (ВКЭ) в наборе геномовКомплекс параллельных программ iHCE реализует метод, описанный нами в [1]. Он предназначен для поиска ВКЭ в наборе относительно хорошо собранных полных геномов. Программы прошли предварительную проверку на ядерных геномах надтипа Alveolata [1], а также митохондриальных геномах инфузорий (тип Ciliophora) [2] и однодольных растений. Комплекс включает в себя следующие программы для суперкомпьютера с MPI:
Эти программы предполагают обработку больших данных и рассчитаны исключительно на 64-битные процессоры и операционные системы. Разные этапы алгоритма требуют различной вычислительной мощности и масштабируются с разной эффективностью, поэтому комплекс реализован в виде нескольких отдельных программ. Для уменьшения объёмов файлов и ускорения работы программы используют специфические форматы входных и промежуточных данных с минимумом контроля. Формирование и интерпретация файлов в правильном формате -- обязанность пользователя. Например, пользователь может создать собственную базу данных, где хранятся исходные данные в любом доступном или желаемом формате, и самостоятельно реализовать приложения или скрипты для формирования и чтения файлов в требуемом формате. Мы действовали таким способом, но не будем детально обсуждать этот вопрос. Все программы написаны на С++ и имеют интерфейс командной строки, позволяющий задавать наиболее важные параметры. Значения параметров, указанные в командной строке, имеют наивысший приоритет. Полный набор настраиваемых параметров задаётся в файле конфигурации, который обязателен и используется всеми тремя программами; значения из этого файла применяются, если они не были изменены в командной строке запуска. Если значение не указано ни в командной строке, ни в файле конфигурации, то используется зафиксированное в программе значение по умолчанию (что предусмотрено не для всех параметров). Образцы файла конфигурации есть в примерах для загрузки ниже. Краткая справка по командной строке выдаётся при запуске программы с параметром -? или --help. Исполняемые модули для Windows 64 бит (варианты с MPI и без) и исходные коды для Linux можно загрузить по ссылкам ниже. Исходный код совместим с любой реализацией стандарта MPI версий 1.2 и выше. Он предоставляется бесплатно на условиях лицензии GNU General Public License (GPL) версии 3. Файлы для загрузки
Литература[1] L.I. Rubanov, A.V. Seliverstov, O.A. Zverkov and V.A. Lyubetsky. Method for identification of highly conserved elements and evolutionary analysis of superphylum Alveolata. (2016) BMC Bioinformatics 17:385. Open Access [2] Применение нашего метода поиска ВКЭ для исследования эволюции хромосомной структуры митохондриального генома простейших типа Ciliophora. « back |