Найденные ВКЭ для 11 видов при различных значениях параметров D и l

Число D допустимых делеций на участке из ВКЭ 0 1 3
Минимально допустимая длина l участка из ВКЭ 60 65 70 75 80 60 65 70 75 80 60 65 70 75 80
Общее число найденных ВКЭ, 2196 1864 1526 1174 911 2245 1883 1535 1183 919 2254 1885 1538 1187 920
  в том числе, представленных в:
   - 11 видах 54 53 38 30 23 54 51 38 29 22 55 51 38 29 23
   - 10 видах 43 52 49 38 39 41 48 50 40 39 42 50 50 41 38
   - 9 видах 43 42 44 37 26 38 41 40 37 29 38 41 42 37 30
   - 8 видах 61 56 51 45 39 66 59 52 47 37 67 59 52 46 37
   - 7 видах 96 84 69 53 41 102 88 72 51 41 101 88 73 52 42
   - 6 видах 125 103 97 76 56 131 109 98 76 57 130 109 97 78 56
   - 5 видах 159 157 119 102 86 166 158 119 101 85 168 160 121 102 86
   - 4 видах 333 278 240 185 139 335 287 250 192 144 333 285 248 191 142
   - 3 видах 1282 1039 819 608 462 1312 1042 816 610 465 1320 1042 817 611 466
   - некодирующих областях геномов 50 27 10 9 4 51 25 10 8 8 50 23 10 8 6
(*) Ссылка на множество ВКЭ s0.60 s0.65 s0.70 s0.75 s0.80 s1.60 s1.65 s1.70 s1.75 s1.80 s3.60 s3.65 s3.70 s3.75 s3.80
(**) Ссылка на соответствующее дерево ВКЭ t0.60 t0.65 t0.70 t0.75 t0.80 t1.60 t1.65 t1.70 t1.75 t1.80 t3.60 t3.65 t3.70 t3.75 t3.80

Строка (*) таблицы содержит ссылки на электронные таблицы Excel, каждая из которых представляет одно подмножество ВКЭ, соответствующее данным D и l. Строка (**) содержит ссылки на деревья ВКЭ, соответствующие множествам ВКЭ из строки (*).

Каждая таблица Excel, которая вызывается по ссылке из строки (*), состоит из двух листов. Первый лист Summary в каждой строке описывает один ВКЭ: в столбце A – номер ВКЭ (нумерация допускает пропуски), в столбце B – суммарное число участков, составляющих данный ВКЭ; в столбце C – общее число геномов, в которых представлен данный ВКЭ. В столбцах D–N – число участков в геноме, указанном в заголовке столбца. В P–R – сведения о типе участков по аннотациям Генбанка: в P – сколько из них лежит в области гена, в Q – сколько из них пересекаются с экзонами, в R – сколько из них пересекаются с РНК (тРНК, мяРНК и др.).

Второй лист Details для каждого ВКЭ содержит строку, играющую роль заголовка, и далее по одной строке для каждого участка из этого ВКЭ. Число участков указано в заголовке (в столбце B). Для каждого участка указаны (слева направо по столбцам): A – номер ВКЭ; B – имя вида; C – идентификатор хромосомы (контига), содержащего участок; D – позиция его начала; E – его длина; F – указатель цепи ДНК; G – сам участок. Следующие колонки заполнены, если участок пересекается с аннотированной областью генома, и содержат: H – идентификатор гена; I – позицию начала гена; J – позицию конца гена; K – указатель цепи ДНК; L – описание гена; M – идентификатор транслируемого участка ДНК (CDS); N – позицию начала CDS; O – позицию конца CDS; P – указатель цепи; Q – описание CDS; R – идентификатор РНК; S – позицию начала РНК; T – позицию конца РНК; U – указатель цепи; V – описание РНК.

Для удобства работы с этими таблицами Excel два указанных листа связаны с помощью макроса. Чтобы эта функциональность действовала, при открытии загруженного с данной страницы файла необходимо разрешить использование макрокоманд. Выбрав на листе Summary интересующий ВКЭ, нужно отселектировать его номер в столбце А и нажать комбинацию клавиш Ctrl-M. Тогда автоматически откроется лист Details, на котором с помощью фильтра будут выбраны строки, относящиеся к данному ВКЭ. Для выбора другого ВКЭ надо вручную перейти к листу Summary, выбрать номер нового ВКЭ в столбце A и снова нажать Ctrl-M, и т.д. Этим способом можно выбрать только один ВКЭ; более сложный выбор осуществляется стандартными средствами Excel непосредственно на листе Details.

Имена видов указаны в таблицах сокращённо (только род). Ниже для каждого вида приведено его полное наименование и код генома в ГенБанке.

Homo sapiens GCF_000001405.37
Drosophila melanogaster GCF_000001215.4
Helobdella robusta GCF_000326865.1
Schistosoma mansoni GCF_000237925.1
Nematostella vectensis GCF_000209225.1
Mnemiopsis leidyi GCA_000226015.1
Trichoplax adhaerens GCF_000150275.1
Amphimedon queenslandica GCF_000090795.1
Capsaspora owczarzaki GCF_000151315.2
Monosiga brevicollis GCF_000002865.3
Salpingoeca rosetta GCF_000188695.1