Lab.6 IITP RAS logo
06/10/24
12:36:27

Лаборатория математических методов и моделей в биоинформатике
Института проблем передачи информации им. А.А. Харкевича
Российской академии наук

« back

Список генов рыб, лягушки и рептилий, утраченных птицами и млекопитающими

В рамках проекта «Поиск генов, играющих важную роль в развитии мозга и регенерации придатков тела» оригинальной программой lossgainRSL были выявлены следующие 96 генов лягушки, которые есть у рыб и, возможно, рептилий, но утрачены птицами и млекопитающими.

Xenopus Gene ID Gene Name Description
ENSXETG00000000291 xgb x globin
ENSXETG00000000295 XB-GENE-5872932 hypothetical protein MGC147475
ENSXETG00000000409 XB-GENE-956264 Putative ortholog of calcium/calmodulin-dependent protein kinase type I (EC 2.7.1.123) (CaM kinase I), 2 of 2
ENSXETG00000001082 mras muscle RAS oncogene homolog
ENSXETG00000001642
ENSXETG00000002864
ENSXETG00000003266 vwc2l.2 von Willebrand factor C domain-containing protein 2-like, gene 2
ENSXETG00000003689 XB-GENE-5796437 microsomal glutathione S-transferase 3-like
ENSXETG00000004229
ENSXETG00000004452
ENSXETG00000004496
ENSXETG00000004596 gprc5c G protein-coupled receptor, family C, group 5, member C
ENSXETG00000005844
ENSXETG00000006007
ENSXETG00000006008 XB-GENE-5727893 novel protein similar to prothymosin, alpha
ENSXETG00000006031 XB-GENE-5969543 undefined
ENSXETG00000006215 XB-GENE-5871034 MGC81025 protein
ENSXETG00000006226 gli1.2 GLI family zinc finger 1, gene 2
ENSXETG00000006330 XB-GENE-5838994 hypothetical protein LOC446281
ENSXETG00000006651 XB-GENE-5959487 Novel protein containing Rieske [2Fe-2S] domain and Protein of unknown function (DUF455) domains
ENSXETG00000006876 des.2 desmin, gene 2
ENSXETG00000007086
ENSXETG00000007319 c20orf3 chromosome 20 open reading frame 3
ENSXETG00000007321
ENSXETG00000008017 vim.2 vimentin, gene 2
ENSXETG00000008516 nif low molecular weight neuronal intermediate filament
ENSXETG00000008911 onecut1.2 one cut homeobox 1, gene 2
ENSXETG00000009053
ENSXETG00000009450
ENSXETG00000009881 XB-GENE-5749128 hypothetical protein LOC100145002
ENSXETG00000011982 kcnk7 potassium channel, subfamily K, member 7
ENSXETG00000012036 coq10b coenzyme Q10 homolog B
ENSXETG00000012456 XB-GENE-5829847 hypothetical protein MGC115632
ENSXETG00000012928 dnase1 deoxyribonuclease I
ENSXETG00000013076
ENSXETG00000013385 XB-GENE-5780652 hypothetical protein LOC100145110
ENSXETG00000013972
ENSXETG00000014798
ENSXETG00000014908 XB-GENE-5816430 undefined
ENSXETG00000015105
ENSXETG00000015157 ggh.2 gamma-glutamyl hydrolase (conjugase, folylpolygammaglutamyl hydrolase)
ENSXETG00000016048 foxo1 forkhead box O1
ENSXETG00000016174
ENSXETG00000017451 cat2 calcium transporter 2
ENSXETG00000017638
ENSXETG00000017674 dnz1 DNZDHHC/NEW1 zinc finger protein 11
ENSXETG00000018081 prc1.2 protein regulator of cytokinesis 1, gene 2
ENSXETG00000018263
ENSXETG00000018432 bapx bagpipe homeobox
ENSXETG00000018597 aldh3b1 aldehyde dehydrogenase 3 family, member B1
ENSXETG00000018648
ENSXETG00000019451
ENSXETG00000023254 zfp36l2.2 zinc finger protein 36, C3H type-like 2, gene 2
ENSXETG00000023255 zfp36l2.1 zinc finger protein 36, C3H type-like 2, gene 1
ENSXETG00000023522
ENSXETG00000023671 XB-GENE-5901104 ccdc3 protein
ENSXETG00000023747 XB-GENE-5813855 putative transient receptor potential channel
ENSXETG00000023966 sfrpx secreted frizzled-related protein
ENSXETG00000024508
ENSXETG00000024633
ENSXETG00000024634 XB-GENE-941700 Putative ortholog of peroxisomal 3,2-trans-enoyl-CoA isomerase (EC 5.3.3.8) (Dodecenoyl-CoA delta-isomerase) (D3,D2-enoyl-CoA isomerase), 1 of 2
ENSXETG00000024707 p2ry8 purinergic receptor P2Y, G-protein coupled, 8
ENSXETG00000024834 kti12 KTI12 homolog, chromatin associated
ENSXETG00000025171
ENSXETG00000025181 hoxc3 homeobox C3
ENSXETG00000025468 XB-GENE-5936142 hypothetical protein MGC75760
ENSXETG00000025579 XB-GENE-5817985 green rod opsin
ENSXETG00000026169 XB-GENE-5904605 hypothetical protein LOC100124841
ENSXETG00000026258
ENSXETG00000026362 XB-GENE-5902318 MGC81843 protein
ENSXETG00000026414 XB-GENE-1017156 novel protein containing four WD domain, G-beta repeats
ENSXETG00000027637 olig4 oligodendrocyte transcription factor 4
ENSXETG00000027673
ENSXETG00000027743 XB-GENE-5727065 hypothetical protein LOC100145161
ENSXETG00000030112
ENSXETG00000030129
ENSXETG00000030590
ENSXETG00000030651
ENSXETG00000030844
ENSXETG00000031372
ENSXETG00000031554
ENSXETG00000031627
ENSXETG00000032002
ENSXETG00000032515
ENSXETG00000032693
ENSXETG00000032741
ENSXETG00000032892 AWAT1
ENSXETG00000032923
ENSXETG00000033120
ENSXETG00000033176
ENSXETG00000033378
ENSXETG00000033543
ENSXETG00000033873
ENSXETG00000033929 MFSD8 major facilitator superfamily domain containing 8
ENSXETG00000033992
ENSXETG00000034219

Более подробные сведения о найденных генах содержатся в следующей таблице Microsoft Excel (некоторые браузеры позволяют просматривать её только в режиме “загрузить”): Таблица Microsoft Excel.

На 1м листе (Genes) указаны координаты и аннотации генов лягушки вместе с их гомологами у рыб и рептилий (считая гомологом найденный у первого же организма BLAST BBH).
На последующих листах указаны тройки находящихся в синтении генов лягушки и их гомологов у рыб и рептилий:
- на 2м листе (BLAST BBH) гомологи определяются по наилучшему отклику BLAST при поиске в обе стороны,
- на 3м листе (ENS Orthologs) гомологи определяются как ортологичные гены согласно БД ENSEMBL,
- на 4м листе (Protein Clusters) гомологи определяются по оригинальному алгоритму кластеризации белков.
В первой строке каждой тройки стоит найденный ген лягушки (из списка на листе Genes) или его гомолог у другого организма, в следующих строках - два гена-свидетеля, расположенные не далее 2 мегабаз от первого гена, далее следует пустая строка - разделитель. « back