Lab.6 IITP RAS logo
28/03/24
22:45:14

Лаборатория математических методов и моделей в биоинформатике
Института проблем передачи информации им. А.А. Харкевича
Российской академии наук

« back

Список генов, приобретенных четвероногими

В рамках проекта «Поиск генов, играющих важную роль в развитии мозга и регенерации придатков тела» оригинальной программой lossgainRSL были выявлены следующие 52 гена лягушки, которые, возможно, есть у рептилий, птиц и млекопитающих, но отсутствуют у рыб, включая миногу, и оболочников.

Xenopus Gene ID Gene Name Description
ENSXETG00000000132 rpl28 ribosomal protein L28
ENSXETG00000001468 qrfp pyroglutamylated RFamide peptide
ENSXETG00000001727 fam105a family with sequence similarity 105, member A
ENSXETG00000002504 ltb lymphotoxin beta (TNF superfamily, member 3)
ENSXETG00000002605 bglap bone gamma-carboxyglutamate (gla) protein
ENSXETG00000004490 XB-GENE-986527 Putative ortholog of cCA2 protein, 1 of 2
ENSXETG00000004680 tigd5 tigger transposable element derived 5
ENSXETG00000004698 hsdl1 hydroxysteroid dehydrogenase like 1
ENSXETG00000005478 c11orf48 chromosome 11 open reading frame 48
ENSXETG00000005639
ENSXETG00000007073 ccdc82 coiled-coil domain containing 82
ENSXETG00000007355 c20orf186 chromosome 20 open reading frame 186
ENSXETG00000007923 dnase2 deoxyribonuclease II, lysosomal
ENSXETG00000010463 nuf2 NUF2, NDC80 kinetochore complex component, homolog
ENSXETG00000012323 hmgn2 high mobility group nucleosomal binding domain 2
ENSXETG00000014817 cmahp cytidine monophospho-N-acetylneuraminic acid hydroxylase, pseudogene
ENSXETG00000015714 nme6 non-metastatic cells 6, protein expressed in (nucleoside-diphosphate kinase)
ENSXETG00000016245 c12orf59 chromosome 12 open reading frame 59
ENSXETG00000016850 prnp prion protein
ENSXETG00000017292 teddm1 transmembrane epididymal protein 1
ENSXETG00000017934 hsd17b11 hydroxysteroid (17-beta) dehydrogenase 11
ENSXETG00000019079 lgals9b lectin, galactoside-binding, soluble, 9B
ENSXETG00000019153 arc activity-regulated cytoskeleton-associated protein
ENSXETG00000020235 stra8 stimulated by retinoic acid gene 8 homolog
ENSXETG00000020472 pacrgl PARK2 co-regulated-like
ENSXETG00000021991 prl.1 prolactin, gene 1
ENSXETG00000022441 ttc19 tetratricopeptide repeat domain 19
ENSXETG00000023012 rcsd1 RCSD domain containing 1
ENSXETG00000025074 asf1a ASF1 anti-silencing function 1 homolog A
ENSXETG00000025286 bola3 bolA homolog 3
ENSXETG00000025424 ALS2CR19
ENSXETG00000025857 chst9 carbohydrate (N-acetylgalactosamine 4-0) sulfotransferase 9
ENSXETG00000026715 spef1 sperm flagellar 1
ENSXETG00000027360 XB-GENE-5788061 hypothetical LOC495228
ENSXETG00000027419 a4galt alpha 1,4-galactosyltransferase
ENSXETG00000027477
ENSXETG00000029949
ENSXETG00000030290 NPSR1 neuropeptide S receptor 1
ENSXETG00000030397 ERI3 ERI1 exoribonuclease family member 3
ENSXETG00000030739
ENSXETG00000030940 IL22
ENSXETG00000031063 OR11L1 olfactory receptor, family 11, subfamily L, member 1
ENSXETG00000031314 SFTPC
ENSXETG00000031504 NEIL2
ENSXETG00000031516 CD14 CD14 molecule
ENSXETG00000032041 trem2 triggering receptor expressed on myeloid cells 2
ENSXETG00000032124 enam enamelin
ENSXETG00000032367 CMTM5 CKLF-like MARVEL transmembrane domain containing 5
ENSXETG00000032544 apoa5 apolipoprotein A5
ENSXETG00000033297
ENSXETG00000033448 MGC145290
ENSXETG00000033484

Более подробные сведения о найденных генах содержатся в следующей таблице Microsoft Excel (некоторые браузеры позволяют просматривать её только в режиме “загрузить”): Таблица Microsoft Excel.

На 1м листе (Genes) указаны координаты и аннотации генов лягушки вместе с их гомологами у рептилий, птиц и млекопитающих (считая гомологом найденный для первого же организма BLAST BBH).
На последующих листах указаны тройки находящихся в синтении генов лягушки и других организмов:
- на 2м листе (BLAST BBH) гомологи определяются по наилучшему отклику BLAST при поиске в обе стороны,
- на 3м листе (ENS Orthologs) гомологи определяются как ортологичные гены согласно БД ENSEMBL,
- на 4м листе (Protein Clusters) гомологи определяются по оригинальному алгоритму кластеризации белков.
В первой строке каждой тройки стоит найденный ген лягушки (из списка на листе Genes) или его гомолог у другого организма, в следующих строках - два гена-свидетеля, расположенные не далее 2 мегабаз от первого гена, далее следует пустая строка - разделитель. « back