C16orf58 | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Identifikatori | |||||||||||||||||||||||||
Aliasi | RUSF1 | ||||||||||||||||||||||||
Vanjski ID-jevi | MGI:2384572HomoloGene:11232GeneCards:RUSF1 | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ortolozi | |||||||||||||||||||||||||
Vrste | Čovjek | Miš | |||||||||||||||||||||||
Entrez | |||||||||||||||||||||||||
Ensembl | |||||||||||||||||||||||||
UniProt | |||||||||||||||||||||||||
RefSeq (mRNK) | |||||||||||||||||||||||||
RefSeq (bjelančevina) | |||||||||||||||||||||||||
Lokacija (UCSC) | Chr 16: 31.49 – 31.51 Mb | Chr 7: 127.87 – 127.9 Mb | |||||||||||||||||||||||
PubMed pretraga | [3] | [4] | |||||||||||||||||||||||
Wikipodaci | |||||||||||||||||||||||||
|
Otvoreni okvir čitanja 58 hromosoma 16 iliC16orf58, znan i kaoFLJ13638, jestprotein koji je kodljudikodirangenomC16orf58.[5] Sam gen dug je 18892 bp, saiRNK od 2760 bp i proteinskom sekvencom od 468aminokiselina. Postoji konzervirani domen nepoznatog sastava, DUF647. Za ovaj gen još nije utvrđena funkcija, ali se predviđa je uendoplazmatskom retikulumu ucitoplazmi.[6]
Struktura
Dužinapolipeptidnog lanca je 468aminokiselina, amolekulska težina 51.018Da[7].
C:Cistein
D:Asparaginska kiselina
E:Glutaminska kiselina
F:Fenilalanin
G:Glicin
H:Histidin
I:Izoleucin
K:Lizin
L:Leucin
M:Metionin
N:Asparagin
P:Prolin
Q:Glutamin
R:Arginin
S:Serin
T:Treonin
V:Valin
W:Triptofan
Y:Tirozin
10 | 20 | 30 | 40 | 50 | ||||
---|---|---|---|---|---|---|---|---|
MADDAGLETP | LCSEQFGSGE | ARGCRAAADG | SLQWEVGGWR | WWGLSRAFTV | ||||
KPEGRDAGEV | GASGAPSPPL | SGLQAVFLPQ | GFPDSVSPDY | LPYQLWDSVQ | ||||
AFASSLSGSL | ATQAVLLGIG | VGNAKATVSA | ATATWLVKDS | TGMLGRIVFA | ||||
WWKGSKLDCN | AKQWRLFADI | LNDVAMFLEI | MAPVYPICFT | MTVSTSNLAK | ||||
CIVSVAGGAT | RAALTVHQAR | RNNMADVSAK | DSSQETLVNL | AGLLVSLLML | ||||
PLVSGCPGFS | LGCFFFLTAL | HIYANYRAVR | ALVMETLNEG | RLRLVLKHYL | ||||
QRGEVLDPTA | ANRMEPLWTG | FWPAPSLSLG | VPLHRLVSSV | FELQQLVEGH | ||||
QESYLLCWDQ | SQNQVQVVLN | QKAGPKTILR | AATHGLMLGA | LQGDGPLPAE | ||||
LEELRNRVRA | GPKKESWVVV | KETHEVLDML | FPKFLKGLQD | AGWKTEKHQL | ||||
EVDEWRATWL | LSPEKKVL |
Iako je dugo bilo poznato da postoji nekoliko lokacija koja će dati predviđanja o strukturi proteina, C16orf58 , tek nedavno određen je njegov gornji aminokiselinski sastav strukturu. Zaključeno je da ima bar jedantransmembranski domen, ako ne i više. Unutar strukture proteina postoji nekoliko proširenih područja s nenabijenim aminokiselinama, što bi mogli biti mogući transmembranski domeni ilihidrofobna jezgra.[6] Sljedeće prikazuje naboj svake od aminokiselina u sekvenci proteina, + za pozitivne, – za negativne i 0 za nenapunjene. Veliki segmenti nenabijenih aminokiselina su podebljani. Ovi dijelovi nenabijenih aminokiselina konzervirani su u prošlosti u udaljeniortolozima.
1 00—000-00 000-00000- 0+00+000-0 0000-0000+ 00000+0000 +0-0+-00-0 610000000000 0000000000 000-0000-0 000000-000 0000000000 0000000000 1210000+00000 0000000+-0 00000+0000 00+00+0-00 0+00+000-0 00-00000-0 1810000000000 000000000+ 0000000000 +00000000+ +0000-000+ -000-00000 2410000000000 0000000000 0000000000 000000+00+ 0000-000-0 +0+000+000 301 0+0-00-000 00+0-00000 0000000000 0000+00000 0-00000-00 0-000000-0 361 0000000000 0+000+000+ 0000000000 000-00000- 0—0+0+0+0 00++-00000 421 +-00-00-00 00+00+000- 000+0-+000 -00-0+0000 000-++00
C16orf58 ima vrlo zanimljivu konzerviranost jer se dalekiortolozi nalaze ubiljkama igljivama. Međutim, nidu pronađeni kodgmizavaca,ptica ilivodozemaca. Sljedeća tabela prikazuje neke, ali ne sve, ortologe koji su pronađeni pomoćuBLAST-a.[8]
Vrsta | Uobičajeni naziv organizma | Pristup baziNCBI | Identitet sekvence (%) | E-vrijednost | Dužina (sminokiselina) | Uobičajeni naziv gena |
Homo sapiens | Čovjek | NP_073581 | 100 | 0,0 | 468 | C16orf58 |
Equus caballus | Konj | XP_001495510 | 85% | 0,0 | 468 | PREDVIĐENO: sličan UPF0420 proteinu C16orf58 |
Canis familiaris | Pas | XP_547054 | 85 | 0,0 | 485 | Sličan CG10338-PA |
Mus musculus | Miš | Q91W34 | 81 | 0,0 | 466 | cDNK sekvenca BC017158 |
Monodelphis domestica | Oposum | XP_001370394 | 65 | 3e−160 | 466 | PREDVIĐENO: hipotetski protein |
Danio rario | Zebrica | NP_001103923 | 53 | 4e−112 | 432 | Hpotetski protein LOC555936 |
Drosophila melanogaster | Vinska mušica | NP_609897 | 40 | 3e−69 | 395 | CG10338 |
Arabidopsis thaliana | Grbaštica | AAF81284 | 37 | 2e−68 | 403 | Sličnan proizvodu gena CG10338Drosophila melanogaster |
Gallus gallus | Kokoš | NP_989823 | 25 | 0,36 | 1434 | Receptorski tip proteina tirozin-fosfataza U |
Xenopus tropicalis | Žaba | AAI22058 | 31 | 34 | 268 | Protein Stk19 |
Saccharomyces cerevisiae | Kvasac | EDZ73379 | 25 | 0,21 | 1578 | YDL140Cp-oliko protein |
Caenorhabditis elegans | Pljosnata glista | NP_502300 | 19 | 3,0 | 414 | Hipotetski protein M18.6 |
Iako je funkcija još uvijek nepoznata, dokazano je daC16orf58 komunicira s tri različita proteina: