; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0018190 (gene) of Snake gourd v1 genome

Gene IDTan0018190
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionProtein of unknown function (DUF1997)
Genome locationLG11:7591695..7594780
RNA-Seq ExpressionTan0018190
SyntenyTan0018190
Gene Ontology termsNA
InterPro domainsIPR018971 - Protein of unknown function DUF1997


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6578788.1 hypothetical protein SDJN03_23236, partial [Cucurbita argyrosperma subsp. sororia]3.1e-11592.05Show/hide
Query:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVI-TSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF
        MALS CSPTS SL  +SPRTSF +TRRPFVI  SSADDS RPSLRISANSNPKA FVARRSESVTVRQL+RPLNEYMSLPASQYSVLDAERIER+DD TF
Subjt:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVI-TSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDV+RG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGT
        GTQVLEQILK+MLPRFT QLVKDYQAWASGDTSRQPLGT
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGT

XP_022939661.1 uncharacterized protein LOC111445487 isoform X1 [Cucurbita moschata]1.4e-11592.47Show/hide
Query:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVI-TSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF
        MALS CSPTS SL  +SPRTSF +TRRPFVI  SSADDS RPSLRISANSNPKA FVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIER+DD TF
Subjt:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVI-TSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDV+RG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGT
        GTQVLEQILK+MLPRFT QLVKDYQAWASGDTSRQPLGT
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGT

XP_022939662.1 uncharacterized protein LOC111445487 isoform X2 [Cucurbita moschata]1.9e-11792.56Show/hide
Query:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVI-TSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF
        MALS CSPTS SL  +SPRTSF +TRRPFVI  SSADDS RPSLRISANSNPKA FVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIER+DD TF
Subjt:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVI-TSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDV+RG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGEI
        GTQVLEQILK+MLPRFT QLVKDYQAWASGDTSRQPLGTGEI
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGEI

XP_022992978.1 uncharacterized protein LOC111489142 isoform X2 [Cucurbita maxima]9.6e-11791.74Show/hide
Query:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVI-TSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF
        MALS CSPTS SL  +SPR SF +TRRPFVI  SSADDS RPSLRISANSNPKA FVARRSES+TVRQLARPLNEYMSLPASQYSVLDAERIER+DD TF
Subjt:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVI-TSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDV+RG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGEI
        GTQVLEQILK+MLPRFT QLVKDYQAWASGDTSRQPLGTGEI
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGEI

XP_038883978.1 uncharacterized protein SYNPCC7002_A1590 isoform X1 [Benincasa hispida]2.3e-11891.32Show/hide
Query:  MALSFCSPTSTSLPCKSPRTSFPLTRRPF-VITSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF
        MALS CSP+S SL CK+PRT F LT RPF ++ SSADDS RPSLRIS NSNPKA F+ARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF
Subjt:  MALSFCSPTSTSLPCKSPRTSFPLTRRPF-VITSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDV+RGNSPLQKLTS+TVIEVNIEIPFAFRAIP+QAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGEI
        GTQVLEQILK+MLPRFT QLVKDYQAWASGDTSRQPLGTGEI
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGEI

TrEMBL top hitse value%identityAlignment
A0A6J1BWG8 uncharacterized protein LOC1110063209.1e-11388.8Show/hide
Query:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVITSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTFR
        MALS CSP S  LP K+PR       RP+V+ SSADDS+RP LR SANSNPKA F+ARRSES TVRQLARPLNEYMSLPASQYSVLDAERIERVDD TFR
Subjt:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVITSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTFR

Query:  CYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAG
        CYVYRFKFFAFEVCPVLIVRVE QPNGCCIKLLSCKLEGSPIV AQNDKFDAYMVNQISYDV+RGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAG
Subjt:  CYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAG

Query:  TQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGEI
        TQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTG+I
Subjt:  TQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGEI

A0A6J1FGJ8 uncharacterized protein LOC111445487 isoform X16.7e-11692.47Show/hide
Query:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVI-TSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF
        MALS CSPTS SL  +SPRTSF +TRRPFVI  SSADDS RPSLRISANSNPKA FVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIER+DD TF
Subjt:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVI-TSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDV+RG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGT
        GTQVLEQILK+MLPRFT QLVKDYQAWASGDTSRQPLGT
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGT

A0A6J1FHF9 uncharacterized protein LOC111445487 isoform X29.4e-11892.56Show/hide
Query:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVI-TSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF
        MALS CSPTS SL  +SPRTSF +TRRPFVI  SSADDS RPSLRISANSNPKA FVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIER+DD TF
Subjt:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVI-TSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDV+RG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGEI
        GTQVLEQILK+MLPRFT QLVKDYQAWASGDTSRQPLGTGEI
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGEI

A0A6J1JRG4 uncharacterized protein LOC111489142 isoform X13.3e-11591.63Show/hide
Query:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVI-TSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF
        MALS CSPTS SL  +SPR SF +TRRPFVI  SSADDS RPSLRISANSNPKA FVARRSES+TVRQLARPLNEYMSLPASQYSVLDAERIER+DD TF
Subjt:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVI-TSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDV+RG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGT
        GTQVLEQILK+MLPRFT QLVKDYQAWASGDTSRQPLGT
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGT

A0A6J1K0U6 uncharacterized protein LOC111489142 isoform X24.7e-11791.74Show/hide
Query:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVI-TSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF
        MALS CSPTS SL  +SPR SF +TRRPFVI  SSADDS RPSLRISANSNPKA FVARRSES+TVRQLARPLNEYMSLPASQYSVLDAERIER+DD TF
Subjt:  MALSFCSPTSTSLPCKSPRTSFPLTRRPFVI-TSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDNTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDV+RG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGEI
        GTQVLEQILK+MLPRFT QLVKDYQAWASGDTSRQPLGTGEI
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGEI

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT4G31115.1 Protein of unknown function (DUF1997)1.1e-2029.79Show/hide
Query:  NSNPKAHFVARRSESVTVR---QLARPLNEYMSLPASQYSVLDAERIERV-----DDNTFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEG
        +S  KA+  A R + + +    +     +E++  P+   +V++A+ ++        D+T+RC + + +  +FEV PVL++RV      C ++LLSCKLEG
Subjt:  NSNPKAHFVARRSESVTVR---QLARPLNEYMSLPASQYSVLDAERIERV-----DDNTFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEG

Query:  SPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPF-AFRAIPVQAIESAGTQVLEQILKIMLPRFTTQLVKDYQAW
        S ++  Q+++F A M N ++++++    P   L  D  + V +EI    F  +PV A+E+ G  V++ ++  ++P    QL+KDY  W
Subjt:  SPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPF-AFRAIPVQAIESAGTQVLEQILKIMLPRFTTQLVKDYQAW

AT4G31115.2 Protein of unknown function (DUF1997)1.1e-2029.79Show/hide
Query:  NSNPKAHFVARRSESVTVR---QLARPLNEYMSLPASQYSVLDAERIERV-----DDNTFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEG
        +S  KA+  A R + + +    +     +E++  P+   +V++A+ ++        D+T+RC + + +  +FEV PVL++RV      C ++LLSCKLEG
Subjt:  NSNPKAHFVARRSESVTVR---QLARPLNEYMSLPASQYSVLDAERIERV-----DDNTFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEG

Query:  SPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPF-AFRAIPVQAIESAGTQVLEQILKIMLPRFTTQLVKDYQAW
        S ++  Q+++F A M N ++++++    P   L  D  + V +EI    F  +PV A+E+ G  V++ ++  ++P    QL+KDY  W
Subjt:  SPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPF-AFRAIPVQAIESAGTQVLEQILKIMLPRFTTQLVKDYQAW

AT5G04440.1 Protein of unknown function (DUF1997)1.5e-8867.86Show/hide
Query:  LMALSFCSPTSTSLPCKSPRTSFPLTRRPFVITSSADDSTRPS----------LRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAE
        L +LSF +  +   P ++P  SF +T      +SS D+S +PS          +R+S++S PKA F+AR+ +SV+VRQL RPL EYMSLPASQYSVLDAE
Subjt:  LMALSFCSPTSTSLPCKSPRTSFPLTRRPFVITSSADDSTRPS----------LRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQYSVLDAE

Query:  RIERVDDNTFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFR
        RIERVDDNTFRCYVY FKFF FEVCPVL+VRVE QPNGCCIKLLSCKLEGSP+VVAQNDKFDA MVN++S D  +  S  Q++TSD VIEVNIEIPFAFR
Subjt:  RIERVDDNTFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFR

Query:  AIPVQAIESAGTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGEI
          PV AIE+ GTQVL+QILK+MLPRF +QL KDY AWASGDTSRQPLGTGEI
Subjt:  AIPVQAIESAGTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGEI


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGCTTCTTACTTCCTTCACCGAAAGCCTAAAAACTCAATATCCTTTCCAATTCCTCTCTGCAAAATCTTCAAACGCGTTAATGGCGTTGAGTTTTTGCTCTCCGACCTC
CACTTCACTTCCCTGCAAAAGCCCCAGAACTTCTTTTCCTCTCACCCGCAGACCATTCGTTATCACTTCATCTGCCGACGATTCTACCAGGCCTTCGCTTCGCATCTCCG
CGAATTCGAATCCAAAAGCGCACTTCGTTGCCCGGAGGAGCGAGTCCGTCACGGTTCGGCAGCTGGCGCGGCCTCTAAATGAGTATATGAGTTTGCCGGCGAGTCAGTAC
TCGGTGTTGGATGCGGAGAGGATTGAGCGGGTTGATGATAACACTTTTAGGTGCTATGTTTATAGATTTAAGTTCTTTGCTTTTGAGGTTTGCCCTGTTTTGATTGTTAG
AGTTGAAGTGCAGCCTAATGGGTGTTGCATCAAGCTGCTGTCGTGTAAGCTTGAGGGCTCGCCAATCGTGGTTGCACAGAATGATAAATTCGACGCTTATATGGTGAACC
AGATTTCTTACGATGTCGATCGAGGCAACTCACCCTTGCAGAAACTCACATCGGATACTGTCATTGAGGTTAACATTGAGATTCCTTTCGCCTTCCGCGCAATTCCTGTA
CAAGCAATCGAGTCAGCTGGGACCCAAGTCCTCGAACAAATATTGAAGATTATGCTTCCCCGCTTCACCACCCAGCTTGTGAAGGACTATCAAGCATGGGCCTCCGGTGA
TACATCAAGGCAACCTCTTGGGACAGGTGAGATCTGA
mRNA sequenceShow/hide mRNA sequence
ATTGTCTTATCCATCTCTCACAGCCCCTCTTGGCTAATGCTTCTTACTTCCTTCACCGAAAGCCTAAAAACTCAATATCCTTTCCAATTCCTCTCTGCAAAATCTTCAAA
CGCGTTAATGGCGTTGAGTTTTTGCTCTCCGACCTCCACTTCACTTCCCTGCAAAAGCCCCAGAACTTCTTTTCCTCTCACCCGCAGACCATTCGTTATCACTTCATCTG
CCGACGATTCTACCAGGCCTTCGCTTCGCATCTCCGCGAATTCGAATCCAAAAGCGCACTTCGTTGCCCGGAGGAGCGAGTCCGTCACGGTTCGGCAGCTGGCGCGGCCT
CTAAATGAGTATATGAGTTTGCCGGCGAGTCAGTACTCGGTGTTGGATGCGGAGAGGATTGAGCGGGTTGATGATAACACTTTTAGGTGCTATGTTTATAGATTTAAGTT
CTTTGCTTTTGAGGTTTGCCCTGTTTTGATTGTTAGAGTTGAAGTGCAGCCTAATGGGTGTTGCATCAAGCTGCTGTCGTGTAAGCTTGAGGGCTCGCCAATCGTGGTTG
CACAGAATGATAAATTCGACGCTTATATGGTGAACCAGATTTCTTACGATGTCGATCGAGGCAACTCACCCTTGCAGAAACTCACATCGGATACTGTCATTGAGGTTAAC
ATTGAGATTCCTTTCGCCTTCCGCGCAATTCCTGTACAAGCAATCGAGTCAGCTGGGACCCAAGTCCTCGAACAAATATTGAAGATTATGCTTCCCCGCTTCACCACCCA
GCTTGTGAAGGACTATCAAGCATGGGCCTCCGGTGATACATCAAGGCAACCTCTTGGGACAGGTGAGATCTGAGATTTGTATCTAAAAACTACGCCTCGATGTCGGTCTC
GAAGTCTTCTATTACCTTTGGCCTTTGGCATTTTCATACGACTCTAGAAGCTGCAAGAATTTGTGTACTTGGAGTCTAGGACCACTCTTTTAGGCTGTTTATGATCTTGT
TTGCCAAGCCAAACATATTCTTCACTAGGGCATTAGTAAAATTTTGGTTTTAGCAGGTTGAGTGAGTACATGTGAATTTCCTTAAGGTATTTTTTTTTTTTTTTTTGGAT
AATCGGGGTCGGAGCTTAAATTTCCTTAAGGTATTCTAGTGAAAGTATAGTTCATGCATGTCATTTGAACTCCATTTTGTAGTCAATTAAGAATGTTGGATTTATTGCGT
AAATGATAATGTTGTTTATGTAATATGGCATTTTGTATCTAATGTATGATTGATTGATTTTATTTTGAATAAATTAAAACTTATTAGGG
Protein sequenceShow/hide protein sequence
MLLTSFTESLKTQYPFQFLSAKSSNALMALSFCSPTSTSLPCKSPRTSFPLTRRPFVITSSADDSTRPSLRISANSNPKAHFVARRSESVTVRQLARPLNEYMSLPASQY
SVLDAERIERVDDNTFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVDRGNSPLQKLTSDTVIEVNIEIPFAFRAIPV
QAIESAGTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGEI