; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Carg21224 (gene) of Silver-seed gourd (SMH-JMG-627) v2 genome

Gene IDCarg21224
OrganismCucurbita argyrosperma subsp. argyrosperma cv. SMH-JMG-627 (Silver-seed gourd (SMH-JMG-627) v2)
DescriptionFibrous sheath-interacting protein
Genome locationCarg_Chr18:7701152..7708822
RNA-Seq ExpressionCarg21224
SyntenyCarg21224
Gene Ontology termsNA
InterPro domainsIPR027471 - YbeD-like domain superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7012726.1 hypothetical protein SDJN02_25479 [Cucurbita argyrosperma subsp. argyrosperma]4.0e-101100Show/hide
Query:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE
        MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE
Subjt:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE

Query:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFGKVRHKLSAKGKYVSVNIGPVQVQAVYNAMKRDDRMKYFL
        GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFGKVRHKLSAKGKYVSVNIGPVQVQAVYNAMKRDDRMKYFL
Subjt:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFGKVRHKLSAKGKYVSVNIGPVQVQAVYNAMKRDDRMKYFL

XP_022151740.1 uncharacterized protein LOC111019651 isoform X1 [Momordica charantia]4.6e-8179.34Show/hide
Query:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE
        MAASR VLRSASIFL EP RP HFSRA SSS  LGT RSFTH LNCNV ++RARGFHF +RT LNCS DETQ TSSS+QDGQGPPQEAVLKAISEVSKTE
Subjt:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE

Query:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY
        GRVGHTTNMV+GGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF                  GKVRHKLS+KGKYVSVNIGPV      QVQAVY
Subjt:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY

Query:  NAMKRDDRMKYFL
        NAMKRDDRMKYFL
Subjt:  NAMKRDDRMKYFL

XP_022945039.1 uncharacterized protein LOC111449401 [Cucurbita moschata]4.7e-9487.79Show/hide
Query:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE
        MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTH LNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE
Subjt:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE

Query:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY
        GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGG DF                  GKVRHKLSAKGKYVSVNIGPV      QVQAVY
Subjt:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY

Query:  NAMKRDDRMKYFL
        NAMKRDDRMKYFL
Subjt:  NAMKRDDRMKYFL

XP_022966813.1 uncharacterized protein LOC111466408 [Cucurbita maxima]4.4e-9286.38Show/hide
Query:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE
        MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSF H LNCNVWSSRARGFHFPERT LNCSLD+TQLTSSSDQDGQGPPQEAVLKAISEVSKTE
Subjt:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE

Query:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY
        GRVGHTTNMVLGGTVTDDSTNEWI LDQKVNSYPGVRGFTAIGTGGDDF                  GKVRHKLSAKGKYVSVNIGPV      QVQAVY
Subjt:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY

Query:  NAMKRDDRMKYFL
        NAMKRDDRMKYFL
Subjt:  NAMKRDDRMKYFL

XP_023542309.1 uncharacterized protein LOC111802242 [Cucurbita pepo subsp. pepo]3.8e-9186.38Show/hide
Query:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE
        MAASRAVLRSASIFLTEPSRPFHFSRA SSSF+LGTRRSFTH LNCNVWSSR RGFHFPERT LNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE
Subjt:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE

Query:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY
        GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF                  GKVRHKLSAKGKYVSVNIGPV      QVQAVY
Subjt:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY

Query:  NAMKRDDRMKYFL
        NAMKRDDRMKYFL
Subjt:  NAMKRDDRMKYFL

TrEMBL top hitse value%identityAlignment
A0A6J1DC16 uncharacterized protein LOC111019651 isoform X12.2e-8179.34Show/hide
Query:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE
        MAASR VLRSASIFL EP RP HFSRA SSS  LGT RSFTH LNCNV ++RARGFHF +RT LNCS DETQ TSSS+QDGQGPPQEAVLKAISEVSKTE
Subjt:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE

Query:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY
        GRVGHTTNMV+GGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF                  GKVRHKLS+KGKYVSVNIGPV      QVQAVY
Subjt:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY

Query:  NAMKRDDRMKYFL
        NAMKRDDRMKYFL
Subjt:  NAMKRDDRMKYFL

A0A6J1FZV2 uncharacterized protein LOC1114494012.3e-9487.79Show/hide
Query:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE
        MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTH LNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE
Subjt:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE

Query:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY
        GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGG DF                  GKVRHKLSAKGKYVSVNIGPV      QVQAVY
Subjt:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY

Query:  NAMKRDDRMKYFL
        NAMKRDDRMKYFL
Subjt:  NAMKRDDRMKYFL

A0A6J1GWI1 uncharacterized protein LOC1114582185.1e-7877Show/hide
Query:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE
        MAASR VLRSA+IFLTEPSRP    RA SSSF+LGTRR+FTH L C  W++R RGF FP+RT L CS DETQ TSSS+QD QGPPQEAVLKAISEVSKTE
Subjt:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE

Query:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY
        GRVGHTTNMVLGGTVTDDS+NEWIALDQKVNSYPGVRGFTAIGTGGDDF                  GKVRHKLSAKGKYVSVNIGPV      QVQAVY
Subjt:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY

Query:  NAMKRDDRMKYFL
        NAMKRDDRMKYFL
Subjt:  NAMKRDDRMKYFL

A0A6J1HTC4 uncharacterized protein LOC1114664082.2e-9286.38Show/hide
Query:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE
        MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSF H LNCNVWSSRARGFHFPERT LNCSLD+TQLTSSSDQDGQGPPQEAVLKAISEVSKTE
Subjt:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE

Query:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY
        GRVGHTTNMVLGGTVTDDSTNEWI LDQKVNSYPGVRGFTAIGTGGDDF                  GKVRHKLSAKGKYVSVNIGPV      QVQAVY
Subjt:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY

Query:  NAMKRDDRMKYFL
        NAMKRDDRMKYFL
Subjt:  NAMKRDDRMKYFL

A0A6J1KAN5 uncharacterized protein LOC1114932141.8e-7877.46Show/hide
Query:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE
        MAASR VLRSA+IFLTEPSRP    RA SSSF+LGTRR+FTH L C  W++RARGF FP+RT L CS DETQ TSSS+QD QGPPQEAVLKAISEVSKTE
Subjt:  MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTE

Query:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY
        GRVGHTTNMVLGGTVTDDS+NEWIALDQKVNSYPGVRGFTAIGTGGDDF                  GKVRHKLSAKGKYVSVNIGPV      QVQAVY
Subjt:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVY

Query:  NAMKRDDRMKYFL
        NAMKRDDRMKYFL
Subjt:  NAMKRDDRMKYFL

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G27385.1 unknown protein9.1e-4354.55Show/hide
Query:  SSSSFTLGTRRSF----------THGLNCNVWSSRARGF-HFPER-TGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTEGRVGHTTNMVLGGTV
        S S  T G RR F           HGL     S    GF   PER T LNC        S +DQ  QGPPQEAVLKAISEVSKT+GRVG TTNM++GGTV
Subjt:  SSSSFTLGTRRSF----------THGLNCNVWSSRARGF-HFPER-TGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTEGRVGHTTNMVLGGTV

Query:  TDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVYNAMKRDDRMKYFL
         DDS  +W+ LDQKVN+YP  RGFTAIGTGG+DF                    V+  LS+KGKYVSVNIGP+      QVQAVYNAM+RD+RMKYFL
Subjt:  TDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVYNAMKRDDRMKYFL

AT1G27385.2 unknown protein6.5e-4154.04Show/hide
Query:  SSSSFTLGTRRSF----------THGLNCNVWSSRARGF-HFPER-TGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTEGRVGHTTNMVLGGTV
        S S  T G RR F           HGL     S    GF   PER T LNC        S +DQ  QGPPQEAVLKAIS VSKT+GRVG TTNM++GGTV
Subjt:  SSSSFTLGTRRSF----------THGLNCNVWSSRARGF-HFPER-TGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTEGRVGHTTNMVLGGTV

Query:  TDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVYNAMKRDDRMKYFL
         DDS  +W+ LDQKVN+YP  RGFTAIGTGG+DF                    V+  LS+KGKYVSVNIGP+      QVQAVYNAM+RD+RMKYFL
Subjt:  TDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVYNAMKRDDRMKYFL

AT1G27385.3 unknown protein2.6e-4254.31Show/hide
Query:  SSSSFTLGTRRSF----------THGLNCNVWSSRARGF-HFPER-TGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTEGRVGHTTNMVLGGTV
        S S  T G RR F           HGL     S    GF   PER T LNC        S +DQ  QGPPQEAVLKAISEVSKT+GRVG TTNM++GGTV
Subjt:  SSSSFTLGTRRSF----------THGLNCNVWSSRARGF-HFPER-TGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTEGRVGHTTNMVLGGTV

Query:  TDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVYNAMKRDDRMKYF
         DDS  +W+ LDQKVN+YP  RGFTAIGTGG+DF                    V+  LS+KGKYVSVNIGP+      QVQAVYNAM+RD+RMKYF
Subjt:  TDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVYNAMKRDDRMKYF

AT1G27385.4 unknown protein6.5e-4154.04Show/hide
Query:  SSSSFTLGTRRSF----------THGLNCNVWSSRARGF-HFPER-TGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTEGRVGHTTNMVLGGTV
        S S  T G RR F           HGL     S    GF   PER T LNC        S +DQ  QGPPQEAVLKAIS VSKT+GRVG TTNM++GGTV
Subjt:  SSSSFTLGTRRSF----------THGLNCNVWSSRARGF-HFPER-TGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTEGRVGHTTNMVLGGTV

Query:  TDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVYNAMKRDDRMKYFL
         DDS  +W+ LDQKVN+YP  RGFTAIGTGG+DF                    V+  LS+KGKYVSVNIGP+      QVQAVYNAM+RD+RMKYFL
Subjt:  TDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDF------------------GKVRHKLSAKGKYVSVNIGPV------QVQAVYNAMKRDDRMKYFL


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCAGCGAGCAGGGCGGTGTTGCGTTCTGCATCAATATTCTTAACGGAGCCATCGCGACCCTTCCACTTCAGCCGTGCTTCTTCTTCTTCCTTCACGCTCGGAACTAG
GCGATCCTTCACTCACGGATTGAATTGCAATGTCTGGAGTTCTAGGGCTCGGGGATTTCACTTTCCTGAACGAACTGGTCTGAATTGCTCGCTCGACGAGACACAACTGA
CGTCGTCGTCTGATCAGGACGGCCAGGGCCCTCCTCAGGAGGCTGTTTTGAAGGCAATTTCAGAGGTATCTAAGACAGAAGGGAGGGTTGGGCATACCACAAATATGGTA
CTGGGAGGAACAGTGACTGATGATTCTACCAACGAATGGATTGCTTTGGATCAAAAGGTTAACTCGTACCCGGGCGTTAGAGGCTTTACAGCAATCGGAACCGGGGGAGA
TGATTTTGGCAAGGTGAGGCATAAATTATCAGCCAAAGGGAAGTACGTTTCGGTAAACATAGGACCAGTTCAAGTTCAAGCCGTATACAACGCAATGAAGAGAGACGACC
GTATGAAATACTTTCTATAG
mRNA sequenceShow/hide mRNA sequence
ACTAAGGCCATAGCAAGAAAATTATCTGTACTGATTTCGCATACTGTAAGCAATTCCCCAGAACTCGGTTAAAGCTTGAGAACCAAAAATGGCAGCGAGCAGGGCGGTGT
TGCGTTCTGCATCAATATTCTTAACGGAGCCATCGCGACCCTTCCACTTCAGCCGTGCTTCTTCTTCTTCCTTCACGCTCGGAACTAGGCGATCCTTCACTCACGGATTG
AATTGCAATGTCTGGAGTTCTAGGGCTCGGGGATTTCACTTTCCTGAACGAACTGGTCTGAATTGCTCGCTCGACGAGACACAACTGACGTCGTCGTCTGATCAGGACGG
CCAGGGCCCTCCTCAGGAGGCTGTTTTGAAGGCAATTTCAGAGGTATCTAAGACAGAAGGGAGGGTTGGGCATACCACAAATATGGTACTGGGAGGAACAGTGACTGATG
ATTCTACCAACGAATGGATTGCTTTGGATCAAAAGGTTAACTCGTACCCGGGCGTTAGAGGCTTTACAGCAATCGGAACCGGGGGAGATGATTTTGGCAAGGTGAGGCAT
AAATTATCAGCCAAAGGGAAGTACGTTTCGGTAAACATAGGACCAGTTCAAGTTCAAGCCGTATACAACGCAATGAAGAGAGACGACCGTATGAAATACTTTCTATAGCT
TTCTTTTCGACATTTACGTATACAATTCCATGTAACTAATCACTCTTATTCCTCTTTAATCTCCCTAATTTAACTTAATCTTTGCTTATCCAAGCCTGTTCTTCATATTA
TAAGGAAAGTAGAAGAAGATTTGATTTCAGATGGGTTTTGTAAGGTGCAAAGAATCTGATAATTGAAGCTGAAAATGGAAATTTAACTGAAAATATGATTATGAGCATAC
ACGACGTGGTAGGAAAGTGGGCACGACATGAAGAACAAATTACAGAATATGGAAAAAACAAAGCAAAAAAGTCAATTAAGAGATTGAAATCTTCTACTTCTCACCTTCTT
CTCCGAAAACACAGCCGAAGTGGTCGGCTGAATTGTCCATACCAATCTATCCGCCCGCTCAGATCCGACTCCGGCGGGTTTTTTTTATTGATGTCCATGAAAATGTTCCC
TCACCGCCGGTCACTACACCGATGACTATCTTTAGACTAAGTAATTTCAGAAACAGCAAATCTCCGGCGACGAACCCCTTCTGATCTAACAATATCGATCGGAAGTTCGG
TCGGCTTTGCTCATGTTGGCGGCCGGAGGAATCTTGAAGTGCCATAGCCTTCCGACTCCATTAACGTAATACTTGTTCTTACACAAAAACTCCTGTGCGAATGTCCTCTC
CACTTTCCGGTCAACATCGTGCAAAAACACGTCGGTGACGCCGGATCCTTTCCTGTTTCTTGACATCACGGCGGCGGAGAATATCGCCGCCATCCGACCAGGTGCCTCCG
CGAAATATCCTCTCGGCGCGTCGATCATTATGAGGTCCCATTCCTTCTCGTAAATCTCTTCTGGAAGATTATGAAGCGCTAACTTACATTTTTTATTGTCTTTAAGAAAC
GCCTTAGTCGGCGAACAGGACGGCTCCGATCGATACGTCGACAGCAGCTGATCTGCTTCCTGAAGCTGCGTTCTGTACTGGACGTGGTAAGCTCGAAGCATCGGAGCGTC
TTTGATAACCGTTTGAATCCATTTCGGATCTTCCTCGAGAAACACGGTGGTTCCGTGAGGGTTGAGCGACGCCCACATCAACGAATCGTGACCGAGGCCGAATATCAGAA
AGTTGCAGGGACATCGAACCTTCAATACATCAAATGAGATACGGATCTCGTCTAGCGATTGCTGTGGAACTATCTTCGCCGTCGCGTAGTGGATTATTGATTGGAGCTGG
ATCTCCGCCGGTGAATATCCAGTTATTGCCGGTGGTCCGGCGGTAGAGATGGAGCAGAATAAGTTACTGTCAACGAATCCAATGTAACCGGAAATCAACAGTGATCCGGC
GATTAAACCGACGACGGCCAGTCCGAGAATCCATGGCTTGACGGATAATCTGTTCTTCATTTTCAGATGATAAAAATTTCGTCAACTCTCCGAAATAAACAAATCGAGGG
CTCTTGAAATGGCGTTTGGTTTGTTTAAATGATTTAGGAAGACGGGGTTGCGAGAGGACGGTGGGTGAAAAGACATTAATGCCCTCCTTGTGCGGGCTGTCCTTCCCATC
AGCAGATCCAGCTTGACCGGTTCTTTGGTAAATTTGGCTCTGGATTCAACGTTTCGCTGACTCACGTGATG
Protein sequenceShow/hide protein sequence
MAASRAVLRSASIFLTEPSRPFHFSRASSSSFTLGTRRSFTHGLNCNVWSSRARGFHFPERTGLNCSLDETQLTSSSDQDGQGPPQEAVLKAISEVSKTEGRVGHTTNMV
LGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFGKVRHKLSAKGKYVSVNIGPVQVQAVYNAMKRDDRMKYFL