; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

MC02g1273 (gene) of Bitter gourd (Dali-11) v1 genome

Gene IDMC02g1273
OrganismMomordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
DescriptionU2 small nuclear ribonucleoprotein auxiliary factor-like protein
Genome locationMC02:11953282..11963240
RNA-Seq ExpressionMC02g1273
SyntenyMC02g1273
Gene Ontology termsNA
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6605331.1 hypothetical protein SDJN03_02648, partial [Cucurbita argyrosperma subsp. sororia]1.30e-11675.85Show/hide
Query:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK
        ME+ DF  IFGEPK+EW+N GSL V  F+F+VH PNPSHLRFCVTDFHSNTWE+ +S  QL DMRD+IGIGG MSEF++Y+ITSLK GDV+LRLE     
Subjt:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK

Query:  EVATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNASNSPD
        + A  AKL +QKSKGMPVFS+ LTKL D AASEA+A+LS GLFNSLK  ECSL+KEQE SLQLT MIS+EKEKYESIQS LGQYTKKQKLQNMNASNSPD
Subjt:  EVATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNASNSPD

Query:  KSV-HNIGSTKVANRVVPAHRRAKTRGALLQDSEDD
        KS+ H IGSTK  NR VPAHRRAKTRGALLQDSEDD
Subjt:  KSV-HNIGSTKVANRVVPAHRRAKTRGALLQDSEDD

XP_022148950.1 uncharacterized protein LOC111017494 isoform X1 [Momordica charantia]4.05e-16298.33Show/hide
Query:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK
        MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK
Subjt:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK

Query:  E----VATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNAS
        E    VATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNAS
Subjt:  E----VATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNAS

Query:  NSPDKSVHNIGSTKVANRVVPAHRRAKTRGALLQDSEDDT
        NSPDKSVHNIGSTKVANRVVPAHRRAKTRGALLQDSEDDT
Subjt:  NSPDKSVHNIGSTKVANRVVPAHRRAKTRGALLQDSEDDT

XP_022148951.1 uncharacterized protein LOC111017494 isoform X2 [Momordica charantia]3.91e-16298.33Show/hide
Query:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK
        MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK
Subjt:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK

Query:  E----VATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNAS
        E    VATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNAS
Subjt:  E----VATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNAS

Query:  NSPDKSVHNIGSTKVANRVVPAHRRAKTRGALLQDSEDDT
        NSPDKSVHNIGSTKVANRVVPAHRRAKTRGALLQDSEDDT
Subjt:  NSPDKSVHNIGSTKVANRVVPAHRRAKTRGALLQDSEDDT

XP_022947758.1 uncharacterized protein LOC111451522 isoform X1 [Cucurbita moschata]1.97e-11675.53Show/hide
Query:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK
        ME+ DF  IFGEPK+EW+N GSL V  F+F+VH PNPSHLRFCVTDFHSNTWE+ +S  QL DMRD+IGIGG MSEF++Y+ITSLK GDV+LRLE     
Subjt:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK

Query:  EVATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNASNSPD
        + A  AKL +QKSKGMPVFS+ LTKL D AASEA+A+LS GLFNSLK  ECSL+KEQE SLQLT MIS+EKEKYESIQS LGQYTKKQKLQNMNASNSPD
Subjt:  EVATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNASNSPD

Query:  KSV--HNIGSTKVANRVVPAHRRAKTRGALLQDSEDD
        KS+  H IGSTK  NR VPAHRRAKTRGALLQDSEDD
Subjt:  KSV--HNIGSTKVANRVVPAHRRAKTRGALLQDSEDD

XP_022947759.1 uncharacterized protein LOC111451522 isoform X2 [Cucurbita moschata]1.90e-11675.53Show/hide
Query:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK
        ME+ DF  IFGEPK+EW+N GSL V  F+F+VH PNPSHLRFCVTDFHSNTWE+ +S  QL DMRD+IGIGG MSEF++Y+ITSLK GDV+LRLE     
Subjt:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK

Query:  EVATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNASNSPD
        + A  AKL +QKSKGMPVFS+ LTKL D AASEA+A+LS GLFNSLK  ECSL+KEQE SLQLT MIS+EKEKYESIQS LGQYTKKQKLQNMNASNSPD
Subjt:  EVATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNASNSPD

Query:  KSV--HNIGSTKVANRVVPAHRRAKTRGALLQDSEDD
        KS+  H IGSTK  NR VPAHRRAKTRGALLQDSEDD
Subjt:  KSV--HNIGSTKVANRVVPAHRRAKTRGALLQDSEDD

TrEMBL top hitse value%identityAlignment
A0A6J1D4D2 uncharacterized protein LOC111017494 isoform X11.96e-16298.33Show/hide
Query:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK
        MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK
Subjt:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK

Query:  E----VATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNAS
        E    VATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNAS
Subjt:  E----VATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNAS

Query:  NSPDKSVHNIGSTKVANRVVPAHRRAKTRGALLQDSEDDT
        NSPDKSVHNIGSTKVANRVVPAHRRAKTRGALLQDSEDDT
Subjt:  NSPDKSVHNIGSTKVANRVVPAHRRAKTRGALLQDSEDDT

A0A6J1D6X2 uncharacterized protein LOC111017494 isoform X21.89e-16298.33Show/hide
Query:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK
        MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK
Subjt:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK

Query:  E----VATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNAS
        E    VATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNAS
Subjt:  E----VATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNAS

Query:  NSPDKSVHNIGSTKVANRVVPAHRRAKTRGALLQDSEDDT
        NSPDKSVHNIGSTKVANRVVPAHRRAKTRGALLQDSEDDT
Subjt:  NSPDKSVHNIGSTKVANRVVPAHRRAKTRGALLQDSEDDT

A0A6J1G7H1 uncharacterized protein LOC111451522 isoform X19.54e-11775.53Show/hide
Query:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK
        ME+ DF  IFGEPK+EW+N GSL V  F+F+VH PNPSHLRFCVTDFHSNTWE+ +S  QL DMRD+IGIGG MSEF++Y+ITSLK GDV+LRLE     
Subjt:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK

Query:  EVATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNASNSPD
        + A  AKL +QKSKGMPVFS+ LTKL D AASEA+A+LS GLFNSLK  ECSL+KEQE SLQLT MIS+EKEKYESIQS LGQYTKKQKLQNMNASNSPD
Subjt:  EVATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNASNSPD

Query:  KSV--HNIGSTKVANRVVPAHRRAKTRGALLQDSEDD
        KS+  H IGSTK  NR VPAHRRAKTRGALLQDSEDD
Subjt:  KSV--HNIGSTKVANRVVPAHRRAKTRGALLQDSEDD

A0A6J1G7U7 uncharacterized protein LOC111451522 isoform X29.22e-11775.53Show/hide
Query:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK
        ME+ DF  IFGEPK+EW+N GSL V  F+F+VH PNPSHLRFCVTDFHSNTWE+ +S  QL DMRD+IGIGG MSEF++Y+ITSLK GDV+LRLE     
Subjt:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK

Query:  EVATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNASNSPD
        + A  AKL +QKSKGMPVFS+ LTKL D AASEA+A+LS GLFNSLK  ECSL+KEQE SLQLT MIS+EKEKYESIQS LGQYTKKQKLQNMNASNSPD
Subjt:  EVATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNASNSPD

Query:  KSV--HNIGSTKVANRVVPAHRRAKTRGALLQDSEDD
        KS+  H IGSTK  NR VPAHRRAKTRGALLQDSEDD
Subjt:  KSV--HNIGSTKVANRVVPAHRRAKTRGALLQDSEDD

A0A6J1L739 uncharacterized protein LOC111499771 isoform X59.23e-11574.26Show/hide
Query:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK
        ME+ DF  IFGEPK+EW+N  SL    F+F+VH PNPSHLRFCVTDFHSNTWE+ +S  QL DMRD+IGIGG MSEF++Y+ITSLK GDV+LRLE     
Subjt:  MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGK

Query:  EVATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNASNSPD
        + A  AKL +QKSKGMPVFS+ LTKL D AASEA+A+LS GLFNSLK  ECSL+KEQE SLQLT MIS+EKEKYESIQS LGQYTKKQKLQNMNASNSPD
Subjt:  EVATHAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNASNSPD

Query:  KSV--HNIGSTKVANRVVPAHRRAKTRGALLQDSEDD
        KS+  H IG TK  NR VPAHRRAKTRGALLQDSEDD
Subjt:  KSV--HNIGSTKVANRVVPAHRRAKTRGALLQDSEDD

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT5G64010.1 unknown protein3.2e-3840.51Show/hide
Query:  QDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGKEVA
        + F PIFGE   E  + GS  +RR +F+V+  +  +L   VTDF S  W  I SV QL DMRD +GIGG  SEF++Y + SLK  +VKL L         
Subjt:  QDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGKEVA

Query:  THAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKL---QNMNASNSPD
          A+L SQK+KGMP  ++PLTK+V+S+ASEA+A+LS  LF + K  +       +  +  +   + EK+K ++  + L +Y++K  +      N  +SP 
Subjt:  THAKLSSQKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKL---QNMNASNSPD

Query:  KSVHNIGSTKVANRVVPAHRRAKTRGALLQDSEDDTG
               +TK   + VPAHRR + RGALLQDSE++ G
Subjt:  KSVHNIGSTKVANRVVPAHRRAKTRGALLQDSEDDTG


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGAGCTTCAAGATTTCCCACCCATTTTTGGAGAACCCAAATTGGAGTGGTTAAACAGCGGTTCGCTTCCTGTGCGCCGATTTGTGTTCTATGTTCACAATCCCAATCC
TTCGCACCTCAGATTTTGTGTTACCGATTTCCATTCCAACACTTGGGAAGCCATCAGATCGGTTCCGCAGCTTCAGGACATGAGGGATGACATTGGAATTGGAGGGGATA
TGTCCGAGTTTCTTAACTATCTCATTACTTCCCTGAAACTTGGAGATGTAAAGCTTCGTCTTGAAGGACACTGGGGGAAGGAAGTTGCAACACATGCCAAATTAAGTTCC
CAGAAATCAAAAGGAATGCCTGTTTTTTCTATTCCTCTCACAAAACTCGTGGACTCAGCTGCTTCTGAAGCTGTGGCAAGTCTGTCCTTTGGGCTCTTTAACTCATTGAA
AGACATGGAATGTTCACTTATAAAAGAGCAAGAGCACTCCCTTCAGTTGACAAACATGATATCATCAGAAAAGGAAAAATACGAAAGTATTCAGAGCCATCTCGGGCAAT
ATACAAAGAAACAGAAGTTGCAAAATATGAATGCCTCAAATTCTCCAGATAAGTCTGTTCATAATATTGGCTCGACAAAAGTAGCCAATCGTGTAGTGCCAGCGCATCGC
AGGGCAAAAACAAGAGGAGCCCTTTTGCAAGACTCTGAAGATGACACTGGTAGGTATGACTTGATATGTTTTGTGCTTAGTTTTAAGTTTCAAGTCTTGAAAAGCTCTGC
TCCAGCCATCATTCTCACCCTTTTAACTGGCAAAAATCTCCATGGGTTTGGTCCTTGTGGGTTTTGCTCCAAACACGATGGAGAATCATCATCTGAAGCGGGATTTGGGG
TCGAGAGGGCTATCTCTCTCCTCCATAAAACTTTTCCAAAGTTTACAAACTTATGCTTATTCCTTGCAAGTTCTATTTTTTGCACAACAACGTTGAATATAGCATTATTA
AAACTAACCGTTTTCTCCAATCTTTTCCCCTAG
mRNA sequenceShow/hide mRNA sequence
CCTACTCTCCCTCCATAGCCAGCCTTCTTCGCCACTGCTGTCTCCGCCGGTAGGGTTTGTTTATAAAACATTTAAGAAAATTCCTACGTCGAAAATCTAAGGGTCGGGTT
CTCTCTGGTATCAGAACCGTTTCAGATTGGTCCAAAAGATCTCTTTAACCCAACCTGATCCAACCGATCGTTTTCCACAATCGCTGAATATATCTGATTGAGTAGAGAAC
AGAAACATTTGGGATAGTTGAAATTGAAATGGAGCTTCAAGATTTCCCACCCATTTTTGGAGAACCCAAATTGGAGTGGTTAAACAGCGGTTCGCTTCCTGTGCGCCGAT
TTGTGTTCTATGTTCACAATCCCAATCCTTCGCACCTCAGATTTTGTGTTACCGATTTCCATTCCAACACTTGGGAAGCCATCAGATCGGTTCCGCAGCTTCAGGACATG
AGGGATGACATTGGAATTGGAGGGGATATGTCCGAGTTTCTTAACTATCTCATTACTTCCCTGAAACTTGGAGATGTAAAGCTTCGTCTTGAAGGACACTGGGGGAAGGA
AGTTGCAACACATGCCAAATTAAGTTCCCAGAAATCAAAAGGAATGCCTGTTTTTTCTATTCCTCTCACAAAACTCGTGGACTCAGCTGCTTCTGAAGCTGTGGCAAGTC
TGTCCTTTGGGCTCTTTAACTCATTGAAAGACATGGAATGTTCACTTATAAAAGAGCAAGAGCACTCCCTTCAGTTGACAAACATGATATCATCAGAAAAGGAAAAATAC
GAAAGTATTCAGAGCCATCTCGGGCAATATACAAAGAAACAGAAGTTGCAAAATATGAATGCCTCAAATTCTCCAGATAAGTCTGTTCATAATATTGGCTCGACAAAAGT
AGCCAATCGTGTAGTGCCAGCGCATCGCAGGGCAAAAACAAGAGGAGCCCTTTTGCAAGACTCTGAAGATGACACTGGTAGGTATGACTTGATATGTTTTGTGCTTAGTT
TTAAGTTTCAAGTCTTGAAAAGCTCTGCTCCAGCCATCATTCTCACCCTTTTAACTGGCAAAAATCTCCATGGGTTTGGTCCTTGTGGGTTTTGCTCCAAACACGATGGA
GAATCATCATCTGAAGCGGGATTTGGGGTCGAGAGGGCTATCTCTCTCCTCCATAAAACTTTTCCAAAGTTTACAAACTTATGCTTATTCCTTGCAAGTTCTATTTTTTG
CACAACAACGTTGAATATAGCATTATTAAAACTAACCGTTTTCTCCAATCTTTTCCCCTAGAACAAGAGCGCTCCCTTCAGTCAACAAAAATCTCGGATGAAAAGGTATA
TTTGTCTCTCATTCACTTTTAAAAAAAGTTGCTGGTGAGTGTTTCTTTATGCTCTTATAGGTGCGTTTTTATTGTCTCGAGACCCCATTAGATAAGTAGAAATATAGTCG
TGATTGTCGTGTATCTTCTGTATCTTAGAGCGTATCTTGATCTTGCTTATTATTTGTTAATTCTGCACATATTTTGCAACTCTCGAACTTTCTTTTTAAAATGTTAGGAA
AAGAAACAGGAGTTGCATACTACAATTACCTCAGTCAATAAAGATGAGTTGCAAAAGTCTCCTGACAAACCTGTTAATGATATCAGCTCGACAAAGGTCACCAATCGTGT
CATGCCAGTACACCGCAGGGCCAGAACAAGAGGTGCCCTTCTACAAGATAATGAAGATGACGGTGGTCGGTAAAGCGATGTAGAATCATTCAGTGATAAACGAAAATATA
CGGATAACAGTGGATATTTCTTTCACAAAAGGGATTATGCAATGCAGATGTTTGTTCCAAAGTTTCATGAAAAATGAAATTGTTGTTTCTTATGGTAATATAAATATCAT
CCCACATTCTGTTTCGTTTGAATTTTACTTTCTAATGAACCTTATAAACGGCCTCTTTAAATTAGGCCTTAGAGTGTAATTAGGAATTTCTAATCGATCTTTGAACTTTT
AGGATGATATTTAATTAGTTCTCATACACAAAAGATTTTAATAAGTT
Protein sequenceShow/hide protein sequence
MELQDFPPIFGEPKLEWLNSGSLPVRRFVFYVHNPNPSHLRFCVTDFHSNTWEAIRSVPQLQDMRDDIGIGGDMSEFLNYLITSLKLGDVKLRLEGHWGKEVATHAKLSS
QKSKGMPVFSIPLTKLVDSAASEAVASLSFGLFNSLKDMECSLIKEQEHSLQLTNMISSEKEKYESIQSHLGQYTKKQKLQNMNASNSPDKSVHNIGSTKVANRVVPAHR
RAKTRGALLQDSEDDTGRYDLICFVLSFKFQVLKSSAPAIILTLLTGKNLHGFGPCGFCSKHDGESSSEAGFGVERAISLLHKTFPKFTNLCLFLASSIFCTTTLNIALL
KLTVFSNLFP