CuGenDBv2

Gene ID	Tan0002534
Organism	Trichosanthes anguina (Snake gourd v1)
Description	LEA_2 domain-containing protein
Genome location	LG06:62136242..62137131
RNA-Seq Expression	Tan0002534
Synteny	Tan0002534
Gene Ontology terms	GO:0032259 - methylation (biological process) GO:0005737 - cytoplasm (cellular component) GO:0016021 - integral component of membrane (cellular component) GO:0043231 - intracellular membrane-bounded organelle (cellular component) GO:0008168 - methyltransferase activity (molecular function)
InterPro domains	IPR004864 - Late embryogenesis abundant protein, LEA_2 subgroup

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6575200.1 Late embryogenesis abundant protein, partial [Cucurbita argyrosperma subsp. sororia]

1.1e-78

75.8

Show/hide

Query:  MMEKEQARPLAPTTD-RPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAVIVV-ILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD
        M +K+QARPLAPT   RPSSDD +  LHLKRI+RRR IK   F++ LL+IL+VIV+ ILMFT+F+VKDP IQMN ISIT++ELING+IPKPGSN+SLTAD
Subjt:  MMEKEQARPLAPTTD-RPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAVIVV-ILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI
        VSVKNPN+ASFKYSNTTTTLYINET IGEARGPPGQAKARRT +MN+TINIV D+LL NL  D++SGKL LRSFSR+PGRVKLL+I+RR IVVKMNCT  
Subjt:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI

Query:  INIINRSIEDQKCKRKVKL
        INI N+SIEDQ CKRKVK+
Subjt:  INIINRSIEDQKCKRKVKL

KAG7013763.1 Late embryogenesis abundant protein, partial [Cucurbita argyrosperma subsp. argyrosperma]

1.7e-79

76.26

Show/hide

Query:  MMEKEQARPLAPTTD-RPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAVIVV-ILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD
        M +K+QARPLAPTT  RPSSDD +  LHLKRI+RRR IK   F++ LL+IL+VIV+ ILMFT+F+VKDP IQMN ISIT++ELING+IPKPGSN+SLTAD
Subjt:  MMEKEQARPLAPTTD-RPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAVIVV-ILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI
        VSVKNPN+ASFKYSNTTTTLYINET IGEARGPPGQAKARRT +MN+TINIV D+LL NL  D++SGKL LRSFSR+PGRVKLL+I+RR IVVKMNCT  
Subjt:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI

Query:  INIINRSIEDQKCKRKVKL
        INI N+SIEDQ CKRKVK+
Subjt:  INIINRSIEDQKCKRKVKL

XP_022959336.1 uncharacterized protein LOC111460339 [Cucurbita moschata]

4.9e-79

74.89

Show/hide

Query:  MMEKEQARPLAPTTD-RPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAV-IVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD
        M +K+QARPLAP TD RPSSDD +  LHLKRI+RRR IK   F++ LL+IL+V +++IL+FT+F+VKDP IQMN ISIT++ELING+IPKPGSN+SLTAD
Subjt:  MMEKEQARPLAPTTD-RPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAV-IVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI
        VSVKNPN+ASFKYSNTTTTLYINET IGEARGPPGQAKARRT RMN+TINIV D+LL NL  D++SGKL LRSFSR+PGRVK+L+I+RR IVVKMNCT  
Subjt:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI

Query:  INIINRSIEDQKCKRKVKL
        INI N+SIEDQ CKRKVK+
Subjt:  INIINRSIEDQKCKRKVKL

XP_023548342.1 uncharacterized protein LOC111807010 [Cucurbita pepo subsp. pepo]

5.4e-78

76.26

Show/hide

Query:  MMEKEQARPLAPTTD-RPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAVIVV-ILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD
        M +K+QARPLAP TD RPS+DD +  LHLK  R+RR IK   F++ LLVIL+V+V+ IL+FT+F+VKDP IQMN ISIT++ELINGIIPKPGSN+SLTAD
Subjt:  MMEKEQARPLAPTTD-RPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAVIVV-ILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI
        VSVKNPNMASFKYSNTTTTLYINET IGEARGPPGQAKARRT RMN+TINIV DQLL NL  D++SGKL LRSFSR+PGRVKLL+IIRR I+VKMNCT  
Subjt:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI

Query:  INIINRSIEDQKCKRKVKL
        INI N+SIEDQ CKRKVK+
Subjt:  INIINRSIEDQKCKRKVKL

XP_038875202.1 uncharacterized protein LOC120067718 [Benincasa hispida]

2.9e-79

73.52

Show/hide

Query:  MMEKEQARPLAPTT-DRPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAV-IVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD
        M++K+QA+PLAP T  R SSD+ ET LHLKRI+RRR IKCCGF+V  L+I  + I++ILMFT+F++KDP I+MN +SIT++ELING IPKPGSNMSLTAD
Subjt:  MMEKEQARPLAPTT-DRPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAV-IVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI
        VSVKNPNMASFKYSNTTTTL+INET IGEARGPPG+AKARRT RMN+TI+IV D++L+NL  DV+ GK+ LRSFSRIPGRVKLL++I R +VVKMNCTF+
Subjt:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI

Query:  INIINRSIEDQKCKRKVKL
        INI NRSIEDQ+CKRKVK+
Subjt:  INIINRSIEDQKCKRKVKL

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KD33 LEA_2 domain-containing protein

1.6e-75

70.32

Show/hide

Query:  MMEKEQARPLAPTT-DRPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVI-LAVIVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD
        M++K+QA+PL P T +R SSD+ ET LHLKRI+R+R IKCC F+VALL+I   VI++ILMFT+F++KDP IQMN +SIT++ELIN +IPKPGSN+SLTAD
Subjt:  MMEKEQARPLAPTT-DRPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVI-LAVIVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI
        VSVKNPNMASFKYSNTTTTL+INET IGE RGP G+AKAR+T RMN+TI+IV D++L+NL  DV+ GK+ LRSFSRIPG+VKLL+ I R +VVKMNCTF+
Subjt:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI

Query:  INIINRSIEDQKCKRKVKL
        INI ++SIEDQKCKRK+K+
Subjt:  INIINRSIEDQKCKRKVKL

A0A1S3C8G8 uncharacterized protein LOC103497685

4.2e-76

70.32

Show/hide

Query:  MMEKEQARPLAPTT-DRPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVI-LAVIVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD
        M+ K+QA+PL P T DR SSD+ ET LHLKRI+R+R IKCC F+ ALL+I   VI++ILMFT+F++KDP I+MN +SIT++ELIN +IPKPGSN+SLTAD
Subjt:  MMEKEQARPLAPTT-DRPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVI-LAVIVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI
        VSVKNPNMASFKYSNTTTTL+INET IGE RGPPG+AKAR+T RMN+TI+IV D++L+NL  DV+ GK+ LRSFSRIPG+VKLL++I R +VVKMNCTF+
Subjt:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI

Query:  INIINRSIEDQKCKRKVKL
        INI ++SIEDQKCKRK+K+
Subjt:  INIINRSIEDQKCKRKVKL

A0A2I4GMG7 uncharacterized protein LOC109009171

3.0e-74

65.75

Show/hide

Query:  MMEKEQARPLAPTTDRPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAVIVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTADVS
        M+E++QARPLAP+TDRPSSD++E  LH++++RR+R +K CG + ALL+I AV+++IL+FTVF VKDP I+MNGI++T++ELING  PKPG+NMSLTADVS
Subjt:  MMEKEQARPLAPTTDRPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAVIVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTADVS

Query:  VKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLAN----LDVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI
        VKNPN+ASFKY NTTTTL+ N T +GEARGPPGQAK RRT RMNIT++I+TDQLL+N     DV S  LS+ S+SRIPGRVK++ II++ +VVKMNCTF 
Subjt:  VKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLAN----LDVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI

Query:  INIINRSIEDQKCKRKVKL
        +NI +++I+ QKCKRKV L
Subjt:  INIINRSIEDQKCKRKVKL

A0A6J1H4K3 uncharacterized protein LOC111460339

2.4e-79

74.89

Show/hide

Query:  MMEKEQARPLAPTTD-RPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAV-IVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD
        M +K+QARPLAP TD RPSSDD +  LHLKRI+RRR IK   F++ LL+IL+V +++IL+FT+F+VKDP IQMN ISIT++ELING+IPKPGSN+SLTAD
Subjt:  MMEKEQARPLAPTTD-RPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAV-IVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI
        VSVKNPN+ASFKYSNTTTTLYINET IGEARGPPGQAKARRT RMN+TINIV D+LL NL  D++SGKL LRSFSR+PGRVK+L+I+RR IVVKMNCT  
Subjt:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI

Query:  INIINRSIEDQKCKRKVKL
        INI N+SIEDQ CKRKVK+
Subjt:  INIINRSIEDQKCKRKVKL

A0A6J1L0R6 uncharacterized protein LOC111499318

4.5e-78

75.8

Show/hide

Query:  MMEKEQARPLAPTTD-RPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAVIVV-ILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD
        M +K+QARPLA  TD RPSSDD +  LHLK+I+R R IK   F++ LLVIL+V+V+ ILMFT+F+VKDP IQMN ISIT++ELING+IPKPGSN+SLTAD
Subjt:  MMEKEQARPLAPTTD-RPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAVIVV-ILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI
        VSVKNPN+ASFKYSNTTTTLYINET IGEARGPPGQAKARRT RMN+TINIV D+LL NL  D++SGKL LRSFSR+PGRVKLL+IIRR IVVKMNCT  
Subjt:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL--DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFI

Query:  INIINRSIEDQKCKRKVKL
        INI N+SIEDQ CKRKVK+
Subjt:  INIINRSIEDQKCKRKVKL

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G64450.1 Glycine-rich protein family

3.5e-06

27.27

Show/hide

Query:  KRIRRRRLIKCCGFMVALLVILAVIVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTADVSVKNPNMASFKYSNTTTTLYINETAIGEA
        +R   R  +  C      L+IL V+++++ FTVF+ KDP+I +N + +    + N       +N S +  V+V+NPN A F + +++  L  +   +G  
Subjt:  KRIRRRRLIKCCGFMVALLVILAVIVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTADVSVKNPNMASFKYSNTTTTLYINETAIGEA

Query:  RGPPGQAKARRTSRMNITINI
          P G+  + R   M  T  +
Subjt:  RGPPGQAKARRTSRMNITINI

AT2G46150.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

3.2e-44

43.69

Show/hide

Query:  MMEKEQARPLAPTTDRPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAVIVVILMFTVFEVKDPRIQMNGISITRVELINGI--IPKPGSNMSLTAD
        M + E  RPLAP T  P SD+  + +     R R  IKC   + A  +IL  IV+ L+FTVF VKDP I+MNG+ +  ++ + G   +   G+N+S+  D
Subjt:  MMEKEQARPLAPTTDRPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAVIVVILMFTVFEVKDPRIQMNGISITRVELINGI--IPKPGSNMSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANLDV-----NSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNC
        VSVKNPN ASFKYSNTTT +Y   T +GEA G PG+A+  RTSRMN+T++I+ D++L++  +      SG +++ S++R+ G+VK++ I+++ + VKMNC
Subjt:  VSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANLDV-----NSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNC

Query:  TFIINIINRSIEDQKCKRKVKL
        T  +NI  ++I+D  CK+K+ L
Subjt:  TFIINIINRSIEDQKCKRKVKL

AT3G05975.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

8.0e-11

25.65

Show/hide

Query:  RRRLIKCC---GFMVALLVILAVIVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTADVSVKNPNMASFKYSNTTTTLYINETAIGEAR
        +RR+  CC   G +  L VI   +  +++  VF+ K P +Q    ++  +     +  +   N +LT ++ +KNPN+A F+Y      +Y  +T +G   
Subjt:  RRRLIKCC---GFMVALLVILAVIVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTADVSVKNPNMASFKYSNTTTTLYINETAIGEAR

Query:  GPPGQAKARRTSRMNITINIVTDQLLANL-----DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFIINIINRSIEDQKCKRKVKL
         P     A+ +  +   + +  D+ +ANL     DV  GK+ + + +++PG++ LL I +  +    +C  ++   +  +EDQ C  K KL
Subjt:  GPPGQAKARRTSRMNITINIVTDQLLANL-----DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFIINIINRSIEDQKCKRKVKL

AT3G54200.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

1.4e-23

31.11

Show/hide

Query:  EKEQARP----LAPTTDRPSSDDEET--TLHLKRIRRRRLIK-CCGFMVALLVILAVIVVILMFTVFEVKDPRIQMNGISITRVEL-INGIIPKPGSNMS
        +KE+ +P    L P     SS + ++  T   K++RR+R  K C  F + L++++A+++VIL FT+F+ K P   ++ +++ R++  +N ++ K   N++
Subjt:  EKEQARP----LAPTTDRPSSDDEET--TLHLKRIRRRRLIK-CCGFMVALLVILAVIVVILMFTVFEVKDPRIQMNGISITRVEL-INGIIPKPGSNMS

Query:  LTADVSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL----DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVK
        L  D+S+KNPN   F Y +++  L      IGEA  P  +  AR+T  +NIT+ ++ D+LL+      DV +G + L +F ++ G+V +L I + ++   
Subjt:  LTADVSVKNPNMASFKYSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL----DVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVK

Query:  MNCTFIINIINRSIEDQKCKRKVKL
         +C   I++ +R++  Q CK   KL
Subjt:  MNCTFIINIINRSIEDQKCKRKVKL

AT4G23610.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

2.5e-20

32.68

Show/hide

Query:  MEKEQARPLAP--TTDRPSSDDEETTLHLKRIR----RRRLIKCCGFMVALLVILAVIVVILMFTVFEVKDPRIQMNGISIT-RVELINGIIPKPGSNMS
        + ++QA+PLAP   T R    DEE   H  R +    + +LI CCGF+ +L +++AV  ++L  TVF +  P + ++ IS   R + +NG +     N +
Subjt:  MEKEQARPLAP--TTDRPSSDDEETTLHLKRIR----RRRLIKCCGFMVALLVILAVIVVILMFTVFEVKDPRIQMNGISIT-RVELINGIIPKPGSNMS

Query:  LTADVSVKNPNMASFKYSNTTTTLYINE-TAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL-----DVNSGKLSLRSFSRIPGRVKLLNIIRRRIV
        ++ ++S+ NPN A F   N   + Y  E   +GE+        A+RT +MN+T  IV  +LLA+L     D+N   + L+S   + GRVK + I R+ + 
Subjt:  LTADVSVKNPNMASFKYSNTTTTLYINE-TAIGEARGPPGQAKARRTSRMNITINIVTDQLLANL-----DVNSGKLSLRSFSRIPGRVKLLNIIRRRIV

Query:  VKMNC
        ++ +C
Subjt:  VKMNC

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGATGGAAAAGGAGCAAGCGCGACCACTCGCCCCAACTACCGACCGTCCGAGCAGCGACGACGAGGAGACAACATTACACTTGAAGAGAATTCGACGAAGAAGACTCAT
AAAATGTTGTGGATTTATGGTTGCCCTTCTTGTAATACTAGCAGTAATAGTTGTCATCTTGATGTTCACTGTGTTTGAAGTTAAGGATCCTAGAATCCAAATGAACGGAA
TATCAATCACAAGAGTTGAGTTGATCAATGGTATCATTCCGAAGCCAGGGTCGAACATGTCGCTCACCGCAGACGTGTCTGTGAAAAACCCGAACATGGCGTCGTTCAAG
TATAGTAACACAACGACAACTCTATACATTAACGAGACCGCGATAGGGGAGGCCAGAGGGCCACCCGGGCAAGCGAAGGCACGACGAACATCGCGAATGAACATCACCAT
CAACATAGTCACCGATCAGCTCCTAGCGAATCTCGACGTCAACTCGGGAAAGCTGAGTTTGAGAAGCTTTTCGAGGATTCCGGGGAGGGTGAAGCTGTTGAATATTATAA
GAAGACGTATTGTTGTGAAAATGAACTGTACGTTCATTATCAATATCATAAACAGATCGATCGAGGACCAGAAATGCAAGAGGAAGGTGAAGCTCTAG

mRNA sequence

Show/hide mRNA sequence

CAAATTTTTGGGCATTTCCCAAACAACTGCCTTACAAACCCAAGCACTTGAACAAAATCCCACAATCCAAATTTTCCAATTTTTCTTCTCCAACAATGATGGAAAAGGAG
CAAGCGCGACCACTCGCCCCAACTACCGACCGTCCGAGCAGCGACGACGAGGAGACAACATTACACTTGAAGAGAATTCGACGAAGAAGACTCATAAAATGTTGTGGATT
TATGGTTGCCCTTCTTGTAATACTAGCAGTAATAGTTGTCATCTTGATGTTCACTGTGTTTGAAGTTAAGGATCCTAGAATCCAAATGAACGGAATATCAATCACAAGAG
TTGAGTTGATCAATGGTATCATTCCGAAGCCAGGGTCGAACATGTCGCTCACCGCAGACGTGTCTGTGAAAAACCCGAACATGGCGTCGTTCAAGTATAGTAACACAACG
ACAACTCTATACATTAACGAGACCGCGATAGGGGAGGCCAGAGGGCCACCCGGGCAAGCGAAGGCACGACGAACATCGCGAATGAACATCACCATCAACATAGTCACCGA
TCAGCTCCTAGCGAATCTCGACGTCAACTCGGGAAAGCTGAGTTTGAGAAGCTTTTCGAGGATTCCGGGGAGGGTGAAGCTGTTGAATATTATAAGAAGACGTATTGTTG
TGAAAATGAACTGTACGTTCATTATCAATATCATAAACAGATCGATCGAGGACCAGAAATGCAAGAGGAAGGTGAAGCTCTAGACTTTCAGTGGCATGTATGGCAATGCT
TTTGATCAATGGTGATGGTTTGAGGGTTTATTTCTTTACAGTAGAATCGAGGGTACGTGATTATGTAAACCTTTATTATCAATCTCTGTCATACTTCAATAAAAACGTTT
TTATCATTAA

Protein sequence

Show/hide protein sequence

MMEKEQARPLAPTTDRPSSDDEETTLHLKRIRRRRLIKCCGFMVALLVILAVIVVILMFTVFEVKDPRIQMNGISITRVELINGIIPKPGSNMSLTADVSVKNPNMASFK
YSNTTTTLYINETAIGEARGPPGQAKARRTSRMNITINIVTDQLLANLDVNSGKLSLRSFSRIPGRVKLLNIIRRRIVVKMNCTFIINIINRSIEDQKCKRKVKL

Tan0002534 (gene) of Snake gourd v1 genome