CuGenDBv2

Gene ID	Tan0013842
Organism	Trichosanthes anguina (Snake gourd v1)
Description	LEA_2 domain-containing protein
Genome location	LG09:65190142..65192206
RNA-Seq Expression	Tan0013842
Synteny	Tan0013842
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	IPR004864 - Late embryogenesis abundant protein, LEA_2 subgroup

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG7021841.1 hypothetical protein SDJN02_15569, partial [Cucurbita argyrosperma subsp. argyrosperma]

1.9e-94

84.33

Show/hide

Query:  MTSSSRVDSAPVPYSLLPQNA--GQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASV
        MTSSSR DS     SLLPQNA  G  N+V+LSLY PP Y HRRLLRLCA YSAAFLLL+A+AFLLFPSDPSLQLVRLKLN AKVRLLPV+VLDLS SAS+
Subjt:  MTSSSRVDSAPVPYSLLPQNA--GQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASV

Query:  RVRNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEV
        RVRNKNFFSLDYNYLGVSVGYRGRRLGFVSS+GGRVSARGSS+VNAT+DLNG+EVIHDAFYLL+DLGKG+IPFD++TEVEG+MGFFFIKFPIKARVSC+V
Subjt:  RVRNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEV

Query:  FVNTKNQTIEHQDCYPE
        FV+TK QTIEHQDCYPE
Subjt:  FVNTKNQTIEHQDCYPE

XP_004148717.1 uncharacterized protein LOC101219269 [Cucumis sativus]

1.9e-94

83.72

Show/hide

Query:  MTSSSRVDSAPVPYSLLPQNAGQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASVRV
        MTSSS  DS PVPY+L+P NA Q NVVVLSLY PP  RHRRLLRLCA YSAAFLLL AVAFLLFPSDPSLQLVRLKLNR KV L+PVV LDLSFS S+RV
Subjt:  MTSSSRVDSAPVPYSLLPQNAGQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASVRV

Query:  RNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEVFV
        RNKNFFSL+YN+LGVSVGYRGRRLG+VSSEGGRVSARGSS+VNATLDLNG+EV+HD  YLL DLGKG+IPFDTET+VEG MG FFIK PIKARVSCEV V
Subjt:  RNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEVFV

Query:  NTKNQTIEHQDCYPE
        NT NQTIEHQDCYPE
Subjt:  NTKNQTIEHQDCYPE

XP_022144909.1 uncharacterized protein LOC111014473 [Momordica charantia]

2.8e-98

86.51

Show/hide

Query:  MTSSSRVDSAPVPYSLLPQNAGQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASVRV
        MTSSSR DS PVPYSLLP NA   NVVVLSLY PPR+R RRLLRLCA YSAAFLLLSAVAFLLFP+DPSLQLVRLKLNR KVRLLPV++LDLSFSASVRV
Subjt:  MTSSSRVDSAPVPYSLLPQNAGQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASVRV

Query:  RNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEVFV
        RN NFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARG S+VNATLDLNG EVIHD  YL+EDL  G++PFDTETEVEGYMG FFIKFPIKARVSCEVFV
Subjt:  RNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEVFV

Query:  NTKNQTIEHQDCYPE
        NT ++TIEHQDCYPE
Subjt:  NTKNQTIEHQDCYPE

XP_023530779.1 uncharacterized protein LOC111793228 isoform X1 [Cucurbita pepo subsp. pepo]

1.9e-94

84.33

Show/hide

Query:  MTSSSRVDSAPVPYSLLPQNA--GQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASV
        MTSSSR DS     SLLPQNA  G  N+V+LSLY PP Y HRRLLRLCA YSAAFLLL+A++FLLFPSDPSLQLVRLKLN AKVRLLPV+VLDLS SASV
Subjt:  MTSSSRVDSAPVPYSLLPQNA--GQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASV

Query:  RVRNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEV
        RVRNKNFFSLDYNYLGVSVGYRG+RLGFVSS+GGRVSARGSS+VNAT+DLNG+EVIHDAFYLL+DLGKG+IPFD++TEVEG+MGFFFIKFPIKARVSC+V
Subjt:  RVRNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEV

Query:  FVNTKNQTIEHQDCYPE
        FVNTK QTIEHQDCYPE
Subjt:  FVNTKNQTIEHQDCYPE

XP_023530780.1 uncharacterized protein LOC111793228 isoform X2 [Cucurbita pepo subsp. pepo]

1.9e-94

84.33

Show/hide

Query:  MTSSSRVDSAPVPYSLLPQNA--GQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASV
        MTSSSR DS     SLLPQNA  G  N+V+LSLY PP Y HRRLLRLCA YSAAFLLL+A++FLLFPSDPSLQLVRLKLN AKVRLLPV+VLDLS SASV
Subjt:  MTSSSRVDSAPVPYSLLPQNA--GQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASV

Query:  RVRNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEV
        RVRNKNFFSLDYNYLGVSVGYRG+RLGFVSS+GGRVSARGSS+VNAT+DLNG+EVIHDAFYLL+DLGKG+IPFD++TEVEG+MGFFFIKFPIKARVSC+V
Subjt:  RVRNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEV

Query:  FVNTKNQTIEHQDCYPE
        FVNTK QTIEHQDCYPE
Subjt:  FVNTKNQTIEHQDCYPE

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LTV4 LEA_2 domain-containing protein

9.0e-95

83.72

Show/hide

Query:  MTSSSRVDSAPVPYSLLPQNAGQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASVRV
        MTSSS  DS PVPY+L+P NA Q NVVVLSLY PP  RHRRLLRLCA YSAAFLLL AVAFLLFPSDPSLQLVRLKLNR KV L+PVV LDLSFS S+RV
Subjt:  MTSSSRVDSAPVPYSLLPQNAGQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASVRV

Query:  RNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEVFV
        RNKNFFSL+YN+LGVSVGYRGRRLG+VSSEGGRVSARGSS+VNATLDLNG+EV+HD  YLL DLGKG+IPFDTET+VEG MG FFIK PIKARVSCEV V
Subjt:  RNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEVFV

Query:  NTKNQTIEHQDCYPE
        NT NQTIEHQDCYPE
Subjt:  NTKNQTIEHQDCYPE

A0A6J1CTN0 uncharacterized protein LOC111014473

1.3e-98

86.51

Show/hide

Query:  MTSSSRVDSAPVPYSLLPQNAGQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASVRV
        MTSSSR DS PVPYSLLP NA   NVVVLSLY PPR+R RRLLRLCA YSAAFLLLSAVAFLLFP+DPSLQLVRLKLNR KVRLLPV++LDLSFSASVRV
Subjt:  MTSSSRVDSAPVPYSLLPQNAGQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASVRV

Query:  RNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEVFV
        RN NFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARG S+VNATLDLNG EVIHD  YL+EDL  G++PFDTETEVEGYMG FFIKFPIKARVSCEVFV
Subjt:  RNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEVFV

Query:  NTKNQTIEHQDCYPE
        NT ++TIEHQDCYPE
Subjt:  NTKNQTIEHQDCYPE

A0A6J1EZ17 uncharacterized protein LOC111437732

3.8e-93

82.95

Show/hide

Query:  MTSSSRVDSAPVPYSLLPQNA--GQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASV
        MTSSSR DS     SLLPQNA  G  N+V+LSLY PP Y HRRLLRLCA YSAAFLLL+A++FLLFPSDPSLQLVRL+LN AKVRLLPV+VLDLS SAS+
Subjt:  MTSSSRVDSAPVPYSLLPQNA--GQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASV

Query:  RVRNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEV
        RVRNKNFFSLDYNYLGVSVGYRGR LGFVSS+GGRVSARG S+VNAT+DLNG+EVIHDAFYLL+DLGKG+IPFD++TEVEG+MGFFFIKFPIKARVSC+V
Subjt:  RVRNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEV

Query:  FVNTKNQTIEHQDCYPE
        FVNTK QTIEHQDCYPE
Subjt:  FVNTKNQTIEHQDCYPE

A0A6J1JI07 uncharacterized protein LOC111485280

6.4e-93

84.11

Show/hide

Query:  SSSRVDSAPVPYSLLPQNAGQP-NVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASVRVR
        S S+  S PVPYS +P NA  P NVVVLSLY PP YR RRLLRLCALYSAAFLLLSAV FLLFPSDPSLQLVRLKLN  KVRLLP VVLDLSFSASVRVR
Subjt:  SSSRVDSAPVPYSLLPQNAGQP-NVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASVRVR

Query:  NKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEVFVN
        NKNFFSLDYNYLGVSVG+RGRRLGFVSS+GGRVSARGSS+VNATLDLNG+++IHD F+LLEDL KG+IPFDTETEVEG MG FFIKFPIKA VSCEVFV+
Subjt:  NKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEVFVN

Query:  TKNQTIEHQDCYPE
        T +QTIEHQDCYPE
Subjt:  TKNQTIEHQDCYPE

A0A6J1KPJ6 uncharacterized protein LOC111497551

7.6e-94

84.33

Show/hide

Query:  MTSSSRVDSAPVPYSLLPQNA--GQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASV
        MTSSSR DS     SLLPQNA  G  N+V+LSLY PP Y HRRLLRLCA YSAAFLLL+A++FLLFPSDPSLQLVRLKLN AKVRLLPV+VLDLS SASV
Subjt:  MTSSSRVDSAPVPYSLLPQNA--GQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASV

Query:  RVRNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEV
        RVRNKNFFSLDYNYLGVSVGYRG RLGFVSS+GGRVSARGSS VNAT+DLNG+EVIHDAFYLL+DLGKG+IPFD++TEVEG+MGFFFIKFPIKARVSC+V
Subjt:  RVRNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEV

Query:  FVNTKNQTIEHQDCYPE
        FVNTK QTIEHQDCYPE
Subjt:  FVNTKNQTIEHQDCYPE

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G52330.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

4.2e-36

38.16

Show/hide

Query:  DSAPVPYSLLPQNAGQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASVRVRNKNFFS
        D  P+P S    ++ + N  VL   HP     RR +    L S A +L+    ++ +PSDP ++++R+K++   V   PV  +D++   +++V N + +S
Subjt:  DSAPVPYSLLPQNAGQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASVRVRNKNFFS

Query:  LDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEVFVNTKNQTI
         D+  L V++ YRG+ LG VSS+GG V+A GSS+++A  +L+G+ V  D  +L+ DL KG + FDT TE  G +G  F +FP+KA+V+C + V+T NQTI
Subjt:  LDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEVFVNTKNQTI

Query:  EHQDCYP
          Q C P
Subjt:  EHQDCYP

AT1G52330.2 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

1.9e-28

36.56

Show/hide

Query:  DSAPVPYSLLPQNAGQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASVRVRNKNFFS
        D  P+P S    ++ + N  VL   HP     RR +    L S A +L+    ++ +PSDP ++++R+K++   V   PV  +D++   +++V N + +S
Subjt:  DSAPVPYSLLPQNAGQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASVRVRNKNFFS

Query:  LDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKAR
         D+  L V++ YRG+ LG VSS+GG V+A GSS+++A  +L+G+ V  D  +L+ DL KG + FDT TE  G +G  F +FP+K R
Subjt:  LDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKAR

AT4G13270.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

1.1e-52

48.61

Show/hide

Query:  SSSRVDSAPVPYSLLPQNAGQPNVVVLSLYHPPRYRHR-----RLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSAS
        +SS+ +   +PY+ LP +    +V++L+ Y     RHR     R LR   L++A  LLLSA  +LL+PSDP + + R+ LN   V     + LDLSFS +
Subjt:  SSSRVDSAPVPYSLLPQNAGQPNVVVLSLYHPPRYRHR-----RLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSAS

Query:  VRVRNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCE
        ++VRN++FFSLDY+ L VS+GYRGR LG V S+GG + AR SS+++ATL+L+G+EV+HD  YL+ DL KGVIPFDT  +V+G +G      PI+ +VSCE
Subjt:  VRVRNKNFFSLDYNYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCE

Query:  VFVNTKNQTIEHQDCY
        V+VN  NQ I HQDC+
Subjt:  VFVNTKNQTIEHQDCY

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGACCTCCAGCTCCAGGGTCGATTCTGCCCCTGTGCCCTATTCTCTTCTTCCCCAAAATGCCGGACAGCCAAACGTCGTCGTTTTATCCCTCTACCATCCCCCTCGATA
CCGACATCGACGACTTCTCCGCCTCTGTGCCCTCTACTCCGCCGCCTTCCTCCTCCTCTCCGCCGTAGCTTTTCTACTTTTCCCCTCCGATCCGTCGCTCCAACTCGTCC
GATTGAAACTCAATCGCGCCAAAGTCCGTTTGTTGCCTGTTGTCGTCCTTGACCTTTCCTTCTCTGCTTCTGTTAGGGTTCGCAATAAGAACTTCTTCTCTCTCGATTAC
AATTACCTTGGCGTTTCGGTCGGCTACCGGGGAAGACGACTTGGATTTGTCAGCTCCGAGGGCGGTCGAGTTTCTGCTCGAGGGTCTTCTTTTGTGAATGCCACTCTTGA
TTTGAATGGGATTGAAGTCATTCACGATGCCTTTTACTTGCTTGAGGATTTGGGGAAAGGCGTCATTCCATTCGATACGGAGACGGAAGTCGAAGGATACATGGGGTTTT
TCTTTATCAAATTCCCCATTAAGGCAAGGGTATCATGTGAGGTATTTGTGAATACCAAAAACCAAACAATTGAACATCAAGATTGTTACCCTGAGTGA

mRNA sequence

Show/hide mRNA sequence

GCACGGCATCACAAAATTCAGTTCCCGTTTTTAATTTTCTCTACCAAAAAACATGACCTCCAGCTCCAGGGTCGATTCTGCCCCTGTGCCCTATTCTCTTCTTCCCCAAA
ATGCCGGACAGCCAAACGTCGTCGTTTTATCCCTCTACCATCCCCCTCGATACCGACATCGACGACTTCTCCGCCTCTGTGCCCTCTACTCCGCCGCCTTCCTCCTCCTC
TCCGCCGTAGCTTTTCTACTTTTCCCCTCCGATCCGTCGCTCCAACTCGTCCGATTGAAACTCAATCGCGCCAAAGTCCGTTTGTTGCCTGTTGTCGTCCTTGACCTTTC
CTTCTCTGCTTCTGTTAGGGTTCGCAATAAGAACTTCTTCTCTCTCGATTACAATTACCTTGGCGTTTCGGTCGGCTACCGGGGAAGACGACTTGGATTTGTCAGCTCCG
AGGGCGGTCGAGTTTCTGCTCGAGGGTCTTCTTTTGTGAATGCCACTCTTGATTTGAATGGGATTGAAGTCATTCACGATGCCTTTTACTTGCTTGAGGATTTGGGGAAA
GGCGTCATTCCATTCGATACGGAGACGGAAGTCGAAGGATACATGGGGTTTTTCTTTATCAAATTCCCCATTAAGGCAAGGGTATCATGTGAGGTATTTGTGAATACCAA
AAACCAAACAATTGAACATCAAGATTGTTACCCTGAGTGAGGGGAAGGATAGAAATTCAGTTTTAGACTTTTATGACGTGAAGTTGGTAAGTGGGAACTCCCCTGATCCT
GCTGAATTTGTCTGTAATTATCACTCGTAGAAAGTTAGGCTCCATTGTGGCATGCTAGGGACTTGAAAGAAGAAAATGGTGAATATCTCTGTGGATTATTACATAAGAAC
CATGTTATTTATTTATTTATAATTTTCTCTATTAGAGTAGAGCTCAGATTCTTACACACGTTATAGTTTGTTCATGTGTACATGTGTGGCAGTCATTGCTATTGCATTAA
TAAGAGTAAATTCTGTTTCTATT

Protein sequence

Show/hide protein sequence

MTSSSRVDSAPVPYSLLPQNAGQPNVVVLSLYHPPRYRHRRLLRLCALYSAAFLLLSAVAFLLFPSDPSLQLVRLKLNRAKVRLLPVVVLDLSFSASVRVRNKNFFSLDY
NYLGVSVGYRGRRLGFVSSEGGRVSARGSSFVNATLDLNGIEVIHDAFYLLEDLGKGVIPFDTETEVEGYMGFFFIKFPIKARVSCEVFVNTKNQTIEHQDCYPE

Tan0013842 (gene) of Snake gourd v1 genome