CuGenDBv2

Gene ID	Tan0008197
Organism	Trichosanthes anguina (Snake gourd v1)
Description	CCHC-type domain-containing protein
Genome location	LG09:10437192..10442262
RNA-Seq Expression	Tan0008197
Synteny	Tan0008197
Gene Ontology terms	NA
InterPro domains	IPR025836 - Zinc knuckle CX2CX4HX4C IPR036691 - Endonuclease/exonuclease/phosphatase superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

PPD84469.1 hypothetical protein GOBAR_DD18598 [Gossypium barbadense]

3.6e-22

31.1

Show/hide

Query:  VGDGVRFYTILDLGEDNYSWGANMRVWIRIDVSKSLRRGIK-INIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNTFHQYGQWLRY
        VG+ +     +D  + N  W   +R+ I+I++S  +RR +K +  D     C   +KYE+L   C +CG+IGH  K C    ++        QYG WLR 
Subjt:  VGDGVRFYTILDLGEDNYSWGANMRVWIRIDVSKSLRRGIK-INIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNTFHQYGQWLRY

Query:  IGKLSKIAKTPISGGKGGDLVLK--PKVKEGRGGK-DSTDVSDQHRTPGLRKAFLILKTMEQEKWQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIG
        +  ++   +  I G  G ++++K  P  ++  G K D+ + S Q       K            ++FTG YG  D   R  +W++LRK+       W+IG
Subjt:  IGKLSKIAKTPISGGKGGDLVLK--PKVKEGRGGK-DSTDVSDQHRTPGLRKAFLILKTMEQEKWQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIG

Query:  GDLNEILRDYEKVGGEPRDRSLISNFRNVLYDCELKDLGCEGNLLTWCNIRNGD
        GD N IL + EK GG  + ++LI +FR V+ +  L DL  +     W N R GD
Subjt:  GDLNEILRDYEKVGGEPRDRSLISNFRNVLYDCELKDLGCEGNLLTWCNIRNGD

TXG69190.1 hypothetical protein EZV62_004125 [Acer yangbiense]

5.1e-24

28.38

Show/hide

Query:  TMEQEK-WQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIGGDLNEILRDYEKVGGEPRDRSLISNFRNVLYDCELKDLGCEGNLLTWCNIRNGDDQM
        T+  +K W+ TG YG P+   R   W LLR+L  +   PW +GGD NEI+   EKVGG  R    + NF+  L DC L+DLG  G   TW N R+ +  +
Subjt:  TMEQEK-WQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIGGDLNEILRDYEKVGGEPRDRSLISNFRNVLYDCELKDLGCEGNLLTWCNIRNGDDQM

Query:  GQGSEFWVGTKGQIIERGTKEAYAQPRPLDFKVINDMEIELETLLHQEEQYWRQRQNTDDLHVADFITPTRSWDMSKLAQYFDEQEVDGEHDFPTQRRWF
         +  +  VG  G +       +    + LDF   +   I LE    +EE   R R   D           R W          E++     DF +Q  + 
Subjt:  GQGSEFWVGTKGQIIERGTKEAYAQPRPLDFKVINDMEIELETLLHQEEQYWRQRQNTDDLHVADFITPTRSWDMSKLAQYFDEQEVDGEHDFPTQRRWF

Query:  DVV-------DIVQQEDFELVLIGVWSIWNDRNNVVHNRPIMNFE--DRCGWIVDYLHRFKHLNSPGVSRSGVQKESLC----EVPRGCVKVFVDVACDE
        D V       DI+    FE + +  W +W  RN +V+ +        D   W   ++  FK   +  V    V K+ +       P G  K+  D   D 
Subjt:  DVV-------DIVQQEDFELVLIGVWSIWNDRNNVVHNRPIMNFE--DRCGWIVDYLHRFKHLNSPGVSRSGVQKESLC----EVPRGCVKVFVDVACDE

Query:  VNKRVGFGVAIVSADGKLIVTMENCGQNYISPQ----IDVRDGARLASQMGFKHCLNFSDSLVVISMVNN
          K  G GV I    G ++ ++       + PQ    + V  G RLA + G       SDSL V++++N+
Subjt:  VNKRVGFGVAIVSADGKLIVTMENCGQNYISPQ----IDVRDGARLASQMGFKHCLNFSDSLVVISMVNN

XP_010686122.1 PREDICTED: uncharacterized protein LOC104900404 [Beta vulgaris subsp. vulgaris]

1.0e-24

33.47

Show/hide

Query:  ILDLGEDNYSWGANMRVWIRIDVSKSLRRGIKINI-DGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNTFHQYGQWLRYIGKLSKIAK
        +L++  D   W  + RV I +D+ K LRR  +I++ DG      + +KYE+L   C  CG+IGH  +DC          N   Q+G WLR   +  + +K
Subjt:  ILDLGEDNYSWGANMRVWIRIDVSKSLRRGIKINI-DGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNTFHQYGQWLRYIGKLSKIAK

Query:  TPISGGKGGDLVLKPKVKEGRGGKDSTDVSDQHRTPGLRKAFLILKTMEQ-EKWQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIGGDLNEILRDYE
             G+  D V         G K++ D +         K  +    + + E+W+F G+YG P+   + +TWEL+R L    D P V+GGD NEIL   E
Subjt:  TPISGGKGGDLVLKPKVKEGRGGKDSTDVSDQHRTPGLRKAFLILKTMEQ-EKWQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIGGDLNEILRDYE

Query:  KVGGEPRDRSLISNFRNVLYDCELKDLGCEGNLLTW
        K GG  R+R  +  FR V+  C L+DL   G   TW
Subjt:  KVGGEPRDRSLISNFRNVLYDCELKDLGCEGNLLTW

XP_022158377.1 uncharacterized protein LOC111024874 [Momordica charantia]

2.3e-40

27.86

Show/hide

Query:  VGDGVRFYTILDLGEDNYSWGANMRVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNTFHQYGQWLRYI
        +G+ +  +   D  + N  WG+N+RV + +D+SK LRRGIK+N+DGP+GG WIP++YE+L   C HCG+               +S    HQYG WLRY 
Subjt:  VGDGVRFYTILDLGEDNYSWGANMRVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNTFHQYGQWLRYI

Query:  GKL---------------------------------------------------SKIAKTPISGGKGGDLVLKP-KVKEGRGGKDSTDVSD-----QHRT
        G +                                                   S + +TP  G +       P  + EG    +  ++S+     +   
Subjt:  GKL---------------------------------------------------SKIAKTPISGGKGGDLVLKP-KVKEGRGGKDSTDVSD-----QHRT

Query:  PGLRKAFL-ILKTMEQE---KWQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIGGDLNEILRDYEKVGGEPRDRSLISNFRNVLYDCELKDLGCEGN
        P ++ ++   L  M+       +FTG YG P    R  TWELLR++ +++ SPW+IGGD+N IL +YE       D S I  FRN++  C L D+G +G 
Subjt:  PGLRKAFL-ILKTMEQE---KWQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIGGDLNEILRDYEKVGGEPRDRSLISNFRNVLYDCELKDLGCEGN

Query:  LLTWCNIRNGDDQM-----------------------------------------------GQGSEFWVGTKGQIIERGTKEAYAQPRPLDFKVINDMEI
        + TWCN R   DQ+                                               G+ + + +  + +  +    +AY QP PLDF +I+ +E 
Subjt:  LLTWCNIRNGDDQM-----------------------------------------------GQGSEFWVGTKGQIIERGTKEAYAQPRPLDFKVINDMEI

Query:  ELETLLHQEEQYWRQRQNTD
        +L  LL  EE +W+QR   D
Subjt:  ELETLLHQEEQYWRQRQNTD

XP_027118730.1 uncharacterized protein LOC113735973 [Coffea arabica]

7.3e-23

32.66

Show/hide

Query:  SWGANMRVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNTFHQYGQWLRYIGKLSKIAKTPISGGKGG-
        S G  +R+ ++++++  L+R +K+ I+G +  C +  +YE+L   C+ CG IGH  +DC                        KL  +AK   S    G 
Subjt:  SWGANMRVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNTFHQYGQWLRYIGKLSKIAKTPISGGKGG-

Query:  -DLVLKPKVKEGRGGKDSTDVSDQHRTPGLRKAFLILKT-------------MEQEKWQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIGGDLNEIL
         D   +P V+       ST V+ Q R   L     IL T             M    W+ TG YG P+   R  TW+++RKL ++   PWV  GD NE+L
Subjt:  -DLVLKPKVKEGRGGKDSTDVSDQHRTPGLRKAFLILKT-------------MEQEKWQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIGGDLNEIL

Query:  RDYEKVGGEPRDRSLISNFRNVLYDCELKDLGCEGNLLTWCNIRNGDD
           E  G   R +  I NFR  L DC L DLG EGN  TWC  R+  D
Subjt:  RDYEKVGGEPRDRSLISNFRNVLYDCELKDLGCEGNLLTWCNIRNGDD

TrEMBL top hits

e value

%identity

Alignment

A0A2N9E949 CCHC-type domain-containing protein

5.1e-30

33.45

Show/hide

Query:  VGDGVRFYTILDLGEDNYSWGANMRVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNTFH-QYGQWLRY
        VG+ +     +D+ ED  +WG  MRV +RIDVS  L R  ++ + G     W+ +KYEKL   C +CGI+GH  ++C L  ++  SK+  H +YG WLR 
Subjt:  VGDGVRFYTILDLGEDNYSWGANMRVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNTFH-QYGQWLRY

Query:  IGKLSKIAKTPISGG--KGGDLVLKPKVKEG-----------------RGGKDSTDVSDQH-----RTPGLRKAFLI---LKTMEQEK-WQFTGLYGQPD
             K       G   K   +V   ++  G                 +G  +   V   H       P +   FL+   +K +E EK W+ TG YG P+
Subjt:  IGKLSKIAKTPISGG--KGGDLVLKPKVKEG-----------------RGGKDSTDVSDQH-----RTPGLRKAFLI---LKTMEQEK-WQFTGLYGQPD

Query:  HRLRFQTWELLRKLQSIEDSPWVIGGDLNEILRDYEKVGGEPRDRSLISNFRNVLYDCELKDLGCEGNLLTWCNIRNG
           R  +W+LL+ L      PWV+ GD NEIL + EK+G   R  S +++FR  L    L+DLG  G   TW N R G
Subjt:  HRLRFQTWELLRKLQSIEDSPWVIGGDLNEILRDYEKVGGEPRDRSLISNFRNVLYDCELKDLGCEGNLLTWCNIRNG

A0A2N9G3M9 CCHC-type domain-containing protein

6.5e-25

28.27

Show/hide

Query:  VGDGVRFYTILDLGEDNYSWGANMRVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNTFH-QYGQWLRY
        VG+ +     +D+ ED  +WG  MRV +RIDVS  L R  ++ + G     W+ +KYEKL   C +CGI+GH  ++C L  ++  SK+  H +YG WLR 
Subjt:  VGDGVRFYTILDLGEDNYSWGANMRVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNTFH-QYGQWLRY

Query:  IGKLSKIAKTPISG--------------GKGGDLVLKP-----------------------------------------------KVKEGRGGKDSTDVS
             K       G                GG     P                                               KV++         V 
Subjt:  IGKLSKIAKTPISG--------------GKGGDLVLKP-----------------------------------------------KVKEGRGGKDSTDVS

Query:  DQHRTPGLRKAFLILKTMEQEK------------------WQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIGGDLNEILRDYEKVGGEPRDRSLIS
         Q R  GL   +  L  +E +K                  W+ TG YG P+   R  +W+LL+ L      PWV+ GD NEIL + EK+G   R  S ++
Subjt:  DQHRTPGLRKAFLILKTMEQEK------------------WQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIGGDLNEILRDYEKVGGEPRDRSLIS

Query:  NFRNVLYDCELKDLGCEGNLLTWCNIRNG
        +FR  L    L+DLG  G   TW N R G
Subjt:  NFRNVLYDCELKDLGCEGNLLTWCNIRNG

A0A6J1DX30 uncharacterized protein LOC111024874

1.1e-40

27.86

Show/hide

Query:  VGDGVRFYTILDLGEDNYSWGANMRVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNTFHQYGQWLRYI
        +G+ +  +   D  + N  WG+N+RV + +D+SK LRRGIK+N+DGP+GG WIP++YE+L   C HCG+               +S    HQYG WLRY 
Subjt:  VGDGVRFYTILDLGEDNYSWGANMRVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNTFHQYGQWLRYI

Query:  GKL---------------------------------------------------SKIAKTPISGGKGGDLVLKP-KVKEGRGGKDSTDVSD-----QHRT
        G +                                                   S + +TP  G +       P  + EG    +  ++S+     +   
Subjt:  GKL---------------------------------------------------SKIAKTPISGGKGGDLVLKP-KVKEGRGGKDSTDVSD-----QHRT

Query:  PGLRKAFL-ILKTMEQE---KWQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIGGDLNEILRDYEKVGGEPRDRSLISNFRNVLYDCELKDLGCEGN
        P ++ ++   L  M+       +FTG YG P    R  TWELLR++ +++ SPW+IGGD+N IL +YE       D S I  FRN++  C L D+G +G 
Subjt:  PGLRKAFL-ILKTMEQE---KWQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIGGDLNEILRDYEKVGGEPRDRSLISNFRNVLYDCELKDLGCEGN

Query:  LLTWCNIRNGDDQM-----------------------------------------------GQGSEFWVGTKGQIIERGTKEAYAQPRPLDFKVINDMEI
        + TWCN R   DQ+                                               G+ + + +  + +  +    +AY QP PLDF +I+ +E 
Subjt:  LLTWCNIRNGDDQM-----------------------------------------------GQGSEFWVGTKGQIIERGTKEAYAQPRPLDFKVINDMEI

Query:  ELETLLHQEEQYWRQRQNTD
        +L  LL  EE +W+QR   D
Subjt:  ELETLLHQEEQYWRQRQNTD

A0A803PRV4 Uncharacterized protein

3.8e-25

31.41

Show/hide

Query:  RVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNT--FHQYGQWLRY--IGKLSKIAKTPISGGKGGDLV
        R+W  + ++K +  G  +   G     WI  +YE+L  +C  CG IGH  KDC      V  + T     YG+WL+   IG+     K+   G +G   +
Subjt:  RVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNT--FHQYGQWLRY--IGKLSKIAKTPISGGKGGDLV

Query:  LKPKVKEGRGGKD------STDVSDQ-------------HRTPG-----LRK--AFLILKTMEQEK---------------------WQFTGLYGQPDHR
        ++     G G         S ++ DQ             H   G     LRK    ++L  M+ E                      W+FTG YG PD  
Subjt:  LKPKVKEGRGGKD------STDVSDQ-------------HRTPG-----LRK--AFLILKTMEQEK---------------------WQFTGLYGQPDHR

Query:  LRFQTWELLRKLQSIEDSPWVIGGDLNEILRDYEKVGGEPRDRSLISNFRNVLYDCELKDLGCEGNLLTWCNIRNGD
         RF +W+LL+++  +   PWV+GGD NEI+   EK GG P+   LI NFR  L  C L+++G EG+  TWCN R  D
Subjt:  LRFQTWELLRKLQSIEDSPWVIGGDLNEILRDYEKVGGEPRDRSLISNFRNVLYDCELKDLGCEGNLLTWCNIRNGD

A0A803QD63 Uncharacterized protein

4.5e-26

33.33

Show/hide

Query:  RVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNV--NSKNTFHQYGQWLRYIGKLSKIAKTPISGGKGGDLVLK
        RVW  + ++K +  G  +   G     WI  KYE+   +C  CG IGH FKDC+     +  +       YG WL+       + +   + GK G ++L 
Subjt:  RVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNV--NSKNTFHQYGQWLRYIGKLSKIAKTPISGGKGGDLVLK

Query:  PKVKEGRGGKDSTDVSDQHRTPGLRKAFLILKTMEQEKWQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIGGDLNEILRDYEKVGGEPRDRSLISNF
                   S DV  Q  +         ++  + + W+FTG YG PD   R  +W+LL++L  +   PW +GG+ NEIL   EK+GG  +   LI+NF
Subjt:  PKVKEGRGGKDSTDVSDQHRTPGLRKAFLILKTMEQEKWQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIGGDLNEILRDYEKVGGEPRDRSLISNF

Query:  RNVLYDCELKDLGCEGNLLTWCNIR
        R  L  C+L+D+G EG+  TWCN R
Subjt:  RNVLYDCELKDLGCEGNLLTWCNIR

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT2G01050.1 zinc ion binding;nucleic acid binding

1.3e-04

35.82

Show/hide

Query:  LDLGEDNYSWGANMRVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDC
        +D+   N+  G   RV I ++++K L+  + IN D         + YE LSK+CS CGI GH    C
Subjt:  LDLGEDNYSWGANMRVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDC

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGATTTTCAACAAATTCTTGCTAGCTCTGGAACACCCCCTTCTGTTTACGAAGTCGTCGGAGATGGGGTTCGTTTTTACACAATTCTAGATTTAGGGGAGGATAATTA
CTCCTGGGGTGCAAATATGCGAGTTTGGATACGGATCGATGTATCAAAGTCATTGCGGAGAGGGATTAAAATCAATATCGATGGCCCGATGGGAGGATGTTGGATCCCTA
TGAAGTATGAGAAACTTTCGAAATTATGTTCTCATTGCGGTATCATTGGGCATCACTTTAAAGATTGCAGCCTGTTTTACAAGAATGTCAACTCCAAGAATACCTTCCAT
CAATATGGCCAATGGCTTCGGTATATAGGTAAATTATCGAAAATAGCTAAAACCCCTATCTCTGGTGGGAAAGGAGGTGATCTTGTTTTGAAGCCAAAGGTCAAAGAGGG
GAGGGGAGGGAAGGATTCGACTGATGTTTCTGATCAACATAGAACTCCCGGATTGAGGAAGGCGTTTCTAATTCTAAAAACGATGGAACAAGAAAAATGGCAGTTTACGG
GCTTGTATGGACAACCTGACCATAGACTTAGGTTTCAAACTTGGGAGCTTTTGAGAAAGTTACAGTCCATAGAAGATTCCCCTTGGGTGATAGGAGGAGATTTGAACGAA
ATTTTAAGGGACTATGAGAAAGTGGGAGGAGAGCCAAGAGATAGATCCCTGATTTCAAATTTTCGTAATGTGTTGTATGACTGCGAGTTGAAGGATTTGGGTTGTGAAGG
GAATCTGTTGACTTGGTGTAACATAAGGAATGGTGATGATCAGATGGGGCAAGGAAGTGAATTCTGGGTTGGTACCAAAGGTCAAATTATTGAAAGGGGAACTAAAGAAG
CCTATGCACAACCTAGACCTTTAGATTTTAAGGTTATTAATGACATGGAAATCGAATTGGAAACACTTTTACACCAGGAAGAACAATATTGGCGACAGAGACAGAATACG
GATGATCTACATGTAGCAGATTTTATTACGCCTACCCGATCATGGGATATGAGTAAATTGGCTCAATATTTTGATGAACAGGAGGTGGATGGCGAACATGATTTCCCTAC
TCAAAGACGATGGTTTGACGTGGTGGATATAGTCCAACAAGAGGATTTTGAGTTAGTACTGATAGGAGTATGGTCAATTTGGAATGACAGGAACAACGTGGTTCATAATA
GACCCATTATGAATTTCGAGGATAGATGTGGTTGGATTGTTGACTACTTACATAGATTTAAACATCTAAATAGTCCAGGTGTCAGTAGGAGTGGGGTGCAGAAGGAGTCG
TTATGTGAGGTACCGAGGGGTTGTGTTAAGGTCTTTGTGGATGTGGCTTGTGATGAAGTGAATAAAAGAGTAGGGTTTGGGGTAGCTATTGTAAGTGCAGATGGGAAGTT
GATTGTGACAATGGAGAATTGTGGGCAGAATTATATCTCGCCACAGATTGATGTTCGTGATGGGGCTCGTTTGGCTTCTCAAATGGGCTTTAAACATTGTCTCAATTTTT
CTGATTCCTTGGTCGTGATTTCCATGGTCAATAATGGTCATAGTGAAGTTTTGGCGAAAGCTCTAACGGTTATTTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MDFQQILASSGTPPSVYEVVGDGVRFYTILDLGEDNYSWGANMRVWIRIDVSKSLRRGIKINIDGPMGGCWIPMKYEKLSKLCSHCGIIGHHFKDCSLFYKNVNSKNTFH
QYGQWLRYIGKLSKIAKTPISGGKGGDLVLKPKVKEGRGGKDSTDVSDQHRTPGLRKAFLILKTMEQEKWQFTGLYGQPDHRLRFQTWELLRKLQSIEDSPWVIGGDLNE
ILRDYEKVGGEPRDRSLISNFRNVLYDCELKDLGCEGNLLTWCNIRNGDDQMGQGSEFWVGTKGQIIERGTKEAYAQPRPLDFKVINDMEIELETLLHQEEQYWRQRQNT
DDLHVADFITPTRSWDMSKLAQYFDEQEVDGEHDFPTQRRWFDVVDIVQQEDFELVLIGVWSIWNDRNNVVHNRPIMNFEDRCGWIVDYLHRFKHLNSPGVSRSGVQKES
LCEVPRGCVKVFVDVACDEVNKRVGFGVAIVSADGKLIVTMENCGQNYISPQIDVRDGARLASQMGFKHCLNFSDSLVVISMVNNGHSEVLAKALTVI

Tan0008197 (gene) of Snake gourd v1 genome