CuGenDBv2

Gene ID	Tan0008882
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Nucleoid-associated protein
Genome location	LG09:67557576..67560993
RNA-Seq Expression	Tan0008882
Synteny	Tan0008882
Gene Ontology terms	GO:0003677 - DNA binding (molecular function)
InterPro domains	IPR004401 - Nucleoid-associated protein YbaB/EbfC family IPR036894 - Nucleoid-associated protein YbaB-like domain superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6587818.1 Nucleoid-associated protein, chloroplastic, partial [Cucurbita argyrosperma subsp. sororia]

9.8e-92

94.15

Show/hide

Query:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV
        MASTIS+SAQVPNLRG+SDWKKRSNLNSMS I+G R SPYGPWKVEKN RSLCV GLFGGKKENE+KSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV
Subjt:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
        RVQKELA AEFDGYCEGELIKVTLSGNQQPLRTEITEAAM+LGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK

XP_004146679.1 nucleoid-associated protein At2g24020, chloroplastic [Cucumis sativus]

4.1e-90

94.15

Show/hide

Query:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV
        MASTISLSAQ+PNLRG+SD+KKRSNLNSMSNIVG R SPYGPWKVEKNNRSLCVYGLFGGKK+ E+KSDDAPSKAGIFGNMQKLYETVRTAQ+VVQVEAV
Subjt:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
        RVQKELAAAEFDGYCEGELIKVTLSGNQQP+RTEITEAAMELGPEKLSLLVTEAYQDAHQKSV AMKQRMSDLAQSLGMPQGLSEGLK
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK

XP_022932159.1 nucleoid-associated protein At4g30620, chloroplastic-like isoform X1 [Cucurbita moschata]

2.0e-92

94.68

Show/hide

Query:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV
        MASTIS+SAQVPNLRG+SDWKKRSNLNSMS I+G R SPYGPWKVEKNNRSLCV GLFGGKKENE+KSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV
Subjt:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
        RVQKELA AEFDGYCEGELIKVTLSGNQQPLRTEITEAAM+LGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK

XP_038879412.1 nucleoid-associated protein At4g30620, chloroplastic isoform X1 [Benincasa hispida]

3.2e-90

91.75

Show/hide

Query:  MASTISLSAQVPNLRGVSDWKKRS------NLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQV
        MASTISLSAQ+PNLRG+SD+KKRS      NLNS+SNI+GVR SPYGPWKVEK+NRSLCVYGLFGGKK+NE+KSDDAPSKAGIFGNMQKLYETVRTAQ+V
Subjt:  MASTISLSAQVPNLRGVSDWKKRS------NLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQV

Query:  VQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
        VQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
Subjt:  VQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK

XP_038879413.1 nucleoid-associated protein At4g30620, chloroplastic isoform X2 [Benincasa hispida]

3.4e-92

94.68

Show/hide

Query:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV
        MASTISLSAQ+PNLRG+SD+KKRSNLNS+SNI+GVR SPYGPWKVEK+NRSLCVYGLFGGKK+NE+KSDDAPSKAGIFGNMQKLYETVRTAQ+VVQVEAV
Subjt:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
        RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LWF8 Uncharacterized protein

2.0e-90

94.15

Show/hide

Query:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV
        MASTISLSAQ+PNLRG+SD+KKRSNLNSMSNIVG R SPYGPWKVEKNNRSLCVYGLFGGKK+ E+KSDDAPSKAGIFGNMQKLYETVRTAQ+VVQVEAV
Subjt:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
        RVQKELAAAEFDGYCEGELIKVTLSGNQQP+RTEITEAAMELGPEKLSLLVTEAYQDAHQKSV AMKQRMSDLAQSLGMPQGLSEGLK
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK

A0A1S3B9T2 nucleoid-associated protein At2g24020, chloroplastic-like

3.4e-90

94.15

Show/hide

Query:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV
        MASTISLSAQ+PNLRG+SD KKRSNLN MSNIVG R SPYGPWKVEKNNRSLCVYGLFGGKK+ E+KSDDAPSKAGIFGNMQKLYETVRTAQ+VVQVEAV
Subjt:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
        RVQKELAAAEFDGYCEGELIKVTLSGNQQP+RTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK

A0A5A7SUZ8 Nucleoid-associated protein

3.4e-90

94.15

Show/hide

Query:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV
        MASTISLSAQ+PNLRG+SD KKRSNLN MSNIVG R SPYGPWKVEKNNRSLCVYGLFGGKK+ E+KSDDAPSKAGIFGNMQKLYETVRTAQ+VVQVEAV
Subjt:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
        RVQKELAAAEFDGYCEGELIKVTLSGNQQP+RTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK

A0A6J1EW88 nucleoid-associated protein At4g30620, chloroplastic-like isoform X1

9.6e-93

94.68

Show/hide

Query:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV
        MASTIS+SAQVPNLRG+SDWKKRSNLNSMS I+G R SPYGPWKVEKNNRSLCV GLFGGKKENE+KSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV
Subjt:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
        RVQKELA AEFDGYCEGELIKVTLSGNQQPLRTEITEAAM+LGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK

A0A6J1HN29 nucleoid-associated protein At4g30620, chloroplastic-like isoform X1

9.6e-93

94.68

Show/hide

Query:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV
        MASTIS+SAQVPNLRG+SDWKKRSNLNSMS I+G R SPYGPWKVEKNNRSLCV GLFGGKKENE+KSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV
Subjt:  MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
        RVQKELA AEFDGYCEGELIKVTLSGNQQPLRTEITEAAM+LGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK

SwissProt top hits

e value

%identity

Alignment

B7K422 Nucleoid-associated protein PCC8801_2554

1.5e-13

41.18

Show/hide

Query:  GNMQKLYETVRTAQQVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLG
        G +++L E    AQQ VQ  A ++Q+EL   E +G+ EG+L+KV +SGNQ+P    I   A+E G ++LS LVT+A +DA+ +S + M+ +M +L   L 
Subjt:  GNMQKLYETVRTAQQVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLG

Query:  MP
        +P
Subjt:  MP

O82230 Nucleoid-associated protein At2g24020, chloroplastic

7.2e-53

76.03

Show/hide

Query:  WKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMEL
        +K +   RSL V GLFGG  + ++ S+D  SKAGIFGNMQ +YETV+ AQ VVQVEAVRVQKELAAAEFDGYC GEL+KVTLSGNQQP+RT+ITEAAMEL
Subjt:  WKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMEL

Query:  GPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
        G EKLS LVTEAY+DAH KSV AMK+RMSDLAQSLGMP GLSEG+K
Subjt:  GPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK

Q5N376 Nucleoid-associated protein syc1054_d

1.3e-14

47.06

Show/hide

Query:  GNMQKLYETVRTAQQVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLG
        G M++L +  + AQQ VQ  A +VQ++L   E +G  +G L+KV +SGNQ+PLR EI   A+  G E LS LV  A +DA+QKS  AMK++M  L   LG
Subjt:  GNMQKLYETVRTAQQVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLG

Query:  MP
        +P
Subjt:  MP

Q8GMT0 Nucleoid-associated protein Synpcc7942_0464

1.3e-14

47.06

Show/hide

Query:  GNMQKLYETVRTAQQVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLG
        G M++L +  + AQQ VQ  A +VQ++L   E +G  +G L+KV +SGNQ+PLR EI   A+  G E LS LV  A +DA+QKS  AMK++M  L   LG
Subjt:  GNMQKLYETVRTAQQVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLG

Query:  MP
        +P
Subjt:  MP

Q9M098 Nucleoid-associated protein At4g30620, chloroplastic

2.1e-52

71.6

Show/hide

Query:  NSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSG
        +S  NIV +     G      NNRSL V GLFGG K  +D  +D  SKAGI GNMQ LYETV+ AQ VVQVEAVRVQKELA AEFDGYC+GEL+KVTLSG
Subjt:  NSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSG

Query:  NQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
        NQQP+RT+IT+AAMELG EKLSLLVTEAY+DAH KSV AMK+RMSDLAQSLGMP GL +GLK
Subjt:  NQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK

Arabidopsis top hits

e value

%identity

Alignment

AT2G24020.1 Uncharacterised BCR, YbaB family COG0718

5.1e-54

76.03

Show/hide

Query:  WKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMEL
        +K +   RSL V GLFGG  + ++ S+D  SKAGIFGNMQ +YETV+ AQ VVQVEAVRVQKELAAAEFDGYC GEL+KVTLSGNQQP+RT+ITEAAMEL
Subjt:  WKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMEL

Query:  GPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
        G EKLS LVTEAY+DAH KSV AMK+RMSDLAQSLGMP GLSEG+K
Subjt:  GPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK

AT2G24020.2 Uncharacterised BCR, YbaB family COG0718

5.1e-54

76.03

Show/hide

Query:  WKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMEL
        +K +   RSL V GLFGG  + ++ S+D  SKAGIFGNMQ +YETV+ AQ VVQVEAVRVQKELAAAEFDGYC GEL+KVTLSGNQQP+RT+ITEAAMEL
Subjt:  WKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPLRTEITEAAMEL

Query:  GPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
        G EKLS LVTEAY+DAH KSV AMK+RMSDLAQSLGMP GLSEG+K
Subjt:  GPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK

AT4G30620.1 Uncharacterised BCR, YbaB family COG0718

1.5e-53

71.6

Show/hide

Query:  NSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSG
        +S  NIV +     G      NNRSL V GLFGG K  +D  +D  SKAGI GNMQ LYETV+ AQ VVQVEAVRVQKELA AEFDGYC+GEL+KVTLSG
Subjt:  NSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSG

Query:  NQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK
        NQQP+RT+IT+AAMELG EKLSLLVTEAY+DAH KSV AMK+RMSDLAQSLGMP GL +GLK
Subjt:  NQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCGTCGACAATATCTCTGAGTGCTCAAGTACCAAATCTGCGAGGAGTTTCTGATTGGAAAAAACGAAGTAACCTAAATTCAATGTCAAATATAGTTGGTGTACGGAA
CTCACCTTATGGTCCTTGGAAAGTTGAGAAAAACAATAGATCTCTCTGTGTTTATGGTCTATTTGGAGGAAAAAAGGAGAATGAGGATAAGAGTGATGATGCACCTTCAA
AGGCAGGAATCTTTGGAAACATGCAGAAGTTATATGAGACTGTGAGGACAGCGCAACAGGTTGTCCAAGTAGAGGCAGTGCGTGTACAGAAAGAACTTGCGGCGGCAGAG
TTTGATGGCTACTGCGAAGGAGAGCTAATAAAGGTGACATTATCCGGGAATCAGCAACCTCTTCGCACTGAGATCACCGAGGCTGCAATGGAATTAGGACCAGAAAAACT
GTCCCTTCTAGTCACTGAAGCATACCAGGATGCGCACCAGAAGAGCGTTCAGGCCATGAAGCAAAGAATGAGCGATCTTGCCCAGAGCTTAGGAATGCCCCAGGGCCTCA
GTGAGGGATTGAAGTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MASTISLSAQVPNLRGVSDWKKRSNLNSMSNIVGVRNSPYGPWKVEKNNRSLCVYGLFGGKKENEDKSDDAPSKAGIFGNMQKLYETVRTAQQVVQVEAVRVQKELAAAE
FDGYCEGELIKVTLSGNQQPLRTEITEAAMELGPEKLSLLVTEAYQDAHQKSVQAMKQRMSDLAQSLGMPQGLSEGLK

Tan0008882 (gene) of Snake gourd v1 genome