CuGenDBv2

Gene ID	Tan0013152
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Unknown protein
Genome location	LG10:18905616..18912162
RNA-Seq Expression	Tan0013152
Synteny	Tan0013152
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_004137519.1 uncharacterized protein LOC101204111 isoform X2 [Cucumis sativus]

4.1e-96

70.07

Show/hide

Query:  MTTALVALQFPFLSPTASKKFPYPFFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMI
        M TAL ALQF FLSP ASKK  YPFFS S  RNGVQF+GC N SN R AQG FDP+L  VLELATNSELYELEQI F P YF+PLM+SI NRG+ DY+MI
Subjt:  MTTALVALQFPFLSPTASKKFPYPFFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMI

Query:  EEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTLA
        EEDLEERD FIS+LESRFL+L  DARSTLRGWRPSYRDVLLTVRKK NVLCSTKLSSEDLEAEIFLH       EESVRQ+N++G+LQLGL+QWKVQT A
Subjt:  EEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTLA

Query:  ATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLA
        ATDG+ DLQSLIL+          G LIT+VKM Q+FA TL GK+F+EA NYQIKKEIIKK   +   N  ++++L +AQ  LA
Subjt:  ATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLA

XP_008467154.1 PREDICTED: uncharacterized protein LOC103504561 isoform X2 [Cucumis melo]

2.7e-95

70.07

Show/hide

Query:  MTTALVALQFPFLSPTASKKFPYPFFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMI
        MTT L ALQF FLSP  SKK  YPFFS S  R GVQF+GC N SN R AQG FDPEL  VLELATNSELYELE I F P YF+PLM+SI NRG+TDY+MI
Subjt:  MTTALVALQFPFLSPTASKKFPYPFFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMI

Query:  EEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTLA
        EEDLEERD FISTLESRFL+L  DARSTLRGWRPSYRDVLLTVRKK NV CSTKLSSEDLEAEIFLH       EESVR++N++GSLQLGL+ WKVQTLA
Subjt:  EEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTLA

Query:  ATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLA
        ATDG+ DLQSLILK          G LIT+VKM Q+FA TL GK+F+EA NYQIKKEIIKK   +   N  ++++L +AQ  LA
Subjt:  ATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLA

XP_022137611.1 uncharacterized protein LOC111009011 isoform X2 [Momordica charantia]

7.0e-96

68.92

Show/hide

Query:  MTTALVALQFPFLSPTASKKFPYPFFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMI
        M TAL ALQF F+SP  SKKF YPFFS S  RNGVQF+ CAN S SR  +GAFDPEL  VLELATNSELYELEQI F P YF+PLM+SI NRG+TDY+MI
Subjt:  MTTALVALQFPFLSPTASKKFPYPFFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMI

Query:  EEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTLA
        EEDLEERD+FIS LESRFL+L  DARSTLRGWRPSYRDVLLTVRKK NV CSTKLSSEDLEAEIFLH       EESVRQSN++GSLQLGL++WKVQTLA
Subjt:  EEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTLA

Query:  ATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLANKCNLATMKLGF
        ATDG+ DL+SLILK          G LIT V+M QMFA TL GK+F+EA NYQIKKEIIKK   +   N  ++++L +AQ  LA     A+  LGF
Subjt:  ATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLANKCNLATMKLGF

XP_031736268.1 uncharacterized protein LOC101204111 isoform X1 [Cucumis sativus]

4.1e-96

70.07

Show/hide

Query:  MTTALVALQFPFLSPTASKKFPYPFFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMI
        M TAL ALQF FLSP ASKK  YPFFS S  RNGVQF+GC N SN R AQG FDP+L  VLELATNSELYELEQI F P YF+PLM+SI NRG+ DY+MI
Subjt:  MTTALVALQFPFLSPTASKKFPYPFFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMI

Query:  EEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTLA
        EEDLEERD FIS+LESRFL+L  DARSTLRGWRPSYRDVLLTVRKK NVLCSTKLSSEDLEAEIFLH       EESVRQ+N++G+LQLGL+QWKVQT A
Subjt:  EEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTLA

Query:  ATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLA
        ATDG+ DLQSLIL+          G LIT+VKM Q+FA TL GK+F+EA NYQIKKEIIKK   +   N  ++++L +AQ  LA
Subjt:  ATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLA

XP_038893597.1 uncharacterized protein LOC120082484 [Benincasa hispida]

9.5e-101

72.39

Show/hide

Query:  MTTALVALQFPFLSPTASKKFPYP-FFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSM
        MTTAL ALQF FLSP ASKKF YP FFS SR RNGVQF+ CAN  N R AQGAFDPEL  VLELATNSELYELEQI F P YF+PLM+SI NRG+TDY+M
Subjt:  MTTALVALQFPFLSPTASKKFPYP-FFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSM

Query:  IEEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTL
        IEEDLEERD+FISTLESRFLYL  DARSTLRGWRPSYRDVLLTVRKK NV CSTKLSSEDLEAEIFLH       EESV QSN++GSLQLGLNQWKVQTL
Subjt:  IEEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTL

Query:  AATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLANKCNLATMKLGF
        AATDG+ DLQSLILK          G LITMVKM Q+FA TL GK+FQEA NYQIKKEIIKK   +   N  ++++L +AQ  LA     A+  LGF
Subjt:  AATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLANKCNLATMKLGF

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LT63 Uncharacterized protein

2.0e-96

70.07

Show/hide

Query:  MTTALVALQFPFLSPTASKKFPYPFFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMI
        M TAL ALQF FLSP ASKK  YPFFS S  RNGVQF+GC N SN R AQG FDP+L  VLELATNSELYELEQI F P YF+PLM+SI NRG+ DY+MI
Subjt:  MTTALVALQFPFLSPTASKKFPYPFFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMI

Query:  EEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTLA
        EEDLEERD FIS+LESRFL+L  DARSTLRGWRPSYRDVLLTVRKK NVLCSTKLSSEDLEAEIFLH       EESVRQ+N++G+LQLGL+QWKVQT A
Subjt:  EEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTLA

Query:  ATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLA
        ATDG+ DLQSLIL+          G LIT+VKM Q+FA TL GK+F+EA NYQIKKEIIKK   +   N  ++++L +AQ  LA
Subjt:  ATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLA

A0A1S3CSV2 uncharacterized protein LOC103504561 isoform X2

1.3e-95

70.07

Show/hide

Query:  MTTALVALQFPFLSPTASKKFPYPFFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMI
        MTT L ALQF FLSP  SKK  YPFFS S  R GVQF+GC N SN R AQG FDPEL  VLELATNSELYELE I F P YF+PLM+SI NRG+TDY+MI
Subjt:  MTTALVALQFPFLSPTASKKFPYPFFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMI

Query:  EEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTLA
        EEDLEERD FISTLESRFL+L  DARSTLRGWRPSYRDVLLTVRKK NV CSTKLSSEDLEAEIFLH       EESVR++N++GSLQLGL+ WKVQTLA
Subjt:  EEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTLA

Query:  ATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLA
        ATDG+ DLQSLILK          G LIT+VKM Q+FA TL GK+F+EA NYQIKKEIIKK   +   N  ++++L +AQ  LA
Subjt:  ATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLA

A0A5D3BIW0 Uncharacterized protein

3.2e-94

69.82

Show/hide

Query:  MTTALVALQFPFLSPTASKKFPYP-FFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSM
        MTT L ALQF FLSP  SKK  YP FFS S  R GVQF+GC N SN R AQG FDPEL  VLELATNSELYELE I F P YF+PLM+SI NRG+TDY+M
Subjt:  MTTALVALQFPFLSPTASKKFPYP-FFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSM

Query:  IEEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTL
        IEEDLEERD FISTLESRFL+L  DARSTLRGWRPSYRDVLLTVRKK NV CSTKLSSEDLEAEIFLH       EESVR++N++GSLQLGL+ WKVQTL
Subjt:  IEEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTL

Query:  AATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLA
        AATDG+ DLQSLILK          G LIT+VKM Q+FA TL GK+F+EA NYQIKKEIIKK   +   N  ++++L +AQ  LA
Subjt:  AATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLA

A0A6J1C746 uncharacterized protein LOC111009011 isoform X1

8.4e-95

68.69

Show/hide

Query:  MTTALVALQFPFLSPTASKKFPYP-FFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSM
        M TAL ALQF F+SP  SKKF YP FFS S  RNGVQF+ CAN S SR  +GAFDPEL  VLELATNSELYELEQI F P YF+PLM+SI NRG+TDY+M
Subjt:  MTTALVALQFPFLSPTASKKFPYP-FFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSM

Query:  IEEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTL
        IEEDLEERD+FIS LESRFL+L  DARSTLRGWRPSYRDVLLTVRKK NV CSTKLSSEDLEAEIFLH       EESVRQSN++GSLQLGL++WKVQTL
Subjt:  IEEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTL

Query:  AATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLANKCNLATMKLGF
        AATDG+ DL+SLILK          G LIT V+M QMFA TL GK+F+EA NYQIKKEIIKK   +   N  ++++L +AQ  LA     A+  LGF
Subjt:  AATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLANKCNLATMKLGF

A0A6J1C749 uncharacterized protein LOC111009011 isoform X2

3.4e-96

68.92

Show/hide

Query:  MTTALVALQFPFLSPTASKKFPYPFFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMI
        M TAL ALQF F+SP  SKKF YPFFS S  RNGVQF+ CAN S SR  +GAFDPEL  VLELATNSELYELEQI F P YF+PLM+SI NRG+TDY+MI
Subjt:  MTTALVALQFPFLSPTASKKFPYPFFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMI

Query:  EEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTLA
        EEDLEERD+FIS LESRFL+L  DARSTLRGWRPSYRDVLLTVRKK NV CSTKLSSEDLEAEIFLH       EESVRQSN++GSLQLGL++WKVQTLA
Subjt:  EEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHF------EESVRQSNIDGSLQLGLNQWKVQTLA

Query:  ATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLANKCNLATMKLGF
        ATDG+ DL+SLILK          G LIT V+M QMFA TL GK+F+EA NYQIKKEIIKK   +   N  ++++L +AQ  LA     A+  LGF
Subjt:  ATDGSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKK---VLVWNFVNQLSLTLAQILLANKCNLATMKLGF

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G73470.1 unknown protein

5.4e-54

44.06

Show/hide

Query:  RNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMIEEDLEERDEFISTLESRFLYLVVDARSTLRG
        R  + F   +  ++   ++  +DPEL  V ELAT+SELYELE+I F P YF+PL++SI N+G  D  MI +D+E RD FI  LESRFL+L  DARSTLRG
Subjt:  RNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMIEEDLEERDEFISTLESRFLYLVVDARSTLRG

Query:  WRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHFE---------------ESVRQSNIDGSLQLGLNQWKVQTLAATD-GSFDLQSLILKILVLLEL
        WRPSYR+VLL VR   N+ CS++L +EDLEAEIFL+                 E+   S  +GSL+LGL++WKV+ LAA   G+ ++QS+ILK       
Subjt:  WRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHFE---------------ESVRQSNIDGSLQLGLNQWKVQTLAATD-GSFDLQSLILKILVLLEL

Query:  FTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKKVLVWNFVNQLSLTLAQILLANKCNLATMKLGFLGFVKPCLATKARL
           G +IT  K+ Q+ A  L GK+F EA NYQI+KE++KK              A I L ++  L   K GF G     +  K  +
Subjt:  FTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKKVLVWNFVNQLSLTLAQILLANKCNLATMKLGFLGFVKPCLATKARL

AT1G73470.2 unknown protein

3.0e-36

43.84

Show/hide

Query:  MIEEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHFE---------------ESVRQSNIDGSLQL
        MI +D+E RD FI  LESRFL+L  DARSTLRGWRPSYR+VLL VR   N+ CS++L +EDLEAEIFL+                 E+   S  +GSL+L
Subjt:  MIEEDLEERDEFISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHFE---------------ESVRQSNIDGSLQL

Query:  GLNQWKVQTLAATD-GSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKKVLVWNFVNQLSLTLAQILLANKCNLAT
        GL++WKV+ LAA   G+ ++QS+ILK          G +IT  K+ Q+ A  L GK+F EA NYQI+KE++KK              A I L ++  L  
Subjt:  GLNQWKVQTLAATD-GSFDLQSLILKILVLLELFTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKKVLVWNFVNQLSLTLAQILLANKCNLAT

Query:  MKLGFLGFVKPCLATKARL
         K GF G     +  K  +
Subjt:  MKLGFLGFVKPCLATKARL

AT1G73470.3 unknown protein

5.4e-54

44.06

Show/hide

Query:  RNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMIEEDLEERDEFISTLESRFLYLVVDARSTLRG
        R  + F   +  ++   ++  +DPEL  V ELAT+SELYELE+I F P YF+PL++SI N+G  D  MI +D+E RD FI  LESRFL+L  DARSTLRG
Subjt:  RNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMIEEDLEERDEFISTLESRFLYLVVDARSTLRG

Query:  WRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHFE---------------ESVRQSNIDGSLQLGLNQWKVQTLAATD-GSFDLQSLILKILVLLEL
        WRPSYR+VLL VR   N+ CS++L +EDLEAEIFL+                 E+   S  +GSL+LGL++WKV+ LAA   G+ ++QS+ILK       
Subjt:  WRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHFE---------------ESVRQSNIDGSLQLGLNQWKVQTLAATD-GSFDLQSLILKILVLLEL

Query:  FTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKKVLVWNFVNQLSLTLAQILLANKCNLATMKLGFLGFVKPCLATKARL
           G +IT  K+ Q+ A  L GK+F EA NYQI+KE++KK              A I L ++  L   K GF G     +  K  +
Subjt:  FTHGILITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKKVLVWNFVNQLSLTLAQILLANKCNLATMKLGFLGFVKPCLATKARL

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGACGACTGCTTTGGTTGCGCTTCAATTCCCCTTCCTTTCTCCAACCGCTTCCAAAAAATTTCCATATCCCTTTTTCAGCTTTTCTAGGGGTAGAAATGGTGTACAATT
TCTGGGTTGTGCGAATGTTTCCAATTCAAGAATTGCCCAAGGTGCTTTTGACCCAGAATTGCATTTTGTGCTTGAACTCGCCACGAATTCTGAATTATACGAGCTTGAAC
AAATCTTCTTCGACCCCATTTACTTCAACCCTTTGATGGAATCGATTGCGAACAGAGGCGAAACTGATTATTCTATGATTGAGGAAGACCTTGAAGAGAGAGATGAGTTT
ATTTCAACACTAGAATCTCGATTCTTATATCTTGTTGTTGATGCTCGGTCGACATTAAGGGGTTGGAGACCATCTTATAGAGATGTCTTGCTTACAGTGAGAAAAAAGTT
CAACGTTCTTTGCTCAACCAAGCTGTCATCCGAAGACCTTGAAGCAGAAATATTTCTTCATTTTGAAGAATCAGTAAGGCAGTCTAACATTGATGGTAGTCTACAACTTG
GACTCAATCAGTGGAAAGTGCAAACTTTAGCAGCTACAGATGGCTCATTTGACCTGCAATCCTTGATATTAAAGATATTGGTTTTATTAGAACTTTTCACACATGGCATT
TTGATAACTATGGTTAAAATGTTGCAAATGTTTGCTATGACATTATTTGGGAAGATATTCCAAGAAGCAACCAACTATCAAATTAAAAAGGAAATCATCAAAAAGGTACT
CGTGTGGAACTTTGTCAACCAACTATCCCTAACTCTTGCCCAAATTCTTTTGGCTAACAAATGCAACCTAGCCACCATGAAATTGGGATTTTTAGGATTCGTCAAGCCTT
GCTTAGCCACTAAAGCTCGGTTAAATCCCATCAAAACTCTAAAATTCAAACTGGCCAATTCTTTCCACCAACTATCATGTTTTGTTCTTATTTTTTACAATTCGTTCTTG
ACTTCTTCATTTGTTGATTTAAGTGGACTCGAGAGATAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MTTALVALQFPFLSPTASKKFPYPFFSFSRGRNGVQFLGCANVSNSRIAQGAFDPELHFVLELATNSELYELEQIFFDPIYFNPLMESIANRGETDYSMIEEDLEERDEF
ISTLESRFLYLVVDARSTLRGWRPSYRDVLLTVRKKFNVLCSTKLSSEDLEAEIFLHFEESVRQSNIDGSLQLGLNQWKVQTLAATDGSFDLQSLILKILVLLELFTHGI
LITMVKMLQMFAMTLFGKIFQEATNYQIKKEIIKKVLVWNFVNQLSLTLAQILLANKCNLATMKLGFLGFVKPCLATKARLNPIKTLKFKLANSFHQLSCFVLIFYNSFL
TSSFVDLSGLER

Tan0013152 (gene) of Snake gourd v1 genome