CuGenDBv2

Gene ID	Tan0021305
Organism	Trichosanthes anguina (Snake gourd v1)
Description	WHy domain-containing protein
Genome location	LG05:917481..918630
RNA-Seq Expression	Tan0021305
Synteny	Tan0021305
Gene Ontology terms	GO:0009269 - response to desiccation (biological process) GO:0016021 - integral component of membrane (cellular component)
InterPro domains	IPR004864 - Late embryogenesis abundant protein, LEA_2 subgroup IPR013990 - Water stress and hypersensitive response domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0061714.1 late embryogenesis abundant hydroxyproline-rich glycoprotein [Cucumis melo var. makuwa]

3.6e-91

92.86

Show/hide

Query:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS
        MG+KRNWSW SALVGAASA+AA+AIISAKPKDPTFHLISIKFTSFKLKPPV+DAELILTVHVTNPNVAPIHYSSTAMSIFY+GSLLGSAQVDAGSQ+PRS
Subjt:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS

Query:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL
        CQVLRLPARLDGLKLAHHGSRFISDV KREMVLDASVDIGG AK+LWW+HKFKVHVDSHLTVDPVFLDVLDQENTS+L+LFL
Subjt:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL

KAE8647360.1 hypothetical protein Csa_003928 [Cucumis sativus]

3.1e-90

92.31

Show/hide

Query:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS
        MG+KRNWSW SALVGAASAIAA+AIISAKPKDPTFHLISIKFTSFKLKPPV+D ELILTVHVTNPNVAPIHYSSTAMSIFY+GSLLGSAQVDAGSQ+PRS
Subjt:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS

Query:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL
        CQVLRLPARLDGLKLAHHGSRFISDV KREMVLDASVDIGG A++LWW+HKFKVHVDSHLTVDPVFLDVLDQENTS+L+LFL
Subjt:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL

XP_004140159.2 uncharacterized protein LOC101218134 [Cucumis sativus]

3.1e-90

92.31

Show/hide

Query:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS
        MG+KRNWSW SALVGAASAIAA+AIISAKPKDPTFHLISIKFTSFKLKPPV+D ELILTVHVTNPNVAPIHYSSTAMSIFY+GSLLGSAQVDAGSQ+PRS
Subjt:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS

Query:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL
        CQVLRLPARLDGLKLAHHGSRFISDV KREMVLDASVDIGG A++LWW+HKFKVHVDSHLTVDPVFLDVLDQENTS+L+LFL
Subjt:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL

XP_008449575.2 PREDICTED: uncharacterized protein LOC103491417 [Cucumis melo]

3.6e-91

92.86

Show/hide

Query:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS
        MG+KRNWSW SALVGAASA+AA+AIISAKPKDPTFHLISIKFTSFKLKPPV+DAELILTVHVTNPNVAPIHYSSTAMSIFY+GSLLGSAQVDAGSQ+PRS
Subjt:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS

Query:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL
        CQVLRLPARLDGLKLAHHGSRFISDV KREMVLDASVDIGG AK+LWW+HKFKVHVDSHLTVDPVFLDVLDQENTS+L+LFL
Subjt:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL

XP_038900652.1 uncharacterized protein LOC120087813 [Benincasa hispida]

1.6e-91

92.86

Show/hide

Query:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS
        MG+KRNWSW SALVGAASAIAA+AI+SAKPKDPTFHLISIKFTSFKLKPPV+DAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQ+PRS
Subjt:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS

Query:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL
        CQVLRLPARLDGLKLAHHGSRFISDV KREM+LDASVDIGG AK+LWW+HKFKVHVDSHLTVDPVFLDVLDQENTS+L+LFL
Subjt:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KGW5 WHy domain-containing protein

1.5e-90

92.31

Show/hide

Query:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS
        MG+KRNWSW SALVGAASAIAA+AIISAKPKDPTFHLISIKFTSFKLKPPV+D ELILTVHVTNPNVAPIHYSSTAMSIFY+GSLLGSAQVDAGSQ+PRS
Subjt:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS

Query:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL
        CQVLRLPARLDGLKLAHHGSRFISDV KREMVLDASVDIGG A++LWW+HKFKVHVDSHLTVDPVFLDVLDQENTS+L+LFL
Subjt:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL

A0A1S3BMZ9 uncharacterized protein LOC103491417

1.8e-91

92.86

Show/hide

Query:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS
        MG+KRNWSW SALVGAASA+AA+AIISAKPKDPTFHLISIKFTSFKLKPPV+DAELILTVHVTNPNVAPIHYSSTAMSIFY+GSLLGSAQVDAGSQ+PRS
Subjt:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS

Query:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL
        CQVLRLPARLDGLKLAHHGSRFISDV KREMVLDASVDIGG AK+LWW+HKFKVHVDSHLTVDPVFLDVLDQENTS+L+LFL
Subjt:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL

A0A5D3B864 Late embryogenesis abundant hydroxyproline-rich glycoprotein

1.8e-91

92.86

Show/hide

Query:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS
        MG+KRNWSW SALVGAASA+AA+AIISAKPKDPTFHLISIKFTSFKLKPPV+DAELILTVHVTNPNVAPIHYSSTAMSIFY+GSLLGSAQVDAGSQ+PRS
Subjt:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS

Query:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL
        CQVLRLPARLDGLKLAHHGSRFISDV KREMVLDASVDIGG AK+LWW+HKFKVHVDSHLTVDPVFLDVLDQENTS+L+LFL
Subjt:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL

A0A6J1JD65 uncharacterized protein LOC111483962

2.0e-87

90.66

Show/hide

Query:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS
        M +KRNWSWGSALVGAASAIAA+AIISAKPKDPTFHLISIKFTS K+KPPV+DAELILTVHVTNPNVAPIHYSSTAMSIFYDGS LGSA V+AGSQ+ RS
Subjt:  MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRS

Query:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL
        CQVLRLPARLDGLKLAHH SRFISDV KREMVLDASVDIGGIAK+LWWNH+FKVHVDSHLTVDPVFLDVLDQENTS+L+LFL
Subjt:  CQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL

A0A6J1K4X2 uncharacterized protein LOC111490777

5.3e-88

89.73

Show/hide

Query:  MGEKR--NWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKP
        M +KR  +WSWGSALVGAASAIAA+AI+SAKPKDPTFHLISIKFTSFKLKPPV+DAELILTVHVTNPNVAPIHYSST+MSIFYDGSLLGSAQVDAGSQ+ 
Subjt:  MGEKR--NWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKP

Query:  RSCQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFLA
        RSCQVLRLPARLDGLKLAH+GSRFISDV+KREMVLDASVDIGGIA++LWW+HKFKVHVDSHLTVDPVFLDVLDQENTS+L+LFL+
Subjt:  RSCQVLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFLA

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G52330.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

4.5e-07

25.9

Show/hide

Query:  PKDPTFHLISIKFTSFKL--KP-PVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRSCQVLRLPARLDGLKLAHHGSRFISDV
        P DP   +I +K +   +  +P P +D  L++T+ V+N +V    ++   ++I Y G  LG    D G         L   A LDG+ +       I D+
Subjt:  PKDPTFHLISIKFTSFKL--KP-PVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRSCQVLRLPARLDGLKLAHHGSRFISDV

Query:  VKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPV
         K  +  D   +  G   +L++    K  V   + VD V
Subjt:  VKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPV

AT1G52330.2 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

5.0e-06

25.78

Show/hide

Query:  PKDPTFHLISIKFTSFKL--KP-PVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRSCQVLRLPARLDGLKLAHHGSRFISDV
        P DP   +I +K +   +  +P P +D  L++T+ V+N +V    ++   ++I Y G  LG    D G         L   A LDG+ +       I D+
Subjt:  PKDPTFHLISIKFTSFKL--KP-PVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRSCQVLRLPARLDGLKLAHHGSRFISDV

Query:  VKREMVLDASVDIGGIAKMLWWNHKFKV
         K  +  D   +  G   +L++    KV
Subjt:  VKREMVLDASVDIGGIAKMLWWNHKFKV

AT3G44380.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

7.1e-69

68.89

Show/hide

Query:  EKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRSCQ
        +K  WSW SAL+GAASA AA++++SAKPKDPTFHLISI  TS KL  PVLDAEL+LTVHVTNPN+A IHYSST M+I YDG++LGSA+V AGSQ  RSCQ
Subjt:  EKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRSCQ

Query:  VLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL
        +LRLPARLDG++LA H  +F SDV  REM L+A + I G AK+LWW+H F+VHVDS +TVDPVFLDV+ QEN S++ LFL
Subjt:  VLRLPARLDGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFL

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGGGAAAAGCGTAACTGGAGCTGGGGCTCTGCCCTAGTCGGAGCGGCGTCGGCGATTGCAGCGTCGGCGATCATTTCCGCCAAGCCCAAGGATCCGACCTTCCACCT
TATCTCCATCAAGTTCACTTCCTTCAAGCTGAAGCCGCCGGTGCTCGATGCCGAGCTTATCCTGACCGTCCACGTCACCAACCCCAACGTCGCCCCCATCCACTACTCCT
CTACCGCCATGTCCATTTTCTACGACGGCTCCCTCCTCGGCTCGGCTCAGGTCGACGCCGGTTCGCAGAAACCCCGGTCCTGCCAGGTCCTCCGACTCCCGGCTCGGCTC
GACGGCCTCAAGCTGGCCCACCACGGCAGCCGCTTCATCTCCGACGTCGTCAAGCGGGAGATGGTTCTAGATGCGAGTGTGGATATTGGGGGAATTGCAAAAATGCTTTG
GTGGAATCACAAGTTCAAGGTCCACGTGGACAGCCATCTCACCGTTGATCCCGTCTTCCTCGATGTGCTTGATCAGGAAAATACTTCTCGACTTCAGCTCTTTCTTGCTT
GA

mRNA sequence

Show/hide mRNA sequence

ATTCAGTCGGCCATGTGATTTCTCAGGCCGCAATCCGTCAATTCCATTCAACGCAACAGAATCCACTTTTCCTAAACTACCCTCCACCGGCCACACCATCTCCCGGCCAT
TGGGTAAGGCCATTACCGTCATTTATCATTCCCACTCTCTCTCTACTCTCTACACAGCTTTCTTTCCATTTCTTTCCCTTTATACTATTTTGCTCTAACTTTACTCTCTC
TCACACAGTCTCAGAAGATGGGGGAAAAGCGTAACTGGAGCTGGGGCTCTGCCCTAGTCGGAGCGGCGTCGGCGATTGCAGCGTCGGCGATCATTTCCGCCAAGCCCAAG
GATCCGACCTTCCACCTTATCTCCATCAAGTTCACTTCCTTCAAGCTGAAGCCGCCGGTGCTCGATGCCGAGCTTATCCTGACCGTCCACGTCACCAACCCCAACGTCGC
CCCCATCCACTACTCCTCTACCGCCATGTCCATTTTCTACGACGGCTCCCTCCTCGGCTCGGCTCAGGTCGACGCCGGTTCGCAGAAACCCCGGTCCTGCCAGGTCCTCC
GACTCCCGGCTCGGCTCGACGGCCTCAAGCTGGCCCACCACGGCAGCCGCTTCATCTCCGACGTCGTCAAGCGGGAGATGGTTCTAGATGCGAGTGTGGATATTGGGGGA
ATTGCAAAAATGCTTTGGTGGAATCACAAGTTCAAGGTCCACGTGGACAGCCATCTCACCGTTGATCCCGTCTTCCTCGATGTGCTTGATCAGGAAAATACTTCTCGACT
TCAGCTCTTTCTTGCTTGATCATGATTTTTTTTGTTTTGTTTTTTTTTTTAAGCTTCTTCGTTTATAGATAAAATGGATTTTAGGTACAAAAAAATGATCCGAGTGGATG
GTTAAATGACAATTGGTATTGCCCTGTTTGATTCTTTTTAATTCATCTTTGGATTTCAAAATTGACTATAATTTGTTGATGTTTTTTGGGTTAATTTTGGAATCACCTGG
GGAAAGGAACGTGGAATTATCAATTCTCTTCGATTTTATTTAAACATTAAGCTTTGGTGTAATAATGTGGTTAATTAATTATTTGACTTTTTGTTTTGGATTTGAACATT
TGATCCCATCTCCCTGTAAGAAATCGCTAATGTTTTGGGTTGGTAAATAA

Protein sequence

Show/hide protein sequence

MGEKRNWSWGSALVGAASAIAASAIISAKPKDPTFHLISIKFTSFKLKPPVLDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSAQVDAGSQKPRSCQVLRLPARL
DGLKLAHHGSRFISDVVKREMVLDASVDIGGIAKMLWWNHKFKVHVDSHLTVDPVFLDVLDQENTSRLQLFLA

Tan0021305 (gene) of Snake gourd v1 genome