CuGenDBv2

Gene ID	Tan0004630
Organism	Trichosanthes anguina (Snake gourd v1)
Description	stress response protein NST1
Genome location	LG10:4090918..4096070
RNA-Seq Expression	Tan0004630
Synteny	Tan0004630
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6582480.1 hypothetical protein SDJN03_22482, partial [Cucurbita argyrosperma subsp. sororia]

1.0e-80

90.16

Show/hide

Query:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK
        MA  SRS+IRTATNLSNNLLRSFSTS K AHHNNHQQTHKYLEA+AFVGSWEAPKDPKEAQA+LA LRRDYAKQVKQVRKNYIQEVE+LRLEKQRKDEAK
Subjt:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK

Query:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL
        REALRVANEERKKLKAEAAKARAEERK+A+EEFRRTLMKER EK EHWRMMEK R+EKKKEKNE IRRQSSMW+DEKKLEEKLL+AIVNT PL
Subjt:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL

KAG6597284.1 hypothetical protein SDJN03_10464, partial [Cucurbita argyrosperma subsp. sororia]

2.8e-81

91.19

Show/hide

Query:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK
        MAFASRS+IR ATN S+ LLRSFSTSTK AHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLA LRRDYAK+VKQVRKNYIQEVELLRLEKQRKDEAK
Subjt:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK

Query:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL
        REALRV NEERKKLKAEAAKARAEERK+A+EEFR+TLMKERAEK EHWRMMEKTR+EKK EKNELIRRQS MWIDEKKLEEKLL+AIVNTTPL
Subjt:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL

XP_022924252.1 UPF0329 protein ECU05_1680/ECU11_0050-like [Cucurbita moschata]

2.3e-80

89.64

Show/hide

Query:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK
        MA  SRS+IRTATN+SNNLLRSFSTS K AHHNNHQQTHKYLEA+AFVGSWEAPKDPKEAQA+LA LRRDYAKQVKQVRKNYIQEVE+LRLEKQRKDEAK
Subjt:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK

Query:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL
        REALRVANEERKKLKAEAAKARAEERK+A+EEFRRTLMKER EK EHWRMMEK R+EKKKEKNE IRRQSSMW+DEKKLEEKLL+AIVNT PL
Subjt:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL

XP_022940859.1 UPF0329 protein ECU05_1680/ECU11_0050-like [Cucurbita moschata]

3.6e-81

91.19

Show/hide

Query:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK
        MAFASRS+IR ATN S+ LLRSFSTSTK AHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLA LRRDYAK+VKQVRKNYIQEVELLRLEKQRKDEAK
Subjt:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK

Query:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL
        REALRV NEERKKLKAEAAKARAEERK+A+EEFR+TLMKERAEK EHWRMMEKTR+EKK EKNELIRRQS MWIDEKKLEEKLL+AIVNTTPL
Subjt:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL

XP_038892259.1 chromatin assembly factor 1 subunit A [Benincasa hispida]

1.4e-80

88.6

Show/hide

Query:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK
        MAF  RS+IRTAT+LSNNLLRS STSTK AHHNNHQQTHKYLEANAF+GSWEAPKDPKEAQA+LAQLRRDYAKQ+KQVRKNYIQEVELLRLEK+RKDEAK
Subjt:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK

Query:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL
        REALRVANEERKKLKAEAAK RAEERK+A+EEFR TLMKERAEK EHWRMMEK RDEKKKEKN+L+RRQSS+W+DE KLEEKLL+AIVNTTPL
Subjt:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL

TrEMBL top hits

e value

%identity

Alignment

A0A1S3AWS6 LOW QUALITY PROTEIN: chromatin assembly factor 1 subunit A

1.6e-74

85.49

Show/hide

Query:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK
        MAFAS S IR ATNLSNNLLRSFSTS K AH+NNH QTH+YLEAN+F+GSW+APKDPKEAQARLA+LRR+YAKQVKQVRKNYIQEVELLRLEK++KDEAK
Subjt:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK

Query:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL
        REALRVANEERKKLKAEAAK RAEERKIA+EEFR TLMKERAEK EHWRMMEK R+EK KEK EL+RRQSS WIDE KLEEKLLEAIVNT  L
Subjt:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL

A0A6J1CYM7 uncharacterized protein LOC111015987

6.2e-79

88.08

Show/hide

Query:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK
        MA +SRS+IR+ATNLSNNLLRSFSTSTK AHHN+HQQTHK+LEANAFVGSWE PKDP+EAQA+L QLRRDYAKQVKQVRKNYIQEVELLRLE QRKDEAK
Subjt:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK

Query:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL
        REALRVANEERKKLKAEAAKARAEERK+A+EEFRRTLMKER+EK EHWR MEK R+EKKKEKNELIRRQSS+WIDE KLE KLL+AIVNTTPL
Subjt:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL

A0A6J1E8D4 UPF0329 protein ECU05_1680/ECU11_0050-like

1.1e-80

89.64

Show/hide

Query:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK
        MA  SRS+IRTATN+SNNLLRSFSTS K AHHNNHQQTHKYLEA+AFVGSWEAPKDPKEAQA+LA LRRDYAKQVKQVRKNYIQEVE+LRLEKQRKDEAK
Subjt:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK

Query:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL
        REALRVANEERKKLKAEAAKARAEERK+A+EEFRRTLMKER EK EHWRMMEK R+EKKKEKNE IRRQSSMW+DEKKLEEKLL+AIVNT PL
Subjt:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL

A0A6J1FLI1 UPF0329 protein ECU05_1680/ECU11_0050-like

1.7e-81

91.19

Show/hide

Query:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK
        MAFASRS+IR ATN S+ LLRSFSTSTK AHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLA LRRDYAK+VKQVRKNYIQEVELLRLEKQRKDEAK
Subjt:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK

Query:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL
        REALRV NEERKKLKAEAAKARAEERK+A+EEFR+TLMKERAEK EHWRMMEKTR+EKK EKNELIRRQS MWIDEKKLEEKLL+AIVNTTPL
Subjt:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL

A0A6J1IZ92 uncharacterized protein LOC111479798

1.9e-80

89.64

Show/hide

Query:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK
        MA  SRS+IR+ATNLSNNLLRSFSTS K AHHNNHQQTHKYLEA+AFVGSWEAPKDPKEAQA+LA LRRDYAKQVKQVRKNYIQEVELLRLEKQ KDEAK
Subjt:  MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAK

Query:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL
        REALRVANEERKKLKAEAAKARAEERK+A+EEFRRTLMKER EK EHWRMMEK R+EKKKEKNE+IRRQSSMW+DEKKLEEKLL+AIVNT PL
Subjt:  REALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT5G49210.1 unknown protein

4.7e-47

58.08

Show/hide

Query:  MAFASRSSIRTATNLSNNL-----LRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQR
        MAF ++ S R     S N      LRSFS      HH  HQ+TH +LE   ++GSWEAP DPK+A+ +LAQLRRDYAK+V+  RK YI E+E+LR+EKQR
Subjt:  MAFASRSSIRTATNLSNNL-----LRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQR

Query:  KDEAKREALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL
        KDEA+  A R ANEER+ LKAEAAK RAEERKIA+EEFR+TL+KERAEK E W+MM + R+EK KE+ +L+R QSS+WI++K+LE K+ EA+V+   L
Subjt:  KDEAKREALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL

AT5G49210.2 unknown protein

4.7e-47

58.08

Show/hide

Query:  MAFASRSSIRTATNLSNNL-----LRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQR
        MAF ++ S R     S N      LRSFS      HH  HQ+TH +LE   ++GSWEAP DPK+A+ +LAQLRRDYAK+V+  RK YI E+E+LR+EKQR
Subjt:  MAFASRSSIRTATNLSNNL-----LRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQR

Query:  KDEAKREALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL
        KDEA+  A R ANEER+ LKAEAAK RAEERKIA+EEFR+TL+KERAEK E W+MM + R+EK KE+ +L+R QSS+WI++K+LE K+ EA+V+   L
Subjt:  KDEAKREALRVANEERKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCGTTTGCGTCTCGTTCTTCGATCCGCACTGCAACCAATCTCTCCAATAACCTTCTGCGATCCTTCTCCACTTCCACCAAACCCGCTCACCATAACAATCACCAGCA
GACGCACAAATACTTGGAGGCGAACGCCTTCGTTGGAAGCTGGGAGGCGCCGAAAGATCCCAAGGAAGCGCAGGCCAGGCTCGCTCAGCTTCGAAGGGACTACGCCAAAC
AGGTGAAGCAGGTGCGCAAGAATTACATCCAGGAGGTCGAACTCTTGAGACTCGAAAAGCAGCGCAAGGACGAAGCAAAGAGAGAGGCGCTTAGGGTTGCCAATGAAGAA
CGGAAGAAACTTAAAGCCGAAGCTGCTAAAGCCCGAGCTGAAGAGCGTAAGATTGCCGAGGAAGAGTTCCGACGGACTTTGATGAAAGAAAGAGCTGAGAAGCATGAGCA
TTGGAGAATGATGGAAAAGACGAGGGATGAAAAGAAGAAAGAAAAGAATGAGCTAATAAGACGGCAGAGTTCCATGTGGATTGATGAAAAGAAGTTGGAAGAGAAGCTAT
TAGAGGCCATTGTTAATACCACCCCTCTCTGA

mRNA sequence

Show/hide mRNA sequence

CCTAGGGGGGGAGAGAACAAACAAGCTTAAACCTTCCTTCTTCAAGCCCAGAAGCTTGTATCTCTACCATCTCATACAACAATGGCGTTTGCGTCTCGTTCTTCGATCCG
CACTGCAACCAATCTCTCCAATAACCTTCTGCGATCCTTCTCCACTTCCACCAAACCCGCTCACCATAACAATCACCAGCAGACGCACAAATACTTGGAGGCGAACGCCT
TCGTTGGAAGCTGGGAGGCGCCGAAAGATCCCAAGGAAGCGCAGGCCAGGCTCGCTCAGCTTCGAAGGGACTACGCCAAACAGGTGAAGCAGGTGCGCAAGAATTACATC
CAGGAGGTCGAACTCTTGAGACTCGAAAAGCAGCGCAAGGACGAAGCAAAGAGAGAGGCGCTTAGGGTTGCCAATGAAGAACGGAAGAAACTTAAAGCCGAAGCTGCTAA
AGCCCGAGCTGAAGAGCGTAAGATTGCCGAGGAAGAGTTCCGACGGACTTTGATGAAAGAAAGAGCTGAGAAGCATGAGCATTGGAGAATGATGGAAAAGACGAGGGATG
AAAAGAAGAAAGAAAAGAATGAGCTAATAAGACGGCAGAGTTCCATGTGGATTGATGAAAAGAAGTTGGAAGAGAAGCTATTAGAGGCCATTGTTAATACCACCCCTCTC
TGAGTTCTCTTTGCGAGATTGATTTAGAGGACTACTCTTTAACTTTGAGTGATAATTGGCCAAGATCTTTTTAAATTCTCATATTTCTGGTTAGAAGCAATTAAGATCAT
TTTAATGTTGGATTCTAGCTGGTAAATTTCTGTACATCCAAGACTTGTACCAATCGTGATGAATTTGGTTTTGCATTAGTAGCTCAATTAATGCTGCTGATGGTCATAGT
TCAAATACTAAACTGATTAAGATTGGGTATTTAAACTCGGATGTAAGTTCAAATCTACTCCTTGTTTGTGAGATTGAACTTAACTAATGCATTTTACTTTTTGTACATAT
ATATATCGATGAGAGATTGAACCAGC

Protein sequence

Show/hide protein sequence

MAFASRSSIRTATNLSNNLLRSFSTSTKPAHHNNHQQTHKYLEANAFVGSWEAPKDPKEAQARLAQLRRDYAKQVKQVRKNYIQEVELLRLEKQRKDEAKREALRVANEE
RKKLKAEAAKARAEERKIAEEEFRRTLMKERAEKHEHWRMMEKTRDEKKKEKNELIRRQSSMWIDEKKLEEKLLEAIVNTTPL

Tan0004630 (gene) of Snake gourd v1 genome