CuGenDBv2

Gene ID	Tan0003984
Organism	Trichosanthes anguina (Snake gourd v1)
Description	NHL domain protein
Genome location	LG05:70411248..70412284
RNA-Seq Expression	Tan0003984
Synteny	Tan0003984
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6584232.1 hypothetical protein SDJN03_20164, partial [Cucurbita argyrosperma subsp. sororia]

1.7e-76

85.8

Show/hide

Query:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR
        MGDRDG FKE ES GEIDGADALLASRRY C CFPCFG  RSAS+ELSWWERAKAKAK+TKFDG+DHWW+GGIRSLKKLREWSEIVAGPRWKTFIRRFNR
Subjt:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR

Query:  NRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKSSSASV
        NRPAAVK GKFQYDPISYALNFDEG+NGDVDFEG+EY+GGFQ+FS RF+AV A  KSS A+V
Subjt:  NRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKSSSASV

XP_022923865.1 uncharacterized protein LOC111431456 [Cucurbita moschata]

7.1e-78

87.04

Show/hide

Query:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR
        MGDRDG FKE ES GEIDGADALLASRRY C CFPCFG  RSAS+ELSWWERAKAKAK+TKFDG+DHWW+GGIRSLKKLREWSEIVAGPRWKTFIRRFNR
Subjt:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR

Query:  NRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKSSSASV
        NRPAAVKLGKFQYDPISYALNFDEG+NGDVDFEG+EY+GGFQNFS RF+AV A  KSS A+V
Subjt:  NRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKSSSASV

XP_023000665.1 uncharacterized protein LOC111495035 [Cucurbita maxima]

4.1e-78

87.04

Show/hide

Query:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR
        MGDRDG FKE ES GEIDGADALLASRRYSC CFPCFG  RSAS+ELSWWERAKAKAK+TKFDG+DHWW+GGIRSLKKLREWSEIVAGPRWKTFIRRFNR
Subjt:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR

Query:  NRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKSSSASV
        NRPAAVKLGKFQYDPISYALNFDEG+NGDV+FEG+EY+GGFQNFS RF+AV A  KSS A+V
Subjt:  NRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKSSSASV

XP_023519821.1 uncharacterized protein LOC111783153 [Cucurbita pepo subsp. pepo]

2.4e-78

87.65

Show/hide

Query:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR
        MGDRDG FKE ES GEIDGADALLASRRYSC CFPCFG  RSAS+ELSWWERAKAKAK+TKFDG+DHWW+GGIRSLKKLREWSEIVAGPRWKTFIRRFNR
Subjt:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR

Query:  NRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKSSSASV
        NRPAAVKLGKFQYDPISYALNFDEG+NGDVDFEG+EY+GGFQNFS RF+AV A  KSS A+V
Subjt:  NRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKSSSASV

XP_038894780.1 uncharacterized protein LOC120083201 [Benincasa hispida]

9.2e-78

86.96

Show/hide

Query:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR
        MGDRDGAFKE ES GEIDGADALLAS+RYSC CFPCFGPRRSAS+E+SWWER K KAK+TKFDG+DHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR
Subjt:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR

Query:  NRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYN-GGFQNFSGRFAAVQAPVKSSSA
        NRPA VKLGKFQYDPISYALNFD+G+NGDVDF+G+EY+ GGFQNFS RFAAV  PVKSS A
Subjt:  NRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYN-GGFQNFSGRFAAVQAPVKSSSA

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LU30 Uncharacterized protein

6.2e-72

82.84

Show/hide

Query:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDD-HWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFN
        MGDRDGAFKE ES   IDGADALL S+RYSC CFPCFGP RS S+ELSWWER K KAK+TKFD +D HWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFN
Subjt:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDD-HWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFN

Query:  RNRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYN--GGFQNFSGRFAAV-QAPVK-SSSASVTG
        RNRPA VKLGKFQYDPISYALNFDEG+NGDVDF+G+EYN  GGFQNFS RFAA+  APVK SSSA+V G
Subjt:  RNRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYN--GGFQNFSGRFAAV-QAPVK-SSSASVTG

A0A5A7ULQ3 Uncharacterized protein

1.8e-71

84.34

Show/hide

Query:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR
        MGDRDGAFKE ES   IDGADALLAS+RYSC CFPCFGP RS S+ELSWWER K KAK+TKFDG+DHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR
Subjt:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR

Query:  NRPAAVKLGKFQYDPISYALNFDEG-NNGDVDFEG-EEY--NGGFQNFSGRFAAV-QAPVKSSSAS
        NRPA VKLGKFQYDPISYALNFDEG NNGDVDFEG  EY   GGFQNFS RFAAV  AP+KSSS++
Subjt:  NRPAAVKLGKFQYDPISYALNFDEG-NNGDVDFEG-EEY--NGGFQNFSGRFAAV-QAPVKSSSAS

A0A6J1ED51 uncharacterized protein LOC111431456

3.4e-78

87.04

Show/hide

Query:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR
        MGDRDG FKE ES GEIDGADALLASRRY C CFPCFG  RSAS+ELSWWERAKAKAK+TKFDG+DHWW+GGIRSLKKLREWSEIVAGPRWKTFIRRFNR
Subjt:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR

Query:  NRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKSSSASV
        NRPAAVKLGKFQYDPISYALNFDEG+NGDVDFEG+EY+GGFQNFS RF+AV A  KSS A+V
Subjt:  NRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKSSSASV

A0A6J1GSC5 uncharacterized protein LOC111457052

1.3e-72

82.72

Show/hide

Query:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKT---TKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRR
        MGDRDGAFKE ESTGEI GADA L S RY+CLCFPCFGPRRS S+E+SWWERAKA A+       DG+DHWWTGG+RS+KKLREWSEIVAGPRWKTFIRR
Subjt:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKT---TKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRR

Query:  FNRNRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKSSS
        FNRNRPAAVKLGKFQYDPISYALNFDEGNNGDVDFE EE NGGF+NFS RFAAV APVKS++
Subjt:  FNRNRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKSSS

A0A6J1KJ01 uncharacterized protein LOC111495035

2.0e-78

87.04

Show/hide

Query:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR
        MGDRDG FKE ES GEIDGADALLASRRYSC CFPCFG  RSAS+ELSWWERAKAKAK+TKFDG+DHWW+GGIRSLKKLREWSEIVAGPRWKTFIRRFNR
Subjt:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNR

Query:  NRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKSSSASV
        NRPAAVKLGKFQYDPISYALNFDEG+NGDV+FEG+EY+GGFQNFS RF+AV A  KSS A+V
Subjt:  NRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKSSSASV

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT3G01430.1 BEST Arabidopsis thaliana protein match is: NHL domain-containing protein (TAIR:AT5G14890.1)

9.3e-20

34.91

Show/hide

Query:  EIDGADAL---LASRRYSCLCFPCFGPRRSASEELS-WWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNRNR---------
        E+D  D +   L ++R  C   PC    + ++   S WW+R        K + D+ WW   IR  +++REWSE+VAGPRWKT+IRRF R+          
Subjt:  EIDGADAL---LASRRYSCLCFPCFGPRRSASEELS-WWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNRNR---------

Query:  -------------PAAVKLGKFQYDPISYALNFDEGN-NGDVDFEGEEYNGGFQNFSGRFAAVQAPVKS
                       +   GKF+YD +SY+LNFD+GN  G  D E       ++++S RFAA   PV +
Subjt:  -------------PAAVKLGKFQYDPISYALNFDEGN-NGDVDFEGEEYNGGFQNFSGRFAAVQAPVKS

AT3G48020.1 unknown protein

5.1e-18

40.8

Show/hide

Query:  SASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNRNRPAAV---KLGKFQYDPISYALNFDEGNNGDVDFEGEEYN
        S + + SWW+R            +  WW   +R+  K+REWSEIVAGPRWKTFIRRFNR+           KF+YDP+SY L+F++ +  D D  G    
Subjt:  SASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNRNRPAAV---KLGKFQYDPISYALNFDEGNNGDVDFEGEEYN

Query:  GGFQNFSGRFAAVQAPVKSSSASVT
        GG ++FS R+A+V      S A ++
Subjt:  GGFQNFSGRFAAVQAPVKSSSASVT

AT5G14890.1 NHL domain-containing protein

7.2e-20

37.65

Show/hide

Query:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELS-WWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFN
        MG       E ++T E+  A   + ++R  C   PC G  + +    S WW+R +      K + D+ WW  G     K+REWSEIVAGP+WKTFIRRF 
Subjt:  MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELS-WWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFN

Query:  R------------NRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKS
        R            NRP  V    F+YD  SY+LNFD+G      FE E     ++++S RFAA   PV +
Subjt:  R------------NRPAAVKLGKFQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKS

AT5G25240.1 unknown protein

1.3e-08

47.37

Show/hide

Query:  GIRSLKKLREWSEIVAGPRWKTFIRRFNRNRPAAVKLGKFQYDPISYALNFDEGNNG
        G   LK L+E SE +AGP+WK FIR F+  R    +   F YD  +Y+LNFD+G +G
Subjt:  GIRSLKKLREWSEIVAGPRWKTFIRRFNRNRPAAVKLGKFQYDPISYALNFDEGNNG

AT5G62865.1 unknown protein

1.1e-20

47.14

Show/hide

Query:  CLCFPCFGPRRSASE-ELSWWERAKAKAKTTKFDGD----DHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNRNRPAAVKLG---KFQYDPISYALNF
        C CFP F   RS++    S W R +     +   GD      WW   IR+  K+REWSEIVAGPRWKTFIRRFNR+           KFQYDP+SY+LNF
Subjt:  CLCFPCFGPRRSASE-ELSWWERAKAKAKTTKFDGD----DHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNRNRPAAVKLG---KFQYDPISYALNF

Query:  DEGNNGDVDFEGEEY--NGGFQNFSGRFAAVQAPVKSSSA
        D+      D E +EY   GG ++FS RFA+V  PV S  A
Subjt:  DEGNNGDVDFEGEEY--NGGFQNFSGRFAAVQAPVKSSSA

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGGGACCGTGACGGAGCTTTCAAAGAATTTGAATCCACCGGCGAAATCGACGGCGCCGATGCTCTTTTGGCTTCTAGACGATATAGTTGTTTGTGCTTCCCTTGCTT
TGGACCTCGCCGGTCGGCTTCCGAGGAGCTCTCTTGGTGGGAACGGGCGAAGGCGAAGGCCAAAACGACGAAGTTCGACGGCGACGATCACTGGTGGACCGGCGGAATCA
GATCCCTCAAGAAGCTTCGTGAATGGTCCGAGATCGTTGCCGGTCCTAGATGGAAGACCTTCATTCGGCGCTTCAACCGGAACCGGCCCGCCGCCGTGAAGCTTGGGAAA
TTCCAGTACGATCCCATCAGTTACGCTTTGAATTTCGACGAGGGCAATAACGGTGATGTGGATTTCGAAGGGGAGGAATACAACGGTGGGTTTCAAAACTTCTCCGGCCG
GTTTGCTGCCGTGCAGGCGCCGGTGAAGTCTTCGTCGGCTTCGGTGACTGGATAG

mRNA sequence

Show/hide mRNA sequence

TTTTTTTCCCAATAATAAATAATTAATTACTCTTTAGTGCTCTCGCTCCTTGTCACGGCTCTGTAGCTTTCGGATAATCCGAGTCCAACTACCGGCTAACAAACACTGGG
CCCCACCACTTTACCGGCAGTCTCCGGTCGCCCACTGTTTCTTTGTTTCTTTCAACCCGTTGGCTCTATATACGGGAGCCTAATCGGACTCTGAATCCCTAATCTCACTC
TTTGCGGCCATGGGGGACCGTGACGGAGCTTTCAAAGAATTTGAATCCACCGGCGAAATCGACGGCGCCGATGCTCTTTTGGCTTCTAGACGATATAGTTGTTTGTGCTT
CCCTTGCTTTGGACCTCGCCGGTCGGCTTCCGAGGAGCTCTCTTGGTGGGAACGGGCGAAGGCGAAGGCCAAAACGACGAAGTTCGACGGCGACGATCACTGGTGGACCG
GCGGAATCAGATCCCTCAAGAAGCTTCGTGAATGGTCCGAGATCGTTGCCGGTCCTAGATGGAAGACCTTCATTCGGCGCTTCAACCGGAACCGGCCCGCCGCCGTGAAG
CTTGGGAAATTCCAGTACGATCCCATCAGTTACGCTTTGAATTTCGACGAGGGCAATAACGGTGATGTGGATTTCGAAGGGGAGGAATACAACGGTGGGTTTCAAAACTT
CTCCGGCCGGTTTGCTGCCGTGCAGGCGCCGGTGAAGTCTTCGTCGGCTTCGGTGACTGGATAGGGCGCTGCGGCGGCGGCAGCGGTCTTTTTTATTTTTCTGGTGAAGT
TGAACCGGTGGTGGGATTATAACGCATCTTTTTTCAACTGATGAGCTGGACGTTGACCGTTTGCAATGAATTAGGAGGCGCCAATGGCGGCGGTACACATGTTCACTAAA
TAGTTTACTTTTTCGTGGGGGCTACGCTTACGTGTAGCAAAAAAATTGGTGTTTATATTCTTATAGTTGATATGATTTTGTTTATTTTATTCAATTAAATTTGTATAATT
CAAACAGATTTTTATTTATATAAATTCTTATAGCGTGAAAAATATAT

Protein sequence

Show/hide protein sequence

MGDRDGAFKEFESTGEIDGADALLASRRYSCLCFPCFGPRRSASEELSWWERAKAKAKTTKFDGDDHWWTGGIRSLKKLREWSEIVAGPRWKTFIRRFNRNRPAAVKLGK
FQYDPISYALNFDEGNNGDVDFEGEEYNGGFQNFSGRFAAVQAPVKSSSASVTG

Tan0003984 (gene) of Snake gourd v1 genome