CuGenDBv2

Gene ID	HG10004894
Organism	Lagenaria siceraria cv. Hangzhou Gourd (Bottle gourd (Hangzhou Gourd) v1)
Description	UPF0114 domain-containing protein
Genome location	Chr08:21240170..21241392
RNA-Seq Expression	HG10004894
Synteny	HG10004894
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	IPR005134 - Uncharacterised protein family UPF0114

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0065266.1 UPF0114 domain-containing protein [Cucumis melo var. makuwa]

1.2e-125

86.35

Show/hide

Query:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMKAAAAAAPETVETKTEELNLGSLLANLLVQLKTPVGKTK
        MAATRFMQR+RPA+AVSSSSSSSSPSS   VR LGKTGLNLNNGERLITSG GE RQ+VA+K AA  AP+TVETKT EL+LGSL+++LLVQLKT +GKTK
Subjt:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMKAAAAAAPETVETKTEELNLGSLLANLLVQLKTPVGKTK

Query:  IQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMKEK
        I+KR+IQKFIEKIIIDCRFFTLLAV+GSL+GS+LC+IEGSFIVAESYLQYFH LSQ ++QTH V LLIEALDMFLVGTALVVFG+GLFAMFVGSEKMKEK
Subjt:  IQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMKEK

Query:  NRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK
        NR  IS SNLFGLFYMKKIPTWVEMESMS AKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVG GGS GFK
Subjt:  NRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK

XP_008444667.1 PREDICTED: uncharacterized protein LOC103487936 [Cucumis melo]

4.7e-125

85.67

Show/hide

Query:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMKAAAAAAPETVETKTEELNLGSLLANLLVQLKTPVGKTK
        MAATRFMQR+RPA+AVSSSSSSSSPSS   VR LGKTGLNLNNGERLITSG GE RQ++A+K AA  AP+TVETKT EL+LGSL+++LLVQLKT +GKTK
Subjt:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMKAAAAAAPETVETKTEELNLGSLLANLLVQLKTPVGKTK

Query:  IQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMKEK
        I+KR+IQKFIEKIIIDCRFFTLLAV+GSL+GS+LC+IEGSFIVAESYLQYFH LSQ ++QTH V LLIEALDMFLVGTALVVFG+GLFAMFVGSEKMKEK
Subjt:  IQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMKEK

Query:  NRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK
        N+  IS SNLFGLFYMKKIPTWVEMESMS AKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVG GGS GFK
Subjt:  NRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK

XP_011649594.1 uncharacterized protein LOC101218655 isoform X1 [Cucumis sativus]

2.1e-125

85.03

Show/hide

Query:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMKAAAA-AAPETVETKTEELNLGSLLANLLVQLKTPVGKT
        MAATRF+QR+RPA+AVS+SSSSSSPSS   VR LGKTGLNLNNGERLITSG  ERRQ+V +KAAAA AAP+TVETKT EL+LGSL+ANLL+QLK  +GKT
Subjt:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMKAAAA-AAPETVETKTEELNLGSLLANLLVQLKTPVGKT

Query:  KIQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMKE
        KI+K +IQKFIEKIIIDCRFFTLLAV+GSL+GS+LC+IEGSFIV ESYLQYFHGLSQ +DQTH V LLIEALDMFLVGTAL+VFG+GLFAMFVGSEKMK+
Subjt:  KIQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMKE

Query:  KNRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK
        KN+   S SNLFGLFYMKKIPTWVEMESMS AKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGS GFK
Subjt:  KNRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK

XP_022951147.1 uncharacterized protein LOC111454079 [Cucurbita moschata]

9.2e-121

81.36

Show/hide

Query:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMK--AAAAAAPETVETKTEELNLGSLLANLLVQLKTPVGK
        MAATR ++ +RP++ V SSSSSSSPS+A TVRCLGKTGLN  NGERL+TSGDGERRQIV +K  AAAAAAPETVET+T EL+LGSLLANLLVQLK    K
Subjt:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMK--AAAAAAPETVETKTEELNLGSLLANLLVQLKTPVGK

Query:  TKIQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMK
        TKI++RQIQKFIEKIIIDCRFFTL AVAGSLLGS+LCF+EGSFIVAESYLQYF+G+S+ SD++H V LLIE+LDMFLVGTALVVFGVGLFAMFVGSEKM 
Subjt:  TKIQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMK

Query:  EKNRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK
        EKN   +SGSNLFGLFYMK IPTWVEMES+S+AKSKIGHAVMMILQVGVLEKFK+IPLSSA DLACFAAA+LISSASIFFLS+LN+GGGG  G+K
Subjt:  EKNRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK

XP_038885641.1 uncharacterized protein LOC120075956 [Benincasa hispida]

5.4e-137

92.15

Show/hide

Query:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMKAAAAAAPETVETKTEELNLGSLLANLLVQLKTPVGKTK
        M ATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGER+QIVA+K  AAAAP+TVET+TEELNLGSLLANLLVQLKT VGKTK
Subjt:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMKAAAAAAPETVETKTEELNLGSLLANLLVQLKTPVGKTK

Query:  IQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMKEK
        IQ+RQIQKFIEKIIIDCRFFTLLAVAGSLLGS+LC+IEGSFIVAESYLQYFHGLSQSS+Q H V LLIEALDMFLVGTALVVFGVGLFAMF+GS KMKEK
Subjt:  IQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMKEK

Query:  NRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK
        NRPVISGSN FGLF MKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAV++SSASIFFLSKLN+GGGGS GFK
Subjt:  NRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LLC9 Uncharacterized protein

1.0e-125

85.03

Show/hide

Query:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMKAAAA-AAPETVETKTEELNLGSLLANLLVQLKTPVGKT
        MAATRF+QR+RPA+AVS+SSSSSSPSS   VR LGKTGLNLNNGERLITSG  ERRQ+V +KAAAA AAP+TVETKT EL+LGSL+ANLL+QLK  +GKT
Subjt:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMKAAAA-AAPETVETKTEELNLGSLLANLLVQLKTPVGKT

Query:  KIQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMKE
        KI+K +IQKFIEKIIIDCRFFTLLAV+GSL+GS+LC+IEGSFIV ESYLQYFHGLSQ +DQTH V LLIEALDMFLVGTAL+VFG+GLFAMFVGSEKMK+
Subjt:  KIQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMKE

Query:  KNRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK
        KN+   S SNLFGLFYMKKIPTWVEMESMS AKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGS GFK
Subjt:  KNRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK

A0A1S3BAX1 uncharacterized protein LOC103487936

2.3e-125

85.67

Show/hide

Query:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMKAAAAAAPETVETKTEELNLGSLLANLLVQLKTPVGKTK
        MAATRFMQR+RPA+AVSSSSSSSSPSS   VR LGKTGLNLNNGERLITSG GE RQ++A+K AA  AP+TVETKT EL+LGSL+++LLVQLKT +GKTK
Subjt:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMKAAAAAAPETVETKTEELNLGSLLANLLVQLKTPVGKTK

Query:  IQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMKEK
        I+KR+IQKFIEKIIIDCRFFTLLAV+GSL+GS+LC+IEGSFIVAESYLQYFH LSQ ++QTH V LLIEALDMFLVGTALVVFG+GLFAMFVGSEKMKEK
Subjt:  IQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMKEK

Query:  NRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK
        N+  IS SNLFGLFYMKKIPTWVEMESMS AKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVG GGS GFK
Subjt:  NRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK

A0A5A7VG09 UPF0114 domain-containing protein

6.0e-126

86.35

Show/hide

Query:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMKAAAAAAPETVETKTEELNLGSLLANLLVQLKTPVGKTK
        MAATRFMQR+RPA+AVSSSSSSSSPSS   VR LGKTGLNLNNGERLITSG GE RQ+VA+K AA  AP+TVETKT EL+LGSL+++LLVQLKT +GKTK
Subjt:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMKAAAAAAPETVETKTEELNLGSLLANLLVQLKTPVGKTK

Query:  IQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMKEK
        I+KR+IQKFIEKIIIDCRFFTLLAV+GSL+GS+LC+IEGSFIVAESYLQYFH LSQ ++QTH V LLIEALDMFLVGTALVVFG+GLFAMFVGSEKMKEK
Subjt:  IQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMKEK

Query:  NRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK
        NR  IS SNLFGLFYMKKIPTWVEMESMS AKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVG GGS GFK
Subjt:  NRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK

A0A6J1GGV4 uncharacterized protein LOC111454079

4.5e-121

81.36

Show/hide

Query:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMK--AAAAAAPETVETKTEELNLGSLLANLLVQLKTPVGK
        MAATR ++ +RP++ V SSSSSSSPS+A TVRCLGKTGLN  NGERL+TSGDGERRQIV +K  AAAAAAPETVET+T EL+LGSLLANLLVQLK    K
Subjt:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMK--AAAAAAPETVETKTEELNLGSLLANLLVQLKTPVGK

Query:  TKIQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMK
        TKI++RQIQKFIEKIIIDCRFFTL AVAGSLLGS+LCF+EGSFIVAESYLQYF+G+S+ SD++H V LLIE+LDMFLVGTALVVFGVGLFAMFVGSEKM 
Subjt:  TKIQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMK

Query:  EKNRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK
        EKN   +SGSNLFGLFYMK IPTWVEMES+S+AKSKIGHAVMMILQVGVLEKFK+IPLSSA DLACFAAA+LISSASIFFLS+LN+GGGG  G+K
Subjt:  EKNRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK

A0A6J1KI88 uncharacterized protein LOC111496020

6.2e-115

79.39

Show/hide

Query:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMK---AAAAAAPETVETKTEELNLGSLLANLLVQLKTPVG
        MAATR ++ +RP SA   SSSSSSPS+A  VRCL KTGLN  NGERLITSGDGERRQIV +K   AAAAAAPETVETKT EL+LGSLLANLLVQLK    
Subjt:  MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMK---AAAAAAPETVETKTEELNLGSLLANLLVQLKTPVG

Query:  KTKIQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKM
        K KI++RQIQKFIEKIII+CRFFTL AVAGSLLGS+LCF+EGSFIVAESYLQYF+ +S+ SD++H V LLIE+LDMFLVGTALVVFGVGLFAMFVGSEKM
Subjt:  KTKIQKRQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKM

Query:  KEKNRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK
         EKNR  +SGSNLFGLFYMK IPTWVEMES+S+AKSKIGHAVMMILQVGVLEK K+IPLSSA DLACFAAA+LI SASIFFLS+LN+GGG   G+K
Subjt:  KEKNRPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT4G19390.1 Uncharacterised protein family (UPF0114)

5.2e-37

41.11

Show/hide

Query:  IQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGS-EKMKEKNRPV
        +++ IEK+I  CRF T L   GSLLGSVLCFI+G   V +S+LQY      S ++  ++ LL+EA+D++L+GT ++VFG+GL+ +F+ + +  + +   +
Subjt:  IQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGS-EKMKEKNRPV

Query:  ISG-SNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLN
        +S  S+LFG+F +K+ P W+E++S+S+ K+K+GH ++M+L +G+ +K K + ++S  DL C + ++  SSA +F LS+LN
Subjt:  ISG-SNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLN

AT5G13720.1 Uncharacterised protein family (UPF0114)

8.5e-32

35.87

Show/hide

Query:  RQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFV--GSEKMKEKN
        R  +  +E+II D RF  LLAV GSL GS+LCF+ G   + E+Y  Y+   S+      MV  L+EA+D++L GT +++F +GL+ +F+      +  ++
Subjt:  RQIQKFIEKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFV--GSEKMKEKN

Query:  RPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVG
           +  S+LFG+F MK+ P W+++ S+ + K+K+GH ++MIL V + E+ K + +++ +DL  ++  + +SSAS++ L  L+ G
Subjt:  RPVISGSNLFGLFYMKKIPTWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVG

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCGGCGACTAGATTCATGCAGCGACTTCGGCCAGCCTCCGCCGTGTCTTCCTCTTCCTCTTCTTCATCTCCGTCGTCGGCGATGACCGTGAGGTGTTTGGGCAAAAC
AGGGCTAAATTTGAACAACGGCGAACGGTTAATAACTTCTGGAGATGGCGAGAGAAGGCAGATAGTCGCCATGAAGGCGGCGGCGGCGGCGGCTCCCGAGACTGTGGAAA
CTAAAACCGAAGAATTGAATTTGGGTTCTTTGCTGGCGAATCTACTCGTTCAATTGAAGACTCCCGTGGGGAAGACGAAGATTCAGAAGCGACAGATTCAGAAGTTCATC
GAAAAGATCATAATCGACTGTCGATTCTTCACATTGTTAGCCGTCGCCGGATCTTTACTGGGTTCAGTGCTCTGTTTTATTGAGGGGAGTTTCATTGTTGCAGAGTCATA
TCTGCAGTACTTTCATGGTCTTTCACAGAGCTCGGACCAAACTCATATGGTGGCGCTTCTAATTGAAGCCTTAGATATGTTCCTCGTCGGAACCGCTCTGGTTGTTTTTG
GGGTCGGATTGTTTGCAATGTTCGTCGGATCGGAGAAGATGAAGGAAAAAAATCGGCCAGTGATTTCTGGGTCGAATTTGTTTGGTCTGTTCTACATGAAGAAAATTCCG
ACGTGGGTAGAAATGGAATCGATGTCGCAGGCGAAATCGAAGATCGGACATGCGGTGATGATGATACTGCAAGTGGGTGTGTTGGAAAAGTTCAAGAACATACCATTGAG
CTCTGCCGTCGATCTCGCATGTTTCGCCGCCGCCGTTCTGATTTCCTCCGCCTCCATCTTCTTCCTCTCCAAACTCAACGTTGGGGGAGGCGGCAGCGTCGGTTTCAAGT
GA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MAATRFMQRLRPASAVSSSSSSSSPSSAMTVRCLGKTGLNLNNGERLITSGDGERRQIVAMKAAAAAAPETVETKTEELNLGSLLANLLVQLKTPVGKTKIQKRQIQKFI
EKIIIDCRFFTLLAVAGSLLGSVLCFIEGSFIVAESYLQYFHGLSQSSDQTHMVALLIEALDMFLVGTALVVFGVGLFAMFVGSEKMKEKNRPVISGSNLFGLFYMKKIP
TWVEMESMSQAKSKIGHAVMMILQVGVLEKFKNIPLSSAVDLACFAAAVLISSASIFFLSKLNVGGGGSVGFK

HG10004894 (gene) of Bottle gourd (Hangzhou Gourd) v1 genome