CuGenDBv2

Gene ID	ClCG04G001030
Organism	Citrullus lanatus subsp. vulgaris cv. Charleston Gray (Watermelon (Charleston Gray) v2.5)
Description	Gag/pol protein
Genome location	CG_Chr04:3256272..3273477
RNA-Seq Expression	ClCG04G001030
Synteny	ClCG04G001030
Gene Ontology terms	GO:0005488 - binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

TYK29682.1 gag/pol protein [Cucumis melo var. makuwa]

3.0e-48

61.73

Show/hide

Query:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS
        L   K +GDNY  WKSNLNTILV+DDLRF LTEEC   P+   N+  + A DRWI+ N+KARV IL  +SDVL KK+E++  AKEIMD L+ + GQ   S
Subjt:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS

Query:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQETSSWRKLREGEIALK
        +RH+ IKY+Y   MKEGTSVREHVLDMM++FNIAE+NG  IDE +QE SSW++L EGEI LK
Subjt:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQETSSWRKLREGEIALK

XP_022157844.1 uncharacterized protein LOC111024457 [Momordica charantia]

4.3e-47

62.67

Show/hide

Query:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS
        L   K +G NY TWK+NLNTILV+DDLRF LTEECP  P++  N+NV++A DRW++ NDKARV IL  ++DVL KKHE ++ AKEIMD L+AM G+ SS+
Subjt:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS

Query:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQETSS
        +RH+ +KYVYN  MKEGTSVREHVLDMMV+FN AEVNG  IDE +++ ++
Subjt:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQETSS

XP_038880476.1 uncharacterized protein LOC120072136 [Benincasa hispida]

7.9e-49

67.12

Show/hide

Query:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS
        L   K + DNYGTWKSNLNTILV+DDL+F LTEECPP+P+   N+ + DA DRW + N+KA+V IL  ISD+L KKHE MV AKEIMD LQA+ GQ SSS
Subjt:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS

Query:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQ
          HD IKYVYN  MKEGT+VREHVLDMMV+FNI EVNG +++EK+Q
Subjt:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQ

XP_038885834.1 uncharacterized protein LOC120076130 [Benincasa hispida]

1.5e-47

67.61

Show/hide

Query:  KSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSSIRHD
        K  G+NY TWK+NLNTILV+DDL+F LTEECPPIPSS  N+ V+DA +RWIRVNDK    IL  ISDVL KKHE+M   K+IM+ L+ M GQ S S+RHD
Subjt:  KSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSSIRHD

Query:  TIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQ
        +IKY+YN  MKEG SVREHVL+MMV+FN+AEVN V++DEKSQ
Subjt:  TIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQ

XP_038895830.1 uncharacterized protein LOC120083997 [Benincasa hispida]

7.4e-47

63.7

Show/hide

Query:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS
        L   K  GDNYGTWKSN+NTILV+DDLRF LTEECPP P    N+ V+DA DRW++ N+KARV IL  ISDVL KKHE +   +EIMD LQ + G+ S+S
Subjt:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS

Query:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQ
          HDTIK+VYN  MKEGTS++EHVL+MMV F++AE+NGV+++EKSQ
Subjt:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQ

TrEMBL top hits

e value

%identity

Alignment

A0A5D3E173 Gag/pol protein

1.5e-48

61.73

Show/hide

Query:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS
        L   K +GDNY  WKSNLNTILV+DDLRF LTEEC   P+   N+  + A DRWI+ N+KARV IL  +SDVL KK+E++  AKEIMD L+ + GQ   S
Subjt:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS

Query:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQETSSWRKLREGEIALK
        +RH+ IKY+Y   MKEGTSVREHVLDMM++FNIAE+NG  IDE +QE SSW++L EGEI LK
Subjt:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQETSSWRKLREGEIALK

A0A5D3E3F1 Gag/pol protein

6.1e-47

58.64

Show/hide

Query:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS
        L   K +GDNY  WK  LNTILV+DDLRF LTEECP  P+S  N+  +   DRWI+ ++KA V IL  +SDVL KKHE++   K+I+D L+ M GQ   S
Subjt:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS

Query:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQETSSWRKLREGEIALK
        +RH+TIKY+Y   MKE TS+REHVLDMM++ NIAEVNG  IDE +QE SSW+KL EGE+ LK
Subjt:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQETSSWRKLREGEIALK

A0A6J1DUZ9 uncharacterized protein LOC111024294

8.0e-47

Show/hide

Query:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS
        L   K +G NY TWK+NLNTILV+DDL+F LTEECP  P+   N+NV++A DRW++ NDKARV IL  ++DVL KKHE ++ AKEIMD L+AM G+ SS+
Subjt:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS

Query:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQETSS
        +RH+ +KYVYN  MKEGTSVREHVLDMMV+FN AEVNG  IDE +++ ++
Subjt:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQETSS

A0A6J1DXQ5 uncharacterized protein LOC111024457

2.1e-47

62.67

Show/hide

Query:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS
        L   K +G NY TWK+NLNTILV+DDLRF LTEECP  P++  N+NV++A DRW++ NDKARV IL  ++DVL KKHE ++ AKEIMD L+AM G+ SS+
Subjt:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS

Query:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQETSS
        +RH+ +KYVYN  MKEGTSVREHVLDMMV+FN AEVNG  IDE +++ ++
Subjt:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQETSS

A0A6J1E205 uncharacterized protein LOC111025258

8.0e-47

66.44

Show/hide

Query:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS
        L   K +GDNYG WKSNLNTILV+DDLRF LTEECPP  +  +NQ V+DA DRW + N+KARV IL  ISDVL KKHE +  A+EIMD LQA+ GQ S+S
Subjt:  LGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGISDVLFKKHENMVAAKEIMDLLQAMLGQLSSS

Query:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQ
        I HD IKYVYN  MKEG+SVREHVL+MMV+FN+AEVN  +++E SQ
Subjt:  IRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQ

SwissProt top hits

e value

%identity

Alignment

Q8I7P9 Retrovirus-related Pol polyprotein from transposon opus

1.6e-04

41.67

Show/hide

Query:  DHESLKYFFTQKKLNMRHRRWLELAKDYDCEILYHPSKVNVVVDALSR
        DH+ L +    +  N + +RW    ++Y+CE++Y P K NVV DALSR
Subjt:  DHESLKYFFTQKKLNMRHRRWLELAKDYDCEILYHPSKVNVVVDALSR

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAAGGGCATCACAGTTGACACTCCAAAAGTAGAAGCAGTTTCTAATTGGCCAGATTTTCTTTACTACGCATCTTGTGATTATGTCGTATTTGGTATGGCCAATTCCTT
GGTTGCACGTATGGAGATTTCTCTTTCCCATGTTTTCCAAGGGCAAGTTTTAGTTGAAGTAGGTGATCTTTCAAGGACATGTAGTCTCAAAGGATTGGATTTTAGTAGAC
CTTGCAAAGATAAAGACCATGAGAGCTTGAAGTACTTTTTCACTCAAAAGAAGTTGAATATGAGACATCGTAGATGGCTAGAGTTAGCTAAAGATTACGATTGTGAGATT
TTGTACCACCCAAGCAAGGTGAATGTAGTGGTAGATGCTCTTAGTAGAAAGGCAGCTCATTCAACAACTCTTGTTACCAGGCAAACTCATTTATACGATGACTTTAACCG
TGCAGGAATTGCAGTGGCAGTAGGAGAAGTTTCTACACTACTGGCACAGTTGACAGTACAACCTACCTTAGGACAGAAAATCATTGATGCACAACAGGGTGGTCCTTACC
TTGTTGAGAAGTTTCACCAGGGTAAGAAGGGTAGAGAAAATACCTCGAGCCCATGTTCGAGTACCAAGCACTACGGTGCTGGAGTAACCCATGTCATACTCCCAGGAAAA
GCTCGAACGACCTTCAATAAAAGGGTACTTGTACCTAAAACTGACACAGGTGGGGTGCCTCCTCACAAAGAGGGTCGTAGTGACCAAGCTCAGGTGACTGTTTACAAAAA
CACAGGGGAGCCGGCGACCGAAGCCTCAATGAATGGCAGTTGTAACTATAATGGTCCTAAGGGTCCTCTTATCTCTTCCTTCTCCGAGCTCGGGTCATGGAAGAAGGAGC
CGAGAAGAAAGTATCAGCAACAACAGGGGATGGATTCTCACTCTCTGAGAGGTGACTCTGAAAATCCTCAGAATCTTCTCACAGAAGAGCTCGAAACGGAGGGTGGCTAT
GAAGCTGTCGCACAGGCTATTATTGCGAAAATCGGCGCACACAACCAACTATTGTTAAGAATTTCATCTTTGTACCAAAAACAGGCAAGGGGCGGAATACCACAAAGAGA
AAGGCGCCGTGGCAGCGCCGTCTCAGCGCCGCGACGCTGTCTTGCGTTCTTCAAGGATGCGTCGAGGCAGTGCCTTTCCAGCGCCGCGTTGCTACTCTGCGTTCATGCTG
ATGCGTTTCTGCTTCAGCGTCATGGCAGCGCTGCCTTAGCGCCGCGGCGCACCATGCGTTTCAAGCAAGGATGCGTTTTTCAGCACTTTTTCTCCATATTCTTGCTCGAA
ACACGCACGAGGAAGAAGAATTGGTCCAATTGGACTAGTGGCGATCTGGTTCGATGTTTTCCAGCCGATTTAGCCCTTATTTCAGCTTTGGAGGTTCGGTTTGGGGGGTT
TCGGCTTGGTTTGGGCCGGCCAAAGAGTTCGGGAGATAATTATGGTACATGGAAATCAAACTTGAACACTATACTAGTCATGGATGATTTACGGTTCGCTTTAACGGAGG
AGTGTCCTCCAATTCCTAGCTCAACTACAAATCAAAATGTTCAGGATGCATGTGATAGATGGATTAGGGTTAACGATAAAGCTCGAGTTTGCATCTTAGTAGGCATATCA
GATGTTTTGTTTAAGAAGCATGAGAACATGGTGGCCGCTAAGGAAATTATGGACTTGCTGCAGGCGATGTTGGGACAACTGTCCTCATCGATCAGGCACGATACTATTAA
ATATGTTTACAATTCCTGCATGAAAGAAGGAACCTCTGTTAGAGAACATGTTCTGGATATGATGGTCTACTTTAATATTGCGGAAGTAAACGGCGTTATCATAGACGAGA
AGAGTCAAGAAACTAGTTCTTGGAGAAAGCTACGAGAAGGTGAGATAGCTCTCAAGGGTAAAGGTTCTCACTCACTGGGAGACGACTCTGAAAATTCTCATAATCTTTCT
CTCAGAAGAGCTCGAAATGGAGGCTGGTTATGGCGTCTGTATCTACTTTTTCTCAATGCATGGTCTCAACGCATAGTCTCGACGCATGGGTTTCCACTTGTTCTCGCAGT
AGCTTTGCCTCTAGTACTTGGGTTATTTGTGCTTCTTTTCTTCTTAATCCTGCGTTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MKGITVDTPKVEAVSNWPDFLYYASCDYVVFGMANSLVARMEISLSHVFQGQVLVEVGDLSRTCSLKGLDFSRPCKDKDHESLKYFFTQKKLNMRHRRWLELAKDYDCEI
LYHPSKVNVVVDALSRKAAHSTTLVTRQTHLYDDFNRAGIAVAVGEVSTLLAQLTVQPTLGQKIIDAQQGGPYLVEKFHQGKKGRENTSSPCSSTKHYGAGVTHVILPGK
ARTTFNKRVLVPKTDTGGVPPHKEGRSDQAQVTVYKNTGEPATEASMNGSCNYNGPKGPLISSFSELGSWKKEPRRKYQQQQGMDSHSLRGDSENPQNLLTEELETEGGY
EAVAQAIIAKIGAHNQLLLRISSLYQKQARGGIPQRERRRGSAVSAPRRCLAFFKDASRQCLSSAALLLCVHADAFLLQRHGSAALAPRRTMRFKQGCVFQHFFSIFLLE
TRTRKKNWSNWTSGDLVRCFPADLALISALEVRFGGFRLGLGRPKSSGDNYGTWKSNLNTILVMDDLRFALTEECPPIPSSTTNQNVQDACDRWIRVNDKARVCILVGIS
DVLFKKHENMVAAKEIMDLLQAMLGQLSSSIRHDTIKYVYNSCMKEGTSVREHVLDMMVYFNIAEVNGVIIDEKSQETSSWRKLREGEIALKGKGSHSLGDDSENSHNLS
LRRARNGGWLWRLYLLFLNAWSQRIVSTHGFPLVLAVALPLVLGLFVLLFFLILR

ClCG04G001030 (gene) of Watermelon (Charleston Gray) v2.5 genome