CuGenDBv2

Gene ID	Clc04G01757
Organism	Citrullus lanatus subsp. cordophanus (Watermelon (cordophanus) v2)
Description	Reverse transcriptase
Genome location	ClcChr04:5717241..5721675
RNA-Seq Expression	Clc04G01757
Synteny	Clc04G01757
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_019150696.1 PREDICTED: uncharacterized protein LOC109147552 [Ipomoea nil]

4.8e-50

43.84

Show/hide

Query:  RKEARERRTAEERFSAEGTIEELLEEEETPMEKPVERILWDLSAPNIDRQPLCITYP--------------------AMKGEDPHKHLKKFIIVCEGMRP
        RKE ++R ++        T + + EE  + M +P  R L +L+APN++ QPLCIT P                     + GEDPHKHLK+F +VC GM+P
Subjt:  RKEARERRTAEERFSAEGTIEELLEEEETPMEKPVERILWDLSAPNIDRQPLCITYP--------------------AMKGEDPHKHLKKFIIVCEGMRP

Query:  HGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQ-------------------------------TYFY
         GVT+E I+LRAFPFSLKD AKDWLY LPP SV TW ++++ FL KFF ASRAT IRKE YGI Q                                YFY
Subjt:  HGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQ-------------------------------TYFY

Query:  EGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTRALCNVFAAKQQPQEPVAEVSYAGNQHVDECLTT-----TVGAVKGTRA
        EGL+P+DRS +DA S  +L +KTP  AR LISTMAEN+QQ+GTRA  ++          V EVS + +++    LTT      VG +K T A
Subjt:  EGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTRALCNVFAAKQQPQEPVAEVSYAGNQHVDECLTT-----TVGAVKGTRA

XP_019180076.1 PREDICTED: uncharacterized protein LOC109175288 [Ipomoea nil]

4.0e-49

46.72

Show/hide

Query:  RKEARERRTAEERFSAEGTIEELLEEEETPMEKPVERILWDLSAPNIDRQPLCITYP--------------------AMKGEDPHKHLKKFIIVCEGMRP
        RKE ++R ++        T + + EE  + M +P  R L +L+AP++++QPLCIT P                     + GEDPHKHLK+F +VC GM+P
Subjt:  RKEARERRTAEERFSAEGTIEELLEEEETPMEKPVERILWDLSAPNIDRQPLCITYP--------------------AMKGEDPHKHLKKFIIVCEGMRP

Query:  HGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQ-------------------------------TYFY
         GVT+E I+LRAFPFSLKD AKDWLY L P SV TW ++++ FL KFF ASRAT IRKE YGI Q                                YFY
Subjt:  HGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQ-------------------------------TYFY

Query:  EGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTR
        EGL+P+DRS +DA S  +L +KTPT+AR LISTMAEN+QQ+GTR
Subjt:  EGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTR

XP_019198426.1 PREDICTED: uncharacterized protein LOC109192308 [Ipomoea nil]

3.1e-49

51.87

Show/hide

Query:  RKEARERRTAEERFSAEGTIEELLEEEETPMEKPVERILWDLSAPNIDRQPLCITYP--------------------AMKGEDPHKHLKKFIIVCEGMRP
        RKE ++R ++        T + + EE  + M +P  R L +L+APN+++QPLCIT P                     + GEDPHKHLK+F +VC GM+P
Subjt:  RKEARERRTAEERFSAEGTIEELLEEEETPMEKPVERILWDLSAPNIDRQPLCITYP--------------------AMKGEDPHKHLKKFIIVCEGMRP

Query:  HGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQTYFYEGLIPSDRSTIDATSVVTLVNKTPTEARALI
         GVT+E I+LRAFPFSLKD AKDWLY LPP SV TW ++++ FL KFF ASRAT IRKE YGI Q      L+P+DRS +DA S  +L +KT T+AR LI
Subjt:  HGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQTYFYEGLIPSDRSTIDATSVVTLVNKTPTEARALI

Query:  STMAENAQQFGTRA
        STMAEN+QQ+GTRA
Subjt:  STMAENAQQFGTRA

XP_024041424.1 uncharacterized protein LOC112098931 [Citrus clementina]

7.6e-48

42.07

Show/hide

Query:  LRRKEAR-ERRTAEERFSAEGTIEELLE----EEETPMEK--PVERILWDLSAPNIDRQPLCITYPAMK--------------------GEDPHKHLKKF
        LR++  R ++R++    S   T+ +L+E     EE  M++  PVER L +L+ P++++QPLCI Y  ++                    GEDPHKHLK+F
Subjt:  LRRKEAR-ERRTAEERFSAEGTIEELLE----EEETPMEK--PVERILWDLSAPNIDRQPLCITYPAMK--------------------GEDPHKHLKKF

Query:  IIVCEGMRPHGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQ--------------------------
         +VC  MRP GVTEEQI LRAFPFS+   AKDWLY+LPPGS+TTW  L++QFL K+F ASRA  IRK+  GI Q                          
Subjt:  IIVCEGMRPHGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQ--------------------------

Query:  -----TYFYEGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTRALCNVFAAKQQPQEPVAEVSYAGNQHVDECLTTTVGAVKGTRARLAD
              YFYEGL   DRS IDA S   LVNKTPT+AR LIS MA NAQQFG+R                     A ++ V+E  T ++  ++   ++LA 
Subjt:  -----TYFYEGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTRALCNVFAAKQQPQEPVAEVSYAGNQHVDECLTTTVGAVKGTRARLAD

Query:  AVSRLDTQ-QKNLPSQPTPN-VQNVSAI
         VSRL++Q    LPSQ   N  QNVSA+
Subjt:  AVSRLDTQ-QKNLPSQPTPN-VQNVSAI

XP_031131881.1 uncharacterized protein LOC116033267 [Ipomoea triloba]

1.5e-48

46.12

Show/hide

Query:  RKEARERRTAEERFSAEGTIEELLEEEETPMEKPVERILWDLSAPNIDRQPLCITYP--------------------AMKGEDPHKHLKKFIIVCEGMRP
        RKE ++R ++        T + + EE  + M +   R L +L+ P++++QPLCIT P                     + GEDPHKHLK+F +VC GM+P
Subjt:  RKEARERRTAEERFSAEGTIEELLEEEETPMEKPVERILWDLSAPNIDRQPLCITYP--------------------AMKGEDPHKHLKKFIIVCEGMRP

Query:  HGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQ-------------------------------TYFY
         GVT+E I LRAFPFSLKD AKDWLY +PP SVTTW ++++ FL KFF AS+AT IRKE YGI Q                                YFY
Subjt:  HGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQ-------------------------------TYFY

Query:  EGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTRA
        EGL+P DRS +DA S  +LV+KTPT+AR LISTMA+N+QQ+GTRA
Subjt:  EGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTRA

TrEMBL top hits

e value

%identity

Alignment

A0A6P6SET8 uncharacterized protein LOC113690552

2.6e-46

43.11

Show/hide

Query:  RKEARERRTAEERFSAEGTIEELL----EEEETPMEKPVERILWDLSAPNIDRQPLCITYPAMK--------------------GEDPHKHLKKFIIVCE
        RK  RER  A    +   ++ + +    E EE       ER L +L+AP++++QPLCITYP ++                    GEDPHKHLK+F +VC 
Subjt:  RKEARERRTAEERFSAEGTIEELL----EEEETPMEKPVERILWDLSAPNIDRQPLCITYPAMK--------------------GEDPHKHLKKFIIVCE

Query:  GMRPHGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQ-------------------------------
         M+P GVTEEQI LRAFPFSL D AKDWLY+LP GS++TW ++++ FL KFF ASRA  IRK+  GI Q                               
Subjt:  GMRPHGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQ-------------------------------

Query:  TYFYEGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTRALCNVFAAKQQPQEPVAEVSYAGNQHVDECLTTTV
         YFYEGL  +DR  IDA S  +LVNKTPTEAR LIS+MA NAQQFG R        +      V EVS +  +   +CLT+ V
Subjt:  TYFYEGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTRALCNVFAAKQQPQEPVAEVSYAGNQHVDECLTTTV

A0A6P6T081 uncharacterized protein LOC113696515

1.4e-44

42.54

Show/hide

Query:  VLRRKEARERRTAEERFSAE--------------GTIEELLEEEETPMEKPVERILWDLSAPNIDRQPLCITYPAMK----------------------G
        + RR     R+  EE  SA               G      E+EE PM     R L +L+APN+++QPLCIT+P++                       G
Subjt:  VLRRKEARERRTAEERFSAE--------------GTIEELLEEEETPMEKPVERILWDLSAPNIDRQPLCITYPAMK----------------------G

Query:  EDPHKHLKKFIIVCEGMRPHGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQ----------------
        E+P+KHL++F +VC  M+P G+TEEQI ++AFPFSLKD AKDWLY+L PGS+TTW +L++ FL K+F ASRA+ +RKE  GI Q                
Subjt:  EDPHKHLKKFIIVCEGMRPHGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQ----------------

Query:  ---------------TYFYEGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTRALCNV
                        YFYEGL+  DRS IDA S   LVNKTP EAR LI  MAEN+QQFGTR  C +
Subjt:  ---------------TYFYEGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTRALCNV

A0A6P6UJL6 Reverse transcriptase

2.0e-46

40.6

Show/hide

Query:  RILWDLSAPNIDRQPLCITYP----------------------AMKGEDPHKHLKKFIIVCEGMRPHGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVT
        R L +L+AP++++QPLCIT+P                       + GE+P+KHL++F +VC  M+P G+TEEQI +RAFPFSLKD AKDWLY+LPPGS+T
Subjt:  RILWDLSAPNIDRQPLCITYP----------------------AMKGEDPHKHLKKFIIVCEGMRPHGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVT

Query:  TWKELQRQFLGKFFLASRATRIRKENYGIFQ-------------------------------TYFYEGLIPSDRSTIDATSVVTLVNKTPTEARALISTM
        TW +L+++FL K+F ASRA  +RKE  GI Q                                YFYE L+  DRS IDA     LVNKTP  A  LI  M
Subjt:  TWKELQRQFLGKFFLASRATRIRKENYGIFQ-------------------------------TYFYEGLIPSDRSTIDATSVVTLVNKTPTEARALISTM

Query:  AENAQQFGTRALCNVFAAKQQPQEPVAEVSYAGNQHVDECLTTTVGAVKGTRARLADAVSRLDTQ-QKNLPSQPTPNVQNVSAISMSCAMNPLPEKPV
        AEN+QQFG+R        +  P   V EV  +  Q     LT+ V +++    ++A  ++RL++Q Q  LPSQP  N +NVSA+++         +PV
Subjt:  AENAQQFGTRALCNVFAAKQQPQEPVAEVSYAGNQHVDECLTTTVGAVKGTRARLADAVSRLDTQ-QKNLPSQPTPNVQNVSAISMSCAMNPLPEKPV

A0A6P6WXZ3 uncharacterized protein LOC113735511

1.3e-45

42.76

Show/hide

Query:  RKEARERRTAEERFSAEGTIEELL----EEEETPMEKPVERILWDLSAPNIDRQPLCITYPAMK--------------------GEDPHKHLKKFIIVCE
        RK  RER  A    +   ++ + +    E EE       ER L +L+AP++++QPLCITYP ++                    GEDPHKHLK+F +VC 
Subjt:  RKEARERRTAEERFSAEGTIEELL----EEEETPMEKPVERILWDLSAPNIDRQPLCITYPAMK--------------------GEDPHKHLKKFIIVCE

Query:  GMRPHGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQ-------------------------------
         M+P GVTEEQI LRAFPFSL D AKDWLY+L  GS++TW ++++ FL KFF ASRA  IRK+  GI Q                               
Subjt:  GMRPHGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQ-------------------------------

Query:  TYFYEGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTRALCNVFAAKQQPQEPVAEVSYAGNQHVDECLTTTV
         YFYEGL  +DR  IDA S  +LVNKTPTEAR+LIS+MA NAQQFG R        +      V EVS +  +   +CLT+ V
Subjt:  TYFYEGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTRALCNVFAAKQQPQEPVAEVSYAGNQHVDECLTTTV

A0A6P6X8T1 Reverse transcriptase

1.0e-45

42.4

Show/hide

Query:  RKEARERRTAEERFSAEGTIEELL----EEEETPMEKPVERILWDLSAPNIDRQPLCITYPAMK--------------------GEDPHKHLKKFIIVCE
        RK  RER  A    +   ++ + +    E EE       ER L +L+AP++++QPLCITYP ++                    GEDPHKHLK+F ++C 
Subjt:  RKEARERRTAEERFSAEGTIEELL----EEEETPMEKPVERILWDLSAPNIDRQPLCITYPAMK--------------------GEDPHKHLKKFIIVCE

Query:  GMRPHGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQ-------------------------------
         M+P GVTEEQI LRAFPF L D AKDWLY+LP GS++TW ++++ FL KFF ASRA  IRK+  GI Q                               
Subjt:  GMRPHGVTEEQINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQ-------------------------------

Query:  TYFYEGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTRALCNVFAAKQQPQEPVAEVSYAGNQHVDECLTTTV
         YFYEGL  +DR  IDA S  +LVNKTPTEAR+LIS+MA NAQQFG R               V EVS +  +   +CLT+ V
Subjt:  TYFYEGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTRALCNVFAAKQQPQEPVAEVSYAGNQHVDECLTTTV

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTATCAAGGCTATGGTAACTATTTTATAGCTTGGGTATTAGGGATTCTTTTTGTAATCGATGTGCTTAGAAGGAAGGAAGCTAGAGAGCGAAGAACTGCAGAGGAACG
TTTCAGTGCAGAAGGCACAATTGAAGAGCTTTTAGAAGAAGAAGAAACACCAATGGAAAAACCTGTAGAGCGCATATTGTGGGACCTCTCAGCCCCAAACATTGATCGAC
AACCCCTTTGCATTACCTATCCCGCCATGAAAGGTGAGGACCCCCATAAACATCTTAAGAAGTTCATCATTGTGTGCGAGGGGATGAGGCCCCATGGTGTGACTGAGGAG
CAAATCAACCTTAGAGCTTTCCCCTTCTCCTTGAAGGACGATGCGAAGGATTGGCTTTACTTTCTTCCTCCTGGTTCTGTGACCACTTGGAAGGAATTGCAGAGGCAGTT
TTTGGGGAAGTTCTTCCTTGCATCACGTGCTACACGTATAAGGAAAGAGAATTATGGGATCTTTCAGACGTACTTCTATGAAGGGCTCATCCCTAGTGATAGAAGTACCA
TCGATGCAACTAGTGTTGTCACCTTGGTCAACAAGACTCCTACAGAGGCTAGGGCACTCATCTCCACCATGGCAGAGAATGCACAGCAGTTCGGGACGCGAGCTCTCTGC
AATGTCTTTGCTGCCAAGCAGCAACCCCAAGAGCCTGTAGCTGAGGTTAGTTATGCTGGCAATCAACATGTGGATGAATGTTTAACTACAACTGTTGGGGCGGTCAAGGG
AACTAGGGCTAGGCTAGCTGATGCTGTGAGTAGGTTGGACACTCAACAGAAGAATCTTCCTTCCCAGCCCACACCAAACGTGCAGAATGTGAGTGCCATCTCTATGAGCT
GCGCGATGAACCCCTTGCCTGAAAAGCCCGTAGGTGAACCTGTGGACATAGTGAGTGATATTAGCTCAGTGAAGAAACGTGGGGTAAGCTTTGATCCACCTCTTAATTTA
AATGTTTCTACTAATTTGCCTCGTGCTCCCTTCCTCAGCAGGTTGGCTGTTGCTCAGGGAGGATCACTTCAGGAGAAGGTGAGGTTAGTTCTATCCCCTGAAGTTCAGAG
GCCTACTATTGAGGGAAAGAGGGTGTGGACCAAAGTTCGTCAGAAGGAAAAGAAGGGAGAGAATAAACAAGAAGGGTGTGGACCAAAGTACGTTTTCTGGAGACCCTTTC
TAAAGACCGCGAAAGTGGTGATCGATGTGGATGAAGGATCTCTATCTCTAAGGCATGGAGAAAAAATTGAAAAATTCTTTATTTCTAATGATTCCTCCACCACTAATCTC
GAGTGTTTTAGCTCTATGGGGACTCGCAATTCCAGATGGATATGGATGACGAAGCCAAGTGTAGTTGAGCCTAACGACCTTAAAAATTTGCCCTTCCTGGAGGGCACAAC
GTCGCGATGCTACCATCACGACAGAACTACTAATAGCAGTTCTGTCCGCGTGAGAGGGGATTTCTTCACTCTTCTTCCTTCTTTTAAACATTTTCTCCGTGGGTTTTTGG
CCATTTGTGCGTATTGGATAGCATCATTGGCATTTGGAGTCTTCACCAATCTTAAGTCTTCATTGCTGATTTTGCTTGAGATTTTGTGTGGTTTCCCTAAATGTTGTGTT
GTGCTAAAGTTGGAGGAAGGAATTGAAGTGTTGAAGCTTGGAAAGGAATTTTTTAGACTTGAACCTAGCATTGTGTTCTTAGAGTCTTATCCTATGGCACCTAAGAAAAG
CAAGGGTAAGGGTGTAGCATCTAGTTCCACTAGAGACCAGAATGAGCCATCATGCGATGGTACCATGGTCGCTAATGTTATAATTCCTGAGCGAGGGCTTAGGCTCGAGG
CTGATTTCTTCACCCAAATCTCCACTAAAACTCAACGTCGTGGGTGGGAATTATTGGCTCGGCAACCTGATGTGGCCATAGTTCTCGTAGTGAGGAAATTTTACTACAGT
ATAGTTGAGGATTTTGATGAGTCTTATGTTAGAGGTCGGTCGGTATCTTTCTCCCCTTCTGTCATAAATAGTTTATTCCACCTTCCTAACATCCATAGAGACGAGTACTC
TGAGTTTTCTTATGGCAAGATCGACTATGACACCATGGCCAAGACCCTAGGTGGGCCTGGGACGCGATGGGTGGTCAAACGAGAGGCACCAGTTAGGATAAGAGGGACCG
ACCTCTTTGTTTCTGGCCAGATTTGGCACGCTTTTATTTGCACTAGGTTCATGCTTGTGACACACTTAGCGGACATCATACGTGCATCAATCCAAGGAGCTCGAGAGGAG
AGTCAACTGGAGCGTATTAAGAAGAGGATCTCTACTTTGCTCACATTTATTTTGACCCTCACCTTCCTAGGGCGCATTCCCCTGGCTCTGATTCTTAAACCCCATTTCGC
TTCTAGTGCGCTTCTTTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MYQGYGNYFIAWVLGILFVIDVLRRKEARERRTAEERFSAEGTIEELLEEEETPMEKPVERILWDLSAPNIDRQPLCITYPAMKGEDPHKHLKKFIIVCEGMRPHGVTEE
QINLRAFPFSLKDDAKDWLYFLPPGSVTTWKELQRQFLGKFFLASRATRIRKENYGIFQTYFYEGLIPSDRSTIDATSVVTLVNKTPTEARALISTMAENAQQFGTRALC
NVFAAKQQPQEPVAEVSYAGNQHVDECLTTTVGAVKGTRARLADAVSRLDTQQKNLPSQPTPNVQNVSAISMSCAMNPLPEKPVGEPVDIVSDISSVKKRGVSFDPPLNL
NVSTNLPRAPFLSRLAVAQGGSLQEKVRLVLSPEVQRPTIEGKRVWTKVRQKEKKGENKQEGCGPKYVFWRPFLKTAKVVIDVDEGSLSLRHGEKIEKFFISNDSSTTNL
ECFSSMGTRNSRWIWMTKPSVVEPNDLKNLPFLEGTTSRCYHHDRTTNSSSVRVRGDFFTLLPSFKHFLRGFLAICAYWIASLAFGVFTNLKSSLLILLEILCGFPKCCV
VLKLEEGIEVLKLGKEFFRLEPSIVFLESYPMAPKKSKGKGVASSSTRDQNEPSCDGTMVANVIIPERGLRLEADFFTQISTKTQRRGWELLARQPDVAIVLVVRKFYYS
IVEDFDESYVRGRSVSFSPSVINSLFHLPNIHRDEYSEFSYGKIDYDTMAKTLGGPGTRWVVKREAPVRIRGTDLFVSGQIWHAFICTRFMLVTHLADIIRASIQGAREE
SQLERIKKRISTLLTFILTLTFLGRIPLALILKPHFASSALL

Clc04G01757 (gene) of Watermelon (cordophanus) v2 genome