CuGenDBv2

Gene ID	Clc01G12100
Organism	Citrullus lanatus subsp. cordophanus (Watermelon (cordophanus) v2)
Description	Retrovirus-related Pol polyprotein from transposon TNT 1-94
Genome location	ClcChr01:20554450..20566589
RNA-Seq Expression	Clc01G12100
Synteny	Clc01G12100
Gene Ontology terms	GO:0009231 - riboflavin biosynthetic process (biological process) GO:0015074 - DNA integration (biological process) GO:0071897 - DNA biosynthetic process (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0003887 - DNA-directed DNA polymerase activity (molecular function) GO:0008270 - zinc ion binding (molecular function) GO:0008686 - 3,4-dihydroxy-2-butanone-4-phosphate synthase activity (molecular function)
InterPro domains	IPR001584 - Integrase, catalytic core IPR012337 - Ribonuclease H-like superfamily IPR036397 - Ribonuclease H superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

CAA7051484.1 unnamed protein product [Microthlaspi erraticum]

4.5e-63

64.02

Show/hide

Query:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ
        GQ   PF KLL+SKG CAQYTMP +P QNGV E+RNRTL EMVRSM+++S +P+SLW+YALR  TY+LNR+PSKAVPKTPYELWT RKPSLR+L VWG  
Subjt:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ

Query:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPII
         ++R+YNPHEKKLDS+T+S +FIGYP+ S GY FYC  HSTRIVE+ NARFIENG  SGS  +  V+I+E   + +       +VVPI+
Subjt:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPII

KAG7551855.1 Integrase catalytic core [Arabidopsis thaliana x Arabidopsis arenosa]

1.3e-65

64.4

Show/hide

Query:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ
        GQ   PF KLL+S+G CAQYTMP +P QNGV E+RNRTLM+MVRSM+++S +P+SLW+YAL+  TY+LNR+PSKAVPKTP+ELWT RKPSLR+L VWG  
Subjt:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ

Query:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPIIVV
         +++ YNPHEKKLDS+T+SG+FIGYP+ S GY FYC NHSTRIVE+ NARFIENG  SGS  +  V+I+E  ++ +    PS+VVVPI+ V
Subjt:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPIIVV

KAG7564986.1 Integrase catalytic core [Arabidopsis suecica]

1.3e-65

64.4

Show/hide

Query:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ
        GQ   PF KLL+S+G CAQYTMP +P QNGV E+RNRTLM+MVRSM+++S +P+SLW+YAL+  TY+LNR+PSKAVPKTP+ELWT RKPSLR+L VWG  
Subjt:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ

Query:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPIIVV
         +++ YNPHEKKLDS+T+SG+FIGYP+ S GY FYC NHSTRIVE+ NARFIENG  SGS  +  V+I+E  ++ +    PS+VVVPI+ V
Subjt:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPIIVV

RYE20332.1 transposase, partial [Sphingobacteriaceae bacterium]

1.4e-64

65.79

Show/hide

Query:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ
        GQ   PF K L+S+G CAQYTMP +P QNGV E+RNRTLM+MVRSM+++S +P SLWM+AL+   Y+LNR+PSKAVPKTP+ELWT RKPSLR+LHV+G  
Subjt:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ

Query:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPIIV
         ++RIYNPHE+KLDS+TISG+FIGYP+ S GYRFYC NHSTRIVE+ NARFIENG VSGS+   +VEI+E  +        SQVVVP+ V
Subjt:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPIIV

RZC25410.1 Retrovirus-related Pol polyprotein from transposon TNT 1-94 [Glycine soja]

1.2e-63

68.82

Show/hide

Query:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ
        GQ  SPF KLL+ +G CAQYTMP +P QNGV+E+RN+TLM+MVRSM+ +S +P+SLWMYAL+   Y+LNR+PSKAVPKTP+ELWT+R PS+R+LHVWG Q
Subjt:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ

Query:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKE
         ++RIYNP E+KLD++TISGYFIGYP+ S GY FYC NHSTRIVE+ NARFIENG +SGS    +VEIKE
Subjt:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKE

TrEMBL top hits

e value

%identity

Alignment

A0A445LQ30 Retrovirus-related Pol polyprotein from transposon TNT 1-94

5.7e-64

68.82

Show/hide

Query:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ
        GQ  SPF KLL+ +G CAQYTMP +P QNGV+E+RN+TLM+MVRSM+ +S +P+SLWMYAL+   Y+LNR+PSKAVPKTP+ELWT+R PS+R+LHVWG Q
Subjt:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ

Query:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKE
         ++RIYNP E+KLD++TISGYFIGYP+ S GY FYC NHSTRIVE+ NARFIENG +SGS    +VEIKE
Subjt:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKE

A0A4Q3ELL0 Transposase (Fragment)

6.7e-65

65.79

Show/hide

Query:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ
        GQ   PF K L+S+G CAQYTMP +P QNGV E+RNRTLM+MVRSM+++S +P SLWM+AL+   Y+LNR+PSKAVPKTP+ELWT RKPSLR+LHV+G  
Subjt:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ

Query:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPIIV
         ++RIYNPHE+KLDS+TISG+FIGYP+ S GYRFYC NHSTRIVE+ NARFIENG VSGS+   +VEI+E  +        SQVVVP+ V
Subjt:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPIIV

A0A6D2KEK6 Uncharacterized protein

2.2e-63

64.02

Show/hide

Query:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ
        GQ   PF KLL+SKG CAQYTMP +P QNGV E+RNRTL EMVRSM+++S +P+SLW+YALR  TY+LNR+PSKAVPKTPYELWT RKPSLR+L VWG  
Subjt:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ

Query:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPII
         ++R+YNPHEKKLDS+T+S +FIGYP+ S GY FYC  HSTRIVE+ NARFIENG  SGS  +  V+I+E   + +       +VVPI+
Subjt:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPII

A0A6N2K712 Uncharacterized protein

2.8e-63

55.41

Show/hide

Query:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ
        GQ   PF KLL+SKG CAQYTMP +P QNGV E+RNRTLMEMVRSM+++  +P+SLW+YAL+  TYILNR+PSKAVP TP+EL+  RKPSLR+L VWG  
Subjt:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ

Query:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPIIVVIPPPK----
         +++ YNPHEKKLDS+T+SGYFIGYP+ S G+ FYC +HSTRIVE+ NARFIENG  SGS  +  V IKE  ++ +    P+QVVVP++ V P  +    
Subjt:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPIIVVIPPPK----

Query:  -----YPLNLGESMRTADTDPLATSTANLIP
              PLN     +  + +P+A    +++P
Subjt:  -----YPLNLGESMRTADTDPLATSTANLIP

A0A6N2L229 Uncharacterized protein

1.3e-63

62.69

Show/hide

Query:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ
        GQ   PF KLL+SKG CAQYTMP +P QNGV E+RNRTLMEMVRSM+++  +P+SLW+YAL+  TYILNR+PSKAVP TP+EL+  RKPSLR+LHVWG  
Subjt:  GQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQ

Query:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPIIVVIP
         +++ YNPHEKKLDS+T++GYFIGYP+ S G+ FYC +HSTRIVE+ NARFIENG  SGS  +  V IKE  ++ +    P+QVV+P++ V P
Subjt:  PKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPIIVVIP

SwissProt top hits

e value

%identity

Alignment

P04146 Copia protein

8.6e-17

32.79

Show/hide

Query:  SGVGQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAV---PKTPYELWTSRKPSLRYL
        +G   +S+  ++    KG     T+P +P  NGV+E+  RT+ E  R+M++ + +  S W  A+   TY++NRIPS+A+    KTPYE+W ++KP L++L
Subjt:  SGVGQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAV---PKTPYELWTSRKPSLRYL

Query:  HVWGWQPKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGV-SGSVGAHDVEIKESLMDQN
         V+G    + I N  + K D K+    F+GY    NG++ + + +   IV +R+    E   V S +V    V +K+S   +N
Subjt:  HVWGWQPKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGV-SGSVGAHDVEIKESLMDQN

P10978 Retrovirus-related Pol polyprotein from transposon TNT 1-94

3.3e-16

32.14

Show/hide

Query:  GEGIPASASTSGVGQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVP-KTPYELWTS
        G  +    S +G    S  F++   S G   + T+P +P  NGV E+ NRT++E VRSM+  + +P S W  A++   Y++NR PS  +  + P  +WT+
Subjt:  GEGIPASASTSGVGQISSPFKKLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVP-KTPYELWTS

Query:  RKPSLRYLHVWGWQPKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIEN
        ++ S  +L V+G +    +      KLD K+I   FIGY     GYR +      +++ SR+  F E+
Subjt:  RKPSLRYLHVWGWQPKMRIYNPHEKKLDSKTISGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIEN

Q94HW2 Retrovirus-related Pol polyprotein from transposon RE1

7.0e-11

30.88

Show/hide

Query:  PRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVP-KTPYELWTSRKPSLRYLHVWG--WQPKMRIYNPHEKKLDSKTIS
        P +P  NG++E+++R ++E   ++++ + IP + W YA  +  Y++NR+P+  +  ++P++      P+   L V+G    P +R YN H  KLD K+  
Subjt:  PRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVP-KTPYELWTSRKPSLRYLHVWG--WQPKMRIYNPHEKKLDSKTIS

Query:  GYFIGYPKMSNGYRFYCSN-HSTRIVESRNARFIEN
          F+GY    + Y   C +  ++R+  SR+ RF EN
Subjt:  GYFIGYPKMSNGYRFYCSN-HSTRIVESRNARFIEN

Q9ZT94 Retrovirus-related Pol polyprotein from transposon RE2

3.5e-10

28.16

Show/hide

Query:  PRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVP-KTPYELWTSRKPSLRYLHVWG--WQPKMRIYNPHEKKLDSKTIS
        P +P  NG++E+++R ++EM  ++++ + +P + W YA  +  Y++NR+P+  +  ++P++    + P+   L V+G    P +R YN H  KL+ K+  
Subjt:  PRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVP-KTPYELWTSRKPSLRYLHVWG--WQPKMRIYNPHEKKLDSKTIS

Query:  GYFIGYPKMSNGYRFYCSNHST-RIVESRNARFIE--------NGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPIIVVIPPPKYPLNLGESMRTADT
          F+GY    + Y   C +  T R+  SR+ +F E        N GVS S        +E   D  P+  PS   +P   ++ P   P  LG  + T+  
Subjt:  GYFIGYPKMSNGYRFYCSNHST-RIVESRNARFIE--------NGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPIIVVIPPPKYPLNLGESMRTADT

Query:  DPLATS
         P + S
Subjt:  DPLATS

Q9ZUX4 Uncharacterized protein At2g27730, mitochondrial

1.6e-18

59.6

Show/hide

Query:  SARTVARIFSRRFSSSGKILSEEEKAAENVYIKKTEQEKLEKLARKGPKPEEKAGGSVTDSVPSGSASTSGASTEKISTDKHRNYAVVAGTVTILGALG
        + R   RI SRRF SSGK+LSEEE+AAENV+IKK EQEKL+KLAR+GP  E+ AG +    V   +AS S  S  K+S DK+RNYAVVAG V I+G++G
Subjt:  SARTVARIFSRRFSSSGKILSEEEKAAENVYIKKTEQEKLEKLARKGPKPEEKAGGSVTDSVPSGSASTSGASTEKISTDKHRNYAVVAGTVTILGALG

Arabidopsis top hits

e value

%identity

Alignment

AT2G27730.1 copper ion binding

1.1e-19

59.6

Show/hide

Query:  SARTVARIFSRRFSSSGKILSEEEKAAENVYIKKTEQEKLEKLARKGPKPEEKAGGSVTDSVPSGSASTSGASTEKISTDKHRNYAVVAGTVTILGALG
        + R   RI SRRF SSGK+LSEEE+AAENV+IKK EQEKL+KLAR+GP  E+ AG +    V   +AS S  S  K+S DK+RNYAVVAG V I+G++G
Subjt:  SARTVARIFSRRFSSSGKILSEEEKAAENVYIKKTEQEKLEKLARKGPKPEEKAGGSVTDSVPSGSASTSGASTEKISTDKHRNYAVVAGTVTILGALG

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTTTTTTACGGCAACAAGCACGCATTCTCCATGTGCAGCCATTGTGACTGAAGATCTTCTCCCAAGCTCACAAGTTCTGAAGATTGAAGCCCTTTCCTCCACTGCAAC
TACCAAAAACTCTCTCCTTCTTTCGGAAAGGCGTTCAATCGATATGGCATCAGCTAGGACGGTCGCTAGAATCTTTTCCCGAAGGTTCTCGAGCAGCGGGAAGATTCTCA
GCGAGGAAGAGAAGGCTGCTGAGAATGTCTACATCAAGAAAACTGAACAAGAAAAACTGGAGAAGCTTGCACGCAAGGGACCTAAACCAGAAGAAAAGGCAGGAGGGTCA
GTAACTGATTCCGTTCCCAGTGGCTCGGCCTCAACATCAGGAGCATCGACAGAGAAAATATCTACTGACAAACACCGGAATTATGCTGTTGTAGCTGGAACTGTGACGAT
TCTCGGTGCTCTTGGATGTAGGGTTGGCAAAAAACTAGTGAGGCTGGGTCCCCACGGGGCCCCGACCCGATCTGGTCGGGAAATCCCTAGTTTGACTAGGGATGTAGGTC
AAACCGGGGAGATTCCCCAAGTACCTGTTCAGGGTCAGGGCAGGGATGGGGAGGGTATCCCCGCCTCGGCCTCGACATCGGGAGTTGGACAAATTTCAAGTCCATTTAAG
AAGCTCCTTAAGTCTAAGGGCACTTGTGCGCAGTATACAATGCCCAGATCGCCAAATCAAAATGGTGTAACGGAAAAGCGTAATCGTACATTGATGGAAATGGTAAGGAG
TATGATGAATGATAGTGTTATACCTATTTCATTGTGGATGTATGCATTGAGGATAGTCACATACATATTGAATAGGATACCTAGTAAAGCAGTTCCTAAGACACCTTATG
AACTGTGGACATCTAGGAAGCCTAGTTTAAGATATCTTCATGTGTGGGGCTGGCAACCTAAAATGAGGATATATAATCCACATGAAAAAAAGTTGGATTCCAAGACCATT
AGTGGCTATTTCATTGGATATCCGAAAATGTCAAATGGGTATAGATTCTATTGTTCTAATCATAGTACGAGAATTGTAGAGTCTAGAAATGCTCGCTTCATTGAAAATGG
CGGAGTTAGTGGGAGTGTGGGAGCACATGATGTAGAGATAAAAGAGTCATTGATGGACCAAAATCCATCAAGTGATCCATCTCAAGTTGTTGTTCCTATTATTGTTGTCA
TACCCCCTCCCAAGTACCCTCTTAACCTAGGAGAAAGCATGAGGACAGCGGACACCGACCCTCTTGCGACATCCACTGCCAACCTTATACCTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MFFTATSTHSPCAAIVTEDLLPSSQVLKIEALSSTATTKNSLLLSERRSIDMASARTVARIFSRRFSSSGKILSEEEKAAENVYIKKTEQEKLEKLARKGPKPEEKAGGS
VTDSVPSGSASTSGASTEKISTDKHRNYAVVAGTVTILGALGCRVGKKLVRLGPHGAPTRSGREIPSLTRDVGQTGEIPQVPVQGQGRDGEGIPASASTSGVGQISSPFK
KLLKSKGTCAQYTMPRSPNQNGVTEKRNRTLMEMVRSMMNDSVIPISLWMYALRIVTYILNRIPSKAVPKTPYELWTSRKPSLRYLHVWGWQPKMRIYNPHEKKLDSKTI
SGYFIGYPKMSNGYRFYCSNHSTRIVESRNARFIENGGVSGSVGAHDVEIKESLMDQNPSSDPSQVVVPIIVVIPPPKYPLNLGESMRTADTDPLATSTANLIP

Clc01G12100 (gene) of Watermelon (cordophanus) v2 genome