CuGenDBv2

Gene ID	Lag0031437
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Retrovirus-related Pol polyprotein from transposon TNT 1-94
Genome location	chr11:8465631..8472444
RNA-Seq Expression	Lag0031437
Synteny	Lag0031437
Gene Ontology terms	GO:0006259 - DNA metabolic process (biological process) GO:0005488 - binding (molecular function) GO:0016779 - nucleotidyltransferase activity (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022147763.1 uncharacterized protein LOC111016620 [Momordica charantia]

2.0e-98

72.59

Show/hide

Query:  MAANSSTN---VAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY
        MAAN+STN   + GSTI K HAEKPEKFKGENFKRWQQKM+FY TTLNLAHI+KE CP T  + +T ETEAAKQ W+HSDFLC NYILS ++DTLYNVY 
Subjt:  MAANSSTN---VAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY

Query:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL
        NA+ TSR LWEALDKKYKLED GTKKFLVGKFLDYKM+DTKLVVN +EELQIIISDLQSEGL I+EPFQV  VIEKL P+W++FKCYLKHK+KELS+ENL
Subjt:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL

Query:  AIKLRIEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGV
         +KLRI+E+N KG K   + EA AH+AE+SRR PKK Q K  N+   PRND NK I  +
Subjt:  AIKLRIEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGV

XP_022148559.1 uncharacterized protein LOC111017193 [Momordica charantia]

9.8e-106

72.86

Show/hide

Query:  MAANSSTN---VAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY
        MAAN+S N   + GSTI+K HAEK EKFKGENFKRWQQKMIFY TTLNLAHILKE CP TP + +TLETEA KQ  +HS+FLC NYILS L+DTL+NVY 
Subjt:  MAANSSTN---VAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY

Query:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL
        NA+ TSR LWEALDKKYKLED GTKKFLV KFLDYK+IDTKLV+NQ+EELQII SDLQSE L I+EPFQ+ AVIEKLPP+W++FK YLKHKRKELSMENL
Subjt:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL

Query:  AIKLRIEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGVYWVCGKSDHIAADCRNKKDSS
         +KLRIEEDNRK  K   + EA AH+ E+SRR PKK Q K  N    PRNDANKRIR + WVCGKS HIAA+ R+KK  S
Subjt:  AIKLRIEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGVYWVCGKSDHIAADCRNKKDSS

XP_022150041.1 uncharacterized protein LOC111018314 [Momordica charantia]

3.3e-85

62.5

Show/hide

Query:  MAANSSTN---VAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY
        MAAN+S N   + G TI+K H EKPEKFKGENFKRWQQKMIFYLTTLNLAH LK   P TP + +T ETEAAKQ W+HSDFLC NYILS L+DTLYNVY 
Subjt:  MAANSSTN---VAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY

Query:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL
        NA+  SR LWEALDKKYKLE                  D +LV+N                    E FQVAAVIEKLPP+W++FKCYLKHKRK+L MENL
Subjt:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL

Query:  AIKLRIEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGVYWVCGKSDHIAADCRNKKDSS
         +KL IEEDNRKG K   +VEAN H+AE+SRR PKK Q K  NVN  PRNDANKRIR + WVCG S HIAA+CR+KK  S
Subjt:  AIKLRIEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGVYWVCGKSDHIAADCRNKKDSS

XP_022155402.1 uncharacterized protein LOC111022547 [Momordica charantia]

1.4e-83

60.65

Show/hide

Query:  MAANSSTNVA---GSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY
        M  N+STN +   GSTI+K HAEK +KFKGENFKRWQQKMIFYLTTLNLA+ILKE CP T  K +T E EA KQ W+HSDFLCRNYIL+ ++DTLYNVY 
Subjt:  MAANSSTNVA---GSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY

Query:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL
        NA+ TSR LWEALDKKY+LED                                                VA VIEKLPP+W++FK YLKHKRKELS+ENL
Subjt:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL

Query:  AIKLRIEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGVYWVCGKSDHIAADCRNKK
         +K+RIEEDNRKG K   +VEANAH+AE+SRR PKK QFK  NVN  PRN+ANKRIR + WVCGKSDHIAA+CR+KK
Subjt:  AIKLRIEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGVYWVCGKSDHIAADCRNKK

XP_022156727.1 uncharacterized protein LOC111023572 [Momordica charantia]

1.9e-80

73.49

Show/hide

Query:  MAANSSTN---VAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY
        MAAN+STN   + GSTI+K H EK EKF+G+NFK WQ KMIFYLTTLNLAHIL++ CP TP + +  ETEAAKQ W+HSDFL  NYIL+ L+ TL NVY 
Subjt:  MAANSSTN---VAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY

Query:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL
        NA+ TSR LW+ LDKKYKLED GTKKFLVGKFLDYKM++TKLVVNQ+EELQII SDLQSEGL I+E FQVAAVIE LP  W++FKCYLKHKRK+LSMENL
Subjt:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL

Query:  AIKLRIEEDNRKGGK
         +KLRIEED RKG K
Subjt:  AIKLRIEEDNRKGGK

TrEMBL top hits

e value

%identity

Alignment

A0A6J1D271 uncharacterized protein LOC111016620

9.6e-99

72.59

Show/hide

Query:  MAANSSTN---VAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY
        MAAN+STN   + GSTI K HAEKPEKFKGENFKRWQQKM+FY TTLNLAHI+KE CP T  + +T ETEAAKQ W+HSDFLC NYILS ++DTLYNVY 
Subjt:  MAANSSTN---VAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY

Query:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL
        NA+ TSR LWEALDKKYKLED GTKKFLVGKFLDYKM+DTKLVVN +EELQIIISDLQSEGL I+EPFQV  VIEKL P+W++FKCYLKHK+KELS+ENL
Subjt:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL

Query:  AIKLRIEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGV
         +KLRI+E+N KG K   + EA AH+AE+SRR PKK Q K  N+   PRND NK I  +
Subjt:  AIKLRIEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGV

A0A6J1D4C8 uncharacterized protein LOC111017193

4.7e-106

72.86

Show/hide

Query:  MAANSSTN---VAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY
        MAAN+S N   + GSTI+K HAEK EKFKGENFKRWQQKMIFY TTLNLAHILKE CP TP + +TLETEA KQ  +HS+FLC NYILS L+DTL+NVY 
Subjt:  MAANSSTN---VAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY

Query:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL
        NA+ TSR LWEALDKKYKLED GTKKFLV KFLDYK+IDTKLV+NQ+EELQII SDLQSE L I+EPFQ+ AVIEKLPP+W++FK YLKHKRKELSMENL
Subjt:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL

Query:  AIKLRIEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGVYWVCGKSDHIAADCRNKKDSS
         +KLRIEEDNRK  K   + EA AH+ E+SRR PKK Q K  N    PRNDANKRIR + WVCGKS HIAA+ R+KK  S
Subjt:  AIKLRIEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGVYWVCGKSDHIAADCRNKKDSS

A0A6J1DA93 uncharacterized protein LOC111018314

1.6e-85

62.5

Show/hide

Query:  MAANSSTN---VAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY
        MAAN+S N   + G TI+K H EKPEKFKGENFKRWQQKMIFYLTTLNLAH LK   P TP + +T ETEAAKQ W+HSDFLC NYILS L+DTLYNVY 
Subjt:  MAANSSTN---VAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY

Query:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL
        NA+  SR LWEALDKKYKLE                  D +LV+N                    E FQVAAVIEKLPP+W++FKCYLKHKRK+L MENL
Subjt:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL

Query:  AIKLRIEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGVYWVCGKSDHIAADCRNKKDSS
         +KL IEEDNRKG K   +VEAN H+AE+SRR PKK Q K  NVN  PRNDANKRIR + WVCG S HIAA+CR+KK  S
Subjt:  AIKLRIEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGVYWVCGKSDHIAADCRNKKDSS

A0A6J1DP87 uncharacterized protein LOC111022547

6.7e-84

60.65

Show/hide

Query:  MAANSSTNVA---GSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY
        M  N+STN +   GSTI+K HAEK +KFKGENFKRWQQKMIFYLTTLNLA+ILKE CP T  K +T E EA KQ W+HSDFLCRNYIL+ ++DTLYNVY 
Subjt:  MAANSSTNVA---GSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY

Query:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL
        NA+ TSR LWEALDKKY+LED                                                VA VIEKLPP+W++FK YLKHKRKELS+ENL
Subjt:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL

Query:  AIKLRIEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGVYWVCGKSDHIAADCRNKK
         +K+RIEEDNRKG K   +VEANAH+AE+SRR PKK QFK  NVN  PRN+ANKRIR + WVCGKSDHIAA+CR+KK
Subjt:  AIKLRIEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGVYWVCGKSDHIAADCRNKK

A0A6J1DSQ3 uncharacterized protein LOC111023572

9.0e-81

73.49

Show/hide

Query:  MAANSSTN---VAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY
        MAAN+STN   + GSTI+K H EK EKF+G+NFK WQ KMIFYLTTLNLAHIL++ CP TP + +  ETEAAKQ W+HSDFL  NYIL+ L+ TL NVY 
Subjt:  MAANSSTN---VAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYY

Query:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL
        NA+ TSR LW+ LDKKYKLED GTKKFLVGKFLDYKM++TKLVVNQ+EELQII SDLQSEGL I+E FQVAAVIE LP  W++FKCYLKHKRK+LSMENL
Subjt:  NAYTTSRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENL

Query:  AIKLRIEEDNRKGGK
         +KLRIEED RKG K
Subjt:  AIKLRIEEDNRKGGK

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT4G00980.1 zinc knuckle (CCHC-type) family protein

4.5e-24

24.64

Show/hide

Query:  GSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDC--------PVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYYNAYTT
        G +++KI      +F G+++  W  +M  +L  L L ++L E C        P T P+ +T   +A  + W+  D+LC  ++++ L D LY  Y   +  
Subjt:  GSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDC--------PVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYYNAYTT

Query:  SRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENLAIKLR
        ++ LW+ L   Y+ ++  +K+  V K+++++M++ + ++ Q++    I   + S G+ + E F V+ +I K PPSW+ F C    + + L +  L  +++
Subjt:  SRLLWEALDKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENLAIKLR

Query:  IEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVN---PQPRNDANKRIRGVYWVCGKSDHIAADCRNKKDSSRA
         EE+  + G   +     A  +    R P      +G+ +    +   + ++R+  V   CG+  H+A  C   K   RA
Subjt:  IEEDNRKGGKASLEVEANAHVAESSRRDPKKRQFKKGNVN---PQPRNDANKRIRGVYWVCGKSDHIAADCRNKKDSSRA

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCTGCAAACTCCTCCACTAATGTTGCTGGATCGACCATCCTCAAAATTCATGCTGAAAAACCAGAGAAATTCAAGGGAGAAAATTTCAAGAGGTGGCAACAGAAGAT
GATCTTCTACCTCACCACACTGAACCTTGCTCACATCTTGAAGGAAGATTGTCCAGTTACCCCACCAAAAGGTGTTACTCTTGAAACTGAAGCTGCCAAGCAGACATGGA
TGCATTCAGATTTTTTATGCCGCAATTATATATTGAGTGGTCTTGAAGACACCTTGTATAATGTCTACTACAATGCCTATACTACTTCAAGGCTATTGTGGGAGGCATTA
GACAAGAAGTATAAGCTGGAAGATGTTGGTACTAAGAAGTTTCTTGTCGGAAAATTCTTAGATTATAAGATGATTGATACCAAGTTGGTAGTCAATCAGATGGAAGAATT
GCAAATTATCATTAGTGATTTGCAAAGTGAAGGATTGGGCATCAGTGAACCATTCCAAGTTGCTGCTGTGATTGAGAAGCTACCTCCTTCTTGGAAGGACTTCAAATGTT
ATCTTAAACACAAGCGAAAGGAGCTTTCCATGGAGAATCTTGCAATCAAACTCCGCATTGAAGAAGATAATAGAAAAGGAGGCAAAGCTTCGTTGGAAGTTGAAGCCAAT
GCTCATGTTGCTGAATCTTCAAGGCGTGATCCCAAGAAGCGACAATTCAAGAAGGGAAATGTGAATCCTCAACCGAGGAATGATGCCAATAAGCGCATTCGTGGAGTCTA
CTGGGTTTGTGGTAAGAGTGACCATATTGCTGCTGATTGTAGAAACAAGAAGGATAGTTCTAGAGCTTGGTCTCACTATTTCTTCGGTAAATTCGATAGATATTCACTAA
GGAAGGTTTTCGATAGAGCAGAAGGGTGTGTGGGTGTGTGGGTACCTCAAATCGCCAAAAAGTTACCTCAAATCACCGGAAAACGCTCGTGGGTTTCATGGGGGAGACCG
TGGGTAAGGTGGAATGACTTTATTGTTGGGGAAGCCATTGGAGAACAAACGGAAGAAATAGAGTTCGCAAGGCTTGCGACGAATTTCGGATTTTCGTCGCAAAGATCTTG
CGACGAATTTCGGATTTTCGTCGCAAAGACCTTGCGACGAATCGTTCCTTCTAGTCGCAGTTATTTTGAGATGAAGTATGCGACGTTTTTTCTCGTTTCGTCGCAACTTG
CAACGAATTTACCTTTTCGTCGCAGGTTGCGACGCATTTTAACAATTCGACGCAAAATCCTGCTTGCGACGGTGTTAAAGGTTATCGATTGTTTGATATCACAAAACGAC
AGGTCCTTATATCTCGAGTCGTGGTTTTCTTTGAAAAATTCTTTTCCATTTCATACTAGTGGTATTTCTGATGACACTATTAATGCCTTATTTGTTGATCATGCTTTGCC
AGGTCCTATTTTGGACCCTATTGTGCTTGAAAGTGTGGTCACTGATTCAAATCAAGAGTCTTCTGATTCTATTCTTGACTCTGGTATTTCTGATGACACTATTGATTCCT
TATTTGTTGATCATGCTTTGCAATGTCCTATTTTGGACCCTATTGTGCTTGAAAGTGTGGTCACTGATCCAAATCAAGAGTCTTCTGATTCTATTCTTGATTTGTCTGTT
GCTAAAGATCATGGAGCACAAAAAACTCAAATTGATGATTCAGAGAATGAGCCACAACCTTCTTGTAAGGATTTGGAATTCCCCAATTCCGTTAAAGCGGAAGCGTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MAANSSTNVAGSTILKIHAEKPEKFKGENFKRWQQKMIFYLTTLNLAHILKEDCPVTPPKGVTLETEAAKQTWMHSDFLCRNYILSGLEDTLYNVYYNAYTTSRLLWEAL
DKKYKLEDVGTKKFLVGKFLDYKMIDTKLVVNQMEELQIIISDLQSEGLGISEPFQVAAVIEKLPPSWKDFKCYLKHKRKELSMENLAIKLRIEEDNRKGGKASLEVEAN
AHVAESSRRDPKKRQFKKGNVNPQPRNDANKRIRGVYWVCGKSDHIAADCRNKKDSSRAWSHYFFGKFDRYSLRKVFDRAEGCVGVWVPQIAKKLPQITGKRSWVSWGRP
WVRWNDFIVGEAIGEQTEEIEFARLATNFGFSSQRSCDEFRIFVAKTLRRIVPSSRSYFEMKYATFFLVSSQLATNLPFRRRLRRILTIRRKILLATVLKVIDCLISQND
RSLYLESWFSLKNSFPFHTSGISDDTINALFVDHALPGPILDPIVLESVVTDSNQESSDSILDSGISDDTIDSLFVDHALQCPILDPIVLESVVTDPNQESSDSILDLSV
AKDHGAQKTQIDDSENEPQPSCKDLEFPNSVKAEA

Lag0031437 (gene) of Sponge gourd (AG-4) v1 genome