CuGenDBv2

Gene ID	Lag0039705
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	CCHC-type domain-containing protein
Genome location	chr2:48625486..48633388
RNA-Seq Expression	Lag0039705
Synteny	Lag0039705
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component) GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR001878 - Zinc finger, CCHC-type IPR036875 - Zinc finger, CCHC-type superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAE8717380.1 hypothetical protein F3Y22_tig00110050pilonHSYRG00143 [Hibiscus syriacus]

1.7e-67

57.04

Show/hide

Query:  KMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVHGIST
        + D+EKFDGR+NFGLWQVQVKD+LIQSGL+KALKG+P+         EG   +    SS    KS MS+E+WEE+D+RA              NV   S+
Subjt:  KMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVHGIST

Query:  AKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVTSKLL
         KELWEKLE MYQA+S SNRLYLKEKF+ L+MEEGTKISDHLS LN I+SELE I V+I+DEDKA +LI SLP+SYEHM+ +LMYGKE ++F++VTSKL+
Subjt:  AKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVTSKLL

Query:  SEERRLKSEGRTSQEDSAL-VASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGSGSDADIVSLV
        SEERRLK+    S E  AL V  N KK K S +K  C  C Q GH+KKDC N  G++  +GS +D  ++V
Subjt:  SEERRLKSEGRTSQEDSAL-VASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGSGSDADIVSLV

KAF5758504.1 putative RNA-directed DNA polymerase [Helianthus annuus]

2.9e-70

58.78

Show/hide

Query:  SPVKMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVHG
        SP++  VEK+DGR+NFGLWQVQVKDVLIQSGLHKAL+G+P+  +S+  SG                 S   DE+WE++DLRA              NVHG
Subjt:  SPVKMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVHG

Query:  ISTAKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVTS
        ISTAK+LWEKLE +YQ +  SNRLYLKE+F+TLRM+  TKISDHLSVLN+I+SELE I VK+EDEDKA +LILSL +SYEHMKPILMYGKETL +ADVT 
Subjt:  ISTAKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVTS

Query:  KLLSEERRLKSEGRTSQEDSALVASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGS
        KLLSEE+RL S G TS E + L+  N  KKK   +   C +C QSGH+K++CP  A S+  S
Subjt:  KLLSEERRLKSEGRTSQEDSALVASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGS

KAF5765959.1 putative RNA-directed DNA polymerase [Helianthus annuus]

9.9e-71

58.78

Show/hide

Query:  SPVKMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVHG
        SP++ DVEK+DGR+NFGLWQVQVKDVLIQSGLHKAL+G+P+  +S+  SG                 S   DE+WE++DLRA              NVHG
Subjt:  SPVKMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVHG

Query:  ISTAKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVTS
        ISTAK+LWEKLE +YQ +   NRLYLKE+F+TLRM+  TKISDHLSVLN+I+SELE I VK+EDEDKA +LILSL +SYEHMKPILMYGKETL +ADVT 
Subjt:  ISTAKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVTS

Query:  KLLSEERRLKSEGRTSQEDSALVASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGS
        KLLSEE+RL S G TS E + L+  N  KKK   +   C +C QSGH+K++CP  A S+  S
Subjt:  KLLSEERRLKSEGRTSQEDSALVASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGS

KAG7577502.1 F-box associated domain type 1 [Arabidopsis thaliana x Arabidopsis arenosa]

3.0e-67

56.98

Show/hide

Query:  VKMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVHGIS
        +KM++EKFDGR+NFGLWQVQVKD+LIQ GLHKALKG+P+            PV    G+  G  K  +SD DWE++DLRA              NVHGIS
Subjt:  VKMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVHGIS

Query:  TAKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVTSKL
        TAKELWEKLE +YQA+  SNR+YLKEKF+TLRM EGT +SDHLSVLN I+SELE I VK++DED A +LI SLP+SYEHMKPIL++GKE + F +VTSKL
Subjt:  TAKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVTSKL

Query:  LSEERRLKSEGRTSQEDSALVASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGSGSDAD
         SEE+RL +       +SALVA N KK+    +K  C  C QSGH+K++CPN  G S    S+ D
Subjt:  LSEERRLKSEGRTSQEDSALVASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGSGSDAD

XP_022139673.1 uncharacterized protein LOC111010521 [Momordica charantia]

5.2e-104

79.17

Show/hide

Query:  EAEMSSFMSPVKMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA----------
        EA+MS FMSPVK+DVEKFDG +NFGLWQVQVKDVLIQS LHKALKGRPS+GASE+LS +GGP+ESSGGSSRG KKSSMS EDWEEMDLRA          
Subjt:  EAEMSSFMSPVKMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA----------

Query:  ---GNVHGISTAKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKET
            NVH ISTAKELWEKLEA+YQA+  SNRLYLKE+F+TL+MEEG KISDHLS LNSII ELE IEVKI+DEDKA +LILSLP SYEHMKPILMYGK+T
Subjt:  ---GNVHGISTAKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKET

Query:  LSFADVTSKLLSEERRLKSEGRTSQEDSALVASNWKKKKESMQKKGCS-ECRQSGHMKKDCPNR
        L+FA+VTSKLLSEERRLKSEGRTS EDSALV SNWKKKK+S+QKK C   C QSGHMKKDCPNR
Subjt:  LSFADVTSKLLSEERRLKSEGRTSQEDSALVASNWKKKKESMQKKGCS-ECRQSGHMKKDCPNR

TrEMBL top hits

e value

%identity

Alignment

A0A6A2YS90 Transcription initiation factor IIA subunit 2

7.1e-67

56.67

Show/hide

Query:  KMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVHGIST
        + D+EKFDGR+NFGLWQVQVKD+LIQSGL+KALKG+P+         EG   +    SS    KS MS+E+WEE+D+RA              NV   S+
Subjt:  KMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVHGIST

Query:  AKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVTSKLL
         KELWEKLE MYQA+S SNRLYLKEKF+ L+MEEGTKISDHLS LN I+SELE I V+I+DEDKA +LI SL +SYEHM+ +LMYGKE ++F++VTSKL+
Subjt:  AKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVTSKLL

Query:  SEERRLKSEGRTSQEDSAL-VASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGSGSDADIVSLV
        SEERRLK+    S E  AL V  N KK K S +K  C  C Q GH+KKDC N  G++  +GS +D  ++V
Subjt:  SEERRLKSEGRTSQEDSAL-VASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGSGSDADIVSLV

A0A6A3BK59 CCHC-type domain-containing protein

8.4e-68

57.04

Show/hide

Query:  KMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVHGIST
        + D+EKFDGR+NFGLWQVQVKD+LIQSGL+KALKG+P+         EG   +    SS    KS MS+E+WEE+D+RA              NV   S+
Subjt:  KMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVHGIST

Query:  AKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVTSKLL
         KELWEKLE MYQA+S SNRLYLKEKF+ L+MEEGTKISDHLS LN I+SELE I V+I+DEDKA +LI SLP+SYEHM+ +LMYGKE ++F++VTSKL+
Subjt:  AKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVTSKLL

Query:  SEERRLKSEGRTSQEDSAL-VASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGSGSDADIVSLV
        SEERRLK+    S E  AL V  N KK K S +K  C  C Q GH+KKDC N  G++  +GS +D  ++V
Subjt:  SEERRLKSEGRTSQEDSAL-VASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGSGSDADIVSLV

A0A6A3CWI3 CCHC-type domain-containing protein

2.5e-67

57.04

Show/hide

Query:  KMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVHGIST
        + D+EKFDGR+NFGLWQVQVKD+LIQSGL+KALKG+P+         EG   +    SS    KS MS+E+WEE+D+RA              NV   S+
Subjt:  KMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVHGIST

Query:  AKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVTSKLL
         KELWEKLE MYQA+S SNRLYLKEKF+ L+MEEGTKISDHLS LN I+SELE I V I+DEDKA +LI SLP+SYEHM+ +LMYGKE ++F++VTSKL+
Subjt:  AKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVTSKLL

Query:  SEERRLKSEGRTSQEDSAL-VASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGSGSDADIVSLV
        SEERRLK+    S E  AL V  N KK K S +K  C  C Q GH+KKDC N  G++  +GS +D  ++V
Subjt:  SEERRLKSEGRTSQEDSAL-VASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGSGSDADIVSLV

A0A6A3DA47 CCHC-type domain-containing protein

3.2e-67

57.04

Show/hide

Query:  KMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVHGIST
        + D+EKFDGR+NFGLWQVQVKD+LIQSGL+KALKG+P+         EG   +    SS    KS MS+E+WEE+D+RA              NV   S+
Subjt:  KMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVHGIST

Query:  AKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVTSKLL
         KELWEKLE MYQA+S SNRLYLKEKF+ L+MEEGTKISDHLS LN I+SELE I V+I+DEDKA +LI SLP+SYEHM+ +LMYGKE ++F++VTSKL+
Subjt:  AKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVTSKLL

Query:  SEERRLKSEGRTSQEDSAL-VASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGSGSDADIVSLV
        SEERRLK+    S E  AL V  N KK K S +K  C  C Q GH+KKDC N  G++  +GS +D  ++V
Subjt:  SEERRLKSEGRTSQEDSAL-VASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGSGSDADIVSLV

A0A6J1CG82 uncharacterized protein LOC111010521

2.5e-104

79.17

Show/hide

Query:  EAEMSSFMSPVKMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA----------
        EA+MS FMSPVK+DVEKFDG +NFGLWQVQVKDVLIQS LHKALKGRPS+GASE+LS +GGP+ESSGGSSRG KKSSMS EDWEEMDLRA          
Subjt:  EAEMSSFMSPVKMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA----------

Query:  ---GNVHGISTAKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKET
            NVH ISTAKELWEKLEA+YQA+  SNRLYLKE+F+TL+MEEG KISDHLS LNSII ELE IEVKI+DEDKA +LILSLP SYEHMKPILMYGK+T
Subjt:  ---GNVHGISTAKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKET

Query:  LSFADVTSKLLSEERRLKSEGRTSQEDSALVASNWKKKKESMQKKGCS-ECRQSGHMKKDCPNR
        L+FA+VTSKLLSEERRLKSEGRTS EDSALV SNWKKKK+S+QKK C   C QSGHMKKDCPNR
Subjt:  LSFADVTSKLLSEERRLKSEGRTSQEDSALVASNWKKKKESMQKKGCS-ECRQSGHMKKDCPNR

SwissProt top hits

e value

%identity

Alignment

P04146 Copia protein

7.0e-11

24.05

Show/hide

Query:  MSPVKMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKG-RPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEE-MDLRAGNVHGISTAKELWEK
        M   K +++ FDG   + +W+ +++ +L +  + K + G  P++            V+ S   +    KS++ +   +  ++    ++    TA+++ E 
Subjt:  MSPVKMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKG-RPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEE-MDLRAGNVHGISTAKELWEK

Query:  LEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEH-MKPILMYGKETLSFADVTSKLLSEERRL
        L+A+Y+ +S +++L L+++  +L++     +  H  + + +ISEL     KIE+ DK   L+++LP+ Y+  +  I    +E L+ A V ++LL +E ++
Subjt:  LEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEH-MKPILMYGKETLSFADVTSKLLSEERRL

Query:  KSEGRTSQED--SALVASN-------------WKKKK----ESMQKKGCSECRQSGHMKKDC
        K++   + +   +A+V +N              K KK     S  K  C  C + GH+KKDC
Subjt:  KSEGRTSQED--SALVASN-------------WKKKK----ESMQKKGCSECRQSGHMKKDC

P10978 Retrovirus-related Pol polyprotein from transposon TNT 1-94

5.3e-35

34.74

Show/hide

Query:  MSPVKMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVH
        MS VK +V KF+G   F  WQ +++D+LIQ GLHK L                  V+S        K  +M  EDW ++D RA              N+ 
Subjt:  MSPVKMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMSDEDWEEMDLRA-------------GNVH

Query:  GISTAKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVT
           TA+ +W +LE++Y +++ +N+LYLK++ Y L M EGT    HL+V N +I++L  + VKIE+EDKA  L+ SLP+SY+++   +++GK T+   DVT
Subjt:  GISTAKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLSFADVT

Query:  SKLLSEER----------------RLKSEGRTSQEDSALVASNWKKKKESMQKKGCSECRQSGHMKKDCPN-RAGSSKGSGSDAD
        S LL  E+                R +S  R+S       A    K +   + + C  C Q GH K+DCPN R G  + SG   D
Subjt:  SKLLSEER----------------RLKSEGRTSQEDSALVASNWKKKKESMQKKGCSECRQSGHMKKDCPN-RAGSSKGSGSDAD

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGCCCATCATGCGGGCTTGGACTAACCAAGTCTACCTCACCCCATCTAGCTCGGGCCAATGCACTTCATCTAAGTCGAGCTCACCCAGCAGAGGCCGTGGCCGAGCG
CCTCTTGCCAAGGCCGAGCACAAACTCTAAAGGGAGTGTCTACTTCTATCCTACTTTGCAGGATGACGACAAAGCTACACGTAACCCAGCCAAGGAAATTTTGGACCACC
CCGATGTACGAGGAGCTGACGAGGACAATCGGGGAGAAATCGGGCTGGGATACAGGCCAAGGAGGCGGAGCCGGCAAGCGGGACGGGCCAAGGCCGAAGGGGTCGGGTTT
TTGACCCGACCCATGCTCAGCCTCGGCCATGGGCCGAGGCCGACCCTCAGCCCGCTCGCGCGGGCCGAGCCCGTTCGGTCTCGTCTGGTCCCCACCGCCTCTGGCTACCC
CGGTTTCGCCTGGTTTGACCTAAAACGCCTCAGAATACCTAAATACCCTAGGAGGATGAGCAGGTATTTATATCCCTCTTCGTCACTGAAGAGGGGATCCCGAATTCTAT
CCCTAAACTCTACTCTCTATTCTCTGCTTTCTCCTCTTGCTCTTACTTTTCCGCTCCCTACCGTTCTGTTTGCTGACTTAAGCATCGGAGCCGGTGTGGCGAGCACCACA
CCGGTGTGCAGGTTACTGTCTTGCAGGCCACGTCTTCCCCCTCATCTACAAATTTACCGTTGGTGGCACGTGAAGGTCAGATTAGCTAGGAGTGAAGCAGAAATGTCAAG
CTTCATGAGTCCAGTGAAGATGGATGTGGAGAAATTTGATGGAAGGATGAACTTCGGCTTGTGGCAAGTGCAAGTCAAGGATGTGTTGATACAATCTGGGTTACACAAGG
CTTTGAAGGGAAGACCAAGCGATGGTGCTTCTGAAAGATTAAGCGGTGAAGGTGGTCCAGTGGAGTCCAGTGGCGGTTCCAGCAGAGGTTTGAAGAAGTCCAGCATGAGT
GATGAAGATTGGGAGGAAATGGATTTGAGAGCTGGAAATGTGCATGGAATTTCGACAGCCAAAGAGCTTTGGGAAAAGCTTGAAGCAATGTATCAGGCAAGGAGCACCTC
GAATCGGTTGTACCTGAAGGAGAAGTTTTACACGTTGCGAATGGAGGAAGGTACGAAAATTTCAGATCATCTGAGTGTTCTCAATAGCATCATTTCGGAGCTGGAGGTGA
TCGAAGTTAAGATAGAGGATGAGGATAAGGCATTCAAGCTTATCTTGTCACTTCCAACTTCTTATGAACACATGAAGCCAATCTTGATGTACGGGAAGGAAACTTTAAGT
TTTGCTGATGTTACTAGTAAACTCTTATCAGAAGAAAGAAGGCTGAAGAGTGAAGGGCGTACTTCCCAGGAGGATTCAGCGCTAGTAGCTAGCAATTGGAAGAAGAAGAA
AGAGTCCATGCAGAAGAAAGGTTGCTCGGAATGCAGACAGTCTGGACACATGAAAAAAGATTGTCCTAACAGAGCAGGTTCGTCAAAGGGCTCTGGGTCGGATGCTGACA
TTGTCTCTCTCGTCAGAAGAGTCAGTGAATTGCTCTGGAGAAAGACAGAATTCATCCTCATGGTATGTCCGCTTTATCATGATAGAGGATGTGATGTTAGCGGTTCCACA
AGTTTGCACACGGGCATTGGCTTGACAGTTATGCAAGGTGTGTGGTGGAAGTTATGTCCATGGCTGACGAACTTCCAGGAGGGAAAGACCGAAGGAGTTGGGCTGGCCCA
ACTCCTTGGCCTCGGCCATGGTCTCGGCCGAATCCCGACCCACCCCGGTGGGTCGAGTCCCTTCCCCTCCGTTTGGCTTCATGTGTCCCGGATCAGCCCGGTTCGAGCAG
TTTCAGTCCTGAATCGTTTCCACGCGCCTAGAAACCTTAAGAACTTCCTTCAGCTTTCTGATTTAAGCATCGGAGGCAGTGTGGTAAGCACCACACCGATGTGTAGGTTT
ACCTTGCCTTGCAGGCCACATCTTTCCCCTCTCATAAAAATTTACCGTTGGTGTCACGTGAGAGTCAGGCTGGCATCAACAGAAAAGACTTTTGCCGACGCTACTTCATT
GGCAATGGCGAAGAAAAGCTGGAGGGACTTTTGCAAGTCAGCATCAACACAACTAGTAGATGGAACTTCTGTTGACACAGTCAAGATCACGTCGACAGAAGTCACTTTTG
CCAATACCAAATGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSPSCGLGLTKSTSPHLARANALHLSRAHPAEAVAERLLPRPSTNSKGSVYFYPTLQDDDKATRNPAKEILDHPDVRGADEDNRGEIGLGYRPRRRSRQAGRAKAEGVGF
LTRPMLSLGHGPRPTLSPLARAEPVRSRLVPTASGYPGFAWFDLKRLRIPKYPRRMSRYLYPSSSLKRGSRILSLNSTLYSLLSPLALTFPLPTVLFADLSIGAGVASTT
PVCRLLSCRPRLPPHLQIYRWWHVKVRLARSEAEMSSFMSPVKMDVEKFDGRMNFGLWQVQVKDVLIQSGLHKALKGRPSDGASERLSGEGGPVESSGGSSRGLKKSSMS
DEDWEEMDLRAGNVHGISTAKELWEKLEAMYQARSTSNRLYLKEKFYTLRMEEGTKISDHLSVLNSIISELEVIEVKIEDEDKAFKLILSLPTSYEHMKPILMYGKETLS
FADVTSKLLSEERRLKSEGRTSQEDSALVASNWKKKKESMQKKGCSECRQSGHMKKDCPNRAGSSKGSGSDADIVSLVRRVSELLWRKTEFILMVCPLYHDRGCDVSGST
SLHTGIGLTVMQGVWWKLCPWLTNFQEGKTEGVGLAQLLGLGHGLGRIPTHPGGSSPFPSVWLHVSRISPVRAVSVLNRFHAPRNLKNFLQLSDLSIGGSVVSTTPMCRF
TLPCRPHLSPLIKIYRWCHVRVRLASTEKTFADATSLAMAKKSWRDFCKSASTQLVDGTSVDTVKITSTEVTFANTK

Lag0039705 (gene) of Sponge gourd (AG-4) v1 genome