CuGenDBv2

Gene ID	Lag0006241
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	CCHC-type domain-containing protein
Genome location	chr6:39871889..39872521
RNA-Seq Expression	Lag0006241
Synteny	Lag0006241
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0044267 - cellular protein metabolic process (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0008233 - peptidase activity (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR001878 - Zinc finger, CCHC-type IPR036875 - Zinc finger, CCHC-type superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA8521602.1 hypothetical protein F0562_012275 [Nyssa sinensis]

5.0e-52

60.67

Show/hide

Query:  SKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINL-----------HANVS
        SK+E Q  GN K C+RCGKLGH+KR+CR KVVC+RCGKS HI+ N RVNL    ANV  E+ + EQL WEQCLSIE  DQ + L           +AN S
Subjt:  SKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINL-----------HANVS

Query:  IEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH
        I+Y +DWI+DSGCSHHATGN  LLS+V  H GKR I TA+NSLHPVV+EG  NVK D  NV GV L++VY VP LKK+
Subjt:  IEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH

KAA8540328.1 hypothetical protein F0562_024753 [Nyssa sinensis]

1.4e-59

65.17

Show/hide

Query:  SKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINL-----------HANVS
        SK EGQS+GN + C+RCGKLGH+KRDCR KVVC+RCGKSGHI+ NCRVNL    ANV  E+++ EQL WEQCLSIE  DQP+ L           +AN S
Subjt:  SKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINL-----------HANVS

Query:  IEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH
        I+Y +DWI+DSGCSHHATGN  LLS+V  H GKR I TADNSLHPVV+EG  NVK D  N  GV L+DVYHVPGLKK+
Subjt:  IEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH

KAA8541518.1 hypothetical protein F0562_022670 [Nyssa sinensis]

5.0e-60

65.73

Show/hide

Query:  SKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINL-----------HANVS
        SK EGQS+GN + C+RCGKLGH+KRDCR KVVC+RCGKSGHI+ NCRVNL    ANV  E+++ EQL WEQCLSIE  DQP+ L           +AN S
Subjt:  SKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINL-----------HANVS

Query:  IEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH
        I+Y +DWI+DSGCSHHATGN  LLS+V  H GKR I TADNSLHPVV+EG  NVK D  NV GV L+DVYHVPGLKK+
Subjt:  IEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH

KAA8549858.1 hypothetical protein F0562_001542 [Nyssa sinensis]

7.0e-54

57.36

Show/hide

Query:  KKKSVATLSTTFPKQGLICSKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQP
        K  S +  S+   KQ    SK +GQS+GN K  +RCGKLGH+KRDC  KVVC+RC KS HI+ NCRVNL    ANV  +++K EQL WEQCLSIE  DQP
Subjt:  KKKSVATLSTTFPKQGLICSKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQP

Query:  -----------INLHANVSIEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH
                   +  +AN SI+Y +DWI+D GCSHHA GN +LLS+V  H GKR I TADNSLHP+V+EG  NVK D  NV+GV L+DVYHVP LKK+
Subjt:  -----------INLHANVSIEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH

RWR74934.1 Integrase, catalytic core [Cinnamomum micranthum f. kanehirae]

1.5e-48

60.23

Show/hide

Query:  SKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINLHA----NVSIEYDEDW
        S  EG+ +GN KGCFRCG+LGHIKRDC A+VVC+RCGKSGHI+ NCRV L EA ANV QE ++ EQ TWE  LSI      I   A    N SI+Y++ W
Subjt:  SKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINLHA----NVSIEYDEDW

Query:  IIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH
        I+DSGCSHHATGN  LLSDV  H GK+ I TADNSL+PV +EG  + + D  N  GV L +VYHV GLKK+
Subjt:  IIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH

TrEMBL top hits

e value

%identity

Alignment

A0A443N8T5 Integrase, catalytic core

7.3e-49

60.23

Show/hide

Query:  SKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINLHA----NVSIEYDEDW
        S  EG+ +GN KGCFRCG+LGHIKRDC A+VVC+RCGKSGHI+ NCRV L EA ANV QE ++ EQ TWE  LSI      I   A    N SI+Y++ W
Subjt:  SKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINLHA----NVSIEYDEDW

Query:  IIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH
        I+DSGCSHHATGN  LLSDV  H GK+ I TADNSL+PV +EG  + + D  N  GV L +VYHV GLKK+
Subjt:  IIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH

A0A5J4ZW51 CCHC-type domain-containing protein

2.4e-52

60.67

Show/hide

Query:  SKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINL-----------HANVS
        SK+E Q  GN K C+RCGKLGH+KR+CR KVVC+RCGKS HI+ N RVNL    ANV  E+ + EQL WEQCLSIE  DQ + L           +AN S
Subjt:  SKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINL-----------HANVS

Query:  IEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH
        I+Y +DWI+DSGCSHHATGN  LLS+V  H GKR I TA+NSLHPVV+EG  NVK D  NV GV L++VY VP LKK+
Subjt:  IEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH

A0A5J5BCB3 Uncharacterized protein

7.0e-60

65.17

Show/hide

Query:  SKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINL-----------HANVS
        SK EGQS+GN + C+RCGKLGH+KRDCR KVVC+RCGKSGHI+ NCRVNL    ANV  E+++ EQL WEQCLSIE  DQP+ L           +AN S
Subjt:  SKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINL-----------HANVS

Query:  IEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH
        I+Y +DWI+DSGCSHHATGN  LLS+V  H GKR I TADNSLHPVV+EG  NVK D  N  GV L+DVYHVPGLKK+
Subjt:  IEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH

A0A5J5BFR6 Uncharacterized protein

2.4e-60

65.73

Show/hide

Query:  SKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINL-----------HANVS
        SK EGQS+GN + C+RCGKLGH+KRDCR KVVC+RCGKSGHI+ NCRVNL    ANV  E+++ EQL WEQCLSIE  DQP+ L           +AN S
Subjt:  SKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINL-----------HANVS

Query:  IEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH
        I+Y +DWI+DSGCSHHATGN  LLS+V  H GKR I TADNSLHPVV+EG  NVK D  NV GV L+DVYHVPGLKK+
Subjt:  IEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH

A0A5J5C3K7 Uncharacterized protein

3.4e-54

57.36

Show/hide

Query:  KKKSVATLSTTFPKQGLICSKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQP
        K  S +  S+   KQ    SK +GQS+GN K  +RCGKLGH+KRDC  KVVC+RC KS HI+ NCRVNL    ANV  +++K EQL WEQCLSIE  DQP
Subjt:  KKKSVATLSTTFPKQGLICSKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQP

Query:  -----------INLHANVSIEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH
                   +  +AN SI+Y +DWI+D GCSHHA GN +LLS+V  H GKR I TADNSLHP+V+EG  NVK D  NV+GV L+DVYHVP LKK+
Subjt:  -----------INLHANVSIEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKH

SwissProt top hits

e value

%identity

Alignment

P03352 Gag polyprotein

1.7e-07

42.11

Show/hide

Query:  KQGLICSKVEGQSKGNLKG----CFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCR
        K  L+   +  Q K   KG    C+ CGK GH+ R CR  ++CH CGK GH++ +CR
Subjt:  KQGLICSKVEGQSKGNLKG----CFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCR

P23424 Gag polyprotein

1.7e-07

42.11

Show/hide

Query:  KQGLICSKVEGQSKGNLKG----CFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCR
        K  L+   +  Q K   KG    C+ CGK GH+ R CR  ++CH CGK GH++ +CR
Subjt:  KQGLICSKVEGQSKGNLKG----CFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCR

P23425 Gag polyprotein

1.7e-07

42.11

Show/hide

Query:  KQGLICSKVEGQSKGNLKG----CFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCR
        K  L+   +  Q K   KG    C+ CGK GH+ R CR  ++CH CGK GH++ +CR
Subjt:  KQGLICSKVEGQSKGNLKG----CFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCR

P35955 Gag polyprotein

1.3e-07

42.11

Show/hide

Query:  KQGLICSKVEGQSKGNLKG----CFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCR
        K  L+   +  Q K   KG    C+ CGK GH+ R CR  ++CH CGK GH++ +CR
Subjt:  KQGLICSKVEGQSKGNLKG----CFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCR

P35956 Gag-Pol polyprotein

1.3e-07

42.11

Show/hide

Query:  KQGLICSKVEGQSKGNLKG----CFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCR
        K  L+   +  Q K   KG    C+ CGK GH+ R CR  ++CH CGK GH++ +CR
Subjt:  KQGLICSKVEGQSKGNLKG----CFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCR

Arabidopsis top hits

e value

%identity

Alignment

AT1G75560.1 zinc knuckle (CCHC-type) family protein

9.2e-04

48.65

Show/hide

Query:  NLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNC
        N K C  C   GHI RDCR   VC+ C  SGH+  +C
Subjt:  NLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNC

AT1G75560.2 zinc knuckle (CCHC-type) family protein

9.2e-04

48.65

Show/hide

Query:  NLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNC
        N K C  C   GHI RDCR   VC+ C  SGH+  +C
Subjt:  NLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNC

AT4G36020.1 cold shock domain protein 1

3.2e-04

38.18

Show/hide

Query:  GQSKGNLKGCFRCGKLGHIKRDCRAKV-------------VCHRCGKSGHIRPNC
        G  KG   GC+ CG +GH  RDC  KV              C+ CG  GHI  +C
Subjt:  GQSKGNLKGCFRCGKLGHIKRDCRAKV-------------VCHRCGKSGHIRPNC

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAGCTTCCAATCTTTAAAAAAAAAAAAAGCGTCGCAACGCTATCGACAACTTTTCCAAAGCAAGGCCTAATTTGTTCCAAGGTTGAAGGGCAGTCCAAAGGCAATTT
AAAAGGATGTTTTAGGTGCGGCAAGCTAGGACACATCAAACGTGATTGTCGAGCGAAGGTGGTGTGTCATCGTTGTGGGAAGTCGGGTCATATTAGGCCAAATTGTCGGG
TGAATCTCAAAGAAGCAGAAGCAAATGTTGTACAAGAAAGTAACAAACCTGAACAACTTACTTGGGAACAATGCTTGTCAATTGAAACTTTTGATCAACCCATTAATTTG
CATGCTAATGTTTCTATAGAATATGATGAGGATTGGATTATTGATTCTGGTTGTTCTCATCATGCTACTGGAAATGTTTTTCTTCTCTCTGATGTCCATACCCATCAGGG
AAAAAGAGTTATTGCAACGGCCGATAATTCCTTACATCCTGTTGTTGAAGAAGGGTGTGTTAATGTTAAGGATGATGCACCAAATGTTGCTGGTGTTTTTCTTGAAGATG
TTTATCATGTTCCAGGCCTAAAGAAGCACTACAACAAATTTGGGCTTAGATGTCAGTTCTGCACCGTTATTAAACCCCTATGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MELPIFKKKKSVATLSTTFPKQGLICSKVEGQSKGNLKGCFRCGKLGHIKRDCRAKVVCHRCGKSGHIRPNCRVNLKEAEANVVQESNKPEQLTWEQCLSIETFDQPINL
HANVSIEYDEDWIIDSGCSHHATGNVFLLSDVHTHQGKRVIATADNSLHPVVEEGCVNVKDDAPNVAGVFLEDVYHVPGLKKHYNKFGLRCQFCTVIKPL

Lag0006241 (gene) of Sponge gourd (AG-4) v1 genome