CuGenDBv2

Gene ID	Spg006714
Organism	Luffa cylindrica (Sponge gourd (cylindrica) v1)
Description	RT_RNaseH_2 domain-containing protein
Genome location	scaffold1:55861043..55869098
RNA-Seq Expression	Spg006714
Synteny	Spg006714
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAE8695166.1 hypothetical protein F3Y22_tig00110733pilonHSYRG00282 [Hibiscus syriacus]

4.0e-13

26.3

Show/hide

Query:  IKSLKAPSPKNPFLEVFKDVNFQERMEIMRKKDFLNEKGF---SNRAGTLPKFVTKVITQYKWQELYAHPQEVVVPLVREFYTGLREKSMSMTVVRGKMA
        ++S  AP P  P    F D   +E  + ++ +    E GF         L   V  V+T++KWQ+   HP  V   +V+EFY+ + E +    +VRG   
Subjt:  IKSLKAPSPKNPFLEVFKDVNFQERMEIMRKKDFLNEKGF---SNRAGTLPKFVTKVITQYKWQELYAHPQEVVVPLVREFYTGLREKSMSMTVVRGKMA

Query:  SFSFVDINRVYRIKAP-------LHPRGNDAIKNPLVQTDERSTK-NGGQL-----------------------GLMPTTHDSTISVERVMHFYSIMKGL
         F+   INR ++++              ++  +  L       T+ NG QL                        LMPT+H++T+S +R++  +SI+ G 
Subjt:  SFSFVDINRVYRIKAP-------LHPRGNDAIKNPLVQTDERSTK-NGGQL-----------------------GLMPTTHDSTISVERVMHFYSIMKGL

Query:  EINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQRVTIVPSKDEERHFFRSTIDLPLIGKL--QQNNAQRKDKASTSQVTPSPGLNLAS
         I+IG II +   LC +++A  L F +LIT LC++  +     +E     + ++   I  L   +    +K +A+TS+V  SP +  +S
Subjt:  EINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQRVTIVPSKDEERHFFRSTIDLPLIGKL--QQNNAQRKDKASTSQVTPSPGLNLAS

KAF4375842.1 hypothetical protein G4B88_026421 [Cannabis sativa]

2.2e-16

31.22

Show/hide

Query:  KNPFLEVFKDVNFQERMEIMRKKDFLNEKGF---SNRAGTLPKFVTKVITQYKWQELYAHPQEVVVPLVREFYTG-LREKSMSMTVVRGKMASFSFVDIN
        KN F E+ K    ++ +  +R K+F  ++G        G++P ++ + I +  W +L   P   V  +V+EFY   L  +  +   VR     FS  DIN
Subjt:  KNPFLEVFKDVNFQERMEIMRKKDFLNEKGF---SNRAGTLPKFVTKVITQYKWQELYAHPQEVVVPLVREFYTG-LREKSMSMTVVRGKMASFSFVDIN

Query:  RVYRIK---------------APLHPRGNDAIKNPLVQTDERSTKNGGQLGLMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLF
          Y +K                 +  RG    K   ++ D +   N  Q  L+PT+HDST+S ER+   Y I+KG +IN+G +I KEI  C  +  GKLF
Subjt:  RVYRIK---------------APLHPRGNDAIKNPLVQTDERSTKNGGQLGLMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLF

Query:  FGSLITQLCQRVTIVPSKDEE
        F  LIT+ C+   +    DE+
Subjt:  FGSLITQLCQRVTIVPSKDEE

PON35554.1 hypothetical protein PanWU01x14_335450, partial [Parasponia andersonii]

2.2e-19

Show/hide

Query:  EKGF----SNRAGTLPKFVTKVITQYKWQELYAHPQEVVVPLVREFYTGLREKSMSMTVVRGKMASFSFVDINRVYRIKAPLHPRG---NDAIKNPLVQT
        EKGF    S   G LP F+ +VITQ+ W++  AHP++ +VPLVREFY  L +   +   VRG   S+S   IN V+ +  P+        +  ++ L+  
Subjt:  EKGF----SNRAGTLPKFVTKVITQYKWQELYAHPQEVVVPLVREFYTGLREKSMSMTVVRGKMASFSFVDINRVYRIKAPLHPRG---NDAIKNPLVQT

Query:  DERSTKNGGQLG----------------------------LMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQR
         E     G +                              L+PTTH  T+S +R++  +S++ G  IN+G +I  EI  C  +K G LFF SLIT+LC+ 
Subjt:  DERSTKNGGQLG----------------------------LMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQR

Query:  VTIVPSKDEERHFFRSTIDLPLIGKLQQNNAQRKDKASTS
               +EE+      ID   + ++ Q       +  +S
Subjt:  VTIVPSKDEERHFFRSTIDLPLIGKLQQNNAQRKDKASTS

PON46472.1 hypothetical protein PanWU01x14_251180, partial [Parasponia andersonii]

1.3e-19

Show/hide

Query:  EKGF----SNRAGTLPKFVTKVITQYKWQELYAHPQEVVVPLVREFYTGLREKSMSMTVVRGKMASFSFVDINRVYRIKAPLHPRG---NDAIKNPLVQT
        EKGF    S   G LP F+ +VITQ+ W++  AHP++ +VPLVREFY  L +   +   VRG   S+S   IN V+ +  P+        +  +  L+  
Subjt:  EKGF----SNRAGTLPKFVTKVITQYKWQELYAHPQEVVVPLVREFYTGLREKSMSMTVVRGKMASFSFVDINRVYRIKAPLHPRG---NDAIKNPLVQT

Query:  DERSTKNGGQLG----------------------------LMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQR
         E     G +                              L+PTTH  T+S +R++  +S++ G  IN+G +I  EI  C  +K G LFF SLIT+LC+ 
Subjt:  DERSTKNGGQLG----------------------------LMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQR

Query:  VTIVPSKDEERHFFRSTIDLPLIGKLQQNNAQRKDKASTS
               +EE+      ID   + ++ Q       +  +S
Subjt:  VTIVPSKDEERHFFRSTIDLPLIGKLQQNNAQRKDKASTS

PON70375.1 hypothetical protein PanWU01x14_080440 [Parasponia andersonii]

3.5e-17

31.63

Show/hide

Query:  PKFVTKVITQYKWQELYAHPQEVVVPLVREFYTGLREKSMSMTVVRGKMASFSFVDINRVYRIKAPLHPRG---NDAIKNPLVQTDERSTKNGGQLG---
        P F+  VI Q+ WQ   AHP++ +VPLVREFYT +         +RG     S   IN ++ +  P+        D  K  LV   E     G +     
Subjt:  PKFVTKVITQYKWQELYAHPQEVVVPLVREFYTGLREKSMSMTVVRGKMASFSFVDINRVYRIKAPLHPRG---NDAIKNPLVQTDERSTKNGGQLG---

Query:  -------------------------LMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQRVTIVPSKDEER
                                 L+PTTH  T+S E V   YS++ G  IN+G +I +EI  C  +K+G LFF SLIT +C+        +EE+
Subjt:  -------------------------LMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQRVTIVPSKDEER

TrEMBL top hits

e value

%identity

Alignment

A0A2P5AGA5 Uncharacterized protein (Fragment)

1.0e-19

Show/hide

Query:  EKGF----SNRAGTLPKFVTKVITQYKWQELYAHPQEVVVPLVREFYTGLREKSMSMTVVRGKMASFSFVDINRVYRIKAPLHPRG---NDAIKNPLVQT
        EKGF    S   G LP F+ +VITQ+ W++  AHP++ +VPLVREFY  L +   +   VRG   S+S   IN V+ +  P+        +  ++ L+  
Subjt:  EKGF----SNRAGTLPKFVTKVITQYKWQELYAHPQEVVVPLVREFYTGLREKSMSMTVVRGKMASFSFVDINRVYRIKAPLHPRG---NDAIKNPLVQT

Query:  DERSTKNGGQLG----------------------------LMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQR
         E     G +                              L+PTTH  T+S +R++  +S++ G  IN+G +I  EI  C  +K G LFF SLIT+LC+ 
Subjt:  DERSTKNGGQLG----------------------------LMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQR

Query:  VTIVPSKDEERHFFRSTIDLPLIGKLQQNNAQRKDKASTS
               +EE+      ID   + ++ Q       +  +S
Subjt:  VTIVPSKDEERHFFRSTIDLPLIGKLQQNNAQRKDKASTS

A0A2P5BCG4 Uncharacterized protein (Fragment)

6.2e-20

Show/hide

Query:  EKGF----SNRAGTLPKFVTKVITQYKWQELYAHPQEVVVPLVREFYTGLREKSMSMTVVRGKMASFSFVDINRVYRIKAPLHPRG---NDAIKNPLVQT
        EKGF    S   G LP F+ +VITQ+ W++  AHP++ +VPLVREFY  L +   +   VRG   S+S   IN V+ +  P+        +  +  L+  
Subjt:  EKGF----SNRAGTLPKFVTKVITQYKWQELYAHPQEVVVPLVREFYTGLREKSMSMTVVRGKMASFSFVDINRVYRIKAPLHPRG---NDAIKNPLVQT

Query:  DERSTKNGGQLG----------------------------LMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQR
         E     G +                              L+PTTH  T+S +R++  +S++ G  IN+G +I  EI  C  +K G LFF SLIT+LC+ 
Subjt:  DERSTKNGGQLG----------------------------LMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQR

Query:  VTIVPSKDEERHFFRSTIDLPLIGKLQQNNAQRKDKASTS
               +EE+      ID   + ++ Q       +  +S
Subjt:  VTIVPSKDEERHFFRSTIDLPLIGKLQQNNAQRKDKASTS

A0A2P5DAQ2 Uncharacterized protein

1.7e-17

31.63

Show/hide

Query:  PKFVTKVITQYKWQELYAHPQEVVVPLVREFYTGLREKSMSMTVVRGKMASFSFVDINRVYRIKAPLHPRG---NDAIKNPLVQTDERSTKNGGQLG---
        P F+  VI Q+ WQ   AHP++ +VPLVREFYT +         +RG     S   IN ++ +  P+        D  K  LV   E     G +     
Subjt:  PKFVTKVITQYKWQELYAHPQEVVVPLVREFYTGLREKSMSMTVVRGKMASFSFVDINRVYRIKAPLHPRG---NDAIKNPLVQTDERSTKNGGQLG---

Query:  -------------------------LMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQRVTIVPSKDEER
                                 L+PTTH  T+S E V   YS++ G  IN+G +I +EI  C  +K+G LFF SLIT +C+        +EE+
Subjt:  -------------------------LMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQRVTIVPSKDEER

A0A7J6FZ22 Uncharacterized protein

1.1e-16

31.22

Show/hide

Query:  KNPFLEVFKDVNFQERMEIMRKKDFLNEKGF---SNRAGTLPKFVTKVITQYKWQELYAHPQEVVVPLVREFYTG-LREKSMSMTVVRGKMASFSFVDIN
        KN F E+ K    ++ +  +R K+F  ++G        G++P ++ + I +  W +L   P   V  +V+EFY   L  +  +   VR     FS  DIN
Subjt:  KNPFLEVFKDVNFQERMEIMRKKDFLNEKGF---SNRAGTLPKFVTKVITQYKWQELYAHPQEVVVPLVREFYTG-LREKSMSMTVVRGKMASFSFVDIN

Query:  RVYRIK---------------APLHPRGNDAIKNPLVQTDERSTKNGGQLGLMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLF
          Y +K                 +  RG    K   ++ D +   N  Q  L+PT+HDST+S ER+   Y I+KG +IN+G +I KEI  C  +  GKLF
Subjt:  RVYRIK---------------APLHPRGNDAIKNPLVQTDERSTKNGGQLGLMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLF

Query:  FGSLITQLCQRVTIVPSKDEE
        F  LIT+ C+   +    DE+
Subjt:  FGSLITQLCQRVTIVPSKDEE

A0A803Q715 Uncharacterized protein

1.6e-15

32.79

Show/hide

Query:  GTLPKFVTKVITQYKWQELYAHPQEVVVPLVREFYTG-LREKSMSMTVVRGKMASFSFVDINRVYRIK---------------APLHPRGNDAIKNPLVQ
        G++P ++ + I +  W +L   P   V  +V+EFY   L  +  +   VR     FS  DIN  Y +K                 +  RG    K   ++
Subjt:  GTLPKFVTKVITQYKWQELYAHPQEVVVPLVREFYTG-LREKSMSMTVVRGKMASFSFVDINRVYRIK---------------APLHPRGNDAIKNPLVQ

Query:  TDERSTKNGGQLGLMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQRVTIVPSKDEE
         D +   N  Q  L+PT+HDST+S ER+   Y I+KG +IN+G +I KEI  C  +  GKLFF  LIT+ C+   +    DE+
Subjt:  TDERSTKNGGQLGLMPTTHDSTISVERVMHFYSIMKGLEINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQRVTIVPSKDEE

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCACGGTACGAGAGGAGCGAGACCTACAGGTTTCTCGCCAGCGATTGTGGCCCAAGGAACCAACGTTCAAACTCCTTCTTCCTCAACAATGTTGGCCACTTCAAGGAA
GAATCAGAGTAGTTCTCGTCCAAGAATGTCCACACGCACTGATTCCATCCACAAAACCCAAAAACCCGCGGGCCAACAGTTGGAGAAACGCTCGAGGGAATGGTATTCAA
TGATTAGAGGGACGAGAGCCCAAAGGCGTGCGACTCTTGAAGAAGAAGCCAGACTCCGTGATGCTAAAGAAATAGCCAAAGTTGGAGAGAGCTCTCGGCAAGGAGAGACT
CTAATGGGTAACGTCTCCCAACCTTCTTCTAATCCATCTTCTTCTTGTAGGGACAAGACTTTCATGACCTACAAGGCAAAGAAGAAGAATGTGTTCGAGGACATGATCCG
CCAAGTCGTGGCACAAGCCATTGTTATTTCTGAAGGTTACAGGGTTGAGCAAGATGCACTCAGGGAAATTCAGTCTGAAAGGGAGATGGAAAACCAGAGTATGAGGGAAG
AGGACGATTTTGCAAGAAAAAGGGACTTGGAAGAAGAAAGGGAAGCTGAGAGAAGGCAAGAAGAAAAAGACAAGAGGTCGAGAGGGCCAGCCTTTGAGCCATTGCATAAG
GCTCAAAGTGAGGCTGATCTATTGCAAGAAAGAGAAGAAGATGCCCTTGAGGGGCCAAGAGAAGAAAATCCAGAAAAAAGAAGAAGAAAAAATGAAGAAAATGAAGGTCA
GGATGCGACCGCATATGGGCCGCATTCTAAAGAAGGACAAAAGGCCACTGAAGAACAGCCAGCTGATGAGGTTTTCAATCCTCTGTTTAAATATGATCCACCAGCTGCTG
AGAGCATCTATTCAGGAGAGAAGAAGGATGAAGAGGAAATTGAAAGTGAAGAGGCCAAGACCTCCAGTGATTCAGAAACCGATTTAGATTCTAAGATCAAGGAATTGAAT
GACAACCAAATTCCTATCTTTGCAGCATTGAGAAATAAGAGAAGAAGAGAGATTAGGGCTGAGAGGAAAACAAAGAATAAAAATGATCCTATTTTTTTCAAGAGGTTGAG
GACAAGGTCCATGGACGCTTCCCCGATACCTCCTCCAACCATCTCACCTACCAAGCCAAAAATCAAATCACTTAAGGCTCCATCTCCCAAAAATCCATTCCTAGAAGTCT
TCAAAGATGTCAATTTTCAGGAACGGATGGAGATCATGAGAAAAAAAGACTTCCTGAACGAGAAAGGATTCTCAAACAGAGCTGGAACACTGCCAAAGTTCGTTACCAAA
GTTATTACACAATACAAATGGCAGGAACTCTATGCTCATCCCCAGGAGGTCGTGGTGCCTCTAGTTCGAGAATTCTACACTGGTTTGAGGGAGAAGAGCATGAGCATGAC
AGTGGTGAGAGGTAAGATGGCCAGTTTCTCTTTTGTTGACATCAACAGGGTGTACAGAATCAAGGCACCCTTGCATCCAAGAGGGAACGATGCCATCAAGAACCCCCTCG
TCCAAACAGATGAAAGAAGCACTAAAAATGGTGGCCAACTAGGGTTGATGCCAACAACCCATGATAGCACTATTTCAGTAGAGAGAGTTATGCATTTCTACAGTATCATG
AAGGGGTTGGAGATAAACATCGGGAGCATAATAAGGAAGGAGATCCTTTTGTGTGGAAGGAAGAAAGCAGGGAAGCTATTCTTTGGGTCACTTATCACCCAATTATGTCA
GAGGGTAACAATAGTCCCTAGTAAGGATGAGGAGCGCCACTTCTTCAGGTCTACCATTGATCTACCTCTAATTGGGAAGCTCCAACAGAACAATGCCCAAAGGAAGGACA
AAGCTTCCACATCTCAAGTCACTCCATCACCGGGGCTGAATCTGGCTTCTCCACCTCAACTAGGGGTGAGCGTAAATTTTCGAAAAACCGATCCGACCGATCGAAACCGG
CCAAACCGACGTCGGTCAGTCAGTTTCAGTCAAGATTCGATCGGTTTCGGTTTGCCATTATGCCAAACCGAAATGTCAGTCGACAGTAGACTCCCCTCACTTCAAGTTCA
CGAATCACGTCAGTCGCCGCCCCTCGCCGACCCTCGCCGTCGATTTCTTTTTCTTCTTCTTCGTCTGCAACTCACAGTCACAGTCACCGCGCCGCCGTCCGTTCTTGTTC
TTGAGATTAAGATCACCATTCGACATTCGTCACTTGAGATTATTGTCCATTTCTCTCATCACATTGTCGATTTGTCACGCTGGAAAATTCTTACGAGTGATACTAGAGTT
GCATCTGTTTGTTTTAGTAGTGGGAGTGGTGGTGGTAGTAGTAGTGCTAGTGCTAGTACTAGTGCTAATGTTGATTTGAGATTTGATGATGAAACAATGGACCTAGATGA
GGATGAAAACTACAACTATGATATAATACCTCAGTTCAAAAGGCCCACGCCATCATCTGAGGCCCTAGCATTTGCCTACCGACAGTTGGACCAAATCAGGGATAACCTGA
GGAGTTATTGGGCTTATGCCAAGGAGAGAGATGAAGCTAGGAGAGAGTTTTACCTCTCTGTCGCCCCGAGTATTGCTCCTGTCTTTCCTGATTTCCCTCAATCGTTCTTG
CCTCAAGAAGAAAAGGAAACTGAAGATGAAGATGAAGATGAAGAGAAAGAGATGCCCTCGGATGAGGATTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MHGTRGARPTGFSPAIVAQGTNVQTPSSSTMLATSRKNQSSSRPRMSTRTDSIHKTQKPAGQQLEKRSREWYSMIRGTRAQRRATLEEEARLRDAKEIAKVGESSRQGET
LMGNVSQPSSNPSSSCRDKTFMTYKAKKKNVFEDMIRQVVAQAIVISEGYRVEQDALREIQSEREMENQSMREEDDFARKRDLEEEREAERRQEEKDKRSRGPAFEPLHK
AQSEADLLQEREEDALEGPREENPEKRRRKNEENEGQDATAYGPHSKEGQKATEEQPADEVFNPLFKYDPPAAESIYSGEKKDEEEIESEEAKTSSDSETDLDSKIKELN
DNQIPIFAALRNKRRREIRAERKTKNKNDPIFFKRLRTRSMDASPIPPPTISPTKPKIKSLKAPSPKNPFLEVFKDVNFQERMEIMRKKDFLNEKGFSNRAGTLPKFVTK
VITQYKWQELYAHPQEVVVPLVREFYTGLREKSMSMTVVRGKMASFSFVDINRVYRIKAPLHPRGNDAIKNPLVQTDERSTKNGGQLGLMPTTHDSTISVERVMHFYSIM
KGLEINIGSIIRKEILLCGRKKAGKLFFGSLITQLCQRVTIVPSKDEERHFFRSTIDLPLIGKLQQNNAQRKDKASTSQVTPSPGLNLASPPQLGVSVNFRKTDPTDRNR
PNRRRSVSFSQDSIGFGLPLCQTEMSVDSRLPSLQVHESRQSPPLADPRRRFLFLLLRLQLTVTVTAPPSVLVLEIKITIRHSSLEIIVHFSHHIVDLSRWKILTSDTRV
ASVCFSSGSGGGSSSASASTSANVDLRFDDETMDLDEDENYNYDIIPQFKRPTPSSEALAFAYRQLDQIRDNLRSYWAYAKERDEARREFYLSVAPSIAPVFPDFPQSFL
PQEEKETEDEDEDEEKEMPSDED

Spg006714 (gene) of Sponge gourd (cylindrica) v1 genome