CuGenDBv2

Gene ID	Sed0023566
Organism	Sechium edule (Chayote v1)
Description	Integrase catalytic domain-containing protein
Genome location	LG13:1889381..1891471
RNA-Seq Expression	Sed0023566
Synteny	Sed0023566
Gene Ontology terms	NA
InterPro domains	IPR005162 - Retrotransposon gag domain IPR029472 - Retrotransposon Copia-like, N-terminal

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

GFY98609.1 haloacid dehalogenase-like hydrolase (HAD) superfamily protein [Actinidia rufa]

5.5e-79

41.77

Show/hide

Query:  LIGESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPK--EEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYAR
        L  +   S Y++HH+D   LVLVS+ LT DNY +W+R+MIIALS++NKLGF++G+I +P+  +   L+ W RNN++VISWILNS+SK IS+SIIF+  A 
Subjt:  LIGESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPK--EEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYAR

Query:  AIWLDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMD
         IW+DLKDRF++ NGPRIF L++ L    Q Q  V+ YF+++K++W+E   YRP+C+CG C+CGG+K +      EY++ FLM L+  F+  R Q+LLMD
Subjt:  AIWLDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMD

Query:  PLPPANKAFSLIVQEEEHKG---DTNIKSNS--TLA-ATQSKTTYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPDNRPVCKHCGLQGHTIDVCYKIHGYP
        PLPP NK FSLI QEE  +      N  SNS  T+A A +++   +  D        G  G+     Y+  G   +R  C HC   GHTI+ CYK HGYP
Subjt:  PLPPANKAFSLIVQEEEHKG---DTNIKSNS--TLA-ATQSKTTYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPDNRPVCKHCGLQGHTIDVCYKIHGYP

Query:  PSNKQR-KNNYKQTNDNQGSVQPENKSCKSATVA----------ASNIESDPFQQCHDILTLLQSKLA-GIKNDNGANLTQHMAGQAHFEDDWEG
        P  K R ++ Y  +N +    Q  N SC  +              +N+ S+ +QQ   ++ +L + +A  +K+      T +  G    EDDW+G
Subjt:  PSNKQR-KNNYKQTNDNQGSVQPENKSCKSATVA----------ASNIESDPFQQCHDILTLLQSKLA-GIKNDNGANLTQHMAGQAHFEDDWEG

KAA8536734.1 hypothetical protein F0562_029212 [Nyssa sinensis]

2.7e-78

44.26

Show/hide

Query:  ESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPK--EEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYARAIW
        E   + YY+HH+++   VLVS+ LT +NY  WSR+M+IALS++NKLGFV+G I  P+  +   L  W RNN+IVISWILNSISK IS+SIIF  +AR IW
Subjt:  ESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPK--EEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYARAIW

Query:  LDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMDPLP
        LDL+DRF+++NGPRIF LK+ L  ++Q Q SV+ YF+++K++W+E + YRP+C+CG C CGG+K++ ++   EY++ FLMGL+D FS    Q+LLMD +P
Subjt:  LDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMDPLP

Query:  PANKAFSLIVQEEEHKGDTNIKSNSTLAATQSKTTYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPDNRPVCKHCGLQGHTIDVCYKIHGYPPSNKQRKNN
        P N+ FSLIVQEE+ +  TN+ S+S+ +        K   +K      G                 +RP C HC + GHT+D CYKIHGYPP  K R NN
Subjt:  PANKAFSLIVQEEEHKGDTNIKSNSTLAATQSKTTYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPDNRPVCKHCGLQGHTIDVCYKIHGYPPSNKQRKNN

Query:  YKQTNDNQGSVQPE-NKSCKSATVAASNIESDPFQQCHDILTLLQSKLAGIKNDNGA
               Q S   + +    S      N+ S+ +QQ   ++++L + L+  K    A
Subjt:  YKQTNDNQGSVQPE-NKSCKSATVAASNIESDPFQQCHDILTLLQSKLAGIKNDNGA

XP_022154919.1 uncharacterized protein LOC111022065 [Momordica charantia]

1.9e-79

43.28

Show/hide

Query:  LIGESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPKEEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYARAI
        ++ E   + Y++HH+D T+LVLVS+LLT++NY +WSRS++IAL+++NK+GFV+G+I RP +   LH W   N++VISWI NS+SK IS+S++F+D A  I
Subjt:  LIGESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPKEEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYARAI

Query:  WLDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMDPL
        WLDLK+RF+R+N PRIF L++ L+ + Q Q SVT YF+R+K+LW E A YRP+C+CG CS GG+KSI+     EY++ FLMGLN  FS  R+Q+LLM+P 
Subjt:  WLDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMDPL

Query:  PPANKAFSLIVQEEEHKGDTNIKSNSTLAATQSKTTYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPDNRPVCKHCGLQGHTIDVCYKIHGYPPSNKQRKN
        P  N+AF+L+ QE + +   ++ S ++  A+  + T    +S+            ++     H    ++ +C HCG+ GHT+D CYK+H YPP    R +
Subjt:  PPANKAFSLIVQEEEHKGDTNIKSNSTLAATQSKTTYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPDNRPVCKHCGLQGHTIDVCYKIHGYPPSNKQRKN

Query:  NYKQTNDNQGSVQPENKSCKSATVAASNIESD----PFQQCHDILTLLQSKLAGIK----NDNGANLTQHMA
         +K T+ N  S +      KS +   S I +        QC  +LTLLQS L   K    ND+G   T H+A
Subjt:  NYKQTNDNQGSVQPENKSCKSATVAASNIESD----PFQQCHDILTLLQSKLAGIK----NDNGANLTQHMA

XP_022154973.1 uncharacterized protein LOC111022117 [Momordica charantia]

2.0e-89

46.7

Show/hide

Query:  VHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPKEEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYARAIWLDLKDRFERK
        +HH DT+NLVLVS+ LTN NYV+WSRSM IALSI+NKLGF+NG++ +P   + L +W RN H+VI+W LNS+SK IS+S+IFT+    IWLDLKDRF+ +
Subjt:  VHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPKEEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYARAIWLDLKDRFERK

Query:  NGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMDPLPPANKAFSLIV
        NGP+IF L++ L T+ Q Q SVT Y++++K+LWDEY  YRP CTCG CSCGG + +++FV FE+L+ FLMGLN+ F+  R+QILLMDP P   KAFSLI 
Subjt:  NGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMDPLPPANKAFSLIV

Query:  QEEEHKGDTNIKSNST---LAATQSKT-------TYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPD--NRPVCKHCGLQGHTIDVCYKIHGYPPSNKQRK
        QEE+ +      + S    LA  QS++       + +   S P C +CG+ GHT+D CYR+HG+P        +H      T  V       P SN    
Subjt:  QEEEHKGDTNIKSNST---LAATQSKT-------TYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPD--NRPVCKHCGLQGHTIDVCYKIHGYPPSNKQRK

Query:  ---NNYKQTNDNQGSVQPENKSCKSATVAASNIESDPFQQCHDILTLLQSKLAGIKNDNGANLTQHMAGQAHFEDDWEG
           N+  QT+ +   + P              + SD F QCH+IL +LQS+L   K D+ A  + ++AG+ HF+DDW+G
Subjt:  ---NNYKQTNDNQGSVQPENKSCKSATVAASNIESDPFQQCHDILTLLQSKLAGIKNDNGANLTQHMAGQAHFEDDWEG

XP_038895765.1 uncharacterized protein LOC120083929 [Benincasa hispida]

1.8e-77

56.25

Show/hide

Query:  VPPIQIDPSL-----TIVPSRQESLIGESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPKEEEFLHLWTRNNHIVI
        +P I + PS      T  P+    L      + Y +HH+DT+NLVLVSELLT+DNYV+WSRSM++ L I+NKLGF++G++ RP   + LHLW  NN++V+
Subjt:  VPPIQIDPSL-----TIVPSRQESLIGESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPKEEEFLHLWTRNNHIVI

Query:  SWILNSISKGISSSIIFTDYARAIWLDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYL
        SWIL S+SK ISSSI+FT+ A+AIWLDL+D F+R+NGPRIFHLK+ L+++KQ QDSVT YF+++KS  DEY  YRP CTCG C+CGG+KS+++F+ FEYL
Subjt:  SWILNSISKGISSSIIFTDYARAIWLDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYL

Query:  LVFLMGLNDEFSTTRSQILLMDPLPPANKAFSLIVQEEEHKGDTNIKSNSTLAATQ
        L F MGLND F+ TRSQ+LLMDP PP NKAFS + Q+E+H+   N  S+      Q
Subjt:  LVFLMGLNDEFSTTRSQILLMDPLPPANKAFSLIVQEEEHKGDTNIKSNSTLAATQ

TrEMBL top hits

e value

%identity

Alignment

A0A5J5B2C5 Uncharacterized protein

1.3e-78

44.26

Show/hide

Query:  ESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPK--EEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYARAIW
        E   + YY+HH+++   VLVS+ LT +NY  WSR+M+IALS++NKLGFV+G I  P+  +   L  W RNN+IVISWILNSISK IS+SIIF  +AR IW
Subjt:  ESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPK--EEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYARAIW

Query:  LDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMDPLP
        LDL+DRF+++NGPRIF LK+ L  ++Q Q SV+ YF+++K++W+E + YRP+C+CG C CGG+K++ ++   EY++ FLMGL+D FS    Q+LLMD +P
Subjt:  LDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMDPLP

Query:  PANKAFSLIVQEEEHKGDTNIKSNSTLAATQSKTTYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPDNRPVCKHCGLQGHTIDVCYKIHGYPPSNKQRKNN
        P N+ FSLIVQEE+ +  TN+ S+S+ +        K   +K      G                 +RP C HC + GHT+D CYKIHGYPP  K R NN
Subjt:  PANKAFSLIVQEEEHKGDTNIKSNSTLAATQSKTTYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPDNRPVCKHCGLQGHTIDVCYKIHGYPPSNKQRKNN

Query:  YKQTNDNQGSVQPE-NKSCKSATVAASNIESDPFQQCHDILTLLQSKLAGIKNDNGA
               Q S   + +    S      N+ S+ +QQ   ++++L + L+  K    A
Subjt:  YKQTNDNQGSVQPE-NKSCKSATVAASNIESDPFQQCHDILTLLQSKLAGIKNDNGA

A0A5J5BKC2 Uncharacterized protein

1.4e-75

48.01

Show/hide

Query:  ESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPK--EEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYARAIW
        E   + YY+HH+D+   +LVS+ LT +NY  WSR+M+IALS++NKLGFV+G+I  P+      L+ W RNN+IVISWILNS+SK IS+SIIF   AR IW
Subjt:  ESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPK--EEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYARAIW

Query:  LDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMDPLP
        LDL+DRF+++N PRIF LK+ L  + Q Q SV+ YF+++K++W+E + YR +C+CG CSCGG+K++ +    EY++ FLMGL+D FS  R Q+LLMDP+P
Subjt:  LDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMDPLP

Query:  PANKAFSLIVQEEEHKGDTNIKSNSTLAATQSKTTYKGKDSKPVCKH--CGLIGHTIDVCYRIHGYPDNRPVCKHCGLQGHTIDVCYKIHGYPPSNKQRK
        P N+ FSLIVQEE+ +     ++NS+  ++ S  T        V K    G                 +R  C HC + GHT+D CYKIHGYPP  K + 
Subjt:  PANKAFSLIVQEEEHKGDTNIKSNSTLAATQSKTTYKGKDSKPVCKH--CGLIGHTIDVCYRIHGYPDNRPVCKHCGLQGHTIDVCYKIHGYPPSNKQRK

Query:  NN
        NN
Subjt:  NN

A0A6J1DLQ9 uncharacterized protein LOC111022117

9.8e-90

46.7

Show/hide

Query:  VHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPKEEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYARAIWLDLKDRFERK
        +HH DT+NLVLVS+ LTN NYV+WSRSM IALSI+NKLGF+NG++ +P   + L +W RN H+VI+W LNS+SK IS+S+IFT+    IWLDLKDRF+ +
Subjt:  VHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPKEEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYARAIWLDLKDRFERK

Query:  NGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMDPLPPANKAFSLIV
        NGP+IF L++ L T+ Q Q SVT Y++++K+LWDEY  YRP CTCG CSCGG + +++FV FE+L+ FLMGLN+ F+  R+QILLMDP P   KAFSLI 
Subjt:  NGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMDPLPPANKAFSLIV

Query:  QEEEHKGDTNIKSNST---LAATQSKT-------TYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPD--NRPVCKHCGLQGHTIDVCYKIHGYPPSNKQRK
        QEE+ +      + S    LA  QS++       + +   S P C +CG+ GHT+D CYR+HG+P        +H      T  V       P SN    
Subjt:  QEEEHKGDTNIKSNST---LAATQSKT-------TYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPD--NRPVCKHCGLQGHTIDVCYKIHGYPPSNKQRK

Query:  ---NNYKQTNDNQGSVQPENKSCKSATVAASNIESDPFQQCHDILTLLQSKLAGIKNDNGANLTQHMAGQAHFEDDWEG
           N+  QT+ +   + P              + SD F QCH+IL +LQS+L   K D+ A  + ++AG+ HF+DDW+G
Subjt:  ---NNYKQTNDNQGSVQPENKSCKSATVAASNIESDPFQQCHDILTLLQSKLAGIKNDNGANLTQHMAGQAHFEDDWEG

A0A6J1DNP7 uncharacterized protein LOC111022065

9.2e-80

43.28

Show/hide

Query:  LIGESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPKEEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYARAI
        ++ E   + Y++HH+D T+LVLVS+LLT++NY +WSRS++IAL+++NK+GFV+G+I RP +   LH W   N++VISWI NS+SK IS+S++F+D A  I
Subjt:  LIGESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPKEEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYARAI

Query:  WLDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMDPL
        WLDLK+RF+R+N PRIF L++ L+ + Q Q SVT YF+R+K+LW E A YRP+C+CG CS GG+KSI+     EY++ FLMGLN  FS  R+Q+LLM+P 
Subjt:  WLDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMDPL

Query:  PPANKAFSLIVQEEEHKGDTNIKSNSTLAATQSKTTYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPDNRPVCKHCGLQGHTIDVCYKIHGYPPSNKQRKN
        P  N+AF+L+ QE + +   ++ S ++  A+  + T    +S+            ++     H    ++ +C HCG+ GHT+D CYK+H YPP    R +
Subjt:  PPANKAFSLIVQEEEHKGDTNIKSNSTLAATQSKTTYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPDNRPVCKHCGLQGHTIDVCYKIHGYPPSNKQRKN

Query:  NYKQTNDNQGSVQPENKSCKSATVAASNIESD----PFQQCHDILTLLQSKLAGIK----NDNGANLTQHMA
         +K T+ N  S +      KS +   S I +        QC  +LTLLQS L   K    ND+G   T H+A
Subjt:  NYKQTNDNQGSVQPENKSCKSATVAASNIESD----PFQQCHDILTLLQSKLAGIK----NDNGANLTQHMA

A0A7J0FKC9 Haloacid dehalogenase-like hydrolase (HAD) superfamily protein

2.7e-79

41.77

Show/hide

Query:  LIGESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPK--EEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYAR
        L  +   S Y++HH+D   LVLVS+ LT DNY +W+R+MIIALS++NKLGF++G+I +P+  +   L+ W RNN++VISWILNS+SK IS+SIIF+  A 
Subjt:  LIGESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPK--EEEFLHLWTRNNHIVISWILNSISKGISSSIIFTDYAR

Query:  AIWLDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMD
         IW+DLKDRF++ NGPRIF L++ L    Q Q  V+ YF+++K++W+E   YRP+C+CG C+CGG+K +      EY++ FLM L+  F+  R Q+LLMD
Subjt:  AIWLDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLMGLNDEFSTTRSQILLMD

Query:  PLPPANKAFSLIVQEEEHKG---DTNIKSNS--TLA-ATQSKTTYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPDNRPVCKHCGLQGHTIDVCYKIHGYP
        PLPP NK FSLI QEE  +      N  SNS  T+A A +++   +  D        G  G+     Y+  G   +R  C HC   GHTI+ CYK HGYP
Subjt:  PLPPANKAFSLIVQEEEHKG---DTNIKSNS--TLA-ATQSKTTYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPDNRPVCKHCGLQGHTIDVCYKIHGYP

Query:  PSNKQR-KNNYKQTNDNQGSVQPENKSCKSATVA----------ASNIESDPFQQCHDILTLLQSKLA-GIKNDNGANLTQHMAGQAHFEDDWEG
        P  K R ++ Y  +N +    Q  N SC  +              +N+ S+ +QQ   ++ +L + +A  +K+      T +  G    EDDW+G
Subjt:  PSNKQR-KNNYKQTNDNQGSVQPENKSCKSATVA----------ASNIESDPFQQCHDILTLLQSKLA-GIKNDNGANLTQHMAGQAHFEDDWEG

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G21280.1 CONTAINS InterPro DOMAIN/s: Retrotransposon gag protein (InterPro:IPR005162); Has 707 Blast hits to 705 proteins in 25 species: Archae - 0; Bacteria - 0; Metazoa - 4; Fungi - 0; Plants - 703; Viruses - 0; Other Eukaryotes - 0 (source: NCBI BLink).

2.6e-26

31.02

Show/hide

Query:  SQYY----VHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPKEEEFLHL-WTRNNHIVISWILNSISKGISSSIIFTDYARAIWL
        S YY    +HH    ++  +S+    DNYV W       L +  K GF++GT+ +P     L+  W + N +V+ W++NS++  +  S+++ + A  +W 
Subjt:  SQYY----VHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPKEEEFLHL-WTRNNHIVISWILNSISKGISSSIIFTDYARAIWL

Query:  DLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYR--PSCTCGLCSCGGLKSIQEFVHFEYLLVFLMG--LNDEFSTTRSQILLMD
        DL+  F      +I+ L++ L T++QG DSV  YF ++  +W E + Y   P C CG C+C   K  +E    E    FLMG  LN  F    ++I+   
Subjt:  DLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYR--PSCTCGLCSCGGLKSIQEFVHFEYLLVFLMG--LNDEFSTTRSQILLMD

Query:  PLPPANKAFSLIVQEE
        P P  ++AF+++   E
Subjt:  PLPPANKAFSLIVQEE

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGATCCCAAAAATCCTAAAGATCCAGAAAAAGAATCAAAGATTGAAGAACCATTAAAAGTACCGCCGATTCAGATAGATCCGTCACTGACTATCGTTCCAAGTCGTCA
AGAATCGCTGATCGGAGAAAGCTCACAAAGTCAATATTACGTACATCACACCGATACAACGAATTTGGTACTGGTGTCCGAACTGCTAACCAATGATAACTATGTAACTT
GGAGCAGATCGATGATCATTGCCCTATCAATCAGGAATAAGCTGGGATTTGTGAATGGGACGATACAGAGGCCGAAAGAAGAAGAGTTTCTACACCTGTGGACAAGAAAC
AATCATATAGTCATTTCTTGGATCCTAAACTCCATATCAAAAGGTATTTCATCTTCCATTATCTTTACAGATTATGCAAGGGCAATTTGGTTAGATCTTAAAGATCGCTT
TGAAAGGAAAAATGGACCTAGGATTTTTCATTTAAAGAAAGGATTGACTACTATCAAACAAGGTCAGGATTCTGTAACAACATATTTCTCAAGAATCAAATCTTTATGGG
ATGAATATGCTTGCTATAGGCCTAGTTGTACTTGTGGGTTGTGCAGCTGTGGAGGTTTGAAGTCTATTCAAGAATTTGTACATTTTGAGTATCTTTTAGTCTTCTTGATG
GGTCTAAATGATGAGTTTTCTACTACTAGATCACAAATACTTCTCATGGATCCATTGCCACCAGCCAATAAGGCTTTTTCTTTAATCGTACAAGAAGAGGAACATAAGGG
AGATACAAATATTAAGAGTAATAGTACCTTAGCTGCCACTCAGTCTAAAACCACATACAAAGGGAAGGATTCTAAGCCAGTATGCAAGCATTGTGGTCTCATAGGACACA
CAATTGATGTTTGCTATAGAATACATGGATATCCGGATAATAGACCTGTGTGCAAGCATTGTGGGTTACAAGGACACACCATCGATGTATGTTATAAAATACATGGGTAT
CCACCTAGTAACAAGCAAAGGAAAAATAACTACAAGCAAACCAATGATAACCAAGGTTCTGTACAACCTGAAAACAAATCTTGCAAATCAGCAACAGTTGCAGCTAGCAA
TATTGAAAGTGATCCTTTTCAACAATGTCATGATATATTGACTCTTCTTCAATCCAAGTTAGCTGGCATCAAGAATGACAATGGAGCGAACCTAACGCAACATATGGCAG
GACAAGCGCACTTTGAAGATGATTGGGAAGGGTAA

mRNA sequence

Show/hide mRNA sequence

GGTAGAGAGAAATATGATCTTTTATATTAGATTGTATAAATAGCCCCATGTATATTCCTTTTTAATTAATAATAATAACTCTTTCTCTAATTTCTGAAGTTCAAATTGGT
ATCAGAGCAATTCTATTGCGCAACAATAAGAAATTCCCAAAATCCAAAACCCTTCTTTCACCGTCAATCTCACAACCTCCATCCTGAGTTCTTCGCCATCAATCTCTGCT
TCTTCCGCCGTCAACCTTCTTCCCAAAATTCATCGCCATCAATACCAATCTCAATCTTCGAGCAATGGATCCCAAAAATCCTAAAGATCCAGAAAAAGAATCAAAGATTG
AAGAACCATTAAAAGTACCGCCGATTCAGATAGATCCGTCACTGACTATCGTTCCAAGTCGTCAAGAATCGCTGATCGGAGAAAGCTCACAAAGTCAATATTACGTACAT
CACACCGATACAACGAATTTGGTACTGGTGTCCGAACTGCTAACCAATGATAACTATGTAACTTGGAGCAGATCGATGATCATTGCCCTATCAATCAGGAATAAGCTGGG
ATTTGTGAATGGGACGATACAGAGGCCGAAAGAAGAAGAGTTTCTACACCTGTGGACAAGAAACAATCATATAGTCATTTCTTGGATCCTAAACTCCATATCAAAAGGTA
TTTCATCTTCCATTATCTTTACAGATTATGCAAGGGCAATTTGGTTAGATCTTAAAGATCGCTTTGAAAGGAAAAATGGACCTAGGATTTTTCATTTAAAGAAAGGATTG
ACTACTATCAAACAAGGTCAGGATTCTGTAACAACATATTTCTCAAGAATCAAATCTTTATGGGATGAATATGCTTGCTATAGGCCTAGTTGTACTTGTGGGTTGTGCAG
CTGTGGAGGTTTGAAGTCTATTCAAGAATTTGTACATTTTGAGTATCTTTTAGTCTTCTTGATGGGTCTAAATGATGAGTTTTCTACTACTAGATCACAAATACTTCTCA
TGGATCCATTGCCACCAGCCAATAAGGCTTTTTCTTTAATCGTACAAGAAGAGGAACATAAGGGAGATACAAATATTAAGAGTAATAGTACCTTAGCTGCCACTCAGTCT
AAAACCACATACAAAGGGAAGGATTCTAAGCCAGTATGCAAGCATTGTGGTCTCATAGGACACACAATTGATGTTTGCTATAGAATACATGGATATCCGGATAATAGACC
TGTGTGCAAGCATTGTGGGTTACAAGGACACACCATCGATGTATGTTATAAAATACATGGGTATCCACCTAGTAACAAGCAAAGGAAAAATAACTACAAGCAAACCAATG
ATAACCAAGGTTCTGTACAACCTGAAAACAAATCTTGCAAATCAGCAACAGTTGCAGCTAGCAATATTGAAAGTGATCCTTTTCAACAATGTCATGATATATTGACTCTT
CTTCAATCCAAGTTAGCTGGCATCAAGAATGACAATGGAGCGAACCTAACGCAACATATGGCAGGACAAGCGCACTTTGAAGATGATTGGGAAGGGTAATCTTGAGCAAG
GATTATATGCGTTAGAGGAGGTACCTTTATCTGCAGCATTGAATACTGTTTGTAGTGTAAGGAGTGGCTCACCATCCCTATGGCATAGGAGATTAGGTCATCCAGCTGAT
TTACCTTTAGTTGCTTTAAAAAATGTACTTTCTTTTGATGCAAATTGTAAAGGGGCTGAAAATTGTACTATATGCCCTTTGGCTAAACAAAACAGATTGAGATTCATTTC
AAATAATAATAAATCAGATGCTATTTTTG

Protein sequence

Show/hide protein sequence

MDPKNPKDPEKESKIEEPLKVPPIQIDPSLTIVPSRQESLIGESSQSQYYVHHTDTTNLVLVSELLTNDNYVTWSRSMIIALSIRNKLGFVNGTIQRPKEEEFLHLWTRN
NHIVISWILNSISKGISSSIIFTDYARAIWLDLKDRFERKNGPRIFHLKKGLTTIKQGQDSVTTYFSRIKSLWDEYACYRPSCTCGLCSCGGLKSIQEFVHFEYLLVFLM
GLNDEFSTTRSQILLMDPLPPANKAFSLIVQEEEHKGDTNIKSNSTLAATQSKTTYKGKDSKPVCKHCGLIGHTIDVCYRIHGYPDNRPVCKHCGLQGHTIDVCYKIHGY
PPSNKQRKNNYKQTNDNQGSVQPENKSCKSATVAASNIESDPFQQCHDILTLLQSKLAGIKNDNGANLTQHMAGQAHFEDDWEG

Sed0023566 (gene) of Chayote v1 genome