CuGenDBv2

Gene ID	Moc06g19340
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Retrovirus-related Pol polyprotein from transposon RE2
Genome location	chr6:15199702..15213893
RNA-Seq Expression	Moc06g19340
Synteny	Moc06g19340
Gene Ontology terms	GO:0015074 - DNA integration (biological process) GO:0003676 - nucleic acid binding (molecular function)
InterPro domains	IPR005162 - Retrotransposon gag domain IPR021109 - Aspartic peptidase domain superfamily IPR025724 - GAG-pre-integrase domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022137317.1 uncharacterized protein LOC111008813 [Momordica charantia]

1.7e-222

76.6

Show/hide

Query:  LKAQSKYKPLTPEAMITREEFNLMKPRFNEQVEALKARYEKKECSFDDGDLGESPFTSDILEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAAT
        +KA+S   P TP  +ITREEF+ ++ + + QVEALKA+ E+KE   +DGDLGESPFTSD+LEAPIPPKFK PT+KPYDGSKDPKDYVEVFE LMDFQAA+
Subjt:  LKAQSKYKPLTPEAMITREEFNLMKPRFNEQVEALKARYEKKECSFDDGDLGESPFTSDILEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAAT

Query:  DAIKCRVFQIALTGSARLWYQRLPASSISTYYQLRKEFISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADET
        DAIKCR F+IALTGSARLWY+RLPA SISTY QLR+EF++ FSSRHYD+KTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADE 
Subjt:  DAIKCRVFQIALTGSARLWYQRLPASSISTYYQLRKEFISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADET

Query:  LT--------------------------LLRTKTCRPEKQIDQKKLSQDKRKADSKSKYKGSSSSGSRTEYRRSEIGHNRSQPYERYTPTTIPISEILTN
        LT                          LLRTKT RPE++I + +  +D   AD KSK KGS SSG R EYRR+E G  RS+PYER+TPTTIPISEILTN
Subjt:  LT--------------------------LLRTKTCRPEKQIDQKKLSQDKRKADSKSKYKGSSSSGSRTEYRRSEIGHNRSQPYERYTPTTIPISEILTN

Query:  IEESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKKFVGKPRTNSVEKTEERKRSRTPPRRDDRPAVINTIFGGLN
        IEESGMEKL+KRPEKLRG PE+R+KDKYCRFHR+HGHNT++ WELKRQIE+LIQDGYFKKFVGKPRT+S EK EERKRSRTPPRR DRPAVINTIFGG +
Subjt:  IEESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKKFVGKPRTNSVEKTEERKRSRTPPRRDDRPAVINTIFGGLN

Query:  GGQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLVRRVLVDGGASANILSLPTYLALGWTRSQLKRSPTPLVGFS
        GGQSG KRKELAR ARREVCIIREQ+PTC ITF   DLEEVHLP NDALVI PLIDHV+V RVLVDGG SANILSLPTYLALGWTRSQLK+SPTPLVGFS
Subjt:  GGQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLVRRVLVDGGASANILSLPTYLALGWTRSQLKRSPTPLVGFS

Query:  GESVSPEGCIDLPVTIGQDSTQVTQMAEFM
        GESV PEG IDLPVT+GQD TQVTQMAEF+
Subjt:  GESVSPEGCIDLPVTIGQDSTQVTQMAEFM

XP_022151683.1 uncharacterized protein LOC111019598 [Momordica charantia]

1.9e-277

100

Show/hide

Query:  MTISNLPTPIVTPPAVVSGAVFTSPPLNQLLNQITSIKMDRGNFLLWQNLALPILRSYKLFDYLTGDKPCPPTHLVPTDTPTNIEGSTSSQSSPTLNPTY
        MTISNLPTPIVTPPAVVSGAVFTSPPLNQLLNQITSIKMDRGNFLLWQNLALPILRSYKLFDYLTGDKPCPPTHLVPTDTPTNIEGSTSSQSSPTLNPTY
Subjt:  MTISNLPTPIVTPPAVVSGAVFTSPPLNQLLNQITSIKMDRGNFLLWQNLALPILRSYKLFDYLTGDKPCPPTHLVPTDTPTNIEGSTSSQSSPTLNPTY

Query:  EAWIVVDKLLLGWLYNSMAADVAMQVMGFSTSRELWTAVQELFGVQSRAEVDYLKQVFQQTCKGSLQMIEYLKLMKSHADNLALAGSSVSVRDLVSQVLT
        EAWIVVDKLLLGWLYNSMAADVAMQVMGFSTSRELWTAVQELFGVQSRAEVDYLKQVFQQTCKGSLQMIEYLKLMKSHADNLALAGSSVSVRDLVSQVLT
Subjt:  EAWIVVDKLLLGWLYNSMAADVAMQVMGFSTSRELWTAVQELFGVQSRAEVDYLKQVFQQTCKGSLQMIEYLKLMKSHADNLALAGSSVSVRDLVSQVLT

Query:  GLDEEYNPIVVAVQGKVNLSWSEMHAELLTYEKRLEYQNSLKSGIPINQTQTPSVNYVDGRSFQTNQRTNNGNNSHGSNTHRGGGYQRGSFGQRNRGRGP
        GLDEEYNPIVVAVQGKVNLSWSEMHAELLTYEKRLEYQNSLKSGIPINQTQTPSVNYVDGRSFQTNQRTNNGNNSHGSNTHRGGGYQRGSFGQRNRGRGP
Subjt:  GLDEEYNPIVVAVQGKVNLSWSEMHAELLTYEKRLEYQNSLKSGIPINQTQTPSVNYVDGRSFQTNQRTNNGNNSHGSNTHRGGGYQRGSFGQRNRGRGP

Query:  QPTQHKNFTPSNSGPNVFAAHHTSTTVTTPETVIDPSWYADSGATSHVTANPNNVEQKVDYSGTENVIVANGNKLSISHIGSTNIHASGGSLKLKDVLRV
        QPTQHKNFTPSNSGPNVFAAHHTSTTVTTPETVIDPSWYADSGATSHVTANPNNVEQKVDYSGTENVIVANGNKLSISHIGSTNIHASGGSLKLKDVLRV
Subjt:  QPTQHKNFTPSNSGPNVFAAHHTSTTVTTPETVIDPSWYADSGATSHVTANPNNVEQKVDYSGTENVIVANGNKLSISHIGSTNIHASGGSLKLKDVLRV

Query:  PDIAKNLDKASGRTLLKGTLKDNLYRLDRSHRSPPATPTLTAPLFAHTVVSLSNNTLSSEKPTPSFPFAEHINVVVSTTVWHKRLGHPSIQVL
        PDIAKNLDKASGRTLLKGTLKDNLYRLDRSHRSPPATPTLTAPLFAHTVVSLSNNTLSSEKPTPSFPFAEHINVVVSTTVWHKRLGHPSIQVL
Subjt:  PDIAKNLDKASGRTLLKGTLKDNLYRLDRSHRSPPATPTLTAPLFAHTVVSLSNNTLSSEKPTPSFPFAEHINVVVSTTVWHKRLGHPSIQVL

XP_022152854.1 uncharacterized protein LOC111020479 [Momordica charantia]

5.3e-256

78.77

Show/hide

Query:  KAQSKYKPLTPEAMITREEFNLMKPRFNEQVEALKARYEKKECSFDDGDLGESPFTSDILEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATD
        KA+S Y P+TP  +ITREEF+ +K +F+ QVEALKAR EKKE SFDDGDLGE  F+SDILEA IPPKFKTPTMKPYDGSKDPKDYVEVFE LMDFQAATD
Subjt:  KAQSKYKPLTPEAMITREEFNLMKPRFNEQVEALKARYEKKECSFDDGDLGESPFTSDILEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATD

Query:  AIKCRVFQIALTGSARLWYQRLPASSISTYYQLRKEFISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETL
        AIKC  FQIALTGSARLWY+RLPA  ISTY QLRKEFISQFSSRHYDRKT THLATIRQKEGETLREYVTRF EEQLKVAHCSDDSAMCYFLTGLADETL
Subjt:  AIKCRVFQIALTGSARLWYQRLPASSISTYYQLRKEFISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETL

Query:  T--------------------------LLRTKTCRPEKQIDQKKLSQDKRKADSKSKYKGSSSSGSRTEYRRSEIGHNRSQPYERYTPTTIPISEILTNI
        T                          LLRTKT RPEK IDQ +  +DK KADSKS+ KG SSS SR +YRRS   HN+S+PYE YTPTTIPI EILTNI
Subjt:  T--------------------------LLRTKTCRPEKQIDQKKLSQDKRKADSKSKYKGSSSSGSRTEYRRSEIGHNRSQPYERYTPTTIPISEILTNI

Query:  EESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKKFVGKPRTNSVEKTEERKRSRTPPRRDDRPAVINTIFGGLNG
        EE+GMEKL+KRPEKLRG PEKRN DKYCRFHRDHGHNT+N WELKRQIEDLIQDGYFKKFVGKPR+NSVEK EERKR RTPPRRDDRPAVI         
Subjt:  EESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKKFVGKPRTNSVEKTEERKRSRTPPRRDDRPAVINTIFGGLNG

Query:  GQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLVRRVLVDGGASANILSLPTYLALGWTRSQLKRSPTPLVGFSG
            NK+KELAREARREVCIIREQ+PT SI F   DLE VHLP NDALVI PLID VLVRR+LVDGGASANILSL TYLALGWTRSQLK+SPTPLVGFSG
Subjt:  GQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLVRRVLVDGGASANILSLPTYLALGWTRSQLKRSPTPLVGFSG

Query:  ESVSPEGCIDLPVTIGQDSTQVTQMAEFMVIDGGSAYNAIFGRPIIHSFRVVPSTLHQVLKYSTPNGVGTVRGEQKTSRECYASALKGSAVCALEEQTNR
        ES+S EGCIDLPV+I QD TQVTQMAEF+VIDG SAYNAIFGRPIIHSFR VPSTLHQVLKYST NGVGTVRGE KTSRECYAS  K S+VCALEEQT R
Subjt:  ESVSPEGCIDLPVTIGQDSTQVTQMAEFMVIDGGSAYNAIFGRPIIHSFRVVPSTLHQVLKYSTPNGVGTVRGEQKTSRECYASALKGSAVCALEEQTNR

Query:  DKL
        D+L
Subjt:  DKL

XP_022152854.1 uncharacterized protein LOC111020479 [Momordica charantia]

2.3e-01

48.39

Show/hide

Query:  PANSANTTERRGFNADNGPQRDLDARMVEDQVRAGQEGDLPQRSSRHANQELPPAHPKPSKA
        PANS NT +RR   A++G QR++ A +VE Q       +   RS+R     LPPAHPKPSKA
Subjt:  PANSANTTERRGFNADNGPQRDLDARMVEDQVRAGQEGDLPQRSSRHANQELPPAHPKPSKA

XP_022152854.1 uncharacterized protein LOC111020479 [Momordica charantia]

3.7e-249

73.93

Show/hide

Query:  PGAPGEREGWVPSFHSGDCEPVPNNEGVDYSLRDNDLRKHLTDKKKRASREPEDSPSYSREFSNSNLKAQSKYKPLTPEAMITREEFNLMKPRFNEQVEA
        PGAPGE+    PS   G+ EP+PN+EGVDYSLRDNDLRKHLTDKKK+AS EPEDS SYSREFSNSNLKAQSKYKPL PEA+I REEF+LMK RF+EQVEA
Subjt:  PGAPGEREGWVPSFHSGDCEPVPNNEGVDYSLRDNDLRKHLTDKKKRASREPEDSPSYSREFSNSNLKAQSKYKPLTPEAMITREEFNLMKPRFNEQVEA

Query:  LKARYEKKECSFDDGDLGESPFTSDILEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATDAIKCRVFQIALTGSARLWYQRLPASSISTYYQL
        LKAR EKKE  FDD DLGESPFTSDI+EAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATDAIKC  FQIALTGSARLW +RLPA SISTY QL
Subjt:  LKARYEKKECSFDDGDLGESPFTSDILEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATDAIKCRVFQIALTGSARLWYQRLPASSISTYYQL

Query:  RKEFISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETLTLLRTKTCRPEKQIDQKKLSQDKRKADSKSKYK
        RKEFI QFS RHYDRKTATHLATIRQKE ETL   V   +E     A    ++           +   LLRTKT RPEKQIDQK+LSQ KRK DSKSK K
Subjt:  RKEFISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETLTLLRTKTCRPEKQIDQKKLSQDKRKADSKSKYK

Query:  GSSSSGSRTEYRRSEIGHNRSQPYERYTPTTIPISEILTNIEESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKK
        GSSSSGSRTEYRRSE G +RS+PYER                                                       CWELKRQIEDLIQD YFKK
Subjt:  GSSSSGSRTEYRRSEIGHNRSQPYERYTPTTIPISEILTNIEESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKK

Query:  FVGKPRTNSVEKTEERKRSRTPPRRDDRPAVINTIFGGLNGGQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLV
        FVGKPR+NSVEK EERKRSRTPPRR+DRPAVINTIFGG +GGQ  NKRKELA EARR+V IIREQKPTCSITF DTDLE VHLP NDALVI PLIDHVLV
Subjt:  FVGKPRTNSVEKTEERKRSRTPPRRDDRPAVINTIFGGLNGGQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLV

Query:  RRVLVDGGASANILSLPTYLALGWTRSQLKRSPTPLVGFSGESVSPEGCIDLPVTIGQDSTQVTQMAEFMVIDGGSAYNAIFGRPIIHSFRVVPSTLHQV
        RRVLVDGGASANILSLPTYLAL  TRSQLK+SPTPLVGFS ESVSPEGCIDLPVTIGQDSTQVTQMAEF+VIDG  AYNAIF RPIIHSF+ VPS LHQV
Subjt:  RRVLVDGGASANILSLPTYLALGWTRSQLKRSPTPLVGFSGESVSPEGCIDLPVTIGQDSTQVTQMAEFMVIDGGSAYNAIFGRPIIHSFRVVPSTLHQV

Query:  LKYSTPNGVGTVRGEQKTSRECYASALKGSAVCALEEQTNRDKLRESEADLPKEGK
        LKYSTPNGVGTVRGEQKTSRECYASALK S+VCALEEQT++D       DLP+E K
Subjt:  LKYSTPNGVGTVRGEQKTSRECYASALKGSAVCALEEQTNRDKLRESEADLPKEGK

XP_022158414.1 uncharacterized protein LOC111024904 [Momordica charantia]

2.4e-224

Show/hide

Query:  MDFQAATDAIKCRVFQIALTGSARLWYQRLPASSISTYYQLRKEFISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFL
        MDFQAATDAIKCR FQIALTGSARLWY+RLPA SISTY QLRKEFISQFSS HYDRKTATHLATIRQKE ETLREYVTRFQEEQLKVAHCSDDSAMCYFL
Subjt:  MDFQAATDAIKCRVFQIALTGSARLWYQRLPASSISTYYQLRKEFISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFL

Query:  TGLADETLT--------------------------LLRTKTCRPEKQIDQKKLSQDKRKADSKSKYKGSSSSGSRTEYRRSEIGHNRSQPYERYTPTTIP
        T LADETLT                          LLRTKT RPEKQIDQKKLSQ+KRKADSKS+ KGSSSS SRTEYRR E G +RS+PYERYT +TIP
Subjt:  TGLADETLT--------------------------LLRTKTCRPEKQIDQKKLSQDKRKADSKSKYKGSSSSGSRTEYRRSEIGHNRSQPYERYTPTTIP

Query:  ISEILTNIEESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKKFVGKPRTNSVEKTEERKRSRTPPRRDDRPAVIN
        ISEILTNIEESGMEKL+KRPEKLRG  EKRNK+KYCRFHRDHGHNTT+CWELKRQIEDLIQDGYFKKFVGKPR+NSVEK EERKRSRTPPRR+DRPAVIN
Subjt:  ISEILTNIEESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKKFVGKPRTNSVEKTEERKRSRTPPRRDDRPAVIN

Query:  TIFGGLNGGQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLVRRVLVDGGASANILSLPTYLALGWTRSQLKRSP
        TIFGG NGGQSGNKRKELAREARREVCIIRE KPTCSITFGD DLE VHLP NDALVI  LIDH LVRRVL+DG                          
Subjt:  TIFGGLNGGQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLVRRVLVDGGASANILSLPTYLALGWTRSQLKRSP

Query:  TPLVGFSGESVSPEGCIDLPVTIGQDSTQVTQMAEFMVIDGGSAYNAIFGRPIIHSFRVVPSTLHQVLKYSTPNGVGTVRGEQKTSRECYASALKGSAVC
                      GCIDLPVTIGQD+TQVTQMAEF+VIDG SAYNAIFGRPIIHSFR VPSTLHQVLKYSTPN VG VRGEQKTSRECYASALKGSAVC
Subjt:  TPLVGFSGESVSPEGCIDLPVTIGQDSTQVTQMAEFMVIDGGSAYNAIFGRPIIHSFRVVPSTLHQVLKYSTPNGVGTVRGEQKTSRECYASALKGSAVC

Query:  ALEEQTNRDKLRESEADLPKEGKRQFSPPTEELELTDL
        ALEEQTNR KL+ESEADLPKEGKRQF PPTEELEL  L
Subjt:  ALEEQTNRDKLRESEADLPKEGKRQFSPPTEELELTDL

TrEMBL top hits

e value

%identity

Alignment

A0A6J1C7X5 uncharacterized protein LOC111008813

8.4e-223

76.6

Show/hide

Query:  LKAQSKYKPLTPEAMITREEFNLMKPRFNEQVEALKARYEKKECSFDDGDLGESPFTSDILEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAAT
        +KA+S   P TP  +ITREEF+ ++ + + QVEALKA+ E+KE   +DGDLGESPFTSD+LEAPIPPKFK PT+KPYDGSKDPKDYVEVFE LMDFQAA+
Subjt:  LKAQSKYKPLTPEAMITREEFNLMKPRFNEQVEALKARYEKKECSFDDGDLGESPFTSDILEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAAT

Query:  DAIKCRVFQIALTGSARLWYQRLPASSISTYYQLRKEFISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADET
        DAIKCR F+IALTGSARLWY+RLPA SISTY QLR+EF++ FSSRHYD+KTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADE 
Subjt:  DAIKCRVFQIALTGSARLWYQRLPASSISTYYQLRKEFISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADET

Query:  LT--------------------------LLRTKTCRPEKQIDQKKLSQDKRKADSKSKYKGSSSSGSRTEYRRSEIGHNRSQPYERYTPTTIPISEILTN
        LT                          LLRTKT RPE++I + +  +D   AD KSK KGS SSG R EYRR+E G  RS+PYER+TPTTIPISEILTN
Subjt:  LT--------------------------LLRTKTCRPEKQIDQKKLSQDKRKADSKSKYKGSSSSGSRTEYRRSEIGHNRSQPYERYTPTTIPISEILTN

Query:  IEESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKKFVGKPRTNSVEKTEERKRSRTPPRRDDRPAVINTIFGGLN
        IEESGMEKL+KRPEKLRG PE+R+KDKYCRFHR+HGHNT++ WELKRQIE+LIQDGYFKKFVGKPRT+S EK EERKRSRTPPRR DRPAVINTIFGG +
Subjt:  IEESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKKFVGKPRTNSVEKTEERKRSRTPPRRDDRPAVINTIFGGLN

Query:  GGQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLVRRVLVDGGASANILSLPTYLALGWTRSQLKRSPTPLVGFS
        GGQSG KRKELAR ARREVCIIREQ+PTC ITF   DLEEVHLP NDALVI PLIDHV+V RVLVDGG SANILSLPTYLALGWTRSQLK+SPTPLVGFS
Subjt:  GGQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLVRRVLVDGGASANILSLPTYLALGWTRSQLKRSPTPLVGFS

Query:  GESVSPEGCIDLPVTIGQDSTQVTQMAEFM
        GESV PEG IDLPVT+GQD TQVTQMAEF+
Subjt:  GESVSPEGCIDLPVTIGQDSTQVTQMAEFM

A0A6J1DCW4 uncharacterized protein LOC111019598

9.1e-278

100

Show/hide

Query:  MTISNLPTPIVTPPAVVSGAVFTSPPLNQLLNQITSIKMDRGNFLLWQNLALPILRSYKLFDYLTGDKPCPPTHLVPTDTPTNIEGSTSSQSSPTLNPTY
        MTISNLPTPIVTPPAVVSGAVFTSPPLNQLLNQITSIKMDRGNFLLWQNLALPILRSYKLFDYLTGDKPCPPTHLVPTDTPTNIEGSTSSQSSPTLNPTY
Subjt:  MTISNLPTPIVTPPAVVSGAVFTSPPLNQLLNQITSIKMDRGNFLLWQNLALPILRSYKLFDYLTGDKPCPPTHLVPTDTPTNIEGSTSSQSSPTLNPTY

Query:  EAWIVVDKLLLGWLYNSMAADVAMQVMGFSTSRELWTAVQELFGVQSRAEVDYLKQVFQQTCKGSLQMIEYLKLMKSHADNLALAGSSVSVRDLVSQVLT
        EAWIVVDKLLLGWLYNSMAADVAMQVMGFSTSRELWTAVQELFGVQSRAEVDYLKQVFQQTCKGSLQMIEYLKLMKSHADNLALAGSSVSVRDLVSQVLT
Subjt:  EAWIVVDKLLLGWLYNSMAADVAMQVMGFSTSRELWTAVQELFGVQSRAEVDYLKQVFQQTCKGSLQMIEYLKLMKSHADNLALAGSSVSVRDLVSQVLT

Query:  GLDEEYNPIVVAVQGKVNLSWSEMHAELLTYEKRLEYQNSLKSGIPINQTQTPSVNYVDGRSFQTNQRTNNGNNSHGSNTHRGGGYQRGSFGQRNRGRGP
        GLDEEYNPIVVAVQGKVNLSWSEMHAELLTYEKRLEYQNSLKSGIPINQTQTPSVNYVDGRSFQTNQRTNNGNNSHGSNTHRGGGYQRGSFGQRNRGRGP
Subjt:  GLDEEYNPIVVAVQGKVNLSWSEMHAELLTYEKRLEYQNSLKSGIPINQTQTPSVNYVDGRSFQTNQRTNNGNNSHGSNTHRGGGYQRGSFGQRNRGRGP

Query:  QPTQHKNFTPSNSGPNVFAAHHTSTTVTTPETVIDPSWYADSGATSHVTANPNNVEQKVDYSGTENVIVANGNKLSISHIGSTNIHASGGSLKLKDVLRV
        QPTQHKNFTPSNSGPNVFAAHHTSTTVTTPETVIDPSWYADSGATSHVTANPNNVEQKVDYSGTENVIVANGNKLSISHIGSTNIHASGGSLKLKDVLRV
Subjt:  QPTQHKNFTPSNSGPNVFAAHHTSTTVTTPETVIDPSWYADSGATSHVTANPNNVEQKVDYSGTENVIVANGNKLSISHIGSTNIHASGGSLKLKDVLRV

Query:  PDIAKNLDKASGRTLLKGTLKDNLYRLDRSHRSPPATPTLTAPLFAHTVVSLSNNTLSSEKPTPSFPFAEHINVVVSTTVWHKRLGHPSIQVL
        PDIAKNLDKASGRTLLKGTLKDNLYRLDRSHRSPPATPTLTAPLFAHTVVSLSNNTLSSEKPTPSFPFAEHINVVVSTTVWHKRLGHPSIQVL
Subjt:  PDIAKNLDKASGRTLLKGTLKDNLYRLDRSHRSPPATPTLTAPLFAHTVVSLSNNTLSSEKPTPSFPFAEHINVVVSTTVWHKRLGHPSIQVL

A0A6J1DHB3 uncharacterized protein LOC111020479

2.6e-256

78.77

Show/hide

Query:  KAQSKYKPLTPEAMITREEFNLMKPRFNEQVEALKARYEKKECSFDDGDLGESPFTSDILEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATD
        KA+S Y P+TP  +ITREEF+ +K +F+ QVEALKAR EKKE SFDDGDLGE  F+SDILEA IPPKFKTPTMKPYDGSKDPKDYVEVFE LMDFQAATD
Subjt:  KAQSKYKPLTPEAMITREEFNLMKPRFNEQVEALKARYEKKECSFDDGDLGESPFTSDILEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATD

Query:  AIKCRVFQIALTGSARLWYQRLPASSISTYYQLRKEFISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETL
        AIKC  FQIALTGSARLWY+RLPA  ISTY QLRKEFISQFSSRHYDRKT THLATIRQKEGETLREYVTRF EEQLKVAHCSDDSAMCYFLTGLADETL
Subjt:  AIKCRVFQIALTGSARLWYQRLPASSISTYYQLRKEFISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETL

Query:  T--------------------------LLRTKTCRPEKQIDQKKLSQDKRKADSKSKYKGSSSSGSRTEYRRSEIGHNRSQPYERYTPTTIPISEILTNI
        T                          LLRTKT RPEK IDQ +  +DK KADSKS+ KG SSS SR +YRRS   HN+S+PYE YTPTTIPI EILTNI
Subjt:  T--------------------------LLRTKTCRPEKQIDQKKLSQDKRKADSKSKYKGSSSSGSRTEYRRSEIGHNRSQPYERYTPTTIPISEILTNI

Query:  EESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKKFVGKPRTNSVEKTEERKRSRTPPRRDDRPAVINTIFGGLNG
        EE+GMEKL+KRPEKLRG PEKRN DKYCRFHRDHGHNT+N WELKRQIEDLIQDGYFKKFVGKPR+NSVEK EERKR RTPPRRDDRPAVI         
Subjt:  EESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKKFVGKPRTNSVEKTEERKRSRTPPRRDDRPAVINTIFGGLNG

Query:  GQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLVRRVLVDGGASANILSLPTYLALGWTRSQLKRSPTPLVGFSG
            NK+KELAREARREVCIIREQ+PT SI F   DLE VHLP NDALVI PLID VLVRR+LVDGGASANILSL TYLALGWTRSQLK+SPTPLVGFSG
Subjt:  GQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLVRRVLVDGGASANILSLPTYLALGWTRSQLKRSPTPLVGFSG

Query:  ESVSPEGCIDLPVTIGQDSTQVTQMAEFMVIDGGSAYNAIFGRPIIHSFRVVPSTLHQVLKYSTPNGVGTVRGEQKTSRECYASALKGSAVCALEEQTNR
        ES+S EGCIDLPV+I QD TQVTQMAEF+VIDG SAYNAIFGRPIIHSFR VPSTLHQVLKYST NGVGTVRGE KTSRECYAS  K S+VCALEEQT R
Subjt:  ESVSPEGCIDLPVTIGQDSTQVTQMAEFMVIDGGSAYNAIFGRPIIHSFRVVPSTLHQVLKYSTPNGVGTVRGEQKTSRECYASALKGSAVCALEEQTNR

Query:  DKL
        D+L
Subjt:  DKL

A0A6J1DHB3 uncharacterized protein LOC111020479

1.1e-01

48.39

Show/hide

Query:  PANSANTTERRGFNADNGPQRDLDARMVEDQVRAGQEGDLPQRSSRHANQELPPAHPKPSKA
        PANS NT +RR   A++G QR++ A +VE Q       +   RS+R     LPPAHPKPSKA
Subjt:  PANSANTTERRGFNADNGPQRDLDARMVEDQVRAGQEGDLPQRSSRHANQELPPAHPKPSKA

A0A6J1DHB3 uncharacterized protein LOC111020479

1.8e-249

73.93

Show/hide

Query:  PGAPGEREGWVPSFHSGDCEPVPNNEGVDYSLRDNDLRKHLTDKKKRASREPEDSPSYSREFSNSNLKAQSKYKPLTPEAMITREEFNLMKPRFNEQVEA
        PGAPGE+    PS   G+ EP+PN+EGVDYSLRDNDLRKHLTDKKK+AS EPEDS SYSREFSNSNLKAQSKYKPL PEA+I REEF+LMK RF+EQVEA
Subjt:  PGAPGEREGWVPSFHSGDCEPVPNNEGVDYSLRDNDLRKHLTDKKKRASREPEDSPSYSREFSNSNLKAQSKYKPLTPEAMITREEFNLMKPRFNEQVEA

Query:  LKARYEKKECSFDDGDLGESPFTSDILEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATDAIKCRVFQIALTGSARLWYQRLPASSISTYYQL
        LKAR EKKE  FDD DLGESPFTSDI+EAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATDAIKC  FQIALTGSARLW +RLPA SISTY QL
Subjt:  LKARYEKKECSFDDGDLGESPFTSDILEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATDAIKCRVFQIALTGSARLWYQRLPASSISTYYQL

Query:  RKEFISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETLTLLRTKTCRPEKQIDQKKLSQDKRKADSKSKYK
        RKEFI QFS RHYDRKTATHLATIRQKE ETL   V   +E     A    ++           +   LLRTKT RPEKQIDQK+LSQ KRK DSKSK K
Subjt:  RKEFISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETLTLLRTKTCRPEKQIDQKKLSQDKRKADSKSKYK

Query:  GSSSSGSRTEYRRSEIGHNRSQPYERYTPTTIPISEILTNIEESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKK
        GSSSSGSRTEYRRSE G +RS+PYER                                                       CWELKRQIEDLIQD YFKK
Subjt:  GSSSSGSRTEYRRSEIGHNRSQPYERYTPTTIPISEILTNIEESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKK

Query:  FVGKPRTNSVEKTEERKRSRTPPRRDDRPAVINTIFGGLNGGQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLV
        FVGKPR+NSVEK EERKRSRTPPRR+DRPAVINTIFGG +GGQ  NKRKELA EARR+V IIREQKPTCSITF DTDLE VHLP NDALVI PLIDHVLV
Subjt:  FVGKPRTNSVEKTEERKRSRTPPRRDDRPAVINTIFGGLNGGQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLV

Query:  RRVLVDGGASANILSLPTYLALGWTRSQLKRSPTPLVGFSGESVSPEGCIDLPVTIGQDSTQVTQMAEFMVIDGGSAYNAIFGRPIIHSFRVVPSTLHQV
        RRVLVDGGASANILSLPTYLAL  TRSQLK+SPTPLVGFS ESVSPEGCIDLPVTIGQDSTQVTQMAEF+VIDG  AYNAIF RPIIHSF+ VPS LHQV
Subjt:  RRVLVDGGASANILSLPTYLALGWTRSQLKRSPTPLVGFSGESVSPEGCIDLPVTIGQDSTQVTQMAEFMVIDGGSAYNAIFGRPIIHSFRVVPSTLHQV

Query:  LKYSTPNGVGTVRGEQKTSRECYASALKGSAVCALEEQTNRDKLRESEADLPKEGK
        LKYSTPNGVGTVRGEQKTSRECYASALK S+VCALEEQT++D       DLP+E K
Subjt:  LKYSTPNGVGTVRGEQKTSRECYASALKGSAVCALEEQTNRDKLRESEADLPKEGK

A0A6J1DZB9 uncharacterized protein LOC111024904

1.2e-224

Show/hide

Query:  MDFQAATDAIKCRVFQIALTGSARLWYQRLPASSISTYYQLRKEFISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFL
        MDFQAATDAIKCR FQIALTGSARLWY+RLPA SISTY QLRKEFISQFSS HYDRKTATHLATIRQKE ETLREYVTRFQEEQLKVAHCSDDSAMCYFL
Subjt:  MDFQAATDAIKCRVFQIALTGSARLWYQRLPASSISTYYQLRKEFISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFL

Query:  TGLADETLT--------------------------LLRTKTCRPEKQIDQKKLSQDKRKADSKSKYKGSSSSGSRTEYRRSEIGHNRSQPYERYTPTTIP
        T LADETLT                          LLRTKT RPEKQIDQKKLSQ+KRKADSKS+ KGSSSS SRTEYRR E G +RS+PYERYT +TIP
Subjt:  TGLADETLT--------------------------LLRTKTCRPEKQIDQKKLSQDKRKADSKSKYKGSSSSGSRTEYRRSEIGHNRSQPYERYTPTTIP

Query:  ISEILTNIEESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKKFVGKPRTNSVEKTEERKRSRTPPRRDDRPAVIN
        ISEILTNIEESGMEKL+KRPEKLRG  EKRNK+KYCRFHRDHGHNTT+CWELKRQIEDLIQDGYFKKFVGKPR+NSVEK EERKRSRTPPRR+DRPAVIN
Subjt:  ISEILTNIEESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKKFVGKPRTNSVEKTEERKRSRTPPRRDDRPAVIN

Query:  TIFGGLNGGQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLVRRVLVDGGASANILSLPTYLALGWTRSQLKRSP
        TIFGG NGGQSGNKRKELAREARREVCIIRE KPTCSITFGD DLE VHLP NDALVI  LIDH LVRRVL+DG                          
Subjt:  TIFGGLNGGQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLVRRVLVDGGASANILSLPTYLALGWTRSQLKRSP

Query:  TPLVGFSGESVSPEGCIDLPVTIGQDSTQVTQMAEFMVIDGGSAYNAIFGRPIIHSFRVVPSTLHQVLKYSTPNGVGTVRGEQKTSRECYASALKGSAVC
                      GCIDLPVTIGQD+TQVTQMAEF+VIDG SAYNAIFGRPIIHSFR VPSTLHQVLKYSTPN VG VRGEQKTSRECYASALKGSAVC
Subjt:  TPLVGFSGESVSPEGCIDLPVTIGQDSTQVTQMAEFMVIDGGSAYNAIFGRPIIHSFRVVPSTLHQVLKYSTPNGVGTVRGEQKTSRECYASALKGSAVC

Query:  ALEEQTNRDKLRESEADLPKEGKRQFSPPTEELELTDL
        ALEEQTNR KL+ESEADLPKEGKRQF PPTEELEL  L
Subjt:  ALEEQTNRDKLRESEADLPKEGKRQFSPPTEELELTDL

SwissProt top hits

e value

%identity

Alignment

P10978 Retrovirus-related Pol polyprotein from transposon TNT 1-94

9.8e-11

21.54

Show/hide

Query:  EAWIVVDKLLLGWLYNSMAADVAMQVMGFSTSRELWTAVQELFGVQSRAEVDYL-KQVFQQTCKGSLQMIEYLKLMKSHADNLALAGSSVSVRDLVSQVL
        E W  +D+     +   ++ DV   ++   T+R +WT ++ L+  ++     YL KQ++          + +L +       LA  G  +   D    +L
Subjt:  EAWIVVDKLLLGWLYNSMAADVAMQVMGFSTSRELWTAVQELFGVQSRAEVDYL-KQVFQQTCKGSLQMIEYLKLMKSHADNLALAGSSVSVRDLVSQVL

Query:  TGLDEEYNPIVVAV-QGKVNLSWSEMHAELLTYEKRLEYQNSLKSGIPINQTQTPSVNYVDGRSFQTNQRTNNGNNSHGSNTHRGGGYQRGSFGQRNRGR
          L   Y+ +   +  GK  +   ++ + LL  EK  +         P NQ Q   +    GRS+Q +      + + G + +R     R  +     G 
Subjt:  TGLDEEYNPIVVAV-QGKVNLSWSEMHAELLTYEKRLEYQNSLKSGIPINQTQTPSVNYVDGRSFQTNQRTNNGNNSHGSNTHRGGGYQRGSFGQRNRGR

Query:  ----GPQPTQHKNFTPSNSGPNVFAAHHTSTTVTTPETVI---------------DPSWYADSGATSHVTANPNNVEQKVDYSGTENVIVANGNKLSISH
             P P + K  T      +     +T+  V   + V+               +  W  D+ A+ H T    ++  +        V + N +   I+ 
Subjt:  ----GPQPTQHKNFTPSNSGPNVFAAHHTSTTVTTPETVI---------------DPSWYADSGATSHVTANPNNVEQKVDYSGTENVIVANGNKLSISH

Query:  IGSTNIHAS-GGSLKLKDVLRVPDIAKNLDKASGRTLLKGTLKDNLYRLDRSHRSPPATPTLTAPLFAHTVVSLSNNTLSSEKPTPSFPFAEHINVVVST
        IG   I  + G +L LKDV  VPD+  NL   SG  L +   +   Y  ++  R    +  +   +   T+   +      E               +S 
Subjt:  IGSTNIHAS-GGSLKLKDVLRVPDIAKNLDKASGRTLLKGTLKDNLYRLDRSHRSPPATPTLTAPLFAHTVVSLSNNTLSSEKPTPSFPFAEHINVVVST

Query:  TVWHKRLGHPSIQVLDHIIRTCNLPYKTNEPISFCDACPFGKSHALPFHDSHSHATGMFELVYTDLWGP
         +WHKR+GH S + L  + +   + Y     +  CD C FGK H + F  S      + +LVY+D+ GP
Subjt:  TVWHKRLGHPSIQVLDHIIRTCNLPYKTNEPISFCDACPFGKSHALPFHDSHSHATGMFELVYTDLWGP

Q94HW2 Retrovirus-related Pol polyprotein from transposon RE1

1.2e-35

25.31

Show/hide

Query:  LNQLLNQITSIKMDRGNFLLWQNLALPILRSYKLFDYLTGDKPCPPTHLVPTDTPTNIEGSTSSQSSPTLNPTYEAWIVVDKLLLGWLYNSMAADVAMQV
        LN  ++ +T  K+   N+L+W      +   Y+L  +L G    PP              +  + ++P +NP Y  W   DKL+   +  +++  V   V
Subjt:  LNQLLNQITSIKMDRGNFLLWQNLALPILRSYKLFDYLTGDKPCPPTHLVPTDTPTNIEGSTSSQSSPTLNPTYEAWIVVDKLLLGWLYNSMAADVAMQV

Query:  MGFSTSRELWTAVQELFGVQSRAEVDYLKQVFQQTCKGSLQMIEYLKLMKSHADNLALAGSSVSVRDLVSQVLTGLDEEYNPIVVAVQGK-VNLSWSEMH
           +T+ ++W  +++++   S   V  L+   +Q  KG+  + +Y++ + +  D LAL G  +   + V +VL  L EEY P++  +  K    + +E+H
Subjt:  MGFSTSRELWTAVQELFGVQSRAEVDYLKQVFQQTCKGSLQMIEYLKLMKSHADNLALAGSSVSVRDLVSQVLTGLDEEYNPIVVAVQGK-VNLSWSEMH

Query:  AELLTYEKRLEYQNSLKSGIPI-------NQTQTPSVNYVDGRSFQTNQRTNNGNN----SHGSNTHRGGGYQRGSFGQ--------RNRGRGPQPTQHK
          LL +E ++   +S  + IPI         T T + N    R+ + + R NN N+       +N H      +   G+         +  R  Q     
Subjt:  AELLTYEKRLEYQNSLKSGIPI-------NQTQTPSVNYVDGRSFQTNQRTNNGNN----SHGSNTHRGGGYQRGSFGQ--------RNRGRGPQPTQHK

Query:  NFTPSNSGPNVFAAHHTSTTVTTPETVIDPSWYADSGATSHVTANPNNVEQKVDYSGTENVIVANGNKLSISHIGSTNIHASGGSLKLKDVLRVPDIAKN
        +   S   P+ F        +         +W  DSGAT H+T++ NN+     Y+G ++V+VA+G+ + ISH GST++      L L ++L VP+I KN
Subjt:  NFTPSNSGPNVFAAHHTSTTVTTPETVIDPSWYADSGATSHVTANPNNVEQKVDYSGTENVIVANGNKLSISHIGSTNIHASGGSLKLKDVLRVPDIAKN

Query:  L------------------------DKASGRTLLKGTLKDNLYRLDRSHRSPPATPTLTAPLFAHTVVSLSNNTLSSEKPTPSFPFAEHINVVVSTTVWH
        L                        D  +G  LL+G  KD LY         P   +    LFA            S K T S               WH
Subjt:  L------------------------DKASGRTLLKGTLKDNLYRLDRSHRSPPATPTLTAPLFAHTVVSLSNNTLSSEKPTPSFPFAEHINVVVSTTVWH

Query:  KRLGHPSIQVLDHIIRTCNLP-YKTNEPISFCDACPFGKSHALPFHDSHSHATGMFELVYTDLWGPAPHLSSD
         RLGHP+  +L+ +I   +L     +     C  C   KS+ +PF  S  ++T   E +Y+D+W  +P LS D
Subjt:  KRLGHPSIQVLDHIIRTCNLP-YKTNEPISFCDACPFGKSHALPFHDSHSHATGMFELVYTDLWGPAPHLSSD

Q9ZT94 Retrovirus-related Pol polyprotein from transposon RE2

1.0e-36

25.82

Show/hide

Query:  LNQLLNQITSIKMDRGNFLLWQNLALPILRSYKLFDYLTGDKPCPPTHLVPTDTPTNIEGSTSSQSSPTLNPTYEAWIVVDKLLLGWLYNSMAADVAMQV
        LN  ++ +T  K+   N+L+W      +   Y+L  +L G  P PP              +  + + P +NP Y  W   DKL+   +  +++  V   V
Subjt:  LNQLLNQITSIKMDRGNFLLWQNLALPILRSYKLFDYLTGDKPCPPTHLVPTDTPTNIEGSTSSQSSPTLNPTYEAWIVVDKLLLGWLYNSMAADVAMQV

Query:  MGFSTSRELWTAVQELFGVQSRAEVDYLKQVFQQTCKGSLQMIEYLKLMKSHADNLALAGSSVSVRDLVSQVLTGLDEEYNPIVVAVQGK-VNLSWSEMH
           +T+ ++W  +++++   S   V  L+ +                   +  D LAL G  +   + V +VL  L ++Y P++  +  K    S +E+H
Subjt:  MGFSTSRELWTAVQELFGVQSRAEVDYLKQVFQQTCKGSLQMIEYLKLMKSHADNLALAGSSVSVRDLVSQVLTGLDEEYNPIVVAVQGK-VNLSWSEMH

Query:  AELLTYEKRLEYQNSLKSGIPINQTQTPSVNYVDGRSFQTNQRTNN--GNNSHGSNTHRGGGYQRGSFGQRNRGRGPQPTQHKNFTPSNSGPNV------
          L+  E +L   NS +  +PI      + N V  R+  TN+  NN   N ++ +N +R   +Q  S G R+  R P+P   +    S  G +       
Subjt:  AELLTYEKRLEYQNSLKSGIPINQTQTPSVNYVDGRSFQTNQRTNN--GNNSHGSNTHRGGGYQRGSFGQRNRGRGPQPTQHKNFTPSNSGPNV------

Query:  --FAAHHTSTTVTTPETVIDP-------------SWYADSGATSHVTANPNNVEQKVDYSGTENVIVANGNKLSISHIGSTNIHASGGSLKLKDVLRVPD
          F +       T+P T   P             +W  DSGAT H+T++ NN+     Y+G ++V++A+G+ + I+H GS ++  S  SL L  VL VP+
Subjt:  --FAAHHTSTTVTTPETVIDP-------------SWYADSGATSHVTANPNNVEQKVDYSGTENVIVANGNKLSISHIGSTNIHASGGSLKLKDVLRVPD

Query:  IAKNL------------------------DKASGRTLLKGTLKDNLYRLDRSHRSPPATPTLTAPLFAHTVVSLSNNTLSSEKPTPSFPFAEHINVVVST
        I KNL                        D  +G  LL+G  KD LY                 P+ +   VS+  +  S          A H       
Subjt:  IAKNL------------------------DKASGRTLLKGTLKDNLYRLDRSHRSPPATPTLTAPLFAHTVVSLSNNTLSSEKPTPSFPFAEHINVVVST

Query:  TVWHKRLGHPSIQVLDHIIRTCNLP-YKTNEPISFCDACPFGKSHALPFHDSHSHATGMFELVYTDLWGPAPHLSSD
        + WH RLGHPS+ +L+ +I   +LP    +  +  C  C   KSH +PF +S   ++   E +Y+D+W  +P LS D
Subjt:  TVWHKRLGHPSIQVLDHIIRTCNLP-YKTNEPISFCDACPFGKSHALPFHDSHSHATGMFELVYTDLWGPAPHLSSD

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGACGATCTCAAACTTACCCACTCCAATCGTGACTCCTCCGGCAGTAGTGAGTGGCGCTGTCTTCACCAGTCCACCGTTGAATCAACTACTTAATCAAATCACCTCTAT
TAAAATGGATAGAGGAAACTTTCTACTATGGCAAAATTTGGCCTTACCGATCCTGCGAAGCTACAAGCTATTTGACTACCTTACGGGAGACAAGCCATGCCCTCCCACGC
ATCTTGTTCCAACAGACACACCTACAAATATAGAAGGCAGCACCTCGTCGCAATCCTCCCCAACTTTGAACCCCACGTACGAGGCGTGGATCGTAGTGGATAAACTACTC
TTGGGTTGGCTTTACAACTCGATGGCAGCGGACGTAGCCATGCAAGTTATGGGGTTTTCCACGTCGCGTGAACTATGGACAGCAGTTCAAGAACTTTTTGGTGTCCAATC
CAGAGCGGAAGTAGACTACCTAAAACAGGTATTTCAACAAACCTGCAAGGGCTCATTACAAATGATTGAATATTTAAAGCTTATGAAAAGTCATGCTGATAATTTGGCCC
TAGCGGGTAGTTCGGTCTCTGTTCGAGACTTGGTTTCACAAGTATTGACAGGTTTGGATGAAGAGTACAATCCCATCGTGGTGGCCGTTCAAGGCAAAGTAAATCTGTCA
TGGTCAGAAATGCACGCAGAGCTTCTAACATACGAGAAACGGTTGGAATACCAAAACTCCCTCAAAAGTGGCATCCCGATCAACCAGACTCAAACACCCTCAGTGAACTA
TGTTGATGGGCGAAGCTTCCAAACCAACCAGCGGACTAATAATGGAAACAACAGTCATGGGTCAAATACTCATCGTGGCGGTGGTTATCAACGGGGAAGTTTTGGTCAAC
GAAATCGTGGCAGAGGACCTCAACCCACCCAACATAAAAATTTCACCCCCTCAAATTCTGGACCAAATGTATTTGCTGCACATCACACTTCTACCACGGTCACTACCCCT
GAGACTGTCATTGATCCTAGTTGGTATGCCGACAGTGGAGCTACAAGTCATGTGACTGCCAACCCGAACAATGTTGAGCAAAAAGTTGATTACTCAGGTACCGAAAATGT
AATTGTCGCAAATGGCAATAAGTTATCTATCTCTCACATTGGTAGCACTAATATCCATGCCTCGGGTGGTTCTTTAAAATTGAAAGATGTTCTCCGTGTTCCTGATATAG
CTAAAAACCTTGACAAGGCTTCGGGAAGAACTTTGTTGAAAGGAACACTTAAAGACAACCTCTATCGTCTTGATAGAAGTCACCGGTCACCACCCGCTACTCCCACATTG
ACTGCACCGTTGTTTGCTCACACTGTTGTATCTCTGTCGAATAATACTCTCAGTTCAGAGAAACCAACTCCTTCTTTCCCGTTTGCTGAACACATTAATGTAGTGGTGTC
CACAACCGTGTGGCATAAACGGCTTGGACATCCTTCTATTCAAGTCTTAGATCATATCATTAGGACTTGTAATCTTCCCTACAAGACTAATGAACCAATAAGTTTTTGTG
ATGCATGTCCGTTTGGAAAATCTCATGCCTTACCGTTTCATGACTCTCACTCTCATGCTACAGGAATGTTTGAACTAGTTTATACAGATCTCTGGGGACCGGCACCTCAC
CTCTCTTCAGACGGTCCAATGCACAAGGGTCATCGCTGTCTCAGCCCAACAGGAAAAGTGTTTATCTCACGGCACGTCCAGTTTAATGAAACTGAATTCTCATTCACCTC
TGGCTTTGGACAAACAAAGTCTGTCACCTCTCCTCCCGCTGCATCTGTGGCTTCATCAATAATGTCCTCGTTTCCCATGCCACCACCTCTGCCTCTCTCCCCACCTGCCC
AAAGTCACCTTTCCACTCCAATTTCTTCCATCCCAACAGATCTCATACCCACTGGCTTAGCTTATCACTACTCCTGCCCTATTGCTGTCTTACCAACAACTTCCCCTATA
TCCTCTGACCTTGCCAATTTGTCACCCAACCCTCCATCAGGCCCACCTTCGCCGCCCCCTCCCTGTCTCTTCTCTTCATCACCTCCACCACCAGCCCCAGAACAACTGGC
TATCTCCTCTCCAACGCCTCAAATACCATTAACAATCATTGACCCTCTAGCTATCTCCTCTCCGCTGCCACCAATAACATCATCGGTCACTGAACCTCTCAACCCTCATC
TTTCATTACGATTGAAGTTCAAACAAAACCTTGCCGTTCTTGGATTCTTCTTGGTTATAAGGTCCACCCGGGTGTTCAGGTCGGATCCGGAGACCGAGTTCGAGCTTGAT
TCGCGAAGAACCGTTCCAGCAAACTCTGCCAATACGACAGAACGGAGGGGTTTTAACGCTGATAACGGCCCTCAACGAGACCTTGACGCTAGAATGGTCGAGGATCAGGT
TCGAGCAGGACAAGAGGGAGATCTTCCACAGAGGTCGTCCCGCCACGCGAACCAAGAGTTACCACCTGCTCACCCGAAACCTTCAAAGGCCAACCGAGGCCGAGGTGGGA
CCTCGAGAAAGACCTCTCGAAGGGCCAACCAGGCGGCAAACCCTGAGGCTTTGTATACTCTCCAACGCGAGTTGGATGATATGCGCCATCGGTTGCGCACAATGGAAGAA
ATGTACGTCGAGGCGACGCGGGCTAACCGAACAGTGTCTCCCTCAAGGGCCCCAGGCGCACCCGGAGAGAGGGAAGGCTGGGTTCCATCTTTCCACTCTGGCGACTGCGA
GCCCGTTCCCAACAATGAGGGGGTGGATTACAGCTTGCGGGATAACGATCTGAGAAAGCACCTCACTGATAAGAAGAAGAGAGCATCTCGGGAGCCGGAAGACTCTCCGT
CCTACTCCCGAGAGTTCTCCAATTCTAACCTCAAGGCTCAATCAAAGTATAAGCCTCTAACACCAGAAGCTATGATCACCAGGGAAGAGTTCAACCTGATGAAGCCCAGG
TTCAACGAGCAGGTCGAGGCGCTCAAGGCCAGGTACGAGAAGAAAGAGTGCTCGTTTGACGATGGCGACTTGGGAGAATCGCCATTCACCTCGGACATCCTGGAGGCCCC
AATTCCTCCAAAGTTCAAAACTCCCACTATGAAACCTTATGATGGGTCTAAAGACCCGAAGGATTATGTTGAAGTCTTCGAGGGCCTCATGGACTTTCAAGCGGCAACAG
ATGCGATAAAATGCCGCGTCTTCCAGATCGCTCTCACCGGCAGCGCGCGCCTGTGGTACCAGAGACTACCGGCCAGTTCGATCTCGACCTACTACCAGTTGAGGAAAGAA
TTCATTAGCCAATTCTCTTCCCGTCATTACGATAGAAAGACAGCGACTCACCTCGCCACCATCAGGCAGAAGGAGGGAGAGACACTAAGAGAATACGTCACGAGGTTTCA
AGAGGAGCAGCTGAAGGTCGCGCACTGCTCCGATGATTCGGCCATGTGCTACTTCCTCACCGGCCTGGCCGACGAGACCCTCACCCTCCTCCGAACCAAAACTTGCCGAC
CTGAAAAGCAAATCGACCAGAAGAAGCTAAGCCAAGACAAGAGGAAGGCCGATTCTAAGTCTAAATACAAGGGATCGTCCTCCTCTGGCAGCAGAACCGAGTATCGTCGG
TCGGAGATCGGCCACAATCGAAGCCAACCTTACGAGCGTTACACTCCTACCACCATCCCCATTTCTGAAATACTTACGAACATCGAGGAAAGCGGGATGGAAAAGCTCAT
CAAGCGACCTGAGAAGCTCCGAGGATACCCAGAAAAGCGTAACAAGGATAAGTATTGCCGTTTTCATCGCGATCACGGCCATAATACGACGAATTGCTGGGAGCTGAAGC
GCCAAATTGAAGATCTCATTCAAGATGGCTATTTCAAAAAGTTCGTAGGAAAGCCGAGGACCAACTCGGTGGAGAAGACAGAAGAGAGGAAGCGTTCAAGGACGCCACCT
CGTCGAGATGACCGACCTGCGGTCATCAACACAATATTCGGGGGCCTTAATGGGGGCCAGTCTGGAAACAAAAGGAAAGAACTAGCTCGCGAGGCCAGGCGCGAGGTATG
CATCATTAGGGAGCAGAAGCCTACTTGCTCCATTACCTTCGGCGATACCGACCTGGAGGAAGTTCATTTGCCTCCTAATGATGCACTTGTGATCACTCCTCTCATTGATC
ACGTCTTGGTCCGAAGAGTACTGGTAGATGGAGGCGCATCTGCCAACATCCTGTCCCTCCCAACATATCTAGCATTGGGGTGGACCAGGTCACAGTTGAAGAGAAGTCCA
ACACCTTTAGTTGGATTCTCTGGAGAATCGGTCTCCCCTGAAGGGTGTATCGACTTGCCGGTTACGATTGGGCAAGATAGTACACAAGTAACTCAGATGGCCGAGTTCAT
GGTTATCGACGGCGGATCGGCCTACAATGCCATCTTCGGGAGACCGATCATTCACTCATTCCGGGTCGTCCCCTCCACACTGCATCAAGTCTTGAAGTACTCAACCCCGA
ATGGAGTGGGCACGGTTCGAGGTGAGCAAAAGACCTCGCGGGAATGTTATGCATCCGCACTTAAAGGGTCGGCAGTATGCGCCCTGGAAGAACAAACAAATCGCGACAAG
CTGCGAGAGTCCGAGGCCGACCTGCCCAAAGAAGGCAAAAGGCAGTTCTCCCCGCCAACAGAAGAGCTCGAGCTTACCGATCTGGCTAGATCGATCCCGGTCGAGATCTT
GGACAGCCCTTCAATCTTGGAGCCAGATATGATGGAGGTTGACACTCCATCACCCTCTTGGATGGACCCAGTCGTGGAGTTCATCAAAGGAAATTCACCGCAAGATCCGA
AGGAGCAAAGGAAGATGGCACGGAGAGCAGCTCGGTTCACACTCCGAGAAGGAGCGTTGTACCGACGTGGCTTCTCCCTGGCTCTGCTTAAGTTTGAGATCGGCATACCA
ACAGACAGAGTAGAGCAGTACGAGCAAGCGAAGAACGAAGAAAAGCTACTCCTTAACCTGAACTTATTGGAAGGAAAAAGGGAAATGGCTCAACTGCGCCTAGCAGAGTA
TCAAAACAGAATGGCCAGACATTACAATGCCCGAGTTCGACCTCAAAGCTTCCAAGTTGTACATTTGGTCTTAAGGAAGATTCAGAGTCATGTGGGCACCCTTGACCCAA
GTTGGGAGGGACCGTTTGAGGTTAAAGGCATAGTCCGGCCCGAAACGTATATGTTGGCCGACCTGGAAGGACAAGTGCTTGCGCATCCATGGAACGCGGAGCACTTGAAG
CGCTATTACCCTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MTISNLPTPIVTPPAVVSGAVFTSPPLNQLLNQITSIKMDRGNFLLWQNLALPILRSYKLFDYLTGDKPCPPTHLVPTDTPTNIEGSTSSQSSPTLNPTYEAWIVVDKLL
LGWLYNSMAADVAMQVMGFSTSRELWTAVQELFGVQSRAEVDYLKQVFQQTCKGSLQMIEYLKLMKSHADNLALAGSSVSVRDLVSQVLTGLDEEYNPIVVAVQGKVNLS
WSEMHAELLTYEKRLEYQNSLKSGIPINQTQTPSVNYVDGRSFQTNQRTNNGNNSHGSNTHRGGGYQRGSFGQRNRGRGPQPTQHKNFTPSNSGPNVFAAHHTSTTVTTP
ETVIDPSWYADSGATSHVTANPNNVEQKVDYSGTENVIVANGNKLSISHIGSTNIHASGGSLKLKDVLRVPDIAKNLDKASGRTLLKGTLKDNLYRLDRSHRSPPATPTL
TAPLFAHTVVSLSNNTLSSEKPTPSFPFAEHINVVVSTTVWHKRLGHPSIQVLDHIIRTCNLPYKTNEPISFCDACPFGKSHALPFHDSHSHATGMFELVYTDLWGPAPH
LSSDGPMHKGHRCLSPTGKVFISRHVQFNETEFSFTSGFGQTKSVTSPPAASVASSIMSSFPMPPPLPLSPPAQSHLSTPISSIPTDLIPTGLAYHYSCPIAVLPTTSPI
SSDLANLSPNPPSGPPSPPPPCLFSSSPPPPAPEQLAISSPTPQIPLTIIDPLAISSPLPPITSSVTEPLNPHLSLRLKFKQNLAVLGFFLVIRSTRVFRSDPETEFELD
SRRTVPANSANTTERRGFNADNGPQRDLDARMVEDQVRAGQEGDLPQRSSRHANQELPPAHPKPSKANRGRGGTSRKTSRRANQAANPEALYTLQRELDDMRHRLRTMEE
MYVEATRANRTVSPSRAPGAPGEREGWVPSFHSGDCEPVPNNEGVDYSLRDNDLRKHLTDKKKRASREPEDSPSYSREFSNSNLKAQSKYKPLTPEAMITREEFNLMKPR
FNEQVEALKARYEKKECSFDDGDLGESPFTSDILEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATDAIKCRVFQIALTGSARLWYQRLPASSISTYYQLRKE
FISQFSSRHYDRKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETLTLLRTKTCRPEKQIDQKKLSQDKRKADSKSKYKGSSSSGSRTEYRR
SEIGHNRSQPYERYTPTTIPISEILTNIEESGMEKLIKRPEKLRGYPEKRNKDKYCRFHRDHGHNTTNCWELKRQIEDLIQDGYFKKFVGKPRTNSVEKTEERKRSRTPP
RRDDRPAVINTIFGGLNGGQSGNKRKELAREARREVCIIREQKPTCSITFGDTDLEEVHLPPNDALVITPLIDHVLVRRVLVDGGASANILSLPTYLALGWTRSQLKRSP
TPLVGFSGESVSPEGCIDLPVTIGQDSTQVTQMAEFMVIDGGSAYNAIFGRPIIHSFRVVPSTLHQVLKYSTPNGVGTVRGEQKTSRECYASALKGSAVCALEEQTNRDK
LRESEADLPKEGKRQFSPPTEELELTDLARSIPVEILDSPSILEPDMMEVDTPSPSWMDPVVEFIKGNSPQDPKEQRKMARRAARFTLREGALYRRGFSLALLKFEIGIP
TDRVEQYEQAKNEEKLLLNLNLLEGKREMAQLRLAEYQNRMARHYNARVRPQSFQVVHLVLRKIQSHVGTLDPSWEGPFEVKGIVRPETYMLADLEGQVLAHPWNAEHLK
RYYP

Moc06g19340 (gene) of Bitter gourd (OHB3-1) v2 genome