CuGenDBv2

Gene ID	MS017965
Organism	Momordica charantia cv. TR (Bitter gourd (TR) v1)
Description	mucin-2-like isoform X1
Genome location	scaffold373:4200568..4202130
RNA-Seq Expression	MS017965
Synteny	MS017965
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_008437498.1 PREDICTED: mucin-2-like isoform X1 [Cucumis melo]

9.6e-123

71.12

Show/hide

Query:  MNNSSENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPS
        MNN + +K+RWMM LH KGRKERDNEDLHLFREL+KRDKERTA LLL   D+LEHN+ GNSPFYRI SI+KESG   L E NKND+DWLKTPPATPLFPS
Subjt:  MNNSSENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPS

Query:  LEMEATA-THMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPT
        LEMEATA    N  ++TPL+QPLSQPQSQASSN E+TKKS+G+EK+   K K+PSR  T SHRPRINSS + KNTKRTT P+PNP+ R +Q  +   D T
Subjt:  LEMEATA-THMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPT

Query:  IKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTK----ATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNP
        IKRN     NN+K  N KE+ T+YLTSNLSKGS+N+ K      PNPRSRTTSPIVRSTIA+QI +FSNETPPNLRTDRSSSVTRGRQ G  +++E  NP
Subjt:  IKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTK----ATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNP

Query:  RRQSCSPSPSVTRGRRVE-AKQEINRGGNLGNDQRRTESTNILGSRMVERVMNSRKGNGIEERDSNSRGRNGIG
        RRQSC  SPSVTRGR+VE AKQE NRGGNL NDQRRTESTNILGSRMVERVMN+RKG G E+RDS    R+GIG
Subjt:  RRQSCSPSPSVTRGRRVE-AKQEINRGGNLGNDQRRTESTNILGSRMVERVMNSRKGNGIEERDSNSRGRNGIG

XP_008437499.1 PREDICTED: mucin-2-like isoform X2 [Cucumis melo]

9.6e-123

71.12

Show/hide

Query:  MNNSSENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPS
        MNN + +K+RWMM LH KGRKERDNEDLHLFREL+KRDKERTA LLL   D+LEHN+ GNSPFYRI SI+KESG   L E NKND+DWLKTPPATPLFPS
Subjt:  MNNSSENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPS

Query:  LEMEATA-THMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPT
        LEMEATA    N  ++TPL+QPLSQPQSQASSN E+TKKS+G+EK+   K K+PSR  T SHRPRINSS + KNTKRTT P+PNP+ R +Q  +   D T
Subjt:  LEMEATA-THMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPT

Query:  IKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTK----ATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNP
        IKRN     NN+K  N KE+ T+YLTSNLSKGS+N+ K      PNPRSRTTSPIVRSTIA+QI +FSNETPPNLRTDRSSSVTRGRQ G  +++E  NP
Subjt:  IKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTK----ATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNP

Query:  RRQSCSPSPSVTRGRRVE-AKQEINRGGNLGNDQRRTESTNILGSRMVERVMNSRKGNGIEERDSNSRGRNGIG
        RRQSC  SPSVTRGR+VE AKQE NRGGNL NDQRRTESTNILGSRMVERVMN+RKG G E+RDS    R+GIG
Subjt:  RRQSCSPSPSVTRGRRVE-AKQEINRGGNLGNDQRRTESTNILGSRMVERVMNSRKGNGIEERDSNSRGRNGIG

XP_022928960.1 putative uncharacterized protein DDB_G0282133 isoform X1 [Cucurbita moschata]

2.8e-122

Show/hide

Query:  NKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPSLEMEAT
        +K+RWMM LHLKGRKE DNEDLHLFRELHKR KERTAC LLPV D LEH+N GNS FYRIQ IRKES FELLSEGNKND+DWLKTPPATPLFPSLEMEA 
Subjt:  NKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPSLEMEAT

Query:  ATHMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPTIKRNVII
        A HM  QK+T  +Q LSQPQSQAS+N E+TK+SNG+EK+ TT P+IPSR IT S++PRINSSTE KNT+R T    NPN R +QA   STDPTIKR    
Subjt:  ATHMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPTIKRNVII

Query:  NSNNIKSINPKENCTNYLTSNLSKGSSNTTKATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEA--MNPRRQSCSPSP
        N+N  KS N KE+ T+YLTSNLSK  +  +   PNPRSRTTSPIVRSTIA+QI DFSNETPPNLRTDRSSSVTRGRQVGT Q+ E   +N RRQSC  SP
Subjt:  NSNNIKSINPKENCTNYLTSNLSKGSSNTTKATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEA--MNPRRQSCSPSP

Query:  SVTRGRRVEAKQEINRGGNLGNDQRRTESTNILGSRMVERVMNSRKGN
        SVTRGR+VE KQEINRGGNL NDQRRTESTNI+GSRMVERVMN+RKGN
Subjt:  SVTRGRRVEAKQEINRGGNLGNDQRRTESTNILGSRMVERVMNSRKGN

XP_023520514.1 putative uncharacterized protein DDB_G0282133 isoform X1 [Cucurbita pepo subsp. pepo]

5.6e-123

Show/hide

Query:  NKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEH-NNGNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPSLEMEAT
        +K+RWMM LHLKGRKE DNEDLHLFRELHKR KERTAC LLPV D LEH N GNS FYRIQSIRKES FELLSEGNKND+DWLKTPPATPLFPSLEMEA 
Subjt:  NKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEH-NNGNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPSLEMEAT

Query:  ATHMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPTIKRNVII
        A HM  QK+T  +Q LSQPQSQAS+N E+TK+SNG+EK+ TT P+IPSR IT S++PRINSSTE KNT+R T    NPN R +QA   STDPTIKR    
Subjt:  ATHMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPTIKRNVII

Query:  NSNNIKSINPKENCTNYLTSNLSKGSSNTTKATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEA--MNPRRQSCSPSP
        N+N  KS N KE+CT+YLTSNLSK  +  +   PNPRSRTTSPIVRSTIA+QI +FSNETPPNLRTDRSSSVTRGRQVG  Q+ EA  +N RRQSC  SP
Subjt:  NSNNIKSINPKENCTNYLTSNLSKGSSNTTKATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEA--MNPRRQSCSPSP

Query:  SVTRGRRVEAKQEINRGGNLGNDQRRTESTNILGSRMVERVMNSRKGN
        SVTRGR+VE K+EINRGGNL NDQRRTESTNI+GSRMVERVMN+RKGN
Subjt:  SVTRGRRVEAKQEINRGGNLGNDQRRTESTNILGSRMVERVMNSRKGN

XP_031740890.1 serine/arginine repetitive matrix protein 1 isoform X3 [Cucumis sativus]

1.8e-124

72.8

Show/hide

Query:  MNNSSENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPS
        MNN + +K+RWMM LH KGRKERDNEDLHLFREL+KRDKERTAC LLPV D+LEHN+ GNSPFYRI SI+KESGF  L EGNKND+DWLKTPPATPLFPS
Subjt:  MNNSSENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPS

Query:  LEMEATA-THMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPT
        LEMEATA +H N QK+TPLVQPLSQPQSQASSN E+TKKS+G+EK+  TK KIPSR IT S+RPRINSS + KNTKRTT P+PNPN R +Q  +   D T
Subjt:  LEMEATA-THMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPT

Query:  IKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTK----ATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNP
        +KRN     NNIK  N KE+ T+YLTSNL KGS+N+ K      PNPRSR TSPIVRSTIA+QI +FSNETPPNLRTDRSSSVTRGRQ    +++EA NP
Subjt:  IKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTK----ATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNP

Query:  RRQSCSPSPSVTRGRRVE-AKQEINRGGNL-GNDQRRTESTNILGSRMVERVMNSRKGNGIEERDSNSRGRNGIG
        RRQSC  SPSVTRGR+VE AKQE NRGGNL  NDQRRTE+TNILGSRMVERVMN+RK  G EERD     R GIG
Subjt:  RRQSCSPSPSVTRGRRVE-AKQEINRGGNL-GNDQRRTESTNILGSRMVERVMNSRKGNGIEERDSNSRGRNGIG

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KJQ3 Uncharacterized protein

8.5e-125

72.8

Show/hide

Query:  MNNSSENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPS
        MNN + +K+RWMM LH KGRKERDNEDLHLFREL+KRDKERTAC LLPV D+LEHN+ GNSPFYRI SI+KESGF  L EGNKND+DWLKTPPATPLFPS
Subjt:  MNNSSENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPS

Query:  LEMEATA-THMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPT
        LEMEATA +H N QK+TPLVQPLSQPQSQASSN E+TKKS+G+EK+  TK KIPSR IT S+RPRINSS + KNTKRTT P+PNPN R +Q  +   D T
Subjt:  LEMEATA-THMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPT

Query:  IKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTK----ATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNP
        +KRN     NNIK  N KE+ T+YLTSNL KGS+N+ K      PNPRSR TSPIVRSTIA+QI +FSNETPPNLRTDRSSSVTRGRQ    +++EA NP
Subjt:  IKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTK----ATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNP

Query:  RRQSCSPSPSVTRGRRVE-AKQEINRGGNL-GNDQRRTESTNILGSRMVERVMNSRKGNGIEERDSNSRGRNGIG
        RRQSC  SPSVTRGR+VE AKQE NRGGNL  NDQRRTE+TNILGSRMVERVMN+RK  G EERD     R GIG
Subjt:  RRQSCSPSPSVTRGRRVE-AKQEINRGGNL-GNDQRRTESTNILGSRMVERVMNSRKGNGIEERDSNSRGRNGIG

A0A1S3AUR3 mucin-2-like isoform X2

4.6e-123

71.12

Show/hide

Query:  MNNSSENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPS
        MNN + +K+RWMM LH KGRKERDNEDLHLFREL+KRDKERTA LLL   D+LEHN+ GNSPFYRI SI+KESG   L E NKND+DWLKTPPATPLFPS
Subjt:  MNNSSENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPS

Query:  LEMEATA-THMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPT
        LEMEATA    N  ++TPL+QPLSQPQSQASSN E+TKKS+G+EK+   K K+PSR  T SHRPRINSS + KNTKRTT P+PNP+ R +Q  +   D T
Subjt:  LEMEATA-THMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPT

Query:  IKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTK----ATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNP
        IKRN     NN+K  N KE+ T+YLTSNLSKGS+N+ K      PNPRSRTTSPIVRSTIA+QI +FSNETPPNLRTDRSSSVTRGRQ G  +++E  NP
Subjt:  IKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTK----ATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNP

Query:  RRQSCSPSPSVTRGRRVE-AKQEINRGGNLGNDQRRTESTNILGSRMVERVMNSRKGNGIEERDSNSRGRNGIG
        RRQSC  SPSVTRGR+VE AKQE NRGGNL NDQRRTESTNILGSRMVERVMN+RKG G E+RDS    R+GIG
Subjt:  RRQSCSPSPSVTRGRRVE-AKQEINRGGNLGNDQRRTESTNILGSRMVERVMNSRKGNGIEERDSNSRGRNGIG

A0A1S3AUS5 mucin-2-like isoform X1

4.6e-123

71.12

Show/hide

Query:  MNNSSENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPS
        MNN + +K+RWMM LH KGRKERDNEDLHLFREL+KRDKERTA LLL   D+LEHN+ GNSPFYRI SI+KESG   L E NKND+DWLKTPPATPLFPS
Subjt:  MNNSSENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPS

Query:  LEMEATA-THMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPT
        LEMEATA    N  ++TPL+QPLSQPQSQASSN E+TKKS+G+EK+   K K+PSR  T SHRPRINSS + KNTKRTT P+PNP+ R +Q  +   D T
Subjt:  LEMEATA-THMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPT

Query:  IKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTK----ATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNP
        IKRN     NN+K  N KE+ T+YLTSNLSKGS+N+ K      PNPRSRTTSPIVRSTIA+QI +FSNETPPNLRTDRSSSVTRGRQ G  +++E  NP
Subjt:  IKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTK----ATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNP

Query:  RRQSCSPSPSVTRGRRVE-AKQEINRGGNLGNDQRRTESTNILGSRMVERVMNSRKGNGIEERDSNSRGRNGIG
        RRQSC  SPSVTRGR+VE AKQE NRGGNL NDQRRTESTNILGSRMVERVMN+RKG G E+RDS    R+GIG
Subjt:  RRQSCSPSPSVTRGRRVE-AKQEINRGGNLGNDQRRTESTNILGSRMVERVMNSRKGNGIEERDSNSRGRNGIG

A0A5D3C2G1 Mucin-2-like isoform X1

4.6e-123

71.12

Show/hide

Query:  MNNSSENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPS
        MNN + +K+RWMM LH KGRKERDNEDLHLFREL+KRDKERTA LLL   D+LEHN+ GNSPFYRI SI+KESG   L E NKND+DWLKTPPATPLFPS
Subjt:  MNNSSENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPS

Query:  LEMEATA-THMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPT
        LEMEATA    N  ++TPL+QPLSQPQSQASSN E+TKKS+G+EK+   K K+PSR  T SHRPRINSS + KNTKRTT P+PNP+ R +Q  +   D T
Subjt:  LEMEATA-THMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPT

Query:  IKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTK----ATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNP
        IKRN     NN+K  N KE+ T+YLTSNLSKGS+N+ K      PNPRSRTTSPIVRSTIA+QI +FSNETPPNLRTDRSSSVTRGRQ G  +++E  NP
Subjt:  IKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTK----ATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNP

Query:  RRQSCSPSPSVTRGRRVE-AKQEINRGGNLGNDQRRTESTNILGSRMVERVMNSRKGNGIEERDSNSRGRNGIG
        RRQSC  SPSVTRGR+VE AKQE NRGGNL NDQRRTESTNILGSRMVERVMN+RKG G E+RDS    R+GIG
Subjt:  RRQSCSPSPSVTRGRRVE-AKQEINRGGNLGNDQRRTESTNILGSRMVERVMNSRKGNGIEERDSNSRGRNGIG

A0A6J1ESX0 Uncharacterized protein

1.4e-122

Show/hide

Query:  NKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPSLEMEAT
        +K+RWMM LHLKGRKE DNEDLHLFRELHKR KERTAC LLPV D LEH+N GNS FYRIQ IRKES FELLSEGNKND+DWLKTPPATPLFPSLEMEA 
Subjt:  NKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNN-GNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPSLEMEAT

Query:  ATHMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPTIKRNVII
        A HM  QK+T  +Q LSQPQSQAS+N E+TK+SNG+EK+ TT P+IPSR IT S++PRINSSTE KNT+R T    NPN R +QA   STDPTIKR    
Subjt:  ATHMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPTIKRNVII

Query:  NSNNIKSINPKENCTNYLTSNLSKGSSNTTKATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEA--MNPRRQSCSPSP
        N+N  KS N KE+ T+YLTSNLSK  +  +   PNPRSRTTSPIVRSTIA+QI DFSNETPPNLRTDRSSSVTRGRQVGT Q+ E   +N RRQSC  SP
Subjt:  NSNNIKSINPKENCTNYLTSNLSKGSSNTTKATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEA--MNPRRQSCSPSP

Query:  SVTRGRRVEAKQEINRGGNLGNDQRRTESTNILGSRMVERVMNSRKGN
        SVTRGR+VE KQEINRGGNL NDQRRTESTNI+GSRMVERVMN+RKGN
Subjt:  SVTRGRRVEAKQEINRGGNLGNDQRRTESTNILGSRMVERVMNSRKGN

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G27850.1 unknown protein

2.0e-09

32.09

Show/hide

Query:  NEDLHLFRELHKRDKERTACLLLPVSDELEHNNGNSPFYRIQ---SIRKESGFELLSEGNKNDFDWLKTPPATPLFPSLEMEATATHMNFQKDTPLVQPL
        ++DL LF E+  +DKER +  LL  SD+LE        +  +    ++ ES   L +EG+KND+DWL TPP TPLFPSL+ +  A           V   
Subjt:  NEDLHLFRELHKRDKERTACLLLPVSDELEHNNGNSPFYRIQ---SIRKESGFELLSEGNKNDFDWLKTPPATPLFPSLEMEATATHMNFQKDTPLVQPL

Query:  SQPQSQAS-SNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPTIKRNVIINSNNIKSINPKENCT
         +PQSQ S S   T +KS    K   +    P+R  TS   PR ++  + +  + ++   P+P      A  + +   ++R   I+    K   P     
Subjt:  SQPQSQAS-SNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPTIKRNVIINSNNIKSINPKENCT

Query:  NYLTSNLSKGSSNTTKATPNPR-------SRTTSPIVRSTI-ATQISDFSNETPPNLRT---DRSSSVTRGRQVGTGQRTEAMNPR-RQSCSPSPS
           +  +S GS  TT A+P  R       SR  SP  +  +  + I  FS + PPNLRT   DR +S  RG    +    +A++ R R+S SPS S
Subjt:  NYLTSNLSKGSSNTTKATPNPR-------SRTTSPIVRSTI-ATQISDFSNETPPNLRT---DRSSSVTRGRQVGTGQRTEAMNPR-RQSCSPSPS

AT2G40070.1 BEST Arabidopsis thaliana protein match is: proline-rich family protein (TAIR:AT3G09000.1)

1.2e-14

29.61

Show/hide

Query:  ENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELE----HNNGNSPFYRIQS----IRKESGFELL-SEGNKNDFDWLKTPPATPL
        ++  R    L      E+D E+L LF E+ +R+KE+   LL    DE E      +G SP + I S     RK +  + L SEG+KND++WL TPP TPL
Subjt:  ENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELE----HNNGNSPFYRIQS----IRKESGFELL-SEGNKNDFDWLKTPPATPL

Query:  FPSLEMEATATHMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKI-----PSRFITSSHRP---------RINSSTESKNTKRTTTPTPN
        FPSLEME+  T M+   D+   +P +     A+S+ E+  +++   + QT+ P +      SR  +SS  P         R ++ T +  + R +TPT  
Subjt:  FPSLEMEATATHMNFQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKI-----PSRFITSSHRP---------RINSSTESKNTKRTTTPTPN

Query:  PNL----RTNQAHEKST-DPTIKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTKATPNPR------SRTTSPIVRSTIATQISDFSNETPPNLRT
          +    R +  + +ST   T K   +  S ++ S       +   TS  ++ + + T++TP+        SR+T+P+ RST  +         PP+   
Subjt:  PNL----RTNQAHEKST-DPTIKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTKATPNPR------SRTTSPIVRSTIATQISDFSNETPPNLRT

Query:  DRSSSVTRGRQVGTGQRTEAMNPRRQSCSPS
         RSS+ TR         T   NP      PS
Subjt:  DRSSSVTRGRQVGTGQRTEAMNPRRQSCSPS

AT2G40070.2 FUNCTIONS IN: molecular_function unknown

1.1e-12

29.37

Show/hide

Query:  LHKRDKERTACLLLPVSDELE----HNNGNSPFYRIQS----IRKESGFELL-SEGNKNDFDWLKTPPATPLFPSLEMEATATHMNFQKDTPLVQPLSQP
        + +R+KE+   LL    DE E      +G SP + I S     RK +  + L SEG+KND++WL TPP TPLFPSLEME+  T M+   D+   +P +  
Subjt:  LHKRDKERTACLLLPVSDELE----HNNGNSPFYRIQS----IRKESGFELL-SEGNKNDFDWLKTPPATPLFPSLEMEATATHMNFQKDTPLVQPLSQP

Query:  QSQASSNPETTKKSNGMEKTQTTKPKI-----PSRFITSSHRP---------RINSSTESKNTKRTTTPTPNPNL----RTNQAHEKST-DPTIKRNVII
           A+S+ E+  +++   + QT+ P +      SR  +SS  P         R ++ T +  + R +TPT    +    R +  + +ST   T K   + 
Subjt:  QSQASSNPETTKKSNGMEKTQTTKPKI-----PSRFITSSHRP---------RINSSTESKNTKRTTTPTPNPNL----RTNQAHEKST-DPTIKRNVII

Query:  NSNNIKSINPKENCTNYLTSNLSKGSSNTTKATPNPR------SRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNPRRQSC
         S ++ S       +   TS  ++ + + T++TP+        SR+T+P+ RST  +         PP+    RSS+ TR         T   NP     
Subjt:  NSNNIKSINPKENCTNYLTSNLSKGSSNTTKATPNPR------SRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNPRRQSC

Query:  SPS
         PS
Subjt:  SPS

AT3G09000.1 proline-rich family protein

9.0e-10

26.61

Show/hide

Query:  NEDLHLFRELHKRDKERTACLLLPVSDELEHN----------------NGNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPSLEMEATATH
        +E+L LF E+ +R+KE  A  LL  SD +  N                  +S  Y ++    E+   L SE  K+D+DWL TPP TP F   E E+  + 
Subjt:  NEDLHLFRELHKRDKERTACLLLPVSDELEHN----------------NGNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPSLEMEATATH

Query:  MNFQKDTPLVQPL------------------SQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQA
        MN Q D P  +P                   ++PQ+ +SS     + S+      T++P  P+R  T+         T   +  R++TPT    L   +A
Subjt:  MNFQKDTPLVQPL------------------SQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQA

Query:  HEKSTDPTIKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTKATPNPRSRT-TSPIVRSTIA----------------------------------
           +T     R    +S + +S  P    +N   S+ S     +  ATP  R  T T P + S+ A                                  
Subjt:  HEKSTDPTIKRNVIINSNNIKSINPKENCTNYLTSNLSKGSSNTTKATPNPRSRT-TSPIVRSTIA----------------------------------

Query:  --TQISDFSNETPPNLRT---DRSSSVTRGR---QVGTGQRTEAM------------NPRRQSCSPSPSVTRGRRVEAKQEINRGGNLGNDQRRTESTN-
           ++  FS E PPNLRT   DR  S +RGR       G R+ ++            N RRQSCSPS    RGR        N  G+L   + R +++N 
Subjt:  --TQISDFSNETPPNLRT---DRSSSVTRGR---QVGTGQRTEAM------------NPRRQSCSPSPSVTRGRRVEAKQEINRGGNLGNDQRRTESTN-

Query:  ----------ILGSRMVERVMNSRK--GNGIEERDSNSRGRNGIGIGDLGF
                   +G++MVERV+N RK     + E      G++      LG+
Subjt:  ----------ILGSRMVERVMNSRK--GNGIEERDSNSRGRNGIGIGDLGF

AT5G01280.1 BEST Arabidopsis thaliana protein match is: proline-rich family protein (TAIR:AT3G09000.1)

5.1e-05

28.5

Show/hide

Query:  IRKESGFELL-SEGNKNDFDWLKTPPATP-----------------LFPSL--------EMEATATHMNFQKDTPLVQPLSQPQSQASSNPET-TKKSNG
        +R+ +G  LL S+G K+D++WL TPP +P                 L   L        E + T+ H +    + + +P S   S+++S P T T+KS  
Subjt:  IRKESGFELL-SEGNKNDFDWLKTPPATP-----------------LFPSL--------EMEATATHMNFQKDTPLVQPLSQPQSQASSNPET-TKKSNG

Query:  MEK----------TQTTKPKIPSRFITSS----HRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPTIKRNVIINSNNIKSINPKENCTNYLTSN
          K          + TT+  + S   TSS     RP  +S T +     T      P   T+Q    S   T   N  +++ N K      + T     +
Subjt:  MEK----------TQTTKPKIPSRFITSS----HRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPTIKRNVIINSNNIKSINPKENCTNYLTSN

Query:  LSKGSSNTTKATP-NPRSR-----TTSPIVRST--IATQISDFSNETPPNLRT---DR----SSSVTRGRQVGTGQR---TEAMNPRRQSCSPSPSVTRG
           GSS   ++ P  P S+       SPIVRS      ++  FS E P NLRT   DR    SSS TR     +  R   TE    +RQSCSPS S    
Subjt:  LSKGSSNTTKATP-NPRSR-----TTSPIVRST--IATQISDFSNETPPNLRT---DR----SSSVTRGRQVGTGQR---TEAMNPRRQSCSPSPSVTRG

Query:  RRVEAKQEINRG--GNLGNDQRRTESTNILGSRMVERVMNSRK----------------GNGIEERDSNSRGRNGIGIG
          V       RG      ND  R  S    G++ VE+V+N RK                G G      +S G  G G G
Subjt:  RRVEAKQEINRG--GNLGNDQRRTESTNILGSRMVERVMNSRK----------------GNGIEERDSNSRGRNGIGIG

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAACAATAGCAGTGAAAACAAAAGCAGATGGATGATGAGCCTGCATTTAAAGGGTCGAAAGGAAAGAGACAATGAAGATCTCCATCTGTTCCGGGAACTGCATAAGCG
CGACAAGGAACGCACTGCCTGCCTTCTTCTGCCTGTCTCCGATGAGCTTGAGCACAACAATGGGAATTCTCCTTTCTACAGGATTCAATCGATCAGGAAAGAATCTGGAT
TTGAACTTCTCTCTGAGGGCAATAAAAACGATTTTGATTGGCTTAAAACACCACCTGCAACTCCTCTGTTTCCATCTTTGGAAATGGAAGCCACTGCTACTCATATGAAT
TTCCAGAAAGATACACCACTTGTTCAACCTCTCTCACAGCCACAGTCACAGGCTTCAAGCAATCCAGAAACAACAAAGAAAAGCAATGGAATGGAGAAAACTCAGACTAC
AAAACCAAAAATACCATCCAGGTTCATCACTTCCAGTCATAGACCGCGCATCAATTCATCAACTGAATCCAAAAACACCAAAAGAACCACTACCCCAACTCCAAATCCAA
ACCTAAGAACCAATCAGGCTCATGAAAAATCAACCGATCCCACGATCAAAAGAAACGTCATCATCAACAGCAACAACATCAAATCCATAAATCCGAAAGAAAACTGTACG
AATTACCTAACCTCAAACCTCTCCAAAGGATCGTCGAATACCACCAAAGCAACTCCGAATCCGAGAAGCAGAACGACATCCCCAATTGTGAGATCGACAATAGCAACTCA
AATTTCAGATTTTTCCAACGAAACGCCGCCGAATCTGAGGACCGATCGGTCGAGCTCGGTGACGAGAGGGCGGCAGGTGGGAACCGGGCAGAGAACAGAGGCGATGAATC
CCAGAAGGCAATCGTGCTCGCCGTCGCCGAGCGTGACGAGGGGGCGGAGGGTGGAAGCGAAGCAGGAGATCAACAGAGGCGGAAATTTGGGGAATGATCAGAGAAGAACG
GAATCGACGAACATTCTTGGGAGTCGAATGGTGGAGAGAGTGATGAATTCGAGAAAGGGAAATGGAATTGAGGAGAGAGATTCGAATTCACGGGGACGAAATGGAATTGG
AATTGGGGATTTAGGGTTC

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MNNSSENKSRWMMSLHLKGRKERDNEDLHLFRELHKRDKERTACLLLPVSDELEHNNGNSPFYRIQSIRKESGFELLSEGNKNDFDWLKTPPATPLFPSLEMEATATHMN
FQKDTPLVQPLSQPQSQASSNPETTKKSNGMEKTQTTKPKIPSRFITSSHRPRINSSTESKNTKRTTTPTPNPNLRTNQAHEKSTDPTIKRNVIINSNNIKSINPKENCT
NYLTSNLSKGSSNTTKATPNPRSRTTSPIVRSTIATQISDFSNETPPNLRTDRSSSVTRGRQVGTGQRTEAMNPRRQSCSPSPSVTRGRRVEAKQEINRGGNLGNDQRRT
ESTNILGSRMVERVMNSRKGNGIEERDSNSRGRNGIGIGDLGF

MS017965 (gene) of Bitter gourd (TR) v1 genome