CuGenDBv2

Gene ID	Tan0017159
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Integrase catalytic domain-containing protein
Genome location	Contig00117:130783..131853
RNA-Seq Expression	Tan0017159
Synteny	Tan0017159
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAE8645659.1 hypothetical protein Csa_020439 [Cucumis sativus]

8.3e-21

64.63

Show/hide

Query:  LDCYNRMNYHFQGRHPPMQLATMAVVQNQQFASSA-SPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTG
        LDC+NRMNY+FQGRHPP QLA M   QN  F S   S  LTDSGC  H+TSD+N +SLA EYNG+E + VGNGQT PIS++G
Subjt:  LDCYNRMNYHFQGRHPPMQLATMAVVQNQQFASSA-SPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTG

XP_008448007.1 PREDICTED: uncharacterized protein LOC103490319 isoform X2 [Cucumis melo]

2.0e-19

60.98

Show/hide

Query:  LDCYNRMNYHFQGRHPPMQLATMAVVQNQQFASSA-SPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTG
        LDC+NRMNY+FQGRHPP QLA M   QN  F S   S  LTDSGC   +TSD+N +SLA EYNG+E + +GNGQT P+S++G
Subjt:  LDCYNRMNYHFQGRHPPMQLATMAVVQNQQFASSA-SPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTG

XP_008448008.1 PREDICTED: uncharacterized protein LOC103490319 isoform X3 [Cucumis melo]

2.2e-21

57.61

Show/hide

Query:  LDCYNRMNYHFQGRHPPMQLATMAVVQNQQFASSA-SPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTGQMLGSNPIPR
        LDC+NRMNY+FQGRHPP QLA M   QN  F S   S  LTDSGC   +TSD+N +SLA EYNG+E + +GNGQT P+S++GQ+ G   +P+
Subjt:  LDCYNRMNYHFQGRHPPMQLATMAVVQNQQFASSA-SPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTGQMLGSNPIPR

XP_011658579.1 uncharacterized protein LOC105436058 [Cucumis sativus]

8.8e-23

60.87

Show/hide

Query:  LDCYNRMNYHFQGRHPPMQLATMAVVQNQQFASSA-SPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTGQMLGSNPIPR
        LDC+NRMNY+FQGRHPP QLA M   QN  F S   S  LTDSGC  H+TSD+N +SLA EYNG+E + VGNGQT PIS++GQ+ G   +P+
Subjt:  LDCYNRMNYHFQGRHPPMQLATMAVVQNQQFASSA-SPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTGQMLGSNPIPR

XP_022150845.1 uncharacterized protein LOC111018892 [Momordica charantia]

1.4e-20

43.64

Show/hide

Query:  NGCRGVYPNNPTNGGRG-NNGGTRSN--------GSFSNAGNVVLPSQMDESCVKFVIGMV-IQPLDCYNRMNYHFQGRHPPMQLATMAVVQNQQFA---
        N     +PN   + GRG NNG  ++N        G   ++GN     Q D      + G +    LDCYNRMN+HFQGRHPP QLA M  VQN  +    
Subjt:  NGCRGVYPNNPTNGGRG-NNGGTRSN--------GSFSNAGNVVLPSQMDESCVKFVIGMV-IQPLDCYNRMNYHFQGRHPPMQLATMAVVQNQQFA---

Query:  -SSASPWLTDSGCTAHVTSDLNQL---SLASEYNGDELISVGNGQTLPISN--TGQMLGSNPIPR
         SS + WL DS C  H+T+DL+ L   S+AS+YNG+E ISVG+GQ+ PI++   GQ+ GSN +P+
Subjt:  -SSASPWLTDSGCTAHVTSDLNQL---SLASEYNGDELISVGNGQTLPISN--TGQMLGSNPIPR

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BI58 uncharacterized protein LOC103490319 isoform X2

9.8e-20

60.98

Show/hide

Query:  LDCYNRMNYHFQGRHPPMQLATMAVVQNQQFASSA-SPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTG
        LDC+NRMNY+FQGRHPP QLA M   QN  F S   S  LTDSGC   +TSD+N +SLA EYNG+E + +GNGQT P+S++G
Subjt:  LDCYNRMNYHFQGRHPPMQLATMAVVQNQQFASSA-SPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTG

A0A1S3BIR3 uncharacterized protein LOC103490319 isoform X3

1.1e-21

57.61

Show/hide

Query:  LDCYNRMNYHFQGRHPPMQLATMAVVQNQQFASSA-SPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTGQMLGSNPIPR
        LDC+NRMNY+FQGRHPP QLA M   QN  F S   S  LTDSGC   +TSD+N +SLA EYNG+E + +GNGQT P+S++GQ+ G   +P+
Subjt:  LDCYNRMNYHFQGRHPPMQLATMAVVQNQQFASSA-SPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTGQMLGSNPIPR

A0A1S4DWT9 uncharacterized protein LOC103490319 isoform X1

9.8e-20

60.98

Show/hide

Query:  LDCYNRMNYHFQGRHPPMQLATMAVVQNQQFASSA-SPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTG
        LDC+NRMNY+FQGRHPP QLA M   QN  F S   S  LTDSGC   +TSD+N +SLA EYNG+E + +GNGQT P+S++G
Subjt:  LDCYNRMNYHFQGRHPPMQLATMAVVQNQQFASSA-SPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTG

A0A5D3CLI6 T4.5

4.9e-19

60.49

Show/hide

Query:  LDCYNRMNYHFQGRHPPMQLATMAVVQNQQFASSA-SPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNT
        LDC+NRMNY+FQGRHPP QLA M   QN  F S   S  LTDSGC   +TSD+N +SLA EYNG+E + +GNGQT P+S++
Subjt:  LDCYNRMNYHFQGRHPPMQLATMAVVQNQQFASSA-SPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNT

A0A6J1D9L6 uncharacterized protein LOC111018892

6.8e-21

43.64

Show/hide

Query:  NGCRGVYPNNPTNGGRG-NNGGTRSN--------GSFSNAGNVVLPSQMDESCVKFVIGMV-IQPLDCYNRMNYHFQGRHPPMQLATMAVVQNQQFA---
        N     +PN   + GRG NNG  ++N        G   ++GN     Q D      + G +    LDCYNRMN+HFQGRHPP QLA M  VQN  +    
Subjt:  NGCRGVYPNNPTNGGRG-NNGGTRSN--------GSFSNAGNVVLPSQMDESCVKFVIGMV-IQPLDCYNRMNYHFQGRHPPMQLATMAVVQNQQFA---

Query:  -SSASPWLTDSGCTAHVTSDLNQL---SLASEYNGDELISVGNGQTLPISN--TGQMLGSNPIPR
         SS + WL DS C  H+T+DL+ L   S+AS+YNG+E ISVG+GQ+ PI++   GQ+ GSN +P+
Subjt:  -SSASPWLTDSGCTAHVTSDLNQL---SLASEYNGDELISVGNGQTLPISN--TGQMLGSNPIPR

SwissProt top hits

e value

%identity

Alignment

Q94HW2 Retrovirus-related Pol polyprotein from transposon RE1

9.2e-07

52.08

Show/hide

Query:  SASPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTG
        S++ WL DSG T H+TSD N LSL   Y G + + V +G T+PIS+TG
Subjt:  SASPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTG

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTAACAATCCCACAACAATCTCAATACTCTCGAGGACGAGGTAATGGTGGTGGTCGATCTCGCTTTCAGGGTTGTGGTAATACCAATCGATGTGGTAGTAATGGATG
CAGAGGGGTATACCCGAATAATCCTACAAATGGTGGTCGTGGAAATAATGGGGGAACTCGATCAAATGGATCTTTCTCAAATGCTGGAAATGTTGTTCTACCCAGTCAGA
TGGACGAATCATGTGTCAAATTTGTAATAGGTATGGTCATTCAACCCCTGGATTGTTATAATAGAATGAATTATCATTTTCAAGGCAGGCATCCTCCTATGCAACTTGCT
ACTATGGCAGTAGTTCAAAACCAACAATTTGCCTCTTCTGCATCTCCTTGGCTCACTGATTCAGGCTGCACTGCGCATGTTACGTCTGATTTGAATCAACTTTCGTTAGC
CTCGGAATATAATGGTGATGAACTAATATCAGTAGGAAATGGCCAAACTCTTCCCATATCTAATACAGGACAAATGCTCGGGTCAAATCCTATACCAAGGACCTACTGTA
AATGGTCTTTACCCCATTCCCAGGCGGCCTACAGCCTTCACCAACCCTACTACACAACGTTTTGCTCATGTCAACAAGGTGTCTTTATCCTCTTTCAGGCAGAATCAGTT
AGGACATCCTAA

mRNA sequence

Show/hide mRNA sequence

TCTCGAAAATCAGAACTAGCGTGAAGAATATGTTCTTCCGCAATCTGCGCAATGGTAACAATCCCACAACAATCTCAATACTCTCGAGGACGAGGTAATGGTGGTGGTCG
ATCTCGCTTTCAGGGTTGTGGTAATACCAATCGATGTGGTAGTAATGGATGCAGAGGGGTATACCCGAATAATCCTACAAATGGTGGTCGTGGAAATAATGGGGGAACTC
GATCAAATGGATCTTTCTCAAATGCTGGAAATGTTGTTCTACCCAGTCAGATGGACGAATCATGTGTCAAATTTGTAATAGGTATGGTCATTCAACCCCTGGATTGTTAT
AATAGAATGAATTATCATTTTCAAGGCAGGCATCCTCCTATGCAACTTGCTACTATGGCAGTAGTTCAAAACCAACAATTTGCCTCTTCTGCATCTCCTTGGCTCACTGA
TTCAGGCTGCACTGCGCATGTTACGTCTGATTTGAATCAACTTTCGTTAGCCTCGGAATATAATGGTGATGAACTAATATCAGTAGGAAATGGCCAAACTCTTCCCATAT
CTAATACAGGACAAATGCTCGGGTCAAATCCTATACCAAGGACCTACTGTAAATGGTCTTTACCCCATTCCCAGGCGGCCTACAGCCTTCACCAACCCTACTACACAACG
TTTTGCTCATGTCAACAAGGTGTCTTTATCCTCTTTCAGGCAGAATCAGTTAGGACATCCTAACCCTGTTATTCTTTTGTCAATCCTCTTATGTTTGTGAACACTATTTA
CATGGTAAAATGCATAAACTCTCCTTCCCACATTCTTCTACTACTTCCCTGTATCCGCTAGAAATTTTGCATTCTGATATATGGGGCCCTGCCCCTGAAACTTCTGTTAA
TGGCCATAAATACTATGTTGCTTTTGTTGATGATATGTC

Protein sequence

Show/hide protein sequence

MVTIPQQSQYSRGRGNGGGRSRFQGCGNTNRCGSNGCRGVYPNNPTNGGRGNNGGTRSNGSFSNAGNVVLPSQMDESCVKFVIGMVIQPLDCYNRMNYHFQGRHPPMQLA
TMAVVQNQQFASSASPWLTDSGCTAHVTSDLNQLSLASEYNGDELISVGNGQTLPISNTGQMLGSNPIPRTYCKWSLPHSQAAYSLHQPYYTTFCSCQQGVFILFQAESV
RTS

Tan0017159 (gene) of Snake gourd v1 genome