CuGenDBv2

Gene ID	Tan0018053
Organism	Trichosanthes anguina (Snake gourd v1)
Description	UPF0587 protein C1orf123 homolog
Genome location	LG02:77471166..77475225
RNA-Seq Expression	Tan0018053
Synteny	Tan0018053
Gene Ontology terms	GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR008584 - CXXC motif containing zinc binding protein, eukaryotic

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6585732.1 CXXC motif containing zinc binding protein, partial [Cucurbita argyrosperma subsp. sororia]

2.8e-90

95.78

Show/hide

Query:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
        MVNFLLKIKAELENLTNLQPQDGCDDPNF YLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
Subjt:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS

Query:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK
        SPLMLFDCRGYEPV F+FGPGWKAESIEGTKFEDIDLSGGE+AEYDEKG CPVMISNLEATF+ VK
Subjt:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK

XP_008444495.1 PREDICTED: UPF0587 protein C1orf123 homolog [Cucumis melo]

7.1e-86

90.36

Show/hide

Query:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
        MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGE+SQKETCVTL+ETIPLQAGKGTTNLVQKCKFCGR+GTITMIPGRG+PLTQE SESG  
Subjt:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS

Query:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK
        SPLMLFDCRGYEP+ FVFGPGWK ESIEGTKFEDIDL+GGEFAEYDEKG CPVMISNL+A F+L+K
Subjt:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK

XP_022132352.1 UPF0587 protein C1orf123 [Momordica charantia]

4.2e-86

89.76

Show/hide

Query:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
        MVNFLLKI AELENLTNLQPQDGCDDPNF YLFK+KCGRCGE+SQKETC+TLNET+ L  GKGTTNLVQKCKFCGRDGT+TMIPGRG+PLTQETSESGKS
Subjt:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS

Query:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK
        SPLMLFDCRGYEP+DF+FGPGWKAESIEGTKFEDIDLS GEFAEYDEKG CPVMIS L+ATFDLVK
Subjt:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK

XP_022952030.1 UPF0587 protein C1orf123 homolog [Cucurbita moschata]

2.8e-90

95.78

Show/hide

Query:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
        MVNFLLKIKAELENLTNLQPQDGCDDPNF YLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
Subjt:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS

Query:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK
        SPLMLFDCRGYEPV F+FGPGWKAESIEGTKFEDIDLSGGE+AEYDEKG CPVMISNLEATF+ VK
Subjt:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK

XP_038884333.1 CXXC motif containing zinc binding protein isoform X1 [Benincasa hispida]

1.8e-89

95.18

Show/hide

Query:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
        MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGE+SQKETCVTLNETIPLQAGKGTTNLVQKCKFCGR+GTITMIPGRGQPLTQETSE GKS
Subjt:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS

Query:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK
        SPLMLFDCRGYEP+DFVFGPGWKAESIEGTKFEDIDLS GEFAEYDEKG CPVMIS LEATF+LVK
Subjt:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BAF1 UPF0587 protein C1orf123 homolog

3.5e-86

90.36

Show/hide

Query:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
        MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGE+SQKETCVTL+ETIPLQAGKGTTNLVQKCKFCGR+GTITMIPGRG+PLTQE SESG  
Subjt:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS

Query:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK
        SPLMLFDCRGYEP+ FVFGPGWK ESIEGTKFEDIDL+GGEFAEYDEKG CPVMISNL+A F+L+K
Subjt:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK

A0A5A7V299 UPF0587 protein C1orf123-like protein

3.5e-86

90.36

Show/hide

Query:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
        MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGE+SQKETCVTL+ETIPLQAGKGTTNLVQKCKFCGR+GTITMIPGRG+PLTQE SESG  
Subjt:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS

Query:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK
        SPLMLFDCRGYEP+ FVFGPGWK ESIEGTKFEDIDL+GGEFAEYDEKG CPVMISNL+A F+L+K
Subjt:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK

A0A6J1BTL8 UPF0587 protein C1orf123

2.0e-86

89.76

Show/hide

Query:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
        MVNFLLKI AELENLTNLQPQDGCDDPNF YLFK+KCGRCGE+SQKETC+TLNET+ L  GKGTTNLVQKCKFCGRDGT+TMIPGRG+PLTQETSESGKS
Subjt:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS

Query:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK
        SPLMLFDCRGYEP+DF+FGPGWKAESIEGTKFEDIDLS GEFAEYDEKG CPVMIS L+ATFDLVK
Subjt:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK

A0A6J1GKL1 UPF0587 protein C1orf123 homolog

1.4e-90

95.78

Show/hide

Query:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
        MVNFLLKIKAELENLTNLQPQDGCDDPNF YLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
Subjt:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS

Query:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK
        SPLMLFDCRGYEPV F+FGPGWKAESIEGTKFEDIDLSGGE+AEYDEKG CPVMISNLEATF+ VK
Subjt:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK

A0A6J1KKK0 UPF0587 protein C1orf123 homolog

1.4e-90

95.78

Show/hide

Query:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
        MVNFLLKIKAELENLTNLQPQDGCDDPNF YLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
Subjt:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS

Query:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK
        SPLMLFDCRGYEPV F+FGPGWKAESIEGTKFEDIDLSGGE+AEYDEKG CPVMISNLEATF+ VK
Subjt:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK

SwissProt top hits

e value

%identity

Alignment

Q32P66 CXXC motif containing zinc binding protein

1.7e-26

39.51

Show/hide

Query:  LKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKSSPLML
        L++KA LEN+TNL+P       +F +  K+KCG CGE+S+K   + L +++ L+ G+G+ ++VQKCK C R+ +I ++    +    E +E  K+  ++ 
Subjt:  LKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKSSPLML

Query:  FDCRGYEPVDFVFGPGWKAESIE-GTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK
        F+CRG EPVDF    G+ AE +E GT F DI+L   ++ +YDEK    V I   E T   VK
Subjt:  FDCRGYEPVDFVFGPGWKAESIE-GTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK

Q3B8G0 CXXC motif containing zinc binding protein

1.7e-29

40.49

Show/hide

Query:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
        MV F L+ KA LENLT L+P       +F +  K+KCG CGE+S K   +TL +++PL+ G+G+ ++VQ+CK C R+ +I ++     P   E SE+ K+
Subjt:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS

Query:  SPLMLFDCRGYEPVDFVFGPGWKAESIE-GTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATF
          ++ F+CRG EP+DF    G+ AE  E GT F +I+L   ++ +YDEK    V I  +E  F
Subjt:  SPLMLFDCRGYEPVDFVFGPGWKAESIE-GTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATF

Q498R7 CXXC motif containing zinc binding protein

2.3e-26

38.92

Show/hide

Query:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
        M    L++KA LEN+TNL+P       +F +  K+KCG CGE+S+K   + L +++ L+ G+G+ ++VQKCK C R+ +I ++    +    E +E  K+
Subjt:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS

Query:  SPLMLFDCRGYEPVDFVFGPGWKAESIE-GTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK
          ++ F+CRG EPVDF    G+ AE +E GT F DI+L   ++ +YDEK    V I   E T   VK
Subjt:  SPLMLFDCRGYEPVDFVFGPGWKAESIE-GTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK

Q8BHG2 CXXC motif containing zinc binding protein

3.0e-26

38.32

Show/hide

Query:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
        M    L++KA LEN+TNL+P       +F +  K+KCG CGE+S+K   + L +++ L+ G+G+ ++VQKCK C R+ +I ++    +    E +E  K+
Subjt:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS

Query:  SPLMLFDCRGYEPVDFVFGPGWKAESIE-GTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK
          ++ F+CRG EPVDF    G+ A+ +E GT F DI+L   ++ +YDEK    V I   E T   VK
Subjt:  SPLMLFDCRGYEPVDFVFGPGWKAESIE-GTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK

Q9NWV4 CXXC motif containing zinc binding protein

1.6e-27

39.52

Show/hide

Query:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
        M    L++KA LEN+TNL+P       +F +  K+KCG CGE+S K   + L +++ L+ G+G+ ++VQKCK C R+ +I ++    +P   E +E+ K+
Subjt:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS

Query:  SPLMLFDCRGYEPVDFVFGPGWKAESIE-GTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK
          ++ F+CRG EPVDF    G+ AE +E GT F DI+L   ++ +YDEK    V I   E T   VK
Subjt:  SPLMLFDCRGYEPVDFVFGPGWKAESIE-GTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK

Arabidopsis top hits

e value

%identity

Alignment

AT4G32930.1 unknown protein

5.5e-68

68.26

Show/hide

Query:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS
        MVN++LKI A+LENLTNLQP  GCDD NF YLFK+KC RCGE++ KETCVTLNET     G+GT +LVQKCKFCGR+G +TMIPG+G+PLT E SE+G+ 
Subjt:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKS

Query:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGG-EFAEYDEKGGCPVMISNLEATFDLVK
        +PLM+FDCRGYEP+DF FG  WKA++  GTKF++IDLS G EF EYDEKG CPVMISN  A+F + K
Subjt:  SPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGG-EFAEYDEKGGCPVMISNLEATFDLVK

AT4G32930.2 unknown protein

8.7e-66

65.14

Show/hide

Query:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQK--------CKFCGRDGTITMIPGRGQPLTQ
        MVN++LKI A+LENLTNLQP  GCDD NF YLFK+KC RCGE++ KETCVTLNET     G+GT +LVQK        CKFCGR+G +TMIPG+G+PLT 
Subjt:  MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQK--------CKFCGRDGTITMIPGRGQPLTQ

Query:  ETSESGKSSPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGG-EFAEYDEKGGCPVMISNLEATFDLVK
        E SE+G+ +PLM+FDCRGYEP+DF FG  WKA++  GTKF++IDLS G EF EYDEKG CPVMISN  A+F + K
Subjt:  ETSESGKSSPLMLFDCRGYEPVDFVFGPGWKAESIEGTKFEDIDLSGG-EFAEYDEKGGCPVMISNLEATFDLVK

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTGAACTTCTTGCTTAAGATCAAAGCGGAGCTCGAGAACCTCACGAATCTTCAGCCCCAGGATGGTTGCGACGATCCCAACTTCACTTACCTTTTCAAAGTGAAATG
CGGGAGATGCGGGGAGTTGAGCCAGAAAGAAACGTGTGTGACCTTGAATGAAACTATTCCTCTCCAAGCGGGTAAAGGGACTACTAATCTTGTTCAAAAGTGCAAGTTCT
GTGGGAGGGACGGAACTATTACAATGATTCCGGGGCGAGGTCAACCATTGACTCAGGAAACAAGTGAATCAGGGAAGTCATCTCCCTTGATGTTATTTGACTGCAGAGGT
TATGAGCCTGTGGACTTCGTATTTGGACCTGGATGGAAAGCAGAATCTATTGAGGGGACCAAATTTGAGGATATTGACTTGTCTGGAGGTGAGTTTGCAGAGTATGATGA
GAAGGGAGGATGCCCTGTCATGATTTCCAATCTAGAGGCCACATTTGACTTGGTAAAGTAA

mRNA sequence

Show/hide mRNA sequence

ATGGATTTGACTGAGCTTCGTAGACCCGCACCGAAACCAGAGCCCATGGACCTCTAAATCCAAAATTCGACGCCTTGTTGAAGTGGAAGTGTGATTGATTGAGCAAAACC
GCTCAAAAAATGGTGAACTTCTTGCTTAAGATCAAAGCGGAGCTCGAGAACCTCACGAATCTTCAGCCCCAGGATGGTTGCGACGATCCCAACTTCACTTACCTTTTCAA
AGTGAAATGCGGGAGATGCGGGGAGTTGAGCCAGAAAGAAACGTGTGTGACCTTGAATGAAACTATTCCTCTCCAAGCGGGTAAAGGGACTACTAATCTTGTTCAAAAGT
GCAAGTTCTGTGGGAGGGACGGAACTATTACAATGATTCCGGGGCGAGGTCAACCATTGACTCAGGAAACAAGTGAATCAGGGAAGTCATCTCCCTTGATGTTATTTGAC
TGCAGAGGTTATGAGCCTGTGGACTTCGTATTTGGACCTGGATGGAAAGCAGAATCTATTGAGGGGACCAAATTTGAGGATATTGACTTGTCTGGAGGTGAGTTTGCAGA
GTATGATGAGAAGGGAGGATGCCCTGTCATGATTTCCAATCTAGAGGCCACATTTGACTTGGTAAAGTAAGAGAGTAATCCCCACCTTAGATCTCTCATTGTAAAAAAAT
TGACCATATTGAATGGCCGTGGTGTTATTGATGGTCACCCAGTCTATACTTTTATGCATCAGTTCTCTTCATCTTTCTGTATTATGAAATATGAATTAAGTTTGAGGAGT
TGAATGAATGGTCATTATTTGTTTTCTTTTGTTGGTAGTTCTTTTTCCTTTTCCTTTTCTGGTATGGATACTCCTTCCATGATCAATATCTTAAAAAAAAAAAAAAAAGA
GATGTAGGGTTTACTAACATTAAACAAAATATTTATAGAGACAAAATGGACTTATGGTATTCTCCTAGTACTCAGAATTTTTTTTCCTACAAATTTCGTGTTTTTTCGTA
GAGATGTTTACCACTTATTGTTATCCACTTTTTTTCATGTGTTTTAAAAAACCAACCCAAATTTTGAAAACTAATTGTTTTTAGAATTTAGTTAAACATTCCCATGTTTT
TTTAAAAAAGTAAAAGGCATGGTAGTGAATTGTAGAGAATAGTCCAATTTTTTTGATTGGTTTTTTACAATGGGTTAAAAAGGCATAACTAATTAGAACTATTTTGGATT
TTCAGCATGTTGTCCTCAATAATATCCTTACTTAAAAGCGTCCGTTTAACTGGTGAGAATTTTACTACGTGGAAATCCAACCTGAATATGATTATGGTTGTTGATGACTT
ACAGTTTGTATTGACGGAGGAATGTTCTCAGGTCCCTACTCGAAACGCTCCTCAATCTGTTAAGGAAGCGTACGACCGCTGGATCAAGGCCAATGATAAGGCCAAGGTCT
ACATTTTGGCTAGTGTTTCTGAAGTTCTGGCCAAAAAGCACGAGGGCATGGTCTCAGCTCGTGAGATCATGAGTTCGTTGCAGGAAATGTTTGGACAACCGTCTCGACAG
ATTCAACACGAATCTCTCAAATACGTTTATAATTCCCGTATGAAGGAGGGTTCATCGGTGAGAGAACACATTCTTGATCTGATGGTCCACTTCAACGTGGTTGAGATGAA
TGAAGCGGTCATTGACGAGCAAAGTCAGGTATCGTTCATCCTGAAATTTCTTCCGAAGAGTTTCCTGCAATTTCGCAGCAATGAGGTGATGAACAAGATAGAGTATAACC
TGACTACTTTACTTAATGAACTACAGACTTTCCAGTCTCTTATGAAGAATAAGGGCGGCAATGATGGAGAGCAAATCTGTTTGCCCATTCCGAGAAGGTTCCGAGAAGGT
TCATCCTCCGGGACTAAGTCCTCAGAGCTCATCTCTCTGGGCTTAAGAAGACCC

Protein sequence

Show/hide protein sequence

MVNFLLKIKAELENLTNLQPQDGCDDPNFTYLFKVKCGRCGELSQKETCVTLNETIPLQAGKGTTNLVQKCKFCGRDGTITMIPGRGQPLTQETSESGKSSPLMLFDCRG
YEPVDFVFGPGWKAESIEGTKFEDIDLSGGEFAEYDEKGGCPVMISNLEATFDLVK

Tan0018053 (gene) of Snake gourd v1 genome