CuGenDBv2

Gene ID	Tan0013219
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Transmembrane protein
Genome location	LG11:5586763..5595314
RNA-Seq Expression	Tan0013219
Synteny	Tan0013219
Gene Ontology terms	GO:0010190 - cytochrome b6f complex assembly (biological process) GO:0009507 - chloroplast (cellular component) GO:0016020 - membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KGN51853.2 hypothetical protein Csa_008870 [Cucumis sativus]

8.9e-71

65.53

Show/hide

Query:  KSLSRAATLSKTGNSPFLFLTQSFYSPPFH-SKNLLISFLFFFFLTYFQLNFIFPLSLFLQPLIKKENKVSKMEENPSRATRRRRFAVDDGADLIDCSGK
        ++L    T S + +   L L QS Y  P   S+NL+ +F FF               L ++   ++  ++ KM+E+PS+ATRRRRFAVDDGADLIDCSGK
Subjt:  KSLSRAATLSKTGNSPFLFLTQSFYSPPFH-SKNLLISFLFFFFLTYFQLNFIFPLSLFLQPLIKKENKVSKMEENPSRATRRRRFAVDDGADLIDCSGK

Query:  HCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRA---RKKRKLIRRKGEPDGATAAAETSGGPTGEEGMPEISPGSGEEEEEMGNFSA
        HCRSCTAGLVADCVAVCCCPCSVVSFLALAL+KLPWM+GRRCLQ+A   RKKRKL+ R+GE DGAT AAET G    E+G+PE+SPGSGEE+E  GNFSA
Subjt:  HCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRA---RKKRKLIRRKGEPDGATAAAETSGGPTGEEGMPEISPGSGEEEEEMGNFSA

Query:  RFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN
        RFEAERIWLQLYQVGQLGFGRVSFTGN+NLWPNSN
Subjt:  RFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN

XP_008458773.1 PREDICTED: uncharacterized protein LOC103498078 [Cucumis melo]

1.3e-69

85.89

Show/hide

Query:  MEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRA---RKKRKLIRRKGEPDGATAAAETS
        M+E+PSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALAL+KLPWM+GRRCLQ+A   RKKRKL+RR+GE DGAT AAET 
Subjt:  MEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRA---RKKRKLIRRKGEPDGATAAAETS

Query:  GGPTGEEGMPEISPGSGEEEEEMGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN
        G    E+G+PEISPGSGEE+E  GNFSARFEAERIWLQLYQVGQLGFGRVSFTGN+NLWPNSN
Subjt:  GGPTGEEGMPEISPGSGEEEEEMGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN

XP_011655414.1 uncharacterized protein LOC105435525 [Cucumis sativus]

4.1e-68

84.05

Show/hide

Query:  MEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRA---RKKRKLIRRKGEPDGATAAAETS
        M+E+PS+ATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALAL+KLPWM+GRRCLQ+A   RKKRKL+ R+GE DGAT AAET 
Subjt:  MEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRA---RKKRKLIRRKGEPDGATAAAETS

Query:  GGPTGEEGMPEISPGSGEEEEEMGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN
        G    E+G+PE+SPGSGEE+E  GNFSARFEAERIWLQLYQVGQLGFGRVSFTGN+NLWPNSN
Subjt:  GGPTGEEGMPEISPGSGEEEEEMGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN

XP_023536558.1 uncharacterized protein LOC111797691 [Cucurbita pepo subsp. pepo]

1.1e-68

84.66

Show/hide

Query:  MEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRARKKRKLIRRKGEPDGATAAAETSGGP
        MEE+PS  TRRRRF VDDG DLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALAL+KLPWM+GRRCLQRARKKRKLIRRK E DGA AA+ET  GP
Subjt:  MEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRARKKRKLIRRKGEPDGATAAAETSGGP

Query:  TGEEGMPEISPGSG---EEEEEMGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN
          EE +PEI PGSG   EEEEE+GNFSARFEAERIWLQLYQ+GQLGFGRVSFTGN+N WPNSN
Subjt:  TGEEGMPEISPGSG---EEEEEMGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN

XP_038891069.1 uncharacterized protein LOC120080480 [Benincasa hispida]

4.0e-71

88.34

Show/hide

Query:  MEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRA---RKKRKLIRRKGEPDGATAAAETS
        M+E+PSR TRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWM+GRRCLQRA   RKKRKLIRR+GE DGAT AAET 
Subjt:  MEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRA---RKKRKLIRRKGEPDGATAAAETS

Query:  GGPTGEEGMPEISPGSGEEEEEMGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN
        G    EEG+PEISPGSGEEEE +GNFSARFEAERIWLQLYQVGQLGFGRVSFTGN+NLWPNSN
Subjt:  GGPTGEEGMPEISPGSGEEEEEMGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KR58 Uncharacterized protein

4.3e-71

65.53

Show/hide

Query:  KSLSRAATLSKTGNSPFLFLTQSFYSPPFH-SKNLLISFLFFFFLTYFQLNFIFPLSLFLQPLIKKENKVSKMEENPSRATRRRRFAVDDGADLIDCSGK
        ++L    T S + +   L L QS Y  P   S+NL+ +F FF               L ++   ++  ++ KM+E+PS+ATRRRRFAVDDGADLIDCSGK
Subjt:  KSLSRAATLSKTGNSPFLFLTQSFYSPPFH-SKNLLISFLFFFFLTYFQLNFIFPLSLFLQPLIKKENKVSKMEENPSRATRRRRFAVDDGADLIDCSGK

Query:  HCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRA---RKKRKLIRRKGEPDGATAAAETSGGPTGEEGMPEISPGSGEEEEEMGNFSA
        HCRSCTAGLVADCVAVCCCPCSVVSFLALAL+KLPWM+GRRCLQ+A   RKKRKL+ R+GE DGAT AAET G    E+G+PE+SPGSGEE+E  GNFSA
Subjt:  HCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRA---RKKRKLIRRKGEPDGATAAAETSGGPTGEEGMPEISPGSGEEEEEMGNFSA

Query:  RFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN
        RFEAERIWLQLYQVGQLGFGRVSFTGN+NLWPNSN
Subjt:  RFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN

A0A1S3C8M3 uncharacterized protein LOC103498078

6.2e-70

85.89

Show/hide

Query:  MEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRA---RKKRKLIRRKGEPDGATAAAETS
        M+E+PSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALAL+KLPWM+GRRCLQ+A   RKKRKL+RR+GE DGAT AAET 
Subjt:  MEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRA---RKKRKLIRRKGEPDGATAAAETS

Query:  GGPTGEEGMPEISPGSGEEEEEMGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN
        G    E+G+PEISPGSGEE+E  GNFSARFEAERIWLQLYQVGQLGFGRVSFTGN+NLWPNSN
Subjt:  GGPTGEEGMPEISPGSGEEEEEMGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN

A0A5A7T2E5 Uncharacterized protein

6.2e-70

85.89

Show/hide

Query:  MEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRA---RKKRKLIRRKGEPDGATAAAETS
        M+E+PSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALAL+KLPWM+GRRCLQ+A   RKKRKL+RR+GE DGAT AAET 
Subjt:  MEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRA---RKKRKLIRRKGEPDGATAAAETS

Query:  GGPTGEEGMPEISPGSGEEEEEMGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN
        G    E+G+PEISPGSGEE+E  GNFSARFEAERIWLQLYQVGQLGFGRVSFTGN+NLWPNSN
Subjt:  GGPTGEEGMPEISPGSGEEEEEMGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN

A0A6J1HEE2 uncharacterized protein LOC111463206

1.3e-67

83.54

Show/hide

Query:  MEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRARKKRKLIRRKGEPDGATAAAETSGGP
        MEE+PS  TRRRRF VDDG DLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALAL+KLPWM+GRRCLQRARKKRKLIRRK E DGA AA+ET+ G 
Subjt:  MEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRARKKRKLIRRKGEPDGATAAAETSGGP

Query:  TGEEGMPEISPGSGEEEEE----MGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN
          EEG+PEI PGS EEEEE    +GNFSARFEAERIWLQLYQ+GQLGFGRVSFTGN+N WPNSN
Subjt:  TGEEGMPEISPGSGEEEEE----MGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN

A0A6J1JH40 uncharacterized protein LOC111486958

4.5e-68

81.66

Show/hide

Query:  MEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRARKKRKLIRRKGEPDGATAAAETSGGP
        MEE+PS  TRRRRF VDDG DLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALAL+KLPWM+GRRCLQRARKKRKLIRRK E DGA AA+ET  GP
Subjt:  MEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRARKKRKLIRRKGEPDGATAAAETSGGP

Query:  TGEEGMPEISPGSGEEEEE---------MGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN
          EEG+PEI PGS EEEEE         +GNFSARFEAERIWLQLYQ+GQLGFGRVSFTGN+N WPNSN
Subjt:  TGEEGMPEISPGSGEEEEE---------MGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT3G01516.1 unknown protein

1.3e-24

38.62

Show/hide

Query:  KKENKVSKMEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQR---ARKKRKLIRRK-----
        +K ++VS+ +++ S  ++       D      CSGK CRS  A  +ADCVA+CCCPC+VV+   LA +K+PWM+GR+C+ R   ++K+ K I R+     
Subjt:  KKENKVSKMEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQR---ARKKRKLIRRK-----

Query:  ----------------------GEPDGATAAAETSGGPTGEEGMPEISPGSGEEEEEMGNFSARFEAERIWLQLYQVGQLGFGRVSFTG
                              GE D      E  G  T EE     +  +  +EEE    SAR EAER+WL+LYQ+G LGFGRVSFTG
Subjt:  ----------------------GEPDGATAAAETSGGPTGEEGMPEISPGSGEEEEEMGNFSARFEAERIWLQLYQVGQLGFGRVSFTG

AT3G11690.1 unknown protein

2.0e-04

32.29

Show/hide

Query:  IKKENKVSKM-EENPSRATRRR---RFAVDDGADLIDCSGKHCRSCTAGLVADCVAV-CCCPCSVVSFLALALIKLPWMLGRRCLQRARKKRKLIR
        I ++ K S     +PSR+ RR+   + ++   +    C G        G  A C AV CCCPC +V+ L LA+ K+P  + RR + R+R++++L++
Subjt:  IKKENKVSKM-EENPSRATRRR---RFAVDDGADLIDCSGKHCRSCTAGLVADCVAV-CCCPCSVVSFLALALIKLPWMLGRRCLQRARKKRKLIR

AT5G06380.1 unknown protein

4.5e-04

30.43

Show/hide

Query:  GKHCRSCTAGLVADCVAVC-CCPCSVVSFLALALIKLPWMLGRRCLQRARKKRKLIRRKGEPDGATAAAETSGGPTGEEGMPEISPGSGEEEEEMGNFSA
        G     C  G  A C A+C C PCSVV+ + LA+ KLP  L RR ++R R+K     R  + +   +  E   G + +  +  +     EEEEE  + + 
Subjt:  GKHCRSCTAGLVADCVAVC-CCPCSVVSFLALALIKLPWMLGRRCLQRARKKRKLIRRKGEPDGATAAAETSGGPTGEEGMPEISPGSGEEEEEMGNFSA

Query:  RFEAERIWLQLYQVG
            + +W + Y  G
Subjt:  RFEAERIWLQLYQVG

AT5G14690.1 unknown protein

1.9e-26

36.74

Show/hide

Query:  MEENPSRATRR-------RRFAVDD-----------GADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCL---QRARKKRK
        MEENP R +RR       +  AVD+             D + CS K CRS  A  +ADCVA+CCCPC++++ L L L+K+PWM+GRRCL    R +KKR+
Subjt:  MEENPSRATRR-------RRFAVDD-----------GADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCL---QRARKKRK

Query:  LIRRK-------------------------------------------GEPDGATAAAETSGGPTGEEGMPEISPGSGEEEEEMGNFSARFEAERIWLQL
        +I R+                                           G+ D      E  G  T EE   E +     E+ +    SAR EAER+WL+L
Subjt:  LIRRK-------------------------------------------GEPDGATAAAETSGGPTGEEGMPEISPGSGEEEEEMGNFSARFEAERIWLQL

Query:  YQVGQLGFGRVSFTG
        YQ+G LGFGRVSFTG
Subjt:  YQVGQLGFGRVSFTG

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGAATTTCGGAAGCAGTTCCCAATATTCGCTGTCACTCACTCCCCATCGGTACTCATGAATATCAACCCTCTTCCTTCTTCTTCTTTCCCTCTCCTCTTTTTTCTTT
TTTCTTTTCTTTTTTAATTCTCTCTCTCTCTCTCTCTCTCTCTCTCTTCGTCAGTTTTTTAATTCCGTTTATTCAAAACGGCTTATTTTGTAAATCTCTGTCACGCGCTG
CCACGCTTTCTAAAACTGGTAACTCTCCTTTTCTTTTTCTCACCCAATCCTTCTATTCACCCCCTTTTCACTCGAAAAATCTACTCATTTCCTTCCTTTTTTTTTTTTTT
TTAACTTATTTTCAACTAAATTTCATTTTCCCCTTGTCTTTGTTCTTGCAGCCTCTAATCAAGAAAGAAAATAAAGTCTCAAAAATGGAAGAAAACCCATCTCGAGCCAC
ACGGCGGCGGAGATTCGCCGTGGACGACGGCGCCGATCTAATCGACTGCTCCGGCAAGCATTGCCGGTCGTGCACCGCCGGGCTGGTGGCCGATTGCGTCGCCGTCTGCT
GCTGCCCGTGCTCCGTGGTCAGCTTCTTGGCTCTGGCCCTCATCAAACTGCCGTGGATGCTCGGCCGGCGGTGTCTGCAGCGGGCGAGGAAGAAGAGGAAATTGATTCGC
CGGAAAGGGGAACCCGATGGCGCCACGGCGGCGGCCGAAACTAGTGGGGGTCCAACGGGAGAGGAGGGAATGCCGGAAATTTCGCCGGGGTCCGGCGAGGAAGAAGAAGA
GATGGGGAATTTCAGTGCGAGATTTGAAGCAGAGAGAATTTGGTTGCAATTGTATCAGGTGGGTCAGTTGGGTTTTGGAAGAGTTTCATTCACTGGGAATACAAATCTAT
GGCCCAACTCCAATTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MGISEAVPNIRCHSLPIGTHEYQPSSFFFFPSPLFSFFFSFLILSLSLSLSLFVSFLIPFIQNGLFCKSLSRAATLSKTGNSPFLFLTQSFYSPPFHSKNLLISFLFFFF
LTYFQLNFIFPLSLFLQPLIKKENKVSKMEENPSRATRRRRFAVDDGADLIDCSGKHCRSCTAGLVADCVAVCCCPCSVVSFLALALIKLPWMLGRRCLQRARKKRKLIR
RKGEPDGATAAAETSGGPTGEEGMPEISPGSGEEEEEMGNFSARFEAERIWLQLYQVGQLGFGRVSFTGNTNLWPNSN

Tan0013219 (gene) of Snake gourd v1 genome