CuGenDBv2

Gene ID	Tan0015213
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Ileal sodium/bile acid cotransporter, putative
Genome location	LG11:15837569..15840392
RNA-Seq Expression	Tan0015213
Synteny	Tan0015213
Gene Ontology terms	GO:0016020 - membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0050244.1 putative Ileal sodium/bile acid cotransporter [Cucumis melo var. makuwa]

1.2e-35

56.98

Show/hide

Query:  MAST-TQEASLEMNE-YSFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLF
        MA T   E SL+MNE YSFITA+  RN GISS  WG   + ASDCLPIYI+MQRP P  SP        G T +S  FQAIL LF+  P S P L  L+ 
Subjt:  MAST-TQEASLEMNE-YSFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLF

Query:  RTAVLISFAVSFAGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK
         T +L +F  SF GV LQ  FP++A LL+ FGAL AAIGVCI+ S L+H NL WI WLACG  L AFI SFK
Subjt:  RTAVLISFAVSFAGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK

KAA0050246.1 putative Ileal sodium/bile acid cotransporter [Cucumis melo var. makuwa]

7.9e-40

63.75

Show/hide

Query:  MNE-YSFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLFRTAVLISFAVSF
        MNE YSFITAINERN  I+S             LPI I MQRP P+ S  + +  N+GKTIL LTFQA+LALFI  P SSP L T LF  AVLISFAVSF
Subjt:  MNE-YSFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLFRTAVLISFAVSF

Query:  AGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK
        AG+FLQN FPR+ALL EK GAL AAIGVCI++SLL+HQN AWI WLA G  L+AF++SF+
Subjt:  AGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK

KGN49803.1 hypothetical protein Csa_004681 [Cucumis sativus]

4.8e-37

57.89

Show/hide

Query:  MASTTQEASLEMNE-YSFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLFR
        M S++Q+ S++MN  YS IT+INERN  I+              LPI I MQ   P+ S  + +  N+G TIL LTFQA+LALFI   TSSP L T LF 
Subjt:  MASTTQEASLEMNE-YSFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLFR

Query:  TAVLISFAVSFAGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK
         AVLISFAVSF GVFLQ+ FPR+ALL EK GAL AAIGVCI++SLL+HQN AWI WLACG  L+AF++SF+
Subjt:  TAVLISFAVSFAGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK

KGN49806.1 hypothetical protein Csa_004683 [Cucumis sativus]

2.0e-35

56.65

Show/hide

Query:  MAST-TQEASLEMNEY-SFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGF-PTSSPSLPTLL
        MA T   E SL+MN+  S I A+  RN GISS  WG     ASDCLPIYI+MQRP P  SP        G T LSLTFQAI+ LF+   P+SS  LP+ L
Subjt:  MAST-TQEASLEMNEY-SFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGF-PTSSPSLPTLL

Query:  FRTAVLISFAVSFAGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK
        F   +L SF  S+ GV LQ  FP+ A LL+ FGALFAAIG CII SLL++ N  WICWLA G  L AFIISFK
Subjt:  FRTAVLISFAVSFAGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK

XP_022146444.1 uncharacterized protein LOC111015658 [Momordica charantia]

1.3e-37

72.09

Show/hide

Query:  MASTTQEASLEMNEY-SFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLFR
        MAST Q+ S++MN   SFITAINERN GISS  WG G ST SDCLPI IRMQRP     PPA S Q+LGKTIL LTFQA+LALFI  P+S P LPTLLF 
Subjt:  MASTTQEASLEMNEY-SFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLFR

Query:  TAVLISFAVSFAGVFLQNAFPRMALLLEK
         AVLISFAVSFAG+FLQ A+PRMALL EK
Subjt:  TAVLISFAVSFAGVFLQNAFPRMALLLEK

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KJN8 Uncharacterized protein

2.3e-37

57.89

Show/hide

Query:  MASTTQEASLEMNE-YSFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLFR
        M S++Q+ S++MN  YS IT+INERN  I+              LPI I MQ   P+ S  + +  N+G TIL LTFQA+LALFI   TSSP L T LF 
Subjt:  MASTTQEASLEMNE-YSFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLFR

Query:  TAVLISFAVSFAGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK
         AVLISFAVSF GVFLQ+ FPR+ALL EK GAL AAIGVCI++SLL+HQN AWI WLACG  L+AF++SF+
Subjt:  TAVLISFAVSFAGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK

A0A0A0KQ03 Uncharacterized protein

9.8e-36

56.65

Show/hide

Query:  MAST-TQEASLEMNEY-SFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGF-PTSSPSLPTLL
        MA T   E SL+MN+  S I A+  RN GISS  WG     ASDCLPIYI+MQRP P  SP        G T LSLTFQAI+ LF+   P+SS  LP+ L
Subjt:  MAST-TQEASLEMNEY-SFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGF-PTSSPSLPTLL

Query:  FRTAVLISFAVSFAGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK
        F   +L SF  S+ GV LQ  FP+ A LL+ FGALFAAIG CII SLL++ N  WICWLA G  L AFIISFK
Subjt:  FRTAVLISFAVSFAGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK

A0A5A7U7U1 Putative Ileal sodium/bile acid cotransporter

3.8e-40

63.75

Show/hide

Query:  MNE-YSFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLFRTAVLISFAVSF
        MNE YSFITAINERN  I+S             LPI I MQRP P+ S  + +  N+GKTIL LTFQA+LALFI  P SSP L T LF  AVLISFAVSF
Subjt:  MNE-YSFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLFRTAVLISFAVSF

Query:  AGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK
        AG+FLQN FPR+ALL EK GAL AAIGVCI++SLL+HQN AWI WLA G  L+AF++SF+
Subjt:  AGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK

A0A5D3BEH8 Putative Ileal sodium/bile acid cotransporter

5.7e-36

56.98

Show/hide

Query:  MAST-TQEASLEMNE-YSFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLF
        MA T   E SL+MNE YSFITA+  RN GISS  WG   + ASDCLPIYI+MQRP P  SP        G T +S  FQAIL LF+  P S P L  L+ 
Subjt:  MAST-TQEASLEMNE-YSFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLF

Query:  RTAVLISFAVSFAGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK
         T +L +F  SF GV LQ  FP++A LL+ FGAL AAIGVCI+ S L+H NL WI WLACG  L AFI SFK
Subjt:  RTAVLISFAVSFAGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK

A0A6J1CY58 uncharacterized protein LOC111015658

6.1e-38

72.09

Show/hide

Query:  MASTTQEASLEMNEY-SFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLFR
        MAST Q+ S++MN   SFITAINERN GISS  WG G ST SDCLPI IRMQRP     PPA S Q+LGKTIL LTFQA+LALFI  P+S P LPTLLF 
Subjt:  MASTTQEASLEMNEY-SFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLFR

Query:  TAVLISFAVSFAGVFLQNAFPRMALLLEK
         AVLISFAVSFAG+FLQ A+PRMALL EK
Subjt:  TAVLISFAVSFAGVFLQNAFPRMALLLEK

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCATCAACCACACAAGAAGCCTCCTTGGAGATGAATGAATATTCCTTCATCACTGCAATCAATGAAAGAAATACTGGAATTAGCAGTCTTATCTGGGGATGGGGAGT
ATCCACAGCATCAGATTGCCTCCCAATTTACATCAGAATGCAGAGGCCTAAGCCTTCACCTTCACCACCAGCCAACAGCCTTCAGAATCTGGGGAAGACAATCCTTAGTC
TTACTTTCCAGGCAATTTTAGCCCTGTTCATCGGTTTTCCCACTTCATCTCCTTCACTTCCTACACTTCTCTTTAGGACTGCTGTGTTGATTAGCTTTGCAGTTTCGTTT
GCTGGAGTTTTCCTTCAAAATGCATTCCCGAGAATGGCGCTGTTGTTGGAAAAGTTTGGTGCTCTTTTTGCTGCAATTGGTGTCTGCATAATATCAAGTCTTCTAGTGCA
TCAAAACCTCGCTTGGATCTGTTGGCTGGCATGTGGCTCCTGCTTGCTAGCCTTTATTATCTCATTCAAGTGA

mRNA sequence

Show/hide mRNA sequence

ATTTTAAAAATAGATGATTCTTTGGACATACATGTCATTTTACATTGTCTAATTACCAATTAGGGACGGAGTTCATACCAATGAAAGAGCAGTGGGTCATATGATTATTG
TACGAAAAAGAAGCAATAGTAAAAGAGAGAGAACTTGACTCAAAAAGTGAACACAATTTCTACGAAATTTAATCAAAAAACTTGTAGGAGAATCACTGAAACTTCTCTCT
CTGTATTCTAGAATACTCCAATGCAATATAAAAAGGAAACTGCAAGACAGAATCGATCCAAGGGAAACCACTTGAAGAGTATTGACCAAATCTTTTTTGTTCCCTCATGG
CATCAACCACACAAGAAGCCTCCTTGGAGATGAATGAATATTCCTTCATCACTGCAATCAATGAAAGAAATACTGGAATTAGCAGTCTTATCTGGGGATGGGGAGTATCC
ACAGCATCAGATTGCCTCCCAATTTACATCAGAATGCAGAGGCCTAAGCCTTCACCTTCACCACCAGCCAACAGCCTTCAGAATCTGGGGAAGACAATCCTTAGTCTTAC
TTTCCAGGCAATTTTAGCCCTGTTCATCGGTTTTCCCACTTCATCTCCTTCACTTCCTACACTTCTCTTTAGGACTGCTGTGTTGATTAGCTTTGCAGTTTCGTTTGCTG
GAGTTTTCCTTCAAAATGCATTCCCGAGAATGGCGCTGTTGTTGGAAAAGTTTGGTGCTCTTTTTGCTGCAATTGGTGTCTGCATAATATCAAGTCTTCTAGTGCATCAA
AACCTCGCTTGGATCTGTTGGCTGGCATGTGGCTCCTGCTTGCTAGCCTTTATTATCTCATTCAAGTGATTTTGACAGAAGATGCATCCAATGTCCGAAGAGGACAGAAG
GAGCACTTTTGTAGAATCCATGCCCATATGTTTGTTTGACTTCTTTTACAATCTCTGAATCTTGACCTGGTGTGGTTCATCACCAAGACAATATCAGCTCCAATTTCCCT
GAAAATCATGTTATTCTACAACTTACAATGACATGATAACTCTGCCTGTGTCATGCAGTAGGCATCATTTCTTCTACGCAGCCGGTCCCAAGCCCGGAACAAAGGAGGAG
GGTAGTGTCATCAGACCATTGGATCTTGAGCTTGTTCTAAAAGACAGAGGCTGAAAGTATAGCTAGCAGTATTTTCATCTTAGTAGTAATAAAGATGGCTGCATCGTGAA
AGATGAGCTCTCTCTATGGTGCATACAGACGAACCACATATTTCTGAAGCTTAGTCATCCCCTAAGGTATAAGTATAACTAAAATCTTGTCAAAATATATGTTTTGAGTC
GTGCAATTAATAGTGGAATGGGCATGCTATGTTATTAGAATGTTAGAAAATATCAATAGACTATGTTGTGGTTCAGATTACATGGGTCCTAAAAAAACACACACATACAC
ACACGGGAACTACAACAACAACTACGGCCACAATTGAAATCAACGTTTTCAAGAACACAGTCCAAAAAAAGAAAGATTAGCAAACAAAAGCCATTTCATTTCATGAAACA
AAAGAGAATTTCATCACATCCTCTCCAGTTCTGCCTCAAAGCCATTTCAGACGCCAACAATAAATAAGAAGAAAAGGAGAGATTTGATGCTGCACAATGCTCGTATGGAC
TGAGATACAAGTTCCCTGCAGACCATGAATTTTAGTGCCACCAGTATTATTGGGGGAAATCCAAAATTGGTAGTCAACTTACCCTATTAAACTAGAATTTAAGAGAAAAA
GATGAGAATAATGAATATGATAATTTCACATTCAAACAGAAACACCAAAAATATATTTCATATGATGGAAAAAAGTAAAACAGCAAAGCAATCAGAGAACTTTGAAGACC
AGAACGATATAAGTTCCACATCAGTTTCAGATGACAAAGTTTTCATCATTTTGCCTTGCTTTTCTTACAGCAAGTTAATCAAAACTCAATACAACAAGCTACACCAATGA
CTGAGTATACCCTCTCGTAGAGGATCAAATCACATCTGCATCGATTCAACCAAAATCACACTCTCCCTGTATTTCAAATTCAGGATAGATACAACAAAATCTAAGCCAAC
CATCAGGCAACAGCAATCAGAGAACTTTGAAGGCATTGAATGATATGAGTTAAGCACACCATAGGTTCACCTCAAAAAGCCTCATCATCTTGAATGGTCATTTCACATTT
TTTGTTAAAAAAAAAGATCGAGACTAAGAGTTGAGACAACGCCATGAAAATAGAACAGAGCATTTCGAAAATTCACATTCTGAATCTGAAGACGACCTTGTGATTGTTTC
TTTGGCCAAGCGGGGTTATGCTGGAGAAAATCTTCCCCAAAACCATAGATGCAAAAGCCAAAATGAATGTAGCACCGCAAGAATAATACCTTTTTCTCGATTTTCCTTGC
AACTAAACTCGAAGAAGCAAGGGGCTATTTGGTGCATCAAATCATGCATGAAAAGGAAACCTAAAACAGAAAAGCAAATGCTTATGCTTAATTGACGCGTCGCTTACCAG
AGAATCGATTTGCAGGAGACAATCATCGAGAGAAGCCCATAAACGAAGTTCCAGATTAGGTTGTGCTGATACTGAACCGACTTGGCGGCTTTTATAGAGGTTTGCTGGAT
TAGGGTTTTATCTGGATTCGCATTTTTTTATTGGGTTGAAGGATATTTTGGACCAGCCCAAATATTAGAGTCGGTCATTCCTTCAACACAATCAATCCTATTTATGAGAG
TAACCCAATCTAACCTATTGGGTCACTAACTAAAATCACATGAAATTCAAATATCAAACTTCAAAATTCATAAC

Protein sequence

Show/hide protein sequence

MASTTQEASLEMNEYSFITAINERNTGISSLIWGWGVSTASDCLPIYIRMQRPKPSPSPPANSLQNLGKTILSLTFQAILALFIGFPTSSPSLPTLLFRTAVLISFAVSF
AGVFLQNAFPRMALLLEKFGALFAAIGVCIISSLLVHQNLAWICWLACGSCLLAFIISFK

Tan0015213 (gene) of Snake gourd v1 genome