CuGenDBv2

Gene ID	Tan0008652
Organism	Trichosanthes anguina (Snake gourd v1)
Description	protein FAR1-RELATED SEQUENCE 4-like
Genome location	LG05:47820536..47826780
RNA-Seq Expression	Tan0008652
Synteny	Tan0008652
Gene Ontology terms	GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR006564 - Zinc finger, PMZ-type IPR007527 - Zinc finger, SWIM-type

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022145820.1 uncharacterized protein LOC111015181 [Momordica charantia]

4.9e-37

51.57

Show/hide

Query:  ARSCQSPGLLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGAC
        AR      LLDHIRG LQ+ +Y RR  A++    ++ YA  +      S RRHVV  +DQF F+V D  L G V+L+  TC CREFDYF+IPCSHAI A 
Subjt:  ARSCQSPGLLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGAC

Query:  AFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR
          RNI+P +LC EAY  +SW+ AYA P+  +GHVS W  S EF +  V PPK V RVGR
Subjt:  AFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR

XP_022153146.1 uncharacterized protein LOC111020715 [Momordica charantia]

2.4e-36

51.57

Show/hide

Query:  ARSCQSPGLLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGAC
        AR      LLDHIRG LQ+ +Y RR  AS+    ++ YA   L     ++RRHVV  +DQF  +V DG L G V+ ++RTC CREFDYF+IPCSHAI   
Subjt:  ARSCQSPGLLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGAC

Query:  AFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR
          RNI+P TLC EAY  +SWV AYA P+  +GHVS W  S +F D  V  P  V RVGR
Subjt:  AFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR

XP_022154610.1 uncharacterized protein LOC111021833 [Momordica charantia]

1.9e-36

50.31

Show/hide

Query:  ARSCQSPGLLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGAC
        AR      LLDHIRG L + +Y RR  A++    ++ YA  +      S+RRHVV  +DQF F+V DG   G V+L+  TC+CREFDYF+IPCSH I A 
Subjt:  ARSCQSPGLLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGAC

Query:  AFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR
          RNI+P +LC EAY  +SW+ AYA P+  +GHVS W  S EF +  V PPK V RVGR
Subjt:  AFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR

XP_022154964.1 protein FAR1-RELATED SEQUENCE 4-like [Momordica charantia]

3.2e-36

48.02

Show/hide

Query:  ARSCQSPGLLDHIRGWLQSKYYKRRNKASAWPHRITKYACQIL-----EARRAS-------------SRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCT
        AR      LLDHIRG LQ  +Y+RR  AS+    ++ YA +++      ARR S             +RRH+V  +DQF FEV DG L G V+L ++TCT
Subjt:  ARSCQSPGLLDHIRGWLQSKYYKRRNKASAWPHRITKYACQIL-----EARRAS-------------SRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCT

Query:  CREFDYFEIPCSHAIGACAFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR
        CREFDYF++PCSHAI A   R+I+P TLC EAY V+SW+ AYA P+  +G  S W+ S  F + +V PPK+V RVGR
Subjt:  CREFDYFEIPCSHAIGACAFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR

XP_022159268.1 uncharacterized protein LOC111025678 [Momordica charantia]

1.4e-36

52.32

Show/hide

Query:  LLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGACAFRNIDPI
        LLDHIRG LQ+ +Y RR  A++    ++ YA  +      S+RRHVV  +DQF F+V DG L G V+L+   C+CREFDYF+IPCSHAI A   RNI+P 
Subjt:  LLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGACAFRNIDPI

Query:  TLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR
        +LC EAY  +SW+ AYA P+  +GH+S W  S EF +  V PPK V RVGR
Subjt:  TLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR

TrEMBL top hits

e value

%identity

Alignment

A0A6J1CVL4 uncharacterized protein LOC111015181

2.4e-37

51.57

Show/hide

Query:  ARSCQSPGLLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGAC
        AR      LLDHIRG LQ+ +Y RR  A++    ++ YA  +      S RRHVV  +DQF F+V D  L G V+L+  TC CREFDYF+IPCSHAI A 
Subjt:  ARSCQSPGLLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGAC

Query:  AFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR
          RNI+P +LC EAY  +SW+ AYA P+  +GHVS W  S EF +  V PPK V RVGR
Subjt:  AFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR

A0A6J1DJT1 uncharacterized protein LOC111020715

1.2e-36

51.57

Show/hide

Query:  ARSCQSPGLLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGAC
        AR      LLDHIRG LQ+ +Y RR  AS+    ++ YA   L     ++RRHVV  +DQF  +V DG L G V+ ++RTC CREFDYF+IPCSHAI   
Subjt:  ARSCQSPGLLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGAC

Query:  AFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR
          RNI+P TLC EAY  +SWV AYA P+  +GHVS W  S +F D  V  P  V RVGR
Subjt:  AFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR

A0A6J1DK35 uncharacterized protein LOC111021833

9.1e-37

50.31

Show/hide

Query:  ARSCQSPGLLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGAC
        AR      LLDHIRG L + +Y RR  A++    ++ YA  +      S+RRHVV  +DQF F+V DG   G V+L+  TC+CREFDYF+IPCSH I A 
Subjt:  ARSCQSPGLLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGAC

Query:  AFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR
          RNI+P +LC EAY  +SW+ AYA P+  +GHVS W  S EF +  V PPK V RVGR
Subjt:  AFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR

A0A6J1DNT3 protein FAR1-RELATED SEQUENCE 4-like

1.5e-36

48.02

Show/hide

Query:  ARSCQSPGLLDHIRGWLQSKYYKRRNKASAWPHRITKYACQIL-----EARRAS-------------SRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCT
        AR      LLDHIRG LQ  +Y+RR  AS+    ++ YA +++      ARR S             +RRH+V  +DQF FEV DG L G V+L ++TCT
Subjt:  ARSCQSPGLLDHIRGWLQSKYYKRRNKASAWPHRITKYACQIL-----EARRAS-------------SRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCT

Query:  CREFDYFEIPCSHAIGACAFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR
        CREFDYF++PCSHAI A   R+I+P TLC EAY V+SW+ AYA P+  +G  S W+ S  F + +V PPK+V RVGR
Subjt:  CREFDYFEIPCSHAIGACAFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR

A0A6J1DYC4 uncharacterized protein LOC111025678

6.9e-37

52.32

Show/hide

Query:  LLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGACAFRNIDPI
        LLDHIRG LQ+ +Y RR  A++    ++ YA  +      S+RRHVV  +DQF F+V DG L G V+L+   C+CREFDYF+IPCSHAI A   RNI+P 
Subjt:  LLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGACAFRNIDPI

Query:  TLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR
        +LC EAY  +SW+ AYA P+  +GH+S W  S EF +  V PPK V RVGR
Subjt:  TLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGR

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G49920.1 MuDR family transposase

3.7e-06

31.82

Show/hide

Query:  GRVNLHNRTCTCREFDYFEIPCSHAIGACAFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEW
        G V L++ TCTC EF   + PC HA+  C    I+P+    + Y V+ +   Y++    +  +S W
Subjt:  GRVNLHNRTCTCREFDYFEIPCSHAIGACAFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEW

AT1G64255.1 MuDR family transposase

7.4e-07

27.35

Show/hide

Query:  HVVRPVDQFEFEVDDGYLGGR--VNLHNRTCTCREFDYFEIPCSHAIGACAFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLP
        ++V P+D   F+V      G   V L + +CTC +F  ++ PC HA+  C     +P+    + Y ++     YA+    +  +S W  +S      +LP
Subjt:  HVVRPVDQFEFEVDDGYLGGR--VNLHNRTCTCREFDYFEIPCSHAIGACAFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEWEMSSEFQDYEVLP

Query:  PKQVSRVGRLPRPPNRV
        P  V      P PP  V
Subjt:  PKQVSRVGRLPRPPNRV

AT1G64260.1 MuDR family transposase

1.3e-06

27.84

Show/hide

Query:  LEARRASSRRHVVRPVDQFEFEVDDGYLGGR--VNLHNRTCTCREFDYFEIPCSHAIGACAFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEW
        LE     S  +V+  +++  F+V +        V L+  TCTCR+F  ++ PC HA+       I+P+    E Y V+ +   YA+    +  V+ W
Subjt:  LEARRASSRRHVVRPVDQFEFEVDDGYLGGR--VNLHNRTCTCREFDYFEIPCSHAIGACAFRNIDPITLCSEAYHVDSWVDAYASPVHSLGHVSEW

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTTTTGAGTTTCACCCTAATCCAAAACCATGGGCCAAACACTCCCTTAGTATTCCACAAGAGGTTGAGCTTGGAAATAAGAGGAGAAGTTAGAAGCCCAAAGGGAGC
ATGTGTAATGCACACCTCTAACATCATGCCGCGTGTTTGGGTTTGTTTTGGGGGTATATGGAACGATGGAGAAAAGGATTACGATGGTGGCGAGGTTAGGGGACTTGATG
TGGATGTAGAAATTAAATTTGAGGAGTTTTTGGGTCTAGTCTATGAGATAAGTTATACTGACCGGAATGATTTTAATCTTGTAATGAGATGTATATTGCCGTTAAGATCC
AAATCCCCAGCATTTGTTATTAAAAATGATGTAGATCTCAAATGTTTCCTTACTTTGGAAGACGTCTCATCAATTCCACTCTACATATCTACATCTCCTACCTTTTCAAG
AAGTCATGCATTTCAACCCTATTCAATTCCTTGTAAGGTACTAGATAATCCATATATGGGAGTACAAAATTATCCATATGTTTCATCCATGACTACGTCTACAGTTGTCC
CTCATAACACCATAAATGGTCCCTTGGAGGAAGATGATGTGGAGGTTGAAAGGATAAAAACTCATGACGAGTTTCAAGAGGCAGATGCACGGAGTTGCCAATCACCTGGT
TTATTGGATCATATTAGAGGTTGGCTTCAATCTAAATACTATAAACGTCGGAATAAAGCATCTGCATGGCCACATCGAATAACGAAGTATGCTTGCCAAATTCTTGAAGC
CCGAAGAGCTAGTTCAAGGAGACATGTAGTCCGACCAGTTGATCAGTTCGAGTTTGAGGTAGATGATGGTTACCTGGGTGGGCGTGTAAATCTCCATAATAGAACTTGTA
CTTGTCGAGAGTTTGATTACTTTGAAATTCCTTGTTCACATGCAATTGGAGCATGTGCATTCCGTAATATAGACCCAATCACACTATGTTCTGAAGCATATCATGTTGAT
TCATGGGTCGACGCGTATGCAAGTCCTGTACATTCATTAGGTCATGTGTCAGAGTGGGAAATGTCATCTGAATTTCAAGACTACGAAGTGTTACCACCGAAGCAAGTATC
TAGAGTGGGTCGCCTGCCACGACCTCCGAATCGAGTCCGAATCAACCTCCTCTTCGGTTTTTGGTATTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MVLSFTLIQNHGPNTPLVFHKRLSLEIRGEVRSPKGACVMHTSNIMPRVWVCFGGIWNDGEKDYDGGEVRGLDVDVEIKFEEFLGLVYEISYTDRNDFNLVMRCILPLRS
KSPAFVIKNDVDLKCFLTLEDVSSIPLYISTSPTFSRSHAFQPYSIPCKVLDNPYMGVQNYPYVSSMTTSTVVPHNTINGPLEEDDVEVERIKTHDEFQEADARSCQSPG
LLDHIRGWLQSKYYKRRNKASAWPHRITKYACQILEARRASSRRHVVRPVDQFEFEVDDGYLGGRVNLHNRTCTCREFDYFEIPCSHAIGACAFRNIDPITLCSEAYHVD
SWVDAYASPVHSLGHVSEWEMSSEFQDYEVLPPKQVSRVGRLPRPPNRVRINLLFGFWY

Tan0008652 (gene) of Snake gourd v1 genome