; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0004012 (gene) of Snake gourd v1 genome

Gene IDTan0004012
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionTHO complex subunit 4D-like
Genome locationLG04:73612457..73627651
RNA-Seq ExpressionTan0004012
SyntenyTan0004012
Gene Ontology termsGO:0003723 - RNA binding (molecular function)
InterPro domainsIPR000504 - RNA recognition motif domain
IPR012677 - Nucleotide-binding alpha-beta plait domain superfamily
IPR025715 - Chromatin target of PRMT1 protein, C-terminal
IPR035979 - RNA-binding domain superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6581189.1 THO complex subunit 4C, partial [Cucurbita argyrosperma subsp. sororia]4.6e-13386.17Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
        MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGS+NGG+ V IGSVRRGPL +NARPSA+SISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY

Query:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT
        VSNLDYGVTKEDIRELFSEIGDLKRFA+HYDKNG  SGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN + PVSARINVTGVNGRSRRTVVLT
Subjt:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT

Query:  SESGRTGSSNVANPFPGPSHRGGLRN--GRGRGRGGWSRGLG-------------GLGGGGRGRGRGRGRG---------GRGQGRKKPVEKSSDELDKE
        SESGRTGSSN  NPFPGPSHRGGLR+  GRGRGRGGWSRGLG             GLGGGGRGRGRG G G         GRGQGRKKPVEKSS ELDKE
Subjt:  SESGRTGSSNVANPFPGPSHRGGLRN--GRGRGRGGWSRGLG-------------GLGGGGRGRGRGRGRG---------GRGQGRKKPVEKSSDELDKE

Query:  LENYHAEAMQT
        LENYHAEAMQT
Subjt:  LENYHAEAMQT

XP_022935328.1 THO complex subunit 4D-like [Cucurbita moschata]1.1e-13490.85Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
        MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGS+NGGR V IGSVRRGPL +NARPSA+SISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY

Query:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT
        VSNLDYGVTKEDIRELFSEIGDLKRFA+HYDKNG  SGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN + PVSARINVTGVNGRSRRTVVLT
Subjt:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT

Query:  SESGRTGSSNVANPFPGPSHRGGLRN--GRGRGRGGWSRGLG-----GLGGGGRGRGRGRGRG-GRGQGRKKPVEKSSDELDKELENYHAEAMQT
        SESGRTGSS+  NPFPGPSHRGGLR+  GRGRGRGGWSRGLG     GLGGGGRGRGRG G G GRGQGRKKPVEKSS ELDKELENYHAEAMQT
Subjt:  SESGRTGSSNVANPFPGPSHRGGLRN--GRGRGRGGWSRGLG-----GLGGGGRGRGRGRGRG-GRGQGRKKPVEKSSDELDKELENYHAEAMQT

XP_022982649.1 THO complex subunit 4D-like [Cucurbita maxima]3.8e-13588.2Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
        MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGS+NGGR V IGSVRRGPL +NARPSA+SISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY

Query:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT
        VSNLDYGVTKEDIRELFSEIGDLKRFA+HYDKNG  SGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN + PVSARINVTGVNGRSRRTVVLT
Subjt:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT

Query:  SESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGG-----------GGRGRGRGRGRG-------GRGQGRKKPVEKSSDELDKELENYHA
        SESGRTGSSN  NPFPGPSHRGGLR+GRGRGRGGWSRGLGG GG           GGRGRGRGRG G       GRGQGRKKPVEKSS ELDKELENYHA
Subjt:  SESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGG-----------GGRGRGRGRGRG-------GRGQGRKKPVEKSSDELDKELENYHA

Query:  EAMQT
        EAMQT
Subjt:  EAMQT

XP_023527122.1 THO complex subunit 4D [Cucurbita pepo subsp. pepo]2.9e-13591.19Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
        MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGS+NGGR V IGSVRRGPL +NARPSA+SISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY

Query:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT
        VSNLDYGVTKEDIRELFSEIGDLKRFA+HYDKNG  SGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN + PVSARINVTGVNGRSRRTVVLT
Subjt:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT

Query:  SESGRTGSSNVANPFPGPSHRGGLRN--GRGRGRGGWSRGLG-----GLGGGGRGRGRGRGRG-GRGQGRKKPVEKSSDELDKELENYHAEAMQT
        SESGRTGSSN  NPFPGPSHRGGLR+  GRGRGRGGWSRGLG     GLGGGGRGRGRG G G GRGQGRKKPVEKSS ELDKELENYHAEAMQT
Subjt:  SESGRTGSSNVANPFPGPSHRGGLRN--GRGRGRGGWSRGLG-----GLGGGGRGRGRGRGRG-GRGQGRKKPVEKSSDELDKELENYHAEAMQT

XP_038896761.1 THO complex subunit 4D-like [Benincasa hispida]2.2e-13592.33Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
        MATPLDMSLEDVIKK+NREKLRARGRARRGRGAGGSFNGGRGV +GSVRRGPL +NAR SAYSI KPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY

Query:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT
        VSNLDYGV+KEDIRELFSEIGDLKRFA+HYDKNG  SGSAEVVYTRRSDAFAALKRYNNVLLDG+PMKIEMLGDN EMPVSARINVTGVNGRSRRTVVLT
Subjt:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT

Query:  SESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGGGGRGRGRGRGRGGRGQGRKKPVEKSSDELDKELENYHAEAMQT
         ESGRT SSNV NPFPGPSHRGGLRNGRGRGRGGW+RG  G+GGGG GRGRGRGR GRGQGRKKPVEKSSDELDKELENYHAEAMQT
Subjt:  SESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGGGGRGRGRGRGRGGRGQGRKKPVEKSSDELDKELENYHAEAMQT

TrEMBL top hitse value%identityAlignment
A0A0A0L717 RRM domain-containing protein1.7e-9692Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
        M TPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGV IGSVRRGPL +NAR SAYSI KPP RMKNVQWQHDLFEDSLRASGISGI+IGTKLY
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY

Query:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT
        VSNLDYGVTKEDI+ELFSEIGD+KRFA+HYDKNG  SGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN EMPVSARINVTG NGR+RRTVVLT
Subjt:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT

A0A1S3C452 THO complex subunit 4D1.4e-13290.24Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
        M TPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGV IGSVRRGPL +NAR SAYSI KPP RMKNVQWQHDLFEDSLRASGISGI+IGTKLY
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY

Query:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT
        VSNLDYGVTKEDIRELFSEIGDLKRFA+HYDKNG  SGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN EMPVSARINVTG NGR+RRTVVLT
Subjt:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT

Query:  SESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGGGGRGRGRGRGRGGRGQGRKKPVEKSSDELDKELENYHAEAMQT
         ESGR  + NV NPFPGPSHRGGLRN RGRGRG W+RG+ GLGG G GRGRGRGR GRGQGRKKPVEKSSDELDKELENYHAEAMQT
Subjt:  SESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGGGGRGRGRGRGRGGRGQGRKKPVEKSSDELDKELENYHAEAMQT

A0A6J1CP51 THO complex subunit 4D-like4.8e-12889.55Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
        MATPLDMSLED+IKKNNREKLRARGRARRGRGAGGSFNGGR V IGS+RRGPLS+N RPSA+SISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY

Query:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT
        VSNLDYGVTKEDIRELFSEIGDLKRFA+HYDKNG  SGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIE+LGDN EMPVSARINVTG+NGRSRRTVVLT
Subjt:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT

Query:  SESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGGGGRGRGRGRGRGGRGQGRKKPVEKSSDELDKELENYHAEAMQT
        SESGRT SS V N FPGPS+RG LR GRGRGRGGWSRG G +GG   GRGRGRGR GRG GRKK VEKSSDELDK+LENYHAEAMQT
Subjt:  SESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGGGGRGRGRGRGRGGRGQGRKKPVEKSSDELDKELENYHAEAMQT

A0A6J1FAB9 THO complex subunit 4D-like5.3e-13590.85Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
        MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGS+NGGR V IGSVRRGPL +NARPSA+SISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY

Query:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT
        VSNLDYGVTKEDIRELFSEIGDLKRFA+HYDKNG  SGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN + PVSARINVTGVNGRSRRTVVLT
Subjt:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT

Query:  SESGRTGSSNVANPFPGPSHRGGLRN--GRGRGRGGWSRGLG-----GLGGGGRGRGRGRGRG-GRGQGRKKPVEKSSDELDKELENYHAEAMQT
        SESGRTGSS+  NPFPGPSHRGGLR+  GRGRGRGGWSRGLG     GLGGGGRGRGRG G G GRGQGRKKPVEKSS ELDKELENYHAEAMQT
Subjt:  SESGRTGSSNVANPFPGPSHRGGLRN--GRGRGRGGWSRGLG-----GLGGGGRGRGRGRGRG-GRGQGRKKPVEKSSDELDKELENYHAEAMQT

A0A6J1J564 THO complex subunit 4D-like1.8e-13588.2Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
        MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGS+NGGR V IGSVRRGPL +NARPSA+SISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLY

Query:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT
        VSNLDYGVTKEDIRELFSEIGDLKRFA+HYDKNG  SGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN + PVSARINVTGVNGRSRRTVVLT
Subjt:  VSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLT

Query:  SESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGG-----------GGRGRGRGRGRG-------GRGQGRKKPVEKSSDELDKELENYHA
        SESGRTGSSN  NPFPGPSHRGGLR+GRGRGRGGWSRGLGG GG           GGRGRGRGRG G       GRGQGRKKPVEKSS ELDKELENYHA
Subjt:  SESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGG-----------GGRGRGRGRGRG-------GRGQGRKKPVEKSSDELDKELENYHA

Query:  EAMQT
        EAMQT
Subjt:  EAMQT

SwissProt top hitse value%identityAlignment
B5FXN8 THO complex subunit 43.7e-3240.14Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGG----RGVGIGSVRRGPL---SLNARPSAYSISKPPRRMKNV--QWQHDLFEDSLRASGIS
        MA  +DMSL+D+IK N  ++  +RG  R GRG GG+  GG     GVG G    GP+    + AR    +   P  R K +  +WQHDLF+    A   +
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGG----RGVGIGSVRRGPL---SLNARPSAYSISKPPRRMKNV--QWQHDLFEDSLRASGIS

Query:  GIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNG
        G+E G KL VSNLD+GV+  DI+ELF+E G LK+ A+HYD++G S G+A+V + R++DA  A+K+YN V LDG+PM I++              VT    
Subjt:  GIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNG

Query:  RSRRTVVLTSESGRTGSSNVANPFPGPS-HRGGLRNGRGRGRGGWSRGLGGLGGGGRGRG-RGRGRG-GRGQGRKKPVEKSSDELDKELENYHA
          RR                    P  S +RGG+   RG         LGG GGGG  RG RG  RG GRG GR    + S++ELD +L+ Y+A
Subjt:  RSRRTVVLTSESGRTGSSNVANPFPGPS-HRGGLRNGRGRGRGGWSRGLGGLGGGGRGRG-RGRGRG-GRGQGRKKPVEKSSDELDKELENYHA

Q6NQ72 THO complex subunit 4D9.8e-7055.56Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRAR-RGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKL
        M+  L+M+L++++K+    +   RG +R RGRG GG   GGRG   G  RRGPL++NARPS+++I+KP RR++++ WQ  LFED LRA+G SG+E+GT+L
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRAR-RGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKL

Query:  YVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN--GEMPVSAR--INVTGVNGRSRR
        +V+NLD GVT EDIRELFSEIG+++R+A+HYDKNG  SG+AEVVY RRSDAF ALK+YNNVLLDG+PM++E+LG N   E P+S R  +NVTG+NGR +R
Subjt:  YVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN--GEMPVSAR--INVTGVNGRSRR

Query:  TVVLTSESGR----TGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGGGGRGR-GRGRGRGGRGQGRKKPVEKSSDELDKELENYHAEAMQT
        TVV+    G      G      P P  S R  + N +G   GG   G GG    GRG  GRGRG GGRG G KKPVEKS+ +LDK+LE+YHA+AM T
Subjt:  TVVLTSESGR----TGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGGGGRGR-GRGRGRGGRGQGRKKPVEKSSDELDKELENYHAEAMQT

Q8L719 THO complex subunit 4B4.6e-4345.07Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLF--EDSLRAS----------
        M+  LDMSL+D+I K+NR+   +RGR   G G      GG G   G  RR    + AR + YS     ++  +  WQ+D+F  + S+ A+          
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLF--EDSLRAS----------

Query:  GISGIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTG
        G S IE GTKLY+SNLDYGV+ EDI+ELFSE+GDLKR+ +HYD++G S G+AEVV++RR DA AA+KRYNNV LDGK MKIE++G N   P    +    
Subjt:  GISGIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTG

Query:  VNGRSRRTVVLTSESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGW---SRGLGGLGGGGRGRGRG-RGRGGRGQ-GRKKPVEKSSDELDKELENYHAE
        +             +G  G+ N    F G  +     N RGRGRGG+    RG GG GGG    GRG RGRGGRG  GR +    S+++LD EL+ YH E
Subjt:  VNGRSRRTVVLTSESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGW---SRGLGGLGGGGRGRGRG-RGRGGRGQ-GRKKPVEKSSDELDKELENYHAE

Query:  AMQT
        AM+T
Subjt:  AMQT

Q8L773 THO complex subunit 4A1.8e-4243.88Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNG-GRGVGIGSVRR-GPLSLNARPSAYSISKPPRRMKNVQWQHDLF----EDSLRASGISGIE
        M+T LDMSL+D+I KN           R+ RG  G   G G G G G  RR  P   + R + Y  +K P       W HD+F    ED       +GIE
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNG-GRGVGIGSVRR-GPLSLNARPSAYSISKPPRRMKNVQWQHDLF----EDSLRASGISGIE

Query:  IGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSR
         GTKLY+SNLDYGV  EDI+ELF+E+G+LKR+ +H+D++G S G+AEVVY+RR DA AA+K+YN+V LDGKPMKIE++G N                   
Subjt:  IGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSR

Query:  RTVVLTSESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGGGGRGRGRGRGRGGRGQGRKKPVEK-SSDELDKELENYHAEAMQT
        +T    S     G+SN A P+ G   RGG +  RG GRGG     GG GGGGRGR  G+G          P EK S+++LD +L+ YH+  M+T
Subjt:  RTVVLTSESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGGGGRGRGRGRGRGGRGQGRKKPVEK-SSDELDKELENYHAEAMQT

Q94EH8 THO complex subunit 4C1.1e-6552.41Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRA-----RGRARR-GRGAGGSFNG--GRGVGIGSVRRGPLSLNARP-SAYSISKPPRRMKNVQW--QHDLFEDSLRASG
        M+  L+M+L++++KK+  E+  A     +G +R+ GRG GG  NG  G G G G VRRGPL++N RP S++SI+K  RR +++ W  Q+DL+E++LRA G
Subjt:  MATPLDMSLEDVIKKNNREKLRA-----RGRARR-GRGAGGSFNG--GRGVGIGSVRRGPLSLNARP-SAYSISKPPRRMKNVQW--QHDLFEDSLRASG

Query:  ISGIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGE-MPVSARINVTG
        +SG+E+GT +Y++NLD GVT EDIREL++EIG+LKR+A+HYDKNG  SGSAEVVY RRSDA  A+++YNNVLLDG+PMK+E+LG N E  PV+AR+NVTG
Subjt:  ISGIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGE-MPVSARINVTG

Query:  VNGRSRRTVVLTSESGRTGSSNVANPFPGPSHRGGLRNGRGRG--------------RGGWSRGLGGLGGGGRGRGRGRGRGGRGQGRKKPVEKSSDELD
        +NGR +R+V                 F G   RGG R GRGRG              +GG + G GG  G GRG G GRG    G+G KKPVEKS+ +LD
Subjt:  VNGRSRRTVVLTSESGRTGSSNVANPFPGPSHRGGLRNGRGRG--------------RGGWSRGLGGLGGGGRGRGRGRGRGGRGQGRKKPVEKSSDELD

Query:  KELENYHAEAM
        K+LE+YHAEAM
Subjt:  KELENYHAEAM

Arabidopsis top hitse value%identityAlignment
AT1G66260.1 RNA-binding (RRM/RBD/RNP motifs) family protein8.0e-6752.41Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRA-----RGRARR-GRGAGGSFNG--GRGVGIGSVRRGPLSLNARP-SAYSISKPPRRMKNVQW--QHDLFEDSLRASG
        M+  L+M+L++++KK+  E+  A     +G +R+ GRG GG  NG  G G G G VRRGPL++N RP S++SI+K  RR +++ W  Q+DL+E++LRA G
Subjt:  MATPLDMSLEDVIKKNNREKLRA-----RGRARR-GRGAGGSFNG--GRGVGIGSVRRGPLSLNARP-SAYSISKPPRRMKNVQW--QHDLFEDSLRASG

Query:  ISGIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGE-MPVSARINVTG
        +SG+E+GT +Y++NLD GVT EDIREL++EIG+LKR+A+HYDKNG  SGSAEVVY RRSDA  A+++YNNVLLDG+PMK+E+LG N E  PV+AR+NVTG
Subjt:  ISGIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGE-MPVSARINVTG

Query:  VNGRSRRTVVLTSESGRTGSSNVANPFPGPSHRGGLRNGRGRG--------------RGGWSRGLGGLGGGGRGRGRGRGRGGRGQGRKKPVEKSSDELD
        +NGR +R+V                 F G   RGG R GRGRG              +GG + G GG  G GRG G GRG    G+G KKPVEKS+ +LD
Subjt:  VNGRSRRTVVLTSESGRTGSSNVANPFPGPSHRGGLRNGRGRG--------------RGGWSRGLGGLGGGGRGRGRGRGRGGRGQGRKKPVEKSSDELD

Query:  KELENYHAEAM
        K+LE+YHAEAM
Subjt:  KELENYHAEAM

AT1G66260.2 RNA-binding (RRM/RBD/RNP motifs) family protein8.0e-6752.41Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRA-----RGRARR-GRGAGGSFNG--GRGVGIGSVRRGPLSLNARP-SAYSISKPPRRMKNVQW--QHDLFEDSLRASG
        M+  L+M+L++++KK+  E+  A     +G +R+ GRG GG  NG  G G G G VRRGPL++N RP S++SI+K  RR +++ W  Q+DL+E++LRA G
Subjt:  MATPLDMSLEDVIKKNNREKLRA-----RGRARR-GRGAGGSFNG--GRGVGIGSVRRGPLSLNARP-SAYSISKPPRRMKNVQW--QHDLFEDSLRASG

Query:  ISGIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGE-MPVSARINVTG
        +SG+E+GT +Y++NLD GVT EDIREL++EIG+LKR+A+HYDKNG  SGSAEVVY RRSDA  A+++YNNVLLDG+PMK+E+LG N E  PV+AR+NVTG
Subjt:  ISGIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGE-MPVSARINVTG

Query:  VNGRSRRTVVLTSESGRTGSSNVANPFPGPSHRGGLRNGRGRG--------------RGGWSRGLGGLGGGGRGRGRGRGRGGRGQGRKKPVEKSSDELD
        +NGR +R+V                 F G   RGG R GRGRG              +GG + G GG  G GRG G GRG    G+G KKPVEKS+ +LD
Subjt:  VNGRSRRTVVLTSESGRTGSSNVANPFPGPSHRGGLRNGRGRG--------------RGGWSRGLGGLGGGGRGRGRGRGRGGRGQGRKKPVEKSSDELD

Query:  KELENYHAEAM
        K+LE+YHAEAM
Subjt:  KELENYHAEAM

AT5G02530.1 RNA-binding (RRM/RBD/RNP motifs) family protein3.3e-4445.07Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLF--EDSLRAS----------
        M+  LDMSL+D+I K+NR+   +RGR   G G      GG G   G  RR    + AR + YS     ++  +  WQ+D+F  + S+ A+          
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLF--EDSLRAS----------

Query:  GISGIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTG
        G S IE GTKLY+SNLDYGV+ EDI+ELFSE+GDLKR+ +HYD++G S G+AEVV++RR DA AA+KRYNNV LDGK MKIE++G N   P    +    
Subjt:  GISGIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTG

Query:  VNGRSRRTVVLTSESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGW---SRGLGGLGGGGRGRGRG-RGRGGRGQ-GRKKPVEKSSDELDKELENYHAE
        +             +G  G+ N    F G  +     N RGRGRGG+    RG GG GGG    GRG RGRGGRG  GR +    S+++LD EL+ YH E
Subjt:  VNGRSRRTVVLTSESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGW---SRGLGGLGGGGRGRGRG-RGRGGRGQ-GRKKPVEKSSDELDKELENYHAE

Query:  AMQT
        AM+T
Subjt:  AMQT

AT5G37720.1 ALWAYS EARLY 47.0e-7155.56Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRAR-RGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKL
        M+  L+M+L++++K+    +   RG +R RGRG GG   GGRG   G  RRGPL++NARPS+++I+KP RR++++ WQ  LFED LRA+G SG+E+GT+L
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRAR-RGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKL

Query:  YVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN--GEMPVSAR--INVTGVNGRSRR
        +V+NLD GVT EDIRELFSEIG+++R+A+HYDKNG  SG+AEVVY RRSDAF ALK+YNNVLLDG+PM++E+LG N   E P+S R  +NVTG+NGR +R
Subjt:  YVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN--GEMPVSAR--INVTGVNGRSRR

Query:  TVVLTSESGR----TGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGGGGRGR-GRGRGRGGRGQGRKKPVEKSSDELDKELENYHAEAMQT
        TVV+    G      G      P P  S R  + N +G   GG   G GG    GRG  GRGRG GGRG G KKPVEKS+ +LDK+LE+YHA+AM T
Subjt:  TVVLTSESGR----TGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGGGGRGR-GRGRGRGGRGQGRKKPVEKSSDELDKELENYHAEAMQT

AT5G37720.2 ALWAYS EARLY 44.8e-7256.66Show/hide
Query:  MATPLDMSLEDVIKKNNREKLRARGRAR-RGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKL
        M+  L+M+L++++K+    +   RG +R RGRG GG   GGRG   G  RRGPL++NARPS+++I+KP RR++++ WQ  LFED LRA+G SG+E+GT+L
Subjt:  MATPLDMSLEDVIKKNNREKLRARGRAR-RGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKL

Query:  YVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN--GEMPVSAR--INVTGVNGRSRR
        +V+NLD GVT EDIRELFSEIG+++R+A+HYDKNG  SG+AEVVY RRSDAF ALK+YNNVLLDG+PM++E+LG N   E P+S R  +NVTG+NGR +R
Subjt:  YVSNLDYGVTKEDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN--GEMPVSAR--INVTGVNGRSRR

Query:  TVVLTSESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGGGGRGR-GRGRGRGGRGQGRKKPVEKSSDELDKELENYHAEAMQT
        TVV+    GR G      P P  S R  + N +G   GG   G GG    GRG  GRGRG GGRG G KKPVEKS+ +LDK+LE+YHA+AM T
Subjt:  TVVLTSESGRTGSSNVANPFPGPSHRGGLRNGRGRGRGGWSRGLGGLGGGGRGR-GRGRGRGGRGQGRKKPVEKSSDELDKELENYHAEAMQT


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCTACTCCTTTGGATATGTCACTAGAGGATGTGATAAAGAAGAATAATCGTGAGAAGCTTAGAGCCCGAGGTAGGGCCCGTCGTGGGCGTGGAGCAGGTGGGTCTTT
TAATGGTGGAAGAGGAGTAGGGATAGGGTCAGTTCGTAGAGGTCCTCTCAGCTTAAATGCGCGACCATCTGCTTACTCAATTAGCAAGCCCCCACGCAGAATGAAGAATG
TTCAATGGCAGCATGATTTATTTGAAGATAGTCTTAGAGCTTCAGGGATTTCTGGAATTGAAATTGGCACAAAGTTGTACGTTTCCAACTTGGATTATGGGGTGACCAAA
GAAGATATAAGGGAGTTGTTCTCTGAGATTGGAGACCTGAAAAGATTTGCACTTCATTATGACAAAAATGGCAGTTCAAGTGGCTCGGCAGAGGTGGTCTATACTCGTAG
AAGTGATGCATTTGCAGCTCTGAAGCGCTATAACAATGTGTTACTGGATGGGAAGCCAATGAAGATTGAAATGCTTGGTGATAATGGTGAAATGCCAGTTTCTGCACGTA
TAAATGTTACTGGAGTGAATGGAAGAAGCAGGAGGACTGTTGTTCTAACGTCTGAATCTGGTCGTACTGGTAGCTCCAATGTGGCCAACCCTTTTCCTGGTCCAAGCCAT
CGTGGAGGGCTGAGGAATGGCCGTGGCCGTGGGCGAGGAGGCTGGAGCCGTGGTTTAGGAGGTCTAGGTGGGGGAGGGCGTGGCCGAGGGCGTGGGCGTGGTCGTGGTGG
CCGTGGCCAGGGAAGAAAGAAACCTGTGGAGAAGTCCTCAGATGAACTTGACAAGGAGCTCGAAAACTACCATGCAGAAGCCATGCAAACCTGA
mRNA sequenceShow/hide mRNA sequence
ATAAAACGCAATTGTAAAAACAGAGGGAAAGAACAAAAGGTTCGATGAAAGAAATATCGTTGCCTTAGTCCCGAAGGAAAAGTCTCTCTCAAGCCGCCGCCGCAACCGCC
GCCTCTCGCCAGAAGAATCTCTGTCTCTCTCTTAGAAGCCCTAAAAATCCCACACGCACATATCGCTTTTCATCATCATCCTCTCGGAAATTCTCTCCTTGATTTCGTTG
AAATTTTTATCTTCGCTCTCTCTGTCGGAAGTCCTTCGACTGTTTCTACGGATCATCTTCAGGACTTCTTTTCTAGAATTCTTTGAAATCTGTTTCTTCTTATCAAACCA
ATGGCTACTCCTTTGGATATGTCACTAGAGGATGTGATAAAGAAGAATAATCGTGAGAAGCTTAGAGCCCGAGGTAGGGCCCGTCGTGGGCGTGGAGCAGGTGGGTCTTT
TAATGGTGGAAGAGGAGTAGGGATAGGGTCAGTTCGTAGAGGTCCTCTCAGCTTAAATGCGCGACCATCTGCTTACTCAATTAGCAAGCCCCCACGCAGAATGAAGAATG
TTCAATGGCAGCATGATTTATTTGAAGATAGTCTTAGAGCTTCAGGGATTTCTGGAATTGAAATTGGCACAAAGTTGTACGTTTCCAACTTGGATTATGGGGTGACCAAA
GAAGATATAAGGGAGTTGTTCTCTGAGATTGGAGACCTGAAAAGATTTGCACTTCATTATGACAAAAATGGCAGTTCAAGTGGCTCGGCAGAGGTGGTCTATACTCGTAG
AAGTGATGCATTTGCAGCTCTGAAGCGCTATAACAATGTGTTACTGGATGGGAAGCCAATGAAGATTGAAATGCTTGGTGATAATGGTGAAATGCCAGTTTCTGCACGTA
TAAATGTTACTGGAGTGAATGGAAGAAGCAGGAGGACTGTTGTTCTAACGTCTGAATCTGGTCGTACTGGTAGCTCCAATGTGGCCAACCCTTTTCCTGGTCCAAGCCAT
CGTGGAGGGCTGAGGAATGGCCGTGGCCGTGGGCGAGGAGGCTGGAGCCGTGGTTTAGGAGGTCTAGGTGGGGGAGGGCGTGGCCGAGGGCGTGGGCGTGGTCGTGGTGG
CCGTGGCCAGGGAAGAAAGAAACCTGTGGAGAAGTCCTCAGATGAACTTGACAAGGAGCTCGAAAACTACCATGCAGAAGCCATGCAAACCTGAGGAACCTTGGAATATA
TATTCAAAAAGCGAAGTATGATGTGATTAACCACTATGTTAGCTGTAAGAATATATGTCAACTGCTTGATTATTTTGTTATCATTGGTAGTTTTCCATGTTTATTTTTCC
TCTTCAGTAGACTAGATTGTATTTGCCTGTTAATGGAGATGTTGCTGTTTAGACCCTCTGTTACCAAAACTTCTACCCTTAAGTTGTCATTATACGATGTTGAGAATAGG
AGTATCTTGTATTTATGGGACCTATTCTTCAACACCTTATCGTCTGGCACTCGATATCTTCCATTTTCCCTCGACAATCTCAAAATCATACTCCATCAGTTTCTTTTCTC
TTGAGCTGTCCTTTCTCAGTGTCGACTCCGACCATTCTCTTATCTCCTTTTGTATTTGATCAAATCTAAATTAAAG
Protein sequenceShow/hide protein sequence
MATPLDMSLEDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVGIGSVRRGPLSLNARPSAYSISKPPRRMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVTK
EDIRELFSEIGDLKRFALHYDKNGSSSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNGEMPVSARINVTGVNGRSRRTVVLTSESGRTGSSNVANPFPGPSH
RGGLRNGRGRGRGGWSRGLGGLGGGGRGRGRGRGRGGRGQGRKKPVEKSSDELDKELENYHAEAMQT