; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CaUC05G091950 (gene) of Watermelon (USVL246-FR2) v1 genome

Gene IDCaUC05G091950
OrganismCitrullus amarus (Watermelon (USVL246-FR2) v1)
DescriptionTHO complex subunit 4D
Genome locationCiama_Chr05:14097127..14120887
RNA-Seq ExpressionCaUC05G091950
SyntenyCaUC05G091950
Gene Ontology termsGO:0006406 - mRNA export from nucleus (biological process)
GO:0005634 - nucleus (cellular component)
GO:0003729 - mRNA binding (molecular function)
InterPro domainsIPR000504 - RNA recognition motif domain
IPR012677 - Nucleotide-binding alpha-beta plait domain superfamily
IPR025715 - Chromatin target of PRMT1 protein, C-terminal
IPR035979 - RNA-binding domain superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004145851.1 THO complex subunit 4D [Cucumis sativus]2.9e-13091.37Show/hide
Query:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT
        DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRK   + MKNVQWQHDLFEDSLRASGISGI+IGTKLYVSNLDYGVT
Subjt:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT

Query:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS
        KEDI+ELFSEIGD+KRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTG NGR+RRTVVLT ESGR A+S
Subjt:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS

Query:  NVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT
        NVVN FPGPS RGGLRNA GRGRG W+RG+GLGGG  G GRGRGRGRG+GQG+KKPVEKSSDELDKELENYHAEAMQT
Subjt:  NVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT

XP_008457020.1 PREDICTED: THO complex subunit 4D [Cucumis melo]9.2e-13292.45Show/hide
Query:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT
        DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRK   + MKNVQWQHDLFEDSLRASGISGI+IGTKLYVSNLDYGVT
Subjt:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT

Query:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS
        KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTG NGR+RRTVVLTPESGR A+ 
Subjt:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS

Query:  NVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT
        NVVNPFPGPS RGGLRNA GRGRG W RG+GLGG G GRGRGRGRGR  GQG+KKPVEKSSDELDKELENYHAEAMQT
Subjt:  NVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT

XP_022935328.1 THO complex subunit 4D-like [Cucurbita moschata]4.4e-12688.11Show/hide
Query:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT
        DVIKKNNREKLRARGRARRGRGAGGS+NGGR VVIGSVRRGPLGINAR SA+SI K   + MKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT
Subjt:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT

Query:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS
        KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNA+ PVSARINVTGVNGRSRRTVVLT ESGRT SS
Subjt:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS

Query:  NVVNPFPGPSQRGGLRN--ALGRGRGGWNRGL------GLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT
        + VNPFPGPS RGGLR+    GRGRGGW+RGL      GLGGGGRGRGRG G GRG+GQG+KKPVEKSS ELDKELENYHAEAMQT
Subjt:  NVVNPFPGPSQRGGLRN--ALGRGRGGWNRGL------GLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT

XP_023527122.1 THO complex subunit 4D [Cucurbita pepo subsp. pepo]1.2e-12688.46Show/hide
Query:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT
        DVIKKNNREKLRARGRARRGRGAGGS+NGGR VVIGSVRRGPLGINAR SA+SI K   + MKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT
Subjt:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT

Query:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS
        KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNA+ PVSARINVTGVNGRSRRTVVLT ESGRT SS
Subjt:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS

Query:  NVVNPFPGPSQRGGLRN--ALGRGRGGWNRGL------GLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT
        N VNPFPGPS RGGLR+    GRGRGGW+RGL      GLGGGGRGRGRG G GRG+GQG+KKPVEKSS ELDKELENYHAEAMQT
Subjt:  NVVNPFPGPSQRGGLRN--ALGRGRGGWNRGL------GLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT

XP_038896761.1 THO complex subunit 4D-like [Benincasa hispida]7.5e-13493.53Show/hide
Query:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT
        DVIKK+NREKLRARGRARRGRGAGGSFNGGRGVV+GSVRRGPLGINARASAYSIRK   + MKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGV+
Subjt:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT

Query:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS
        KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDG+PMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS
Subjt:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS

Query:  NVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT
        NVVNPFPGPS RGGLRN  GRGRGGWNRG G+GGGG GRGRGRGRGR  GQG+KKPVEKSSDELDKELENYHAEAMQT
Subjt:  NVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT

TrEMBL top hitse value%identityAlignment
A0A1S3C452 THO complex subunit 4D4.4e-13292.45Show/hide
Query:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT
        DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRK   + MKNVQWQHDLFEDSLRASGISGI+IGTKLYVSNLDYGVT
Subjt:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT

Query:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS
        KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTG NGR+RRTVVLTPESGR A+ 
Subjt:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS

Query:  NVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT
        NVVNPFPGPS RGGLRNA GRGRG W RG+GLGG G GRGRGRGRGR  GQG+KKPVEKSSDELDKELENYHAEAMQT
Subjt:  NVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT

A0A5D3BPA9 THO complex subunit 4D1.6e-9485.4Show/hide
Query:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKL---------------------------MKNVQWQHDLFE
        DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKL                           MKNVQWQHDLFE
Subjt:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKL---------------------------MKNVQWQHDLFE

Query:  DSLRASGISGIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSA
        DSLRASGISGI+IGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSA
Subjt:  DSLRASGISGIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSA

Query:  RINVTGVNGRSRRTVVLTPESGRTAS
        RINVTG NGR+RRTVVLT  SG TAS
Subjt:  RINVTGVNGRSRRTVVLTPESGRTAS

A0A6J1CP51 THO complex subunit 4D-like5.6e-11987.05Show/hide
Query:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT
        D+IKKNNREKLRARGRARRGRGAGGSFNGGR VVIGS+RRGPL IN R SA+SI K   + MKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT
Subjt:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT

Query:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS
        KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIE+LGDNAEMPVSARINVTG+NGRSRRTVVLT ESGRT SS
Subjt:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS

Query:  NVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT
         VVN FPGPS RG LR   GRGRGGW+RG G  GGGRGRGRGRGR    G G+KK VEKSSDELDK+LENYHAEAMQT
Subjt:  NVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT

A0A6J1FAB9 THO complex subunit 4D-like2.1e-12688.11Show/hide
Query:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT
        DVIKKNNREKLRARGRARRGRGAGGS+NGGR VVIGSVRRGPLGINAR SA+SI K   + MKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT
Subjt:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT

Query:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS
        KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNA+ PVSARINVTGVNGRSRRTVVLT ESGRT SS
Subjt:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS

Query:  NVVNPFPGPSQRGGLRN--ALGRGRGGWNRGL------GLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT
        + VNPFPGPS RGGLR+    GRGRGGW+RGL      GLGGGGRGRGRG G GRG+GQG+KKPVEKSS ELDKELENYHAEAMQT
Subjt:  NVVNPFPGPSQRGGLRN--ALGRGRGGWNRGL------GLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT

A0A6J1J564 THO complex subunit 4D-like1.4e-12585.47Show/hide
Query:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT
        DVIKKNNREKLRARGRARRGRGAGGS+NGGR VVIGSVRRGPLGINAR SA+SI K   + MKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT
Subjt:  DVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGVT

Query:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS
        KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNA+ PVSARINVTGVNGRSRRTVVLT ESGRT SS
Subjt:  KEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASS

Query:  NVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGG------------GGRGRGRGR------GRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT
        N VNPFPGPS RGGLR+  GRGRGGW+RGLG GG            GGRGRGRGR      G GRG+GQG+KKPVEKSS ELDKELENYHAEAMQT
Subjt:  NVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGG------------GGRGRGRGR------GRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT

SwissProt top hitse value%identityAlignment
Q58EA2 THO complex subunit 4-A2.6e-2837.68Show/hide
Query:  DVIKKNNREKLRARGRARRGRGA-GGSFNGGRGVVIGSVRRGPL-GINARASAYSI-------RKASFKLMKNV--QWQHDLFEDSLRASGISGIEIGTK
        D+IK N  ++   RGR   GRGA GGS  GG G  IG  R G   G+     +  +       R   +   K +  +WQHDLF+    A   +G+E G K
Subjt:  DVIKKNNREKLRARGRARRGRGA-GGSFNGGRGVVIGSVRRGPL-GINARASAYSI-------RKASFKLMKNV--QWQHDLFEDSLRASGISGIEIGTK

Query:  LYVSNLDYGVTKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVV
        L VSNLD+GV+  DI+ELF+E G LK+ A+HYD++GR  G+A+V + R++DA  A+K+YN V LDG+PM I+++    E                RR   
Subjt:  LYVSNLDYGVTKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVV

Query:  LTPESGRTASSNVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHA
                       P    S+ GG+     R RGG    LG   G R RGRG  RGRG+G G+    + S++ELD +L+ Y+A
Subjt:  LTPESGRTASSNVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHA

Q6NQ72 THO complex subunit 4D1.1e-6653.74Show/hide
Query:  DVIKKNNREKLRARGRAR-RGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGV
        +++K+    +   RG +R RGRG GG   GGRG   G  RRGPL +NAR S+++I K   + ++++ WQ  LFED LRA+G SG+E+GT+L+V+NLD GV
Subjt:  DVIKKNNREKLRARGRAR-RGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGV

Query:  TKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN--AEMPVSAR--INVTGVNGRSRRTVVLTP---
        T EDIRELFSEIG+++R+AIHYDKNGRPSG+AEVVY RRSDAF ALK+YNNVLLDG+PM++E+LG N  +E P+S R  +NVTG+NGR +RTVV+     
Subjt:  TKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN--AEMPVSAR--INVTGVNGRSRRTVVLTP---

Query:  --------ESGRTASSNVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT
                  GR  +  V    P  +Q+GG    +  GRGG+ R  G G GGRGRG GRG G       KKPVEKS+ +LDK+LE+YHA+AM T
Subjt:  --------ESGRTASSNVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT

Q8L719 THO complex subunit 4B1.7e-4043.52Show/hide
Query:  GYSFGYDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLF--EDSLRAS----------GIS
        G     D I K+NR+   +RGR   G G      GG G   G  RR    + AR + YS R    +   +  WQ+D+F  + S+ A+          G S
Subjt:  GYSFGYDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLF--EDSLRAS----------GIS

Query:  GIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNG
         IE GTKLY+SNLDYGV+ EDI+ELFSE+GDLKR+ IHYD++GR  G+AEVV++RR DA AA+KRYNNV LDGK MKIE++G N   P    +    +  
Subjt:  GIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNG

Query:  RSRRTVVLTPESGRTASSNVVNPFPGPSQRGGLRNALGRGRGGW---NRGLGLGGGGRGRGRG-RGR-GRGQGQGKKKPVEKSSDELDKELENYHAEAMQ
                 P +G   + N    F G        N  GRGRGG+    RG G GGG    GRG RGR GRG G G+ +    S+++LD EL+ YH EAM+
Subjt:  RSRRTVVLTPESGRTASSNVVNPFPGPSQRGGLRNALGRGRGGW---NRGLGLGGGGRGRGRG-RGR-GRGQGQGKKKPVEKSSDELDKELENYHAEAMQ

Query:  T
        T
Subjt:  T

Q8L773 THO complex subunit 4A5.5e-3944.12Show/hide
Query:  ARGRARRGRGAGGSFNGGRGVVIGSVRR-GPLGINARASAYSIRKASFKLMKNVQWQHDLF----EDSLRASGISGIEIGTKLYVSNLDYGVTKEDIREL
        A+ R  RG GAG +   G G   G  RR  P   + R++ Y   KA         W HD+F    ED       +GIE GTKLY+SNLDYGV  EDI+EL
Subjt:  ARGRARRGRGAGGSFNGGRGVVIGSVRR-GPLGINARASAYSIRKASFKLMKNVQWQHDLF----EDSLRASGISGIEIGTKLYVSNLDYGVTKEDIREL

Query:  FSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASSNVVNPFP
        F+E+G+LKR+ +H+D++GR  G+AEVVY+RR DA AA+K+YN+V LDGKPMKIE++G N +   +                     SGR A+ N      
Subjt:  FSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTASSNVVNPFP

Query:  GPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEK-SSDELDKELENYHAEAMQT
        G   RG      G+GRGG  RG G GGGGRG   G GRGR  G+G   P EK S+++LD +L+ YH+  M+T
Subjt:  GPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEK-SSDELDKELENYHAEAMQT

Q94EH8 THO complex subunit 4C3.6e-6252.48Show/hide
Query:  DVIKKNNREKLRA-----RGRARR-GRGAGGS---FNGGRGVVIGSVRRGPLGINAR-ASAYSIRKASFKLMKNVQW--QHDLFEDSLRASGISGIEIGT
        +++KK+  E+  A     +G +R+ GRG GG      GGRG   G VRRGPL +N R +S++SI K + +  +++ W  Q+DL+E++LRA G+SG+E+GT
Subjt:  DVIKKNNREKLRA-----RGRARR-GRGAGGS---FNGGRGVVIGSVRRGPLGINAR-ASAYSIRKASFKLMKNVQW--QHDLFEDSLRASGISGIEIGT

Query:  KLYVSNLDYGVTKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAE-MPVSARINVTGVNGRSRRT
         +Y++NLD GVT EDIREL++EIG+LKR+AIHYDKNGRPSGSAEVVY RRSDA  A+++YNNVLLDG+PMK+E+LG N E  PV+AR+NVTG+NGR +R+
Subjt:  KLYVSNLDYGVTKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAE-MPVSARINVTGVNGRSRRT

Query:  VVLTPESGRTASSNVVNPFPGPSQRGGLRNALGRGRGGWNRGLGL-----------GGGGRGRGRGRGRGRGQ---GQGKKKPVEKSSDELDKELENYHA
        V                 F G   RGG R   GRG G   R L L            GG RGRGRG G GRG    G+G KKPVEKS+ +LDK+LE+YHA
Subjt:  VVLTPESGRTASSNVVNPFPGPSQRGGLRNALGRGRGGWNRGLGL-----------GGGGRGRGRGRGRGRGQ---GQGKKKPVEKSSDELDKELENYHA

Query:  EAM
        EAM
Subjt:  EAM

Arabidopsis top hitse value%identityAlignment
AT1G66260.1 RNA-binding (RRM/RBD/RNP motifs) family protein2.5e-6352.48Show/hide
Query:  DVIKKNNREKLRA-----RGRARR-GRGAGGS---FNGGRGVVIGSVRRGPLGINAR-ASAYSIRKASFKLMKNVQW--QHDLFEDSLRASGISGIEIGT
        +++KK+  E+  A     +G +R+ GRG GG      GGRG   G VRRGPL +N R +S++SI K + +  +++ W  Q+DL+E++LRA G+SG+E+GT
Subjt:  DVIKKNNREKLRA-----RGRARR-GRGAGGS---FNGGRGVVIGSVRRGPLGINAR-ASAYSIRKASFKLMKNVQW--QHDLFEDSLRASGISGIEIGT

Query:  KLYVSNLDYGVTKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAE-MPVSARINVTGVNGRSRRT
         +Y++NLD GVT EDIREL++EIG+LKR+AIHYDKNGRPSGSAEVVY RRSDA  A+++YNNVLLDG+PMK+E+LG N E  PV+AR+NVTG+NGR +R+
Subjt:  KLYVSNLDYGVTKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAE-MPVSARINVTGVNGRSRRT

Query:  VVLTPESGRTASSNVVNPFPGPSQRGGLRNALGRGRGGWNRGLGL-----------GGGGRGRGRGRGRGRGQ---GQGKKKPVEKSSDELDKELENYHA
        V                 F G   RGG R   GRG G   R L L            GG RGRGRG G GRG    G+G KKPVEKS+ +LDK+LE+YHA
Subjt:  VVLTPESGRTASSNVVNPFPGPSQRGGLRNALGRGRGGWNRGLGL-----------GGGGRGRGRGRGRGRGQ---GQGKKKPVEKSSDELDKELENYHA

Query:  EAM
        EAM
Subjt:  EAM

AT1G66260.2 RNA-binding (RRM/RBD/RNP motifs) family protein2.5e-6352.48Show/hide
Query:  DVIKKNNREKLRA-----RGRARR-GRGAGGS---FNGGRGVVIGSVRRGPLGINAR-ASAYSIRKASFKLMKNVQW--QHDLFEDSLRASGISGIEIGT
        +++KK+  E+  A     +G +R+ GRG GG      GGRG   G VRRGPL +N R +S++SI K + +  +++ W  Q+DL+E++LRA G+SG+E+GT
Subjt:  DVIKKNNREKLRA-----RGRARR-GRGAGGS---FNGGRGVVIGSVRRGPLGINAR-ASAYSIRKASFKLMKNVQW--QHDLFEDSLRASGISGIEIGT

Query:  KLYVSNLDYGVTKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAE-MPVSARINVTGVNGRSRRT
         +Y++NLD GVT EDIREL++EIG+LKR+AIHYDKNGRPSGSAEVVY RRSDA  A+++YNNVLLDG+PMK+E+LG N E  PV+AR+NVTG+NGR +R+
Subjt:  KLYVSNLDYGVTKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAE-MPVSARINVTGVNGRSRRT

Query:  VVLTPESGRTASSNVVNPFPGPSQRGGLRNALGRGRGGWNRGLGL-----------GGGGRGRGRGRGRGRGQ---GQGKKKPVEKSSDELDKELENYHA
        V                 F G   RGG R   GRG G   R L L            GG RGRGRG G GRG    G+G KKPVEKS+ +LDK+LE+YHA
Subjt:  VVLTPESGRTASSNVVNPFPGPSQRGGLRNALGRGRGGWNRGLGL-----------GGGGRGRGRGRGRGRGQ---GQGKKKPVEKSSDELDKELENYHA

Query:  EAM
        EAM
Subjt:  EAM

AT5G02530.1 RNA-binding (RRM/RBD/RNP motifs) family protein1.2e-4143.52Show/hide
Query:  GYSFGYDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLF--EDSLRAS----------GIS
        G     D I K+NR+   +RGR   G G      GG G   G  RR    + AR + YS R    +   +  WQ+D+F  + S+ A+          G S
Subjt:  GYSFGYDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLF--EDSLRAS----------GIS

Query:  GIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNG
         IE GTKLY+SNLDYGV+ EDI+ELFSE+GDLKR+ IHYD++GR  G+AEVV++RR DA AA+KRYNNV LDGK MKIE++G N   P    +    +  
Subjt:  GIEIGTKLYVSNLDYGVTKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNG

Query:  RSRRTVVLTPESGRTASSNVVNPFPGPSQRGGLRNALGRGRGGW---NRGLGLGGGGRGRGRG-RGR-GRGQGQGKKKPVEKSSDELDKELENYHAEAMQ
                 P +G   + N    F G        N  GRGRGG+    RG G GGG    GRG RGR GRG G G+ +    S+++LD EL+ YH EAM+
Subjt:  RSRRTVVLTPESGRTASSNVVNPFPGPSQRGGLRNALGRGRGGW---NRGLGLGGGGRGRGRG-RGR-GRGQGQGKKKPVEKSSDELDKELENYHAEAMQ

Query:  T
        T
Subjt:  T

AT5G37720.1 ALWAYS EARLY 47.6e-6853.74Show/hide
Query:  DVIKKNNREKLRARGRAR-RGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGV
        +++K+    +   RG +R RGRG GG   GGRG   G  RRGPL +NAR S+++I K   + ++++ WQ  LFED LRA+G SG+E+GT+L+V+NLD GV
Subjt:  DVIKKNNREKLRARGRAR-RGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGV

Query:  TKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN--AEMPVSAR--INVTGVNGRSRRTVVLTP---
        T EDIRELFSEIG+++R+AIHYDKNGRPSG+AEVVY RRSDAF ALK+YNNVLLDG+PM++E+LG N  +E P+S R  +NVTG+NGR +RTVV+     
Subjt:  TKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN--AEMPVSAR--INVTGVNGRSRRTVVLTP---

Query:  --------ESGRTASSNVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT
                  GR  +  V    P  +Q+GG    +  GRGG+ R  G G GGRGRG GRG G       KKPVEKS+ +LDK+LE+YHA+AM T
Subjt:  --------ESGRTASSNVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT

AT5G37720.2 ALWAYS EARLY 49.0e-6955.24Show/hide
Query:  DVIKKNNREKLRARGRAR-RGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGV
        +++K+    +   RG +R RGRG GG   GGRG   G  RRGPL +NAR S+++I K   + ++++ WQ  LFED LRA+G SG+E+GT+L+V+NLD GV
Subjt:  DVIKKNNREKLRARGRAR-RGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSNLDYGV

Query:  TKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN--AEMPVSAR--INVTGVNGRSRRTVVLTPESG
        T EDIRELFSEIG+++R+AIHYDKNGRPSG+AEVVY RRSDAF ALK+YNNVLLDG+PM++E+LG N  +E P+S R  +NVTG+NGR +RTVV+    G
Subjt:  TKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDN--AEMPVSAR--INVTGVNGRSRRTVVLTPESG

Query:  RTA---SSNVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT
        R     +  V    P  +Q+GG    +  GRGG+ R  G G GGRGRG GRG G       KKPVEKS+ +LDK+LE+YHA+AM T
Subjt:  RTA---SSNVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGAAAAGGTCGCCGCAGCCGCCGCCTGTCGCCAGAAGAATCTCAGTTTCTCTCTCAGACGCCCTAAAAATCCCACACGCACCCTATCACTTTCCATCATCAAT
CATCATCCCCTCGGAACCCTCTCTTTGATCTTGTTCAACTTTTTTTCTTCGCCCTCTCTCGCTCTCTCGGAAGTCCTTCGACTGTTTCTAGGGATAAGCTTCAGG
CTTGAGGTGAACCAAAATGCAATAAATTTGGGGAACATAAAGTATGAGGCTTATGCTTCACATTGTCTCAGACTTCTTTTCTATTATTCCTTGAAATCTGTATCC
TCCTACTACACCGATGGCTACTCCTTTGGATATGATGTGATAAAGAAGAATAACCGTGAGAAGCTTAGAGCACGAGGTAGGGCCCGTCGTGGGCGTGGAGCAGGT
GGGTCTTTTAATGGTGGAAGAGGAGTAGTGATAGGATCAGTTCGTAGAGGTCCTCTCGGCATAAACGCACGGGCATCTGCTTACTCAATTCGCAAGGCAAGCTTC
AAACTAATGAAGAATGTTCAATGGCAGCATGATTTATTTGAAGATAGTCTTAGAGCTTCAGGGATTTCTGGAATTGAAATTGGCACAAAGTTGTATGTTTCCAAC
TTGGATTATGGGGTGACCAAAGAAGATATAAGGGAGTTGTTCTCTGAGATTGGAGACCTGAAAAGATTTGCAATTCATTATGACAAAAATGGTCGTCCAAGCGGC
TCAGCAGAGGTGGTATATACTCGAAGAAGTGATGCATTTGCTGCTCTGAAGCGCTATAACAATGTGTTATTGGATGGGAAGCCAATGAAGATTGAAATGCTTGGT
GATAATGCTGAAATGCCGGTTTCTGCACGTATAAATGTTACTGGAGTGAATGGAAGAAGCAGGAGGACAGTTGTTCTAACGCCTGAATCTGGTCGTACTGCTAGT
TCTAACGTGGTCAACCCTTTTCCTGGTCCAAGCCAGCGTGGAGGGCTGAGGAATGCCCTTGGCCGTGGGCGAGGTGGCTGGAACCGTGGTCTAGGTCTAGGTGGA
GGAGGCCGTGGCCGAGGGCGTGGTCGTGGCCGTGGCCGTGGCCAGGGCCAGGGAAAAAAGAAACCTGTGGAGAAGTCTTCAGATGAACTTGACAAGGAGCTTGAA
AACTACCATGCAGAAGCCATGCAAACCTGA
mRNA sequenceShow/hide mRNA sequence
ATGGAAAAGGTCGCCGCAGCCGCCGCCTGTCGCCAGAAGAATCTCAGTTTCTCTCTCAGACGCCCTAAAAATCCCACACGCACCCTATCACTTTCCATCATCAAT
CATCATCCCCTCGGAACCCTCTCTTTGATCTTGTTCAACTTTTTTTCTTCGCCCTCTCTCGCTCTCTCGGAAGTCCTTCGACTGTTTCTAGGGATAAGCTTCAGG
CTTGAGGTGAACCAAAATGCAATAAATTTGGGGAACATAAAGTATGAGGCTTATGCTTCACATTGTCTCAGACTTCTTTTCTATTATTCCTTGAAATCTGTATCC
TCCTACTACACCGATGGCTACTCCTTTGGATATGATGTGATAAAGAAGAATAACCGTGAGAAGCTTAGAGCACGAGGTAGGGCCCGTCGTGGGCGTGGAGCAGGT
GGGTCTTTTAATGGTGGAAGAGGAGTAGTGATAGGATCAGTTCGTAGAGGTCCTCTCGGCATAAACGCACGGGCATCTGCTTACTCAATTCGCAAGGCAAGCTTC
AAACTAATGAAGAATGTTCAATGGCAGCATGATTTATTTGAAGATAGTCTTAGAGCTTCAGGGATTTCTGGAATTGAAATTGGCACAAAGTTGTATGTTTCCAAC
TTGGATTATGGGGTGACCAAAGAAGATATAAGGGAGTTGTTCTCTGAGATTGGAGACCTGAAAAGATTTGCAATTCATTATGACAAAAATGGTCGTCCAAGCGGC
TCAGCAGAGGTGGTATATACTCGAAGAAGTGATGCATTTGCTGCTCTGAAGCGCTATAACAATGTGTTATTGGATGGGAAGCCAATGAAGATTGAAATGCTTGGT
GATAATGCTGAAATGCCGGTTTCTGCACGTATAAATGTTACTGGAGTGAATGGAAGAAGCAGGAGGACAGTTGTTCTAACGCCTGAATCTGGTCGTACTGCTAGT
TCTAACGTGGTCAACCCTTTTCCTGGTCCAAGCCAGCGTGGAGGGCTGAGGAATGCCCTTGGCCGTGGGCGAGGTGGCTGGAACCGTGGTCTAGGTCTAGGTGGA
GGAGGCCGTGGCCGAGGGCGTGGTCGTGGCCGTGGCCGTGGCCAGGGCCAGGGAAAAAAGAAACCTGTGGAGAAGTCTTCAGATGAACTTGACAAGGAGCTTGAA
AACTACCATGCAGAAGCCATGCAAACCTGAGGAATTTCAAATATGCAAAAATCGAAGTATGATCTGATTAACCACTTATGTTAGCTGTGTAAGAATATATATAGC
ATTCTCGGGGGTGATTATTTATTTTATTTTAATTTTTGTTCCAGTAGACTAGATTTGTATTTTGCCTGTTAATGGAGAATGATTCCGTTTGACCCTCTGTTATCG
AAACTTCTACCTTTTTCGGTTGATCCTGAATGGAACGAGCTCGGATCATTGATCTCTCAAATAGGTAAATTGCTTTATGTATAAAGGATTTAGTTTAGTTGATAC
ATTGTTAAGAATGGGAATATCCTGTATTTAAAGGACCTATTCTTCAAAACCTTGTCGTCTGGCCATCAAGTATCTCTACACTGTAACTCCTCTTTTCACTTGCTA
TTGAGCTTCTCATTCCCTTATCTCCTTTTTTATCTACTCTCTAAGATGTAGACCTGTGCTTGATCAAGATGATAAATTTTTTGGCTGATCGAAGTTTATGTTTTG
CTCGATCTGCTATCATGTTTTATTCTCAATTGCTATTTGATCAATTGAATTGATTGCTTCATTTTCTAAGATGTTAGTTCATAT
Protein sequenceShow/hide protein sequence
MEKVAAAAACRQKNLSFSLRRPKNPTRTLSLSIINHHPLGTLSLILFNFFSSPSLALSEVLRLFLGISFRLEVNQNAINLGNIKYEAYASHCLRLLFYYSLKSVS
SYYTDGYSFGYDVIKKNNREKLRARGRARRGRGAGGSFNGGRGVVIGSVRRGPLGINARASAYSIRKASFKLMKNVQWQHDLFEDSLRASGISGIEIGTKLYVSN
LDYGVTKEDIRELFSEIGDLKRFAIHYDKNGRPSGSAEVVYTRRSDAFAALKRYNNVLLDGKPMKIEMLGDNAEMPVSARINVTGVNGRSRRTVVLTPESGRTAS
SNVVNPFPGPSQRGGLRNALGRGRGGWNRGLGLGGGGRGRGRGRGRGRGQGQGKKKPVEKSSDELDKELENYHAEAMQT