1
61
121
181
241
301
361
421
481
541
601
661
721
781
841
901
961
1021
1081
1141
1201
1261
1321
1381
1441
1501
1561
1621
1681
1741
1801
1861
1921
1981
2041
2101
2161
2221
2281
2341
2401
2461
2521
2581
2641
2701
2761
2821
2881
2941
3001
3061
3121
3181
3241
3301
3361
3421
3481
3541
3601
3661
3721
3781
3841
3901
3961
4021
4081
4141
4201
4261
4321
4381
4441
4501
4561
4621
4681
4741
4801
4861
4921
4981
5041
5101
5161
5221
5281
ATGAATAAAGGATTATTTGAAAAACGTTGTAAATATAGTATTCGGAAATTTTCATTAGGT
GTTGCTTCTGTTATGATTGGAGCTACATTCTTTGGGACAAGTCCGGTTCTTGCAGATAGC
GTGCAGTCTGGTTCCACGGCGAACTTACCAGCTGATTTAGCTACTGCTCTTGCAACAGCA
AAAGAGAATGATGGGCATGATTTTGAAGCGCCTAAGGTGGGAGAAGACCAAGGTTCTCCA
GAAGTTACAGATGGACCTAAGACAGAAGAAGAACTATTAGCACTTGAAAAAGAAAAACCG
GCTGAAGAAAAACCAAAAGAGGATAAACCTGCAGCTGCTAAACCTGAAACACCTAAGACG
GTAACCCCTGAATGGCAAACGGTAGAGAAAAAAGAACAACAGGGAACAGTCACTATCCGA
GAAGAAAAAGGTGTCCGCTACAACCAATTATCCTCAACTGCTCAAAATGATAACGCAGGT
AAACCAGCCCTGTTTGAAAAGAAGGGCTTGACCGTTGATGCCAATGGAAATGCAACTGTT
GATTTAACCTTCAAAGATGATTCTGAAAAGGGCAAATCACGCTTTGGTGTCTTCTTGAAA
TTTAAAGATACCAAGAATAATGTTTTTGTCGGTTACGACAAGGATGGCTGGTTCTGGGAG
TATAAATCTCCAACAACTAGCACTTGGTATAGAGGTAGTCGTGTTGCTGCTCCTGAAACA
GGATCAACAAACCGTCTCTCTATCACTCTCAAGTCAGACGGTCAGCTAAATGCCAGCAAT
AACGATGTCAATCTCTTTGACACAGTGACTCTACCAGCTGCGGTCAATGACCATCTTAAA
AATGAGAAGAAGATTCTTCTCAAGGCGGGCTCTTATGACGATGAGCGAACAGTTGTTAGC
GTTAAAACGGATAACCAAGAGGGGGTAAAAACAGAGGATACCCCTGCTGAAAAAGAAACA
GGTCCTGAAGTTGATGATAGCAAGGTGACTTATGACACGATTCAGTCTAAGGTTCTCAAA
GCAGTGATTGACCAAGCCTTCCCTCGTGTCAAGGAATACAGCTTGAATGGACATACTTTG
CCAGGACAGGTTCAACAGTTCAACCAAGTCTTTATCAATAACCACCGAATCACCCCTGAA
GTCACTTATAAGAAAATCAATGAGACAACAGCAGAGTACTTGATGAAGCTTCGCGATGAT
GCTCACTTAATCAATGCGGAAATGACAGTACGCTTGCAAGTTGTGGACAATCAATTGCAC
TTTGATGTGACCAAGATTGTCAACCACAATCAAGTCACTCCAGGTCAAAAGATTGATGAC
GAAAGAAAACTACTTTCTTCTATTAGTTTCCTCGGCAATGCTTTAGTCTCTGTTTCTAGT
GATCAAACTGGTGCTAAGTTTGATGGGGCAACCATGTCAAACAATACGCATGTCAGCGGA
GATGATCATATCGATGTAACCAATCCAATGAAAGATCTAGCCAAGGGTTACATGTATGGA
TTTGTTTCTACAGATAAGCTTGCTGCTGGTGTTTGGAGTAACTCTCAAAACAGCTATGGT
GGTGGTTCGAATGACTGGACTCGTTTGACAGCCTATAAAGAAACAGTCGGAAATGCCAAC
TATGTAGGAATCCACAGCTCTGAATGGCAATGGGAAAAAGCTTATAAGGGCATTGTTTTC
CCAGAATACACGAAGGAACTTCCAAGTGCTAAGGTTGTTATCACTGAAGATGCCAATGCA
GACAAGAAAGTCGATTGGCAGGATGGTGCCATTGCTTATCGTAGCATTATGAACAATCCT
CAAGGTTGGAAAAAAGTTAAGGATATCACAGCTTACCGTATCGCGATGAACTTTGGTTCT
CAAGCACAAAACCCATTCCTTATGACCTTGGATGGTATCAAGAAAATCAATCTCCACACA
GATGGTCTTGGGCAAGGTGTTCTCCTTAAAGGATATGGTAGCGAAGGCCATGACTCTGGT
CACTTGAACTATGCTGATATTGGTAAGCGTATCGGTGGTGTCGAAGACTTCAAGACCCTA
ATTGAGAAGGCTAAGAAATATGGAGCTCATCTAGGTATCCACGTTAACGCTTCAGAAACT
TATCCTGAGTCTAAATACTTCAATGAAAAAATTCTCCGTAAGAATCCAGATGGAAGCTAT
AGCTATGGTTGGAACTGGCTAGATCAAGGTATCAACATTGATGCTGCCTATGACCTAGCT
CATGGTCGTTTGGCACGTTGGGAAGATTTGAAGAAAAAACTTGGTGACGGTCTCGACTTT
ATCTATGTGGACGTTTGGGGTAATGGTCAATCAGGTGATAACGGTGCCTGGGCTACCCAC
GTTCTTGCTAAAGAAATTAACAAACAAGGCTGGCGCTTTGCGATCGAGTGGGGCCATGGT
GGTGAGTACGACTCTACCTTCCATCACTGGGCAGCTGACTTGACCTACGGTGGCTACACC
AATAAAGGTATCAACAGTGCCATCACCCGCTTTATACGTAACCACCAAAAAGATGCTTGG
GTAGGGGACTACAGAAGTTATGGTGGTGCAGCCAACTATCCACTGCTAGGTGGCTACAGC
ATGAAAGACTTTGAAGGCTGGCAAGGAAGAAGTGACTACAATGGCTATGTAACTAACTTA
TTTGCCCATGACGTCATGACCAAGTACTTCCAACACTTCACTGTAAGTAAATGGGAAAAT
GGTACACCGGTGACTATGACCGATAACGGTAGCACCTATAAATGGACTCCAGAAATGCGA
GTGGAATTGGTAGATGCTGACAATAATAAAGTAGTTGTAACTCGTAAGTCAAATGATGTC
AATAGTCCACAATATCGCGAACGTACAGTAACTCTCAACGGACGTGTCATCCAAGATGGT
TCAGCTTACTTGACTCCTTGGAACTGGGATGCAAATGGTAAGAAACTTTCTACTGATAAG
GAAAAGATGTACTACTTCAATACGCAGGCCGGTGCAACAACTTGGACCCTTCCAAGCGAT
TGGGCAAAGAGCAAGGTTTACCTTTACAAGCTAACTGACCAAGGTAAGACAGAAGAGCAA
GAACTAACTGTAAAAGATGGTAAAATTACCCTAGATCTTCTAGCAAATCAACCATACGTT
CTCTATCGTTCGAAACAAACCAATCCTGAAATGTCATGGAGTGAAGGCATGCACATCTAT
GACCAAGGATTTAACAGTGGTACCTTGAAACATTGGACCATTTCAGGCGATGCTTCTAAG
GCAGAAATTGTCAAGTCTCAAGGGGCAAACGATATGCTTCGTATTCAAGGAAACAAAGAA
AAAGTTAGTCTCACTCAGAAATTAACTGGCTTGAAACCAAATACCAAGTATGCCGTTTAT
GTCGGTGTCGATAACCGTAGTAATGCCAAGGCGAGCATCACTGTAAATACTGGTGAAAAA
GAAGTGACTACTTATACCAATAAGTCTCTCGCCCTCAACTATGTAAAAGCCTATGCCCAC
AATACACGTCGTAACAATGCTACAGTTGACGATACAAGTTACTTCCAAAACATGTACGCC
TTCTTTACAACTGGATCGGACGTATCAAATGTTACTCTGACATTGAGTCGTGAAGCTGGT
GATGAAGCAACTTACTTTGATGAAATTCGTACCTTTGAAAACAATTCAAGCATGTACGGA
GACAAGCATGATACAGGTAAAGGCACCTTCAAGCAAGACTTTGAAAATGTTGCTCAGGGT
ATCTTCCCATTTGTAGTGGGTGGTGTCGAAGGTGTCGAAGACAACCGCACTCACTTGTCT
GAAAAACACGATCCATATACACAACGTGGTTGGAATGGTAAGAAAGTCGATGATGTTATC
GAAGGAAATTGGTCACTCAAGACAAATGGACTAGTGAGCCGTCGTAACTTGGTTTACCAA
ACTATTCCGCAAAACTTCCGTTTTGAAGCAGGTAAGACCTACCGTGTAACCTTTGAATAC
GAAGCAGGTTCAGACAATACCTATGCTTTTGTAGTCGGTAAGGGAGAATTCCAGTCAGGT
CGTCGTGGTACTCAAGCAAGCAACTTGGAAATGCATGAATTGCCAAATACTTGGACAGAT
TCTAAGAAAGCCAAGAAGGCAACCTTCCTCGTGACAGGTGCAGAAACAGGGGATACTTGG
GTAGGTATCTACTCAACTGGAAATGCAAGTAATACTCGTGGTGATTCTGGTGGAAATGCC
AACTTCCGTGGTTATAACGACTTCATGATGGATAATCTTCAAATCGAAGAAATTACCCTA
ACAGGTAAGATGTTGACAGAAAATGCTCTGAAGAACTACTTGCCAACGGTTGCCATGACT
AACTACACCAAAGAGTCTATGGATGCTTTGAAAGAGGCGGTCTTTAACCTCAGTCAGGCC
GATGATGATATCAGTGTGGAAGAAGCGCGTGCAGAGATTGCCAAGATTGAAGCCTTGAAG
AATGCTTTGGTTCAGAAGAAAACGGCTTTGGTAGCAGATGACTTTGCAAGTCTTACAGCT
CCTGCTCAGGCTCAAGAAGGTCTTGCAAATGCCTTTGATGGAAACTTATCTAGTTTATGG
CATACATCATGGGGCGGAGGAGATGTAGGCAAGCCTGCAACCATGGTCTTGAAAGAAGCA
ACTGAAATCACTGGACTTCGTTATGTTCCACGTGGATCAGGTTCAAATGGTAACTTGCGT
GATGTGAAACTTGTTGTGACAGATGAGTCTGGCAAGGAGCATACCTTTACTGCAACTGAT
TGGCCAGATAACAATAAGCCAAAAGACATTGATTTTGGTAAGACAATTAAGGCTAAGAAA
ATTGTCCTTACAGGTACTAAGACTTACGGAGATGGTGGCGATAAATACCAATCTGCAGCG
GAACTCATCTTTACTCGTCCACAGGTAGCAGAAACACCTCTTGACTTGTCAGGCTATGAA
GCAGCTTTGGCTAAGGCTCAGAAATTAACAGACAAAGACAATCAAGAGGAAGTAGCTAGC
GTTCAGGCAAGCATGAAATATGCGACGGATAACCATCTCTTGACGGAAAGAATGGTGGAA
TACTTTGCAGATTATCTCAACCAATTAAAAGATTCTGCTACGAAACCAGATGCTCCAACT
GTAGAGAAACCTGAGTTTAAACTTAGCTCTGTAGCTTCCGATCAAGGTAAGACGCCAGAT
TATAAGCAAGAAATAGCTAGACCAGAAACACCTGAACAAATCTTGCCAGCAACAGGTGAG
AGTCAATTTGACACAGCCCTCTTCCTAGCAAGTGTTAGCCTAGCCCTATCTGCTCTCTTT
GTAGTAAAAACGAAGAAAGACTAG
60
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
1380
1440
1500
1560
1620
1680
1740
1800
1860
1920
1980
2040
2100
2160
2220
2280
2340
2400
2460
2520
2580
2640
2700
2760
2820
2880
2940
3000
3060
3120
3180
3240
3300
3360
3420
3480
3540
3600
3660
3720
3780
3840
3900
3960
4020
4080
4140
4200
4260
4320
4380
4440
4500
4560
4620
4680
4740
4800
4860
4920
4980
5040
5100
5160
5220
5280
5304

⊟Protein[edit | edit source]

⊟General[edit | edit source]

locus tag: SPV_RS01825 [old locus tag: SPV_0335 ]
symbol: SPV_RS01825
description: SpGH101 family endo-alpha-N-acetylgalactosaminidase
length: 1767
theoretical pI: 5.918
theoretical MW: 196143
GRAVY: -0.660498

⊟Function[edit | edit source]

reaction:
EC 3.2.1.97? ExPASy
Endo-alpha-N-acetylgalactosaminidase 3-O-beta-D-galactosyl-N-acetyl-alpha-D-galactosaminyl-L-serine-[protein] + H₂O = 3-O-beta-D-galactosyl-N-acetyl-alpha-D-galactosamine + L-serine-[protein]
TIGRFAM:
gram-positive signal peptide, YSIRK family (TIGR01168; HMM-score: 54.6)
and 1 more
Cell structure Cell envelope Other LPXTG cell wall anchor domain (TIGR01167; HMM-score: 17.2)
TheSEED: data available for D39, Hungary19A-6, TIGR4
PFAM:
Glyco_hydro_tim (CL0058) Glyco_hydro_101; Endo-alpha-N-acetylgalactosaminidase (PF12905; HMM-score: 412.9)
and 8 more
Concanavalin (CL0004) GalBD_like; Galactose-binding domain-like (PF17974; HMM-score: 296.6)
Gal_mutarotase (CL0103) Gal_mutarotas_3; Galactose mutarotase-like fold domain (PF18080; HMM-score: 295.9)
GBD (CL0202) GH101_N; Endo-alpha-N-acetylgalactosaminidase N-terminal (PF17995; HMM-score: 273.9)
GHD (CL0369) Glyco_hyd_101C; Glycosyl hydrolase 101 beta sandwich domain (PF17451; HMM-score: 145.4)
no clan defined YSIRK_signal; YSIRK type signal peptide (PF04650; HMM-score: 48.5)
GBD (CL0202) F5_F8_type_C; F5/8 type C domain (PF00754; HMM-score: 45.2)
no clan defined Gram_pos_anchor; LPXTG cell wall anchor motif (PF00746; HMM-score: 15.8)
WW (CL0680) WW; WW domain (PF00397; HMM-score: 15.6)

⊟Structure, modifications & cofactors[edit | edit source]

domains:
modifications:
cofactors:
effectors:

⊟Localization[edit | edit source]

PSORTb: Cellwall
- Cytoplasmic Score: 0
- Cytoplasmic Membrane Score: 0
- Cellwall Score: 9.97
- Extracellular Score: 0.03
- Internal Helices: 0
DeepLocPro: Cell wall & surface
- Cytoplasmic Score: 0.0004
- Cytoplasmic Membrane Score: 0.0176
- Cell wall & surface Score: 0.6672
- Extracellular Score: 0.3147
SignalP: Signal peptide SP(Sec/SPI) length 38 aa
- SP(Sec/SPI): 0.984774
- TAT(Tat/SPI): 0.010761
- LIPO(Sec/SPII): 0.001368
- Cleavage Site: CS pos: 38-39. VLA-DS. Pr: 0.9461
predicted transmembrane helices (TMHMM): 1

⊟Accession numbers[edit | edit source]

GI:
RefSeq: WP_001032523 NCBI
UniProt:

⊟Protein sequence[edit | edit source]

MNKGLFEKRCKYSIRKFSLGVASVMIGATFFGTSPVLADSVQSGSTANLPADLATALATAKENDGHDFEAPKVGEDQGSPEVTDGPKTEEELLALEKEKPAEEKPKEDKPAAAKPETPKTVTPEWQTVEKKEQQGTVTIREEKGVRYNQLSSTAQNDNAGKPALFEKKGLTVDANGNATVDLTFKDDSEKGKSRFGVFLKFKDTKNNVFVGYDKDGWFWEYKSPTTSTWYRGSRVAAPETGSTNRLSITLKSDGQLNASNNDVNLFDTVTLPAAVNDHLKNEKKILLKAGSYDDERTVVSVKTDNQEGVKTEDTPAEKETGPEVDDSKVTYDTIQSKVLKAVIDQAFPRVKEYSLNGHTLPGQVQQFNQVFINNHRITPEVTYKKINETTAEYLMKLRDDAHLINAEMTVRLQVVDNQLHFDVTKIVNHNQVTPGQKIDDERKLLSSISFLGNALVSVSSDQTGAKFDGATMSNNTHVSGDDHIDVTNPMKDLAKGYMYGFVSTDKLAAGVWSNSQNSYGGGSNDWTRLTAYKETVGNANYVGIHSSEWQWEKAYKGIVFPEYTKELPSAKVVITEDANADKKVDWQDGAIAYRSIMNNPQGWKKVKDITAYRIAMNFGSQAQNPFLMTLDGIKKINLHTDGLGQGVLLKGYGSEGHDSGHLNYADIGKRIGGVEDFKTLIEKAKKYGAHLGIHVNASETYPESKYFNEKILRKNPDGSYSYGWNWLDQGINIDAAYDLAHGRLARWEDLKKKLGDGLDFIYVDVWGNGQSGDNGAWATHVLAKEINKQGWRFAIEWGHGGEYDSTFHHWAADLTYGGYTNKGINSAITRFIRNHQKDAWVGDYRSYGGAANYPLLGGYSMKDFEGWQGRSDYNGYVTNLFAHDVMTKYFQHFTVSKWENGTPVTMTDNGSTYKWTPEMRVELVDADNNKVVVTRKSNDVNSPQYRERTVTLNGRVIQDGSAYLTPWNWDANGKKLSTDKEKMYYFNTQAGATTWTLPSDWAKSKVYLYKLTDQGKTEEQELTVKDGKITLDLLANQPYVLYRSKQTNPEMSWSEGMHIYDQGFNSGTLKHWTISGDASKAEIVKSQGANDMLRIQGNKEKVSLTQKLTGLKPNTKYAVYVGVDNRSNAKASITVNTGEKEVTTYTNKSLALNYVKAYAHNTRRNNATVDDTSYFQNMYAFFTTGSDVSNVTLTLSREAGDEATYFDEIRTFENNSSMYGDKHDTGKGTFKQDFENVAQGIFPFVVGGVEGVEDNRTHLSEKHDPYTQRGWNGKKVDDVIEGNWSLKTNGLVSRRNLVYQTIPQNFRFEAGKTYRVTFEYEAGSDNTYAFVVGKGEFQSGRRGTQASNLEMHELPNTWTDSKKAKKATFLVTGAETGDTWVGIYSTGNASNTRGDSGGNANFRGYNDFMMDNLQIEEITLTGKMLTENALKNYLPTVAMTNYTKESMDALKEAVFNLSQADDDISVEEARAEIAKIEALKNALVQKKTALVADDFASLTAPAQAQEGLANAFDGNLSSLWHTSWGGGDVGKPATMVLKEATEITGLRYVPRGSGSNGNLRDVKLVVTDESGKEHTFTATDWPDNNKPKDIDFGKTIKAKKIVLTGTKTYGDGGDKYQSAAELIFTRPQVAETPLDLSGYEAALAKAQKLTDKDNQEEVASVQASMKYATDNHLLTERMVEYFADYLNQLKDSATKPDAPTVEKPEFKLSSVASDQGKTPDYKQEIARPETPEQILPATGESQFDTALFLASVSLALSALFVVKTKKD

Navigation menu

Contents

⊟Summary[edit | edit source]

⊟Genome View[edit | edit source]

⊟Gene[edit | edit source]

⊟General[edit | edit source]

⊟Accession numbers[edit | edit source]

⊟Phenotype[edit | edit source]

⊟DNA sequence[edit | edit source]

⊟Protein[edit | edit source]

⊟General[edit | edit source]

⊟Function[edit | edit source]

⊟Structure, modifications & cofactors[edit | edit source]

⊟Localization[edit | edit source]

⊟Accession numbers[edit | edit source]

⊟Protein sequence[edit | edit source]

⊟Experimental data[edit | edit source]

⊟Expression & Regulation[edit | edit source]

⊟Operon[edit | edit source]

⊟Regulation[edit | edit source]

⊟Transcription[edit | edit source]

⊟Expression data[edit | edit source]

⊟Biological Material[edit | edit source]

⊟Mutants[edit | edit source]

⊟Expression vector[edit | edit source]

⊟lacZ fusion[edit | edit source]

⊟GFP fusion[edit | edit source]

⊟two-hybrid system[edit | edit source]

⊟FLAG-tag construct[edit | edit source]

⊟Antibody[edit | edit source]

⊟Other Information[edit | edit source]

⊟Literature[edit | edit source]

⊟References[edit | edit source]

⊟Relevant publications[edit | edit source]

Search

Navigation menu

⊟Summary[edit | edit source]

⊟Genome View[edit | edit source]

⊟Gene[edit | edit source]

⊟General[edit | edit source]

⊟Accession numbers[edit | edit source]

⊟Phenotype[edit | edit source]

⊟DNA sequence[edit | edit source]

⊟Protein[edit | edit source]

⊟General[edit | edit source]

⊟Function[edit | edit source]

⊟Structure, modifications & cofactors[edit | edit source]

⊟Localization[edit | edit source]

⊟Accession numbers[edit | edit source]

⊟Protein sequence[edit | edit source]

⊟Experimental data[edit | edit source]

⊟Expression & Regulation[edit | edit source]

⊟Operon[edit | edit source]

⊟Regulation[edit | edit source]

⊟Transcription[edit | edit source]

⊟Expression data[edit | edit source]

⊟Biological Material[edit | edit source]

⊟Mutants[edit | edit source]

⊟Expression vector[edit | edit source]

⊟lacZ fusion[edit | edit source]

⊟GFP fusion[edit | edit source]

⊟two-hybrid system[edit | edit source]

⊟FLAG-tag construct[edit | edit source]

⊟Antibody[edit | edit source]

⊟Other Information[edit | edit source]

⊟Literature[edit | edit source]

⊟References[edit | edit source]

⊟Relevant publications[edit | edit source]