Jena Prokaryotic Genome Viewer

Gene list
Applied filters:
COG category: Replication, recombination and repair
Organism: Corynebacterium glutamicum ATCC 13032, DSM 20300 = ATCC 13032
Gene type: CDS
Number of genes found: 168
Free access

Show UniProt / TrEMBL protein name	View in Fasta format (DNA)	View as list

# Corynebacterium glutamicum ATCC 13032, DSM 20300 = ATCC 13032

>cg0773 PUTATIVE EXODEOXYRIBONUCLEASE
MADGGFPQAPTSVTSMSFHITSVNVNGIRAAVKQRSETNLGFLPWLEETR
PDVVLLQEVRASEKDTATALQPALDNGWHYIGAPAAAKGRAGVGILSRHE
LEDVNIGFGSFLDSGRYIEATIKDTTLDVPVTVASLYLPSGSAGTDKQDE
KYRFLDEFEGFLDQRAKERSHMVIGGDWNICHRREDLKNWKTNQKKSGFL
PDERAFMDSVFGTFPDEATQVAGAGDFFGAVDYEGTRRREATTDPAWFDV
ARRLQPEGDGPYTWWTYRGKAFDTGAGWRIDYQAATAAMLERAERSWVDK
AAAYDLRWSDHSPLNVIYS
>cg0186 Methylated-DNA--protein-cysteinemethyltransferase
MEELEFDELTSMVLDCADLIPQGKVATYGDIAKIVGTGPRQVGRIMATAG
QFTSWWRVVRSDGGSQVAGTARSKWAEENIAFSELSAPKVRMQQHRLSEE
ELETIAGKLQQIAD
>cg1837 Predicted endonuclease involved in recombination
MKVSADTPGHDDPGPGRRLGLDVGTVRIGVAASDRDAKLAMPVETVPRET
GFKGPDLADIDRLVAIVEEYNAVEVIVGLPTDLQGNGSASVKHAKEIAFR
VRRRLTNAGKNIPVRLGDERLTTVVATQALRASGVSEKAGRKVIDQAAAV
EILQTWLDARTRALEPQSTDTQDFDEKGNFPG
>cg1303 NTP pyrophosphohydrolase
MKKRINVTGAVLVKENRILAAQRGPEMSLPGYWEFPGGKIEQGETPEASL
ARELKEELLCDATVGEHLTTTEHEYDFGIVVLSTYFCTLNDAEPQLTEHA
EIRWVAPHELESLEWAPADIPAVKLLVEQLA
>cg2993 conserved hypothetical protein
MIHHIDCMPTDVSAEALGVSWNGESPEVLVDKLIDASPHPSTCHLAVIGG
SHVVTVETPDGRFREEISCHAQEAEDSRWPLPDSITRENYLLQTNVAVLS
EEDFARAAEEISNGDDDWLIASFPGAGEHHLTALTAEFLEDVWEWFSHHL
YPEELTIVSTRSIYKP
>cg2024 putative nuclease subunit of the excinuclease complex
MIDRPVWLFELYNTAKEVVYSLLIDEVTGENTILKKDDGWRDQFMIESFF
AYDSEADATSWSGKNMNSYWFVSDLISNISFAERSLESFSWALRDLEDLS
SSETGFEGLEELNLKFSELQEWYTNLELPFQPSAADVDEVEQYLQAEVTR
QRGDYQWSPEFWIPKPDSYYIDHALAVVTDVLGAIEQGELREEVEVQQAL
DEVSENWNPLEDSDYYLQDHRGRPVQDLSREMEELVRCLMLDQEWWGAEA
RIRKLVESVEWEDTQAISSLIEHEQYWEDGRFRPPLHKFSEGLDEPEPLP
MTRKMILATNHPDVLRVNIADYYQQHRRIATQKVECYKEVLALYPEILKK
FDDSSFVNRHWIYRAFDREGQLLYIGETINPLVRLREHAGLGSINHAHHR
LVSPWFSTMATFHLESCFTQAEAKEKEALYIKLEQPRYNKTHNSARLAVS
EEGVPVNEVPSRNDPRNVGWKGHRHVPPMLPIVARVVDESTTREGYAFYE
DNR
>cg1683 Superfamily II DNA and RNA helicase
MSFSAEKGTHLSEFIADLGFDLDEFQIKGCHAVEEDHGVLVCAPTGAGKT
IVGEFAVSLALSRGTKCFYTTPIKALSNQKYHDLVAKHGSDAVGLLTGDV
SINHDADIVVMTTEVLRNMIYAGSFALERLSHVVMDEIHFLADASRGAVW
EEVILNLDDSVNIIGLSATVSNSEEFGEWLTTVRGDTRVIVTDHRPVPLD
QYMMVQRKVMPLFEPGTDGRVNKELEATIDRLNSKQSEQGRAAYRSGEGF
RARSKGDKQDSRTGKPREQDRHRPLGRPEVLSILKGINMLPAITFIFSRA
GCDGALYQCLRSKLVLTDQAESEEIARIVDAGVVGIPEEDLQVLNFKQWR
AALMRGFAAHHAGMLPAFRHIVEELFVKGLVRAVFATETLALGINMPART
VVLEKMVKFDGEGHVDLTPGQYTQLTGRAGRRGIDVLGNAVVQWSPALDP
RWVAGLASTRTYPLISTFQPGYNMSVNLLKTIGYEPSLRLLEKSFAQFQA
DGSVVGDVREIERAEAKVAELRAQLNKEIAATNPAVREDQDAVEVFIDYM
ELRRELNEEEKLNRKQSIEDRNVETVRVLSKLQIGDVIAMPGRKRPVLAV
VMTPANQSRDPRPWVTTESGWSGRVDAESFTNPPITIGHMRLPRQAIEEP
RRNARRVQELFRREHFKRPNKMREFARVRPNEAVTKLRNAIRDHEAHHWP
DREHLARTAERMIRKERDLAKLTGNVDKARETLGRTFERILSLLSEMDYV
DYSNPDNPVITDEGERLAKIHSEADLLVAQCLKRGIWDNLDPAELAGVVS
MCTFENRRETGGEAQAVTEAMADSMNSVERIWGELVEDERRHRLPITRQP
EAGFATAIHQWASGAPLGYCMAAAAENGAELTPGDFVRWCRQVIDLLEQV
AKTAYFDETTRNARQAIDAIRRGVVAIGS
>cg2228 Predicted endonuclease
MKTQKQYLGAFGEDVALQQYLDDQATLLDRNVRYSCGELDLIVRSASGVV
VFVEVKTRRGSAFDSAAAVNNQKMLRMRRAAALWLEGKPYTPIRFDVVAI
VLDPHTGRPEITVYEDVEHGAR
>cg1028 PUTATIVE RESTRICTION-MODIFICATION SYSTEM: METHYLASE
MSRLTELLRQVRKADAQLGTDLEAEVAALTKRRTFGLVFEQHQPEAVELP
GRVVRRGDKVRVLPPRGGTKAGDQRLWRTTRIECVDGQRVAHLAELDVEE
PETRAVLADDVVVVAEFRDRIYPGLVETGRVERGGDKPFHTVVNAENYHA
LEMLTYTHRHSIDAIYIDPPYNTGARDWKYDNDYVASDDDYRHSKWLAFM
ERRLKICRELMRSDATLVATIDEHEVNRLGVLLDQLFPESTRQLVTIVNN
PKGVTQGYLSRVEEYAFFVFGPDARIGSVDDDLLTHRDMADAEGELQRPR
WKGLLRSGDDSLRADRKDMFYPVWFDESTGRLSHAGEALPLDETPDFSPQ
DGLTPIWPIRRDMKEGPTRAAPRRSILDYALHPHL
>cg1963 Superfamily II DNA/RNA helicase
MTSTTQPGTTPELSADTHSEPWDVVIENTLEPFQKVVRQFIIDRPYSGIF
LTMGGGKTLTTLSALTYIQPPGHILVVAPLNISRLTWPEEVRKWNIPVNA
ISLITNERGTKLTRAKRLKLYEETATTPPTLYYITINLLEDIVNYFGDRW
PFWTVIIDESQTISDISSKRTRALFSVRPYIGRLILLTGTPSANKFDSIY
AQVAVLDYGASLGDNIDVFRARWCAPDIITDKQVRRWKPANKQAEAEVYR
TISHLVMSAVNTDIKLPPLHFVDHEVHMSDDEHRDYELFKKDAVLAALLD
MAEENEGGEGADDTDAADSATTTPPASSQPTNPAIPAGLLQAIQQTQDTN
GRAIAPVTTAELDHFDDLPVQRQEDLGTLVVISAVHAATLRMKLLQYAGG
AVYVDPEDSAQSQDLDASTARDVIDATNTAMTTITSRPTMIVHLHKVRKV
IEILCNPALGGEPVNIDQDETGKQVYTPTPTLVAYRFISDKEILLHYLAQ
AGVQGVEVFDGSPDMLSRWNAGRIPVLLLQPASAGHGLNFQHGGHRLVWY
NLPDNNEHYMQANARLHRIGQKNPVTIHRIITADTYDANMPAILAGKANR
QQRLIDAVRRDPV
>cg1990 NUDIIX hydrolase
MTTPHSHRAPRLASTVIIARESADSGTLEFFIQQRQSTMAYAANAVVFPG
GGVEDSDYPFMLPHRDQHMSPEHIKHHASRLHMDSETMAAHISAARREVW
EETGVDLGNYNHELIPIDRWITPDIPAFRRRYDTATFVLILSKDSTNAAL
QHQHQTTEATHSYWATAEELLTQWSTGHLNLLLPTWWHINQLNHLHTLNQ
LYSFAQRTHNPQHTPPTVFANWTAPADEAAMQHYGFPDPDAYFDHATIAG
KHHTLITRK
>cg2321 DNA polymerase III epsilon subunit or related 3'-5' exonuclease
MIQIERTTPVIAAYGASISLDDSTLTISYSPLLAALSKSSAQSESVDLTQ
VSGVSVQDPTAFTHGFLNLEGVDKSIAFAPNSSADLAALAADIDAVLKGE
KPQHLGGGAPVVPSAPSTVAGLNFVGFDVETANDDWGSICQIGLVKYVDG
VEESSESWLCTPPESLNFFNEINIGIHGITPEMVADQPRFADLVPKMVEF
VGDLPLVAHNAQFDFTALSRACAASGIDVPEMIYGCSLTLARNEKLQVEN
HKLPTVASHLGFELKNHHDAAEDARACAAITIALAKRHSFEGSFVDFVHS
RGFTMGTVDNARVYPVLKDRSGANVALQRRNFGLDAGKTEVPVQPAVDPA
WETPKAEPKKQSGRRAPWDKVATPEVIPDPNPDADPSSILYGQNVTLTGD
FEPYEKGALWQRIADQGALIGKNVTKKTTILVAGPWATITSKQKRAEELK
EKGQDIQIWDEKQLFTALGLDEQPPF
>cg2697 SINGLE-STRAND DNA BINDING PROTEIN
MINTPVTIAGRIVSDSVYIGRKDNLDGVLRIRVASSRSYKQGEKWHNVDK
VFINVEAWGKLGVNSHISLKPGVSVIVQGFLYTNEWEVESADPNVKKLEK
RQEIRMRATSIGIDMNHYIVGFKESKPNASNSPEGVEMPDANLEDYPDVD
QKRGAKQVAASDASEEGTEASEADEAPETPEEKRELAMAGVGAGSGSDSG
EEAPF
>cg2576 putative DNA polymerase III delta subunit
MWHDGHVASAPISVQPAVHLVLGEDEFLAERARINIVHDIRSSMASPDSL
QVTTLKASEITQGELLDALSPSLFAEDRVVVLTNMDQAGQDAVDLALSAA
VDPSPGTYLIVMHSGGGRSKSMVKKLEKVAVVHDAAKLKDRDRPGWVKQE
FKNHKVQVTPDVIHALLEGVGSDLRELASAVSQLVEDTQGNVTVEKVRAY
YVGVAEVSGFDIADSACAGQMSKAVASTRRALQLGTSPVALAAALSMKVG
QIARLYSTRGRINGFELAKELGMPPFVVEKTAKVARNWSGDAVSEAVILM
ADLDAAVKGQSGDPEFAIESAVRRVAELARR
>cg0395 hypothetical protein
MIVMKSIDLEQLAGTQSRTYQSRKITDEMVARPVHVAIALWEVPWESAKS
GKIEGWVIAVDSPRGRFVRSGQTKNGDAVNRTVSMLKSALKGVRGKAWIV
TGRRQAALRAALVRENYLVTGSFAEQNRAGVKASAISRRAEQSALYKAKK
IGEFAERAPRVKERQEAHWWPRLSRTQGTAGVLRLATDASTDGVFRGAMC
FVASNGDYLLETQDTTASSDELELESITHALIYLKTIGATQAIIESDSKA
ALEAIDFILNNRPRRGRWRGITACARNRFRDAWEALIDDCVVELSRVLGH
AGDPLNQAADQIAYMGMRAVIFEQKSAHPTLLKGIDKALRKAE
>cg0934 conserved hypothetical protein
MKKDSPIPTLKGWLDTQSDDQLSTILRNRPDTVLPLPPNLASLAARLQLR
ASAIRAVLKLNALELGVLEAVANLGGELHPVTAPEVVEYLHVALAEDLPA
QDTIGAALATLKNFALVYGDDQLMIAQETMPALPVHWRLLPEVSDRGQSE
EQVRESVDKLSDRHRKLLHTLAASGGFGLTRDAAPDADPSRPIPQLLASG
LLARVDEQTVRLPAMVRRVIEGREQLPAQVRPIPRTAAPGSNDGGIAAGL
EVVRHMRLLIDALSHVPAPTLKVGALGVRVVTRLSKELDLDETELARLLS
LGMASGLIRKGVPDPLPMDDDGGDYVAPTPLADEWMEYDLAHQLGTLMSG
WWKQTYAPWLVGRADDKDKPIHVLSKTSIIDSLPDARAKILSSLSRVLVD
NLHADLAFHYPLAASRMNPDTITQLVQEAQWIGAYSQGVTAAGQALIDGE
NPTEVIKAPAPVENFIVQGDFTIMVPGPLTPAMQKTMDSIASLESPGLAS
VYRLSEKSIRHALDLGLTTPEILEFLKEHSMTDLPQSVGYLLSDIARKHG
TLRGGPALSYIRSDDPALLHSAVEAGADVALRQIAPTVAIAQAPLLQVIT
VLRAAGFQPVAEDGEGASLNISPSPARVPAASPPPVVPALDESRVQAAVK
AIRRENSASQGTVSTQPTLSVLQAAVRGQRTVTLGFVDKQGVAVHRVVKP
LTVNAGQVDAVDEATGAVHRFMLHRITEVIVDN
>cg0886 PROBABLE DNA HELICASE II PROTEIN
MRRISPRLLSQYLGQEHAPTDQQSAIIGSEPGPLLVVAGAGAGKTETMAA
RVVWLVANGFVAPDQVLGLTFTRKAAQQLSQRIRKRLETLAGVPRLKDID
PTGQLEKNLQAITPTVSTYDSYAGTLIREYGLLLPVEPSARLITQTELYH
IARNVVNNYDGELTATQTPATVTEYLLKLVSEMDNHMVTAEDIREESDPF
IKLFDELPKGKGQRDNLNAEMTKWRDTQVARLQYLPLVKALKEELHNQAV
VTFGEQMSKAAHLASTHPQVGYSQRRRFRVVMLDEYQDTSHSQRVLLSSL
FGGTDPGLTVNAVGDPMQAIYGWRGATAANLENFVDDFPVIHLDGKTRAP
KNELTTSWRNPPEVLTLANAVSREVLGSPDAPTRTVQPLQPREGAPTGEV
SLGWFGTAAQEREFVADEMVKHWNAREEKGTFTAAVLVRKKRHSAPMAEE
LTKRGIPVEIVGLSGLLDIPEIADLISLATMLVRPHDNRAALRILAGPHV
GLGVADLQRLQGRARNIAGRVSRERREKNPDPLAELDAIIEEATAIEPEA
VVGLADAVADLGEGDRFSEEGLSRLKRLATQLRYLRKYSLGRSVADIFAD
IETVFNIRTEVLSRQDPHADGAAGTVHLDKFAEEVASHGGIGLPELLDYF
ELAKDQEEGLEPGEVTVRSDRVQILTVHKAKGLEWDIVSVLHADASTYDA
KASTWLKNVTMIPSSLRGDAGTGAPEMDTSEADDRKALEDSGKEYTSEVR
EGLREENSRLFYVGITRSERVLLVTGSALDESGTKAKVPYGHLEILRDKA
PECVVSWWEGEEGDVEKQKPAEGVFPQLLAADSSGADLVRGPRAEPNNEG
GLESLWEKEVSALIDEHRRLSNPIVEVETPRELTATDLVSMKNNPEQFAR
RMRRPVPFKPNTYAKRGTLFHQWLEDRFGSTALLDETELPGIDEDYSDDA
FIELRDAFLGSTWENRTPEFVEHPFEVTIGEHVIRGRMDAVFHTDGTWMV
VDWKTGRTPTGPEMDAAIIQLAVYRLAWARLKGLEPEEVRAAFHYVAHDH
TFEPNDLPTQEELARLLSQE
>cg0355 pyrophosphohydrolase
MTSKPLWQGRCRMRNYPDLPHDFPGQNTELTPAKAPVWMHRLLDRIHTGR
MANPLDGAETLGDTDSEKRAAVLMLFSGSETSFDLPNDASVLLTHRTPTM
RSHAGQIAFPGGRIDPTDTNAVDCAFREAWEETGLDRRTATPLAQLNEVH
IRATGYPVYPILGHWHTPSPVAVASPHETDEVFDAPLYDLIDPKNRLMVG
WREWHGPAFRINDYIIWGFTGGLLSAILDTAGWATEWDTDRIFDLENTLS
TSRNNERMR
>cg1318 DNA repair exonuclease
MSTVHDEMGVMNTTVKFLHSSDLQIGMTRWFLSDEAQARFDDDRIRAIEK
MGKIARKNQCEFIVLAGDVFEHNSLEQRTTGRALEALRSLKLPVYLLPGN
HDPLTADSLFYRAKDIDGVTILSDTTVHGVAPGVEIIGAPLLHKMATSDL
VAEALKDLEPTSNVRIAVGHGQAEARTTDHRADLIDLNTVEAKLADGTID
YLALGDTHSAQPVGTSGKVWFSGAPETTDFHDLDPDRVGGEVNSGKVLIV
SASKGDVSVEEVEVGKWTFHALSKEITSGTDVEDFLDTLQAYPDKSRTVI
KYGLRGTITLEQNRRLEEGIAGLEDVFASLKPRERTTDLVLEPGEEELAN
LDATGYAAEVLRELADSVVNGAAPEEDRDALNLLFRLSREV
>cg2534 putative secreted protein
MRRIWLLVCGIALTVAGCTSGSTTPTTVTVTATPTSEEAASTEPTNDILA
SQFHPCEVLTQEQFEEVGLGVLIVEDAYLGSTGLGCSFGKADREDFSGTW
LISTDQANRQFVENQDLETLDWGSNDNPDLYVHQMSETGRQCEAAVDYDW
GRLTVDYLELGEGWEPEILCSDAVEILENLIKELRGIP
>cg1205 strong similarity to hypothetical protein Rv2133c-Mycobacterium tuberculosis
MITSPFERELKLLNEGELGIVQQLVESSNIGFIVDLELDGDYGWAVYKPE
LGEQPLWDFPPGLYKRERAAFVISEFLGWNIVPPTVIMHDAPAGVGSVQW
FIENNGEHYFPLFDTRADLHPQFVRMAVFDLLCNNTDRKAGHVLLDGDHI
WGIDHGLCFSVEPKLRTVIWDFAGCTIPDDLVTDVEQLLEDVPEELHQLL
HPAEIDALQRRASRISRLPFLPQAKSHRQFPWPLV
>cg1916 hypothetical protein predicted by Glimmer/Critica
MTMYNAAKTLVPQIVAFDDTAIIALDQAAEDEFRKANYPEVKANQEAAYI
LAEAAQNIQRIATARATGDVPATARVVRIKGSEKYYTEEQWRIPENAYYP
RSMAESPDAHLDDRGIYIIPAQYPWGYEEIINLPARATSTPAVAPRTEAA
PATVSDAEVQSLLEYLRTNAFVSRHDGDTTKADIFNKHADTVNKLAALRA
P
>cg3043 NTP pyrophosphohydrolase/oxidative damage repair enzyme
MKGDGDGWAAAPNGGAVWGKNGAAGLLLVADKQMLMQHRAAWTNNGDTWA
LPGGARDSHETAAESALREAFEETGILPDDVEVLDSIVTAGPFPADPERP
ELAGNWTYTTVIARTKTGETLDTTANEESLELRWVDIAAVDSLALMPAFA
KAWPSLRKLLNTTE
>cg0302 DNA polymerase III epsilon subunit or related 3'-5' exonuclease
MSTTSESQDHAARIEAERQEAIEAAPFVSVSIQSSGIHPSTSRMVTIDLV
TLSPNLEPVETFHAVLDSKTDPGPFHLHGVTEEEFASAKRFGQILKSLDR
LIDGRTLLIHNAARSWGFIVSEAKRAMNDAARANRNSNRGNRRGGRGRRR
QRVGHIPKPLVIVDTLASARRQAIALDDVRIRGVAHTLGLDAPAAEASVE
RAQVSHRQLCREETLLVARLYGALKQSGPLAEIDPQSLRADKFGLQRSII
RVQAQEASPTLVNPGTYEPGKTLIAGMEVVVAPEIEMDPDIIIQACVDAD
LSYSEKLTRQTSVVVCNQTRDIDGKAMHAQRKGIPLLSDVAFLAAVKRVK
EGKKVDVEKR
>cg4004 hypothetical protein
MSPSNIIRIAAVLIPNDQDQILCVRKEGTELFMFPGGKQELWETPAQAAA
NSRKKTSIFMGVFRHRQQTNLASMWTAMCLAHLMCS
>cg0842 PUTATIVE DNA HELICASE
MVSYSVHGALDIDGSLKKLTLDFLNKLATNPASPGLHIEPIKNSIDSRVR
TGRVNDQFRAVLFELHDEFDHHFVVVGVYPHDDAITKAGKIRLEVNSVNG
ITRLIEETTVPAQKDDQESRRKAEEAAKRAEEQLRDAVEVPTPVELPSPG
EALAHAGHTPEVLEAELGIDPAATRIVLELASEDDIAAALPSSPTWEKDA
LIGLVAGLSIEDIRESLAIPAPSTEPDTRSEDTRLIAGLKTPAAQMDFAY
LDTPNSNDLRRVIETEGFDSWRVYIDPSQRSLVTRNFSGSGRVFGGAGTG
KTVVVVHRANRLVTSDGHLETDDKTPRVLLTTYTRGLADALKSSMNALNP
TFPEAEKPGSPGLWISGIDALANKVVALANTAEREAATTAILGRAAGRIT
PFIGNGEQEFWIDAIISADPGDLSEEISNTEFLAQEFETVILARGITQEK
DYLRAPRPGRGTPLNRVQRKKVWAIIQQFMTSCAREGKMSWPALSSIAAN
ILEQRAAAGQGRLFDHVLIDEAQDFHAGHWLLLRAAVAEGPNDIFLAEDS
HQRIYGQHHVLSRFGISTRGRASKRLTLNYRTTAENLSYALGMLTGEWTD
AEGETDTIEHYRSARKGPKPHLYQFESETDEFEAIAELIKVWQDRTTDVR
IGILARTRPLINRVVNALSEQGIDAVKTQNAELAAHETVSVMTMHGAKGM
EFTHVILIGMGRDLIPLQYTMQGLGEAERNDAQQRERSLLYVAASRARDA
LVLTTHTEPSELLPRV
>cg1498 RecG-like helicase
MLGWHDERLLKDILPAKEATAIKKALGYTTAEELLRHHVRKYSHHGSGVG
IGDATEGDLVTIVGQVAFAKQSYTQSGKMLYKVTVLTETERIGISFFGAK
HIPRLLPEGTRALFTGKVKFFRNEPQLSHPEFIVIPDPGSGRRLTATGGM
KSLAAYGDVEEVALRLVDREYIPIYAGTATMTTWRIMAAVQRVLETMPVI
KEPLSVVPEGMPSFDEAIRGIHDPGHESPSTFINRLKYNEALSLATVMAI
RRADTKNRKAPPMPRALKGHQHMLIDALNFQLTVGQKQVIREISADIEQR
VPMSRLLQGEVGSGKTIVSLIAMLQAIDSGRQCAMLAPTEVLATQHARSL
SKTLDDAGLDINVVLLTGSMPTGAKKEALLEIISGDADIVVGTHALIQDT
VEFFDLGLVVVDEQHRFGVEQRDQLRTKGREGLTPHLLVMTATPIPRTIA
MTVFGDLAVSTLRELPGGRRPIQTSVIPDHKPGWVKRGWERIGEEVLAGR
QAYVVCPRIEGEGGVLEIHAYLSEQVYPGLNVGMLHGRMDTDLKDSVMQE
FAQGEIDILVATTVIEVGIDVANATVMLIREAERFGVSQIHQLRGRVGRG
QHDSLCLLHTTFDEDSPQGQRLAAISTTTDGFQLSELDLQVRQEGDVLGT
RQSGSDTKLRHLSFISDQKIIERALIDATELVAASRSRALELVSDIAMIN
QEYLEKS
>cg0888 NTP pyrophosphohydrolase
MRILPIGPHDEIAVNGSIVLLSEHDGDIVSVGPDLGTVRVTLEEIESLGT
PTAPRDLGSREVDACVSLLRNRELVRFDPHDGSELTYREHSVAYGASGKP
LFPRLDPAVIGIVELRGEDRLLLGMNAQKRQRYSLIAGYVSHGESLEDAF
TREVFEEAARRVSEISYVSSQPWPISGSLMLGMKGFTEDELPQGETDGEL
AETIWASPLDIIDRKIPIAPPGSIAYDMINAWARDKQN
>cg0181 PUTATIVE DNA REPAIR PROTEIN
MPTLFDDPLHQLPRPPRRVAAGVVHLPNFLGLAEQKALVAQARDLAREVV
GTPLAMVRPKLKSGQMSVHMLHLGKYWASNPYRYVDVVDGFPVPPLPDSF
VDLAHRALLSAGSLSNSLQSWSEAYRAEAALVNYYSPDASMGMHQDANEE
SEAPVISLSIGDTGIFRLGGTLNRNKPWTDIPLMSGDLIVFGGANRQAFH
GIPSIEANTAPAGCGLKEGRINITIRQLAL
>cg3417 NTP pyrophosphohydrolase
MNQAWQQSRLVTSDETSAGGLVVSGLAEAVNANNEVDLSKIYVALIGRLD
RRGRLLWSMPKGHVEPGEDKAATAEREVWEETGIHGEVFTELGVIDYWFV
SEGKRIHKTVHHHLLRYVDGDLNDEDPEVTEVAWIPANQLIEHLAFADER
KLARQAHDLLPEFALKEKAEGRSTPR
>cg1302 Predicted HKD family nuclease
MSPFDSKLGRDTHFGFLDKTTASQQLLNPSLISNEDPHTMLQAIKLELRT
AQSFTFSVAFISSRGIALLKQALLDFKGKGRIITSRYLDFNDPTMFRELL
TLENVEVLIHQGDGFHSKGYVFHHDVGITAVVGSSNLTDNALLVNREWNL
KFSASKNGDIAFQLDDAINRQIERSTPLTPEWISEYEATRRVPERLVSQN
IPLEDQSNAGTIVPNVMQEEALDALLSLTEKGEKRGVIISATGTGKTILA
ALATRMLKPERVLFVVHREQILDKARSEFIKVLERPAVDFGKMSGSTKEL
DKPFVFGTIQTLTKEATLSQISPTDFDLVIVDEVHRAGAESYLALLNHLQ
PQFLLGLTATPERTDGFNIYELFDFNVPYEIRLQAALESNMLVPFHYYGV
TDFTLDSETTVTDTSKLSALVSEERVHHILEALKTYGHPENVRGLIFCSK
TEEAEELSKLLDQSLFNGSLLKTKALSAKDSIPYREEVVAELESGDLDYI
LTVDIFNEGIDIPSVNQIVMIRSTQSSIVFTQQLGRGLRKAAGKDHLRVI
DFIGNYANNYLIPIALFGDNSRNKNSIRRRLIESDIDGTISGVSSVNFDP
IAQERIFAALKAAKLDSKAQFKQDIVQLQDRLNHVPALLDFARFNTVDPF
ILATHSGNYWSLLSSVKFVDHAPSESEKYFLDFLTGELLNGKRPHELLLI
QELMKQPETSTEEFRKLLQAQSTSSDEQTINSVERILSQEFYTGPNRKKF
GEHPILSVQNRTYSFTPEFRRALDESLEVTDRDEAAQNFKFHVQDIIDTG
LFIARNNGFWQGNLVVGERYSRRDVCRILNWERNNESTIYGYKVDSYTST
CPIFVTYHKADDVSESTRYQDELVDPNTLHWYSRGNRKITSNEIKPIAAN
AVDLHVFVKKDDAEGLDFFYLGQAHSENSKQSSMPGNKGVVQPVVTMDLQ
FDTPVEQSLFEYLSTNLAVTE
>cg1641 Superfamily II DNA or RNA helicase
MTTFLELKLPDEIVRELRSQGITEAFPIQEAAIPDALAGKDVLGRGPTGS
GKTFTFGLPMITRLARSGASKPGRPRGLVLVPTRELAAQVRERLDDPARV
MGLRVLEVVGGVNINRNITALATPVDILVATPGRAQDLINQKKLSLADVS
VTALDEADQMADMGFLPQVKKLMDLTPKNGQRLLFSATLDGDVSKLVDRY
LHNPITHSTAPVQAAVDTMEHYRLLVGGRDPRNSVVLSIAAREGKTIMFM
RTKHGVDRQVKKLRRVGVNAVGIHGDKGQSTRTNALAGFADGSIPVLVAT
DIAARGIDVDDVSLVVHVDPPAEHKAYLHRAGRTARAGTSGTVVTLVMDE
QIKEVRELFQKAGVTAAEVKVNENSPELAKITGARRPSGVALPAPGQQQP
KREQKNTHNRSDSRGSSRNPRRRGQSGSRSTGRSNPRRQTSRKDGPKS
>cg2432 MUTT/NUDIX FAMILY PROTEIN
MAVPEFIVSLREKVGQDPLWLPAVTAVVIRDVPPGSPFHVVPDVLLVKRA
DTGEWTPPTGICDPDEQPHVTAVREVKEETGLDVSVEALLGVGAVGPVTY
QNGDVASYMDTTMRCVVSGDSDEPHVGDDENVDVAWFPISKMPVTNQRFR
MVIADAVAQLKHPQGYKPRMGYEKRNAR
>cg2578 secreted DNA uptake protein or related DNA-binding protein
MKPDIAARLKGLTQPTGTEDLMRVNYPTPRFQISIKHALIVCIVLVVAFV
GWFFTREKPVNPPTMAALAETYQTPAPSSQVVVSVVGHVAKPGLVTLAEG
SRVADALAIAGALPDADLTALNLAQLLVDGTQIHVLAIGEVQPISVDAAA
TSASGLISLNTATVADLVTLPGVGEKTAQAIIDFRESNGGFSTVEDLLQV
KGIGPSKFEQISGLVSP
>cg2107 Superfamily II DNA or RNA helicase
MWLIVNLSEMLPDLSDVPESLMDESIFDSFLSWTRERGISLYPAQEEAAL
GILAGDNVILATPTGSGKSMVAIAAHFIAMARGQRSFYTAPIKALVSEKF
FALCEIFGAENVGMMTGDATVNGKAPIICATAEIVANIALRDGSGAAIDQ
VVMDEFHYYSEPDRGWAWQVPLLELSRAQFLLMSATLGDTEWLEKDLQQR
TGRTANFVGGTERPVPLEFSYVYTPVHETIEELLKDSKAPIYVVHFTQRD
AIERAQALTSLTVVNKEEKERIAEEIGDFRFSTTFGKTLSKLLRRGIGVH
HAGMLPKYRRLVEKLSQTGLLKVICGTDTLGVGINVPIRTVLMTGLVKFD
GSRERVLKSREFHQIAGRAGRAGYDTIGTVVIQAPEHEIENHRLREKAGQ
DPKKLKKLRLKATRPGEVTWTKKTYERLTTAEPEQLTSYFKVSNSMLLNV
IARPGDGYQHMKHLLRTNHDTRTKQNKDILTAVELFKGLINAGIVEKVPD
GPDATGRIYALTEELQRDFALNQPLAPFALAALTLLDKESETYTLDVISV
FEAILEDPRQILLAQQKAQRGEEIEALKAEGVDYNERMAIIEDVTWPKPL
EEELESAFETFREGHPWAKEFELKPKSVVRDMIEHGMTFSDLVATYGVAR
SEGVALRYLTDAWRTLQHSLPTEARTEELDDVVVWLGELIKQVDSSLVDE
WAQMADPEAPISKEALERELAFGVEDPTALTANRRAFTIMVRNAMFRLVE
LFAYEKEDQLSQMTEYLDEAPDFGAAMDAYFDEYADLDTGPAARGPEFFK
VEHTGRMWEVRQVVKDPEGDNSFAFVATIDLDASDDAGEVRFGSLSIDHN
>cg2064 DNA TOPOISOMERASE I (OMEGA-PROTEIN)
MTIGILTEKASAAKNFAKALGGPSGTYNGEKYVIAAASGHLYEFVEPEEM
VPPSYADKIGGYWDLAKLPWDETQFLWSREQKHGAANTIARIKKTLSSCT
TIVIGSDIDPTGEGDLLAWEIIAELGLDTKKIQRMEFVDEAPASIQQAFI
NRRDVTSMHDEPNYLKAEFRSRFDLLSMQWTRGATKVLETTGRRAVLRNG
RLKSAMVAIVGQGLDAYNDYKKIPFYQNRFIDDHGVSYVNPEEPRYKTCD
EVPQLYKASAVECYEKSMKKTAPPRLLDLASLSALLSKEGFSAKNVLKTY
QQMYEAQVVSYPRTEDKTITPEQFKELAPLVDKIAGLVGVNPADLTHRQP
RSTHVKPKGAHGANRPGLNVPTSIAAVKTTYGVLGQRIYEVLAKSYLTML
AEDYLYEHQKGRVVDYPAFLGTANVPKSLGWKGIFDVDAEADDDAAGSDA
AQQGIGTRAEPEVFEGFPQRPPHPSMTWLMKQLDKHDVGTGATRTSTYAE
VTAGKSALLKETRGKVTMTDAGQLNYLLLPGTHIGDLKLTERVYADMAAV
AAGEKTAEQALEPVKQWVEEDIATMTRNAKNIPQELGKKLMTTTFTPSVK
HSGTWNGEQVSFKKVYCGHEFSDAECEALLRGEELTITDAMIGGQITTVT
GKLAHQSFNKDGKTIKFFGFKGQVDRIASADPAVYAVGVWKVEGEKIRFK
RVWGGHKFTDKEIADLLEGREIAFDAMSKAKKPYTARGSLQRGEYNGNSF
VGFQLAPRD
>cg1307 Superfamily II DNA and RNA helicase
MSNTENVNGDVEQPNNVISSESQETPQGDSASADFALETPTNTVEDAPAS
EGSEEITRVADTSEDADSADADNASNVINENEDSSEGANQPSNESSSTEA
KSGFDALGLPERVLDAVRKVGYETPSPIQAQTIPILMEGQDVVGLAQTGT
GKTAAFALPILARIDKSVRSPQALVLAPTREQALQVADSFQSFADHVGGL
NVLPIYGGQAYGIQLSGLRRGAHIVVGTPGRIIDHLEKGSLDISGLRFLV
LDEADEMLNMGFQEDVERILEDTPDEKQVALFSATMPNGIRRLSKQYLNN
PAEITVKSETRTNTNITQRFLNVAHRNKMDALTRILEVTEFEAMIMFVRT
KHETEEVAEKLRARGFSAAAINGDIAQAQRERTVDQLKDGRLDILVATDV
AARGLDVERISHVLNFDIPNDTESYVHRIGRTGRAGRTGEAILFVTPRER
RMLRSIERATNAPLHEMELPTVDQVNDFRKVKFADSITKSLEDKQMDLFR
TLVKEYSQANDVPLEDIAAALATQAQSGDFLLKELPPERRERNDRRRDRD
FDDRGGRGRDRDRGDRGDRGSRFDRDDENLATYRLAVGKRQHIRPGAIVG
ALANEGGLNSKDFGRITIAADHTLVELPKDLPQSVLDNLRDTRISGQLIN
IERDSGGRPPRRFERDDRGGRGGFRGDRDDRGGRGRDRDDRGSRGGFRGG
RDRDDRGGRGGFRGRDDRGDRGGRGGYRGGRD
>cg1500 N6-adenine-specific methylase
MGQTRIISGDARGRKIEVPPAGTRPTSDRAREGLFSSLQVRFGFEGQRVL
DIFAGSGALGLEAASRGADEVVLVESNPKAVEVIRRNVDVVKHPRVTVAE
MKASTYLASAPDKFFTMVLADPPYELADDAVTEMLTALTPKLLDGAAVVV
ERHVDSPETAWPAWLVPTTQKLKKRTYGIARMDMAVFDESLLQE
>cg1985 Superfamily I DNA or RNA helicase
MPIIIDNLNSDDDSTIGTATEYNPDTDADLLDAINADADLDGDATISTNA
TEEGVDAAAEKPKKKRKAPALKPKGLTAKFFHRDLTGVGGRTGRLNKNVH
PTNPDLSYQPVSDVYTPQSADHKGIKTRYILTHPTPAVVLSESISNAFHV
STLRRNNNVNNSDSELAAWPYLYQLDIPQLDQMINVADICDYHFHGYNLW
VDFTPQTIALRSGKTVLDDGTTASDNTTHVYYRVTVHVIAGQDHGSTLLD
DQGNQVLDRDDNPISTPSIKRIGAVTDLFDHNPFGFASVNSFAFVDFSWD
PATTLVDMLNNLDSYLSNHINIASSPTPIALDMVVLNEWSEKSYQLCERV
VAQAKLINSNKITAHVSDVIKQNAHNILWFTEQMNPGTTNLSEVPISKKS
MLPMSRQLRILEHYDVPLTAYSALFWTVSAIKNESMVQYLVRQNMQLTLS
SNLDALNSIVSQLPVPDKDVVAASGYQIQPHFSTQQREAITTDNPLAIIQ
AGAGTGKSTVILERIEYLCAAGTNPEEIAVLSFTNAAADNITAKNDKVTS
MTISKMVHEIYAHNFPDHEISTIDTIINTLDIEYGDQMVTSDYMIQLRDL
LYKVMTQGGNANLTALSIFMESHIEAFISVLDQIKQTSLELEIIICYLLL
DKLIEPHASPKYLIIDEVQDNSVFEFVFALRFAAKHNTSLYLVGDSSQTL
YEFRSANPKALNSLEASGVFGTYRLTTNYRSNQEILDFANIHLSDIEANQ
FAGIQLYANSFDAPTADSFKEKVELDMHHVSKQSEFTDSIPYFMESNKAR
FDAAILNNEQTIVLAHSGREIRAAQQALAEMYPSITVRNLQSDKGFNNTV
FSTFIKDFWFEVTAVDPAHAAFTFTSQVTAHLDKLVRGKREQMEDRVIRS
MAAWWRENERDIQGWVQQTQSGAITNEEFFYRLRQCILDYEIRNNRARQS
MLNARNNANKEAVAQEKPLLMVSTIHSAKGLEFDNVIVLQKPSSDAEMTE
EGKRATYVALTRAKKRELIIAGSTRAYPRIVTDYEQIVDLLEKRDEERKI
KEEEAAALATLEAEQETRALAAAEAQAQALLLEHNPWLRDLSDEEVTALT
EQEIINNVEAALQIEEEEEEARALAAAEPAIQQYLSQFAFDEFPDDDNVA
NTVVHVAPQPILHQAVPADVTVQSSTAPVTPVVADLEVTTVAADPVEPTI
VAAQPEVDDNLVYSTSTPNSHSDVIAVNSDTSENAAVNPVLSDIEALRAI
FNNQD
>cg1316 Superfamily II DNA/RNA helicases, SNF2 family
MTSHLLHGLWIKDRGLQLWIEQVEGHRIVLPEAVEKGTFPPVVEQILDGK
TFRARMNVHLRTPKGRHVELPTPTAAFTPEEAVTVFSQLSFLKAETPAAT
RAQRDSIAPDLWWLIVMYQGLARFVQAGRVTLRTVMMDNAWWPQWQLSAS
LSERGWLAEMNHAAPGILRINGGRDLAGSMSNELPHWIANAILRDYRDET
MPYARHEFVEALLFNHSLRKGSTMLTHALNQWKNTITSASLQLVILVEEP
PAESDYEDPMDSVWPVRLMVRTGVDAPQAIQKGSIDSGGMEQLRSQYETA
KTTSMLLDPAREDAMLGHMVDIAQNGDWDIFLTTEEIVNFISHDVAKLRK
AGIPVMLPKAWSTYETRAQVEARTPNDAADSSTKAIIGLDQLVEYNWRIS
VGDIQLSDEEMRELIDSKTGLIRLRGDWVMADQDALRRITSYMEELSKSS
EKRARTEMEKVAMQAKLAEANGEEGWQLLAAKAETLRKEFNEKFSGDGQG
EVTLAELREIALKAAENEPVEFTGSQWFNSLLGGTETPAPVRVDIPDTVL
ADLREYQRRGVDWLYWMSANNLGAVLADDMGLGKTLQLLSLLAVERAENP
ELERGPTLVVCPTSVVGNWAAEAAKFVPSLKVLMHHGPQRLNDADFLSQS
KGMDLIITSYGVITRDFKLMGQVGFERVVLDEAQAIKNSSTRVSKAVRSL
PSRHRVALTGTPVENRLSEMRSILDFCNPGVLGSASFFRNHFAKAIEREQ
DDTMTERLRQLTAPFILRRLKTDPNIIDDLPEKTEQIIRVDMTTEQASLY
KALVEDVQKQLDERQGMSRKGLVLATITRIKQICNHPAHFLGDGSEVTLK
GKHRSGKVEALMELIDTAVKEERRMLIFTQYAAFGRILAPYLSDRLGTNI
PFLHGGVTKPGRDRMVAEFQSEDGPPAMILSLKAGGTGLNLTAASIVVHM
DRWWNPAVENQATDRAFRIGQRKNVDVYKMITVGTMEESIQDILDGKTHL
ASAIVGEGEGWITELNPEELAMLMSYREKEGADD
>cg1400 putative DNA polymerase III alpha subunit, the Gram-positive type
MNSPSNPSPTVPSFDTTKMLSFDLETTGVNPFDTRIVTSAMVTITSKGAE
PIELLADPGIEIPEAATAVHGITTEHARANGRPHDEVLAETISRLRAGWQ
AGLSVIVFNASYDLTVLRNHDPSFTIDGLVYDPFVIDKVKDRYRKGKRTL
TDMCAHYDVQLGNAHEATSDALAAARIAWKQVRLWPELTKMTGEELMEFQ
AVNYYEQQKSFRSYLIGQGRDASDVNTSWPVQTDPAS
>cg1234 putative excinuclease ATPase subunit-UvrA-like protein
MQKADSHDWISVHGANENNLKNVSVRIPKRRLTVFTGVSGSGKSSLVFGT
IAAESRRLINETYSTFVQGFMPSMARPDVDHLEGITTAIIVDQEQMGANP
RSTVGTATDATAMLRILFSRIAEPNAGGPGAYSFNVPSVSASGAITVEKG
GNTKREKATFKRTGGMCPACEGMGRASDIDLKELFDASLSLNDGALTIPG
YTPGGWSYRMYSESGLFDAAKPIKDFTDEERHNFLYLEPTKMKIAGINMT
YEGLIPRIQKSMLSKDREGMQKHIRAFVDRAVTFIPCPACGGTRLAPHAL
ESKINGKNIAELCAMEVRDLAKWIKTVEAPSVAPLLTALTETLDNFVEIG
LGYIQLDRPAGTLSGGEAQRTKMIRHLGSALTDVTYVFDEPTAGLHAYDI
ERMNKLLLDLRDKGNTVLVVEHKPETIAIADHVVDLGPGAGAGGGEIRFE
GSVDKLKDSDTVTGLHFNDRASLKESVRAPHGALEIRGADRNNLNNVDVD
IPLGVFTAISGVAGSGKSSLIHEIPRDESVVFVDQTAIHGSNRSNPATYT
GMLDSIRKAFAKANDVKPALFSPNSEGACPNCKGAGSVYVDLGMMAGVSS
PCEVCEGKRFDESVLDYHFGGKDIADVLGLSAANAYEFFAAKDSKILPAA
KIAKRLVDVGLGYITLGQPLTTLSGGERQRLKLATHMADKATTFILDEPT
TGLHLADVKTLLDLFDQLVDDGKSVIVIEHHLGVLAHADHIIDVGPGAGS
DGGSIVFEGSPAELIKTDTPTGRHLKAYVD
>cg1395 conserved hypothetical protein
MSSMSARNPFRPTFGVSPTVLAGRDSLLQSFKLGLAEGPGSPFRALLISG
SRGMGKTVLLNEFEDAAASQGWITLRAYPDNSMVDGLVNSAIPEALQNLD
GPQSKRMLSGVAIPGIATVTAIADPTKKDPTPTLISRLRELATRLQKHGS
GILITLDELQSANVDLLHVLATAVQDLLRDDFDIALVAAGLPEGIDRLLQ
HEGTTFIRRAERILLNPVNHEDSVEMFLDTAAEGQRHMTSEAAELAAQIS
KGYPYSMQLTGSLAWARSTLDNSDTIQAEQVDAVRDEVVRRMGMQVHEPS
LHQVPDGELTILYAIAQLSKNGEMVSTGDIAHLMGVKPNALSMQRKQLLS
RGLVEVPKYGFLNFTLPYMREHLLNSPHHRPIT
>cg1733 conserved hypothetical protein
MEIRANVYSPLQNTAVWLGAWLYELVPTEDVIDAFVDLGGPHTFGDGGLL
DMLRTLKELTSTLIDAPFHGPILTLALSGPGQVPALPAGSRAAVLASASK
EGALVLGGVDKQHSWALIPTRGKDATEWNLVEVEGFLPAIATVSPGEADQ
LLRQATDQAANIIELSGYASLAPKSLKNPRLTVGMLSDFYDTPGLPYAVP
ERSAKLFARADRVAAIAETVQETIGDHSLDPQLIFLWSHIRTARMAGVSY
ALAEFARDYHS
>cg0889 PUTATIVE DNA HELICASE RECQ
MINLQDLDEDQRIAASAPRGPVCILAGAGTGKTRTITYRIAHLIDQGFVS
PNRVLAVTFTSRAAGEMRHRLNLMGIGGVQARTFHAAARKQLLYFWPQVA
GNLPWRLLDNKFQLVGRAVRGARLESQTEKVRDILGEIEWAKASLITPEQ
YPDRLGTRTPPAPAEKIAEVYQRYENMKATPEGMLLDFDDLLLHTAGALE
NSPAVAEEFRQQYRSFVVDEYQDVTPLQQRVLDAWLGDRDDLTVVGDANQ
TIYSFTGATPEFLLNFSRKYPEATVVKLQRDYRSTPQVTALANTVIGQAR
GRVAGTRLELQGMRIAGPEPEFSAFDDEPTEAREVAGRILTLLKNGVQAS
EIAVLYRINAQSAVFEQALADAGIVYQVRGGEGFFTRPEIRQALSQLIRT
SQRDVDESDLVRLTQRTLVPLGLSSEEPSGAQERERWQSLNALVDLVKDL
VKATPDLDLTGLLLKLRERQEAKHPPTVEGVTLASLHAAKGLEWDAVFLV
GLVDSTLPISHAIKSGDEAIEEERRLFYVGVTRAREHLHCSWALARQEGG
RKSRKRSRFLDGIVVEMASESGTPRSNRPKNCRVCGSVLSSPAEKAVGRC
ASCPIQADERVFEQLRTWRNDTAKRENKAAYMVFSNATLMAIAEMNPTNE
NELLSVPGVGPMKIENYGDDVLAILGAL
>cg0845 Superfamily II DNA/RNA helicase, SNF2 family
MSESGALSSTDSLSPGVTIEVRDEIWLVTHVTRSTDGFRVKARGLSDYVR
DHEATFFTALDKDLKVIDPTQVTVSLDDSSNYRRTRLWLEATMRKTPVPL
YQESLSVADQMLADPLEYQLAAVRKTLSSANLRPRVLIADAVGLGKTLEM
GMILAELIRRGRGERILVVTPRHIMEQFQQEMWTRFAIPLVRLDSVGIQQ
VRQKLPASRNPFTYFPRVIVSMDTLKSPKYRAQLEKVHWDAVVIDEIHNA
TNAGTQNNELARTLAPTAEALILASATPHNGDPESFKEILRLLDPTAVMP
DGTIDAEAAQRLIIRRHRNSPEVSGFVGEKWAPRNEPQNFLVAASKEENG
VAAELNHVWISPGASNPIKDRLFPWTLVKAFLSSPAALGETVSNRLKKAS
APEEKRALETLSQLNSAITPQTSQKYQSLLSYLGDIGVKKNSDTRVVIFS
ERVATLHWLQENLIRDLKMPPNSIAVMHGGLPDQEQMRLVDEFKKTDSPI
RIMITGDVASEGVNLHTLCHNLVHYDIPWSLIRIQQRNGRIDRYGQTHNP
SIVTFLLDPAEDSKVGEVHVLERLMEREHEAHSLLGDAASLMGKHSERLE
EETIREVLRGAQNFNDAVADPAEVLENPAGLDDIDWLLAQIAQADAKAET
EAEAETENQTAPDAASNSTQHAQRRLYAQESSFLYDCLLEGFNNVPEDSI
NRGGVGFKKHDNDIVELTPTDDLRRRLDFLPQDYVAARKVKEDLLLASTL
MRGQERLNAARTGEDGSTWPSAHYLGPLHPVTSWAADRALATMPRSEIPA
ASGKVTEPTVLLMSTLSNRRGQIVSRSFVASSGPFDTEVLSDPIQWLHSI
GLDETAINPGTAALPDDIEQLISLAVQAARGEIRPLMIAARAQAQTRVEH
WAKRAEAWNNKRSGAASTSRTARTAKLIEEQQKLSNALEPDRELIRPLAV
ILPQPATLNTEV
>cg0933 DNA or RNA helicase of superfamily II
MAFGDGPLIVQSDKTVLLEIDHPQAGEARIALAPFAELERAPEHIHTYRI
TPLALWNARAAGHDAEQVVDMLERFSRFPVPQALLIDIAETMSRYGRVRL
HRHPAHGLILESGEPAILVEISRHKKIKPMLGAQVDPETIVVHPSERGRL
KQELLKVGWPAEDLAGYVDGESHPIGLSTEFEDWSLRDYQQMAADSFWEG
GSGVVVLPCGAGKTMVGAASMARAQATTLILVTNTVAGRQWKDELLRRTT
LTEDEIGEYSGERKEIRPVTIATYQVVTRRTKGEYKALELFDSRDWGLII
YDEVHLLPAPVFRMTSDLQSRRRLGLTATLVREDGREGDVFSLIGPKRYD
APWKDLESQGFIATADCVEIRSTMTDAERMVYATAESADRYRLAATAHTK
VAVVRKLLEEHAGKPTLIIGAYLDQLEELGAEFNAPVIDGKTPNKKREAL
FDQFRSGSLSVLVVSKVANFSIDLPEASVAIQVSGTFGSRQEEAQRLGRL
LRPKHDGSEAHFYSIVSRDTLDTEYAAHRQRFLAEQGYAYRILDADDILF
PLPKKEL
>cg3274 Site-specific recombinases, DNA invertase Pin homolog-fragment
MHFIKENLIFSAESNALRAQLMLSILGSFAEFERSIIRERQAEGIAWRKR
PASTRAANAPSPRTTSRKPGNG
>cg1074 conserved hypothetical protein
MPTTDVFNRVRLALEPLADPARATGMASYMRDQFSFLGIPSTPRKEACKP
VLSALKELDTDFVSDCFGAAEREYQYVACDHINRVGITDLGFAKALVQTK
SWWDTVDSLAKPIGAKHDDDLMKTWALDEDFWVRRIAIIHQLGRKKNTDA
ALLAWIIEQNLGSSEFFINKAIGWALRDFARHDPSWVRAFVDATDLSPLS
RREALKNI
>cg1607 NTP pyrophosphohydrolases including oxidative damage repair enzymes
MIMVSKMHIPGTHEFTVTDTELLLESPILGVRRDSLIMPGGSTARREVVE
HFGAVAVVAFDGENIAMVKQYRRSVGDSLWELPAGLLDIADEDELTGAQR
ELMEEAGLEASEWSVLTDLITSPGFCDEAVRVFLARGLTKVERPKVMGDE
EADMINQWVPLHEAVGMVFSGQLVNSIAIAGVMAADAVIAGRASARAVTA
PFTYRPTALAQRRKAHGIVPDMKKL
>cg0208 hypothetical protein
MSKIVDLRYGTRRSSELSKRSAEVFAEAEEHPITVTRRDGEALVLMSQRE
ADGRARLLELAAQLITVATDHQGTLAERMAKVFPWMLALSVADREACARE
ILDAARASFATEQPHLALTELTSWKETAAAVAAGLSNTDLQWYDDPHLVE
RP
>cg1663 conserved hypothetical protein
MSQAAGKFKPMTSTLAESTLTSLKELEDPKILSVNERHGDDHAVNLTKLR
AVAKELKKNQPLARELWATDDTAARLVALLICRPKEFDQSELDSMIHEAR
TPKVLDWLINYVVKKNPHWNDLRVLWLEDPAENVAAAGWALNTHAVITKP
DALDDSEILDTIEAQMKTAEPRVQWSMNECLAQIGIHRPELRDRAIAIGE
RLEVLKDYPTPPNCTSPFAPIWIEEMVRRKK
>cg2065 Superfamily II DNA or RNA helicase
MMSLGNPAAMLAAYNTSTQVAPQPQLGPRAGEVQLSSEQQAMIDYVLAGK
DVIVDATVGSGKTTAIQRLCSIMGADHDVLYLTYSKLLKVDAQQRVRGAK
VQNYHGIVYPHLLKAGIKCGISESIREFNKNFKHISRTFPSYDLLVIDEY
QDINEDYAELLRNIKSVNPLMQIVMVGDLEQKVRSDTTLDPQEFAAQLCE
DPVFAPFTQSFRIGEAMAAGLADAWNKPIVGANTAQQIEYRSFAEAVVLI
QSTEPSKLLCLGSRNGQMSDALNVVERKSPAKFNKKTVFASIRDGDSQIA
HPNDAAVFTTFDSSKGLERDTCVVFDYDEEFWDMRLGYPNVDPVVMRNVF
LVAASRGKNKVVFVRSDSLQAAYEAGADWAAGLAVGVVDNNTEVAPEVDA
HTPAEESKGDVGEVQSQIERMMGFIPVSVFKELPELAPSEYARPISVTEA
FDFKYAENVEACFDLLDVKRLDNGKGAAIEVNRSDGLIDLSPTVGNFQEA
VFFKDYNVHTALSAYPSQFAKNLKRLVKKNNSVWRNCLIVTAASTEQMRY
VDQVRSSIPVAAEKALVSRLSTRLNADSRNQIPLILDGEAVQSKVVRTPM
SFAGVADAVHKGVLYELKFVSELTHPMFLQLAMYLVMSGMKDGILWNTRT
DEAWQVRVPDPKRFLNAVVLCVSKQDYRVGNFDLPSTGGGAR
>cg3401 hypothetical protein predicted by Glimmer
MAAGTNAQSIGNHLAEHPVLNAHRVLRTDGSISDGFRWLNAEETRSPKEV
LESEGVEFTSSNRANPQQRLTPEELLAFFAAEN
>cg0885 HELICASE, UVRD/REP FAMILY
MSEYKPPIPSDPQVRLIKPTSKLRPRSWEGEVSHLVKQGTGLWRVTGEAG
SGVSSAVVDTVLERIRQGWEPSSMLVVATSKEAASRLRQEISESVAQMDY
VSEGPLVRSVHSVAFALIRDASDDDVRLITGAEQDAVIRELLRGHADDGR
GGWPQEQREGLRMVGFARQLRDFLLRAVERGVGPDELVELGERFERANWV
AAGEFLREYKQVMKLSGAHSFSASELVTEALRGPEPSVKYRGVFIDDAQH
LDPKSAELVSRFFPEAELAVVAGDPQQSVFRFRGANPDFLTKLSVDHEVV
LKGRRKASTSIVVAETESAHADLLADTVRRAHLIDGRSWSEIAVIVRSAG
MIAPIWRTLLAAGVPVHISPTDVVLAEQRIVAAMILGLRALTESLNAIEL
EDLLLGPIGGADPVTLRRLLRGLRQAEMKMGGQRRAIEVLRSLLAESDAE
MLGFLTDRELNLLERVRSVLEAGREALAEHGSIEEVLWALWSATDLSNSL
SAISLRGGASGSQADRDLDAMMALFDAAGDYVERYPSAGVRSFILHISEQ
ELPTGMRERRGAIPEAVEVLTAHATTGREWKRVIVAEVQEGSWPSLGETG
TLLGQEEFVDLVDEGIDPDIIISRSAERLAEERRLFYLATTRSTESLLVT
AVNSPDSDEVREPSRFLELLSQPIVVLEGEEASAIAEPEEIGHRLLSIPA
MVAELRRVVNDPRDPRRKQAARQLSRLAEAGIPGANPAEWTNLRTPSTDE
ELIKGAVSLSPSRIEQLLNCPLRAVLDRLDSEEETPIAMLKGTLVHAFAE
AVAGGVDAALAEEKVTSAYMQLANVPSWSRESTEIAFRRILSRTDTWLKT
SRADFTEVGTEMDVSVTIDDSVSIRGRMDRLERNKSGELVVVDFKTGKTQ
IAAKDMGDHPQLFAYQLALSKGVLHGDKISDPNPGETPDPVGGGLLVYPA
TDTKAVGQRMQDPKTQEDLDDFAAMLPGLAEHLRGPNLLARVNPTCSTCP
VRSLCPVQPEGRVIHA
>cg3419 Uncharacterized membrane protein, virulence factor homolog
MVRSTGSMAIATLLSRITGFLRTVMIGAALSPAIASAFNTANTLPNLITE
IVLGAVLTSLVIPVLTRAEKEDADGGSGFFRRLLTLSVTLLGGVTILSII
GAPLLTRMMLSSEGQVNVVMSTAFAYWLLPQIFFYGLFALFMAVLNTREV
FKPGAWAPVVNNVITLTVLGVYMVLPARLHPHEQVGIFDPQIIFLGVGTT
LGVVAQCLIMIPYLRRAGIDMRPLWGIDARLKQFGGMAMAIIVYVAISQF
GYIITTRIASIADDAAPFIYQQHWMLLQVPYGIIGVTLLTAIMPRLSRNA
ADGDDRAVVSDLQLGSKLTFIALIPIVVFFTAFGVPIANGLFAYGQFDAN
AANILGWTLSFSAFTLIPYALVLLHLRVFYAREEVWTPTFIIAGITATKV
VLSLLAPLLSSSPERVVVLLGAANGFSFITGAVIGAYLLRNKLGLLGMRS
LAKTSLWALGSAAVGAAAAWALGWLIQAVVGDFLLGTLSSVGYLLYLAVL
GVFFIFVTGIVLSRSGLPEVQNLGQALTRIPGLSRFIRPNTKISLDVGEV
SEQDFSTQLVAPSEFAATPVPPPMSAGIVRGPRLVPGAPVGDGRFRLLAD
HGGVQGARFWQAREIATGKEVALIFVDTSGNAPFAPLSSAAAAGIAYEVQ
RRTKKLASLGSLAVAPNIHSEAYRNGCLIVADWVPGSSLSAVAESGADPR
AAAFALAELTETIGEAHEMGIPAGLDNKCRIRINTDGHAVLAFPAILPDA
SELRDAKSLASAAEMLIDATLAPSDVKAMVTEAQGLATEDNPDYASLAMA
MRTCGLFTEEPTHLVVKKEKTPKPATRDGFGASDYTVKGMAAIAAVVIIL
VSLVAAGTAFLTSFFGSSTNEQSPLASVEATTSATPEPVGPPVYLDLDQA
RTWDDGAGTDVTDVTDGNTSTAWTSTGGDGLLVDLSTPARLDRVILTTGT
GSDSNVTSTVKIYAFNDASPHSLSEGIEIGTVDYSGRSLSHSIRDSSKLP
GQVESVVILVDEVRSSQTSDTNPQMQIAEVQLVGW
>cg2977 putative membrane protein
MNQDLSHEDSGDGNSVDRGQILLAVLIGLALIASVIMLLANSDGAMKIAL
LAALWAAIIGFFLVYRSRKQVEAAAREKETLEYAHQSELNRLEAELVQEK
MEISESRRARDQETLEEIKLQLEEMRTQLSELSGREWGYEPTMLRAEARR
ILELESQQLSQQFQAPQPEVPEPVAVPEPMPEPAPVPEPVPEPEPVEVAV
EAEEEPAPGRRRRRHAAPEETGGRRRKDERQGGLSVADLLAAARKKENN
>cg1843 Superfamily II DNA/RNA helicase, SNF2 family
MAESNAMDRAQISALLDRAQHTINLAEQANNVLRLLKTPGTATVGDNGTL
GTDTYLIPSRNITWPDNLYVNVFLDGMNAEATLTDYVASVASIPRLCQII
NEGQGGMFRRLFNPTKVQAGDQAVFDLMVKLDEISSTTHEVSRMLEGVHA
ARTRQQQGVALFPGIHGVGERYIERAQQVLASALGIAGFGAEPWDGHTLA
QARRVVQRYAQDPNSEYRLKSEAEKHLTSINELRVQILLEQLPVDALRMA
TDHRLRFGSLDSIHVATVADVLKTHTSILTTVQGIGAQTAGRMKAAAETL
KQEALRRQNTSIGDEPTQPAMRLINVLARFDQTETITPEERARRTRVIDY
VEHIPPSLDPYIVINPATPEFNNFTDDLRWIDANPNLFHPQTITTPPADI
WDDYISRPAHYQGLLATLLGRDIEGADELLDATTLQKIRDLTLDKTHLTD
LHLRGYQSFGARFAIIQKKTLLGDDMGLGKTVQALSAAAHLAATEKDFRT
LVVVPASVIVNWTRECKRFLNLPVFIAHGDNKQDAINAWSNTNGIAICTY
DGVRTMDIPAPGLVIADEAHLIKNPSTKRTQALRKLIDAAPYTLLMTGTP
LENKVEEFVNLVRYIQPELITRGMSKMQAENFRERIAPAYLRRNQADVLD
ELPERTDSIDWIDLTPEDRSAYDDQVRQGSWMGMRRSAMLSPTPRLTSAK
MQRILELFEEAEEHGRKALIFTYFLDVLDELEKHLGERVIGRISGDVPAT
KRQLLVDALSHSKPGSALIAQITAGGVGLNIQSASLCIICEPQVKPTIEQ
QAVARVHRMGQTATVQVHRLIGDETADERMLEILAGKTHVFDVYARLSET
AEIPDAVDITESQLAARVIDEERARLGLTESTGPKDEETALS
>cg2132 conserved hypothetical protein
MTENQTPSSTSAPKPGPRPGPRPGPRPGAQVAAKKAAVATPAPIAKTSND
PAKFGRVEADGSAYVTTSAGERLIGSWQAGTPEEGLAHYGARFDDLATEV
ELMEQRLISHPDDATSIRTKAEELKATLPTIAAIGDLDGVEARLSKIINN
SEEANERAKEQKAKNRERAVARKEELAVEAETLAENSSDWKVAGDRIRAI
LDEWKSIHGIDRKTDDELWKRYSRARDSFNRRRGAHFAELDRTRASARKL
KEELVERANALKESTEWNDTARAFRDLMTEWKAAGRAPREIDDKLWAAFK
GAQDYFFDKRNAVAKERDQEFEANATAKQQLIDEYDAQINPEQGLDGARS
KLRELQEKWEEIGFVPRGVVREFEEKIAVLEKRVSAAEESQWRRTDPEAQ
ARADQFSAKVAEFNAQADAAEAKGNSKKAEKLRAQAAQWAEWSRAAHEAV
DQL
>cg1384 putative NUDIX hydrolase
MVMQGIGGRKLAATVLLVRDGIINGRPDVEVYIQERVSTMANFPRATVFP
GGGVDSRDFADGHGKEVWRGPSAEEWGVRLGVEPHVAYALVFAAVRELFE
EAGTLLAEHTDGSGLVKNAGQYHGYRELLETHEMSLTDMLQSENLAIRSD
LIVPFARWASPEGNREQFDTFSFVAVEPEGQCADGNTSEASSTGYFPARL
ILDGWRAGLLRLVIPTWASLFELSQFKTVEELLEYSAQVDMSPVLDDAVD
NPRYAEFYQAMRTERF
>cg2097 DNA or RNA helicase of superfamily II
MSSNLRAWQRAALDNFLANKPRDFLAVATPGAGKTTFALRVATELKASRT
VDRIIVVVPTEHLKVQWSQAAARVGLALDPEFKNSGSINPAYDGICVTYA
QVSMHPFKHYQLTMARRSLVILDEIHHGGDAKSWGDGISQAYRDAEHRLA
LTGTPFRSDDSQIPFVRYQEDDEGHLVSKSDHTYGYSEALADGVVRPVVF
LAYSGEARWRDSAGEEYAARLGEPLNAEQTAKAWRTALDPKGDWIPAVLS
AAHTRLMQLRQNIPDAGGLVIASDTKTARAYAKILGTLSSTPVAVILSDE
AGASERIDEFSASTDEWMVAVRMVSEGVDVPRLAVGVYATSASTPLFFAQ
AIGRFVRSRMPGETASVFLPSVPVLLELAEKLEVSRDHVLGKPHRPKEGW
DDELLQEANRKESEPDDMPKYESLGAEAELDSLIYDGSTYGTGTFSGSAE
EADYLGLPGLLDAEQMRELLRKRQEEQLDARDAAEKRRKELEKQQQREAE
IHEKPVEEVASDEIPRLRKELNTIVSITSGRTGRPHGAIHTEARKHCGGP
PTALCSAEQLRARIDYLRKW
>cg0714 polymerase involved in DNA repair
MTRVMALWFPDWPVQAVHLDEDAPAHNKPVAIAAHYRIQVCGVAARKRGV
RRGMKVRQAQAVCPELEVVDADADRDARMFEGIVASLGEVASSVEVLRPG
LVAVDAGAAARYYGSEDIAAQMLIDAALRQGIDVFAGVADEITTAVIAAR
ANGGTVVKREASRSFLQQQPLGVLAAEEALGCEAEVVRALADLGMRTLGE
LAELPVEAVATRFGNAGLRCHNIARARHDRKVAPPITHADWEVSHVPEEP
ILRVDAASFVARNLASRLHQLLSKGGVVCQLLKVTADFSTGDTVSRIWRT
GEPLTEQATADRVRWQLDGWLTARGVHSDDPNEHDGITALWLIPLECVPP
DMASGGLWDTGRSQQHVARQVIERVQSSLGVDAVLQPVPAGGRGVEERIH
FVPYGEKRDAIRNPAGSWPGKIPGPLPARLGGGINHPASQVTMIDTEGQR
IYVTAEALLSSSPYALSWGPARYLITGWAGPWPVDDRWWEKNGTKYARLQ
VVGRAVSEERQLSAWLLMWKDNKWRIEATY
>cg1241 hypothetical protein predicted by Glimmer/Critica
MGDSCTGSRELEEEDLDLYGRFQAPAANEPGFYVDCHVFSTFDVFLNYTP
DVYEELAEAKYFSPKPRSKKLAPLTRDVFEAISSEVR
>cg1371 Predicted nuclease of the RecB family
MRLVIARCSVDYVGRLEAHLPSADRLLMVKADGSVSIHADDRAYKPLNWM
TPPCSLVETPITDEDGEATGESLWVVENKKGEQLRITVEEIHSEQNFDLG
QDPGLVKDGVEDHLQELLAEHITTLGDGYTLIRREYPTAIGPVDILCRNS
DGETVAVEIKRRGGIDGVEQLTRYLELLNRDELLKPVHGVFAAQEIKPQA
KTLAEDRGIKCVTLDYQALRGIESNELTLF
>cg1035 TatD related DNase
MSKKKPRPIPVPAQFIPGLIDAHTHLASCGGDLAGLVERAKEAGVEKLCT
VGDGLAEAELALEAAQQFGNVFAACAIHPTKADQLDGAARARLTQMAADP
NCVAIGETGLDSYWIKHDPEDTAALDVQEEALRWHIDLAISADKPLMIHN
READADLMRVLADAPPPKDTILHCFSSPLDVAKEALDRGYVLSFAGNVTF
KRNEELREAARIAPISQILIETDAPYMTPEPFRGSRNEPSLIGHTALCIA
EVRGMAVEDVAAALNENFDRVYGVTNL
>cg1018 PROBABLE ATP-DEPENDENT DNA HELICASE PROTEIN
MNATREEANNLLAGIAGPGAQLRDDQWVAIDALVNQRKRMLVVQRTGWGK
SAVYFIAAKLLRARGAGAAVIISPLLALMRNQVASAERAGIKAATLNSAN
MTEWETIQQQVVSGDADVLLISPERLNNPDFRDTILPRLAAETGLVVVDE
AHCISDWGHDFRPDYRRIRDLLAGLAPNIPVLATTATANDRVVEDVRAQL
GDGTGLLRGGLDRESLYLSVVNLLNPTERPAWLATHLKELTGSGIIYCLT
VSAAHDLADALNSVGWNVAAYTGRTEAGERERLEHALINNEIKALVATSA
LGMGFDKPDLGFVVHMGSPSSPVSYYQQIGRAGRGTARADVILLPGTEDK
EIWEYFASVSFPREEVVRQLLAVLTDEAQSTVKLESQVDLSRSRLEQVLK
VLDVDGAVKRVRGGWVSTGQEWIYDAERYAGLEQARKIEQQSMVNYQNTT
ECRMLYLRKELDDVEATTPCGRCDNCTGKTWGLDTDASITLKVDQQLQTP
GVKIAPRKMWPTGISVRGKIAGLEEGRALGRLNDIARGPALKALLDSGAY
SDDPWMARIIEVLKNWDWTNRPANVVALGNTNFGSTEMIIQVAQSIAAVG
RMNFAGVLPAAPGAEEVMAQNSAYRVEALLKQWDWSQGLQLVPGPILLVT
DLIDTGWSVTVAGNGIAQRTSEKVLPFALASRG
>cg1519 hypothetical protein predicted by Glimmer/Critica
MKYFALNRDNLIGPAVEILAPLGWASYGLWHRRGTEQIVELARRGTDSAE
IDALVTQQWNNTSESFLHHVAIPLRRYGRGIDYSFQRLQFQRGNLIDQAV
KCHENGNYAAAILLTFPKSMGLPEI
>cg1839 Uncharacterized ATPase related to the helicase subunit of the Holliday junction resolvase
MLGCFSQATNLCTMAQDSLFETPETPGSAGNTSSVSNSKAASKYFHPGGH
APLAARMRPRTLDEVVGQQHLLGEGRPLRRLIEGSGDASVILYGPPGTGK
TTIASLISAAAGDRFVAMSALSSGVKEVRAVIERARMDLQLGQRTVLFID
EVHRFSKTQQDALLSAVENRTVLLVAATTENPSFSVVSPLLSRSLLLQLE
SLSDEDIKTVLNKALEDERGLAGRITATDEAVDQLVLLAGGDARRGLTYI
EAAAEAVEDGGVLDIDTVMANVNRAVVRYDRDGDQHYDVVSAWIKSIRGS
DVDAALHYLARMIDAGEDPRFIARRLVVHSSEDIGMADPSAMQVAIAAAQ
AVQLIGMPEARINLAQATIHLALAPKSNAVIMAMDAALTDVQQGHIGTVP
AHLRDGHYEGAKKLGNAVGYSYPHDDPRGVVRQEYLPENLRDRVYYEPTT
HGGEKRIAEYIGRLRRIIRGTK
>cg2226 Predicted Rossmann fold nucleotide-binding protein involved in DNA uptake
MIDSRLLAWAYLSKVVEGPNAHLQKLLKEGHDVERIAFGIKHREEWIGEG
LLKNTDSRYSIDTAQTDLETIAKLGGRLITPEDDEWPMEELDHAFGFAAS
GMSDHVRTYQDDALPPHALWIRGGNLRTLSAQSVTLVGTRAISQYGTEVT
REFTQNLVSHQWTIISGGALGVDSVAHSEAVRAQGSTIAIAACGLDRSYP
SHNRDLFNQIAKSGKGALVSEYPPGTPPQRHRFLTRNRLVAALSQGTVVV
EAAWRSGALNTLSWCAGLGRIAMAVPGPVNTAGSLGCHERIRNGSAQMVT
SADDVRSLLGAVGAMDSQTQYELNFAATPVQGLTRNELRVFDALDDRGEG
REAASIATEAGLTLQLTIFLLIALNKRGIVKRDGTAWSRNAEMP
>cg1752 'int, putative phage integrase-fragment
MMHTSSPMNELQAAGERTPPETATSVRTIPIADDLITVLDHRVAASIQGG
IFETARGAPYRIASADGELRKTVTRLRECVTFHSFRHLYASRLISAGVSV
KQVQRDLGHTTVSTTLDTYVPFFPGLNNQPAAEIARMMKFMRATCGRLSA
GV
>cg1998 cglIIR, RESTRICTION ENDONUCLEASE CGLIIR PROTEIN
MSHHTHLNNYITSLSDNADLREKVTATVDAFRHTVMDDFDYISDQQVLLY
GDVQSGKTSHMLGIIADCLDSTFHTIVILTSPNTRLVQQTYDRVAQAFPD
TLVCDRDGYNDFRANQKSLTPRKSIVVVGKIPAVLGNWLRVFNDSGALSG
HPVLIIDDEADATSLNTKVNQSDVSTINHQLTSIRDLATGCIYLQVTGTP
QAVLLQSDDSNWAAEHVLHFAPGESYIGGQLFFSELNNPYLRLFANTQFD
EDSRFSDAIYTYLLTAALFKLRGESLCTMLIHPSHTASSHRDFAQEARLQ
LTFAFERFYEPMIQHNFQRAYEQLAQTDSNLPPLRKILNILGGMEDDFSI
HIVNSDNPTVEEDWADGYNIIVGGNSLGRGLTFNNLQTVFYVRESKRPQA
DTLWQHARMFGYKRHKDTMRVFMPATIAQTFQEVYLGNEAIKNQLDHGTH
INDIRVILGDGVAPTRANVLDKRKVGNLSGGVNYFAADPRIKNVEALDKK
LLAYLDKHGEDSTIGMRAIITILNAFTVDPNDLDLATFKAALLDFERNQP
HLTARMVLRTNRKVNQGTGALLSPTDQALSRAEVAHPLLILYRIEGVNDA
AAQRGEPTWSSDPIWVPNIKLPGQRQFWCVDG
>cg1996 cglIM, MODIFICATION METHYLASE
MSTKPTIVSTFSGCGGLDLGLQEVGFDPIWANDFSEEAVQTYKHNIGDHI
VHGDITEIDPFTDDTIPDGDLVTGGFPCQDFSMIWKRPGLDGKRGTLYQN
FRDFVAAKKPKAFIAENVKGLLTANQHKAIKTIIEDLEAVEPGYIVKPRL
YNFAEYGVPQFRERVLIVGIRRDTGFDFKHPAPTHGPRGDMPYKTAGEAL
KGVKDVPTNNNHMKIMPRTVEVLKRIPEGENFTAIPKDDPYYVKGMISHV
YRRLHRDEPSKTLIAGGGGGTWGYHYEENRALTNRERARIQSFPDDFEFL
GSNTEVRRQIGNAVPPVGMHAVGERLMNLYTGNYTPVDLEEQHAYLQTLS
IKERLALADQEAD
>cg2776 dinG, PROBABLE ATP-DEPENDENT DNA HELICASE-RELATED PROTEIN
MAKAVTKAFDTERHLAVQAGTGTGKSLAYLVPSIRHAQKSDSTVIVSTAT
IALQRQLVNRDLPRLVDALEPLMERRPTFAIMKGRSNYLCMNKVARQEEL
NQEDALIEQEDISWLGKHIVRLNEWANETETGDRDDLDPGVPDLAWKQVS
VTARECIGASRCPHGEDCFAEIARGKAKEADVVVTNHALLAIDALSDVSV
LPEHDVVVIDEAHELDGRITAVASAEITVNSLNLAARRASKLDSDKREER
VQEIAGDLETLLQTMQPGRWNDMDEGSKGTLVALKDALWALRAQIAGAPE
GEAANDPERFAERQNLSNHLMEIHDANVRILEVFAEEDPSKQYDVVWHNH
DDRRGDSLNVAPLSVAGLLHEKLFAENTVVLASATLTIGGNFNAMAASWG
LPKGSWDSMDAGTPFDPAKSGILYTARHLPDPGRDGLPEETLDEIYELIT
AAGGRTLGLFSSKRAAEQATKAMRLRLPFDVLCQGDDNTAALVKKFSDSE
NTCLFGTLTLWQGVDVPGRSLSLVLIDRIPFPRPDDPLLQARKEAADAEG
RNGFMEVAATHAALLMAQGAGRLLRHVGDRGVVAVLDHRLSTKRYGGFLR
FSMPRFWETTNPETVRAALKRLVTK
>cg2355 dinP, Nucleotidyltransferase/DNA polymerase involved in DNA repair, DinP homolog
MQRWVLHIDMDAFFASCEQLTRPTLRGRPVLVGGVSGRGVVAGASYEARK
FGARSAMPMHQAKARVGFGAVVVTPRHIVYSAASRRVFQIVEKRAGIVER
LSIDEGFMEPEALVGATPEEVKQWAEELRAEIKEVTGLPSSVGAGSGKQI
AKIGSGEAKPDGVFVVPVDKQHDLLDPLPVGALWGVGPVTGSKLASMGVE
TIGDLAALTQKEVEISLGATIGISLWNLARGIDDRPVEPRAEAKQISQEH
TYEKDLLTRQQVDAAIIRSAEGAHRRLLKDGRGARTVSVKLRMADFRIES
RSYTLSYATDDYATLEATAFRLARYPGEVGPIRLVGVSFSGLEESRQDIL
FPELDQQIIVPPAPDTDYEVGVQSSSSSESTQVEAPQDVALSMWCATQDV
YHPEYGHGWVQGAGHGVVSVRFETRSTTKGRTKSFSMDDPDLTPADPLDS
LDWADWFAENGETGDDE
>cg0001 dnaA, CHROMOSOMAL REPLICATION INITIATOR PROTEIN
MSQNSSSLLETWRQVVADLTTLSQQADSGFDPLTPTQRAYLNLTKPIAIV
DGYAVLSTPNAMAKNVIENDLGDALTRVLSLRMGRSFSLAVSVEPEQEIP
ETPAQQEFKYQPDAPVISSNKAPKQYEVGGRGEASTSDGWERTHSAPAPE
PHPAPIADPEPELATPQRIPRETPAHNPNREVSLNPKYTFESFVIGPFNR
FANAAAVAVAESPAKAFNPLFISGGSGLGKTHLLHAVGNYAQELQPGLRI
KYVSSEEFTNDYINSVRDDRQETFKRRYRNLDILMVDDIQFLAGKEGTQE
EFFHTFNALHQADKQIILSSDRPPKQLTTLEDRLRTRFEGGLITDIQPPD
LETRIAILMKKAQTDGTHVDREVLELIASRFESSIRELEGALIRVSAYSS
LINQPIDKEMAIVALRDILPEPEDMEITAPVIMEVTAEYFEISVDTLRGA
GKTRAVAHARQLAMYLCRELTDMSLPKIGDVFGGKDHTTVMYADRKIRQE
MTEKRDTYDEIQQLTQLIKSRGRN
>cg3304 dnaB, PUTATIVE REPLICATIVE DNA HELICASE
MATDTHAASFDDDYVPPQEPSDSFADDAHVDVPAPAFEDFSPAQAFGQGT
RGGDSQGFKKRGRKDESREYRDFRQPPYDNDAEMGVLGAMLLSPTTVIDI
LDILTPEDFYRPSHQLIFQAIIDLFSDNRDIDPVIVSGRLDRTNDLDRVG
GGAYLHDLIQSVPTAANARYYAEIVSEKAVLRRLVDAGTRVVQLGYEGDE
GAEIDAVIDRAQQEVFAVSQKNQSEDYAVLADILDETMAELEMLNDGGIA
TGIPTGFKDLDDLTNGLRGGQMIIVAARPGVGKSTIALDFMRSASIKNNM
ASVIFSLEMSKSEIVMRLLSAETEIRLADMRGGKMDETAWEKMVQKLDKV
AQAPLFIDDSANLTMMEIRSKARKLKQKHDLKMIVVDYLQLMSSGKRVES
RQQEVSEFSRQLKLLAKELDVPLIAISQLNRGPESRTDKRPQLADLRESG
SLEQDADIVMLLYRPDSQDKDDERAGEADIILAKHRGGPIDTVQVAHQLH
YSRFVDMARG
>cg2338 dnaE1, PUTATIVE DNA POLYMERASE III, ALPHA CHAIN
MAKQSSFVHLHNHTEFSMLDGMAKIDMLADEVKAQGMPAVGITDHGNMYG
SNPFYRKMTEMGIKPIIGIETYMAPESRFKKERVRWGEPHQKSDDVSGSG
AYLHQTMLAENTTGLRNLFYLSSMASYEGQLGKWPRMDADIIAEHAEGII
ATTGCPSGDVQTRLRLGQFDEALEAAAMWQDIYGRDNYFLELMDHGLDIE
TRVRSELLEIGRKLNLPPLVTNDCHYVLESQAQAHEAMLCVQTGKTLHDE
DRFKFGGTGYYVKSAEQMRALWDDMVPDGCDNTLWIAERVQSYDEIWEEH
SHDRMPIADVPEGYTPTTWLHHEVMAGLEDRFSGQQVPEDYIERAEYEIS
VIDMKGYPSYFLIVAEIIKHARSIGIRVGPGRGSAAGALVAYALTITNID
PMEHGLLFERFLNPERPSAPDIDIDFDDRRRGEMIRYAADRWGEDKIAQV
ITFGTVKTKQALKDSARVQMGQPGYQIADRVIKELPPAIMAKDIPLSGIT
DPDHPRFNEAGAVRQLIETDPDVKRIYDTARGLEGVVRQSGVHACAVIMS
SVPLLDCIPMWKRPADGALITGWDYPACEAIGLLKMDFLGLRNLTVIGDA
IENIKANRDGEVLDLENLAIEDEETYKLLGRGETLGVFQLDGGGMQELLK
RMQPTGFNDIVAALALYRPGPMGVNAHWDYADRKNGRKPITPIHPELEEA
LEEILGETYGLIVYQEQIMRISQKVANYTAGQADGFRKAMGKKKPEVLEK
EFANFEGGMKANGYSDAAIKTLWDTILPFAGYAFNKSHAAGYGLVSFWTA
YLKAHYAPEYMAALLTSVGDNKDKSAIYLSDCRHLGIRVLSPDINESSLN
FLPVGTDIRYGLGAIRNVGAEVVDSILDTRKEKGLFKDFSDYLDKIDTLP
CNKRITESLIKGGAFDSLGHARKGLMLVFEDAVDSVIATKKAADKGQFDL
FAAFDSDNNDDVASFFQITVPDDEWDRKHELALEREMLGLYVSGHPLDGY
EDAIAAQVDTALTTIVAGELKHGAEVTVGGIISGVDRRFSKKDGSPWAIV
TIEDHNGASVELLVFNKVYSIVGSMIVEDNIILAKAHISIRDDRMSLFCD
DLRVPELGPGNGQGLPLRLSMRTDQCTMSNIAKLKQVLVDNKGESDVYLN
LIDGDNSTVMILGDHLRVNRSASLMGDLKATMGPGILG
>cg0738 dnaE2, PUTATIVE DNA POLYMERASE III ALPHA CHAIN
MYPIIMEWNGGGSFNGRPLSWSKLERILSGKKVESLRPVLHEPDAQAPSS
AMQGEASVPFAELHATSSYNFLTGASDPSDVVVQAKKLGLVALSVMDRDG
FYGAVRFAEAAAEAGMHTVYGAELSLQEGVLTVLCKNPEGYKKLSHLISD
AKMATGEKGEVRYPPLPMVAEHAAGDWVVLAGFQWLDKIDYVIDCFKPEN
IVLEFGSTMTPEDADRNEYLRRTQAKFQLRGILSTNPESAARGSVRLAGA
KQALARKMPLADAESELHPMGTTWMRSGDTLLKAHPDYADLIATTVELAA
ECAFTLDLVAPNLPKWDTPGEHTEMSWLAHLVSTRIDTRYVGRSADIKAR
AATQIDYELGVIEKLGFPGYFLVVNDLVEFCRDSNILCQGRGSAANSAVC
FVLGITNAEPISAGLLFERFLSPDRDGPPDIDIDIESGRREEVIQYVYEK
YGRDNAAQVANVITYRTKGAMRDAARALGYPQGAADAWAKGTSEPPDDVL
ELAAQFKGQPRHLGIHSGGMVICDRPIADVVPVEWARMDNRSVVQWDKDD
CATAGLVKFDLLGLGMLEAIHHMLDLVAEHRGKKINLWELDLAEPEVYDM
LCKADAVGVFQVESRAQLSTLPRLKPRTFFDLVVEVALIRPGPIQGGSVH
PYLRRRAGEEAITYDHPVLEKSLGKTLGIPLFQEQLMQVAVDAAGFSGGE
ADSLRRAMGSKRSPERMAALRSRFFQGLKDTNGIVGETAEKLWNKIVAFA
AYGFPESHSQSFASLVYFSAWFKYHYPAEFCVGLLRAQPMGFYSPQSLIS
DARRHGVSILPITVNDSGVEADAPNGAIRLGLNLVKGLGHDAAQRIEDNA
PFDSIPDLSRRADLNVAQVEALARAGAVDCLGVGRRQALWQAGVAATEKP
GMLPGLSVIEAPALPGMSAFELMATNISATGVTADYQPMALIRERMEELG
IVPADRLLEVEDGTRLRIAGIVTHRQRPQTASGLTFLGMEDETGLMNVMV
SVGLWQRQRVLARNAKALIIRGIVQNAQGVATVVADRLEPLDMGEFLSRG
SRDFR
>cg2489 dnaG, DNA PRIMASE
MVMAKGRIPESDIQAIRERTPIEEIVGDYVQLKSAGADSLKGLSPFKDEK
TPSFHVRPNRGYYHCFSTGKGGDVFSFLMEMEHISFPEAVEVCAEKIGYQ
INYQGGGPGRREEPGTRQRLILANKAAHQFYREQLETPEAQPGREFLLQR
GFGQQHIYHFECGYAPAGWDTLTKHLLKKGFEFKELEAAGLSKMGKRGPI
DQFQRRLLWPIKNLSGDVIGFGARKLFDDDKMGKYMNTPETLLYKKSKVL
FGLDSAKKAIAAGHQAVVVEGYTDVMAMHAAGIDTAVASCGTAFGEEHLQ
MLRRLMLDDNYFRGELIYTFDGDEAGQKAAMRAFEGDQKFTGQSFVSVAP
NGMDPCDLRLERGDAAVRDLVARRIPMFEFVIQSIISEYTLDTVEGRLAA
LRRAVPIVADIRDKTLQSEYARLLSGWVGWSDPSEVLRQVHEEARRPKRD
KKPVRAKRFDQPLEDQSLRPTMALPNPRNPVLWQERESLKIALQYPELAG
SYFDGLPTDSFTNPAYRMVRDAISAAGGCERALDGTDWLPAVSENMTDIL
GTSLVSELAMEPIEVEAQDLESYTDGVLSRLQETRVGNQIAILKGQLQRM
RPSEDEQAYNSLFSDLVALEQARRELLARAFRG
>cg0004 dnaN, DNA POLYMERASE III, BETA SUBUNIT
MESQNVSFRVAREDLVTAVAWVARNLPTKPTQPVLRAMLITADDEGLELA
GYDYDVSTRVRLSAEVSQPGRIAVAGKLLSEITGSLPNKPVDFRIDGSKA
FVTCGSSRFELPLIPLDDYPMLPKLPAGTGSINAKLFTEAVSQVASAAGK
DDSLPMLTGVSMEIVGNQINLAATDRFRLALRTFEWEANDPELNVKLLIP
ARTLLDNARSLDSGLNDSIDIAVGTGDQVGREGLFGVHTDNRETTTRLLD
ADFPNIAPLLPKEHTAIASVEIAPLVDAIRRVSLVAERNAQIVLHFSEGQ
VILTAGATEAGHAEETLPCAFTGKELTIAFNPGYLKDGLSVVPTSRAVFG
FTEPSRPAIMIPEPEEMPSANENGIFQTPDTYFTYLLMPVRLPG
>cg1457 dnaQ2, DNA POLYMERASE III, EPSILON SUBUNIT, PUTATIVE
MPRPGASTRIEDLKLLAVDVETTGLKPHRHQIVSIGWVPINGDVIDLSGA
GYVVIRGSEGFSVGSSAVIHQLTDDEIAAGIDIKEALGQLLQALQGRAML
AHFSPIERDFISAACLKHFGTLLDVPLVDTFAMERRHMERMSTYPRGEDL
RLARIRQRYGLPNYSNHQALTDALACAEVYLVQITHLRANTLKDIWE
>cg0376 dnaX, PUTATIVE DNA POLYMERASE III, DELTA' SUBUNIT
MTNSSVFDSLAGSKTVSKTLFDAASSARALVRARTTERARARAEHQNPAM
IHDSGFAQSWLFTGPPGSGRSVAAKVFAATLVCSNPDVVGCGQCEDCRAA
MGGSHPDIEHIVPQQLSIGVDAAREVIKAAAVSPVAGNWRVVIFENADRL
TMQAANALLKTVEEPTESTVMILCAPTTDPRDIAITLRSRCRHLYIPTPS
IAEVARILVAEGNVSQADAELAAAASGAHIGRARYLAHNNAAQRRRASIL
NLAELIFHGDVAFRSVNTLVKMVETEAKDSNKEKEEAELEAVRISLGMGA
KGKGVHKAVRGGAGDFKALEDQQKLRRTRFLRDSLDLALVDLAGIYRDAI
IISSQAQVGLTHPDMEGLSQELATKVSQEGLLACLDAISKCRESFGFNVR
PIVAMDALVGRLRKAYKVS
>cg0296 dnaZX, DNA POLYMERASE III GAMMA AND TAU SUBUNITS
MALYSKYRPASFGELVGQSQVTDPLSAALDSGRINHAYLFSGPRGCGKTS
SARILARSLNCVEGPTSTPCGVCNSCVALAPGGPGTLDVTELDAASNNGV
DDMRELRERANYAPAESRYRVFIIDEAHMISTQGFNALLKIVEEPPAHLI
FIFATTEPDKMIGTIRSRTHNYPFRLLTPGDMRKVLKNAVDGEGVHVDDS
VYPLVIRAGGGSPRDSLSILDQLIAGSGPEGLTYERALPLLGVTSFTLID
DSIHALASKDNASMFTTIDNVIEEGLEPRRFTIDLLDRLRDLMVLQAVPE
ALNLGLVDAPTDRADALIEQSTLFKGNELANLASMVNSGLDDMRGATSPR
LLLEILCARLLLASNTVAGPAVSSSTDAAPAATPGGLTGIAAARAKAREY
GQKKAAPAPAPTPAPEPVREQSLAPTPEPTPAAEPTSQPAPEPEPAREPV
VEVREASVEKQPASSDPLETIRSRWSELRNIVEKQSVRTSIMLTEARVLG
LRGDTLVLGHSTGALAARLNAADHNGILVKVLAEETGLQLKVECIVGTNP
AEAGFTAQPAVQKSTWNPNYDSKPATPSAPAQPQTPKQESVPTEPEEPES
SAETSGWGQPVKIGGPAPEAQTPTPPPAPVVPATPAAPAAGAAKPAWKER
VEQAAANAAQQRQHRQGSSEPFERGVPLPPEPDLPPDPYGYPADEGFPER
NQGFQQQPAPPVEQPAPEPATEPVPAVAPEPEVSQLSEEEQLIREADEEP
GEMDRRDAKTIAMELLAQELGAKPL
>cg0015 gyrA, DNA TOPOISOMERASE (ATP-HYDROLYSING)
MSDDNTGQFDRVNPIDINEEMQSSYIDYAMSVIVGRALPEVRDGLKPVHR
RVLYAMFDNGYRPDRSYVKSAKPVADTMGNFHPHGDTAIYDTLVRMAQPW
SMRYPLVDGQGNFGSRGNDGPAAMRYTECRMTPLAMEMVRDIRENTVNFS
PNYDGKTLEPDVLPSRVPNLLMNGSGGIAVGMATNIPPHNLNELADAIFW
LLENPDAEESEALEACMKFVKGPDFPTAGLIIGDKGIHDAYTTGRGSIRM
RGVTSIEEEGNRTVIVITELPYQVNPDNLISNIAEQVRDGKLVGISKIED
ESSDRVGMRIVVTLKRDAVARVVLNNLFKHSQLQANFGANMLSIVDGVPR
TLRLDQMLRYYVAHQIEVIVRRTQYRLDKAEERAHLLRGLVKALDMLDEV
IALIRRSPTPDEARTGLMSLLDVDEAQADAILAMQLRRLAALERQKIIDE
LAEIELEIADLKAILASPERQRTIVRDELTEIVEKYGDERRSQIIAATGD
VSEEDLIARENVVITITSTGYAKRTKVDAYKSQKRGGKGVRGAELKQDDI
VRHFFVSSTHDWILFFTNYGRVYRLKAFELPEASRTARGQHVANLLEFQP
GEQIAQVIQLESYNDFPYLVLATAHGRVKKSRLLDYESARSGGLIAINLN
EDDRLIGAALCGEEDDLLLVSEFGQSIRFTADDEQLRPMGRATAGVKGMR
FRDNDQLLSMSVVRDGEFLLVATSGGYGKRTPLEDYSTQGRGGLGVVTFK
YTPKRGRLVSAIAVEEDDEIFAITSAGGVVRTEVKQIRPSSRATMGVRLV
NLEEGVELLAIDKNVEDQGEASAEAVAKGAVEGPASKTAAEETDSVDNGS
DENGEE
>cg0007 gyrB, DNA GYRASE SUBUNIT B
MANTEHNYDASSITILEGLEAVRKRPGMYIGSTGPRGLHHLIWEVVDNSV
DEAMAGHATKVEVTLLEDGGVQVVDDGRGIPVDMHPSGAPTVQVVMTQLH
AGGKFDSDSYAVSGGLHGVGISVVNALSTRVEADIKLHGKHWYQNFEKSV
PDELIEGGNARGTGTTIRFWPDAEIFETTEFDFETISRRLQEMAFLNKGL
TITLTDNRATDEELELEALAEQGETATELSLDEIDNETELVEETTDAPKK
PKKREKKKIFHYPNGLEDYVHYLNRSKTNIHPSIVSFEAKGDDHEVEVAM
QWNSSYKESVHTFANTINTREGGTHEEGFRSALTSLMNRYAREHKLLKEK
EANLTGDDCREGLSAVISVRVGDPQFEGQTKTKLGNTEIKSFVQRMANEH
IGHWLEANPAEAKVIINKAVGSAQARLAARKARDLVRRKSATDLGGLPGK
LADCRSKDPEKSELYIVEGDSAGGSAKSGRDSMFQAILPLRGKILNVEKA
RLDKVLKNAEVQAIITALGTGIHDEFDINKLRYHKIVLMADADVDGQHIA
TLLLTLLFRFMPDLVAEGHVYLAQPPLYKLKWQRGEPGFAYSDEERDEQL
NEGLAAGRKINKDDGIQRYKGLGEMNASELWETTMDPTVRILRRVDITDA
QRADELFSILMGDDVVARRSFITRNAKDVRFLDI
>cg2111 hrpA, PROBABLE ATP-DEPENDENT RNA HELICASE PROTEIN
MTTSETAPSKASLYELLEGVSLSDERTFRRRLSKARAPKALGAIKADIDK
ARLLIDEKSQLIPSITYPENLPVSSRRDDIAEAIRDNQVVIIAGETGSGK
TTQIPKICLDLGRGRRGLIGHTQPRRLAARTVAERIADELGQDIGESVGY
AIRFDDRVSSHTSVKLMTDGILLAEMQRDRFLNAYDTIIIDEAHERSLNI
DFILGYLRQLLPKRPDLKVIITSATIDPERFAEHFADASGKPAPIIEVSG
RTFPVEIRYRPLEVLDGDKIIDTDPLDGLCSALEELMAEGDGDILCFFAG
ERDIRDAMEAIEARRWKGVEVTPLFGRLSNQEQHRVFSPHSGRRIVLSTN
IAETSLTVPGIHYVVDTGTARISRYSVRTKVQRLPIENISQASANQRSGR
CGRVADGIAIRLYSEDDFNSRPEFTDPEILRTNLASVILRMASLRLGDIN
DFPFVQAPEQRSIRDGILLLHELGALTDDTQADGSPQLTQIGKDLANIPV
DPRMARMLVEANTLGCLHSVMVIVSALTIQDVRERPLEFQAQADQAHARF
KDTTSDFLGFLKLWEYIADQRNQSSGNSFRKQMKKEFLHYMRIREWWDLV
RQLEQIGQQLGWAKKEQVAGTASPDIIHQSLLTGLLSQIGSRDGESKEFT
GARGTKFLVFPGSALTKKPPQFIMAGQLVETSRLWARDVAKIEPEWVEKA
AGPLLKHQYSEPYWSSKRGAAMVHRKSTLYGVTIVADKVVPYHTVDPVAA
RDMFIRHALIEGDWSTHHRFYHDNVAKLEAIGELEAKARRRDIVVDEDTL
FDFYDAKLPSNATTTRNFDSWWKKTSRVTPDLLDFDPDSLINEDADGVNE
EAFPDKWIKGSLIFDLSYHFEPGHRDDGVTVLIPIPVLGGLDTEGFDWLV
PGLRLDLVTELIRTMPKALRRTVVPAPDFAERVLPLLRPYMTPLTTQLAD
ALHTLGGQGINASDFDPAKLPDHLRISYAAVDRRGKIIDRDRDLEALKKR
RANQIRASVSSVAKASEQDETTQWTTDTLGTIDEEIETTVDGQSVTAYPA
LVVTPTGVSVKVMPTKAAADASMITATLTLLMREIEVSTKQMVKGLPLQQ
RVAVDNYPHGGAEGLVSDARIAAIRDLMFEHGGAVRSPEEFDVLLAKVKP
ETPGVVRRTVVELAPALVHYASVVSELESWSGPAIDDMTAQLDFLLPKQA
ISIHGISRLRHLPRYLQALTIRLEEMNQNPDRDADRQDEVNFVEEQLEKQ
LSKLPAARANTKEAKDIAWQIQELRISLFAQRLGTPRPVSAQRIQKAIAK
LR
>cg0178 hrpB, PROBABLE ATP-DEPENDENT RNA HELICASE PROTEIN
MCSLSKFLMYRQLMSSRIGNFLINRISTGLPVENIIPHLQEAFSAGPKNL
VIQAPPGTGKTTLLPPLVANILCNEGAGNATPTKVLVTAPRRVAVRAAAR
RLAQLDDSQLGTKVGFSVRGEHISGSHVQFMTPGVLIRQLLNNPELPGIG
AVIIDEVHERQLDSDLLLGMLAELSQLRDDFSLIAMSATLDSDKFANLLD
AQVLSVEAPIFPLDISYAPARAPRLNAKGVDWDFLDHMAQKTHDAVTHSE
HSALIFVPGVREIDRVMSTLKSLGHNNVFPLHGQLSPTEQDRALAPSQQQ
RIIVSTPVAESSLTVPGVRIVVDSGLSRSPKRDSARGMTGLITSSCAQAS
AGQRAGRAGREGPGQIIRCYSEEDFSHFPRFVTPEISSADLTQAALWLAQ
WGTSPADLPLLDQPPHAAWTAAQQILRLIGALEGDAITSLGHRLSTLPLC
PQLSASLLRFGEQSAKILAVVSENPQGDVEKQQPDKREVERLRRLAPASV
GKASAGQIVGAAFPQLIGRKIDNGEYLLASGTRARLMDSDLKDAEWISVA
AINRSQNSAIIRAAARISEDDAIDIIGVVEETRAIFVNGKVQARKVKAAG
AIELSSTPTKPTPAEASETIATALAKGGIDLFHFSDKAASLRDRLKFIHE
HRGEPWPDIETADPHLWLSPEIEALSHGTRLNNIDMYPALQRLLPWPEAT
NFEEFAPSHLSVPSGNQHRLDYSSGRPVIRVKLQECFGLEESPQLCGIPV
QFHLLSPAGRPLAVTDDLRSFWSGPYSQVRAEMRGRYPKHPWPEDPWTAP
ATARTKNRM
>cg1507 int1, probable phage-type Integrase
MRPVKAQTNEPQALQVADIQPFHAVIAASKQLTLIDVVDVCLGTVLRAWE
ALSLRWVDVVLDEEHPRIFIRGTIVYNKEKGNHRQDKTKTTSSRRVIQLP
EIASDVLRKRHALYAEHLEMVFPSARGTYIYESNFNKLLRKHRKGTAYDW
VTVHSIRKTLASIVSENLDSKAASDVLGHADSRLTERVYIAKTDKDVPIG
DVVNQALKEARKVSKKSPNKEAKEEE
>cg2071 int2', putative phage Integrase (N-terminal fragment)
MRSERYRARFMHEGRRYSAPYTFGTKGEANEFLASERTAIINGTWMDFEM
RERFERAQLEAEERMMETFFSYASRWIETRTNAQGKKLSQGVKDDYFRYI
KSDRLSYWADYALCAITVADVREWYSDTIQDGKLTSMARSYSMMKSVMET
AVEDGIIPTNPCKVRGGGNTKTGKRLIPQPMPSLKRTLVHCRVSTFVWLL
LLLPAHFDSVKSLRYEPPMSMFILIAADL
>cg2710 int3, integrase
MNLDIAAPKPKKSGRRTLTKPEWDAVIKHLLTRDTEPLLTPTKHKNIRQS
TKNIHARIVRLTLLQAVSGLRIAEANQLQWKHIIDGDDGMLINASADIVK
GRKGKERGRYIPILRADVAEYLRTHREDDEHFIVGSPTTTARPWDATNAD
DKVPELYRQIAEATGVKTLQDLRSHSWRATLHGVYADVMDPATRAAIFGH
TEQVAEEYYNDRQNIESLMRQVKRAYA
>cg1401 ligA, DNA LIGASE
MTEDNAQLRRTWNDLAEKVRYHRDRYYNEQPEIPDADFDALFKQLQQLEE
DHPELAVPDSPTMVVGAPVAEQSSFDNVEHLERMLSLDNVFDEQELRDWL
GRTPAKQYLTELKIDGLSIDLVYRNGQLERAATRGDGRVGEDITANARVI
EDIPHQLQGTDEYPVPAVLEIRGEVFITVEDFPEVNAQRIADGGKPFANP
RNAAAGSLRQKNIEDVKKRRLRMISHGIGFTEGFSPASQHDAYLALAAWG
LPTSPYTEAVTDPEDVVKKVSYWADHRHDALHEMDGLVIKVDDIASQRAL
GSTSRAPRWAIAYKYPPEEVTTKLLDIQVGVGRTGRVTPFAVMEPVLVAG
STVSMATLHNQSEVKRKGVLIGDTVVIRKAGEVIPEVLGPVVELRDGTER
EYIFPTLCPECGTRLAPAKADDVDWRCPNMQSCPGQLSTRLTYLAGRGAF
DIEALGEKGAEDLIRTGILLDESGLFDLTEDDLLSSNVYTTNAGKVNASG
KKLLDNLQKSKQTDLWRVLVALSIRHVGPTAARALAGRYHSIQALIDAPL
EELSETDGVGTIIAQSFKDWFEVDWHKAIVDKWAAAGVTMEEEVGEVAEQ
TLEGLTIVVTGGLEGFTRDSVKEAIISRGGKASGSVSKKTDYVVIGENAG
SKATKAEELGLRILDEAGFVRLLNTGSADE
>cg0151 mag, PUTATIVE 3-METHYLPURINE DNA GLYCOSYLASE
MPIDFLQPADIVAPQLLGCTLTHGGVGIRITEVEAYLDSTDEAAHTYRGK
TPRNAAMFGPGGHMYVYISYGIHRAGNIVCGPEGTGQGVLLRAGEVVSGE
SIAQSRRGEGIPHARLAQGPGNFGQALGLEISDNHASVFGPSFLISDRVE
TPEIVRGPRIGISKNTEALLRFWIPNDPTVSGRRGYPKE
>cg1099 mfd, PUTATIVE TRANSCRIPTION-REPAIR COUPLING FACTOR
MTPMLAGLLKVAATDPKLKGLMSNVGQQHLHITGIDQARPWAIGALAHHA
PVLVVTATGREAEDLTAELKAMMGDKVAWLPSWETLPHERLSPGVDIVGK
RAQVLNHLGDLKVVVAAARAFCQPVLKDAEGRAPLTLKEGAEFDFSALTT
ELVFRAYKHVDMVAKRGEFATRGGILDIFPTTLDYPVRVEFWGDEVSDIR
QFSVADQRTIPEITIKSIEIFPARELLITEEVASRAESLISKHPGNPTLV
EMLSRIADSQDVDGMEALIPALTDTPMVPMLELMPENTHVLVIAPEKVRR
RIADLEATDAEFLMAGWEAAAMGADGPVAAEGLDLEASSYRSYESLEVSA
SKSDVRWWTFAPPGMFEASEEATLPLDFEAGPAPRGELPKIDAMMAQLLA
HTTGGGRAAFIAPTQGAIKRMVDRFAEKGIPTHVATPGWEPTPGQVTLYH
ALSHAGLVFPKVRKHRDGAAMPLVVITETDLTGNRVGDIAGAKRRPAKRR
NKVDPLALEPGDLVVHETHGIGRFVKMTERTISAGDETSRREYIVLEYAP
SKRGQPGDQLYVPMDALDMLSRYVGGEKPTLSKMGGSDWKNAKKKARAAV
REIAGELVELYAKRQSAPGHPFAPDTPWQKEMEDNFPYVETEDQMLAIDA
VKEDMEKSVPMDRVIIGDVGYGKTEVAVRAAFKAVQDGKQVAVLVPTTLL
AQQHQSTFEERMTGFPVTIKGLSRFTSPAESREILSGLAAGSVDIVIGTH
RLLQTGVQWKNLGLVIVDEEQRFGVEHKEHIKALRTHVDVLTMSATPIPR
TLEMSMAGIREMTTMLTPPEDRHPILTYVGPYEDKQVAASIRRELLRDGQ
VFFIHNKVADIEKKAREIRDLVPEARVVVAHGQMSEELLEQTVQGFWDRE
YDVLVCTTIVETGLDISNANTLIVENAHHMGLSQLHQLRGRVGRSRERGY
AYFLYPKGATLTEMSYDRLATIAQNNDLGAGMAVAMKDLEMRGAGNVLGA
EQSGHIAGVGFDLYVRLVGEAVEAYRALADGKVVDGTVKGPKEIRVDLPV
DAHIPEKYINAERLRLEIYRKLAQSESEVDLRLAVEEMEDRYGPIPEEVE
RLLAVSRLRHLMREAHLTDIAVQGTRIKVHPVDLADSQQVRLKRLFPGAT
YRAAAKAIQLSFPKTGNKVTDPLLRDVDLLQWVANFISNMFNLEEIDVRG
PQPGKPKKKSSVISVSL
>cg2272 mutM1, FORMAMIDOPYRIMIDINE-DNA GLYCOSYLASE
MRRGLEDHMVGHTIVSATVLHPRAARNQLGGGPEIEANIAGLRVSAAKRR
GKFLWLELIDAPSGETRPDLGLLVHLGMSGQMLIKEPDAPISPHLRAKVE
LDNGDEVWFVDQRTFGYWWLGDLVDGVPERVSHIATDVLDESADFSAIAR
NLKSRKSEIKRLLLNQEIVSGIGNIYADEMLWQAKIHPLQRADRLSLARL
EELLQAGKDVMTKALAQGGTSFDALYVNVNGNSGYFALSLNAYAQTGEPC
GRCGTLIIRESFMNRGSHYCPNCQKRR
>cg3328 mutM2, PROBABLE FORMAMIDOPYRIMIDINE-DNA GLYCOSYLASE PROTEIN
MPEGHVIHRLAGELTKNFGDTILDATSPQGRFTSEAAIINGHRIAVAEAY
GKHLFVEFDADHPEHILYIHLGLIGTLQFEPAEETRGQIRLHLSDGEIAA
NLRGPQWCRLITDAERTQAIGKLGADPIRDDADPEPIRIKVQRSGRSIGS
LLMDQKLFAGVGNIYRAETLFRLGISPFTIGKDITTAQFRSIWADLVGLM
KDGVVTGRIDTVRPEHTPEAMGRPPRKDDHGGEVYTYRRTGQECFLCATP
IKEQVMEGRNLFWCPGCQR
>cg2955 mutY, A/G-SPECIFIC ADENINE GLYCOSYLASE
MSFTAFQTALLVWFRANARDLAWRDPNTSAWGILLSEVMSQQTPVARVEP
IWREWMEKWPTPEDFANASTDEILRSWGKLGYPRRALRLKECAEVIVEKH
AGEVPDTVEALLALPGIGDYTARAVAAFHFGQRVPVVDTNVRRVYQRAVA
GRYLAGPAKKQELIDVSLLLPNTHAPEFSAAIMELGALICTATSPKCDTC
PLLDQCQWQKLGCPSPSEEELASAKKRVQKFVGTDRQVRGLIMDVLRNAT
APVPLSAIDVVWPDDAQRSRALFSLIEDGLAEQNEAGYFHLPR
>cg0969 nei, ENDONUCLEASE VIII REMOVING OXIDIZED PYRIMIDINES MA
MPEGDSVFQLSRKLQFMRGREVLETSLRVPSVALHDFTGQTVNRVWPYGK
HLFMQFGEEILHTHLKMEGTWAVHRKGDRWRKPGHTARVVLVLSENIEVV
GHSLGFVRVFPANRYSEEIAYLGPDVLAEEFDINTARNNIASNPSRTIGE
ALLDQSNLAGVGNEYRAEICFLMGVHPATQVGYVDVEKALKITRRLMWEN
RNSPIRVTTGVRRAGESTYVFGRNNKPCRRCRTPIVKAELGERIIWWCPR
CQPLNS
>cg0353 nth, PROBABLE ENDONUCLEASE III PROTEIN
MGSITPQKRPRVGSHIANKGQETDIGRKRRARRINRTLTVAYPDAHCELD
FTNPLELTVATILSAQCTDVRVNQVTPALFKRYPTATDYANADRTELEEF
IRPTGFYRNKATSLIGLGEALISLHDGQVPGTLEQLVELPGVGRKTANVV
LGNAFGVPGITVDTHFGRLVRRLKLTDEEDPVKVEKVMNELIEKPEWTMF
SHRLIFHGRRICHSRRAACGACMLAADCPSFGLEGPSDPFEAQKLIKSDD
REHLLKMAGM
>cg3331 ogt, METHYLATED-DNA--PROTEIN-CYSTEINEMETHYLTRANSFERASE
MHHLRYESPIGELLLVASDQGLTYVAFSDENYAACTVGSTPGTNAVLEQA
VAELEEYFAGKRKEFSTPLDWPSQNLLSFRGKVQEFLLSIPYGESKTYKQ
IAAELNNVGAVRAVGSACATNPLPIFAPCHRVLRTDGALGGYRGGLEAKQ
WLLELERP
>cg0976 pcrA, ATP-DEPENDENT HELICASE PCRA
MNTSPFTPGSPDLIDGLNEQQRAAVEHIGSPLLIVAGAGSGKTAVLTRRI
AYLMRYRGVHPQQILAITFTNKAAAEMRERVSQLVGPVAERMWVATFHSV
CVRILRQQAQLVEGLNTNFTIYDSDDSRRLLTMIAKDLELDIKKFSARTL
LGAISNLKNELVTPQEALADAERTHNPYETVVARAFSEYQSRLRRANAVD
FDDLIGETVRIFREHPPVAEYYRRRFRHVLIDEYQDTNHAQYELISTLVG
KPDQDPSELCVVGDSDQSIYAFRGATIRNIEEFERDFSNARTILLEQNYR
STQTILSAANAVISQNENRRPKNLWTALGEGEQIIGYVADNEHDEARFIA
SEIDNLVDHGMSYSDIAIMYRTNNSSRALEDVFMRTGVPYKVVGGTKFYE
RKEIRDIIAYLRVLENPDDTVNLRRIINTPKRGIGDRAQAFIALHSENNQ
ISFGQALLDAALGKVDLLGARGKNAVIKFNELFDALRSELPTMVNEVTGL
PDIGQVISRILDITGYKAELEASNDPQDGARLDNLNELVSVAREFSSDAA
NRMVNEVPEGEAQPGSLQAFLERVSLVADADQIPDSDNGVVTLMTLHTAK
GLEFPIVFLTGWEDGQFPHLRSLGDAKELAEERRLAYVGITRARKRLYMT
RAMLRSSWGNPVTNPPSRFLQEVPAELIDWRREEPQMSSAWAPRPTRSIP
TKTRTNNKQLDLSVGDRVNHDKYGLGTVLSSDGSGPRATVTIDFGSSGKV
RLMLLGGVPMEKL
>cg0728 phr, DEOXYRIBODIPYRIMIDINE PHOTOLYASE
MNANARVFILNSLAMNDPQRSPTLLWFRDDLRLSDNAALKWAADHGPVIG
LFIDETINRSIGAAARWWREQSLNALAQDLSFYGVPLLRRTGNPLEILPK
IVSEMEVKAVTWNRRYHQPLCEVDATLKKNLRDKGIEVHSHPGFLLTEPW
EVSTATGTPYKVFTPFSKAAWEVARVHAYETVKNNVPVPSHLTGPEDVEL
PILEMEQPFWSTTLVKECAPGEKNASEKLFDFLEHLQDYPQARDSLARSA
TSKLSAHLRFGEISIHRVWAETAAIDSEGTELFLKELLWRDFAWHRLYAL
PHMDTQNVRMQFNRFGWSWDPSEKDKLNTPSTPLIPTKADQFHEDLAAWR
AGKTGIPLVDAGMRELWATGSMHNRVRMVVASFLTKNLQIHWRHGEEWFW
ETLVDADPASNAFNWQWAAGSGDDASPYFRIFNPVTQAKKFDPDETYIRR
WVPEYGTPSYPDPIVDLKESRQIALDAYSAIK
>cg0059 pknA, SERINE/THREONINE PROTEIN KINASE
MSQEDITGKDRLQELIGADYRLQWIIGHGGMSTVWLADDVVNDREVAIKV
LRPEFSDNQEFLNRFRNEAQAAENIDSEHVVATYDYREVPDPAGHTFCFI
VMEFVRGESLADLLEREGRLPEDLALDVMEQAAHGLSVIHRMDMVHRDIK
PGNMLITANGIVKITDFGIAKAAAAVPLTRTGMVVGTAQYVSPEQAQGKE
VTAASDIYSLGVVGYEMMAGRRPFTGDSSVSVAIAHINQAPPQMPTSISA
QTRELIGIALRKDPGRRFPDGNEMALAVSAVRLGKRPPQPRTSAMMAQAE
APSPSESTAMLGRVARPATITQEAAPKRGSGIGIGLFIAALLAVIIGAVI
YAGTTGILFNDTPEETTTPETITETYTPTVEETTSQWVPPTPPTRSTFTE
PETTSHRPTTSEESTSEEPTTEAPTSSRTVPQIPTSTPRTSASVPVETNA
PADDLIDAVNGLLDVGGAQ
>cg3046 pknG, Serine/threonine protein kinase
MKDNEDFDPDSPATEAVAFNPFDDDDEDDSPATSAVAFNPFEDDDDDDEF
QGEGLEFLLRDLDNLRATQGQMVVEQPAVEDSLGSASAHTETTAASLRPR
PEVDPSERSRRQAISLFRERRRVRRQSRPVADGMVELPFITPKPEDELLI
DPEKKRKPGVAAPQLVAGDIVAEQYEVLGVIAHGGMGWIYLANDRNVSGR
IVVLKGMMAQSSVQDQGTAEAEREFLADITHPGIVKAYNFIDDPRVPGGF
IVMEYVNGPSLKDRCKAQPDGVLRVDLAIGYILELLPAMDYLHQRGVVYN
DLKPENVIATEDQVKLIDLGAVTGIGAFGYIYGTKGFQAPEVATHGPSIS
SDIFTIGRTLAALTMPLPVEDGVLAPGIPSPKNSPLLRRHLSFYRLLQRA
TADDPQHRFRNVSELRTQLYGVLREILAVRDGKQYPPQHSLFSPQRSTFG
TKHLVFRTDRIIDGIERQARITAPEIVSALPVPLIDRTDPGARMLSGSSY
AEPSETLETLRNSMEDEQYRQSIEIPLGVVRALLDLGFTTEARQWLETLE
GRIGDDWRHKWFSGITYLLLDDYATAQVFFNHVLTILPGEAAPKLALAAV
DELILQQIGAESTAYLTPDIVSATATLSKDFEDLDASAFESLSDTWSHIS
SDPHVVRFHSLRLYALVWATNPTTVSSAFGLARQLMAENQIELAVQALDK
LPQSSTHYRMATLTTILLLVSSNLSESRIRRAARRLTEIPTNEPRFNQIK
IAIMSAGLSWLRERKLKASASANPLFEYPFSQKGLRTGISEALRIQARSA
PFPHHRYALVDMANAVRPLSWF
>cg1525 polA, DNA POLYMERASE I
MLIDGHSMAFRAFFALPAENFSTSGGQATNAVYGFLSMLSTLLKDEQPTH
VAVAFDVGRKTFRTDMFPAYKAQREATPPEFKGQVEILKEVLSTLGITTI
EKIDFEADDVIATLSVAAKPLGFKTLIVTGDRDSFQLVNDTTTVLYPMKG
VSVLHRFTPEAVEEKYGLTPRQYPEFAALRGDPSDNLPNIPGVGEKTATK
WIAQYETLDNLLDHADEIKGKVGASLRERIEQVRMNRKLTEMVKDLELPL
GPDDFEMKPVQVAEVAAKFDDLEFGTNLRERVLAVVKAEGSAAPVEEVEA
EQVVVDTQSLAQWLPARAGQALALALAGVAKPAAGDTYALAIADTKRHAV
LVDVADISAEDEKALATWLASEDPKMLHGAKAAYHMLAGRGFELHGVVHD
TAIAAYLLRPGQRTYELADVYQRHLQRQLSTNDNGGQLTLLDAADDQSLV
DDVIAILELSEELTKQLQEIQAFELYHDLEIPLSGILARMEAIGIAVDVA
TLEEQLKTFIGQVAQEEEAARELAEDPTLNLSSPKQLQVVLFETFGMPKT
KKTKTGYSTAAAEIEALAIKNPHPFLDHLLAHRQYQKMKTTLEGLIREVA
PDGRIHTTFNQTVASTGRLSSTDPNLQNIPVRTEAGRKIRSGFVVGEGYE
TLLTADYSQIEMRVMAHLSQDPGLIEAYREGEDLHNYVGSKVFNVPIDGV
TPELRRQVKAMSYGLVYGLSAFGLSQQLSIPAGEAKQIMESYFERFGGVQ
RYLREIVEEARKAGYTETLFGRRRYLPELTSDNRVARENAERAALNAPIQ
GTAADIIKVAMIRVDRSLKEAAVKSRVLLQVHDELVVEVAAGELEQVREI
LEREMDNAIKLSVPLEVSAGDGVNWDAAAH
>cg1805 priA, Primosomal protein N' (replication factor Y)-superfamily II helicase
MAKTRVPAPEKSVARVLPLLGLPHLDRLFDYRISEDQHDDVQPGVRVRVR
FGGRLVDAIVMSRTAQTSHEGKLMWLDRVISPIVVYPPQTAKLIEQLSDR
YGGVRSDLIRSALPARHAGAEEADTSTSWESLGEVKEPDLSSWSAYQHGQ
SFVDAVLAGTTARASWQIAPGDDWALALASLAVKVVKDGGGALLVVPDQR
DLDRLEAALRGLVAAKQITVLNSGLGPQARYRRFLSVLSGQGRLIIGTRS
AAFAPVKDLKLAVILNDGDDNLVDPRAPYAHAREVLTTRSSLEASSLIIA
GHARTAETQLLVESGWMHNLIAPRDTIRTRMPRIQAVGDSDFQMERDPMA
RSARLPGIAFHAVRSALERDQPALIQVPRKGYVPTLACGNCRTPARCRHC
NGPVGLPQGSSDLAGVPTCRWCGRPDSRFKCQNCGSPKLRAVVLGTERTA
EELGRAFPSVRVITSGGNKVVDSVENRASIVVSTPGAEPFVANSPERPEK
SEKPEHKGAYGALLLLDTWALMGRQDLRAMEDALHKWAAAATLVHSHLHQ
GQVIVVADPSFPAVQSLIRWDMAGAAAQELASRREVMFPPSVHMAAIDGA
TAALESFLDLAELPDHAEVLGPVDLPPGVSLPGEYDEQRFGPPQRLLIRT
PLGPRSELGRALRSAQVARAVRKNDLPLRIQMDPIHIG
>cg2141 recA, DNA RECOMBINATION/REPAIR
MAPKKTATKATAAKGNDRQKALDAALALIEKDFGKGAVMRLGDENRPPIQ
TISSGNTAIDIALGIGGFPRGRIVEVYGPESSGKTTVALHAIAQAQKAGG
IAAFIDAEHALDPDYARKLGVDTDALLVSQPDTGEQALEIADMLVRSGAI
DIIVIDSVAALTPKAEIEGEMGDSHVGLQARLMSQALRKMTGALYNSGTT
AIFINQLREKIGVMFGSPETTTGGKALKFYASVRCDIRRIQTLKDGQDAI
GNRTRLKVVKNKVSPPFKIAEFDIMYGEGISRESSVIDLAVDNGIVKKSG
SWFTYEGEQLGQGKEKVRLSLKENPELTDELEDKIFKKLGVGKYAAASDE
LTDDPVELVPNVDFDDEADTEADAED
>cg1694 recB, RecB family exonuclease
MTSPVENVKKKPRPLALSPSRAGDYQQCPLLYRFRAIDRLPEPKTVAQVK
GTLVHAVLEYMHKLPREEREYPAMVKQLKPTWAQMCEEDAELKELVPEDE
LYDFLVDSRTLLRGYFEMENPQGFDATECEMYVDTVLPNGVPVRGFIDRV
DTAPTGQVRVIDYKTGKKPKPQWSQQAQFQMLFYALVYWRMFNEIPAQLR
LMYLKVNDSMFLNPSREQLEFFERDLGDLWAKIEMDGKAGHFRTKTSKLC
GWCPHQSLCPEYGGVPPEYPGWPGSTAD
>cg0005 recF, DNA REPAIR AND GENETIC RECOMBINATION PROTEIN
MHIRSLELRDYRSWPELKVDLEPGITVFIGRNGFGKTNIVEAIGYLAHLS
SHRVSSDAPLVRAHAENARVSAVAVNQGRELAAHLLIKPHAANQASLNRT
KVRTPRELLGVVKTVLFAPEDLALVKGEPAERRRYLDDIIATRQPRMAGV
KADYDKVLKQRNALLKTATIALRRGYGTEEGAAALSTLDTWDGQLARLGA
EVMAARFALLNELGPKIYEAYTTIAPESRPAAVNYKTTIDQGLSQFSEFD
AGIIEATLLTELAAKRQREIERGSSLVGPHRDDVDLMLGDQPAKGFASHG
ETWSFALSLRIAEFNLLKSDGTDPILILDDVFSELDAGRREKLVGIAQEV
EQVLITAAVHDDLPENLKKVLTAQHTVTVQDTGTGRISLLDVQP
>cg1956 recJ, SINGLE-STRANDED-DNA-SPECIFIC EXONUCLEASE
MTVTSPAALALSDMSYVDIIKKKRGWTTEFFHSTINTGETTTPLPDSDRA
TALIHDHITKAQEITIITDFDMDGISAGVIAYAGLAELGAQVNMVVPDYR
GERNVTASDIDRALELYPATSLIITCDVGIGSHEGIARAHERSIAVLVTD
HHMEVEPCQADVVLNPNRIDSDYPNKDICGAQVIFATLSDYARRYRADKI
IDINLLAVFSGIGALADVMPLTRDTRPTVKQAIALLRLAIPQVSKNRFGG
WDTYAARSVNPDTSTLMHIVNASQHDHRFIAAFQGISILLGELIAQKKLV
NIDNISESFIGFTLGPMFNATRRVGGDMHDSFLVFAPHAALASQPSMNPN
RHAAISRIIDNNERRKELSKSSYAAVHSSDQPYAPFVWLSEAPSGILGLI
ASQLTRESDVPAIVINPDTLSGSARSPEWAPIITQVNTLSAQGHGGIHAA
GHEYACGMRFDNHDDIVTFVATLDALDKNTPREAQPADLHLVDIDHARPV
LDNPSLTQELSTVDAAVDAAQLLVLIDQLDQLQPFGHGFTYPRIDVTFRP
AETEFKVMGQHHQHLKVITHSGLTLLWWNKAQQLDEIAQSELVTMSVELD
VNMFRGFISPQGIVSACTVI
>cg1602 recN, DNA REPAIR PROTEIN RECN
MLVDIAIENLGVIPAASAEFSSGLTVLTGETGAGKTMVVTGLRLLSGGRA
DASRVRTGSPQAVVEGRFVTQGVPCDIVERATGIVSNAGGAADENGEFLA
VRSVGANGRSKAHLGGRSVPAATLSEFSDELLTIHGQNDQLRLLSPERQL
EALDRFDPELAQLRKNYNAKYLTWKSLDKDLQKRLSSRRELAQEVDRLQF
AINEIEEVSPQPGEDAELVEQIRRLQDVDTLREQAATALAAIDGAGSLSD
AMGGSGGFDESQESASDQLGQAESALAGSDDSKLKDIAVQLAEITSQLSQ
VSMELGGFLSDLPADPQALDDMLTRQQQLKLLTRKYAADIDGVIEWQRKA
QIRLDSIDISSEALDKLKEDAKKAQASMMRAAKKLSAVRAKAATKLGTTV
TEELQGLAMQKARFEVALTSIEACASGIDQVEFQLAANAFAQPRPLASSA
SGGELSRVMLALEVILAAGTTGTTLVFDEVDAGVGGRAAVEIGRRLARLA
TKNQVIVVTHLPQVAAYADTHLHVAKNVGEASVTSGVESLTFDRRVEELS
RMLAGLDDTATGRAHATELLERAQREKEDINEERVEPLLAASA
>cg2509 recO, Recombinational DNA repair protein (RecF pathway)
MRRDSFRDRALVVKTYDFGEADRIIVLLTRDHGIVRGVAKGVRRSKSRFG
SRLQLFVELDVQLYPGRKLSTISGADTVGYYASGIIEDFTRYSCASAILE
IATHIAGLENDPHLFEETTRALKNIQDSPEPILNLDEFMLRAMNHAGWAP
SLFDCAACGRPGPHNAFHPGVGGAVCLYCRPPGSAEVPPEALHMMWLVAN
GQAARIPREHPEQQTTIHQLTTAHLQWHIERKLPTLAVLDQA
>cg0298 recR, DNA repair protein (RecF pathway)
MFEGPLQDLIDELSRLPGVGPKSAQRIAFHLLNVDPSDITRLQEALGGVR
DGVQFCRICCNISREEVCRICSDSGRDGGTICVVEEPKDIQVIERTGEFS
GRYHVLGGALDPLANIGPRELNISTLLQRIGGVLPDRELADSTPENKLFD
ATPTVREVILATDPNTEGEATASYLGRLLKDFPDLVISRLASGMPLGGDL
EFVDELTLSRALSGRLQI
>cg1929 res, RESOLVASE FAMILY RECOMBINASE
MFGSSFKEQTTNPRSQRVSYLRVSSTDQNLARQREAVNHSGHIDREFTDE
LSGGAKSHRPGLEDCINYLREDDVLVVASIDRLARSLVDLRVIIDRITDK
GASVIFLKENLTFAAGRDDPRANLMLGILGSFAEFERSIIRERQAEGIAL
AKKAGKYAGRPKALDKEQIQEAKDMIAQGETKSAVAKHFGINRSTLYEYL
KNPD
>cg0881 rhlE, PROBABLE ATP-DEPENDENT RNA HELICASE PROTEIN
MSSESPRPTFTELGVAVEITDALEALGINRTFAIQEYTLPIALDGHDFIG
QARTGMGKTYGFGVPLLDRVFDSADVAETDGTPRALVIVPTRELAVQVGD
DLQRAATNLPLKIFTFYGGTPYEEQIDALKVGVDVVVGTPGRLLDLHKRG
ALSLDKVAILVLDEADEMLDLGFLPDIEKILRALTHQHQTMLFSATMPGA
ILTLARSFLNKPVHIRAETSDASATHKTTRQVVFQAHKMDKEAITAKILQ
SKDRGKTIIFARTKRTAAQVAEDLASRGFSVGSVHGDMGQPAREKSLNAF
RTGKIDILVATDVAARGIDVDDVTHVINYQTPDDPMTYVHRIGRTGRAGH
NGTAVTLVGYDETLKWTVIDNELELGQPNPPQWFSTSPELLETLDIPEGV
TERVGPPTKVLGGTAPRPPRRTRK
>cg2230 rnhB, PROBABLE RIBONUCLEASE HII PROTEIN
MRRLKHLRTFEVTLSRNGLGPVAGVDEAGRGACCGPISIAACILPDKPIQ
ELAALTDSKKLSASTREKLMPLIKKHALAWSVIVISAQDIDRFGIQHANI
SGMRRAVAALGTQPGYVLTDAMKVPGFTVPYLPIIGGDASARCIAAASVL
AKQTRDDIMTDMANDYPHYGLEIHKGYSTKIHMDAVRHHGASPEHRYSYA
NVAKAHQEWLHAADNDTTEGGA
>cg1870 ruvA, Holliday junction resolvasome DNA-binding subunit
MIASLRGTVINIGLSSAVIECNGVGYEVVTTPNTLSQLVRGEEALVLTTM
VVREDAMKLYGFIDNESREMFSVLQTVSGLGPRLALACESVLSPLEISQA
ITNADAKTLQRVPGVGKRMADRLIVELKGKVAAFAAGVVDEGGEQISLPN
ANIASEVVVEQVSQALVGLGFSEKQSDDAVSFVLAADPSLDTSGALRAAL
AKLSGK
>cg1869 ruvB, Holliday junction resolvasome helicase subunit
MSDVERTEFEIPGGIPPRRNGGQGRAADTNVDANLKPDEYDAEVTLRPKS
LTEFIGQPKVRDQLSLVLTGAKNRGVVPDHVLLSGPPGLGKTTMAMIIAQ
ELGTSLRMTSGPALERAGDLAAMLSNLMEGDVLFIDEIHRIARPAEEMLY
MAMEDFRIDVIVGKGPGATSIPLEIPPFTLVGATTRSGMLTGPLRDRFGF
TAQMEFYDVPDLTKVVKRTAKILDVGIDNDAAVEIASRSRGTPRIANRLL
RRVRDFAEVHADGHITMGAANAALVVFDVDEVGLDRLDRAVLDALIRGHG
GGPVGVNTLAVAVGEEPGTVEEVCEPYLVRAGMIARTGRGRVATAAAWRH
LGLEPPEGTIGDY
>cg1871 ruvC, CROSSOVER JUNCTION ENDODEOXYRIBONUCLEASE
MGIDPGLTRCGLSVVQAGRGRTVYPVSVGVVRTPPDAELAERLLRLSKAV
GEWMDEYTPDVIAIERVFERGNVSTVMNTAHAVGVLILAAAERGLPVHMY
TPSEVKKAISGNGRADKKQMTVMITRILGLGEPPKPADAADALSLAVCHC
WRAPMLMRAQSQYSEQELEKRRRVQQGKLGKAKSTYNAEQAQSHASDPAK
AAHPSQFQRTDTN
>cg3307 ssb, SINGLE-STRANDED DNA-BINDING PROTEIN
MAIGDTNITVVGNIVADPELRFTPSGAAVANFRIASTPRSFNRQTNQWED
GEALFLTVNVWRQAAENVAESLSKGMRVIVTGRLKQRSYETREGEKRSVF
EVEADEVGPSLTFAKADVQRTPRGGNSGGNYGGGNQGGGLGGNQGNQQGG
FSNQNSGGFGGNQGNQQQSNQGGFGGNQNQSQGNNFNQGGFGGGSPQAAP
DNDPWNSAPPAGSGGFGGADDEPPF
>cg3140 tagA1, PROBABLE DNA-3-METHYLADENINE GLYCOSYLASE I PROTEIN
MSSLIVGTDGLSRPSWAAQDPLMRDYYDTEWGMPIRDEQGLFERVSLEAF
QSGLSWATILRKRDSFRAAFSQFDPELVAKFTDADIERLMEDAGIVRNKR
KILATINNAKATLQLREKGGLVEFVWGFKPIDTPQPETLEEIPTQSPESV
ALSKALKKEGFSFVGPTTMFALMEAIGIVDTHLVGSHRRGSSGVWA
>cg0182 tagA2, PROBABLE DNA-3-METHYLADENINE GLYCOSYLASE I PROTEIN
MSHAQIMVRAMTTNKANPNELVICADEKSRPRWASRSELCWEYFDNEWGR
PPVDLNALFEILTLVVFQVGVTWHAVLSKREGFRQAFAQFDVAKVAAFNE
DDVERLLDDLQIFRNRRKINAAITNAKALLELNDETGTFDSIIADHSTDA
TAMVKHLKALGFTHIGLTSLSILQQAIGVTELKAA
>cg1185 tnp10b(ISCg10a), TRANSPOSASE-fragment
MLDVVEGRSADALRAWLARRSPAFRHQVRIVTMDGFQGYATTSKQLLPAA
RRVMDPFHVVLLAGDKLTRCRQRLQQEKYHRRGLHDDPLYKNRKTLLTTQ
KWLSKKKQSVLMSCLALIKTTRHCN
>cg1184 tnp10c(ISCg10a), TRANSPOSASE-fragment
MADKRRAKTMMREIVDQMRLLKGQANRELAQLGRSLHKRLGDILAYFDVG
ISNGPVEAINGRLEHLRGIALGFRNLNHYILHCLIHSGQLTHKINAL
>cg2807 tnp11a(ISCg11a), transposase-fragment
MILPVQEGISYFPTPLHLNHIGGSRFKKFLVKIDKTVPQDLDVHVICDNY
ATHKHPTINTWLVKHPRFHMHFTPTYSSWINQVERLFAEVTRELLQRSDH
RSVQALEKDLRNWVKAWNEDPKPFIWTKTAEEILSSIARYLKRINGAGH
>cg1951 tnp14a(ISCg14a), transposase
MPRKTYTEEFKRDAVALYENSAGTSIQKIANDLGINRMTLKNWITKYGAN
STPHGANTATALSEAERIRQLEKENALLREERDILRKAAKYFAEETNW
>cg1950 tnp14b(ISCg14a), transposase
MIRFRFVDDARKTYSVKRICDVLKLNRSSYYKWKSTAFTREKRLLSDAIL
GVQVKTVFTTHSGCYGAKRIAAELKDQIGHDLANHKRVARIMRSLKLFGY
TKKRKVTTTVPDKTKTVFPDLVGRKFTADKPNQLYVGDITYLPIQDGSNM
YLATVIDCYSRRLVGFSIADHMRTSLVQDALLMAKDQRGNLKGAIFHSDH
GSVYTSHAFQETCKKLGIRQSMGSIGTSADNALAESFNAAMKREVLQDSK
TFENQLCCRRDVFRWCTRYNTVRRHSWCRYLAPVVFEERGPAILRSAS
>cg2757 tnp15a(ISCg15a), transposase
MMTERGVPVDHTTIYRWVQKYAPELDKQTRWYRQVPDWQASSWRVDETYI
RVGGTWCYLYRAITAGGQTLEFYLSPKRNVAAAKRFLAKTLRSNTTAGSP
RVINTDKAPALAKAISELKAEGICPQTVEHRQVKYLNNVIEGDHGRLKRI
LGPKGAFKNRISAYRTLKGMEAMHSLRKGQGTMFDLTGTRTQTR
>cg2759 tnp15b(ISCg15b), transposase
MPVDHTTIYRWVQKYAPELDKQTRWYRQVPDWQASSWRVDETYIRVGGTW
CYLYRAITAGGQTLEFYLSPKRNVAAAKRFLAKTLRSNTTAGSPRVINTD
KAPALAKAISELKAEGICPQTVEHRQVKYLNNVIEGDHGRLKRILGPKGA
FKNRISAYRTLKGMEAMHSLRKGSGNDV
>cg0292 tnp16a(ISCg16a), TRANSPOSASE
MDEQRAFDQGLKEENTLITDLTTCARLSHNKALRLIKLSKSTAYYRNKPR
PRPAPKPVLQAVPAPTAPGVEPTPEPWQGKEPAVSSVRQALAEHERQFIV
DAITAYPQLSVSGVFNMLFNKGIYRASLRTWWRVAKQHKLLHKDRVSALS
PGKRSPTPRVKPRLEATQPGQVVCWDVTFLPSLVRGKTYALHLAIDLFSR
KIVGAKVAPTENTSTAVELLTQVLADNPGVVTVHSDNGSAMTSTRVRRLL
ADHGVALSLIRPRVSDDNAFVESVFHTLKYRPFYPKVFASMDQARVWVEE
FVVYYNTVHPHSGVAGHTPQSVFDGSWRAAHRLRVQALDAHYRQFPQRYV
EQPVVQEVAGVVRLNGARDDGSVQERVGGVASLLSA
>cg1716 tnp16b(ISCg16b), transposase
MDEQRAFDQGLKEENTLITDLTTCARLSHNKALRLIKLSKSTAYYRNKPR
PRPAPKPVLQAVPAPTAPGVEPTPEPWQGKEPAVSSVRQALAEHERQFIV
DAITAYPQLSVSGVFNMLFNKGIYRASLRTWWRVAKQHKLLHKDRVSALS
PGKRSPTPRVKPRLEATQPGQVVCWDVTFLPSLVRGKTYALHLAIDLFSR
KIVGAKVAPTENTSTAVELLTQVLADNPGVVTVHSDNGSAMTSTRVRRLL
ADHGVALSLIRPRVSDDNAFVESVFHTLKYRPFYPKVFASMDQARVWVEE
FVVYYNTVHPHSGVAGHTPQSVFDGSWRAAHRLRVQALDAHYRQFPQRYV
GRPVVQEVAGVVRLNGARDDGSVQERVGGVASLLSA
>cg0428 tnp17c(ISCG17a), TRANSPOSASE-fragment
MVVLSRHDCGVWESVEIRGKEADEKGINSLRKGLPARMDELAQLGHTLWR
RRKNVLASFNIGASNGPVEAINGRLEHLRGITLGFRNLNHYILRCLIQAG
QLQRKINVL
>cg0919 tnp18a(ISCg18a), transposase
MLALPSSIIDPLWCQFAALIPPVTDTHPLRCHRPRIPDRIIFDKLIQVLV
LGASYAKIADTTCSATTLRTRRDEWITAGIFEQLEQICLEFYDRIVGLDL
>cg3298 tnp19a(ISCg19a), transposase-fragment
MPVDHTMIYRWVQKYAPELDKQTRWYRQVPDWQASSWRVDETYIRVGGRW
CYL
>cg3297 tnp19b(ISCg19a), TRANSPOSASE-fragment
MRPISGSAAGGATSDLAITAGGQTLDFYLSPKRNVAAAKRFLAKALRSNA
SAGYPRVINTDKAPSLARAITELKSEGICPPTVEHR
>cg1213 tnp1a(ISCg1a), TRANSPOSASE
MKSTGNIIADTICRTAELGLTITGASDAGDYTLIEADALDYTSTCPECSQ
PGVFRHHTHRMLIDLPIVGFPTKLFIRLPRYRCTNPTCKQKYFQAELSCA
DHGKKVTHRVTRWILQRLAIDRMSVHATAKALGLGWDLTCQLALDMCREL
VYNDPHHLDGVYVIGVDEHKWSHNRAKHGDGFVTVIVDMTGHRYDSRCPA
RLLDVVPGRSADALRSWLGSRGEQFRNQIRIVSMDGFQGYATASKELIPS
ARRVMDPFHVVRLAGDKLTACRQRLQREKYQRRGLSQDPLYKNRKTLLTT
HKWLSPRQQESLEQLWAYDKDYGALKLAWLAYQAIIDCYQMGNKREAKKK
MRTIIDQLRVLKGPNKELAQLGRSLFKRLGDVLAYFDVGVSNGPVEAING
RLEHLRGIALGFRNLNHYILRCLIHSGQLVHKINAL
>cg2725 tnp1b(ISCg1b), Transposase
MKSTGNIIADTICRTAELGLTITGASDAGDYTLIEADALDYTSTCPECSQ
PGVFRHHTHRMLIDLPIVGFPTKLFIRLPRYRCTNPTCKQKYFQAELSCA
DHGKKVTHRVTRWILQRLAIDRMSVHATAKALGLGWDLTCQLALDMCREL
VYNDPHHLDGVYVIGVDEHKWSHNRAKHGDGFVTVIVDMTGHRYDSRCPA
RLLDVVPGRSADALRSWLGSRGEQFRNQIRIVSMDGFQGYATASKELIPS
ARRVMDPFHVVRLAGDKLTACRQRLQREKYQRRGLSQDPLYKNRKTLLTT
HKWLSPRQQESLEQLWAYDKDYGALKLAWLAYQAIIDCYQMGNKREAKKK
MRTIIDQLRVLKGPNKELAQLGRSLFKRLGDVLAYFDVGVSNGPVEAING
RLEHLRGIALGFRNLNHYILRCLIHSGQLVHKINAL
>cg0692 tnp1c(ISCg1c), TRANSPOSASE
MKSTGNIIADTICRTAELGLTITGASDAGDYTLIEADALDYTSTCPECSQ
PGVFRHHTHRMLIDLPIVGFPTKLFIRLPRYRCTNPTCKQKYFQAELSCA
DHGKKVTHRVTRWILQRLAIDRMSVHATAKALGLGWDLTCQLALDMCREL
VYNDPHHLDGVYVIGVDEHKWSHNRAKHGDGFVTVIVDMTGHRYDSRCPA
RLLDVVPGRSADALRSWLGSRGEQFRNQIRIVSMDGFQGYATASKELIPS
ARRVMDPFHVVRLAGDKLTACRQRLQREKYQRRGLSQDPLYKNRKTLLTT
HKWLSPRQQESLEQLWAYDKDYGALKLAWLAYQAIIDCYQMGNKREAKKK
MRTIIDQLRVLKGPNKELAQLGRSLFKRLGDVLAYFDVGVSNGPVEAING
RLEHLRGIALGFRNLNHYILRCLIHSGQLVHKINAL
>cg2600 tnp1d(ISCg1d), Transposase
MKSTGNIIADTICRTAELGLTITGASDAGDYTLIEADALNYTSTCPECSQ
PGVFRHHTHRMLIDLPIVGFPTKLFIRLPRYRCTNPTCKQKYFQAELSCA
DHGKKVTHRVTRWILQRLAIDRMSVHATAKALGLGWDLTCQLALDMCREL
VYNDPHHLDGVYVIGVDEHKWSHNRAKHGDGFVTVIVDMTGHRYDSRCPA
RLLDVVPGRSADALRSWLGSRGEQFRNQIRIVSMDGFQGYATASKELIPS
ARRVMDPFHVVRLAGDKLTACRQRLQREKYQRRGLSQDPLYKNRKTLLTT
HKWLSPRQQESLEQLWAYDKDYGALKLAWLAYQAIIDCYQMGNKREAKKK
MRTIIDQLRVLKGPNKELAQLGRSLFKRLGDVLAYFDVGVSNGPVEAING
RLEHLRGIALGFRNLNHYILRCLIHSGQLVHKINAL
>cg1515 tnp24a(ISCg24a), transposase-fragment
MRQSLGSIGTSADNALAESFNAALRREVLQDSKTFAN
>cg3151 tnp2b(ISCg2b), Transposase
MSGLAASTAVGVSEFTGRKWAKAAGVKLTRGPRGGNAFDTAEKLEIAASM
LEKGCLPREIGEYVGMTRANISLWRKQGPDKLRQRAATLRTGKRAAEFIH
APVMGPYYGPRTLHQVLREDYTTLFDELSALGLPAQVCGALLHLAPPPSL
RFSYMSCVVPLFADEIKVVGQGTRLSLEEKMMIQRFHDTGVSAAEIGRRL
GRCRQTISRELRRGQDDDGRYRARDSYEGAIRKLARPKTPKLDANRRLRA
VVVEALNNKLSPEQISGLLATEHANDSSMQISHETIYQALYVQGKGALRD
ELKVEKFLRTGRKGRKPQSKLPSRGKPWVEGALISQRPAEVADRAVPGHW
EGDLVIGGENQATALVTLVERTSRLTLIKRLGVNHEASTVTDALVEMMGD
LPQALRRSLTWDQGVEMAEHARFSVVTKCPVFFCDPHSPWQRGSNENTNG
LVRDFFPKGTNFAKVSDEEVQRAQDLLNYRPRKMHGFKSATQVYEKIVVG
ASTD
>cg2854 tnp2c(ISCg2c), Transposase
MSGLAASTAVGVSEFTGRKWAKAAGVKLTRGPRGGNAFDTAEKLEIAASM
LEKGCLPREIGEYVGMTRANISLWRKQGPDKLRQRAATLRTGKRAAEFIH
APVMGPYYGPRTLHQVLREDYTTLFDELSALGLPAQVCGALLHLAPPPSL
RFSYMSCVVPLFADEIKVVGQGTRLSLEEKMMIQRFHDTGVSAAEIGRRL
GRCRQTISRELRRGQDDDGRYRARDSYEGAIRKLARPKTPKLDANRRLRA
VVVEALNNKLSPEQISGLLATEHANDSSMQISHETIYQALYVQGKGALRD
ELKVEKFLRTGRKGRKPQSKLPSRGKPWVEGALISQRPAEVADRAVPGHW
EGDLVIGGENQATALVTLVERTSRLTLIKRLGVNHEASTVTDALVEMMGD
LPQALRRSLTWDQGVEMAEHARFSVVTKCPVFFCDPHSPWQRGSNENTNG
LVRDFFPKGTNFAKVSDEEVQRAQDLLNYRPRKMHGFKSATQVYEKIVVG
ASTD
>cg2426 tnp2d(ISCg2d), Transposase
MSGLAASTAVGVSEFTGRKWAKAAGVKLTRGPRGGNAFDTAEKLEIAASM
LEKGCLPREIGEYVGMTRANISLWRKQGPDKLRQRAATLRTGKRAAEFIH
APVMGPYYGPRTLHQVLREDYTTLFDELSALGLPAQVCGALLHLAPPPSL
RFSYMSCVVPLFADEIKVVGQGTRLSLEEKMMIQRFHDTGVSAAEIGRRL
GRCRQTISRELRRGQDDDGRYRARDSYEGAIRKLARPKTPKLDANRRLRA
VVVEALNNKLSPEQISGLLATEHANDSSMQISHETIYQALYVQGKGALRD
ELKVEKFLRTGRKGRKPQSKLPSRGKPWVEGALISQRPAEVADRAVPGHW
EGDLVIGGENQATALVTLVERTSRLTLIKRLGVNHEASTVTDALVEMMGD
LPQALRRSLTWDQGVEMAEHARFSVVTKCPVFFCDPHSPWQRGSNENTNG
LVRDFFPKGTNFAKVSDEEVQRAQDLLNYRPRKMHGFKSATQVYEKIVVG
ASTD
>cg2354 tnp2e(ISCg2e), Transposase
MSGLAASTAVGVSEFTGRKWAKAAGVKLTRGPRGGNAFDTAEKLEIAASM
LEKGCLPREIGEYVGMTRANISLWRKQGPDKLRQRAATLRTGKRAAEFIH
APVMGPYYGPRTLHQVLREDYTTLFDELSALGLPAQVCGALLHLAPPPSL
RFSYMSCVVPLFADEIKVVGQGTRLSLEEKMMIQRFHDTGVSAAEIGRRL
GRCRQTISRELRRGQDDDGRYRARDSYEGAIRKLARPKTPKLDANRRLRA
VVVEALNNKLSPEQISGLLATEHANDSSMQISHETIYQALYVQGKGALRD
ELKVEKFLRTGRKGRKPQSKLPSRGKPWVEGALISQRPAEVADRAVPGHW
EGDLVIGGENQATALVTLVERTSRLTLIKRLGVNHEASTVTDALVEMMGD
LPQALRRSLTWDQGVEMAEHARFSVVTKCPVFFCDPHSPWQRGSNENTNG
LVRDFFPKGTNFAKVSDEEVQRAQDLLNYRPRKMHGFKSATQVYEKIVVG
ASTD
>cg0226 tnp2f(ISCg2f), TRANSPOSASE
MSGLAASTAVGVSEFTGRKWAKAAGVKLTRGPRGGNAFDTAEKLEIAASM
LEKGCLPREIGEYVGMTRANISLWRKQGPDKLRQRAATLRTGKRAAEFIH
APVMGPYYGPRTLHQVLREDYTTLFDELSALGLPAQVCGALLHLAPPPSL
RFSYMSCVVPLFADEIKVVGQGTRLSLEEKMMIQRFHDTGVSAAEIGRRL
GRCRQTISRELRRGQDDDGRYRARDSYEGAIRKLARPKTPKLDANRRLRA
VVVEALNNKLSPEQISGLLATEHANDSSMQISHETIYQALYVQGKGALRD
ELKVEKFLRTGRKGRKPQSKLPSRGKPWVEGALISQRPAEVADRAVPGHW
EGDLVIGGENQATALVTLVERTSRLTLIKRLGVNHEASTVTDALVEMMGD
LPQALRRSLTWDQGVEMAEHARFSVVTKCPVFFCDPHSPWQRGSNENTNG
LVRDFFPKGTNFAKVSDEEVQRAQDLLNYRPRKMHGFKSATQVYEKIVVG
ASTD
>cg1094 tnp3a(ISCg3a), Transposase
MGIFSGRQFPREIILWAVRWYCRYGVSYRDLEEMMTERGVPVDHTTIYRW
VQKYAPELDKKTRWYRQVPDWQARSWRVDETYIRVGGKWCYLYRAITAGS
QTLDFYLSPKRNVAAAKRFLAKTLRSNKSAGYPRVISTDKAPSLARAISE
LKAEGVCPSTVEHRRVKYLNNVIEGDHGRLKRILGPKGAFKNRTSAYRTL
KGMEAMHSLRKGQGTMFAYGHPNPDAVIVSRVFETA
>cg1757 tnp3b(ISCg3b), Transposase
MGIFSGRQFPREIILWAVRWYCRYGVSYRDLEEMMTERGVPVDHTTIYRW
VQKYAPELDKKTRWYRQVPDWQARSWRVDETYIRVGGKWCYLYRAITAGS
QTLDFYLSPKRNVAAAKRFLAKTLRSNKSAGYPRVISTDKAPSLARAISE
LKAEGVCPSTVEHRRVKYLNNVIEGDHGRLKRILGPKGAFKNRTSAYRTL
KGMEAMHSLRKGQGTMFAYGHPNPDAVIVSRVFETA
>cg2461 tnp4a(ISCg4a), Transposase
MVAGANRHDSPLLAATLDTLGRFGGCLPDQITVHLDAGYDSKKTRRLLSE
RGYSWVISTKGKPLQAGARWVVERTNSWHNRGFKKLSICTERCTRVVEAF
IALANAVIILRRLIKQAWTSYRWDTRPGHRP
>cg0824 tnp5a(ISCg5a), Transposase
MHTPDLHHRHSPRLLTIDIMPKPLPPETRRKIIDFDPFAPNSPSIEEFCS
RLKISRRSFYNIRNRYQQDANAALHPHSSAPITARRTYDESITSTLLSIR
ARLKAQGWEYGPISIRFEGISTGELTAPIPSVSTIARLLRAAGAVESNPK
KRPKSSVVRFQRGQAMEMWQIDGFIYTLHDTDLTRVTIYQILDDATRFDV
GTCVFPANENSVDARTALEQAIAHFGAPHELLSDNGSAFNRMRQGYVGSL
ESYLATVGCLSITGKPGHPQTQGKNERSHRTLFRFLQAHQPHTLEECAHY
IEQFRDHYNNRRPHQGLPNNLTPAAAWEIVGCVEQQPPIDPVVLQQQADH
YARRRIEKQSDVPLVRQEESVPVSKMQQTEQRRRVRRFGKKPVDPDVFTF
AGNNQKVVFQGMRISVPRTMRDREFYRTVTATELGFWDAITGELELSIPL
PVVAIARGKSYINSYNIRGVWMQHPTPLWQRKRDEAEKRFKSIDPGDLLR
>cg2914 tnp5b(ISCg5b), Transposase
MHTPDLHHRHSPRLLTIDIMPKPLPPETRRKIIDFDPFAPNSPSIEEFCS
RLKISRRSFYNIRNRYQQDANAALHPHSSAPITARRTYDESITSTLLSIR
ARLKAQGWEYGPISIRFEGISTGELTAPIPSVSTIARLLRAAGAVESNPK
KRPKSSVVRFQRGQAMEMWQIDGFIYTLHDTDLTRVTIYQILDDATRFDV
GTCVFPANENSVDARTALEQAIAHFGAPHELLSDNGSAFNRMRQGYVGSL
ESYLATVGCLSITGKPGHPQTQGKNERSHRTLFRFLQAHQPHTLEECAHY
IEQFRDHYNNRRPHQGLPNNLTPAAAWEIVGCVEQQPPIDPVVLQQQADH
YARRRIEKQSDVPLVRQEESVPVSKMQQTEQRRRVRRFGKKPVDPDVFTF
AGNNQKVVFQGMRISVPRTMRDREFYRTVTATELGFWDAITGELELSIPL
PVVAIARGKSYINSYNIRGVWMQHPTPLWQRKRDEAEKRFKSIDPGDLLR
>cg3266 tnp5c(ISCg5c), Transposase
MNPSPVSCWPSAHRLKAQGWEYGPISIRFEGIATGELTAPIPSVSTIACL
LRAAGAVESNPKKRPKSSVVRFQRGQAMEMWQIDGFIYTLHDSDLTRVTI
YQILDDATRFDVGTCVFPANENSVDARTVLEQAIAHFGAPHELLSDNGSA
FNRMRQGYVGSLESYLATVGCLSITGKPGHPQTQGKNERGHRTLFRFLQA
HQPHTLEECAHYIEQFRDHCNNRRPHQGLPNNLTPAAAWEIVGCVEQQPP
IDPVVLQQQADHYARRRIEKQSDVSLVRQEESVPVSKMQQTEQRRRVRRF
GKKPVDPDVFTFAGNNQKVVFQGMRISVPRTMRDREFYRTVTATELGFWD
AITGELELLISLPVVAIARGKSYISSYNIRGVWMQHPTLLWQRKRDEAEK
RFKSIDPGDLLR
>cg1022 tnp6a(ISCg6a), TRANSPOSASE
MCRKLGVSRASYYRWAKPAGLTPTAIRHLELRAEVAQEFEKSNQMAGRDQ
LTTLLNQRGVKVSTGTVGSIMNE
>cg1023 tnp6b(ISCg6a), TRANSPOSASE
MSDECGPGRTPRSVTLSARTEHIKNHMLDSHGKRDFTATVPGTRLVGDIT
YLKTGSGWLYVATVIDLATRMVVGWSMDSNMRTPLVINALAMARDHGCLH
PEGAIFHSDRGSQYTSEQFQTWCAGNKITQSMGLTGVCWDNGSRGEFFLT
FEDRNVSPL
>cg1030 tnp6c(ISCg6c), transposase
MCRKLGVSRASYYRWAKPAGLTPTAIRHLELRAEVAQEFEKSNQMAGRDQ
LTTLLNQRGVKVSTGTVGSIMNE
>cg1031 tnp6d(ISCg6c), TRANSPOSASE
MSDECGPGRTPRSVTLSARTEHIKNHMLDSHGKRDFTATVPGTRLVGDIT
YLKTGSGWLYVATVIDLATRMVVGWSMDSNMRTPLVINALAMARDHGCLH
PEGAIFHSDRGSQYTSEQFQTWCAGNKITQSMGLTGVCWDNGSRGEFFLT
FEDRNVSPL
>cg1024 tnp7a(ISCg7a), TRANSPOSASE
MIAAYREKDRSLGRAAMEALIDAVSQDVPAGLDELRKLGRTLKARATDVL
AYFERPGTSNGPTEAINGRLEHLRGSALGFRNLTNYIARSLLEFRRIQTS
TTPSSVKSRFRHPSSSRTTMNDVPTHL
>cg3059 tnp8a(ISCg8a), transposase
MPTKTYSEEFKRDAVALYENSDGASLQQIANDLGINRVTLKNWIIKYGSN
HNVQGTTPSAAVSEAEQIRQLKKENALQRARTRHPAESC
>cg3058 tnp8b(ISCg8a), transposase
MSCFRFVDDVRKTYPVKRLCEVLKINRSSYYKWKKTAPTRSNRLLSDAVL
GAKIKSIFTKERGCYGSKRITAELNDDPGSTPVNHKRVARIMASLKLFGF
TKKRRVITTVSDKKKPVFPDLVKRHFNALAANEVYVGDITYLPIADGTNM
YLATVIDCYSRRLVGFAIADHMRTSLVQEALLMAKSQRGSLKGAVFHSDH
GSVYTSQAFQDTCKKLGVRQSMGAVGTSADNSLAESFNAALKREVLQDSK
TFANQLVCRREVFRWCTRYSTNRRHSWCGYVVPAVFESRNLAILKSVS
>cg1178 tnp9a(ISCg9a), Transposase
MAYDFVIGMDVGKYFHHACVLDPQGRQVLSKRINQHEGSLRKLFDKFLAN
DAEVLVVVDQPNNIGRLTVAVAQAMGADVRYLPGLAMRQLSRIHVGNSKT
DVRDAYVIAHAGLNLPDALRSVDRVEEVFLQLKVLNGIDEDLARAYTRLI
NQMQSALVGTYPAFEHVLRGQMIHRKWILHLLAKYGGPTKIRRVGKARLA
AFARGHRARNPEPVIDAMLAAIHGQTVSIAGAEYAELGVAMSAKDALAKL
EHRKEIEGQVLELIQDIPQTEILLSMPGIGPRSAAQILMTVGDMSDFPDA
AHLASYAGLSPQTNQSGTSIMSNSPNRAGNKKLKNALWQSSFASIRFHER
SRQFYERKRNEGKRHNAAVVALARRRLNVLFAMMRSGELYRDIPTAQEAA
AA
>cg0373 topA, DNA TOPOISOMERASE
MADTAGTTGSKKKYLVIVESATKAKKIQPYLGNDYIVEASVGHIRDLPRG
AADIPAKYKKEPWARLGVDTDRGFAPLYVVSPDKKKKVADLKAKLKLVDE
LLLATDPDREGEAIAWHLLEVLKPTVPVRRMVFNEITKPAILAAAENTRE
LDENLVDAQETRRILDRLYGYEVSPVLWKKVMPRLSAGRVQSVATRVIVE
RERERMAFVSADYWDLSAEFNARENGKADSDNPSSFTARLSTIDGNRVAQ
GRDFNDRGELTSEAVVVDKQRAEALAEALEGQEMAVVGVEEKPYTRRPYA
PFMTSTLQQESGRKLHYTSERTMRIAQRLYENGHITYMRTDSTSLSEQGM
KAARDQALELYGAEYVSPSPRTYDRKVKNSQEAHEAIRPAGETFATPGQL
HGQLDAEEFKLYELIWQRTVASQMADAKGTSMKVTIGGTAKTGEKTEFNA
TGRTLTFPGFLRAYVETTRTADGRDVADNAEKRLPLLSEGDLLKVLSIEA
DGHSTNPPARYTEASLVKKMEDLGIGRPSTYASIIKTIQDRGYVYSRGNA
LVPSWVAFAVVGLLEANFTSLVDYDFTSSMEDELDNIAAGREGRTEWLNG
FYFGDAEADQSMAESVARQGGLKALVDANLEHIDARSVNSLKLFDDAEGR
AVNVRVGRYGPYIERIVGTTAEGEPEFQRANLPEETTPDELTLEVAEKLF
ATPQGGRELGINPANGRMVVAKEGRFGPYVIEQVTDSERAGAEAQAEEVV
AAERKAEDEQRATDGMRPKNWETKTAANQKEKRINQLVEENLKPATASLF
SGMEPATVTLEEALKLLSLPREVGVDPSDNEVITAQNGRYGPYLKKGSDS
RSLNSEEQIFTVTLDEARRIYAEPKRRGRAAAQPPLKQLGDNDVSGKPMT
VKDGRFGPYVTDGTTNASLRKGDVPESLTDARANELLSERRAKEAADGGA
PAKKTSTKKTAAKKTTAKKTTAKKTVRKAPPKTTKNVVKAGAKKKS
>cg1496 ung, PROBABLE URACIL-DNA GLYCOSYLASE PROTEIN
MTNTLWNSVDELPIHDSWKPVLKPVEDAIRKLGVFLAEEEFLPPVDDVFR
AFSYPFDAVKVLIMGQDPYPTPGHAMGLSFSTQPDVRPLPRSLNNIFKEL
VSDVGSLGDSASEQGALDLGINAPGSVAGTQVALPADGDLRAWSNQGVAL
FNRVLTVHPGQAGSHKGKGWEAVTEQAIKALAERDQPLVAILWGKQAQEV
QKFLGDTPCICSVHPSPLSASRGFFGSKPFSRANEILSSLGATEIDWSL
>cg1560 uvrA, Excinuclease ATPase subunit
MADRLVVRGAREHNLKGVDIDLPRDSMVVFTGLSGSGKSSLAFDTIFAEG
QRRYVESLSSYARMFLGQMDKPDVDLIDGLSPAVSIDQKSTNRNPRSTVG
TITEVYDYLRLLYARAGTAHCPVCDARVERQTPQQMVDQILGMEEGLKFQ
ILAPVVRTRKGEFVDLFADLASQGYSRVRVDGEVHQLSDPPKLEKQIKHD
IDVVVDRLQVKASQKQRLTDSMETALRLADGVAVLEFVGLEEDDPNRLRR
FSEKMSCPNGHALTVDELEPRAFSFNSPYGACPACDGLGVRTEVDIDLII
PDPDAPATKAVQPWNSSPNHSYFEKLIEGLAKALGFDPETPYSELTAAQK
KALVYGSKEEVSVRYKNRYGRVRSWTAPFEGVMGYFDRKLEQTDSETQKD
RLLGYTREVPCPTCKGARLKPEILAVRLDSGSHGALSIAGLTALSVHEAF
EFLDNLTLGKREEMIAGAVLKEIHARLKFLLDVGLSYLTLDRAAGTLSGG
EAQRIRLATQIGSGLAGVLYVLDEPSIGLHQRDNQRLITTLEHLRDIGNT
LIVVEHDEDTIRRADWLVDIGPRAGEFGGEVVYQGEPKGILDCEESLTGA
YLSGRRTLGVPDTRREIDKERQLKVVGARENNLQGIDVKIPLGVLCCITG
VSGSGKSTLVNQILAKVLANKLNRARQVPGRAKRVEGLEHLDKLVQVDQS
PIGRTPRSNPATYTGVFDKVRNLFAETTEAKVRGYKPGRFSFNIKGGRCE
ACQGDGTLKIEMNFLPDVYVPCEVCDGQRYNRETLEVKYKGKNIAEVLGM
PISEAADFFEPITSIHRYLATLVDVGLGYVRLGQAATTLSGGEAQRVKLA
AELQKRSNGRTVYILDEPTTGLHFEDIRKLMMVIEGLVDKGNSVIIIEHN
LDVIKAADWIVDMGPEGGSGGGTVVAEGTPEQVAEVAGSYTGQFLKELL
>cg1550 uvrB, EXCINUCLEASE ABC SUBUNIT B
MLARCFAAGRNVSTLWRILECMAFAAEHPVLSHSEHRPVGEIERSDDKFV
VVSEFEPAGDQPAAIKELDERLDRGERDVVLMGATGTGKSATAAWLIEKQ
QRPALVMAPNKTLAAQLANELRQLLPNNAVEYFVSYYDYYQPEAYIAQTD
TYIEKDSSINEDVERLRHSATSSLLSRRDVVVVSSVSCIYGLGTPQSYLD
RSVVLNVGEEIDRDRFLRLLVDIQYERNDVGFTRGAFRVKGDTVDIIPAY
EELAVRIEFFGDEIDALYYIHPLTGDTIRQVNEIRIFPATHYVAGPERME
KAVADIKAELEVRLADLENRGKLLEAQRLRMRTEYDLEMIEQVGFCSGIE
NYSRHIDGRGEGTAPATLIDYFPEDFLTIIDESHVTVPQIGGMFEGDMSR
KRNLVEFGFRLPSAMDNRPLTWEEFDERRGQTVFMSATPGKFEIAAADGE
FVEQVIRPTGLVDPKVTVKPTKGQIDDLIHEIRQRTDKDERVLVTTLTKK
MAEDLTDYLLENGIRVRYLHSDIDTLQRVELLRQLRLGEYDVLVGINLLR
EGLDLPEVSLVAILDADKEGFLRSTTSLIQTIGRAARNVSGEVIMYADKI
TDSMQYAIEETDRRREKQVAYNKEHGIDPQPLRKKIADILDQVYDNSADG
AGPSASGDAAVVAKPDVSSMPAKEVQKLIDDLSAQMAAAARELKFELAGR
LRDEIFELKKELRGIKDAGI
>cg1795 uvrC, Nuclease subunit of the excinuclease ABC complex
MADPTTYRPAPGTIPTEPGVYKFRDENRRVIYVGKAKNLRSRLSNYFQDV
TQLHPRTRQMVFAASSVEWTVVSSEVEALQLEYTWIKRFDPRFNVKYRDD
KTYPMLAVSTGERFPRAFFFRGPRRKGVRYFGPYSHAWAVRETLDLLTRV
FPMRTCSKGVFNRHESLGRPCLLGYIDKCAAPCVGRVSEEEHREIVDGFT
SFMAGHTDKVTRKLNADMMAAAEELDFERAARLRDDLEAIDKVMEKQAVV
LGDGTDADIIAFATDQLEAAVQVFNIRGGRIRGQRGWVVEKPGDYAGLLV
DATTQPEGDAPETDPALPFLMQDFLVQFYGDAVERAETEAKEDAAVIERR
GVDKHSFEEAAPVTRASVVPREILVQVAPNEAEQTLKVLEELRGAGVDAR
VPQRGDKRALMETVERNAKELLKQHKLKRVGDLTARSAALQELQEALDME
QAPLRIECTDISHIQGTDVVASLVVFEDGLPRKSDYRRYRVKEAAGDGHS
NDVASIAEITRRRFLRHNQDKLAVPEAEEFDGSTFSDEKVEEMSTDARRF
AYPPQIFIVDGGAPQVAAAQEVFDELGIVDVVLIGLAKRLEEIWLPGDPD
PVILPRNSQALFLLQQIRDEAHRFAITYHRQQRSKRMRVSELDSIKGLGQ
SRRTELVKHFGSVAKLKEASVEDISQVKGFGPKLAEAVYEGLHASK
>cg2224 xerC, SITE-SPECIFIC RECOMBINASE
MGESKKKVARSGRNAPPSGISGADAPSKLHTLIDDFCEHLDLVVGRSAAT
IRGYRSDLYAMADTIEDIDNFSLPTLRQWLGIAVDEGKSRATLARRTASV
KAFSSWAQKNGHLKADEAARLISPKITRDLPKILGEQQAGDFVENAASTN
EEEFLRDSAILELLYATGMRVAELCGIDLSDIDYDRKMVRVLGKGNKERV
VPFGESAHKALRNWLDVRDEMTEDPKALFVGVRGQRINARQVRRIVDRAA
KVTGVDHLSPHSLRHTAATHLLDGGADLRQVQELLGHSSMQTTQIYTHVS
NKRLLEAFNKAHPRA
>cg1608 xerD, INTEGRASE/RECOMBINASE XERD
MKARVLAKTWLTHLAVERGLSANTLSNYRRDVERYCDWLEAAGLDDIRDI
TTAHVESYVKDLRRGIDGQQALSASSAGRALIVARGLHKFALMEGEVAAD
VAADVSPPAMGRHLPDTLSINEVALLIDAIPHSDIATPVDLRDRALVELL
YGTGARISEAIGLAVDDVSEMPEVLRITGKGSKQRIVPFGSMAQQAVREY
LVRARPALSKGKSHALFLNQRGGPLSRQSAWAVLKKTVERAGLDKDISPH
TLRHSFATHLLEGGADVRVVQELLGHSSVTTTQIYTHITADSLREVWRGA
HPRA
>cg1163 xseA, EXODEOXYRIBONUCLEASE VII LARGE SUBUNIT
MSSEKASSKSTPEAPWPVREVNTQVKQWIERLGHLWVEGQLAQINVKPNW
KLSYLTLRDVEQEMSVQLTCPTDIIRNRPTPLKDGDRVIVYGKPAFYAGR
GTFSLWVTDIRPVGIGELLARIEELRKRLAAEGLFDPARKKRLPFLPNRV
GLITGRGSAAERDVLSVAKDRWPEVQFEVINTAVQGASAVPEIIEALRVL
DQDPRVDVIIIARGGGSVEDLLPFSEEALQRAVAAAQTPVVSAIGHEPDT
PVLDNVADLRAATPTDAAKRVVPDVAEERMLINQLRSRSAAALRGWVQRE
QQALAAIRTRPVLADPMTPINRRRDEIAQAVGLIRRDVTHLVRTEQALVA
SLRAQVSALGPSATLARGYSVVQVIPRDGSAPEVVTTIEQSPPGSQLRIR
VADGSITAASMGTQQAN
>cg1162 xseB, PUTATIVE EXODEOXYRIBONUCLEASE PROTEIN
MTNPDIVGSGQGNDSFEPVAQLSYERARDELVEIVKILELGQMGLDESLK
YWERGEALAKRCEEHLAGASARVEQALNQAE
>cg3036 xthA, EXODEOXYRIBONUCLEASE III
MRIVNWNVNSARTRVDRMVDFLLRHDVDVLAVQETKCKDEQFPTERFTEI
GYEVAHFGLNQWNGVAIISRVGIENVETHFPAQPGFNKDITKEQSIEARA
IGARCGGVQVWSLYVPNGREIADPHYDYKLRWLFSLRNYVIDTLEYRPEE
KLVLLGDFNIAPTDIDVWDIAAFEGKTHVTEPERAAFDGLIEAGLKETTP
GPGTYTYWDYKGARFLKGEGMRIDFQLASPALAATAGETFVDVEERSGTG
ASDHAPVIVDYKV