Jena Prokaryotic Genome Viewer

Gene list
Applied filters:
COG category: Replication, recombination and repair
Organism: Parachlamydia sp. UWE25, UWE25
Gene type: CDS
Number of genes found: 180
Free access

Show UniProt / TrEMBL protein name	View in Fasta format (DNA)	View as list

# Parachlamydia sp. UWE25, UWE25

>pc1962 conserved hypothetical protein
MTNCKLITSVERRRRWSLEEKKQIIEKTYQEGQSVSQIARRYDITPSQLF
AWRRQMEQGALQGISSREELVPKSQVKEMEKRIRELERMLGKKTLENEIL
KEAVRLGQEKKLISRQPLPSLSDLA
>pc1026 conserved hypothetical protein
MDKALTSKSVALIIKRNKHLENQKHSFSGHSLRAGFATTAAIFGVPEHLI
MKQTGHKSSDTIRRYIRLGNMWTENAATKIGL
>pc2023 hypothetical protein
MILSTATASPAATVSPANLEELLQAQKEMDARITNLDNILLKAQEKADEQ
VRKLANELSRVKDDNTSLNGRINILSDDNTSLNNRINILNKDNDSLRNQI
EEQNLKITLLSEESRIVEGTLKTTQKTLEEKTKQIAEIQETLEKYEKEKQ
ELSEKNTKLVNENAELVKEKEGLNALLEALRKEKADLENKEKAYQEEIEA
LSVVLDETLKCQLELEKNHQLEISEKTKIIAKQQLKCENYEKEALSNTNK
LVETEKDRDEAKHKLSLEQTKHIKTRQKLFEEQEKYITASRMLDKEQKSH
SETSKSLLIEQTARAITNQILFKEKAEHTDTKQKLDLEQAKYAAAKEDLN
KAKIDAEKAQEDLINSIQKQLDEMLNTHEDELTKIKDNYTKLQEGVQAQK
NELKKIVSRLSNINLQDPQLFRMWILDFAMFAGLNIEDRKSLETKISQLH
QQLASPTNLISWKHLVLQFCNTLITTAIVRKVS
>pc0522 unknown protein
MMCFWSLILITRRFLMSFKMCLVIILSLTACMANLTAEADLSNLSQKVTF
QNQAQAQKDIQNQTQQAKEEVQKSLVPDAIFIVNETKKAINFIKNGQMAE
ALSAVENATGKSDVLLARHPENALLPVDFAIKVIDSAPVELNKINGIEKL
IKKNIDYKNYPVSRALLNFLCSEIDVVTYCLPLAYYPEALKKAARLLELK
QASEASLVLDIALNTLVEMHQTFPIPTIKVITLLTTAEDILEKENDKENA
LKLVNEAKFELKRSIELGYLEKDEKYRALNEELTDLENKINKNQKSTSSF
RSLKEKFRDFLKILSKPKSASRCLNE
>pc1181 hypothetical protein
MFMTREYPMHKIRWGLCCIFKEAPIKFRKTTVAYIARLNNRGEPYLNFLS
TLILSNLNTLIAAIEYCKQFNIGSFRIQSEFLPLFKHSQYGYQLEQLPEA
ALIFQKFEYCKKLAQTNAVRLTFHPDQFVVLNSPHEHVVKNSIQELEYHG
EIAELLGADVINIHAGGTYGNKAKALTNFAERFERLSKRVRTRLTIENDD
RCFTPQDLLSLCQQLKIPLVYDVHHHRCLPDELSLEQASIQAYKTWDREP
LFHISSPLEGWNGPKRERHHDYIDIQDFPTCWFDFPAMTIEIEAKAKELA
IFKLQAELDLILKKIKHGFD
>pc1814 unknown protein
METEKPVIILVSTHSSFHEKISGDLKMNAFVSTIRNHVKGKITVLLSDRA
HINTMSLRFQNDLQKAQEECLIKAHALRNRYQSYFENCNVVYGHSYISQN
KNFASFLKVIESLAENDSTFHELLLKDAESAYSNTFIHLFPDKNLFIKNT
REDILTQCASSLVLIDKGYRYQFYPGSSYESLDYLNRIFISQEKQLSWIR
VFLTIEKKTILHNIMQN
>pc1080 conserved hypothetical protein
MEQRILGDYIIIKSIGHGTLGEVYLAEHRFMKTQYILKILPEELSTDRSF
IQRFQEDISFLSTLDHPNIVKTHNISFAQGVYFLVTDCVVDQMGEMTNLA
QYLMELDRRLEEDEIINILMQIAEALDYAHSKKMGNRELIHRGLKPNNIL
IGKRRQNLEVHLSDFGLSWIIGPGAVLTRTYKNVAEALEIGSQNLWQKMG
QDRYPSPSIDSQKLIPLHASFLQTHAFFAPEQKRLDFPHSVSMKTDVFAF
GVLVYYLLMNELPEGIFEMPSNSSRYRYQWDTLLEKCLQNQPAKRTDSLV
TALKETLQEPKSKNAKIEELTLGKEEFFFNNEASIIFEEGKCNVQKGVSE
SLVTLKIEEAPPVIEEAVSTLRPVLQNPLLERPQTDHDPAAIFQISSAVK
VYNPERKDVTNVKPILTDMVIIEGGNFYRGSQDGNRDEMPRHQITLSSFA
LDVHPVTNEQFVRFLEVMGGEKDSNHNDIIRLRDSRIKRSGGKLSIESGY
AKHPVVGVTWYGAIAYAKWIGKRLPTEAEWEIAARGGQENVLYPTGEEIE
KTQANFFSSDTTTVMSYAPNNCGLYDMAGNVYEWCHDWYGYNYYELSMQE
PDFPQGPLQGVYRVLRGGCWKSLKEDLRCSRRHRNNPGTVNGTYGFRCAA
DVQIS
>pc1201 conserved hypothetical protein
MDLIKLYCSVDDFWKSFEQKWNKQLIDHGKTKRGPQPELSIPEMMTIVIL
FHQSNDRTFKHFYGYVTKYLVKEFPNLISYSRFVYLKKNLFAPLFAYLLD
KRGEITGIAFIDSPSIDVCHNKRIKRNKVFKGLAKRGKTTSGWFFGFKLH
LMINERGEILAFQLTPGNVADVSIAETLSKGVFGKLFGDKGYISKELSKR
LLKQGLELFTTLRSNRKQNLMKLTDKILLRTCLKSF
>pc0959 conserved hypothetical protein
MEMTANNWEVYIIQTRSGKLYTGITKDIERRFKEHREQGKGARFFKISEP
EKIVFREKQLNRSEATKREISIKKMNRQQKIELIEHQTHEN
>pc0441 conserved hypothetical protein
MCASKTKQEAQNPLILRCHRLMEAFAKSDDERDFFIDRLEGFLIYVDLDK
PQNELDALQKELAENSDRYCQIPKLSFYETKKIMEGFVNEKVYDIDTKEK
LLDIIQSKEARENFLEFIYDHHSEQEKWQQFYQERSRIRIIEWLRLNHFH
FVFEEDLDLPRQLVEKLKHSLFQSKVGKDILTARKNLFAKAKTYYSNEAL
NPRPKRGRPPKQAAKPEIEPQVTIDIFTTVPPTVRPFLFVPNIQSSHFSA
FSSKFDSEDDLLTNRRQSFDDDTSISQKLASLRTLSNRWAETQNPPTEKE
NNPYAMDNSFDDEDDDDDDEDFTEKKQKKAKEKPIKAKAASKSAVVTKAT
KPAKPEKPKAKRIIPKAKKEAMPTKGKVLKKIMPKKES
>pc1279 conserved hypothetical protein
MFNTWLEKILIPELKTGQVIIMDNATFHKSKKTKYLLEQAGCKILFLPSY
SPDLNPIEVFWANFKQLVRLSLNKLSNLAKAIDYSFCQICT
>pc0777 unknown protein
MNRYRHVFFLIGCFLFLTSCGPKSLEDYKEEGKGITRSLIQELREIRNRD
QLLASTSLLQKRFDQLVFVMIGAREFQYKYPNMESHELTLADHELSDKLR
IELNRIYHIEGAKQIIEKCQEMALNRLDACEKKLSK
>pc1323 conserved hypothetical protein
MDLIKLYCSVDDFWKSFEKKWNKQLIDHGKTKRGPQPELSIPEMMTIVIL
FHQSNYRTFKHFYGYVTKYLVKEFPNLISYSRFVYLKKNLFVPLFAYLLD
KRGEITGIAFIDSTSIDVCHNKRIKRNKVFKGLAKRGKTTSGWFFGFKLH
LMINEKGEILAFQLTPGNVADVSIAETLSKGIFGKLFGDKGYISKELSKR
LLKQGLELFTTLRSNMKQNLMKLTDKILLRKRAIIETVNDQLKNISQIEH
TRHRNAGNFLINLLAGIVAYTHQPKKPSINLTEQHRLLLMAA
>pc1029 conserved hypothetical protein
MMEVSRSNLIEQLKKHLPHQPIFYSKAENEQVLALIKEVVKNRPTYGYRR
VHAIVNSLLKEKKLKVINHKRVFRLMRQHHLLLQRPNRRPKRLHTGKVET
LYSNTRWCSDSFSIQCLNGDRVHVAFSLDTCDREVMRYIASTIGIDGQMI
RDLMLETIEYRFEQPKARVPLEWLSDNGSCYTAKETVNFGRMLGLTIRTT
PPYSPESNGMAEAFVKTFKRDYVYFGNLASAEAVLQQLPIWIEDYNVKAP
HKALNMLSPREYLRKLKMAG
>pc0903 conserved hypothetical protein
MLKCATLLSSSMEHLMEAHRRHDISDRVWNLLGPHLPGRRGTWGGIARDN
RTFINAVFWILRTGAPWRDLPPDYGCWSNTHRRFIRWRNQRVWERLLEVL
IDDPDYEWLVIDASHCKVHPHAAGAKGGNQSMSRTKGGSIQNCILPWMRM
VCRSGSLLQKAQQQIVLKQAI
>pc0757 unknown protein
MVVDFKVPLESIYCFFQLADYYQLIKVVKNLEKQLLDAYKLKKYEIFNSS
EDSLIELKKLLNFAQQYQLNILKII
>pc1015 hypothetical protein
MLTNVCPYKALKMYKKRWAIETLFGYLKTKCFCFEDTHMTDLKKIDAWML
VLTLAVVWTIKTNEIIQSKTNQASHGRKRKSIFRTSFEGTRKCLLCLELY
MNEFLHYIRLLRKKNFILNRL
>pc1637 conserved hypothetical protein
MWMEIESNYTFNRPLASSLSGKPILSAASRKRYQRERFLAVKVGSDTMVP
FYSQGTFNTDLFNLWLEQFLIPELRPSQAGILDNATFHQSQKTKDLIQSA
GYQVLFLMPYSPDLNPIELFWANLKRTISENLKKFTSLSEAIDYSFLAYS
>pc0797 hypothetical protein
MRCTHCGSDLVKKNGYTRHEKQNFRCLECGKQWSENKEAKIINEQTKELV
RKALLEKVSLNGICRIFDVSMPWLLDFINFIINDLPEDLNAQVTCCEKDE
LEVAKLEVDELWNFVGNKKNDQWLWLILHKKSRQVLAMQVGPRDKKTAEL
LFAKLPESLKKKPSISLISLMSIMKPFLGVNINQLASNLVRQATLKDLII
LSDKDVQDL
>pc1280 conserved hypothetical protein
MAYSKDLRQKALNYLETGHSAEEVRQVFGIALRTVFNWLKRQRNGCLEDK
PRKRHPIKIDNDQLKSYIKKYPDSYLKEIAKEFNVDPSSIFYACKRLKIT
>pc1561 conserved hypothetical protein
MAYSKNLSQKALSYLEIGHSAEEVRLVFGIALRTVFNWLKRQRNGCLEDK
PRKRHPIKIDNDQLKNYIKKYPDSYFKELAKEFNVDPSSIFYACKRLKIT
LKKGLILQRKR
>pc1124 putative calcium-dependent protein kinase 9
MQMRNCLSMPLMNHRNNCTSSSYTDLSSESSTFSFCSIDSNDSSSDLETL
TKIKDLAPVIVNEFSVTQSTWKSSRNHIIQVITSAITVKNVQLQASKTLT
PFLKFSNIDLLLQLQIPLTKTQLTSTFEFLSENLPLLKPATITGPIWHQI
ALTALNSYFDTNFCLEIHNHAIFILFLSHPSTVISQGRHKNVYKIFQLTG
IPKLYAAAITTILKRDPEAKKLKEMQINEERFLTNLASNPQVVKTYSIHY
YPANLSFDERQVIIMEYCPKDLRGLLNNLIDKREKLTSNQKYNCMFQLLQ
FLNDFHSNGYLHRDIKPDNILIKNLQLKFIDFGYSCHITEKEKLMRRCGT
FQYLPIEIFEDLERPFGQEKDMWGAACIIWLLFYESLYPWYKAISSDEKY
LDFLKKEICDFRQTITSLKSPTPLDHLLFNLLNPDPRTRWTASQAFKYIL
KHKKAFCEEEIIYI
>pc0049 unknown protein
MSINLNSSMCNPIDSLNQPKEVVWEENVCEMNNCSLTSENKISVIAKNML
PVEEEVIFTSFNCPITLSPFVDPVVDECGHTFEQEAIMQIYNRAIARGTP
FTCPMDPSKILDVNKLVKNYNLASAQEEVEEFTKKYTSEKKTSLELMKEL
MQEHKIEKREHKLEIQKLLEDHKSFLEDFRPLARDAKESLNTSANILNQC
SILKDKNTILEKKVKNFETMSAADRLFSYLFPRYNDAISTRNITLKEQEL
LNKSTITDTEIEAEGRKLKELKNKIEKYYPPVETK
>pc1100 hypothetical protein
MKYDNSRAFEKHLEGAAPHHFSRLYFILSKDPVEQQEAVEHTLHALHPSP
NVLEESIEIIDGTQTTLDMLFSELYSHNLFADKRLFWIQNADKLKKNLIE
ALEKYFPQIPSSQYLILSAPSWNKQTSFYKAAEKEGIILELTEPKPWEKE
KKLIEWASKQLSAKRKIIPYQVCQLLVKQTGLDSSLLIQEIEKLLCYIGD
RNEITQQDIIKICNYQPSDTIWQLGEALFKRDGLAAILIAQSLLTEGQSL
LPLLRQIRSQFQTQFHICVMLANGKAAQEISHEFPYLKGNLLDRTIQQAQ
RYGLDSLRQGILFIDNTEMRVKNSHADEKLLMELLMIQLTRTI
>pc0245 unknown protein
MRVNKIFGNTFIILELVEKTLNVAGYIPGIGTVSAYVRGGLASIEAVSGI
GLTIIGFIANSQGNPASSIYLTTGITFIGHALLNGFRASFENQPFIPLVT
TLPYDIGSYLLLGRRVFPYLK
>pc1322 unknown protein
MEFYMSLEQKMEEKFHSTQVKMKEISVGMGKLESEYQKLLKDLGLSSEEV
HEFASNASNYSAPIWEQLQNEKKQLDEKLNLNLNNVRDPLKVKKAFSDHA
TIQSHWIYVR
>pc1274 conserved hypothetical protein
MANNGAKTRKLKSLTNKHKELVRKALLKRVSLNGICRIFDVSMPWLLDFI
NLLINDLPEDLNTQVTCCEKDELEVARLEVDERWSFVGNKKNDQWLWLIL
HKKSRQVLAMQVGPRDKKTAELLFTKLPESLKKSPLFH
>pc1143 conserved hypothetical protein
MLAKFRSVDMVNMENQLAIQKIENFEVGEYLDLVKTAKEYATFARSFNTN
KSYRSDWDDFVFWCQEKNLRPLPALPQTIVVYLISRADNAWINQKGKLQK
PLKISSLSRRLTSISQAHKLAKQPFDKNCPEIQEVWKGIKNKLGSAQIRK
DPILLDDLRKMIESINNDNSKANSLSGMRDKALLLLGFVGAFRRSELVSL
TIDDIKFVREGLQITLRKSKTDQEGKERIIAIPYGSNILTCPVRTLNDWL
DCSKISEGLLFRPINRHGQIMDKALTSKSVALIIKRNKHLENQKNSFSGH
SLRAGFATTAAIFGVPEHLIMKQTGHKSFDTIRRYI
>pc1645 conserved hypothetical protein
MPHSFPDYSFTCPFCKNNCKLSFAQCPAFCPFCGKSQKNESTGLPIQSDF
YQIIKSIGKGGMGEVFLAYDPCYERQIAIKKIRSDLLEHPQIKKRFLKEA
HMTSQLTHPAIIPIYTIRSDADTAYYTMPFVEGDTLKQIIRKTKLQEKNG
ETLDYLGGSILALMRVFITICQAVAYAHSKGVLHRDLKPENIIIGKYGEV
LILDWGLAKFIDQSPEEELLASFPESLTKQKDITKIGKVVGTVAYMAPER
ALGQPATIQTDIYSLGVILYQLLTLKSPFKRGTLDEFRKNMSREEWQDPV
TAAPYREVPRMLASFTEKCLSLDLQNRYQSVEELIRDIENYLEGRSEWFC
IANLNTKEKNDWEFQENVLIAEHVAITRMTDDAEWVSLMISKQSFTGNTK
IEADVCLGEQGHGIGFLLSVPEASAREHLIEGYCLWLGSDFSKTTKLLRS
NVEVVHAPDIFLKRQQTYHVRIEKVDKSIHVYINDNLQFSYIAHIPLIGT
HVGLLSRDADFEISPLEIYVGNLNINVNCLAVPDAFLAHRDYNQALSEYR
RIAYSFPDRTEGREALFRAGLTFLEQAKTAENKMPLLEEALNEFEKLHGT
PSAPLEYLGKALAYESINDSEEEIKCYELAYRRYPNHPILPMLQEQIISR
LHEVSRMQRITTYRFTLLTVRHLPLNKIDTHTKRLFNSLQKHWEVLPFIE
YKSPSPLTTLSTRFATPLAFWLAKPFILGEILDDLIQSPPFPIEEVNNAL
LCLVELGSWEYAQEKLNTIQTYLNLPQNPKWLDLKAFIACHYQTLEDVYK
DFFFQIPSTNADHLHAVLYFMDQCLDQLNTSLIYTLARQFEHAELSFEDR
LRLNCRRVWAYLLDKNWQDAGNLLYTYSVETLNKDSSLLHFLYGCWLQVT
EGAEIANVHFAGVNPVMFPRTWTLGARFLTNNLSKDSYEKAFMWEKRQLC
KQLILYYHCVGNETKRIHFQKLYQEQFIHAEL
>pc1097 unknown protein
MIKNDSSFSDVPRSYQTNCEHVIQNKIQLDKIYEQLKTSKNSKEFVIMHD
ALTKLDHSMAKLKEDIEKIKIISKDDELSKKVWNTANSQDIFTALDSSRL
LIQNAQESYQLSLQILQSHMPSSLHTTEPKNELSNSYVLFDKLWQKENVL
PESFLEVGQSLVELYQKNPTQLELLTRAHQCWEKAAELYEKKKNYSQAFE
IRAKIANEITIPHTHPLYELESKVDDYVKNANITPDDGAKFDHLDSGILK
RGMLSIRKRNLDGKEKLVANFHISHFAKEKLLSTIKAIRENKEEFIKNLP
EHLKSQLTIRDVDNGYFKKISDVYSSDISQGMRLGKAIEIEFKDIGVIRV
AADNEFHSMRDRIVIEVNKNTSSGLEQMSEISTVMGLGPIFGVESLEEEE
RKKIMLLFRTFYPQEAYPLENLQDTYEISIESLKQMIIDRQPDMKEVFKD
YLSGEGRMKKVEIAPNASVWSVSNLADLMRHEGAIGLMAGFTGDPEVLVS
VLTQGSLCSQERFEKGHNFDGTSAGQDHRHGGAGFVFSRLINQKMVNTLR
EELIESTGSYEERPSSLIQRYPHYGEYQLLYDLSVINTGAYAYNQDRYGS
KSIEHYGKRNNLIEFTKSLDENSIKNEVMIRDRLPPDKLHKILFSSENKK
QMLIDDLKDKNLIIEEKGKHYIKGYKSKSIEELFVVGKYFTSEMWK
>pc0295 conserved hypothetical protein
MAYSKVLRQKALNYLETGHSAKEVRQVFGIALRTVFNWLKRQRNGCLEDK
PRKRHPIKIDNDQLKSYIKKYPDSYLKEIAKEFNVDPSSIFYACKRLKIT
LKKGLILQRKRLEKT
>pc1891 unknown protein
MRLSCPLAKIIFFIHPRVDMNVLPLVLMLILMTAVITVEKLEKFKSTVIV
QRQYQVYLEEDERQALNLHQRNLYAEYEPSQRQLSFTMFFNKKNREKSPE
VFRQIRQITEDLIKVLYGQAAFYKRLESQRPNFVHEMLDDFMAAAEKLNK
INKIRQIEDIQRIRLEDPVLQQAFYHILKGTITKKKLKELQIKEGTDEKI
ALSQRNQEKGYYSLLNFIKHTEKPQIEIQLASRELLLAIFGNEEIVEAIL
IKRNEKSADIGAQFIESFKGKQKPGISNELLNFKLTKTDKKPYD
>pc1618 unknown protein
MYIPTDDCKPSLTESTSSQTSEVQTSSQQVKSPTEVNIEKIATKSLPAIE
EETKTISFSEKSTKFSKGRFLCSYNRGDLKTSILQTNDLQKRIYIKLNEK
IGDKFINKTKKLWIKVCSQSESESLVKLTLSCENKTVDILNDKTLSKKSQ
DYQEVKIELDKNKMKLDGLNKLLTNIKKRTYADKIKELELLKELDKPIIN
IDNFLLSFEQFLEKYQEIDVEKLTTEDIEFLKKEHSELEKGYNDLKKILP
GTIQRLNQNVKLTKGGLQKNIETVLKGINTALQGQEVKNLDDSINQFKVI
KTSIKEASEAYPGKLNQVQQEVDEICPRYMKLFQEIEEGNLERYPDFIHE
IKEILLNVSHDPVAYKDALQTLSDKVIPSIQSQVLGITNELRERLNRKKD
VEIITIDDCIALKTYIEDYLKPLLALTEPMATEKAPVFEDQFKNLFNLLP
NSGKEMTAQEIVSKINSFSSPEGSLRVYRNFINKNLAGIKKELNQETKIK
KEIEDLTNLLKELKGKKADILESFFNELMEKEKNKISELLTGGVEQVQNF
VDIFLGHYLVHSQERFPKLLESHRDFAVRVSDMFELVKDHLSEEQLGEIK
LVLNDFLTHHITNQTGEIEESLGTSLHQNQKSSEKVTKPAKPLYRKVQGA
HEFGDDFSIKCQHVCKQVEALLPWLFGKGFVASPQAAHLVPFPGIVSWDV
SYLSTLFKTRLGLDLSQKEIENRLELFNKNVEPFLKTVQANEKVDQEMVK
NLLQEKFDNKEINDNFYFIYTNLILLSHLSSLEMSETRHLPEFFNQTMDK
FSESEIKYNSDGSRGYKVLLGEAFIDLLTYPKESLLNPQSALSKKHIEYL
QATLDTVSERLKQLADEKLQNRALKPIELVECHALHSIYLGVKNLYTQIK
LADSDEDFLNKERNIIKNTEAILSRD
>pc1005 conserved hypothetical protein
MVGPQAKRKAMNDLTIHHGISQRRACRLLAFDRSVGRYKHKMKNDTEVKD
KMISIAHERRRFGYRRICLLLKKEGLKINHKKVYRLYKESGLKIRKRGGR
KRALGSRIGPEEISRPNQRWSLDFVSDALANGRRLRILTIMDDFTRKSLK
MVVDTSISGVRVARELSELIETEGRPACILSDNGTEFTSNAILKWSWDNK
ISWKYIQPGKPMQNGYIESFNGKLRDECLNENWFLNVKDARSTIEKWRED
YNEYRPHTSLKGLSPKQFIRSLSENNKKLIA
>pc1039 unknown protein
MLVGDLHTSIQFGQNFNPFTATVNSLVETITFIFFNTITLGTYGSLEILA
KKNKINNLERVQKQMQEELSNFIQKWNDLESRLATVREEILNKTQGATFI
SEENLTTLEIETKNLKRQFSLLFPDSDLSISFANFLKNLITNFLTLGIYS
AYQNSLLNKKVSLLIKQNNYIKDKFQRDNEQKEHQILSNIKIAKSFVSWQ
KGLQAYSQNPHIIENEISEIRQKLIEDEACLRKLESDKKNWETLHIDLTR
LQEQCVKLDSQRLALKKVYADVFEQMTYEKTLEVIGQDKAKVKQLQQKLD
QISRIKKQSGTSILGQLKPINPSDKKTLDQYGIVLADEEVQGDYGLNSND
DEENLFTDYVKRNEKTVTPEKFINESLTYILDKMLKLGNDSTSNVKFNDS
EMIYLDPDYLYSKMAIYQLLVLDVLEHGAIVRDCQGIKLKIGRASELEMR
PSNPAQVGTFENGRFGSKIILRNEDPFGPVSGTAGLQYGIDPVRAKRIWI
LLTEEEQQYLYYWLMDPFFEEGSQESKSLREFVTRGDKKRVALVNLVYDH
VCDIAASIMKNFEKHTGVVWQEKMTNDKPLVTPYKKVSINILDQIEDSAP
IVAWQMNIEILAKYPLLYTALQEAQADHSILQMMQMIPGYLQNPLNKAYA
AQWKSDDKIKGLSEQYYGSHELLEGYVYDTSPRGCLFSNLLAIIMTNENY
VNKRYLKFLKEAVADCLDNEETAKEFKDRIKQDYHWSLKQYQKWLRGESI
EMISEYSDIEIELTARLIGVKIGVFVLGQNTALDESGAMIPAGQINYFGP
NTKEVYYLYNHPSVTYYGLFSKYHKGENLKTYLSSFDENVFGEGIVERIE
STVNKLHLYWRLLAQAKD
>pc1405 conserved hypothetical protein
MKCKFIVDTVRFHAIKLGLIIERPKKMIDFLNIDEACEFLNLSRPTLYRY
AKEGKIPSVKFGKTWRFHKKLLEEWLLNEMKEAAQRRAKQQPDNQLSEEK
DIFSEN
>pc0527 conserved hypothetical protein
MEQGARQGISSREELVPKSQVKEMEKRIRELERMLGKKTLENEILKEAVR
LGQEKKLISRQPLPSLNDLA
>pc0340 hypothetical protein
MLSEFQTAEGIILKVIPFRDYDQILAIFTKEAGLIKVLCKKSRNKKGGAK
SHYTPLTKVELVYKEQKGEIFNCHEISILDFYRHLRTELSHLNAACDIIQ
LLYQTQLVGKPAPRLFTLTEIYLKKIPQTQFPDILTTSFRLKLLKHEGIL
AHPLVCSVCLQPLHQEAFFFRGEVFCRLHYPMGASHLRENEINVLYQLLN
CKNYQELTEITLFSQTKNKIERYCKETMQKQ
>pc1028 conserved hypothetical protein
MTNCKLITSVERRRRWSLEEKKQIIEKTYQEGQSVSQIARRYDITPSQLF
AWRRQMEQGALQGISSREELVPKSQVKEMEKRIRELERMLGKKTLENEIL
KEAVRLGQEKKLISRQPLPSLSDLA
>pc1003 hypothetical protein
MISGYGLFPIKKVGKCLLCKWVLEIKKPLSFFLQKLPESLKKAFYFTDKF
NVYYETNPWSQHQPVSKQSGQTSYIERFNCTRRQRCARLVRKTLSFSKKL
TNHIGLTLPLKNHPRRNRGSC
>pc1621 unknown protein
MLAIFLDIESSGLDSFHHRALEIAFKVIDVRTGEERLTYQSIVKQPLEVW
EKRDLASIEINGFTWEKLLLGQEEAVVKSEIVQIFNDLKIQRGRAVYICQ
NPAFDRGFFSQIVDVYTQEKYHWPYHWLDFASMYWALQFKFYTQKHEHFP
LEINLSKNTIAQHFGLPIESSPHNALNGVNHLILCYKTVVGFG
>pc1399 unknown protein
MPSSDEINPVRFNPRSDSSSLGRSRPEGTPRSDKNFKKLVRNDEDPSKEQ
EELAGLEEENEAAPLSLFDLSAKNKSTRKSPSMVAKNPFIKEENDQQPIL
EMAENKNPQLEQNSTEKPLKDTFLHGEIVRESVIEGKKEKNSSLALATDS
AAPSPKKEKQKLSRTPFEAREEQVDLSAINSQQRPIAFLADKAELAEEPK
TLSSIKDIVAQIVEKMQIIKTGEKTDTVVTLRYPPIFEGATVTLTNFEGA
AREFNVAFANLTDEAKRFLDRKIVEDSLVENLARQDIIVNVLTTTTLPEA
NADTDSYKYFTREEREQKRDQQAQDQKEEE
>pc1929 conserved hypothetical protein
MGSNILTCPVRTLNDWLNCSKISEGPLFRPINRHGQIMDKALTSKSVALI
IKRNKHLENQKHSFSGHSLRAGFVTTAAISGVPEHMIMKQTGHKSSDTIR
RYIRLGNMWTENAATKIGL
>pc1004 conserved hypothetical protein
MKKRFSEEHIIQILKEVEAGSAVAEVCRKYSIAPATYYSWKAKFGGMSVS
EAQRLKALEEENRKLKRLVADYALDNVALKDLLSKKW
>pc1045 unknown protein
MFNNTSLDEVPFLKQLDEVANKIEYFQKKYCQPGDSVTNHEISEFIKDLE
LYNTLIEGTLENRKLVLANGQKNNQRIEQALNAVLLFQKVNPDEGTKKNI
RQVIASLFNDSEKEQRRFEESIKNLRSKWDSYMKKVHEIVKSNKVN
>pc1196 conserved hypothetical protein
MYSSNLIAGLTAEWLLADKGYDSDAIVEQAISQGMQVVIPPRKNRITGRE
YDKDLYKLRHLVENAFLHLKRWRGIATRYAKNTASFLAAVHIRCITIWAE
VS
>pc0411 unknown protein
MPSKLQRHEWLIVSILITTLILLTGMAFFSKKRVLPIPRTEHLLTTELVD
VTVQGAAEHIGIFELRKGARIKDLWKLCKPTFDADLSSFKPNQLLRDGQV
IKIPLKEYLTVYIRGAVQQEVVLRVLKGTQLKDLKDMIVLQKDADIKILN
AKRRLKDQEVIHIRSKKISKNAQKILDKKIEPKVE
>pc1650 conserved hypothetical protein
MSQKKVVSSQAQRKATGYLKKHFEISERRGCELIKVVRSTMHKSHARENK
DLKERIFQISLKHKSYGYRRISALLKREGCSVNHKNVYRL
>pc1202 conserved hypothetical protein (chlamydia plasmid)
MSLQIHQIDWERCEITFPQSKMKGVYKETVITYSNSIMERLREHIGERKG
HVFITRFGKPVMINQVAVTFAKAGKEAGIPFKITPHVLRASAVTYLKQQG
FQDSDIMRVTGHASSEMVYAYDKSARSDNASKKVNLIP
>pc0087 unknown protein
MIMALPDKSKSKKKESTLFGLENKSSPLTELDQFDPDKMTLSDVENMISK
VKILHDEIDRKLDDIFQKSGWTSKQIKTYLDNPNNFTVDEWEKVQRDRQK
LMNTLKTGKDLQAASISNAKTEQNSKLTRERRGKTIGARRNWISMQ
>pc1199 conserved hypothetical protein
MTHSYPSDISREQFDKIKPILESIRKKTRPRKIDLYDVFCGVLYTLKSGC
QWRMLPKEYPKWEICYYYFTLWSKKDQQTSESILEQVLKKNRWRGSTKQW
SERENQFYHS
>pc1198 conserved hypothetical protein
MGSNILTCPVRTLNDWLNCSKISEGPLFRPINRHGQIMDKALTSKSVALI
IKRNKHLEKQKHSFSGHSLRAGFATTAAIFGVSEHLIMKQTGHKSSDTIR
RYIRLGNMWTENAATKIGL
>pc1492 conserved hypothetical protein
MDLIKLYCSVDDFWKSFEKKWNKQLIDHGKTKRGPQPELSIPEMMTIVIL
FHQSNYRTFKHFYGYVTKYLVKEFPNLISYSRFVYLKKNLFVPLFAYLLD
KRGEITGIAFIDSTSIDVCHNKRIKRNKVFKGLAKRGKTTSGWFFGFKLH
LMINEKGEILAFQLTPGNVADVSIAETLSKGIFGKLFGDKGYISKELSKR
LLKQGLELFTTLRSNMKQNLMKLTDKILLRKRAIIETVNDQLKNISQIEH
TRHRNAGNFLINLLAGIVAYTHQPKKPSINLTEQHRLLLMAA
>pc1953 conserved hypothetical protein
MKVLPLQIYQIDWEQCKITFPQSKMKEFYKETVITYSDDIMERLREHIGE
RKGHVFITRFGKPVMINQVTMTFAKAWKEAGISFKITSHVLRASAVIYLK
QQGFQDSDIMRVTAGHASSEMIYAYDKSARSDNASKKLT
>pc0779 hypothetical protein
MNVLEKRVENQVQFWSLLGPFLILLSIAVLLFKVSSHWYFPLSALIGIPL
CVKWKIKGMAAALGCLLSFSVVGYLSIDLDEQFWHVGMALAMAFSFIVLT
LSLEEVEGLVDKLQLESQSRLDNFLRLEEKLKTMEHTWFVEKESIQGQVI
SLTNDLTQIQDEKQTFYKLALLSKDELSHFKSEHDKLLQELFYKKQSIAQ
LNEKLHDSEMHLQEYINTDSASTISKLKQNISNLEEEKELIDSQFQELKK
DHEHLLEVFYKSQQNEKEYLKQCEDSQKEIESHQILIKNFHDQYQCLENE
KNDIQSHLISVQTQLERTTFLIQQNESFIQIQTHKIQQLEQLLEQRETEI
QLHAETKISLQNQLVGEEILKKHGEDLKYKLEQLQTQHDQEKDTLEQQHL
FQQNQLRGQLNQLMQEIDDLNSQTLNYQAQGEKIQKIQVQLQLSQELNQE
LEQDLEELRKKLLTYKQELDESNQHLIEIDLLKQSKLGLEQELGLITEQL
KQSQQEVDQLKTVENQLILMTENNQLLEKTVDQLKKEFLELQEKTSSFQL
SEQHKNFTEIQFRKMEGLYLQLRKQFQEKSMVLDKTRQELFLTQEKMTSL
YKSIEEEQIFDFSENERFLQKDLHILSVEYEKAISDYKDEIDEMSDLISI
LLKQC
>pc1087 hypothetical protein
MRTRTGFFKNKSLKLSEPIIYQLRGIIMIPKPKDYFFTPTDLQGTIDTFL
RPNAILTQQRQRQLELVLENFFLKKDQENLTQQLTDIKCNITGKQIENEE
LKNKSQQELQQIIKISEKLLAACKKECEDHAQFKKEADQKVASISQSFAK
LRENDAKQLHELKRMHQQCDDLQLSHKQDMQLLGQLNEQVQKIKESFHFL
GQEYKQHFKDFQVLKQQFGQIRKDLELIKNQLDYMGKDLEDIRQDFKRFK
EEMNSLTQDFRVIRAQIEELDRREDISNKAIADRLEKMQVAFDQLAAQMN
KDKFVQSTSLPQISESSFDRSNSKNILTFSFFRSLFKWNIFKIICLNHFN
HHHLFRRTSNIWTSNIWARKIPIPVDSKELG
>pc0857 conserved hypothetical protein
MANYKLVINLCIKQLDMAFPSFTEEAKKIQKVMAEKVVVEDPFQEPQWIG
GMDVSNNLYDPSQLIYATIVVLKFPEFQLVE
>pc0068 hypothetical protein
MNQATSLKTERICIFLMLVHLVFLNGVKENLRIFVNYSTKVTISFLVNNL
KGVSSRLVQK
>pc0279 hypothetical protein
MEAGTFISSLFPRCGSLCLSRYVSLSSINNYSHESVTVDLYRLPAALKFA
NYDSLQKFEVYLNIVGKGDRKDSLSLPEEFLDVVEVESVYPELVQKRYEL
EVAQVSQKALQARIGIKELWSWEVDDKNWEILKAQFPDLALRKAITREER
FSVLDDLDKTTRSKVDRFAKEAIVRSHPEWILEGLSKVNSQKMNVGLRTT
GGKIPFTGLDKKEKRQEFMQLLDHAILGAAPTDDLKAYTADNQNYYQIKV
LNRAPQSEILTFEEANQDGTMDEVRMKALEKYYLAIREQNPSTYQKENQE
WKPFKSVRELVADDYFSKVLIALQPAQKTLLASEKETANWSKDQAASLRL
YSYVQHIKARLEKDPSLATLYVKNQELEQKPASLKDQWLLERTNVSLTRQ
DQKDGINTEEAFILPVTAWSNLSTPVNGDLAFFQVKEKGEDVSKKEVAIA
EQTKKAQAILSIDAQKVLMHHILDKIKAKDAISLSYLQVSQETSTDESAL
ANPDF
>pc0716 conserved hypothetical protein
MLIKHPKLQKWLPPGGHVENNETPVEAARREVREETGLEIELISQENIWV
NYWNANSFERPYLCLLEEIPPYKDQPAHQHMDFIYVANLISAKSSSPSES
LIYQWFDQKGLDLLEPDVDIFKETLQVLQHLLATFCSIPKKLVSN
>pc1160 conserved hypothetical protein
MTTPIEMSLKALLTSMQRNHYEADIQLETDQVYTILKIANKEYPLFLRIF
DEGNLLQLLLFIPCQIAKPVISDMARLLHLLNKELDVPGFGMDEIAGVVF
YRLMLPTPNKKIDEELLLAFLKTIEQVCKMFATPIEAVGFGQTTLDEILE
KTREMENES
>pc0863 hypothetical protein
MSEFIAEPNPDTNESKQPLLNSTFNIEQLSRQIQSTPFLIKQALESDRIL
LDHLQNLTERTKACIMHFNEQKQTILTRFDNWLAPLASDVLDEFIKQAQL
LKSELDETLLNLRKIDTIDWDKHANSWLNLYHQWSDHKELNKKILKLVSD
RTEHLIDKDLKLIKEYQIQYLSKMEEEDPDLINLENRLAKAIEEPLKHLV
ELKTHVKNAESMQQASEWIEKLDSQRENCFDQLLMKIDSVVKEVVLPEAE
IGSEDLKEIENEMHFVAQELKHIHELLPKLDKHDEKEFYFTEVRLEGLRD
HLEQFDSLKLPFSTRDRLETLFATIEATLSEVLKRNE
>pc1451 hypothetical protein
MSTFEVISVLLSSGVFIGILALFYRFGRNQERIDNSFKAIDEKLKAVDER
FNKMDERFDKVDSRLNRIDERFNSLETRMAIVETRIGDIARYVSYLIWHS
QTVSPKEIQEH
>pc0498 unknown protein
MFKQSTKFLLFFLIVFGCTHAINPENSSEIPYIDKRLIELKQHLKELQSS
EFNEVVTGQEYMIADWSAYEREIQKFKQIKELERDLQDKIEQLEKRKREL
LKQPKSNQ
>pc1000 conserved hypothetical protein
MMEVSRSNLIEQLKEHLPHQPVFYSKAENEQVLALIKEVVKGRPTYGYRR
VHAIVNSLLKEKKLKVINHKRFFRLMRQHHLLLQRPNRRPKRLHTGKVET
LYSNTRWCSDSFSIQCLNGNRVHVAFSLDTCDRKVMRYIASTIGIDGQMI
RDLMLETIEYRFEQPKARVPLEWLSDNGSCYTAKETVNFGRMLGLTTRTT
PSYSPESNGMAEAFVKTFKRDYVYFGNLASAEAVLQQLPIWIEDYNAKAP
HKALNMLSPREYLRKLKMTG
>pc1484 conserved hypothetical protein
MTAIPSYLQPYFQDAEKSLNAKLAKEIEFSGATYQILVEDLYTHLEYWVF
LQLEAQGNIKDAFCSCNSQDEGCLHQLVAYLSLFNTNEIPLHLRFERSLW
NHLCFLYEDRLNDALMELKQLQPGHYIFQSSSEKIIFSIKALSDSSILFL
DELVTPRPKETEETSLKFSNLSNEDLLLWREGRPNPQLRYDLSYWSDLAK
WLMRKQDNQEAYQVSFQYSKKKLPNWIQIDFYDLEIGFYLSEANLPFIIP
SLATVKSPLSVRNANNQGIDRIEYDKTTGIMRIFEGSLEKAPKIKKESDS
FLNGIRLENWIFIPEKGFYTDEPHNLLQTPELEGEQLSVALTEHQRFLST
LLMNEVIHRSVQVPSYQLFFDKKWNLHIVAYLFEIGDLSLNYSRIIGDWA
YLDGEGFYPLENKRFEEVETIIPIYQVSDFVTQNRGWLNNIEGFHTHIRS
IEYQLSYQVSETNRLTFQCSLAKAKQRARLQDFGVWVYLEEYGFYSKSVG
PFSHLLKPGFSLSPEQVPLFIRMNRDELSLIPHFFYEKCPLEKTKLHLQM
TQKGTIKINPEYVLLPFLKDTNFRLFDDFIYIEKKGFYELSAPLRLPEKF
RYPVELAGEELDLFLSYEMEEIRPYIHDIDPRLLKPQKKQLVTSFVEAEE
KKGKGWYRFKLYYQTENGIIPITALRQALNKKKQQFAFFEAGLIALQDKQ
LDWIRRLDKDRFDKDEEVVFLTTLEFMRINAFEQIQFFETENLDLESSQK
NFIALQELQTPDVPNITGLNSHLRPYQEIGVQWLWFLYHQQLAGLLCDDM
GLGKTHQAMALIASVANLYRNYAEGIQRHFLIVCPTSVIYHWQDKLEQFL
PGLRICTFFGVKRSLAAFHQSYDILLTSYGILRNEKELLSQVNFEIAIFD
EIQVAKNQTSLVYAALKNVKAQMKLGLTGTPIENHLRELKSLFDIVLPTY
MPNENDYRELFIKPIEREYNSHRKDILNRLIKPFTLRRKKEDVLKDLPEK
SEEIAYCDLSPYQQQLYTEVLEQRKRHLMQDLKDDQTPIPYLHIFALLSS
LKQICNHPAVHLKNPGDYQKYSSGKWELFIELLREARESQQKVVIFSQYL
GMLDIIENYLNDQKIGYASIRGSTQNRKEQLQKFNHDPSCEVFVGSLQAA
GLGIDLTAASVVIHYDRWWNAARENQATDRVHRIGQMKGVQVFKLVTKGT
FEEKIDAMINRKGQLMEEIIGVDDQNTLKKFTRNELIELLTYEEKDDDHM
TLSDVE
>pc0808 hypothetical protein
MRWTHCGSDLVKKNSYTRHEKQNFRCLECGKQWSENNEAKIINEQTKELV
RKTLLKRVSLHGICRIFDVRMPWLLDFINFIINDLPEDLNVQVTCHEKDE
LKVATLEVDDLWSFVGNKKND
>pc1230 unknown protein
MDANFNSFLPTSNQNFIPSIPLAPSRVMGEYNEMLGRIKEVAKELEGLNH
LEEQSLIDQHISSLLGLDIDQYRKNPRNYRVYHGHLADLAGVVTDTPPSC
EADASGLVSCQFVQGINLSGWNTADFLPLRISYLFWLTMSLVNEEISKRK
LPKFSYQFTNTQRTELIQRCAKEICVELETLRVARLVAKLEKHYASAIKE
AIAMEEEDPDELINLLQKIRNVLDFSTNKMLRIIQGLEPEEEVSYSSGSI
NHCVYVSFRRVSNHVLIRVDNAGLWSEDNSYHLPAVIGGISGIYPSCIAT
VNFTSIEQNPEPLKKYLSDILIASLLPADKAKDMIYNLNLVKAYQYGETE
EFSTSRLLELSKQFTPKVQQTVGNCVVASHNIGMEIRINQNSEVAEQEPF
TWIKRQETRTSATADPQIGII
>pc1129 unknown protein
MFMNTENYFSKDSLNLWDKESTNIGKLEKHQTLLEPQSEKWVGKLNKYIL
EGSITSKDVDRIEKYIKKKEGREKNVLLVCNKLVCISRIAIREKVIKDNT
EGKNCKEFIGKISTILVDCSIDDILKNISDPDLFNKIIEEKLKGEKLDFE
SIEKIIDKKIELGDKSGINEKLISLIQDLNTEEFLKIANKLFGYKQFKKE
NLDEIVKFKITKTSDINDKISIINKYNNSKDIIDDVIQQFKPASPEEGIK
IAEECTLSSENRSILFQNFLSAKEEVKLEEALEFHEKLGLSLEDLAKQLP
LLLKICDMEKNDYLANVKIKEALTNPQVNCHFASHLCIAKPQLLVTLFGE
QGSFKDIFKIDKQLEVLRNVVAQTKDFKEFEENSLQDLTIELLDKGQEDK
DLLDENVFSCLVAINKRDHIYCIENMVSSDAICGIIDTPLLLALQREEGR
AETTTYSDISSSWRKEKKEQYLDALLSDPSTQQLALTRIDTGNQQEPSER
IEYILENLDKIPLDDAIEAIKKDFKKLSDVSDSLLVKILTNFNLNAIKGV
NEETNKKTLNIFAEEYPNLVPTLQKLIESSGKNHYALAKSLFSIAYLIDN
MPKKGDQNKFRELLEKKEIQALIIQIATMRKPDEARFFLMNRFMENISKP
SSDDDAYNLIEDLKATQKQVEAHKLIKLQVSPFYHPFQKGLGELFGANKD
FISDTDYLPTILETLQDIHRDPLLTESEKKYLVDFILGKVPSQVMLDSKQ
IKKNLSSVKAILRLGGANYLCQASLEKAFEGDHETLLNRLGGQCLSELMK
GHLSDTVSLQLIEKINKSRDFSWVLNIAVKLNMLDSDKKDAHLKMFAEAL
KEDVEGQFVEERFNKSPHLLALAKKLEEKKQNDFIEEWKKPLSEEPLTVA
QLLGETAKTGSKVLNEQQVAKYEVFFTDDFLDLAQMGTEVVGSCLNIKTG
KSIDVMTILGNAIDGKTRMLAVKTTQDPQQPLQGRVMLRLLWDEEGKTPV
IIMEGIRTRKPGDQEEAQIVDQALLEASIKVAEKLKVPLICGFTVKPQPD
VDYEQYPHQVQSLAPNRSPSEKFDPLEEQGEGAVERTPEELSGLYTLKKT
NTIWKP
>pc1516 unknown protein
MITLNSSYTAIADIVRNDNIGGILKKAEATVVGGKVQLYLGDSMISYLPA
IDAIFQQAGVNSEPAKKLLIVFRKYKLGVINASKLQRKIEILAIPYTKEI
SEIIQSRTSHPKPFSERLDEILASNDFQNTYGLQLTASQIHSKIAKICAK
YKTISLSALRAQKLGNIGEKQEDINAKVDELFEAGLAASAGANGQNVVVF
VGNTGVGKSTTINFLLKRELKSIPKEVLGIESVIENVIIAKDPATSIGHK
RISKTSYPLVVQDPDNQLAYCDCPGFRDTRGKSVEIYNALSIIGVLDKAK
SVRGFLFFIDCFALKASRGQAIIDDMRFLFLLLQDFKIHQRAVLFVITKT
MRADKLHDIKKVLQDSVEEILQDGNQSIEFRIFCGEIAEANFLDNAGLGQ
RVFICDPCGPNAKGNREEILRTINAFSYDTNIHKKFGYPISEKVESKLDM
SRNSIIFQVQKTLTVLKNKLGLYWDEQTEKIKTEIDKVLVEKTRAYLDEI
KQWQKDLKQELSHFASGNYVKVSKELTDTLTQSLVYWDKLNQISTQKTNM
ENLDDHFEGIVKELQSIQSNIEILWHKRMHEVIKKTFEQSLQTYQVQNKL
DDMRKSLPPKKLADLTVKELRDLLQTLADAAKVALEYPNFIEAILIKDPN
KCKDLIEIIRVNLMEPIHVVSNQQVLNITANAQAVTLSEILKNTHDLLNS
TREIWITQIATLYFNSELTADHFKGKVIYIAADQIEVVQDSLIDLAVTWR
RGGVITLKGHLKGEEKFENAQFKLVPKDQVSDTVRLIKCQWPLS
>pc0994 conserved hypothetical protein
MQSLRNYLENRTGQIFITRSGKPVMINQVALTFKKAGVKANIPFKITPPV
LRASTVTYLKKQGFSDSEIMRVTGHASSELVYAYDKGSRADNATKLINLV
I
>pc0753 conserved hypothetical protein
MNGEKKLLFVSCASALEPLLLEELQELGLTDLQTGYRGVFINQWNWADIY
KINYASRLATRVLLPLSRFRCFDRKSLYRHIYDIDWSLYLKEGNTFAIDA
NVHHRELRNSLFAAQVVKDAICDQLRHKVGRRPSVDVQQPHVQLNLYIQH
SLAIISFDTSGTPLHKRGYRQETVEAPLQETLAAAILRLAKYSADKVFLD
PCCGSGTLLIEAALMASQTPPGYLRQKWGFMNHPDYQANEWLKVRNRLDE
HRKTIQPGHLFGIDINKSAVWATKTNLKAAGFGQAVEVLQADFREFSPTV
PPDLIVTNPPHGKRLEEEDQLRPFYRSLGDFMKKKTARPAQGFVFTGNLE
LAKEVGLAASKRHVLNNGGIDSRLLAYELY
>pc0645 conserved hypothetical protein
MFNTWLEKILIPELKTGQLFIMDHATFHKSKKTKYLIEQAGCKILFLPSY
SPDLNPIEVFWANFKQLVRLSLNKLSSLAKAIDYFFCQICT
>pc1195 conserved hypothetical protein
MLKCATFLRSSMEHLMEAHRRHDISDRVWNLLGPHLPGRRGAWGGIARDN
RTFINAVFWILRTGAPWRDLPPDYGC
>pc0593 unknown protein
MNSNLPLSSSYSQIDKMAQTLESRGIKVNIDKESNKGIIDANGRKFAVSL
INVNSEHPLDADTMTQIATRVAYMIFAKNLISEEFQGAKIDQQGIQINDK
NLTHEEANTKELYQDIQSIMQNKLSKQNADIAEAQIGVNTNTKQPIQKEF
NPPLHPYLSQFTSDQLDAINKYGANKVMVGGQFSQSKLDALQQAEVKAVA
KGKVKPVKKERVTRKNGFIEAKNGFIEAVKTKVKTTKKDKSKLQTISNQK
LQEKLTKIQFTLSDYAKNLLLLEQAREDLDKMLNHGASKGEIDATKATIS
SKEKISKEQLKELQSAKNELASFKLEKNKPLLNEIRRIIHDMQNLLNASN
TKTASHAFLEKYKTKQEVQQGIGNAYTAAWSEKYAFRNPENPGSLINGHN
NLIARDPANKNSYENLVSILGEVHQALQEASTTFGPLFIREAGLMNASHK
IKPDTAKTLAISAAQKKLFDKLEELKQKAKSLTFETNSQNELQGVGNFGE
YSKLTLDITLSKIQKELQEFDALPLPEAKT
>pc1374 conserved hypothetical protein
MLNFRKLKHDFSPSVIKEGKTLQDKGMVVSVKILNLKPDVVRLSCRVMGS
FDNSYESELEIDRNESVIIDSDCDCTYKYDCQHLAAVLFYLEAHFNEILV
AYSKETDLEKDVSVDDQEKENLRETFKEAETKEHARQGKKFQKELLAEYI
NASQVLGQSSFFLPEEEIIQDKAELAVIFLNPQKMTEQVEIQLALRLPFR
SKALNISQIKLFIDAIRYNEALYIGNKRYFFSLSSFDEASSEVLKLIIDF
ARFIDKGDKQQRSAFIDTEAFGTLLAVSYGIAESKFALAGSLNDLETELY
PMPCMYRGTLEEPLRLAISPALLRFELNYLEVNAPKVLLKPKIVLQNEAV
IDCDEAILFECAKPGMIHGNTYYRFQPLIKRKHLRNLPSIRDMTIPEPLF
GTFVENSMTELSRFAEIANKEMIERFVTLPFVEKVAAECDIQYLDGELEA
SLNFVYGGVKVPAASSQLKVSHISTFVTPEGILARNLTEEQKIIDLLFQD
FVYDPSQGLYSAKNDKKIVEFMTEVIPAHQDQVKFNCPENLLDQFIYDNS
VFHLNLKESNRIDMYEVEVKVDGYLNNVTVDLLWDCLSSKRAFIELSVKK
GSKRKSKTEEKGTYKILILDLEKLAPVVQIFDEMGINRLDEHKELRPLWS
LASLDIEQFANLPIHFSMSDKLKEIQQQMLGNLPCPSREIPKSIKASLRN
YQIDGIHWLNRLRGMHLNGILADDMGLGKTLQAIITLTQYKMDHPKQPSI
VVCPTSLVYNWQEEITKFNPKLKVLPVDGNPSQRKKLLNDLDYYDVIITS
YTLLQKDIEFYKTVPFGYIILDEAQHIKNRGTRNAQSVKMIQAAHRLILT
GTPIENSLEELWSLFDFLMPGLLSSYDRFVEKYIRQSTISQGGKNLDNLR
RKVAPFILRRMKKDVLDDLPPVSEIVYHCHLSNIQQELYRSYAASAREEL
SQLVKKEGFERVQIHVLATLTRLKQICCHPAIFAKDRPENGDSSKYEMLL
ELLQTLMESKHKTVIFSQYTRMLNIMREDLEKQGIRFEYLDGSSKNRLSI
VKKFNEDPNIPIFLVSLKAGGSGLNLVGADTVIHYDMWWNPAVENQATDR
VHRLGQKNSVSSYKLITLNTIEEKILELHNRKKGLVKEVVSRDEDMMAKL
TWEEVLELLQT
>pc0902 conserved hypothetical protein
MDAHGLPIRVIITEGTTADCTQASNLIAGLTAEWLLADKGYDSDAIVEQA
ISQGMQVVIPPRKNRITGREYDKDLYKLRHLVENAFLHLKRWRGIATRYA
KNTASFLAAVHIRCIAIWAEVS
>pc1200 conserved hypothetical protein
MPHAIHITTANVTDRKRALEACLLNKSVLSEVKNILADRGYSGEPFSNGI
HEIWGCTVEITKRNELHAFKVIAKRWIVERSFSWLEKCRRLWKNCERKLN
TSLNLVILAFVVLLLKRF
>pc1651 conserved hypothetical protein
MIGGLDRLSLIKRMPESIRVDNDPEYTSKMGQRKRLELNCIPPGKPIKDG
NIESFNGKIRQKCLNQNLFLDLQEAQEIIEAWRVEYNKERPHSLLEYSTQ
QNSLANTFLNKK
>pc1426 conserved hypothetical protein
MGLRDICKVIKCGKKKVFKGHHTLLGVSVQIAASRNYQGELLIVLTNVCP
YKALKMYKKRWAIETLFGYLKTKGFCFEDTHMTDLKKIDAWMLVLTLAVV
WTIKTNEIIQSKTNQASHGRKRKSIFRTCFEGIRKCLLCLELYMNEILHY
IRLLRKKNSILNRL
>pc1203 conserved hypothetical protein (chlamydia plasmid)
MTLMPTVIEPSIGFSLETYEQAKAFQTNVIWNKLDEITLEEALSHWLSTL
SHRTQINYRSGIRKLIEFGLLNPLMSLQVFALTNHEAVIDRIKLIQDWAE
ASRQSRAACYISFTGFLQRRLQGIVKKALPNKEGSSKTFFKIGEKVKTPA
MTQAQWITFF
>pc1833 conserved hypothetical protein
MELKKYLSKRNFNETTEPHEKTKEHSSQSLLFVVQMHNASHLHYDFRLEL
DGVLKSWAIPKGPSLNPNDKRLAIQVEDHPYSYHNFEGTIPKGNYGAGEV
IVWDKGNYSALGAKSQKESEQFIRQGLKKGHLKFVLNGHKLKGEFSLIRF
QGDDKQWLLIKKSDVYASQVSILEKNESVLSQRIISLDPKKTGKNPKKTR
NSILIQKEIQKTTMPQIIKPMLATLVDKPFDHPDWLFEIKWDGYRALAQI
HNQSVFLWSRNHLSFNSRFDPIVKALNEMTVDAYLDGEIVVLNENGQPSF
QLVQNYLKNQEGFLVYYVFDLLYLKNNDLRELTLLQRKELLKQILPKNSR
IRFCEHLIQEGKAFFKVASQAGFEGIVAKRIDSTYQSTRSKKWLKIKTHQ
RQEAIICGFTTPRGSREHFGSLLLGVYKDNELLYVGHTGSGFDQKSLTYV
RDLLKPQETCPFSFPPKLHQPTTWVKPELVCEIQFAEWTKEKIMRQAIFI
DLREDKKKQEVVLEEEVKVKKILQETSPISKQQKIKPSIHTELSFTHLDK
IYWPQEGYTKGDLLEYYRSISPLILPYLKDRPETLHRYPNGIGQPGFYQK
DLLHAPNWVQIETISHEEREVHYIIINDEQSLLYVINLGCIELNPFNVRR
QSLHYPDYLILDLDPEGISFDYVIEVAQGIHHILDPLDIPHVCKTSGATG
LHIYIPMGTRYTFEETTQFGKLIAHLAHEKMPDLTSLERNPKNRQNKVYL
DYLQNNFGQTVVAPYSVRPKPEAPISTPLSWKEVKVGLRPTDFTIKNCLK
RFQKVGDLFKPILGKGINLEKILKQLDD
>pc0737 conserved hypothetical protein
MDVTELYCTIDDFWKSFKQEWEKHLIDSGKHKKGPESVLSPAEMMTIIVL
FHQSNYRTFKHFYNYINFYLRNEFPKLISYDRFVYLKKNMFVPLFAYLMH
RKGKVTGIAFIDSTSIAVCHNKRISRNKVFAGLAKRGKNTSGWFYGFKLH
IINNDSGEILAFQLTPGNVSDVSMAETLSKGLFGKLFGDKGYISGKLTES
LLEQGLELFTSVRANMKQKLMTFNDKILLRKRSLIETVNDQLKNISQIEH
TRHRNIGNFLVNMLGGLAAYSHQRKKPSLNFREEKFCVAIAA
>pc1009 unknown protein
MNSADFYNPSLVASTSSPIEGIQKSSKQIKKSTEKTIEEATSKLMPQPTE
EGTKLTPLVKQSTKFSKGRFLCSYSKKPDLRASSIEKNTLQSRIRIELNK
KIEKKFNKKTVKSWINAYPQSTSEMIVKLPHEGLSESISIRHKDILCEQS
QAYQEIKVQLDEKKMQLNILHQRLNNINKKSYNDKLKELEGLKRLNLDIE
AINKFLPIFEQFAERCQKIDLEKLTSEEIDLLKKEHGELKEAYKKFEKIV
QGIIQKVNKCLPKGNKFQFKNKHLIKNMGAVLDSIDNILFVREANKLNEF
IDNFKESKKSIEQDLLPYTHQLNQVKKEVDETCPSYIKSFLEIKKGNSKQ
YSEFIDAIQLTFELHNDPVDPVVHMEVWQTLLEVFNFIQTHELFKLTGEI
KEELCRKKDEEIITDRDYGPLDTYIESYLKPLLALPAGLTAKVPAPVFEE
KFKTLLALLPDSNNTMTVQQAKTKLTLFNQAKEDLDNSFKVYRNLLNENI
AQTKKGLNQETRIKKEIDELSHQLKELKEKKTVILDNFFSEIIKNEDEKI
SDLLQKGIQQTQDFVDIFLGHYLVHSQERFPKLLENHRDFALRVFDMFEL
LKDHLSEEQLDKIKLVLNEFLTHHITNQTSEIEESLETSLNQSKKSLEKV
TKPAKPLYRKVQAAHESGDAFSIECQRISKQVEVLLPWLFGKGFVASPQA
AHLVPFPGVVSWDANYLSTFFNDKLGLELSQEKTDRLDLFNQNVEPFLST
VQVNGKIPQELVKEELQARFKVIEEQYKTFHSIFNALIFLSHLSSLEMSE
TRHLPEFFNQTMDKFSETAINNEKGGARGYKVLLGEALIDLIVSPDETLF
NLKTGLSDKHVEYLQATINTVSDRLEQLAFKKTQSGKLAPLELVECHALQ
SIYLGVKNLCDQKELPTDILQNEEQIIEKTKVILSN
>pc1281 conserved hypothetical protein
MANDLDNSADDNYKVYKKRWRIEKYFKSIKQNASLEKSSTKVIRSQKHLI
FASIIAYCKLKCFDLKLHLVISR
>pc1859 conserved hypothetical protein
MLSDSFMYIITGLYRHKRLVTPKDDLTRPTASRLREALFNICQNFIEEAA
FLDLFAGSGAIGFEALSRGAKSATFIDSSKEALKCQQKNASLLGVEQQCQ
LLYGEVFTLLEYLKKQQKRFNIIFADPPYAKQVYANEPSYSEKIIRCIDT
SDLLAEKGTLFIEEDSRFSPQLNDLKKLQLINSRKIGHSSLQRYSFIN
>pc1001 conserved hypothetical protein
MTNCKLITSVERRRRWSLEEKKQIIEKTYQEGQSVSQIARRYDITPSQLF
AWRRQMEQGALQGISSREELVPKSQVKEMEKRIRELERMLGKKTFENEIL
KEAVRLGQEKKLILRQPLPSLNVLA
>pc1523 unknown protein
MVPYYILVYECINEFEKRKTRFFLTHVYLVFVKKCGTKSFSKPVLKELKL
IFYKYLPCFETPIGHKFEAKMTMFVFSLTIHLK
>pc0646 conserved hypothetical protein
MAYSKNLRQKAFNYLETGHSAEEVRQVFGIALRTVFNWLKRQRNGCLEDK
PRKRHPIKIDNDQLKSDIKKYSDNYLKEIAKEFKVDPSSIFYACKRLKIT
LKKRPYFTKKEMRKTVRSLKKN
>pc1985 conserved hypothetical protein
MNNSIPDRSFVNQQIDVISQSIVKGQTLGMVEHEGRQFVNLSKEDKSTPN
TETERIVYLEVAHFISNNKQILQFSEVKNLKSSIDKRMKHIEEQTTGLKG
LIKSIFNNKEYAKLITESQDLKALKNIIKNVAKEMQQFADTNSSDQKTSH
LASPYADVKASHLTSDIKAGDPPPSEDPTPLLNTDIPTAPPVLNTDIPPA
PPPPPGNIPPPPPPPGMGVPPPPPGGGLAQPKVAVPKLSPQESHNIGQER
RLDRLLKERANPTSLFKFTPPSNANEIKGELKALESIARELRATMPEYAK
KLDLEIEKKYKELEGTAAAVPALNLQNPDVPAYNPDFIQHAKKLTNHEIK
FVLGQYFGGKVPPEDDAVLYPRYQANKALLDDIFANWATISSGKMAEEFG
KHSDQWNSFIRLKGVNGFVVLLNHRLNGKHGNKKYMGDNGVEPQYKPDPF
DPNKKAAAKEAAAPQQPQGIDLEGIRRAKLRSTPPKQATAPESNEIAQQM
GRLKKAETNDKSQFKANEGETFNVNRLKPKDSDE
>pc0647 unknown protein
MYKNTTYKEKFTLLKELLPNVIDSVKKDLKNEHLKKDFYFVKKFLGTKNL
NKLTTEELTEAYQKAIDDEEKGEELAEFVTSRWLLKNSELYEFFESRLTE
ISPNFTDLEELSISQAQPLVDNAVSQFGALKTYLFAVLNSVVFPKEIFQK
LEQLSQKQDVQEKEQAQLNLEKLNADTMRKTFTAEMARVTDKYEKKLAGM
QKKYIVDMESLKKQISQLQKKLQGKEA
>pc0987 conserved hypothetical protein
MKKRGFKINHEKLFRLYQEMGLKVRKRGARRRGVGIRLARIKASQINKVW
SLDFMSDRLANGKKIRLLNIVDEFTRESLKMIVDTSLSGLRVVRELEELI
KYRGYPRQIIS
>pc0528 conserved hypothetical protein
MMEVSRSNLIEQLKEHLPHQPVFYSKAENEQVLALIKEVVKDRPTDGYRR
VHAIVNSLLKEKKLKVINHKRVFRLMRQHHLLLQRPNRRPKRLHTGKVET
LYSNTRWCSDSFSIQCLNGDRVHVAFSLDTCDREVMRYIASTIGIDGQMI
RDLMLETIEYRFEQPKARVPLEWLSDNGSCYTAKETVNFGRMLGLTIRTT
PPYSPESNGMAEAFVKTFKRDYVYFGNLASAEAVLQQLPI
>pc0823 conserved hypothetical protein
MSRIGLAQSDERKIIAMPLITVHTEKKSEQTVIKLLETISQLCETQKCEI
EEIVIGLPLMMSGRTGFLADEVKHFAQLLQQLTPIPIRLWDERLTTVQAE
RSLRESQLTRKKRSKVVDIVSASIILQSYLDSRC
>pc1006 unknown protein
MSNPSDFNPSSLNNGSSSSEYSTSLINDPLSSDTTSSTREVQTNTKEIQT
VTEGITSEIFSEFTHSKDETQKSPCLTEQTVKSFVKGKFLCAYNKKPNLR
ASELEISRSFQGEIRARLNDQIHQTFSKKIVKLWIKTCHENISQASVKLI
RLCQTAPITINYNDTIKQQIQRYQDTQKEIEETKIELNVLNRKLTNIDKK
SYSDNLKELEALEKIQKNIAKINDFLSKLEQLVEKYQKCNLETLDPSELN
ALKEELSYLKEFHFSQLKKEVSDTITEINNYHRLQNNRNKFQLTDNQLNI
KTKRVLDNLEKIFSGETPKDVARQIEECNRCIIATKKDFSPYTEKLQQIK
EETTIDCRPTYEKLLQKIRDENSNDLYPEFIAEIKKGLKSLDPVIRKDAQ
QTLLSSFDIFEKETLKLTRNIQNGLPKDENEIIPEKDYDVLQTHIKYLKE
ILELTQLTSSDAKLPQFEGHFKGLFALIPDKTITVKEANAKLNLFNQADE
SLARLVEPYKRVVKKAYSESKQELEKQKPIIQENIKILLQQLKEKKADKK
QILNDFIEELNKIQSINFSDLIISDVEQIQDFVDIFLGHYLEHSEERFPK
VLDSHRDFALRVSNMFEIVKENLSDQQLEELQSVLKDFLSQHITNQKTML
EEGSVETRTDHRERALEKTSESEKPLYRKVQAMHETEDEFSVECQMVGKK
VESLLPWLFGKGCFVSPQAAHLAPFPGIVSWDLNYLTSLFNHKFGLKLPT
IEKNDQAELFNEDVAGFIKTIQSEGKVDNGILEKELIQRYADSKEEKQDT
LHFIFNALVFLSRISSLEMSETRHLPEFFNQEMDKVSETLIKGGEQKDRG
YKLLLGEAFIDLLAFSKESLLDPQTALSEKHIEYLQATVNAVSERLEQLA
SKKQKTGKLTPLEFVECHALHSIYLGVKNLCDQKKLPTDILQNEEQIIEK
TKVILSY
>pc1930 conserved hypothetical protein
MITYSNSIMERLLEHIGGRKGHVFITRFGKPVMINQVAVTFAKAGKEAGI
PFKITPHVLRASAVTYLKQQGFQDSDIMRVTGHASSEMVYAYDKSARSDN
ASKKVNLIP
>pc1051 unknown protein
MILNFSTQINAMKSKVYFFNVKDNQAKIHLICSKAKESFEQEKRLQILVP
TIEAGQYIDSLLWRYPEDSFLTHTLTTNLSPEWIVITTEETVNLNLAARL
LNLCPHPIKYFSLFAEIYELYDESHPQKLENSKLRFKNYQDWGLALSLLK
>pc1402 conserved hypothetical protein
MLKCATLLRSSMEHLMEANRRHDRSDRVWNLLEPHLPGKRGAWGGIARDN
RIFINAVFWILRTKAPWRDLPPDYGGWSNTHRRFIRWRNQRVWERLLEVL
IDDPDYEWLVIDASHCKVHPHATGAKGGNQSMGRTKGGSIQNCILPWMRM
VCRSGSLL
>pc1917 conserved hypothetical protein
MDKALTSKSVALIIKRNKHLEKQKHSFSGHSLRAGFATTAAIFGVPEHLI
MNQTGHKSSDTIRRYIRLGNMWMENAATKIGL
>pc1215 conserved hypothetical protein
MHLAVDAHGLPIRVIITEGTTADCTQASNLIAGLTAERLLADKGYDSDAI
VEQAISQGMQVVIPPRKNRITGREYDKDLYKLRHLVENAFLHLKRWRGIA
TRYAKNTASFLAAVHIRCIAIWAEVS
>pc0986 conserved hypothetical protein
MKKRFTEEQNIKILKEVDSVIPLAEVCRKHGVSTASYYKWKAKFSGMNVS
EAQRLRSLESEITKLKRLVTDQALDIVALKDVLSKK
>pc1963 conserved hypothetical protein
MMEVSRSNLIEQLKKHLPHQPIFYSKAENEQVLALIKEVVKNRPTYGYRR
VHAIVNSLLKEKKLKVINHKRVFRLMRQHHLLLQRPNRRPKRLHTGKVET
LYSNTRWCSDSFSIQCLNGDRVHVAFSLDTCDREVMRYIASTIGIDGQMI
RDLMLETIEYRFEQPKARVPLEWLSDNGSCYTAKETVNFGRMLGLTIRTT
PPYSPESNGMAEAFVKTFKRDYVYFGNLASAEAVLQQLPIWIEDYNVKAP
HKALNMLSPREYLRKLKMAG
>pc1699 conserved hypothetical protein
MIKKVLPLAEQLRPKNLNDIVGQDHILGENGLITKTIESQIPLSVILWGP
PGCGKTSIARLYAQAFNMQFISMSAIFSGVADLKKTIKEAQNQPLFHKGT
LLFVDEIHRFNKSQQDAFLPFVENGTIILIGATTENPSFYLNGALLSRLR
VLPIYPLDGFSLEQLLERYEKQFAPLPLTAEARHWLITCAQGDGRYLYNL
IENLRYASKQILDIPLLEKIFQKRSPLFDKRGDQHYNLISALHKSVRGSD
PNAAIYWFTRMLEGGEEPLFLARRLIRMAVEDIGLSDPQALPLAIAAKDA
YEMLGSPEGELALAEVVIYLALAPKSNAVYRAFGMAKESASKTSYLNPPL
TILNAPTKMMKNLGYGKDYQYDPDLPEAFSGQNYFPDSLEKQHFYEPVER
GFERELKKRLEYFEQLRLKKKL
>pc0043 unknown protein
MINNTTLQSLTEGAYRIHSCLKDGQFDHAQATQEADNLYQEGVQLVIAEV
NSNPIFKDVVSPVVCRLNEIVSLEDTQHLASFHRSLSKVYRLFIEITWYQ
CLRQGSLPTWNKTRDSIITNSRSIHSILPEKEIGTRFEYRCAEQAAKCLT
VVKSIWKKYPNHILNIGESAEGSSFFGVIKGFQELNKDVKKDWLQAWYPY
IHELRWLSANIKTQKDFKNIIGTRLKDFQDKGKKYTVCLALTFVDLIKNP
GVTENVRKLASEQLANLFLLRDQDRLSTLTERALGKFPNVKLLQKTVKNE
DRYWKTRSLIMQSLEKLAEDSAYKEYIRDSIKSLREVRTHSIHAEEKEEI
QKSLKILEEDKEEFQKAIEQDESSLAAKKGKKQRGEDDIEELEAKLKNDI
EEKGNIERDLEAMYLVEKALEELHDEEEEYENRLEAIWNSYS
>pc1835 ada, putative methylated-DNA-[protein]-cysteine S-methyltransferase
MHNKHVEQIFFSIGNSSFGQVIVAQSQVGLCAVILGENPAELQLLLQARF
PQAHLIHDDYKTKNILSQIIELMENPLKKIDFTLDERGTLFQRSVWKALR
EIPIGTTSSYAEIAKKISSPKAVRAVGGACAANPLALVTPCHRVIRKDGN
LSGYRWGIERKLQYLQLESKLKK
>pc1834 alkA, putative DNA-3-methyladenine glycosidase II
MYFKAYLSRDARFDGIFYVGVLSTGIYCRCICPARRPKESNCRFFKSTGE
AEKEFFRPCLRCRPELAPGQSPVDDAHRIANLLISSMQEGLFDELGLEDI
ALKFNLSSRQIRRVIQKEFGVSPIQLLLTRRLLLAKQLLTDTDLSVIDIA
FASGFSSLRRFNDAFKKHYRMPPNQLKKEGQRKKTFFPSAYITLQLNYRP
PYDWIGFLNFLSIRSLKGIELVKNNCYLRTVQIREYKGWIHVSHVEDKHC
LRVKIASSLVPVLAILLERIRNFFDLNARPDKISVQLEQDPFLAEEVAKN
PGLRVPGTFDGFELAFRAILGQQITVKAATTLASRFVKAFGEEFKTPFAE
LHYLCPSSQRISSLKWEEIATIGIIRARAQTIIELAKQMSSNTLKLEAGV
NLRLTIKQLTSIAGIGQWTAHYIALRALQWPDAFPKEDVALRKKLGKVTA
KQAEKLSQVWRPWRSYATLYLWQKKD
>pc0503 alkA, putative DNA-3-methyladenine glycosylase II
MTQKFESSFEENGHIIYSFPETCVIMKCTIKELMALGFSQHKSGTLILIA
STIVNEKTFCDLDKLSNEEIIKLLCGIKGIGRWSAEYTLLRGLGKTEILP
GDDVAINKSVINLLKLRKNQILTGLKKLKRNGILMQD
>pc0286 alkB, probable alkylated DNA repair protein
MNTYVFFMIMKEDLFENQRKDMILGQGAILFAGLAKKIDKSLLSSVQEIT
QLAPFRHMKTSGGFDLSVAMTNCGLLGWVTDEAGYRYQSFDPLSGLVWPK
IPPLFLELALEAAERAGYSSFVPSACLINRYVPGAKMSLHQDKDEDDLDS
PIVSVSLGLPATFQFGGFNRTDPLQKLLLIHGDVVVWGGKLRLAYHGILP
LKSGHHHLTGSTRINLTFRKVF
>pc1559 deaD, putative ATP-dependent RNA helicase
MTQDSIIEQDLAFEQFGLKAPILQALQEAGFKIASPIQKQAIPVVLAGHD
VVAQAHTGTGKTAAFGLPALHLIHDNPGSQLLVLTPTRELASQVSDELFR
LGRHLGIRTATICGGKSFRPQIEALQRGVQVIVATPGRLQDLLESDSLPD
FRPAIVVLDEADEMLDMGFLEAIQRIFTFLPAKRQTLLFSATMPSAIQKL
AHQILKKPIFISVTQKETTNKDIKQVYYVIREDERDDAILRLLDSEEPAK
SIIFCRTKKDVDRLSTTLVANGYHARGLHGDMEQPQREEVIRHFRSEQIR
VLVATDVAARGLSVSDVSHVFNYHLPFDPASYVHRIGRTGRAGNKGVAST
FVTLREWREFQRYEKVTGAPINREIIPTLEDVKKLKRQKLVSRIQNQPLH
QETELVLELMKEVDHSTLVSKFISFVLEQETIQGPDRIGVEPRGQERDTR
GQRTDKFNDERRRANRPQQKFGKANGFKKEHDKGFKKTFGQKNRASHPSK
VPSSAAGFKERTRSI
>pc1265 deaD, putative ATP-dependent RNA helicase
MQEQIDVELLPQEPNGFITFNLDPLILKALDKMNFKEPSRIQTEAIPLIQ
KKQDLIALSQTGSGKTATCAIPICNRVNTELTDIQALIIVPTRELALQYA
TETQKIGKYKGVKAFAIFGGEDSALQQSKLKHGVQVLVATPGRLIDFIYS
RQIDLSHVETLILDEADEMLSMGFYDDLVFIIQCLNHSHQTLLFSATMPA
AIQRLAKHHMKDPQEVNLILEQASPHLLEHCFVYCLAHQRDHELIQLIKE
NNPTQAIIFCQSRFQVEKVCRTLQSHLDGVDFLHAGLNQDIRTIVTNKFR
TGKIRLLVATDIVARGLDFSKVSHVFIYQLSHESDVYVHRSGRTGRYGKT
GVVISLVTSRELPYLNAILKQIKQEPRWIGCPPPEKQEAAKPRKRRPYPN
KKSSKPH
>pc0176 dinG, putative ATP-dependent DNA helicase dinG
MSHSQLQSRGLQSEKILSLLKPDGLLANSLKGFEFRPQQQQMMTNIIEAY
NNDSIALIEAGTGIGKSLAYLIPALIWAARFNERTVISTNTITLQEQLLS
KDIPNLLDALDLNLKAVLVKGMHNYLCIRKLEDVQMEMSIVSSEEAQEIE
KIEAWRQQTVDGSRSSLSFAPTHSVWEKVGAENEACSHHECPHYQQCFFF
KARRQAQDAHILIVNHHLLFADLMRRADTANYSETSILPTYRRIILDEAH
HVEDIATEYFASHLHRIELMRTMGRLGSERHSQQPGKLPILKEKLQLLYN
KTPPREISQIVMRLTIDLPALRHVIHEQINQTFDAFAHFIEAIKNPASRL
LGEEVSLNEQKLRILNEHMNHTKWKEEIHPSASQLIDSLKNYRLNITNLE
AELKLIENERLQEQTKSIRLDIQGLANRLETSISLLNHFILPPSSPNKVR
WIEAHKLKSLINVHLVDADLDISKSLAEFVFSKFPTVILCSATLTSNQQF
QFIRKRLGLTDKHLPYRQIEEYIYDSPFDYHKQALLAVPTDMPPPSHPDF
NWIAFENIWKAIQASRGQAFVLFTSYSMLQQCAEKLSARMHEHAYVLFKQ
GEEARQTLLHKFKTTDRAILFGTDSFWEGVDVAGDALRCVIIVKLPFRVP
TEPLIQARTEAIIEKGGEPFFEYSVPQAVVKFKQGFGRLIRNQWDRGCIV
CLDTRLVTKGYGKQFLNSLPACEKVFINSEQLWAKMGDFYRKTYHLVKQN
PFS
>pc1820 dinP, probable DNA polymerase IV
MTLRKIIHIDMDAFYASVEMRDDPSLVLKPIAVGGDPDKRGVIATANYLA
RKFGVRSAMPSWKAKQLCPDLIILFPDFDKYKRESKAIHEIFHLFTDLIE
PLSLDEAFLDVTDVDALRGSATWIAQEIRQLIWKERGLTASAGVAPNKFL
AKVASDWHKPNGQFVLTPKEVDAFMVHLPVEKIFGIGHVMAKKLHSLGLM
NCGDLQTLDITTLQKLFGSRAWNLYELCRGIDHRFVISDRIRKSLSVEST
FLEDLNNLELCYQEIPNLIERLMIRYEKISNQYYKKKPFIKIKFADFTTT
TVENTFFKAFDLETYQTLIRIGWERKKAPVRLLGLGMSLSLEEEIQLTLF
>pc1082 dnaA, putative chromosomal replication initiator protein, dnaA
MQAWEEFLKAQEVELGLETVQKWLRTLKIQRFDACNLYLEAKDSFQALWF
EEHIRNKAQQKFINGNNKRIKIHLSVANTPQRAKKTKTANKEKDFKAPFE
LTFDELDPLCLFPYFISTEENLLSHQLLLEIAGLSPQIHSTQLGTFNPIY
LYGSGGSGKTHLLMSLAHALKAQGLKVIYVRAETFTDHVVTAIRAGEMSV
FRQAYRNIDVLLVDDVHVFSRKGATQEEFFHTFNTLHLEGKQIILASECS
PQDLQLIEPRLVSRFEWGIVLPLKPLRPGEMRNLLIAKAKALHFELPLKI
ADYLIETFKSNAKALIKGLEALVLRLHLDAKHSITALSVTATKALLIDLI
EEEQKTAITPQKIIQAVAEQYGIRTEDILGKAQTRECALPRQLAMHLCRE
QLKMPFMKIGDLFSRDHSTVMSSVKSIQKSLEQDDREISGICHIILKKLQ
G
>pc0307 dnaA, putative replication initiation protein dnaA
METLFITFLRNKNMLTSETQNVWTQFLQFVKTRCSPAAFGNWLAPIRVID
CSTEEVTLEIPNIFVQEYLLSNYKKDLCAFLPVDMSGEPAIRFIIAPPQK
KIIPPNHFSISSSQKEEQSPNSDVKLNNNYRFENFIEGPTNQFVKSAAMG
VALRPGQSYNPLFIHGGVGLGKTHILHSIGHYIKENHKKLRVQCITTEAF
INDLVDSLRNKSVDRMKKFYRSEIDVLLVDDIQFLQNRLNFEEELSYTFE
ALKNKGAQIVITSDKPPSLLKLSERTIGKMEGGLVAHMGIPELETRVAIL
QYKAEQKGLHIPHKVAFFIAEHIHNNVRQLEGAINRLSAHCRLLDLNITE
ELVSRTLREMLQQAPREKISVEQILKSVAAVFQVRVSDLRGSTRTKDIAL
PRQVAMYLAKEMINESLIMLGASFGKTHSTILHACKNIEKKVASDETLRR
QIGMVRRNIES
>pc1810 dnaB, putative replicative DNA helicase
MTEANVKVKIAPHSKESEMMVIGCMLTSINSLNIASDSLDDSDFYFNEHK
IIFQILKTAYKKDKPADIHLVAEELKRVEKLSAVGGVSYLATLAQYAGTS
AFIEEYVELVKNKSILRRMIHAAQIIEKSALEESQDVQVALDEAQQLFFQ
IGQTSNPTSGLILQDIFSGLKSESGLPYLKELQEKQERYAQRGPEDSGIS
GIPSHFIDLDKMINGLNNSNLMILAARPAMGKTSFAINIAENVCFKNKIP
VGIFSLEMSAEQLVHRIVCSQAEVQSDKIKTGALDGVEFQRIVSCVNDMQ
NHVMIIDDQAGLKITDLRARARRMKESHGIGLLIIDYLQLLSGSGSNRTS
ENRQNEISEISRMLKNLARELNIPIICLSQLSRKVEERPGHRPMMSDLRE
SGSIEQDSDIVMFLLRREYYDPNDKPGMAELIVAKNRHGSVGSVNLTFRK
EFAQFANYSPVRYDPSQIDSETEQAFKHFSP
>pc0389 dnaE, putative DNA polymerase III, alpha chain
MISSPFVHLRTHSQYSILDASASISDLSQRAFQEGMSSIALTDHGNLFGI
VDFYKACKEVKVKSIIGCELYVAPGSRLEKTKVYGQRAAYHLTLLAQNNR
GYQNLAKLSSSGYIEGFYYYPRVDHDLLRKHSEGLICLSGSLGTLLAHEI
LQGNVKSIQDHLLWYQEVFKDRFYLDLQRHEMAAEDIQQDGLYQESWLVQ
QYQDYFNRQQKVNEALIALSREHHIPLVATNDVHYIDREDWRAHEILLNI
QSGEPCEIWEKDAYGTPKFRIPNPKRQTYPSHEYYFKSSQQMEQLFKDVP
EAIINTQKIAEQCLVEIDFKTKHYPVYLPPSLENRPFEKDEQKKEVENYL
WKLCEEGISNRYTIERLAKVQEIYPDRNPLDVVRERLNYEMSIIVPKGMS
DYLLIVWDFINWAKRNGIPMGPGRGSGAGSIVLYLIGITDIEPLRFHLFF
ERFINPERISYPDIDVDICMDRRGEVIAYTLQKYGKDNVAQIITFGTMKA
KMALKDVGRVLSVPLSKVNEIAKLVPEDLNITLDKALEKDQDLRQLYEND
EEVGRLIDLAKKLEGSIRNTGIHAAGIIISGVPLTNLIPICNSKDSDIPV
TQFSMKPVEAVGMLKVDFLGLKTLTAIQICVNAVKASTGKEIDWINLPLD
DKPTFDLLNQGKTLGIFQLESGGMQDLARQLHLDRFEEIIAVGALYRPGP
MDMIPSFINRKHGREAIENDHPWMKDILAETYGIMVYQEQVMQIASKLAN
FSLGEGDVLRRAMGKKDMDQMAKQREKFRLGALENQIDNQTSMLIFDKME
KFAAYGFNKSHAAAYGYLSYVTAYLKANYPGEWMASLMTCDRDDLSKVAK
FIRECQSMNIPMLPPDINEAGEIFQATKQGIRFAMTGIKGVGAGVVEAIV
QERQKRGPFKNFYEFFKRIDTKKVGKKVVESLVEAGSFDFTGWARDALVM
SIDPMYESSSKEQKEQAMGFMSLFAKMDDEMTNQFRKPPEVKNKTSRQDL
LRKEKALLGFFLTGHPMDEYKDILQRLSCVPLRRLDQLNHDAVFRSAFIV
ESLQIRIASKSQKKFAILTISDGMERQELPIWPDLFEEKSHLLQENQLLY
AVLQIEKKDGEVKLSCRWLDDLTKANEEMIETCDRAYDKAKHQAVRFAQN
KNIATKQSEKPKAEKNIVKQNQEASSMKTVCIKLNADQARLSHILKIKKL
IQDHHGTTSVLIDFHNSTKSLATLHIDAKWGITLSEQFKQKICELPCVFE
IE
>pc0690 dnaG, putative DNA primase
MPIFNKESLENLRQRVDLVEVLSSHIELKRSGASYKGLCPFHDEKSPSFI
VQKGDSHYHCFGCGAHGDAIQFLMSHQKLSFAESVESLAQRFQVHLELVE
DREEKKGVTKAFLKLALETASQFFHYCLLYSEEGHEALNYLYNRGIDLDF
ICHFQVGLAPKTAGIFRKFMHAKGIKDDSLLEAGLLSVNKDGQVREFFND
RILFPIHHHSQGVIGFSGRKYKEETFGGKYINTPETSLFKKSRVLFGLNY
SRRRIAKERKAIIVEGQIDALRLIQMGFNLTVAGQGTAFGEGHVQELINL
GVNQVFLALDSDLAGQEATSKIGHLFQKEGIEVRIVQLPVGGDPDSFLRE
QGPEAFLELLKNSSDYLNFLIKHLSQDLNLDSPAAKNELVQKATKLIREW
DHPLMVHETLRKLAHLMKVPEEIIGVGKNHLPNIYIKKSASVGAQTIDPD
RILETDLLRWLLLLGQEQTKLVEIVRTNLVKEDFRVAICQKIYDIYRNNY
ENQRSCDLLSLAIDLDDAEGQLVLSDLLQKKVNKEKAEQLLIETVKKILD
RNWMHKREEIKIKVQSGHCSDDEVMELIKQFDELKRNPPIVK
>pc1705 dnaN, putative DNA polymerase III, beta chain
MEGKKILDTEQVISYLQSPNLSEIKRIEIMKFVISTQELNYLISKILNVV
AQKPTIPILSNFLIEAYNDELILTATDLTVGIHCHTEAKILEEGSTTLPA
KRLSQLVRELTAVNVEISTNTNEITTIIAGSSRFKLNGMSKTDYPSLPDL
SQSHTFEMKQSELKDLLYRTSFAVSKEDNRYVLTGVFIQIANGSITFIGT
DGKRLARAKGVIDNDPSFSGQAIIPIKAVDEILKNLTDEGEVKISLMADK
VAIEANQMRILTKLLSGDYPDVNRVIPEKSEIIVTLHREELSSLLRQISL
FTADHNHSVRFTFIPGELKLTANTMDIGEGNVSMPVNYDGPKLEIAFNPG
FFIDILRHCKGETVIMGLTDAYNPGIITDSAELANSLDASPLFVIMPMRL
SED
>pc1161 dnaQ, putative DNA polymerase III, epsilon chain, mutD
MIEIAAYDPVQNRRFEKFVHPGFPIPPESTAIHHITDEMVANAGSFADVG
AEFVEFCAGEVVLIAHNNDNFDLHFLRHEFERNQLILPTHWKFLDSLKWA
RRYRSDLPRHTLQFLREIYGITANNAHRALDDVIVLERVFRSMVDDLEIQ
DVFDLLNRPRAIQHMPFGKHQGQPLNKIPKNYISWLATTGAFDKPENQEL
KASFVKLGLLEMAESM
>pc0236 dnaQ_2, putative DNA polymerase III epsilon chain
MPDIEKNKFICIDCETTGLDPQQDRIIEVAVMCFDGNQVYAQMESLINPE
CPIPETSIAIHHITQDMVKDKPTINHVLPQILELISDHIIIGHGVGFDIE
ILAVAAERHGIPCKIRKNRFLDTLRMARLYGESPVNSLEYLRKHFNIPLE
GAHRAMSDVIVNKEVFKHLSKRYRTTEQLFEVLSKPILMNTMPLGKHKGR
LLKEIPLQYLQWVCNKDFDQDLLFSVRTELKRRKHGNQFNQSSNPFLKL
>pc0478 dnaX, probable DNA-directed DNA polymerase III subunits gamma/tau dnaX
MSEYQVIARKFRPQTFKEVFGQEAVVTTLKNAIKFKRLAQAYLFCGSRGT
GKTTLARIFAKAINCQNSTEDFEPCNQCTSCREITSGSSLDVLEIDGASH
RGIEDIRQINETVGYAATSGQYKVYIIDEVHMLTKEAFNALLKTLEEPPP
KVKFIFATTEAHKVLPTILSRCQRFNLSRIPLSQIMIKLKLIADQLEIDV
EEEALQLLAYKAEGGLRDAESLFDQIVAFSEGKINAATVQSILGLMPREA
YFELDLAGKEGNFVKAFEIAYRIFAEGKDLNHFIEGLIDHFRHILLIQLA
GITSPLLTISPKEKQFYERAAHLYTQEQCLDLIDYLIESAQQIRFTHSGK
IALEAILLHVIRSHFRLPIEVLVQRLGELEQMLGEASLVNSSVFPPLSKS
TPQSSLSTEVKNPPLTPPVPLTNNKPSQNLTTSPIEKNLNSSTATSLLSP
STNNCSLFDHFVSEDPTPTQSDLGRSTQKLPNKDSPSLVAKLNGDNPTPV
HQYDTLFQFAAIELEGKLQRKA
>pc1760 dnlJ, probable DNA ligase
MITQKDYEKLCHEIWHHNKLYYIEHQPIISDEEFDALLKKLEEIERSHPE
WITEFSPSQRVNESLTSGFKTVAHRTPMLSLANTYSKEEIEDFIKRLQKL
VGKRQVEFSVELKMDGIAITAIYEQGIFKRGITRGNGKRGDDITTNMRMI
ENLPLQLSGENLPDFLEIRGEVFMPRQVFLQLNEQKLQDGEVLWANPRNA
AAGSLKLLDPKMVAERRLAVVFYGLAEDSSASIKKQAEVPSFFRSIGLPA
LEHHAYCQNIEQIWKFAEEIRSLRTILPYDIDGIVIKLNDFKDQKRLGVT
GKSPRWAIAYKFAAEQAKTRIIDITVQIGRTGVLTPVAELEPIFLSGSTI
ARASLYNQEEVQRKDIRIGDLVTIEKGGDVIPKVLNVELSQRPLHSQPWQ
MPLYCPSCGTQVINIIGEVAVRCPNEDSCTEQQIRKLIYFVGKQAMDIKH
MGEKIVIQLFQKGFIHLPSDIFALTEGQISQLTNFKTKAIQNLMRSIEES
KHVSLERFIMALEIKYIGIGTAELLAARAGTIETLMQLNEEDLIKIEGVG
GKVAQAVVEHFQNPKHRQEVYRLLELGVCPQSKTVQIFTNHAFQGKIFVL
TGSLEHYTRQSAASLIKERGGKVSDSVSRKTNYVVAGAEPGSKLDKARTL
GIPVLNEKEFISLCH
>pc0072 dprA, putative protein required for chromosomal DNA transformation
MEELEALMILTDMPLIGPVKVRFLVDYFGSAKKALSASITELSHLPGFKQ
KILDQWQEHIRSKKHFANLQLVEKFHTHLISFKDPSYPKQLQNIPDHPPL
LYLKGELKPQDNQSITIIGTRQATLYGLEMAKKLSYELAQAGFTIVSGLA
RGIDTAAHIGALEAGGRTLAIIGSGLANIYPQENHYLADQIAKKGAVISE
FSMSTPPHRSHFPKRNRLVSGMSLGTLLIEAPQKSGAILTIENALEQKKH
IWALPGRADQVNFRGNHALIKNKKAILVENIEDIVQCLDTFCFTTPIEQK
HLDLVHLQQEEIHLLQKLPVEELSIEEIVKRAQLPIQQVNSLLMSLVLKK
IIKEFPGKFYKKI
>pc0351 gyrA, putative DNA gyrase (topoisomerase) chain A
MEDIKQLMQRHYIKYASYVILDRAIPNVIDGLKPVQRRILYTLWLMHDGK
LHKVANVAGQTMALHPHGDAPITEALINIANKGYLLDQQGNFGNLFTGDP
AAAARYIETRLTPLAKETLFNADLTSTIPSYDGRHQEPTCLPAKIPVVLL
QGADGIAVGMSTHIFPHNFLELLEAEIAILEGKPFSILPDFPTGGIMDAS
DYNKGKGKVRLRAKIEVRDAKSLVITEICYGTTTESLIRSIDEAAKKGKI
KIDAINDYTAEKVEIEIKLPRGQYAQDLLEALYAYTECQVTLHSQIVVIK
DNYPWETDVDSILRLHTEKLQEYLQRELELERDHLNEKIFEKTLEQIFIE
NRLYKRIEDLTSYEEVHVTIAASLIPFHSQLLRIPTEQDRERLLSIPIRR
ITRFDLAKNQEEILSHQEQLTRVEKDLKNIIKVAIRYLNSLIKKFASEHK
RKTEIQVIQQVDTRAMETRQITVCFDPTTGFIGTKVTSNYTIECTNFDKL
LVIFKDGTYQIINIPEKQYVHHKGNKVVYVGIADKKTIINVVYRDPETHY
VYAKRFIVEKFILDKYYRYLEEGTTLEFISTQPGVSLELQFIPKPRQTIS
KMQFQIDNIAVKGVTAKGIRISNREVKKVIIAK
>pc1074 gyrA, probable DNA gyrase subunit A
MSYTKDEVIVSRNVEDEMKDSYLRYSMSVIISRALPDARDGLKPSQRRIL
YAMRQLNLGPNGKHRKCAKISGDTSGDYHPHGEMVIYPTLVRMAQKWIMR
YNLVDGQGNFGSVDGDPPAAMRYTEARLTTAAVQLMDDLDKDTVEMVPNY
DETKKEPTVFPSKFPNLLCNGSSGIAVGMATNIPPHNLNELIKATLLLLE
NPTTSIDDIMKVMPGPDFPTGGMICGYRGIKEAFHTGRGKLILRGVIRVE
ENEDNPDRSRLAIDEIPYNVNKSRLIEHIAELINNKTITGISDLRDESDK
DGMRIVIELKRGEVPEVIINQLYKFSDLQITFGCNMLALDKGLPRTMNVK
QLISVWIEHRIDVVRRRTRFELNKAEARAHILEGYLKAIDHLDEVVRLIR
ASSNRDEARIELIKQFEFTERQANAILDLRLYQLTGLERDKINDEYQELL
KKIDYLRAVLASEAMVKEIIREELLDIQKHHKSERQTQIIAAETEVNMED
LIANEPVIITISQDDYIKRMPVNTFREQRRGGQGVTGMQLKREEDVIKGL
YVATTHDYLLIFTNLGRCYWLKVWQIPETGRKSKGKPLINLLEDIRPEEK
IATIQRVSSFEEEACILMATKRAVVKKSLLNEFSNPRRKGIWALDIDEGD
ELVAARLVKPEQQVMLFTHQGMAVRFEESNVRPMGRTARGVKGATLRGEN
DYIVGCEVVNGDESILVVCENGFGKRSQVDDFRQTNRGGVGVRSIITSER
NGKVIGALCVTDEDGMVMMSATGQTVRINMNDLRVMGRNTQGVKLANLKE
NDYLVAIQKLQGSENQSEELLASDTIELNENNVSFESPEIKMSVKPSSEE
ITDQSE
>pc0350 gyrB, putative DNA gyrase (topoisomerase) chain B
MAKNYDESTVKTLDALAHIRLRSGMYIGRLGDGTNPDDGIYIMLKEVVDN
SVDEFIMKHGKKIIIELDEDLSRVSVRDFGRGIPLGKVVECVSQINTGAK
YNDDVFQFSVGLNGVGTKAVNALSSHFVVKSYRDGEFVEAHFSQGLLKQE
KKGKTKEENGTYVEFIPDPEIFKKYRFQKEYILKRIWHYAYLNTGLILQF
NGEEIQSKYGLLDLLNAEVTEDRLYEPIHYRGKFLELAFLHTHSYGESYF
SFVNGQYTSDGGTHLSAFREGILKGVNEFTKKNFQGVDVREGIVGTILVK
VKDPIFESQTKNKLGNNELRAPIVQEVKEAVVNLLHKHPDVANRLVERIV
FNEKLRKELASVKKEAKEKQKKISFKIPKLRDSKYHYQDRSVHSENTMIF
LTEGDSASASVVASRDPLIQAVYSLRGKPLNVFGMKLDQLYKNEEMFNLM
NALNIEDEIEKLRYNKVILATDADVDGMHIRNLMITFFLTYFEGLVLNGH
LYILETPLFKVRNKVQTIYCYNEEEKNKAVVKLKKQVEVTRFKGLGEISP
SEFKQFIGKDIRLIPVTIHSFSDIKSTLQFYMGKNTPERKQFIMQNLINE
DEIAPV
>pc1075 gyrB, probable DNA gyrase subunit B
MSQDTLSSDKPKIQLKEYDASSITVLEGLQAVRERPGMYIGDTGVNGLHH
LVYEVIDNCIDEAMAGYCTAIDVVLHKDNSISIEDDGRGIPVERHENESR
KQGREVSAIEVVMTILHAGGKFDKDTYKVSGGLHGVGVSCVNALSKKMIV
QVCKNGLMHEIEFSQGKVVKPVQVIGETTKRGTKVWFWPDPEVMTTIDFD
YDILAKRFRELAFLNKGINIFFRDEKHAEKEDVNFCYQGGLSSFVSYLNE
NKEPLFSNPIYFHGVKPGDDAPIEFEVAMQWNDGYSETIFSYVNNIPTRQ
GGSHLTGFSTALTRVLNNYIKNHNLLKSDKISINGEDMREGLTAVISVKV
ANPQFEGQTKQRLGNSDVGSVVQQIVGEELAIFLDENPSMAKLITDKAII
AAQAREAARKARELTLRKSALDSARLPGKLTDCQEKNPALCEIYIVEGDS
AGGSAKSGRDRRFQAILPIRGKILNVEKARLEKVLQNTEVGTMVAALGCG
IGKDGFNLEKLRYHKVIIMTDADVDGSHIRTLLLTFFYRHMPALVENNFI
YIAQPPLYRVSRKKTSRYIHSEREMDDYLLELGLSDIQIKLASRENILSL
EETKKLVSTILAVEIFIDRIEKKGIPFREFLALKNENGLLPRFQMNLMEG
ARFAYSEDEFVALRQSEEESQRQRHQETLASIPADEITPEMRTFKPSRLH
FIELYEEGGIEEIQEPLQEYGLDFSYYMCANGVILDIVEEGGKTYTYYTL
REVIDFLRNNGRKGIEIQRYKGLGEMNADQLWETTMDPVKRTLIKVTLPD
VIAADHMFTMLMGEDVPPRRAFIEQHALSVKNLDV
>pc1168 himD, putative integration host factor
MKKMKECGLMATSTKKSTMTKKKLINSISQDKGIHPNDVRHVIQAFLDKI
TDCLSQGERLEFREFGVFEVVERKQKIGRNPKNAAVPIVIPARQAVKFTP
GKKMRQVVEMEESYLAEISS
>pc1072 holB, putative DNA polymerase III, delta' subunit, holB
MNKFPSSFSFLVGNDPIKIYLQRMLIKKAIGNSLLFAGPNGVGKGLFAYA
LASQLICEQEEKNKYKIENGLHPDIHIYRPEGKLGLHGIQSLRELSEEVH
LPPYEASWKIFIIHDAERMLSVSANTLLKTFEEPPPKTVIILLSQSQAAL
LPTIVSRCRTLHFQPIHASEIEKVLVERMYLETEFAQNIASLSQGSLGRA
VQLIQKKGDESRIFLLNTLSQLPLTSYKEFTQIVGELVAQIELSKKLFEE
KAKEEFLKLFSEQLSTAHQQHLEKEIEGRCTQIFLQDVESLFDQLFAWYR
DLHLLQLTQNKSLLIHSDYAESIEQILQRGNLLPLEIVQKSIEEARLSLQ
RSTSLNICLENLFLKLAWI
>pc0950 lig, putative DNA ligase
MKNFSLLFEQIDQTQSTNEKVSYIQKYFADSSPADGAWALFFLSGHRLKR
LISGKKLLKWCQELLQLPDWLVEESYAAVGDTAETISLLLPFKEKEIKNK
LTLSEWMEMRIKPLQGLLEEKQKEQIFLYWNELNTKETFIFNKILTGSFR
VGVSSLLTLKGLSQALEIPREILSQHVMGTWEPTAEFFASLSITDDRKQY
LNPYPFYLAYPFEGDLKTLENPFDWLAEWKWDGIRAQVVKRGGECAIWSR
GNELVSSQFPEIMEVCKQLPDGTVLDGELIAYQSNRPLAFGELQKRLGRK
NVSKSMQKNIPVILMIYDVLEYRGEDIRKLPLGDRRDVLKCLNLESPQLL
ISDEISFSNWEELSEKRALARQQGTEGVMLKKRNSFYGVGRQKGNWWKYK
IDPMVIDAVLMYAQAGSGRRANLFTDYTFGIWNQNELIPIAKAYSGLDQG
EINKLDRWIRMHTEEKFGPVRKVKTEQVFEIAFEGIQRSNRHKSGIALRF
PRIKRWRTDKPYQECDDLETIIKTFLHDSS
>pc1521 mfd, probable transcription-repair coupling factor mfd
MPMIFEKMLKSERILALQKALQHTKDILLIEELWNAPKALIAALAQQVTG
KHVLILTGSSQEEARLFHDLSFFTNCPTVDFPSWETLPSENVPPSPDIVG
ERYQLLKKINSSSEPHIILTSLQACLQKLIAPSAFQKLYLTLKANESFFF
DDLIQKLNLMGYQRKFIASDKGEFAVRGGIIDVFPVSSPDPYRLEFWGDD
LESIRIYDPIGQISVRAVEQIDIAPGLELELLNQSNEQASFLDYLGPETL
IIFDDLLALEDRYASLISLGANNKFFSSIEEFLHLLTPYQKMFWSQKPIE
ELSEVKHLDSKQSGYYSQTTIFHKLKFQMFNRDWTVKRWRHPFNTITNYF
ISQEEQGDFNGDEILYRLPSLSHETFRLDLLCASELEENNLRQKLLSNNI
HLPKQTTYQIGYLSSGLVIQDEEWMILPLTELTHRYKIRRQKLRSTYHTS
PAETYDLTPGEVIVHLNNGIGRYLGIEKRANHLGILSEFFTIEYADQAKL
YVPFNQAHLITKYLGSNEVIPKLHTIGSSKWKKTKEHTERAILGYASDLL
KSYAEREIKEGFAYPIDSADLQSFEGEFPFSETEDQLAAISSIKQDMMSK
KAMDRLICGDVGYGKTEVAMRAAFKAVTDGAKQVAVLVPTTVLAMQHFDN
FLDRMANFPINIGILSRFRTQKQIQETLEGIANGFIDIVIGTHRIIGEDV
KFKDLGLVIIDEEQRFGVKAKEHLKKIKIGVDCLTLSATPIPRTLYMSLI
GARDMSVINTPPQDRLPTKTIITEPSDQIIQNALLRELSRDGQAFVIHNR
VESIYSVSNRIKSLLPQARVLVAHGQMHADEIDATFHAFKSGQADILVAT
TIVENGVDIPNANTILIDRADHFGLAALYQLRGRVGRWNRRAYAYFLVPN
LRVMPELTRKRLQALSEASGYGSGMKVAMRDLEIRGAGDILGLEQSGHVS
SIGFHLYCKMLKRTIQTLQGKLPSIVTETKIELAIDARLPEDYVNEVSLR
MEVYQRLGEAFSLEEVDSIWSEIRDRFGPPPEPAQWLYHLTRIRVHASRF
GFTLIKQEKLSLTMEKGKKGKDLIIRKILMPKFKSPQELEAKIIAELNQK
F
>pc0034 mutD, probable ATP-dependent DNA helicase
MIITGMETLPSEKKNIDIHYPVIKEKPVYLVELVVVMDNLFNLNKEQKDA
VTTLEGPVLVLAGAGSGKTRVVTSRIVNLIENGISPSNILGVTFTNKAAQ
EMRERVCKLTQHHVLICTFHSLGAKILRESIHVLGYQRDFTIYDEEDVNK
LVKACLMELNWQDKKVDAKPFRQMISQAKNMLQQPNPHYDKEVTSDFDEA
FPHVYALYQKKLQEYQAVDFDDLLFLTAKIWREYPSVLNYYQDRWPFVLI
DEYQDTNAVQYTMTTLLVEKRRNLFVVGDPDQSIYSWRGANVQNILNFER
DYPGAKVIQLEQNYRSRTNILNAANALISHNTNRFEKELWSELGAGEKVK
LFIGDDDRAEAEFVASQISYHHKEHQISLSEMVIFYRTNAQSRVFEDYLL
YRGIPYVIVGGISFYQRREIKDILAFLRFAQSGADFVAFARTINLPKRGL
GETTIEKIRQSANEERMTIYAFCEALLKNTPMKSIVRLTAKQREGLTEYL
AIVQELRTLSKAGSVRELVLAAIEKTKYLNYLMEDKESYEDRRENLDELI
TKAVEWEISATDPSLEAFLEELSLKSSLDEANQAVERLSLMTIHNGKGLE
FTTTFLVGLEEDLFPHVNSKNNREDVEEERRLCYVGITRAKEYLYLSFCH
TRYLWGNLRFQRPSRFLKELPSEYLEKCQQSQIISKHALQNQQKERVTYV
EKPLPSGEIFAPSDTIFHKDFGIGQIKEAYEGSMGLTYKIFFTKDNSVKT
LVAKYAVLNRV
>pc0139 mutL, putative methyl-directed mismatch repair (MMR) protein, mutL
MASLPKIHVLTEQTINQIAAGEVIENPASVVKELVENSMDAGATEICVEI
QGGGRQLIRISDNGCGMSEDDALLCLERHATSKIKNVDDIENILTMGFRG
EAIPSIASISKFSLLTTPQSGVSSIDKLMQGSLTIVEGGRIQSHGKATRS
PGTTIEVKSLFFNVPVRRKFQRSPNYDTQEIVKILTNLSLAYPNIAFELI
SDQKSILKMPLISIDINHQQQLLKKIETLLGKEFSHSLCPLTFSSPPYEI
EGYIGLPSIHKPNRTSQYLFINRRAVYSPLIGVAIREGYGTMLGTNRYPV
FILHLRLPGSLFDVNVHPQKKEVRLRQEQKLKETLINAVQKALRQENPHQ
AFSEMANQVQNETCVYPWSAPSFQTPFQVKEESWEFKPNHKFSTSIDENP
TFIKNIENLELKNETFNPSSFIQTRSLPTKEEPTFFISHQQKAPKVLQTL
TGYCLLDACQVKGTFNSNQELNGLLLLDQKQAYSRIKYEKLLFNLKGKQA
IQQLIVPLTFQFSIPETTLLKTHLESLNQLGFSMREFGNQTFVLDAFPSI
MSEQEIETCLLEMIQDLSTLQQSQQLQIKITEKLALTASRSSFSKNIQLS
IDEGQGLVDQLFMCDMPYLSPSGSPIFAYFKLQELADLFRKYSYFPSQDS
TF
>pc0892 mutM, putative formamidopyrimidine-DNA glycosidase
MPELPEVHTIVQDLKQSRLIGKKIISTEIFWPKTLAVPTPEIFCQQVQGQ
SIQNVDRRGKYIIFQLSNQMFLIVHLRMTGRFQFVTSQTPASPYVRIQFN
FENGDQLRFHDTRKFGRWYLVSDVEEIIGHLGPEPLLSSFTFELFEDMMK
NRKTLLKSLLLDQSFIVGLGNIYVDEALWEAKLHPLIPANQINLKHLKIL
YHSIKYVLEKGIQARGTTLGPGRTHYYRLDGSKGEHQTLLNVFRKTGHPC
PRCGHLIEKLIVAQRSTHICPICQKK
>pc1221 mutS, putative DNA mismatch repair protein mutS
MFIFQLKISLFMSDFEQHSLDESKISPMMMQWHACKKMAGDAILFFRMGD
FYEAFYEDAHLLSKELELTLTKRQEIPMSGIPFHTSEGYIDKLVAKGFRV
AIAEQIEDPKKTKGLVKREVVRVVSPGTVINSSLLSDKNNNFFAALVKVG
QIFGLAFLDLTTGEYWVSEFTQERELLNELYRLHPAEFLTSEKFKEKHAS
LFEEMQQTYSFLVNTLEDWQFEHQQAHDFLINHFKVQRLDGFGLSGMVAA
INAAGALLNYLQETLCLPIQHIQSIRCYSSSQFMMLDRMTQRNLELTHSL
QDGSRRHTLLGVIDQTQTPMGARLMHHWVKQPLLKVSEIHQRQNGIQALL
NHEHIVDQLQNLFLQIKDIERLMMKVSACYATPRDLIALHFSFKPIAFIK
SLLLNIPSEWINEHAQKLDPLSKMNALISNAIVEEPPLRLGEGKTFRQGF
HRELDELREISHDSKAWMARYQTQIREETGIKTLKVGFNKMFGYFIEVSR
GQIDKMPDHFIRRQTLVNAERYITPELKEYESKVLTAEERINSIESELFH
QLRLEVASYTKNVLEVAQALAKIDCLISLTNVAKKYCYTCPVIDDSSILV
IEEGRHPVIETVCRHEKFIPNDTYLDDQANRLLLITGPNMAGKSTYLRQV
ALIVILAQIGSFVPAAKAHIGIIDKVFTRIGASDDLSRGQSTFMVEMTET
ANILNNATSQSLVILDEIGRGTSTYDGISIAWSVAEYLLTTEKRMAKTLF
ATHYWELTKLEEKVPGAVNYNVAVHEADDHITFLRKIIKGGTDKSYGIHV
ARLAGLPQAVLNRSKEILEHLEENANRKSAFEPTRSKKSMVSKVKVPSTD
FQLNLFQS
>pc1237 mutT, putative dGTP pyrophosphohydrolase, mutT
MLIQQQAGHWSFPKGHADANESPKQAAERELFEETGLKITSYLSEEVFLE
HYIFTFNKQRIDKTVAYFAALVEGEVVIQWSEIRSSQWILLSEACEKISF
PEGKKLCHSILKLLNLD
>pc1646 mutT, putative mutT protein
MQNSKKTFAIPFVEETTLAFEESFIKIKRDRLRLAHEDPYSYYTLITPPQ
AVVVLARTADGYYVLNEEYRHPTKKMLLCFPGGFIDDNENPLAAAKRELE
EETGYTAESFHLLGSAYPYPGISGQKTFYVKALGAKFNTSPRLEPSEIIQ
TRLCSFDQLKEMISKNAELDGTLCTALFFNSLSESTS
>pc0089 mutY, putative A/G-specific adenine glycosylase, mutY
MSSSFPNEKLKKWFLSSKRDLPWRQNPTPYAVWISEVMLQQTQVAVVIPY
FNRWMQAFPSIEALAIASLEEVIKAWEGLGYYSRARHLHQGAQYLVEHCQ
GELPADEKELKKIKGLGPYTIGAILSFAFHQKKAAVDGNVLRVLARYFQI
EEDIAKTSTIKKLRDFAESILPDEESWISSEALIELGATICSRKAICQEC
PLKSNCQSYLHGLSDKLPIKTKAIKTQYLYRAVAIVKCGDYFLVKKGKKG
EIMSDLYEFPFFEVSQEGITFKELQENIKLHWNLTVHLLQSLSSIEHGFT
RYQARLDPCVFNCLEMSPVKDLEWLDTKSLKQKAFSSGHRRIFQSLLSLD
ID
>pc0623 nfi, probable endonuclease V (deoxyinosine 3'endonuclease)
MSQRFNFDPSFLQPDSIEKATIIQKELANRICLEDEFNTPEFFGGMDVSN
NLFDPKQIIYATAILLDSKMLSVQFHNSVSQRQTFPYIPGFLGFREAPAL
IDALESLPKLPDMIFVDGQGISHPRRLGIASHIGVLVNIPTIGVAKNILF
GEPKKDLGSCVGDYVFLYAYGKEIGALVRTKLRCKPLIISTGHRVSLRTA
IEYVLNCVKGYRLPEPTRQAHLAANAFRKQSQAGN
>pc0345 nfo, probable endonuclease IV
MSHSNLLLGAHTSAAGGVYRALLEGKKIGATTIQFFTSNQKQWKGRQFTT
NDIELWQSTLKETNLTHLMSHDSYLINLGCPNQENLLKSRQAFQEEVIRC
TQLGINYLNFHPGASLGEDVQKCLDSIVESLLLVRPFIQGNLRLLLEATA
GQGTSVGHKFEQLAYIINGVKDELPIGVCIDTCHIFVAGYDIRTSSAWDF
TLKGFDRIIGLPYLYAFHINDSSKDLGSRVDRHQPLGEGKIGWESFEFLM
KDSRTRHLPKYLETPGGVDLWEKEIQKLKEFA
>pc0021 nth, probable endonuclease III (UV endonuclease)
MYRKMNKHTIAKNIQRILNELYPAPAVPLSHHDSYTLLIAVLLSAHCTDA
RVNKVTPILFKKASTPQEMVKLSINEIESIIHSCGLGFRKATNIWELSDR
LIKDYEGKVPASFEALESLPGVGHKTASVVMSQAFQEAAFPVDTHIHRCA
RRWGLSNGKNVKQTEKDLKSLFPKKDWTRLHLQIIYFAREHCQARSHQTP
ICPICSWIVENPI
>pc1601 pcrA, probable ATP-dependent DNA helicase, mutU
MEKELETLNPEQKHAVKLINGRVLILAGAGSGKTRVLTMRMAYLIRYLNV
SPRAILGLTFTNKAAAEMRHRLANFVDSKLAKQVTLCTFHGFCMQILRQD
IAKLGYTTKFSLYDEQDVQRLINMIVRDILQHEGELPSLTSTLNAIRHAK
NKGISPENIEISESKWHNSFVQDVYRRLQASMRAYNAVDFDHLLSLTVEL
LERFPDVLEAYQERFRYMMIDEYQDTNPIQYRLASLLTSKYQNLCVVGDD
DQSIYGWRGADVKNILEFEKATVIKLEQNYRSTNFILKAANAVIDHNQYR
HKKKLWSEKGEGHPIEVFHTPNELEEAQVVVKRIVKMKESLNLQWKDFAI
LYRSNALSRQFETALMRQVWKFQNRWIQGIPYEIFGGTEFYERKEVKDLC
AYLRLIINPADQEALLRIVNQPRRGIGEDSLDLLTTHNRQFQRPLWDVLK
EVANQKGEGAKLIYHGKAFKGICEFTHLISEAKKRFQEGNLAENLKWLIE
QINYQKAIKEEVKSQQMRDFKWENIQEFVSSLAEFEQQAQLNPDLESSLE
NFLGNMYVDNKFNQSTKNNRHEDRVSLLTFHSAKGLEFPVCFLVGMEDHI
IPHEKSMKETGIEEERRLMYVAITRAQQHLTISMAQQRKRMGKDMASRPS
RFLFEIPKELLKMTDWRN
>pc0672 phrB, putative photolyase
MTNPSIVWFRQDFRLEDNPALNAATQKGGPVIPVFNWVFNPEKEWQLGGA
SQWWLYYSLISLKNDLSELGLSLIIRKEDPLKSLLEIAHETGADTVYWNR
RYEPMLIQDDAKIKTELQKQGIKAHSFNGNLLFEPWTIANKQGKPFQVFT
PFWNQCLKLNDPEVPLPVPHSLKKFVGQLQTESIDSLNLLPKIKWDKGLK
EVWSPGAKSAKALLKKGLTGVIDQYLDIRDLPDHDGTSLLSPYLHFGEIS
PRMIWQAVKENSTSKGAEGYLRQIGWREFAHHLLYHFPETPQKPLRSQFN
SFSWKNDKQNLKAWQKGQTGYPIIDAGMRQLWKIGWMHNRVRLIVGSFLV
KDLMIHWIEGAKWFWDTLVDADLANNTMGWQWIAGCGADAAPYFRIFNPI
TQGEKFDPEGNYVKKWVPELINLPKEWLHQPWEAPEEILRQSGIELGINY
PKPIVNHAKAREEALQAYSRL
>pc1401 pkn, putative serine/threonine protein kinase
MELDPSKRITLPTALDSTKNIVKIPEKIGPYQVEALLEKGGMSILYLATH
PDTKDPITIKVLFPEFVSNPEMVQRFLRESEIIGLADHPNIVKLYGQGEW
EGGLYIAMEFIQGISLRQYLLRNLISLKHALELVMEISMALCHLHAHGVI
HRDVKPENILVTESGGVKVIDFGIAQLLTEGQTDPKSQRRLIGTPIYMSP
EQKNNPESTSYPSDIYSLGIITYELVLGKLSHGQIHLSIMPKGLQKILAK
ALQLNPEDRYQDIVDFMTDVSAYLYSPALLKENKELDPLSDLSESLRHAQ
HSLVPDNPPKWSKIDIGLASYKSLGISSLYYDFFNLPHHGYGIIIGEPSV
KGSAGIVYTSVLRGMVRALCQLTQRPEEMATVLNALLLNDPMKQNFSFSY
LILSPQENLFRFISCGCGHLWYLPKEKLQLELINSENSPLGINHLNSFVE
IEHPWNVGDAILFYGSLCSSDTFAKKPLFSNEQLLSSLQEASMTSPQKQV
DTILRKAKVELSRTSDERSIVLLNLLRNE
>pc0223 polA, probable DNA polymerase I
MDKLYILDASGYIYRSYFAIRQMTNARGESTNALFGFIRSVLKLIKDFNP
THLVAVFDGPNNSQKRTELYPAYKAHRKEMPKDLLYQILWSQRFCQLMGI
PELMVPGVEADDTMGSIAKWAATLNTTAYICTSDKDMCQLVSNQILILNT
FKDNLIIDANGVKEQFGVMPAQMIDYLAIIGDASDNIPGLTGFGPKTAAD
LLEKFGSLDYILEHPLEVSGKKKQDTLISEKEKVLLSKKLVIVDTTVSFP
NQEDFFKLTSPAYQSLKEFYAEMNFSSLIRELEAVKSGISFSDLESQNEV
VYQLVNDEETLVNLISYLSQQKEICLDTETTDLRPLEAQLVGIGLGVEPK
KAWYIPLNGQLNGDFVLSQLKPLLENPSIGFYGHNFKYDYHVLRNHNISV
ANISFDTILASYLLNSHKRQHSLDHLALELFDKVKIAIQELIGKGKNQLN
MKNVALDKICHYCCEDVDYTIRLKNILLSQLEERKLTSLLFDLELPLLSV
LAQMERNGIFIDTAYLKHLSQFIGQEIHCLEQNIYALAGEIFNLNSPKQL
SQILFHKLGIKPPKKIATGHSTNAEVLEILKHVYPIAEKLLEYRTLEKLR
STYVNSLPLQVNAKTGRIHCNFNQSMAATGRLSCQDPNLQNIPVRTEVGR
QIREAFRPEKEDWSYLSADYSQIELRLLAHLSEDPVLIKAFLSNEDIHKY
TASLIFDVPLQQVSSEQRYQAKAVNFGLIYGQQAFGLAHELGIDTKTAAA
FIQRYFERYGKVKEFLEACKQSARETGKAVTMYGRERLLPEIRSQNAMIR
ATADRFAVNTPIQGTQADLIKMAMLKINKLLIQEKKKGFMILQIHDELIF
EVPNQELESISHLVKNTMENIINLKVPLIVNIHIGKNWKEC
>pc1225 priA, putative primosomal protein N'
MKTFAAIASVILDISIDKTLDYGIVPSQLEAAQKGSRVEVPVRGHSRTGY
IVEIKSDSNFKNIKPITRLLSETPLVPEELFKLALWVAKYYCAPLRDIFR
IILPPSVRKGMKEKEQLFVVRGKSKEILRQVCVDIREKKPAQASVLEVML
QVKNGILLSKLLEESKSSRSSVLSLAKQQLLIVETIKIDRSPLVDEDYFM
TKPKILNEDQAVALNKIDASLNAKIFQTHLIHGITGSGKTEIYLQAIEKA
LKLEKGTIMLVPEISLTAQTIQRFRSRFAEKIAILHHRLSEGERRDEWHK
IREGRAKIIVGARSAIFSPVVNLGLIIVDEEHEQSYKQNEMSPCYQARDV
AVMRGKLAQATVVLGSATPSLESYYNALNGKYALSVLHKRADVATLPDVT
IVDMRKEFERAKTLTSFSEVLLSGIERRQKQGEQVILFLNRRGYHTTLLC
QDCSHIVKCTHCEIPLTFHLGDNHLSCHLCGYQISPPPKECPSCRGTKHL
KFRGAGTEHVEKALHAIFPQIRTMRIDADTTKHKGSHQKLLRDFGTGKAD
VLIGTQMIAKGLHFPEVTLVGVLNSDAGLNIPDFRASETIFQLITQVAGR
SGRGVTKGEVIIQTSMPENSTIQHAAKQDYAGFYEEEIAVREMFHYPPFS
HLAKLTFSGKQPDQTYEIAQKFRELLIFQLPQHYEFNPVIPCGYAKIKDL
YRYQFLLRGPSMIPLNLVLENLMQKFSIPKEIKLFVDINPSSTFF
>pc1765 radC, putative DNA repair protein radC
MRINEHSIQSLPKEERPRERLIRHGADSLSLIEILAIILGSGSKVASVLE
VSRALVTRFGGLEALMQATLTELLEVQGIGFAKAIQLKAALNLGFRATRQ
QIKSRYLIEHSSHAYQLVKDELENENREIFMAIFQDTKGYLITYEVISIG
SLSQTLVHPREVFYSAIRHKAASLIVVHNHPSGDPMPSNQDLKLTQILLE
GSRLLGIPLRDHLIIGKNSYVSFKDQNLLLK
>pc0375 rapA, putative rapA, a bacterial member of the swi/snf helicase family
MTLKLTEVIKEGYHHRLHYPLAKNLAKWKASIQQDREKEIFTSLFKEEVN
YQTKLIGRSPSLETTTSPFFHISSNQAVNLLNLLGSLQKIYLNNKQLVVD
FVGKVEFYYEVFPLNTSQIEIKGHLKWRDQDIDIASCDCIGPGKPVWFVR
GISLKGITTFISWKELQRAYQTRPWILEGSQKAAFLEEFEENDSNSPQLM
IKGHSIENLYKQTEPLPFLILKDRSGGFADLWLNYGNGLKIAFHELKKTS
FKRQEEVEKNFEKDLLETDFIKKNVGTSHYYCPLDKVAKSLTFLLEIGWV
ILDWKENRVIKQDHIDLKLEDAPQMIKIKGSVRYETHEADVSSVLGAFNR
RERFIQLNPGTVGLLPELHSVQELKELAEEGKIIGQEVHIKKSHIGALSS
LFDRTELPSTLSIFKQKWENFKGVETALPAPSFEGHLRPYQQEGLNWLSF
LFNYGFHGILADEMGLGKTVQVLAFISRFASESKHLIVVPTSLLFNWKNE
ICRFLPSCSCYIHQGSQRANSIEILQNYSIILTSYTTLRLDLSLLQKLDL
NTLILDEAQQIKNAHTQTFQAACSLSSHFRLCITGTPIENHLGELWSHFH
FLIPDLFGAEESFNADIQAASADRRYLDRIKKKVAPFILRRQKQEVAKDL
PARIDQIVWIEMSESQRQHYEQFLANFKRNLFKKIEAEGITKHRLEVLEA
ILRLRQICCHPLLVSSIIEEKEDLITSAKFDLLMQDLQTIREEGRKVLVY
SQFTSMLKLMTRYANQQGWTYAYLDGSTQNREKVVTEFQENLEQSIFFIS
LKAGGVGLNLTAADYVILYDPWWNEAVEEQAINRAHRIGRQEQVIAKRFV
VIESIEEKMMKLKAAKRTLVDDIFDFEAAPTQLTIEDLRYLIS
>pc1995 recA, probable recombination protein recA
MSQSAPPDSERKKALGLAVSQIKKQFGEGAIMSFGKHSSEKEMSVIKTGA
LALDIALGIGGVPRGRVVEIYGPESSGKSTLALHIVANAQKNGGLAAYID
AEHALDPSYAGKIGINIDDLMISQPDSGEEALNIAEMLARSNAVDVIVID
SVAALVPKSELEGEIGDQFMGLQARMMSQALRKLTASLSKSNTCAIFINQ
IRDKIGIVYGNPETTTGGRALKFYSSVRLDIRRTGGIKGPDNTEIGNRVK
VKVSKNKMAPPFQIAEFDILFNEGISRTGSAIDMATEYNIVDKKGAWFSY
KGQRLGQGREAVREEFKNNPTLLEEIEALILQQYKENRSKPASKKTSIGA
AIEEIEGALNE
>pc0009 recB, putative exodeoxyribonuclease V beta chain
MLDRQLILHQHYLLEASAGTGKTFSIQNIVVRLLIENQLEQEALPLSKIL
VVTFTKAATRDLKLRIRLNIEYALEVFNEWLSHSNVLENTPDYLKAVIEA
GIESVLKAKKKLQQALFEFDQAQIFTIHAFCARMLRQYAIESDIGFHASY
GEETFPPSEILAVIQDFFRTEIRLENFSPAQLEIILKHDPDQKKLLRAIQ
SGYEFEELPTFQQIYQQFLEGMQNLQRTYSISSSLLMEDFQEQAPFFRNY
KGAKSKADTLIKISRFVALFDQTEWTVENFDQLICDGLEWVLALDPKLLK
NPAASFRLNYPGFTALLHHTLERVVYLARDESILIARLAKACQKLLRNYQ
REEEKLSPDDLLRKMDWAIGQENFLKQIQMIYQAAIIDEFQDTDPLQWQI
FRRLFLPQDKTWKGYLYLVGDPKQSIYSFRQADIYTYLAAAQALGHEHCF
SLDVNYRSQPALVNALNVLFSPDHTPKFIPLPKTNFHLTYQPVFASTFNQ
TRLFEDEKGAVHFFMGDGSNKKNSTIQDLEQKVFFPFIAQEIRRLRKQKT
LAYSQFAVLVRDRYQALRLAEYFDSYQLPYLNQRGTSLAESPALNALIDL
IKAVLHPQNIGTLRTLLGNSLIGWSHEKLHDSSNLESILSVIQSLKQVLI
EQGFSIFYDRFLQSCWGKNKLSILEQLLAKEGGVDFYHDLQQIAEIVINH
QYHEWNGPEGLIPFLDQFQKWDENEDPRVKRFQDPSKDGIKILTLHVSKG
LEFDIVFALGLIQRNSFKDELIPIEKEGKFVLIPLEESSEQRLHYCEEID
AEKMRQLYVAMTRAKYQLYIPISLHIPSEQIKYGEASPLDLLLGRLGQTE
CSYETLYDRIRHFNGQSFIKFMEEIGSQNDMTYSIHREIFLEKNKKDSVP
FIDLEPPKSISILTTPLLMSSFSSLNRISSFSLSQTPPHDFNNSIKTEHT
LPASSETGILIHELLEKISFRDFKGINLAVETLPLIRPWIQNEMYRPWEN
VLAALVYQVLNVDLGIYSSPFCLADIEPSKLVREMTFLFPYESDLAIEGL
VEGQGLIKGFIDLIFVHKGKYYIVDWKSNWLGSSNECYDFFHLHQAMLDH
NYFVQAKIYTEALKRYLKLVETRAFEECFGGFFYLFLRGIQSNKQSGIYF
CDAQDLIKIFSPKNYE
>pc0008 recC, putative exodeoxyribonuclease V gamma chain
MFLLKFYVGFNKTVCKEGCKLLTLTVDTPKSEPFVSDLEVFFSNQLSILY
EQLKNNLFGFKQTPFKKRLVIVYGPAMQTWLTLKMAQDPDLGIAAGIEFL
YLNQAFETLIHYFQLKNEKIPSILELSLAIEKELLTVLQDYHRLSDEEQQ
DWLTLIYYLKLNSKQVGENLKLTRKMEKRLTGLSYHLAKIFQEYGKYAYS
LVSKWEKSEHRGWQSRLWKSLFGGNQGWTYWTKAFQKTLKFFPECEVHFF
SISFISKAEFQFLSKLANVAPIYYYLLSPCAVFWSDIRSDNETRYLQTYW
QQKLGSKASQVLQLEELLRDRNPLLANFGKLGREMAYQIEESQATTHAGY
ILPSHVSELNDEIFFQEDLFLKESLQPLTLLHAIQADILMMRNPEGKPPF
NFERKDDSIQLHIAPSIRREIQILYHNLLKLFEKDSTLQPNDIIVMAPQI
SDYVPYIQSVFGLEESQLDFQILDLGMQAQSEIVQGFFQLIRLSESRWEV
SELLQLFGHRLFQRCHQLTQSDYYLIQEWIQQAGIRWGEDWLHRNELLQR
HHCEKEMVDSSSVGTWNFGLTRLLLGLTTVVKSADSHSFDSIPCEGIDFS
QAELMERWIRLLHSLRDDLSPLHDRSQMCMEEWSCYLSCLLDTYFKCEFE
DSQSIADYEELKSQFKLLGDSAKTFKETKFSFQTIKFHLNNLLQQRGITY
RESHLQTIRFCSMMPLRSIPAKVIAVLGMQEGAFPRAGYHTSLNLMVGQD
NLDYNPNSTDYDRYLFLEALQSVTDVFIVSYQGYTYQDSKVLQPSLIIEE
FFTYLDKYYLIQNKKISEQCVSKHPFDAFDVSYFKPNSILNNYSQFDYRI
AEQYYQTHKTPSHRLLKQFILSNYSLEDILPSHTVIDLKTLNTLVRSPVK
FYLNRGLDIYLEGYEDRIIKNQEELGLSALNKYQLKQFALKEPFEKVMQI
ADKEGKLPLGMFKTVATKRFKDEIDEVHQRLYKHGINPSELFQIEFCTSC
SEPCQIQKDQWLLPALQLNYSDQYQISIIGKLPFVSKKGLVVLSQGSGFS
DAWKAWPQFLLFNYATTFNIEAIERNLILSKSSEVKKAFFKDSIPYLKHL
INYYALSMRNFSPLFPDWIPSLIEGDEQAIQNYMKQVFSNSFGAFLNQEL
RWVFNKDHLPCPKILIESWQEIGKQLAGDLIQLWYPPKKKKGEDA
>pc0689 recD, putative exodeoxyribonuclease V
MEQICGYVERLTFHNSENGYTVAQLQQPKQSELTCIVGCMPGIQPGETIR
CNGNWKTHLIHGRQFEISSFRVEAPADILGIKKYLGSGLIKGIGPKYATR
IVDIFGIDTLKIIEESPQRLLEIEGLGTKRVEKIQACWIEQKSIRDVMIF
LQGHGVSPAFAQKIFKKYGSQSILKLKDNPYCLARDIFGVGFKTADTVAQ
KMGISKDSEQRIGAGIEYVLSQLSGDGHVCYPVDEFLKEAETHLEVKADL
IEKRLEGLQSEERIILAQLIHEGKKRDFIWIKPLFIAETGIARELKRLKN
GVSTFRSINKEKAVEWVQAQLKIELAPNQKEAVAKAISTKLHIITGGPGT
GKSTITNAILQITAILTQKILLAAPTGRAAKRMSEITKRKASTIHSLLEY
DFKSTGGFKRNRENPLDCDLIIIDEASMIDTFLMYSLLKALPDHTRVIFV
GDIHQLPSVGPGNVLSDMITSLTISVTTLKEIFRQAAGSHIITNAHRVNK
GMFPSLYNGQNSDFFFIECQENEEVLNTIVKLVSQRLPNRYGFNPNQDIQ
VLAPMKKGLIGTEHLNQSLQMILNPKEHALFRGGQKFQVGDKVMQIRNDY
QKEVFNGDIGYILNIDSEEQQVLIQFEDKEVVYDYTDLDELILAYAISVH
KFQGSECPCVVMPVHTSHFMLLHRNLLYTGITRGKKLVVLVGTKKALAIA
VKKDDVQKRYTSLQNALMEII
>pc0010 recD, putative exodeoxyribonuclease V alpha chain recD
MKVMERGFAKQNFLESYKLAPWLGTKRAQDLPNWPLVNQLLSKNQLSYLN
YLLTLEIIKDQWINQNLVLFICHLLMAAQEGHLCVEIRNQTLFPTVKQLW
TNEAAAPLSNEELENLTHSILQGSQNIPVNFVTAMDSLENSVYPNTPICM
HKGNFYLQKHWVLETVFLKNLNKHLQTSPTLELNRVVLEQHLNECVLKKK
LLLEQAQAILTGCLSSLSLITGGPGTGKTFTAGRFIQIYWDSLKECQKKN
CQIALAAPTGKAAANLQKSLSLVTAQLKDFPPLKAKTLHQLLGINNRSRN
ESGIRLAADLIIVDESSMIDVKMMAYLFEALKKGSRLILLGDQHQLPSVE
AGSLFADLTKLKTKIPCTELKVCLRTELSSIVSLAHYINQGKGQETLSML
NETQIAGISRLNLSPDRREAQKEFVQHVMNHFPLSIKVHDNQKILELFNT
IRILSPMRKGYFGVDSINQLIWNHVSQIKLSPGWLAIPIIIVTNDYKQNL
FNGETGVLIRKLPLKSITSEDYALFPSKDEGENMRCLPACLLPKYELAYC
LSVHKSQGSEFERVILMLPEGSECFGREVFYTGVTRARKHIEVWGTDFTI
EKTISQQSFRLSGIQTRLEKFI
>pc1706 recF, putative DNA replication and repair protein recF
MTLRSLYLQHFRNYEEAYLEFSPQFNLICGPNAKGKTTLLEAIHCLMIGR
SFRTSHYPDLIQQQFESFFLEAQFYKHGIEQTLKFGFHTTDRKIIYNSTP
LATLSNLLGLIPGVIITPDDVQLVKGSPQLRRQFLDIQIAQVDPLYVHHL
NRYGRALKQRNHLLKMKQQISIDSWEQEMTHSAAYLIQQRYQTITHLQNL
AQKYYHLLSGENDLLTLEYRSIANSNLSIDEIKKLLVKQLCKNRQREMQI
GYTLSGPHKDDLFVAIGGRDIRYFASEGQQRSCVNALHFAEWNRLHQRGD
GDFPLFMIDDIGMSLDSNRKDRLVEQLQSVGQVFLTTTDPKFLDHIDADK
KIFTLPFYN
>pc0249 recJ, putative ssDNA-specific exonuclease
MHFTTNVQEDPIWVYPPMDEALKESIVKEFKLHPVIAQILVSRGFTSFQQ
IHDYLYAKLPELHDPFLMAEMPQAVERVCRAIRDHENILIYGDNDVDGMT
GTTLLTEFLQDLGANVFFYVSNRGALRQSLIVEALEYALINNCKLLITVD
CGITAAVEIAKVAAQNVDVIITDHHEPTDKIPHCVATLNPKLVNNPYPNR
DLTGVGVAFKLAHGITNQLTSEGKIPPSKIDLKKYLDLVALGTISDMGSL
LDTENRILVRYGLRQLRKGKRMGLAKLFSICDVDLNDLNTFTIASKIAPR
LNSLGRIADPRKGVQMLLVKNADLAEKMALELDLNNIERQKIERTMSSDV
DSTIQQIPAILSNKAIVMVSDKWHPGVIAILSTRISKQYNRPTVMIAIDK
GIGKGSIRSIREFPLLPTLKECSDILINFGGHDFAAGLTIKEEHVEQFKN
HFIASANKKLADTDVMSKLYLDAEIKFSELTFDFIESARLLEPYGNENPQ
PILYCDAWQTWPPKIVGKTHLKLYLEQGDRVLEGVALGKATYSQQLRKKN
LKLRIAFTPQINKSSIQLLIRDFKVLEEVPTTFTELEPTQYQNL
>pc0677 recN, putative DNA repair protein RecN
MLKQLRIQNIILVENADISFSSGLNILTGETGSGKSAIMHGLSLAIGERV
DTSLIRKGCDKGIVEAIFDIDRLDLNNLLEEGGIDHESHQDLIIRREIAI
TGKNRIFINNQSAQASFLRKLGSQIVQIVGQRANQNLFNLDYHREVLDIY
GGLSPFLQRYKESYVYENELKKRLDLLIQQDAHRMREIDICKSEWEELEE
AQLKSGEDEELFTEYAILFNSEELSEKTREINQALTGEKVSILAILNRQK
QNLESLSHFDPILKEVEQSLQSVFLELQEISHTLRHYQNKLNHNPERLQI
VNERLSLLNRLKRKYGGTIDEVIHYQQEIKQKLYRLENTDIEIEELKIEL
QQVQTDTNNLARTLSEKRVLLARQLQTALSTQLHSLNMPKAEFKVIIEPQ
KRTLIGDDKIEFFLQPNVGEHQIALKDGASGGEISRVLLALQTILAGKEK
ILTLIFDEVDANIGGETASIVGDKLKEIGKQHQVICITHFPQVASLADHH
LQISKVEKDGRTLTQVQKLDKISCQQELARMAGQKSLAFSQ
>pc1724 recR, probable recombination protein RecR
MRYPEHLLKLIHILKKFPGVGHKSAERFAFHLLNWPMEHLIELSETVKNT
KDKIKQCLNCGCLTDEAACYFCDINQRDSQIICVTAFPRDVFSIEETHEY
RGLYHVLGGVLSPLENRGPEHLSISRLKHRIQDLQIKEVVIALDSTLEGD
ATALFLKQELAADDIQISRLAFGLPMGSSLDYVDGGTLARALAGRSRF
>pc0658 rnh, putative ribonuclease HII
MPDLISTEELTRLEHMIVYEKRAFSQGYQLIAGIDEAGRGPLAGPVVAAA
CILPKGLLVPQINDSKKLSPKVRERLFERLTTDSAVRYGIGIIGQAEIDR
VNIYQATILAMLMAIQQLPVTPDYVLVDGMNLPHPDLPCLKIIKGDQLSQ
SIAAASIIAKETRDRLMCQYHREWPGYGFNQHKGYATELHLEALFKQGPC
PIHRRSFDPIKSMLEVEIADDF
>pc0679 rnhB, putative ribonuclease HII
MSSLPPFVTTLDLKLAEKLLKDLQQQGFSITIPAYTRFSASKKGLTCTLY
TSGKLVVQGKEQAHFIEFYLEPEILESFGFSHPTTKIDLTPHIGIDESGK
GDFFGPLCIAGVYIQANQFSKLQALGVKDSKTLSDKTIRQLASQIKNLCL
YHIVKINPAKYNEIYQDFKNLNHLLAWGHATTIEQLILQSGCQTVIVDQF
ADEKVVLLALKRKKLDVNLTQRHRAEDDLAVAAASILARQAFIDGLEQLS
KEIQIPLPKGSSSATQKAGKEVLRKWGEERLRSICKQHFKTLDAILGKVG
K
>pc0020 ruvA, probable Holliday junction DNA helicase
MFAYIKGVLAFFNPSQAIVDVHGVGYLLFIPCRLLGQLPQIGEPVQFYTT
YVVREFSHTLYGFLSYQERDIFEILMNVTGIGPKMALSLIGHLSMSELQI
AVMRQDLSTLCRVPGVGKKTAERLIVELKDKLAAIGHLDTSDHIEPLTQD
PKSKSVQDAMLALINLGYNQTTAQKAIKQGMKELPEEIDLAQLITVALKH
V
>pc1108 ruvB, probable holliday junction DNA helicase, ruvB
MNKNFIESNLNKQELSFEVPLRPQCLTDFVGQDSIRDRLEVHIGAARQRG
EVLGHCLFSGPPGLGKTTLASILSKAMESNLVLTSGPVIEKAGDLAGILT
SLKTGDVLFIDEIHRLNRSVEEYLYQAMEDFALDLMIDSGPNARSIQVKL
NQFTLAGATTRLGLLSEPLRSRFAFTCRLEYYDPMILQKILLRTSRILNV
KIDSEAALEIAKRSRGTPRVANHLLRWVRDFAQIKANNYIDLSVANRALT
MLSIDEKGLDEMDKKMLQTMIDHYSGGPVGINAIAASIGEEPSTVEEVYE
PYLILQGLLKRTPRGREVTSLGYQHIVGSSQR
>pc0019 ruvC, probable Holliday junction endodeoxyribonuclease
MSNQVIILGLDPGTKITGFGVIRIEGHQYVPVDYGCIRPPSHYKLSERYL
VICQGVEQLIDQHQPHAVVVETQYVSKNVQSAMKLGMARGVIMIAAKKRG
IPIYEYAPSKAKLAVVGTGRASKYQVQGMVQRLLNLSIPPTPEDAADALA
LAICHAQMPILKQSQYET
>pc1104 ssb, putative Single-strand binding protein
MFIVNIAGRLGKDPEARFTPSGQKVTAFTIATNHRKGKEDITIWVRVTVW
GDRLDKIISYLKKGSAVIVVGKMNPPSSYTDKEGRTQISLEVTADMIEFS
PFGNPDRAEQGNVATQGSEQMPYDQNAYNRPQPNYGSYSATGQGHSQHTT
IDDDALPF
>pc1338 tag, probable 3-methyladenine-DNA glycosylase I
MLKRCDWVQLNNPLYVAYHDEEWGIPVHDDHKHFEFLILEGAQAGLSWQT
VLQRRENYRQAFASFDPHIVATYDEQKKNELLLHPGIIRNRLKIESTIAN
AKHFLKVQEEFGSFNTYIWQFVNGKPIQNQWETIRQVPAETKESLALSKD
LKKRGFKFVGATIMYAYMQACGLVNDHTIDCFCHPSKH
>pc1844 tatD, putative deoxyribonuclease TatD
MDRMSYSLSFIDSHAHLTSSPVYEQIDVLLERAQKEHVHQIVNICTDPES
LKKGIELSKKYPWIFQTAATPPNNVQKEGEAAFETIADYARKGYLKAIGE
TGLDYYYDYSSKEIQKDFFHRYLHLALECRLPVVIHCREAFADFFEIIDA
EYRIDCRHAPGVLHCFTGTIAEAEEVIKRGWMLSLSGIVTFKKSFELQQV
AKEVPLSQLLIETDTPYLAPQKYRGHPNEPSYIIETARLIASLKGISLEE
VAHATSENARYLFRI
>pc1471 tnpA, probable transposase, partial length
MALIELGWIERTFWLQNVELRRRANAGLNKGEAKNTLARAIFFNCLGKMR
ERSFENQRYRDSGLNFVIAAIVLWNTVYLERAIRHMKDSGQQVDESLLKH
LSPPLG
>pc1470 tnpA, probable transposase, partial length
MPIAGASDLYRMLIFSHYDNAFKMVKRNQKLPENLALAVKPFINIFVRYK
YVSTHNPILPFHTKVINIEVRDATYVLGGLLYHESDIRIEEPYTDTSGFI
DHIFALMHLLGFRFAPRIRDLANKQLFVTSSKKEYPSINTLIDDVINVKH
IRSYWDEILCLAAFIKQGTVSFFNIA
>pc1469 tnpR, probable resolvase
MTGQRIGYVRVSTYDQNPDRQLDNIQVTRIFVDKASGKDVKRPQFEALMS
FVCAGDTVLVHSMDRLARNLADLRSIVQTLTQRGVCIEFVKESLKFSGED
SPMAILMLSVMGAFAEFERSLIRERQREGIALAKQRGAYCGRKRSLSDAD
ILSLRQRIQNGEKKSKVAREFGISRETLYQYLRSV
>pc0071 topA, putative DNA topoisomerase I
MGKALIIVESPAKIKTLKKFLGTNFIFESSIGHVRDLPEREFGIDIENDF
EPKYTIMPNKEEVISKLLKAAKQCDVVYLSPDPDREGEAIAWHITQVLPP
NTNIKRVSFNSITKDAVVKALENPREIDIALVNAQQARRLLDRIVGYKIS
PLLNRRIQRGRENFLSAGRVQSVALKLVVDREKEIEAFKPIEYWNIGAIL
KTNQEDRLFRAALYSVDGKRFEKEPIEGKEITIINNKEAADAILKRMKPG
PYQVKKVERKEKRRFPVPPFITSTLQQEASRHHGFSSARTMNIAQGLYEG
VDLGSDGPEGLITYMRTDSVRISPEAVQEAREFIKKQYGSDFIPSDPKQY
STQKSAQDAHEAIRPASLQNTPEKVQPYLTKEQFSLYQLIWRRFLASQMV
AAIYDTVSADILAGEGILLRATGSIIKFQGFLAVYEEKNDDDEKDDENRM
LPKLEEGQTLFLQELTSEQAFTRPPPRFTEASLVKELEKSGIGRPSTYAA
IMNKIQSRDYTVKENGRLKPTELGQIIAQMLETSFQKIMNIGFTAAMEDD
LERVAENMKDWKTLIRDFWEQFNPTLEIALKEAFVPKVMTEIDCPKCKIG
KLQKVWARSKYFFGCSRYPECDYSSPVEEITFNKEDYATDFDWEQPCPNC
NSEMKIRHGRYGAFLGCTKYPECKGIINIPKKGEEALSQQDLPSCPAIEC
PGHMVARKSRFGKIFYSCSTFPECDVIVNNLEQVENKYPNHPRTPYEKKG
KKAAAKTATKEKTKKTAKANASKATKKIKSTPDKPKKVRQMPVYQVSPEL
RGIIEVSEITRGDMTKKVWDYIKTHQLQDTNNKRLIIPDAKLSQVFGTTQ
PVDMFKMATLLSAHLKK
>pc1182 topI, putative DNA topoisomerase I
MKKIKIKPEACTEIDPKKLAEVANLTYVNNFKHGITRERKGKQFIYKDSN
GKIIIDSNEIKRIQALAIPPAYTDVWICPSLNGHIQATGRDAKGRKQYRY
HALWKEVSDETKYGKMIAFAQALPTIRKRIKRDLSLTEMSKEKILAVVVY
LLEMTLIRVGNEAYAKENNSFGLTTLQNHHVSIEGTEMTFKFIGKSGKQH
TITLYDKRLAKIVKRCKDLPGQELFEYMDENAMPVSISSTNVNEYLRMIT
NDHFTAKDFRTWAGTVLTVFALQEFEHFDSHAQAKRNIVQAIEKVAKKLG
NTPAICRKSYVHPEVFNAYLDQTLFKVTKRPSKKSVDLVMELSFEETYVL
NFLKKRMK
>pc0975 umuC, putative SOS mutagenesis and repair protein UmuC
MVVLSNNDGCVISRSQEAKLLGVKMGEPYFQIKALCEFRNIQVFSSNYAL
YGDISERIMNLLFEHAPDLDIYSIDEAFLKYPSSVAPSDLVSLCHELQKK
VKKWVGMPISLGLANTKTLAKMANDLAKKIQNFYVFDLNSSVRQKVLQNY
LIGDVWGIGRNLKEKLNGMNIHTAWEYAQMDPSIIRKRLGVIGERILWEL
RGVSCLESDEKVSKKSLLYSRSFGHVLSEITPLSEALSTYVYTVAEKLRA
QGSLAKALYIFLEYQIQPGKKMRCYDSITEIFPAPTKDTGEMIKAAKRGL
NKIFRREERYKKCGVILLDLLPESSSNSDLFLNPVDPKRTQLMNTMDALN
ARFGKKKLFFGAMGTDVSWKSRKDCSSKHNPSNWQQLPIVLAK
>pc2012 ung, probable uracil-DNA glycosylase
MLDKNYTPFILEPSWQKVLKQELEQPYIFNLATFIENEYTSSPSPIYPPH
DLIFNAFYNTPYEKVQVVIMGQDPYHGPGQAHGLSFSVPKGIRPPPSLQN
IFKELQTDILLPIPSHGCLLKWAKQGVLLLNATLTVKKSEPLSHHGRGWE
RFTDAAILQLIERQDPIIFVLWGKSAQDKCRFLKESVNIKRHYILTAAHP
SPYSAANGFFGCRHFSKINALLEQQGKCPIDWSLDN
>pc1245 uvrA, putative excinuclease ABC chain A
MSVFSYHRFINLQGCKEHNLKNLSVQLPKHAITVITGVSGSGKSSLAFDT
LFAEGQRRYLEYLSPQARPWIKQMPKPDVDLIEGLSPTLAIGQHRQPLYF
YGTVATYTDLYDFLSLLYAKVGDQYSPATGKKLSRFTRQEMIDWILKNYS
AGSRLQLIAPIKLVKENGHQAITRLQQMGFIRMRINEQEWCGENPFPINK
AISNLEVVVDRLEIREGIRDRLAPSVETALDLSQGILKIQEGKEGNTHYL
TEIYVCPETGFSFAPLEAGDFNFNSPKGACAACNGLGGREQVNPSQVIFD
ENEPLLDQIQVILDHLPKKAAYSFKSLLKALWKILNLSEENFIKDISQMI
LNKILFGHSQEIVFNVQINEESEQLKAKWKGLIPVLNEALEMKKNKGSLS
ELSFIDWQTCSSCLGGRLKPESLACLIQEKNIYQLCSLTVAECLIKIKAW
LFTGKQEAIVKEILPHIQSRLEFLDQVGLGYLTLTREGKTLSDGEAHRIQ
LASQIGAKLSGIIYILDEPSLGLHRQDIQHLHKVIHELKALGNTVVIVEH
EKSLIQQADYILELGPGAGSLGGQICFQGTITDLLNDSNSLTGKWLSGKL
SLPIPPRRKIQQDWLEIRGATLNNLNDFSANIPLGCFVGFCGVSGSGKST
LVLDIIGQQLKNFLVRGIIPHFLNKYQTIKRLISHEKQTDRLSARSIPAT
YIGIMTPLRQLFAETRLAKARGYTASRFSLNKRGGRCEACEGLGYIEVNM
HLMPDFFMPCDICQGLRYNYETLQITWENKNIADILRLSALESFQLFKHI
PSLAPTLELMTELGLDYLQLGQPFNTLSGGEIQRLKLIADLAGKTQEKTL
YILDEPSSGLHLQDIEKLVKILHKLVEKGHTVFVIEHHLDILYQADWLIE
LGPEGGPKGGRLIFEGPSTKMIKAHTPTGKVFSQFNQ
>pc1641 uvrA, probable excinuclease ABC subunit A, uvrA
MMNQENIVLKKVRVHNLKTVDLTLEKNELIVFTGVSGSGKSSLAFDTIYT
EGQRRYVESLSTFARRQLGELSKPDLEHASGISPTISIEQKTAGKNPRST
VGTLTEIYDYLRVLYARIGIPHCPVSGEAVTPQSRERIIKSVQNLPPKTK
IIILAPYAKAKKAEFKEDFQELIRKGFMRARVDGHFVNLTDELTLDGNVT
HDVDVVIDRLTIENNALSRIADSLTQALQLGQGVCSILDAESKNEQLFSM
HAYSPQSGLSYSSLEPHDFSFNSPSGMCPRCQGMGNIHEFNLDLVIDPNL
SIANNCCSIASPYQTVRYGNIYDNLAEQYHFSVNTPWKNLSASARKVYLF
GTEKKWTRMHFVHPITGARWTDHIQWKGVLHDAHTRFSEAKSENYRKKMQ
KVMSIQICPECEGTRLKPYPAATLLGGQRISKLTSMTIFDCSVFFENLKL
SPQDSLIAGELLKEIRQRLQFLLEVGLHYLTLERTAPTLSGGEAQRVRLA
SQIGCGLVGITYILDEPSIGLHPRDNRKLIDTLKHLRDMGNTVIVVEHDE
ETIWEADRIVDFGPGAGVKGGRILVNGDLSDLFNQSESITGAYLTGRKQI
DIPKKRRKASKDFLEIKGAQHHNLKSIDVKIPLGLFVAVTGVSGSGKSSL
ITDILYPALSNALHGGEHAVGNHQMIQGLEAIDKVIAIDQSPIGRNPRSN
PATYIKLFDEIRDLFSQLPESQARGYKAGRFSFNVKDGSCSHCEGMGMIK
IDMDFMEDAWDDCPLCKTKRFDSETLSVLYKGKNIHDILEMDVCDALEFF
TNIPSIKHKLETLSQVGMDYIKLGQASTTLSGGEAQRIKLAKELVRPATG
KTLYILDEPTTGLHFHDIKHLLEVLHALVEKGNTVLVIEHNMDVVKTADW
IIDLGPEGGAGGGQIIATGNPEKIAKMKTPTGIAVNYALYPEIEKKIATA
LETSKKRRKTKKQREALLIKDINVIGAEQNNLKQISVTIPREKITVCTGP
SGSGKSSLAFETIYAEGQRRYIESLSPYARQFVKQMPKPKVGQVSGLSPA
IAIEQKAHAGNPRSTVGTLTEIYDYLRILFSRLGIAHCPETGEVIKSISK
ELVVERILSYPENQRLQILAPIELNKNEKFEDLILKFNRQGFLRIRLNGE
FYSLEQDQINQIPFDRKRKNQLFLVIDRLKTNSSIKARLFEAIENATSIG
DGKVVVMKEDEDIPFNLSFAVESTGKSYPEITPHTFAFNTHEGMCVDCQG
LGYQYGANFARNTEMTSYSVIGLMRHLWQQAFTRHAFAYMEHILDEEGID
PHVPLNQLPIDKIQFLMQGSSEERWYTNASGLRYRWIGIDQVLAKAGKNA
ASEKKEAIIPLLQEQTCISCQGARINPLARNVTIHNHSIHDICSMPIEQT
LNFIKKLKLCPQDKKLLEEVHTQLINRLSFLCEVGLHYLSLERRAPTLSG
GEAQRIRLARQLGSGLTGVLYVLDEPTIGLHPHDNAKLNAALKKLKDLGN
TLLMVEHDPLTIETADYLLDFGPASGEHGGHVTARGSFKQILKSTTSLTG
AYLSGKKKIPILSRRRSIDQEQIVIQHTKKNNLKSISVEIPIAALTCLTG
VSGSGKSTLLHQVLLPALEKRQNHDIVEIEGAIVSGLSHFDKVISIDQDP
IGTTVRSDVCTYVDVLTRIREFFVSLPAARTKGLQPKNFSYNHRKGMCTG
CWGLGYRRVEMHFLPAVKVTCEDCQGLRLNPISLEVTYAGKNLGQYLNTT
IDEARVIFQNHPRIVRILDTLIAVGLGYLKLGQETASLSGGEAQRLKLSR
ELAKRSTGRTLYLLDEPTTGLHSDDIYKLLQVLHRLVDKGNTMIIIEHHL
DIIKNADYIIDLGPEAGEKGGKVLGKGTPEQIAQLSSSWTGHYLKNVLSI
>pc0174 uvrB, probable Helicase subunit B of the DNA excision repair complex (excinuclease ABC)
MNPSQLFQLHTEFEPCGDQPEAINQLVASILQNKRSQVLLGITGSGKTFT
MANVIAKVQRPTLILAHNKTLAAQLYQEFKAFFPHNAVEYFVSYYDYYQP
EAYVPRTDTYIEKDMSINDKIDKMRLSATRSLLERSDVIIVSSVSCIYGL
GSPEYYRGMNLTLSQGQMRRRDDILLHLVEMQYKRNDFEFIRSTFRVRGD
VLDIFPAYEEDLAIRVEMFGDEIEQISEIDPLTGKVKRRIASITIYPSSH
HVTPEEIRLKAMETIRAELDERRQFYETEKKYLELERIQQRTMYDLEMLK
EVGTCKGIENYSRHFSMRQPGAPPPCLLDYFPSDYLLVIDESHQTLPQVH
AMFNGDRARKQTLVDFGFRLPSAFDNRPLRFEEVYGRIHQVVYVSATPGA
WEVQEAGGEIVEQLIRPTGLLDPIIEIRPASGQVDDCLAEIRSHVSKGGR
VLLTTLTKKLSEELTTYLNDLNVKAKYLHSDIDTIERVQIIRDLRLGVFD
VLVGINLLREGLDIPEVSLVAILDADKEGFLRSETSLIQTCGRAARNAEG
RVIMYADKITKSIKRTLEITESRRALQMRYNEQHGITPRTVKREISVLME
SEEDQVTHPTKLEEEIFKAAEEAHHYLTLDEVRLKIKECEKEMKKAAKEF
RFEEAADWRDQMRRYQQIELTLA
>pc0697 uvrC, putative Excinuclease ABC subunit C
MSYDPKKIDLFPTLPGVYLMKNEEGEVLYVGKAKNLRQRVKQYFVPGRDG
RLMIPYLVAKINYIETIVVTSEKEALLLENNLIKQHKPRYNALLKDDKSY
IALKISQNDAWATVRLVRYKGTPEPDGLYFGPYTSAQAARQTLDLLNRLF
PLRQCSDQEFARRTRPCLLYQMKRCVGPCTQKCTKGEYQQHLDRTIKFLR
GQNKDVLKDLYEEMRLLSEQLEFEKANHLLRTIRYIEKTIESQYVDRPLG
HDADAIGLFRYGEHVVVVLMIFRGGKLVGSRHFEFDNIIEEDHELLTSFL
LQHYEGATEIPSEILLPSKISDEHPVEEILSARREQKVNLQIPQRGEKKA
LIEIAQKNAEALFKTQKDEATLREKTLLEMQELLFLTNYPTRIECFDNSN
IAGSEPVSSMVAFTDGLKDSKRYRTYRLKIGSKPDDYAAMYEVLTRRYKR
AKEENDMPDLVVVDGGKGQLNIAIKVFEELNITGVDLLGLAKEAGRHDKG
MTAEQVFTCYQKEPILLKANSPILFLLQKIRDEAHRVAISFHRKRRSKKT
LKSALDDIPGIGPAKRKTLLTHFGSLKKIELAADAELREVKGISAANIEA
IRTFFQGRKE
>pc0458 xerC, putative XerC Protein
MYIAACYQFLEHLKVVKNASEHTIRNYAIDLNLFKNYQEKQIFAESKLEH
ISPKICARESYQQRQSCHDGILKLEDIDRKTIRGFLAWLSANQQNKRTIA
RRLSSLRSFFRYLQTQNLIQINPTEELESPKLNKKLPVSLSYEQVSLLFE
QPDTTSYLGFRDRTIMELFYSSGLRVSELVSLDRQDFDYSNLTIKLKGKG
KKQRLIPITKNAAKWIQSYLLHIERYQNLETHSAESDSNAIFLNKWGTRL
TTRSVDRKFDLYLTKSGLAGKVTPHTIRHTIATHWLENGMDLKTIQLLLG
HRSLSTTTIYTQVSTKLKQKVYADAHPRA
>pc0783 xerD, probable XerD protein
MIRDLEDFFIYLASEKGLAQNTLEAYRRDLFSFATFLKQRSVNNWSQIHL
QAIIDYLALKQQQHYASASICRALIAIKVLFRFLKREGMITTNILLLMET
PKLWQLIPDVLSLEEIDRILAIPNIQTWRGARDKAILETLYACGLRVSEL
CQLKIYDVDDTFVRVLGKGGKERIVPIGQQAIAAIDGYLSFREGGENSRN
EFLFITKKSKPLTRALVWKLVKFYARQASIFKSISPHTFRHTFATHLLDH
GADLRVIQDMLGHASINSTDRYTHVSQIRLQQAFQAFHPRN
>pc0621 xseA, putative exodeoxyribonuclease VII, large chain
MTQAIKLNLESMFPFIYLQGEISNFKEQSSGHFYFSLKDATAQISAVMFK
AEASLLKTPPKGGDHVMIKGEISVYPPKGNYQLIIRELSYVGIGELLQKL
EQLKIKLHQKGWFKAIHKKPIPRFPKKIGVITSPTGAVIQDILQILTRRF
SGFHLILNPVKVQGEGAAKEIARAIEQFNRYQLVDVLIVGRGGGSLEDLW
PFNEEIVAEAIYNSQIPIISAVGHETDHCIADYVADIRAPTPSAAAEIVI
SEKNQQLEHLKTLRRRIQQAIQNLIQSGHYRLKGFSKHLFITHPHVITEW
RMQKLDDLKEDLSNQLKQIITFKKHQLESFARQTQLLKPSNQIIHLRKHL
RDWNGIFSRKMQDLLLQNKKKIEQIEYRLKQQWTYLIGQKKYLFKGKDYR
IKNNQLIRDRILSSKQKILHITNILKAVDPKNLLKQGYSILFAEKEVFVI
NSICKLKKGQKAKLLLSDGEALITINEVNPRE
>pc0620 xseB, putative exodeoxyribonuclease VII, small chain
MNNPSDQEPTASFETALCRLEEILEKMNSGTVSLDESLKLYEEADQLIII
CNKRLNDAERKIEILVKNRSGELTLGNDDKPIIQDFKIASTS