Jena Prokaryotic Genome Viewer

Gene list
Applied filters:
COG category: Replication, recombination and repair
Gene type: CDS
Genomic element: chromosome
Number of genes found: 138
Free access

Show UniProt / TrEMBL protein name	View in Fasta format (DNA)	View as list

# Mannheimia succiniciproducens MBEL55E, MBEL55E

>MS2015 unknown
MQYEHIHEKFRHLVTADNQERIAFLDEPRWLGYGVAKDIMDNLVSLMNKP
KRPRMLNLLIVGDSNNGKTTLIRRFFDLYGQAYIDSDSNAIYPILLAEAP
PSANEKELYISLLERFYVPYKPTDTIAKLRYQTIHLFREFRVKMLIIDEF
HSLLVGTPRLQRQVMNAIKMLCNELQIPIVGVGTRDAIRVLHTDPQHASR
FDVAELPTWKLDKDFQKLLFQFQGILPLKKCSNLHSPELATKIHTISGGN
LGNVHRLLTVCAVEAITSGTEQITLDIIEKNSWVQPTQGFRKIIG
>MS1646 unknown
MSNILNWPDYKVLQVSELEHDYQVHAEVSEPPTQCPHCNHPEIVGFGRRD
EVIMDTPVHGRRTGIMLNRRRYRCQSCRKTFLEPVPHKDEKRQMTNRLIQ
YIERESLRRTFSSVAEDVGVDEKTVRNIFNDYCERLEKTLNFEMPQWLGI
DEIHIIKPRCVITNIQQQTIVDMLDNRNKTTVTRYLSKRTDRDLVRYVAM
DMWRPYRQAVETMIPDATVIIDKFHVVRMANESLERARKAIRSALTPQQR
RGLMRDRFVLLKRRHELTDAEYMRFSGWTLNYPEIGQAYELKEAFFEIWD
CQTRHQAQEAYYSWLRQITPEMKAHYDPLIKAMGNWHDDIFAYFDHPITN
AYTESLNNLIRVVNRVGRGYSFEALRAKILFTEGFQKIKKPRYQRQRIPE
GAMGRMPFYGVAEAGPSTNYGADISTLVREIEAGRL
>MS0261 unknown
MLMGICALAFDFGTKSIGCAVGQSITGTAQALPAFKAQNGIPNWDSIEKC
LKEWKPDILVVGLPLNMDGTEQEFTSRARKFANRLHGRFGVKVELQDERL
TTTEARTEIFQRGGYKALNKSKVDGISAALILESWFERHS
>MS0980 unknown
MMILITYDVSLENEGGERRLRHIAKHCLDYGIRVQYSVFECEVTPAQWVE
LKDKLLNTYDKETDSLRFYQLGSKWKHRVEHYGAKRAIDMFRDILII
>MS1636 unknown
MRDRYLIVYDISSSKRRYYTHKYLSAYAVGGQKSFYECWLTNRELVEFKQ
KLINCIDKQEDKLFIFQLNKDTQPQLFGCASLPKFNQPYLII
>MS1650 unknown
MNIKFGKDKSPEIFSSIAEQTAEQIKSNKDKNKTTQLRKFYDELAMWNER
VQLAREDKEAKFQELVPFIKMLKAKVAYAEGRKHIDKNFSDVFNRCIDQA
NNAETLRDAKLFMEAVMGFCKLEELKR
>MS2298 unknown
MRRTFSAEYKAEAVKLVIERGYSVSQACRELGVGETALRRWISQVQAEQQ
GYVLAGSKPISPEQQRIRELENRIKELEEDKDILKKATAILMSLENKNTK
SLRR
>MS0986 unknown
MMSKVALQSAITNKNNAISPKKKPPNLPKIKELIMSIQNRYEFVYFFDVT
NGNPNGDPDAGNMPRLDPESSKGLVTDVCLKRKIRNFVELANENQAGYEI
YVKEKSVLNLQNKRAYEALEIEPEAKKLPKDEAKARDITAWMCKNFFDIR
SFGAVMTTEVNSGQVRGPVQLAFAQSIDPIIPLEVSITRMAVTNEKDLEK
ERTMGRKYIVPYALYRVHGFISANLAAKTGFSEEDLQKLWQALQLMFEHD
RSAARGEMAARKLIVFKHDSALGSVPAHKLFDSVKVERINGESGTPATGF
ADYQISIEKDKFNGVSVEELL
>MS0979 unknown
MRRTFSAEYKAEAVKLVIERGYSVSQACRELGVGETALRRWISQVQAEQQ
GYVLAGSKPISPEQQRIRELENRIKELEEDKAILKKATAILMSLENKNTK
SLRR
>MS1448 unknown
MTTKKQAVFSRLVNELVQKNQGKRIFSFDFENQTYWVKQPEKLTGVWKIL
KPHPKQSFREELHILKNLYERGAPVPQVILSGEDFFVLKDVGPTLNHWIE
NAGLNLTPAEKNQILVDAIKALTSLHKKGVTHGRPAIRDIAWRQGKVTFM
DFESHSRSLNLQWHKIRDVLVFIHSLCRSKHLSGEQIQYLINKYEEYCES
DLWQDVLNLVAKFRFLYYILLVFKPVARMDLIAIYRLFQYLLPLTEENK
>MS1401 unknown
MSVLHFIGIDVAKKKFDVAYLKDKERQMVKTKVLDNKPAGFNQLLDWIKK
NVSNDFSTIHITLEPTGVYHEALAYFLHDNGFVVNLINPARLPKFAEYKG
FVHKNDRGDCKLLALLGAENPHEYWQPEPLSIRQLKAKLSRLEALKSDLL
RENNRLEQAESGNLPDEVLQSIHHIRKALQDSIKALSQDIDDHINGNPEL
KKDKALLKSIPGVGDVITKQMLVVYHSKHFQKAADMAAFLGLIPKERTSG
TMKGKIMLSKRGSPQIRALLFLPAVAAKSYNPDIKAHYERLLAKGKTKMQ
AIGAAMRRLVHICFGVLKNKSVYQPQTILA
>MS1044 unknown
MHKLIIIRGHSGSGKTTFALKKIAEFKRQYPVGHVFHIENDHYLIENDKY
IWTEQRFRQARLQAQKTIYRAFRFCRKHNAPDCLIVISNVGVNKQEIQCF
VHQAEKQNMQVEIYRLRHFYPNTHHVPEDTVMSMYRHLCANPIEGEIIID
>MS1137 unknown
MYLRQLDISGFRGIKRLSIHLRPDMVLIGENSWGKSSLLSALSLILNVDN
GLYHFVPTDFHRADNMKDITLLFTFSESSINEEHEKFNPVYRHIFVPHED
GFERIYLRVSGDINEQNQVQTYYSFLDQQGQPIDVENVDFLVKELTHDHP
VYRFRDARLNRHKANSQPLKYAENIDAVSRELYAVTELVKYYFVETQEYA
QMSSDPGVLWDLAQSLCYRLEQRKNPELQQRLVNAITSLFEHNGKLNPGS
HRFMRPILLLEDVATRLHPRMVAIVWKLANYLPIQRITTTNSVELISQVN
LRSICRLVRYDDRTRAYQLNRRDLGKEDLRRLSFHVHHNRSRALFARTWI
LVEGETEVWILSELAELLGIDLDIEGIRIVEFAQSGIRPLIKYARAMGIE
WYALTDGDEAGKKYTETVKTMLLEHELLSNRVTTLPRQDIEHFFYSSGFE
NVFIRLARWEPQGGHYPIHKIIQKAIQRTSKPDLAITLSNEMANRGRDSI
PLLFKRLFSKVVSLTRTQES
>MS2157 unknown
MHSQRKTMIINTGGRTDTVHYYSKWLLKRFEEGYVLSRNPLFPNKVTRYE
LTPDKVDCVVFCSKNYRPILPDLHKITDRFNTYFHYTITAYGKDIEPGVQ
TIEKSVETLKRLADIVGKQRIAWRYDPVLLTEKYTIERHLETFDYLAREL
TPYVDRCIFSFVEMYKKLAVNMPEIILLTDEDKHRLAKAMGEIAQRYGLY
LQTCATEGDFSAYGIHGSGCMTLDIIGRANGVNFKSLKHKGNRQHCGCVE
SRDIGAYDSCPSGCKYCYANKSPAKARAMQQYHDPDSPLLLGHLRETDVV
TQSPQKSFLAPQQMDLIGLWG
>MS0803 unknown
MVGQFNQLEGKNMKLLAKLGAAALLAFTLAACSDPAADLKKLQAWDRDNA
AAQQQIQAELQQALSTVKEPSELEPVLASYKAKVQDLVKSLDQLDIKSNE
IKALKEKTKAVFLESQDVTADSLKVLVVSRTEETVNALKAKTEALNKNVE
ELMKLQNDLQAKFGDKTAETKPAEQAPAQPAEQAPAQPAQQPAEQAAPAQ
PAK
>MS0700 unknown
MKNLTALIEQLQAKVQQLTLQFAAFSDKKIYAKFDRTLFSEDFESGQFYF
DQIQHTLAQIAGLKETEIPQIQFFSEKLLAQCTALSDAINQNNGRKTAPT
PKIPSQREKIKHELNQLPPRERLVRYYEALQALNEKINELEDKRDTAHNE
QQKAGYQHQIDITLPRRKRCLEAIEVLEEYLSFKEN
>MS0981 unknown
MRKLQNTLYITTQGSYLHKERETLVVEQDRKKVAQLPVHSIGHIFCFGNV
LVSPFLMGFCGENNVNLAFFTETGRYLGRLQGRQSGNVLLRRAQYRISEQ
NPIPIARNIIAAKIQSAKRVLQRRLRNHGEHEEVQAAVMALNFSLQQLKQ
AENLDLIRGIEGDAAARYFGVFQHLLAEKNGFGFDGRNRRPPRDGVNALL
SFLYSILGKDISGALQGVGLDPQVGFLHADRPGRDSLAQDLLEEFRAWWV
DRMVLSLINRGQIKPQDFVTEDGGAVNMKPEARKLLFQSLQAKKQEKIVH
PFLQEEVEIGLLPYIQAMLLARHLRGDLAEYPPFLMR
>MS1647 unknown
MKFMQTHKIYLTPISPIHIGCGEDFEPTNYVIDNEVLFNFDPANLALNNR
QKTELLNRVNRLDLLSIQRFFLENKEKVLSSTYYFADVAEGLANDYKNKV
GKVAQRESDGNKVINNLSIERTAFLPVKHLPYIPASGFKGALATALLDQA
HQAKNNPRVNKNDHGKLFKEYIGEFAESKLRFVKFADFSPLVQAESKIYY
ALNFKKKVGKIGGEGRAMALRRECIKSGQYRAFLSELALMQGDANKMQIA
DYFTLLKNFYLPIFKQEAELLAERNLVNRHYLKQLEQLFNLPNVALIRLG
KNGADSKTYQADGIAQIKIMGAKGTPLNFKDSSTTVWLAGTNQQQQNDLL
PFGWAIIEADPTAENEPLKQWCDAQPKSKFNRSVILAKREEQKAKQAQLK
AEEEAKQQAKLAEEKAKAEMLNSLSDNQRLIMDFVEKLKNTSERQADNTG
SPLLKEAEALINQAIEWENAERQFACEQITVELLKSGIRITGLKQGYKRP
ASISRTSVDMSAP
>MS1272 unknown
MKNIRTFISIFLILLPLWAQAQREVKCRVVRVSDGDSLTCLARNNKQIKV
RLLDIDAPERRQPFGNKARQQLAQLIFKREITLRISGYDRYNRTLATVFN
EKNENINLKMVQLGLAWAYNQYSENPEYGKAEALAKKRKIGLWRETNPIE
PSRYRRELYKRNIQNKKQRTEKN
>MS1289 unknown
MFSLKRQQGASFEQQARLFLESQGLQFIAANQNFKCGELDLVMLDGETIV
FVEVRQRKNDHFGSAVESVDWQKQQKWINAASLWLATQNHSLEDTDCRFD
LVAFGATASNVQWLKNFIE
>MS1589 unknown
MNRRDHLLQELGITQWQLRRPDVLKGAINIAVEEHIRLLVIAECTLSARD
FFIQDVLRSAEIKLQDCLFLTFSQAAHLTVQHPVNYWLLSDEQGIIEQTL
TFCTLQNSLWQTPDLPRLKLDRRAKQALWKQIQTSL
>MS1382 unknown
MESRDIGAYDSCPSGCKYCYANKSSAKARACSNITIRIRPYCSGICVKRM
LSLKARKKAF
>MS1603 unknown
MRRTFSAEYKAEAVKLVIERGYSVSQACRELGVGETALRRWISQVQAEQQ
GYVLAGSKPISPEQQRIRELENRIKELEEDKAILKKATAILMSLENKNTK
SLRR
>MS1578 unknown
MRRTFSAEYKAEAVKLVIERGYSVSQACRELGVGETALRRWISQVQAEQQ
GYVLAGSKPISPEQQRIRELENRIKELEEDKAILKKATAILMSLENKNTK
SLRR
>MS0985 unknown
MRIISLSALQHYAFCPRQCALIHNEQLWAENFLTAQGNALHERVDSGEPE
TRKGVRFERSVHVSAEQLGISGILDMVECEIQTGKLKPVEYKRGKPKPKP
SDEIQLCAQALCLEEMTGKKVEEGALWYMQTRHRHPVIFSAELREKTLQV
INEVKTLLESGITPPPNYSKSCKACSLIDLCQPKLLERDKSGKYVVGLFW
E
>MS2166 unknown
MNNDLTTSAIARNNVLNNKYALAELETNLQLGGLSFEGETVFTKQQAAQI
LDVTERTIDNYIASSGDELEKNGYRILRGKSLKNIRLAYVDEMNFVDISP
KAPSLGIFTFRALLNLAMLVTESERAKFIRSRMLDIVIDVIAQKSGGKTT
FINQRDVDYLPAAYQEESYRKQFTNALRDYLEMSNVKYGIYTDKIYQIIF
CENTKEYRQILKLAEKDKTRETMYAEVLKAIGSFETGLAAGMKQKSEMLG
RKLTPTELNELLAEAASNPFLQPFILDARTKMSSRDLGFREVLHEKLEKY
IQAIPENDFERFLGERSRSLKEQLEDAETLAVLQRLKDR
>MS1010 unknown
MSHYIYLMQNGGINPTLRRNMPNYRRDFTTGGLYFFTVVLKDRSQDYLIK
YINEFRQAYKITQERYPFETVAICVLPDHFHLLMQLPENDSNYSVRIGFL
KSQFSKLLPLQCRKVSESDQKQGDAGIWLRRFWEHLIRNDEDLANHWDYI
YYNPVKHGYVQYVKEWQFSSFHRDVDKGIYPKDWSGCPDLIIKGEM
>MS1451 unknown
MSNLSFDFVENDFKPLAARMRPTTLEQYCGQQHLLGNGKPLRKAIEAGHA
HSMIFWGPPGTGKTTLAEIIAHKINAEVERISAVTSGIKEIREAIERAKQ
NRLADRRTILFVDEVHRFNKSQQDAFLPHIEDGTIIFIGATTENPSFELN
SALLSRARVYILKSLTNQDILHVLEQALADKERGLGNENLDLEEGILELL
ADYVHGDARLALNCLELMVDMADESEKGKKIDRTLLTEVLGERQARFDKQ
GDRFYDLISAVHKSIRGSAPDAALYWYARIITAGGDPLYVARRLLAIASE
DVGNADPRAMQVAIAAWDCFTRVGAAEGERAIAQAIVYLAVAPKSNAVYN
AFNQAKQLAKESADFDVPVHLRNAPTKLMKNLGYGAEYRYAHHEPNAYAA
GENYFPEELKDTVLYEPTNRGMEIKIQEKLAWLRELDKQSSVKRYK
>MS1331 unknown
MNKALLPVLVSSIFMLSACNEEKNIELAAQLQHYQQQVDQLKTELENANN
KLTQTQNELTAQQQAFPALKTTEEKIFTRNEEISFTENRPTGSGIINYYI
DTVKTSIPWLDKLLISQAIDILNQDAEPKDKLTINDSDSDQQKAVLTEKL
ENNYQRDLDILTANKLPGIDYIIETSYLGQRENLVSFSLFRHAYYGGERS
SFYTRYLNIDSETQSIIRLSDVIPPVKQKELKELLWNSYANALGNNKPYI
KKQNFYIAKDFYFTPDGMNFVYSPSSIAPFSAGEITLQLYWNEINTLING
QYIWHDIK
>MS1398 unknown
MTALLRWKSMKQTSLFSQNNTQNQPLASRLRPTSLDEFVGQKHLLEPGKV
LQQMIVQDELSSMIFWGPSGVGKTTLAQIIAHQTNAKFITFSAVVSGIKD
IKKIMEEAETDREMGEKTIVFIDEIHRFNKAQQDAFLPYVEKGSIILIGA
TTENPSFEINSALLSRCKVFVLEALSNNDIVLLLKQALNHPQAFIPLEVN
ADEKLLQAIAEFANGDARIALNTLELAVKNVEKQGNSVHLSENLLADILN
NRQIVYDKTGEEHYNIISALHKAMRNSDPDAAIYWLSRMLEGGEDPVYIA
RRLIRFAGEDIGLADTNALTLTTNVFQACRFIGMPECDVHLTEAVVYLSL
APKSNAIYQARCKVREDVKNTRNDPVPLHLRNAPTKLMKNLGYGKGYKLA
HHYEDKLTTMQTMPDNLLGKQYYFPTEEGNEQRFKARLAQIKQWKAEHK
>MS1635 unknown
MPTLYIDRRTTELKVNGDVLICYEKGERIATIPLASVDRLYMKGDINLQI
SLLSKLGEKGIGVVFLQGRKNKPMQFLPQPHNDAYRRVTQTYLADNKLFC
LTLAKNIVLNKCIKQCQFLAKFIEHNPKIITFIAELQKLFNLIVKQENID
SLRGIEGRMGAIYFAAFADILPRSLGFNGRNRRPPKDPVNAVLSLTYTLL
YSEATLAVYGAGLDPYIGFFHTLHFGRKSLSCDLMEPIRPSVDEWIAECF
TAEVLKIDQFSQTNEGCILGKEGRVIFYTAFEKVVSEWRKIFEKQAYELV
HLICGYQTEYHQDQFDDYTINMAHILGNEKCDI
>MS0139 unknown
MKKNTNSTRSNQSNSKPNQSKGEVRIIAGKWRGRKLPVLNAQGLRPTGDR
VKETLFNWLMPYIADAVCLDCFAGAGSLGFEALSRRAQGVTFLELDKQAA
TQLKKNLQTLNVPVEQGQVLNQNSLDYLKFGQNLPQFDLVFLDPPFHLGL
ADKAIELLGQNNWLKPDALIYVETERDKPLLTPPHWQLLKEKTTGQVSYR
LYQA
>MS0120 unknown
MAILPEVLMNIALDVKRAKARGDKLEPIYQRGCELTKLSRATLIRQLKPY
LPPSGRKVRSDKGTNQLELAELKTISAAWLENRRNQYKKRMLPLDELLAM
LRANGEIKAEFVDKATGEIRPYSESAVSRALINARLHPDQLLKPKPAIRM
RSLHPNHCWQIDPSLCVLYYLKRDHKQTENGLQVMEAKRFYKNKPANVAS
VESDRVWRYVITDHTSGVIYVEYVYGGETSENLCNTFINAMQRKPHGDEP
FCGVPKMVMLDPGSANTSKMFDNLCYQLGVKLQINEPGNPRAKGQVEKGN
DIVERQFESRLRFKSVANLDELNERAHEWMRAFNATKKHSRHGMPRYKAW
LHITKEQLVLAPSLDICRELMVSKLVERQVDGQLQVKFEGLTYDVSGVPN
LNVGDKLRLGKNPYRPDCIQVECFEQVFDENNEMSLKPYWFVVEPIETDK
FGLDVNAAVIGESYKSHAKTTLETNRETVERLAYGATDDDGVKAAKKANK
PLFDGRIDPFKTIDERPDVMFIPKRGQEHELTTNARRVEQKPVGLVECAK
QLKARFPQWNGKHYKQLATHFADGVPAELLETWLQDEKLPEILNPETKIL
KLSAA
>MS1803 unknown
MRRTFSAEYKAEAVKLVIERGYSVSQACRELGVGETALRRWISQVQAEQQ
GYVLAGSKPISPEQQRIRELENRIKELEEDKAILKKATAILMSLENKNTK
SLRR
>MS1634 unknown
MRYLIGYDITDSKRLQRIYRRMIKFATPLQYSVFLFNGTKEQLDKYMQTV
LRLYNKKEDDLRIYPLPVQAKYWQIGKNPMPEGIVLSTFVF
>MS1026 unknown
MITETLFNAENITANSPQLEQLKQLFPNCFDTSGHFLLEKFQAEIAQHTD
ISHEFYSMNWLGKSYAKLLRNLPPETLLAEDVEHNSKEENAHSQNVLIQG
DNLEVLKHLKNAYRNSVKMIYIDPPYNTGSDGFVYQDDRKFTPEQLATLA
NITPDEAERILNFTDKGSNSHSAWLTFMYPRLYVARELLKEDGVIFISID
DNEVAQLKLLCDEVFGEGNFVAKLPTIMNLKGNNDEFGFAGTHEFTLVYI
KNKNSVEDLNGIPLENEDLAEYSKEDEIGKYKQGATLMRTGEAGSRNARP
KGYYPIYVNTELTRMSLERQKEDDFEVYPKTTKGKDMSWRRSPETLSKTF
SEFIIKKTSSGISFYKKQRLEEDLEKGKKPKSLFYKPQYSSGNGTTLLES
LFGKRIFNNPKPIELLKDFISIGMGKNDLILDFFAGSGSTAHAVMQLNAE
DGGNRQFILVQLPEQTDTKSEAYKAGYKTIFDITKARIEKSAVKIREDFP
DASGAKSIDSGFKIYQTTDNFNAVAEDEFNPNQAQLPNLTSLTESQIQTL
LTTWRVYDGAKLTEIVQAVDLGGYIAYLCDKRLYLLHEHFNSQHLLTFIQ
KLDNDTAFNPNRVIVFGNHIESAMQQELNQALASYSNRKNISLSLIVRA
>MS0673 unknown
MDDIMSNYRRDFSPGATYFFTVVINQRSDGLLIKYINEFKQAYQDVVSYY
PFETIALTVLPDHFHLIMQLPENDSDYSKRISSLKYNFSSLLPTYYRNMN
LSRQFKREAGIWQRRFWEHLIRDDRDLDNHIDYVYYNPVKHGYVSQVMDW
KYSTFHRDVKNGIFELDWGSYISESVRNLYLD
>MS1649 unknown
MKLTNIIEIKAKLVLKTGLHIGAGDSEMHIGGIDNSVIKHSITQSPYIPG
SSLKGKIRTLLEWYSGEVKSEPLSINNVASANNSENVKNILRLFGFAGHS
ENNKELCQELKSSRLAFWDCALNEDWEKMIREDNQLLTEAKSENTIDRIT
ATAGNPRQTERVPAGAEFDFKLALRQFEGDSEELVKLVLKGLRLLELDSL
GGSGSRGYGKVEFQGLTVGGKEEKLPENPFA
>MS0009 unknown
MNNNYKKISPILTAVLLSACTAQVPLPKTCEDFINEYAKLSVDTKKIIPE
TLLGEDMRDYILADRYTLREKYQDSVNSSYQSIKTNLGRNAAEMSLKAIE
QSCYIGTEQIKALDFMQ
>MS2016 unknown
MNLPRYGGIMMSNSGFTEKRYHHRLDRGRIILQKGNIYLNREDGEQYELV
DYMDEPSQLLVRNLNTRTTKVVSIHQLENFKMNERTDLSVDLTAISNEYW
EKAQQKYEAIKPLLGMDQHRPYAVKARAEDVGVNPRTLYRWLQAYNSIGS
IAGLVDQKRGWQQGNSRLTPEQDKLIVQVINEFYLHKQRPTTEQTIREIR
RRCKIEKVESPSKETIRIRILHISEEERLRKRGQREKARNKFKPKPNSFP
DADYPLSVVQIDHTPVDLIIVDSKYRKPIGRPFLTVAIDIYSRMIVGYYL
SLDAPSVTSVAMCIARGILPKERLLLDLGLQGSEWNAFGYPVKVHVDNGP
DFQALDLSKSCSAHGIHLEFRPMGRPEYGGHIERVIGTFMKEVHSLAGTT
FSNIKERDSYDSEKEAIMTLDEFEKWLVHYIVNVYHKRVHSALGISPEQK
WKIGIFGDENEVGCGYPQLPVDEQTLLLDFLPSITRTIQHNGVTIDGLRY
YDVALNMYISDSDESGKSKEFLFRRDPRNISKIWFYDPKLKRYFPIPFAN
QAMPEMSIWEYREVRSRIANKGDKYINEQQVLDGLTEMREMVAESAQRTK
KARRQAERQKMHKASKPIIETKVETKAVVPVVVTSNLLALDDESLSFGEV
D
>MS1390 unknown
MEFPLSITANINSHEGNFSRELELRSALTFIVGPNGSGKTHLLKGLKESF
SGFTEKKVRFLSAGRLGPLEQYRSNYDQFDRSNESDNARHGNKNEREYRH
KIENINGDLHTLSARPDILIKVRERLQKLFKRNIDVDWDAGSLKISFSRL
GATNTYYSSGREASGLLHLVGILSALYDDEVGVLLIDEPEVSLHPQLQAF
LLKEIQRAAGIPNDDDYKKLIIMATHSTEMLKISNSNSLLNFIFCNDLKE
NPIQIAQNAGELNNKKVKGLIARLGQEHKLALFSKTPLLVEGPSDVIICN
ALSDKLYLNLEAAGSQILPINGKEAMPETVKLLRLMGKNPTVLVDADAFA
DGLNLVNAYFNNTEIKEKANELASKQGNADILSWAKQVYDDFCNAVTNNW
NEISEQAQSHPYFSLSDDVDKKDDIDKKNKRSALCTLFVSENLAKEWTNI
KNRLDVLFSIFQECGLFILKKGAIESYYSTAQFESDDKVDKSVAESENID
SLPSDKIDSLREEYKDVIDCLMYASNSEKIDESRAIRDELLSFITPIHAR
YSEGETSFNKPSTIFSYGINNRDELEISMSSKVLDVKGFPIILRKNDNVT
TVVNSALGLK
>MS0637 ada, Ada protein
MDSIYYSYYSSPVGNLLMIAQQGKLTNLDCELEQTAPNPKWILNNELPLF
RQVKSALDRYFSGEKEDFSDIPLNPQGTTFQQSIWQALRRIQLGKTTSYG
ELARLINNPKAVRAVGGAVGSNPISIIIPCHRVLGKNGQLTGFGGGLPMK
RFLLNLEKIRYVDKGVEYVKQKLLKKYTA
>MS0939 cDC9, CDC9 protein
MMLLENYKNQDITGWVMSEKLDGVRGYWDGKQLISRQGGVLAAPDYFLEN
FPPFPIDGELFSQRDQFAEISSITRSQQDKGWHKLKLYVFDVPEAPGDLF
TRLATLKNYLKTNRTSYIEIIEQIPIRDKNHVRQFLQQVETQKGEGVVLR
NPNAPYENKRSTQILKLKSHLDEECTVIAHHKGKGQFANALGALTCKNQR
GKFRIGSGFTLEDRVNPPAVGSVITYKYRGLTKTGKPRFATYWRKREDLQ
ETP
>MS1748 comEA, ComEA protein
MTTLFLILCIGSKKYTVFLCMNRLFPESNVVATEQRYFNFKRESLMKLSV
RKFLLSCLAAGSLLSAGTAFAADKVPASAETQAIKTSETAKPADNIGNTV
NINTATAEEIKQTLIGIGAKKAEAIIQYREKHGNFTNVEQLLEIQGIGEA
TLDKNKDRIKL
>MS0826 comEA, ComEA protein
MKEKTKSTKNQLSESAKERMETAKNSVTSTKDKAASMKPTVKNALNSSSK
VNINTADAKTLQSLTGIGEVKAKAIVDYRKKVGKIKNASELSNIDGIGDA
TIEKITPYLNF
>MS1967 dam, Dam protein
MSHSGKTKHGLKHRSFLKWAGGKYRLTDNINNLFPKRRKCLVEPFVGAGS
VFLNSQFERYILADINADLINLFNTVKTDVDAYIEALKPVFFHAEANSAG
YYYARRDDFNNSTDPFFRSVLFLYLNRFGFNGLCRYNSLNEFNVPFGAYK
SHYFPEKELRYFAEKAKSAVFICADFNETFKLADDESVIYCDPPYAPLLQ
DSNFTKYAGNDFSVTHQQALAELAKQTVNERNIPVLISNHDTAFTREIYH
GAKFKRIKVQRTISQAAERRVKVNELIAVFK
>MS1361 dinG, DinG protein
MANIDQIKAAFSERGQLSSNIKDFRPRSEQLEMAEAVGKAIENKGVLVVE
AGTGTGKTFAYLTPALLSKKKTIVSTGSKNLQDQLFKRDLPTIQKALNYS
GKIALLKGRANYLCLERLDQVIAQGVLGDKSVLVDLSKVRKWNNATKTGD
LSECVELAEDSPILPQLTSTTESCLGSDCPNYGDCYVAAARKRALAADLV
VVNHHLFCADMAVKENGFGELIPNAEVIIFDEAHQLPDIASQYFGQSITS
RQLFDLCKDINIVYRTEIKDMPQLGVASDHLLKMVQDFRLLLGEGNNRGN
WREWLVKPDVQKGFKVLQEKLDFIADVVKLALGRSQTLDSIFERISALKA
QLVRLSDTSVTGYCYWFETFNRQFGLHITPLTVSDKFGEQMNNHESAWIF
TSATLEVGGSFNHFRQRLGIRATDEKVLQSPFNYPEQALLCVPRYLPGSN
QNHTMTKLAEMLLPVIEANKGRCFVLCTSYFMMKGFAEYFREHSGLSILL
QGEISKTKLLEQFVSEEHSVLVATSSFWEGIDVRGDALSLVIIDKLPFTS
PDEPLLKARVEDCQLQGGNPFNDIQIPEAVIALKQGGGRLIRDVTDSGAV
IICDSRLVTRPYGETFLKSLPNAKRTRDLNKVVEFLKSIQQNRT
>MS1135 dinP, DinP protein
MHKLRKIIHIDMDCFYAAVEMRENPALRDKPIAVGGSVQQRGVLTTCNYP
ARKFGLHSAMPTGQALKLCPDLILLPVNITLYKQVSHQIKQIFHRYTDNI
EPLSLDEAYLDVTDCVQCSGSATWIAEEIRRAIFNELHLTASAGVAPLKF
LAKIASDQNKPNGIFVITPGEVDNFVKTLPLSKIPGVGKVTGQKLLQMGL
KTCGDVQKLDLTVLLNRFGKFGQRIWQYSHGIDEREVQSHWQRKSVGVED
TLLRNITDIEQGIVELERLYPILEQRIKRACPDIPFERFRKLGVKLKFED
FQVTTLEKSAVEFKRENFIVLLRQIWQRRQGRAIRLVGLQVTIPEQKAEQ
QMSLW
>MS1878 dnaA, DnaA protein
MSEHQLPLPIHQIDDETLDNFFVGHNDLLVDSLSKNIACLKQQFFYVWGA
EGSGKSHLLKAVSNQFLLQNRPAIYVPLSKSQYFSPAVLENLEYQDAVCL
DDLQLVVGNEEWEIAIFDLFNRIKEKENTLLLISANQSPNALPIKLPDLA
SRLTWGEIYHLNVFTDEEKILVLQRNAHERGIELPDETANFLLKRLDRDM
HTLFDALLKLDKASLQAQRKLTIPFVKETLGL
>MS0485 dnaA, DnaA protein
MERDLSQLWQNCLLQLQDQISSSDFGLWLRPLQADTSMPNTIVLYASNMF
VKSWVENNYLAQITKIAQDLSNNTDLVIKVQEGSKPAARKVVAQQEIANT
PVQHSAPMPENEPQAAFRSNLNQHHLFENFVEGKSNQLARAVGQKVANRP
GDKSANPLFLYGGTGLGKTHLLHAVGNGIIAGNSNARVVYIHAERFVQEY
VKALKAERIENFKKFYRSLDALLIDDIQFFAGKDGTQEEFFNTFNSLFEG
EKQIILTSDRYPREIEKIDDRLKSRFSWGLSIAIEPPDLETRVAILMKKA
EEKNIYLPEEVAFFIGQKLRTNVRELEGALNRVHANADFTGKAITIDFVR
ETLKDMLALQDKLVTVENIQKMVAEYYRIKVSDLKSKNRSRSIARPRQLA
MALAKELTNRSLPEIGKAFGDRDHTTVLHACRTIAALRDDDNNIQEDWSN
LIRTLSA
>MS1183 dnaB, DnaB protein
MVYDIAVFSVLIESFFMARQPSQSPDKQTAQINIPPHSIEAEQAVLGGIM
LNNSHWENVVEHVITEDFYTAAHRLIFREMEELARQNHPIDLITLDQALK
NKGVVEDVGGFAYLAELSKNTPSAANIIAYADIVREKAVLRELIGVGNTI
AQSAYSPKGREVKEILDEAEREVFKIAEKRSAENEGPENILNVLERTIDK
IEFLSKNQHANGGVTGVTTGFKDLDKKTAGLQPSELIIVAARPSMGKTTF
AMNLCENAALSSEKPVLIFSLEMPADQIMMRSLASLSRVDQTKIRTGQIT
EDDEWARISSTMGMLTNKPNMYIDDSAGLTPTELRSRARRVYRENGGLSL
IMIDYLQLMRAPGFDNRTLEIAEISRSLKALAKELEVPVVALSQLNRTLE
NRTDKRPVNSDLRESGSIEQDADLIMFIYRDEVYHETTEENHNVAEIIIG
KQRNGPIGRVRLTFQGQYSRFDNYAGGHQFNDDDY
>MS0574 dnaE, DnaE protein
MPEPRFVHLRVHSDFSMIDGIAKVKPLVKTCVQENMVAMALTDFTNFCGL
VKFYGEALGSGIKPIMGADVSVKSDLCGDEHFELTLLAKNNAGYKNITLL
LSKAYQRGYEDVPYIDQDWLAEYNEGIIVLSGGRKGDVGKKLLKTGAADE
VESAVGFYQKYFPDHYYLSLSRTGHNEEETYIKTALKLAEKHNLPVVATN
DVVFLKSEDFEAHEIRVAIHDGFTLDDPKRPKLYSDRQYFRSEQEMCELF
ADIPSALENTLLIAQRCNVTIRLGEYFLPQFPTGELSTEDYLIKRAKDGL
EERLKVLFPDEKEREEKRPAYDERLDTELGVINQMGFPGYFLIVMEFIQW
SKDNNIPVGPGRGSGAGSLVAYALKITDLDPLEFDLLFERFLNPERVSMP
DFDVDFCMDNRDKVIEHVADMYGRGAVSQIITFGTMAAKAVIRDVGRVLG
HPYGFVDRISKLIPPDPGMTLAKAFDAEPQLQQIYDSDEEVKALIDMARK
LEGVTRNAGKHAGGVVISPTLITDFSPLYCDSEGKHPVTHFDKNDVEYAG
LVKFDFLGLRTLTIIKWALDMINARMDRDGKPHIDINHIPLDDPESFNLL
LKSETTAVFQLESRGMKDLIKRLQPDCFEDIIALVALFRPGPLESGMVQN
FIDRKHGREEVAYPDAQYQHECLKPILEPTYGVIVYQEQVMQIAQELAGY
TLGGADLLRRAMGKKKPEEMAKQRSVFEKGAIEKGIDGELAMKIFDLVEK
FAGYGFNKSHSAAYALVSYQTLWLKTHYPAEFMAAVMTSEMDNTDKIVGL
YDECLRMGLTVTPPDINTGKHHFSVNDHGEIVYGIGAIKGVGEGPIEALV
SAREKGGIFKDLFDLCARVDLKKINRRTFESLIMSGAFDKLGPHRAALSK
NLEDALKASDQHAKDEAAGQADMFGVLTESPEEVEIAYANTPRWSEKQIL
DGERETLGLYLSSHPISRYLKELSHYSPNRLKDLVPNIRGQVSTASGLVV
ASRFAVTKKGNRLGIATLDDRSGRLDITLFAEALEKFGEKLQKDSVVVVS
GQVSFDDFTQGLRMSVRDLMTLDEARSRYAKSLAISLSQQQITPQFLKRF
KSVIEPYSGGTMPINVYYQSPQGRALLKLGIQWYIKPTDELLSELVNMLG
ESAVELEFE
>MS1761 dnaG, DnaG protein
MGVPIPRSFINDILAKADIVDVVNSRVKLKKAGTNNYQACCPFHHEKTPS
FTVSKNKQFYHCFGCGAHGNAIGFLMEYDKLEFLEAVEELANFLGLEVPR
EAGSDKKFEKSQPHYQNKRNLYELMHDIAEFYRQQLPHSIPAQAYLQKRG
LSEEVIERFAIGFVPDSFNAVLRRFGTTKAEQQKLFDLGMLSRNDRGDIY
DRFRNRIMFPIRDRRGRTIAFGGRVLTDERPKYLNSPETLTYHKGNEIYG
LYEALQINDSPEMLLVVEGYMDVVALAQFGVNYAVASLGTATTAEQIQLI
FRASEQIVCCYDGDRAGREAAWRALENALPYLQDGRQLKFVFLPDGEDPD
TYIRQYGKDAFEDYIQKALSLSDFMFTHLIEQVDLSSKEGKSKLAALAVP
LIKRIPGQMLRLYLRNILAQKLGIIDQTQLESLIPSKIEQPEAAIEKSPA
VKRTPMRLLIGLLLQNPQLAQLDYDLEPLKSLNEPGFELFYALTKLCRDN
MGITMGQILEYWRDSQYSKPLEILAIWDHLVTDDKIQETFLETLLYLYVR
FTDQNIERLIAKDRSTGLSPEEKQELAQLLARPQQNNS
>MS0486 dnaN, DnaN protein
MRERAMQFIVSRDNLLKPLQQVCGVLSSRPNIPVLNNVLLQIADDCLTIT
GTDLEVELSTQAKLISGTEGKFTIPAKKFLDICRSLPDEAEIHVTFEEER
AIVRSARTKFNLATLPAEEYPNLADWQSEVDFTTEQATLRRLIEATQFSM
ANQDARYFLNGMKFETEGNLLRTVATDGHRLAVCTIALEQDLQNHSVIVP
RKGVLELARLLEATDAPARLQIGTNNLRVQLANVVFTSKLIDGRFPDYRR
VLPRNADHILEADWDVLKQAFVRAAILSTERFRSVRLQLDQNQMKITATN
PEQEEAEEIIDVSYSGNEMEVGFNVSYILDVLNALKCQRVRMRLTDASSS
CLIENCEDASAEYVIMPMRL
>MS0702 dnaQ, DnaQ protein
MVTETQNETETTEKIDYNLLKNRFRGYYPVIIDVETAGFNAKTDALLELA
AITLKMDENGLLVPDQKCHFHIKPFEGANINPESIKFNGIDIDNPLRGAV
PESEAITGLFQMVRKGQKNAGCQRSIIVAHNATFDQSFVMAAADRTKIKR
NPFHPFSSFDTASLSGLMFGQTVLVKACQAAHIAFDGKQAHSALYDTERT
AELFCYMVNHLKALGGFPHIAEN
>MS1570 dnaQ, DnaQ protein
MKVEIDLNRQILLDTETTGMNQFGAHYEGHCIIEIGAVEMINRRYTGRKL
HLYIKPDRLVDPEAIKVHGITDEMLEDKPVFTEVAQEFIDFIKGAELLIH
NAPFDVGFMDYEFRKHHIDVKTADICSVTDTLQLARQMYPGKRNSLDALC
DRLGIDNTKRVLHGALLDAEILGDVYLVMTGGQTSLFDDNEPELADIHSA
KAHILAQNADKVAHHLSLLQPTDEELQAHLEYIKLINKKSKDNCLWEKRL
GSDSNEETQH
>MS0871 dnaX, DnaX protein
MSYQVLARKWRPKNFAEVVGQEHILAALSNGLRENRLHHAYLFSGTRGVG
KTSIARLFAKGLNCMDGVTAEPCGKCAHCKAIEEGNFIDLIEIDAASRTK
VEDTRELLDNVQYKPVQGRYKVYLIDEVHMLSRHSFNALLKTLEEPPEYV
KFLLATTDPQKLPVTILSRCMQFNLKALDQKQISHHLQHILKEEEIPYEM
TALDKLAKAARGSIRDSLSLTDQAIAMSNGNISRDVVRVMLGLLDDNQPI
EILYALQQGNGENLMKVIQAVADKGGNWDELLIEVGETLHQIAMQQLLPS
TSNDETQIGFLAKHIAPEDVQLFYQIVVNGRKELAFAPNPRIGVEMTLLR
ALAFHPKLVQSQPSQQEQLSNVQTYVQSAVKKTENLVDMPVVSQSIKAKY
ESPAHSAAANAEQPSSAALSALEQIQKLRSQASGNGEKKNVNVTSSPLTE
TDSSSLSDLSETSPKVTALPVVTMQNKSKKQADLLDRLVNLSNSKNTETE
NAEDSAENTENDSEDETNLAETYRWEWTNPELAQEETAVRPSDIKKAILQ
EKTPEVITKVIAMADERDEWTKTVSQLHLDELKLVKQIALNSVVLIQHEN
EMKLGLRSAQKHLVRDKSVEILQDALTKFYGKTINLTIDFNDDESLFTPL
DHRRQIYQELSEQAKEDLLKDKKVRLLQDMFDAKLDMDSIRPV
>MS0531 fis, Fis protein
MLEQQRSPSDALTVSVLNSQSQVTNKPLRDSVKQALRNYLSQLDGQDVND
LYELVLAEVEHPMLDMIMQYTRGNQTRAATMLGINRGTLRKKLKKYGMG
>MS0875 gyrA, GyrA protein
MSEINYEGIEQMPLRTFTESAYLNYSMYVIMDRALPFIGDGLKPVQRRIV
YAMSELGLNATAKYKKSARTVGDVLGKFHPHGDTACYEAMVLMAQPFSYR
YPLVDGQGNWGAPDDPKSFAAMRYTESRLSKFAELLLGELGQGTVDYQPN
FDGTILEPQYLPARLPHILLNGTTGIAVGMATDIPPHNLNEIADAAVMLL
DNPKATLDDILTLVQGPDFPTEAEIISPKEEIRKIYENGRGSVKMRAVWK
KEDGEIIITALPHQASPSKVIAQIAEQMTAKKLPMVEDIRDEADHENPVR
IVLVPRSNRVDSEALMAHLFATTDLEKNYRVNMNMIGLDNKPAVKNLLQI
LTEWLSFRRSTVTRRLQYRLDKVLSRLHILQGLMIAYLNIDEVIHIIRNE
DEPKPVLMARFELSDEQAEAILNLRLRHLAKLEEHELQAEKDQLEQERAQ
LEQILSSERRLNTLIKKEIQQDAKTYASPRRSPIVERAEAKAISESEMIP
AEPVTVILSEMGWVRCAKGHDIDPQGLNYKAGDKYLAHACGKSSQPAVFI
DSSGRSYALDPLSLPSARSQGEPLTGKLTLPAGASVDYLLIENENQQLLM
ASDAGYGFICKFEDLIARNKAGKAVISLPENAKVLPPKNIENSTALLVAL
TAAGRMLIFPVKDLPSLSKGKGNKIVTIPAASAKERTDLLVKLLLISENS
SLVFHSGKRKITLKPEDLQKYRAERGRKGTQLPRGLTSQAEITVVEPN
>MS0858 gyrA, GyrA protein
MTELVQDITPVSIEEELKSSYLDYAMSVIVGRALPDVRDGLKPVHRRVLF
SMNQSGNTYNKSYVKSARVVGDVIGKYHPHGDSAVYDTIVRMAQPFSLRY
MLVDGQGNFGSIDGDAPAAMRYTEVRMQRITQELLTDLDKETVDFSPNYD
GKEMIPDVLPTKIPSLLVNGSSGIAVGMATNIPPHNLGEVMDGCLAYMDN
EDISIDELMQFIPGPDFPTAALINGRRGIEEAYKTGRGKVYVRAKASVEI
NDKGREQIIITEIPYQVNKAKLVEKIGELVRDKKIEGIAGVLDLSNKEGI
RLEIDIKRDAVGEVVLNHLYALTQMQVTFGINMVALDHGQPRLFNLKQII
EAFVKHRREVVTRRTVYELRKARERAHILEGLAIALANIDPVIELIRASK
TADEARENLLSRAWSLGNVAPMLEAAGVDASRPDGLAAELGAHDGQYFLS
ETQARAILELRLHRLTGLEHEKIVEEYHEILLQIGELIRILTSSVRLNEV
IREELELVKSTYNDERRTEITAASGDINLEDLIAQEDVVVTLSHEGYVKY
QPLTDYEAQRRGGKGKSATKMKEDDFIERLLVANTHDTILCFSSRGRLYW
LKVYQLPEASRGARGRPIVNILPLEDNERITAILPVASYDEDKFVVMATA
CGIVKKTALTEFSRPRANGIIAVNLRDEDELIGVDITDGSNEIMLFSSQG
RVVRFAEAAVRAMGRTATGVRGIKLALTNDISDDESAVEIEEISDDNAED
TLDLNIDKVVSLVIPKNEGAILTATQNGYGKRTALNEYPTKSRNTKGVIS
IKVSERNGKVVAATQVEETDQIMLITDAGTLVRTRVSEVSIVGRNTQGVR
LIRTAEDEHVVSLERVAEPEEDEFDAESPETAVENSEE
>MS2249 gyrB, GyrB protein
MSENTQENYGASSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDN
AIDEALAGYCKDIIVTIHEDNSVSVQDDGRGIPVDIHPEEGVSAAQVIMT
VLHAGGKFDDNSYKVSGGLHGVGVSVVNALSDKLQLTIRRQGHVYEQFYS
LGEPNEQLKNIGETDKTGTTVRFWPSPTIFSNTVFEYEILKKRLRELSFL
NSGVSIKLFDERDGANDHFHYEGGIQAFVEYLNQNKTTIHPKPFYFSIEK
EGIGVEVALQWNDGYNENIYCFTNNIPQRDGGTHLAGFRGALTRTLNSYM
DKAGLNKKGKNDKDKVETSGDDAREGLVAVISVKVPDPKFSSQTKDKLVS
SEVKGAVESAMNERLQEYLEENPNDAKIIATKIVDAARAREAARKAREMT
RRKGALDIAGLPGKLADCQERDPAFSELYLVEGDSAGGSAKQGRNRKNQA
ILPLKGKILNVEKARFDKMLSSQEVGTLITALGCGIGRDEYNPDKMRYHK
VIIMTDADVDGSHIRTLLLTFFYRQMPEIIERGYVYIAQPPLYKVKKGKQ
EQYIKDEPAMTQYELAIALEDAALYVNANAPAMTGLPLEKLVADYNNTHQ
MIERLHRRYPEALLKELIYYPQLTTELMKDTGATEEWTKNLIAVLTEKDT
QGNSYSFRLQYDTERQVNDIILTVRTHGVDTNYTLNYQFATGNEYARIVK
LGNQLKGLLEDGAYVTRGNGKLEISSFEQAIEWFVKESRKGLTVQRYKGL
GEMNPEQLWETTMDPDARHMLKVTIKDAVAADQLFTTLMGDEVEPRRDFI
ESNALRANLDI
>MS0878 gyrB, GyrB protein
MANNYSAEDITVLKDLEPVQLRPGMYTDTSRPNHLGQEVIDNSVDEALAG
FANKIEVILHKDQSLEVIDNGRGMPVDIHPTEKVSGIELILSKLHAGGKF
SNKNYEYSGGLHGVGISVVNALSELVEVIVKRDGQIYKIVFSNGQKIEEL
QVIGTCGRRNTGTTVRFKPNPKYFDSDKFSVTRLRHLLRAKAVLCSGLEI
KFTDKVNDTEESWCYQDGLSDYLIEAVQGYNALPQTPFIGDFSADSEAVS
WALLWLPEGGELIAESYVNLIPTIQGGTHVNGLRQGLLDAMREFCEFRNL
LPRGVKLVADDIWDRCAYVLSLKMHDPQFAGQTKERLSSRQSAVFIGGVV
KDAFSLWLNQNVEIGQQLAELAINSAQRRLRASKKVVRKKLVSGPALPGK
LADCSQQDLEKTELFLVEGDSAGGSAKQARDREYQAILPLRGKILNTWEV
SSDQVLGSEEVHNIAIALGIDPDSDDLSQLRYGKVCILADADSDGLHIAT
LLCALFLRHFPKLVQQGHVFVAMPPLYRIDLGKEVFYALDESEKEGILDR
LKSKRGKPNVQRFKGLGEMNPSQLRETTMEPNTRRLVQLTYEQDETNMTE
TFELMDMLLAKKRAEDRKNWLQTKGDQVDLTV
>MS0195 hepA, HepA protein
MSFAVGQRWISESENDLGLGVIVGMDNRTVTILFPASDEQRVYALAAAPL
TRVEFQKGDTVVHHEGWKAQIIDVTENNGVLIYLTIRLDTQEEAVLREMD
LAHKISFSKPQERLFGAQIDRSDRFTLRYHALQQQQAQFQSPLRGLRGIR
AGLIPHQLHIANEVGRRVNPRVLLADEVGLGKTIEAGMILQQQLFAGKVE
RVLIIVPETLQHQWLVEMLRRFNLHFSLFDEERAADFAANEYDEERNPFE
SENLIICSLDWIVAQPKRAQQILQAEFDMLIVDEAHHLVWSERQPSMAYQ
VVEQLSRRIPAILLLTATPEQLGQESHFARLALLDPDRFYNYDAFVAEQK
NYQPVAEAVQTLLNEKPLNTAEQNAIADLLEEQDVEPLFKVINSMAEESE
RLQARQELIDNLVDRHGTSRILFRNTRQGVKGFPHRIYNQVTVEMPKQYV
NAVKVMNLLGEEIGDGLFYPEQIFQKMNPEAKWWEFDPRLEWLITFLKNH
REEKVLVICRHANTAIQLEQALREKEAIRSAVFHENMSIVERDRASAYFA
LQEEGAQVLLSSSIGSEGRNFQFACHLVLFNLPDNPDLLEQCIGRLDRIG
QTRDIRIHTPCFADTPQVVLARWYHEGLNAFEETCPMGMTIFTECGEKLK
NFVKNPTQLDGFEEFVAQTRKRQQVLKQELENGRDRLLELNSNGGERAQK
LAEHIADEDNSTALVNFVLNLFDVIGIEQEDLGEKSIAIIPASTMLVPDF
PGLKEEGVTVTFDRRLSLAREELEFLTWDHPIVTNGIDLITSGDIGKTAV
SLLINKSLPPGTLLLELIYVVESQSPKGLQLTRFLPPTPVRLLLDAKGNN
LAAQVSFQALEKQLRPVKRNMANKMAKMIRPNIERLIAGGDKHIAEQARE
IIQSAKQKADQTLSAELDRLNALKAVNKNIRQDEIDILAQIREQSLTQLD
QANWRLDSLRVIVSNKE
>MS0185 himA, HimA protein
MNKTDLIDAIASAAELNKKQAKAALEATLDAITASLKAGDSVQLIGFGTF
KVSERKARTGRNPQTGAEIQIAASKVPAFVSGKALKDAVNG
>MS1089 himA, HimA protein
MTLTKVELADNLIEKHGLNKSEAKALVEDFFEEIRVALEKGNDVKLSGFG
NFELREKASRPGRNPKTGESVPVSARRVVVFKPGQKLRARVEKTKPKS
>MS1475 himA, HimA protein
MTKSELIESLVEKNHSISVKSVENAVKEILEHMSQALESGDRIEIRGFGS
FSLHFRQPRVGRNPKTGAQVKLDAKCVPHFKAGKELRERVDFNA
>MS0332 holA, HolA protein
MNRIFAEQLSPSLAGRLAKVYLLVGQDPLLLSESQDNIIQAATKSGFDEK
LEIQIDNGTNWNDLFERCQSMGLFFSKQVITLHFPENPTALLSKNLAELI
SLLNSDLLLILHFGKLTKLMEKQDWFIQSEQYDRNAVLVNCQTPTAEQLP
RWVANRCKAMGLIAEQDAVQLLCYSYENNLLALKQTLQLLDLLHADHKLT
FVRVKNIVEQSSVFTPFQWIDALLEGKEARARRILTGLQAEDIQPIILLR
SLQRELTILLQLAKPQHKTASVDSALPVAQLREGFDRLKIWQNRRPLFTQ
AFQRLTYRKLYLAVQQLAELERLAKQEFSADIWDQLANIIPKICR
>MS0570 holB, HolB protein
MGKFNFVMTAIIYPWLQSYYERITAAFQQGYGHHALLFRAEQGIGADQLI
HAVANWLMCQHSSPRPCGECHSCRLFAAGNHPDVYQLAPVENKDIGVDQV
REINEKVSQRAQQNGNKAVYVQSAERLTESAANALLKTLEEPRPNTYFLL
NADLSSPLMTTIYSRCQVWLINTPSEQQALNWLQLHNYSEISEIQTALRI
SYGRPLLALHCLEQGWLEKRREFFRAFWLFYTRRSPLELLPLFDKELILQ
QVDWLLAFLSDALKDKLNITSGWICRDLIRGIQQFNERQTVAGLLTATKI
MQKVRSDLVQINAVNQELILLDGLTRLITEVFEH
>MS1557 holC, HolC protein
MPKQAQFYLIEKTQADNALSATEALACNLAADAWRLGKKVLIACETEEQA
LNLDEALWQRDAEQFVPHNLSGEITNYATPIEISWQGKRNAQRRDLLISL
QNNVPDYAQSFNHVIDFVPAEEERKAVARERYKLYRQLGFEMVMEKA
>MS1437 hrpA, HrpA protein
MMKMKTPKREFNALQKSLAEQIEDVMIVEQSRLLARIRGLGQIKKEQSQQ
AAALDIEQQIQQAKLRLELRKSAVKNPIVFPENLPVSQRKTEIQKLIAQN
QVVIVAGETGSGKTTQLPKMCLELGFGQKGLIGHTQPRRIAARSVAARIA
EEMQTELGGIVGYKVRFNDQIGEDTQIKLMTDGILLAEIQTDRFLNRYDC
LIIDEAHERSLNNDFILGYLKQLLPRRPDLKVIITSATIDVERFSKHFNN
APIIEVSGRTYPVEVRYRPVAETEEQDQLQGILNAVDELQAEGRGDILIF
LSGEREIRDTAEALEKQNLRHTEILPLYARLSAQEQNKIFHPGGLNRIVL
ATNVAETSLTVPGIKYVIDPGTARISRYSYRTKVQRLPIEPISQASANQR
KGRCGRVSEGVCIRLYSEQDFNNRPEFTDPEILRTNLASVILQMTALGLD
DIEAFPFVDAPDKRHIQDGIKLLEELGAFEWQKSPPSAFGTSPRKRGEGN
LASNSSLPPFTGGAGHSPEGGKRVLTQTGRQLAQLPVDPRLAKMLLSAVD
LGCVLEVMIIVAALSIQDPRERPQEKQQSADDKHRRFADKKSDFLAFLNL
WNYIQEQQKVLSKNQFRRLCQKDYLNYLRVREWQDIYHQIRLTVREMGLP
INSEPAQYPQIHSALLSGLLSHIGMKEAEKQQYLGARNAHFAIFPNSVLF
KKQPKWVMAAELVETSKLWGRMVAEIDPEWVEPLAKHLIKSSYSEPRWSK
SRGQVIANEKVSLYGVPIVASRPVNYGAIDPQTSREIFIQSALVEGDWHT
RHKFFFENQKLIREVEDLEHKSRRRDILVDDRTLFEFYDSRIGADVVSQK
HFDSWWKKAAQQDPELLNFEKSFLMKEDAQKVSQLDFPNFWHQGNLKLKL
TYQFEPGTDADGVTVHIPLPLLNQIEMQGFDWQIPGLRHELIVSLIKALP
KSLRRNFVPAPNYAEAFLARVANFDKPLTETLSYELRRMTGVNVEVEEWK
LEQIPPHLRMTFRVIDEKGKKIAESMNLDELKFGLKDQVQQSISAVADDG
IEQSGIHIWNFDSLPQCYEQKKQGFTVKAFPAITDEKEAVGIKLFETEYE
QSVAMQQGLRRLILLNVPSPIKYLHEKLPNKSKLGLYFTPFGKVLDLIDD
CIACAVDKLIADFGGFVWNERDFERLRDFVRENLNEITVDIAQQVERLLT
LTFEINKRLKGKMDFTMAFALSDIKSQLAGLIYPGFVEKTGYARLPDIQR
YLQAIDKRMDKLAQDINRDRAAMLRVEQCQQAYQQLLAKLPKSKPLSTEV
LEIRYMIEELRVSLFAQQLGTKYPVSEKRVLGVITEI
>MS1766 lig, Lig protein
MTIMDINQQIKQLRDTLRYHEYQYHVLDDPKIPDAEYDRLFHQLKALEQQ
HPELITADSPTQRVGAKPLAGFAQITHELPMLSLDNAFSDEEFNAFVKRI
QDRLIVLPQPLTFCCEPKLDGLAVSIFYVNGVLTQAATRGDGTTGEDITL
NIRTIRNIPLQLLTDNPPARLEVRGEVFMPHEGFNRLNERALEHGEKTFA
NPRNAAAGSLRQLDPKITSRRPLVFNAYSVGIAEGVELPATHYERLQWLK
SVGIPVNSEVQLCDGSEKVLEFYRSMQQKRPTLGYDIDGTVLKINDIGLQ
RELGFISKAPRWAIAYKFPAQEELTRLNDVEFQVGRTGAITPVAKLAPVF
VAGVTVSNATLHNGDEIARLDIAIGDTVVIRRAGDVIPQIIGVLHERRPA
NAQAIVFPTQCPVCGSKIVRIEGEAVARCTGGLFCDAQRKEALKHFVSRR
AMDIDGVGAKLIEQLVDKELIRTPADLFKLDLITLMRLERMGEKSAQNAL
DSLEKAKNTTLARFIFALGIREVGEATALNLANHFKNLDALQAASPEQLQ
EVADVGEVVANRIYVFWREQHNIDAVNDLIAQGIHWETVETKEAGENPFK
GKTVVLTGTLTQMGRNETKDLLQQLGAKAAGSVSAKTHFVIAGDNAGSKL
TKAQELGVAVMSEAEFLAIVNAYKR
>MS0216 mfd, Mfd protein
MTTHYFNLDIPTQAGDHKIVANVLTGSDGLAICEMAEQFQGLTVVVANDT
KSAVRLEKILQESGKLEVRYFPDWETLPYDSFSPHQDIISSRLSALFYLQ
NTRKGILILSVSTLMQRICPPQYLQHNVLLIKKGDRLVIEKLRLQLENAG
YRAVEQVMEHGEFAVRGALLDLFPMGSPLPFRLDFFDDEIDSIRTFDADT
QRTLEEIRQINLLPAHEFPTDDKSIEFFRAQFRETFGEIRRDPEHIYQQV
SKGTLVSGIEYWQPLFFENMATLFDYLPANTLFVDMEQYQIQAERFYQDA
VQRFESRKIDPMRPLLAPERLWLRIDEVNRALRNYPRISLKAEKVRTSVR
QKNLPLKALPELQIQPQQKEPLQNLRHFIEKFKGHIVFSVETEGRRETLL
DLLSPIKLRPKQVNSLFEAQSQTYSLQISSLDNGFIIEQENGEPIAIICE
TELLGERVQQRGRDKRKSVNPDTLIRNLAELKIGQPVVHLDHGVGRYGGL
VTLENAGIKAEYLLLTYANDAKLYVPVANLHLISRYVGGSEETAPLHKLG
SDSWAKARRKAAEKIRDVAAELLDVYAQREAQKGFAFHYNREEFMQFSAT
FPFEETHDQEAAINAVISDMCQPKAMDRLVCGDVGFGKTEVAMRAAFLAV
MNHKQVAVLVPTTLLAQQHYENFRDRFANLPVNVEMVSRFRTAKEQKKIL
EDLSAGKVDILIGTHKLIQSDVKFNDLGLLIIDEEHRFGVRQKEKIKQLR
ANVDILTLTATPIPRTLNMAMNGIRDLSIISTPPARRLTIKTFVRQADDL
LIREAILREILRGGQVYYLHNDVASIENCAEKLTALVPEARIIIGHGQMH
ERELERVMTDFYHQRFNVLVCSTIIETGIDIPTANTIIIERADHFGLAQL
HQLRGRVGRSHHQAYAYLLTPPPKLMTKDAVKRLEALESLDNLGAGFILA
THDLEIRGAGELLGSEQSGQIESIGFSLYMELLEAAVQAMKQGREPSLDE
LTQQQVEIDLRIPALLPEDYLGDVNMRLSFYKRIAGAENKPALDELKVEL
IDRFGLLPEATKNLMQITELRLMAKQLDIIRIDGSQNGGFIEFSPTADID
PMKFINLIKQQPAVFKFDGPTKFRFSCALEQAQKRLDFIFNLLQSLMD
>MS1222 mug, Mug protein
MSVQIIETHPFPPVLPARATVMMMGTFPPKSEKRCMEFHYPNFQNDMWRI
YGLIFFEDKEYFQVPGEKRFDAERIKAFLHERGIASCPTVIKAVREQGNA
SDKFLKIVEPVNLTQVLQKVPNVRWLFTTGGKATEALFSLVPELKLKEPK
TNEYIDFPFQGHELKLYRVPSTSRAYPLSLEKKAEAYRKFFELSGILK
>MS0635 mutH, MutH protein
MAAELHIPVPPDLKRDKGWVGQLIETALGAKAGSKPEQDFANLGIELKTI
PINSAGFPLETTFVSLAPLIQTAGVNWHNSHLRYKLSKVLWIPIQGERQI
PLAERRIGSPILWQPDPQQEARLQQDWEELMDYIVLGKVHEITAKIGEVL
QLRPKGANSRAKTKGIGQNGEIIETLPLGFYLRKEFTAQILQNFLRNK
>MS1516 mutL, MutL protein
MPIHILPPQLANQIAAGEVVERPASVVKELVENSLDAGASRIQIDIENGG
ATLIRIRDNGLGIAKEDLSLALARHATSKISCLDDLEAILSLGFRGEALA
SISSVSRLTLTSRTAEQKEAWQVYAQGRDMETTIKPASHPVGTTVEVANL
FFNTPARRKFLRTEKTEFAHIDEVVRRIALAKPQIAFTLTHNGKILRQYK
SAVEIEQKLKRVSAICGEDFVQNALQIDWKHDNLHLSGWVAVPNFHRPQN
DLSYSYVNGRMIRDKVINHAIRQAYGDYLTNEQYPAFVLYLDLDPNEVDV
NVHPTKHEVRFHQARLIHDFICQGVGNALQSEQADFARYDTPASADEIQE
PAANWHSSLIKPNRSAAGHNIFESASDKNISGANTYSHGSAKINRFSTKF
AENIPHFSTKSVSKTEQKLYGNLLTTPAEAKKNTAINAESENSFEKNVST
PQQSTQLSGQFLHSLALVKNQALLLQQGQDFYLLPLAKLQKLKFELTLQQ
PDIAQQPLLIPILFRLNERQLAQWQKQKNFFLQSGFEFDENPAQHRITLN
KVPSCLRQQNLQGCVIRLLEENHEKISDFLTALCNQLQLNEIHVLADALT
LLTEVELLLKTQNKIQLAQLLISVDFTQYLQ
>MS2244 mutS, MutS protein
MNVMENLEQHTPMMRQYLALKAENPDILLFYRMGDFYELFYDDAKKAAAL
LDISLTKRGQSAGQPIPMAGVPYHAVEGYLAKLVQLGESVAICEQIGDPA
LSKGPVERKIVRIVTPGTVSDENLLPERQDNLIVAVYQEKDKFGLATLDM
TSGRFQISEPENAESLKAELQRLAPAELLYCEDFADMQLIEHYKGLRRRP
IWEFELSTAVQLLNRQFGTKDLRGFGVEKAILGLCAAGCLLQYAKETQRT
ALPHIQSITLIQNNENIQLDAATRRNLELTQNLAGGTENTLASVLDKCVT
PMGSRLLKRWIHQPIRHIQKLRQRQQIISEIIQLDLIGELQPYLQQVGDM
ERILARVALRTARPRDLTRLRTALEQIPTIKDILKNSPKFTALFQQIGDF
DELFALLQQAIIDNPPLLIRDGGVIAEGYNAELDEWRALSDGATKYLEDL
EIRERESTGIDTLKVGFNAVHGYYIQISQGQAHKAPIHYVRRQTLKNAER
FIIPELKTYEDKVLKAKGASLALEKQLYDALFDRLLPHLGALQLASLTLS
ALDVLTNLAERAETLNYVAPDFSDEIGVKIENGRHPVVEQVLKEPFIANP
VDLNQQRHLLIITGPNMGGKSTYMRQTALITLMAYIGSFVPAESALIGPI
DRIFTRIGASDDLASGRSTFMVEMTEMANILHQAGANSLVLIDEIGRGTS
TYDGLSLAWACAEWLAKKLRSLTLFATHYFELTVLPEQLAGTANVHLDAL
EHGDSIAFMHAVQDGAASKSYGLAVAALAGVPKNVVKLAKQKLANLEKLS
QQSADQKLQDLRTINQNQGELNLMEEEDGKNAALEMLAQLDPDDLSPKQA
LAYLYQLKKLL
>MS0019 mutT, MutT protein
MNLLQKPEILGISVAAKSRIFEIQAVELKFSNGELRTYERFKPSSRCAVM
VLPIDGEDLLMVREYAVGTERYELGFTKGLMEAGETPEQSANREMQEEIG
LGAKQFMLLRTVNSSPSFMNNPMHILIAQDFYPSKLPGDEPEPLQLVRVP
LANINELIEDPGFSEARNLVALYTLRDYLRKLK
>MS0709 mutT, MutT protein
MNYKNPNSVLVVIYAKNSGRVLMLQRQDDPEFWQSVTGSLAEKEMPFLTA
LREVKEETGIDIKRENLTLVDCHQSVEFEIFPHFRYKYAPNVTHCKEHWF
LLELPDERVPVLTEHLAYQWLEPAKAAELTKSPNNAQVIRKYLINKSA
>MS2341 mutT, MutT protein
MLKPHVTMACIVHCKGKFLFVEEIEYGKRTLNQPAGHLEENETILEGASR
ELYEETGIRAKMQHLVKIYQWHAPRSQKDYLRFVFALELDDWAEITPHDS
DITQGFWLTLEEFNYYIRQENQCARNPLVTEALEDYLAGSRYPLDILTLF
NN
>MS0328 mutT, MutT protein
MDKKTVQVAAGIIRNEFGQIYLTQRLEGQDFAQSLEFPGGKVDVNETPEQ
ALKRELEEEVGIVALNPVMFEQFVFEYPNKIIHFYFYLISEWIGEPFGRE
GQEGFWIEQLDLDESQFPPANSKLIQRLLAEMNC
>MS0408 mutT, MutT protein
MIDFDGYRPNVGIVICNRKGQVLWAKRYGQNSWQYPQGGINDGETPEQAM
YRELYEEVGLTRRDVRIVYASKQWLRYKLPKRLLRYDSKPMCIGQKQRWF
LVQLMSDEKNINMNCSKSPEFDGWRWVSFWYPVRQVVSFKRDVYRKAMKE
FACFLFDANKTVNPLSTNNNDEKKANYSAKKPYSPYRNQDKKRKTRV
>MS1694 mutT, MutT protein
MLIFCEQVQKNYKKNLKIFNFELSLPIVFAGGSVMSELQQFSQQDIEVLN
EETLYSGFFKMKKVRFRHKLFAGGMSEVVTRELLYKGAASVVIAYDPVRD
EVVLVEQVRIGAYDPNLSSSPWLMELIAGMIEEGESPEEVAMRESEEEAG
VTIDNLEYALSVWDSPGGTVERLYLFAGRVDSSKAKGLHGLACEHEDIKV
HVVSRETAYQWVNQGKIDNSSAVIGIQWLQLNYRRLQKNWC
>MS0317 mutY, MutY protein
MLAQSSIQAPFARSVLRWYDKYGRKNLPWQKNKTFYQVWLSEVMLQQTQV
STVIPYFERFIDAFPTINVLADAPLDEVLHLWTGLGYYARARNLHKAAQT
VRDQYGGEFPTDFQQVWDLTGVGRSTAGAILSSVLNAPYPILDGNVKRVL
SRYFTVEGWAGEKKTENRLWRLSAEVTPTERAADFNQAMMDLGAMVCTRT
KPKCGLCPLSKKCGATLTNSWEKYPAKKPKKQLPERESYFLILAQNGKVA
LEQREQSGIWGGLYCFPQFEDKSTLLQYLQQLGIREYQEWSAFRHTFSHF
HLDIFPIYAQYRQTERDENRSDWKKIEENGADYKSTISSTINYWYDPENP
DQIGLATPVKNLLTEFQKGQHYVKNRIL
>MS0182 nPY1, NPY1 protein
MQLIRSSDYGFWLLSQGSHIHLVNNYLPEGRAEDFHLQGKKGMVIGELDR
QPLWLVEEQPNDTRAYFDLRDQLYLPERTFNLLNRGVELNHFFKTHQFCG
KCGDKTMQTEDEWAVQCTNEECNYRTYPVICPSIIVAIRRGKEILLANHR
RHAPKYGKGGMYTTLAGFVEVGESFEQTIHREVFEETGIKVKNIRYFGSQ
PWAFPNSQMVGFLADYESGEIRLQEEEIADAKWFRYDEPYPEFPEKGTIA
RALIEATLKLCAEHQDK
>MS1944 nei, Nei protein
MRNPNFCSGFLLCRQNPDRNTVMPELPEVETAKNGITPYLEGYLIEKIIV
RQPKLRWEVSPQLAQISQQKITALSRRAKYLIIHTEQGYIIGHLGMSGSV
RIVSARDPVDKHDHLDIVMNNGKIMRYNDPRRFGTWLWSANLDEFHLFLK
LGPEPLSDEFNAEYLFKKSRKKQTPVKNFLMDNSVVVGVGNIYANETLFM
CGLHPEKITAKLTKAQCALLVEKIKQELKRAIEQGGTTLKDFLQPDGRPG
YFAQELQIYGKKGAPCPNCGTKIESLVVAQRNSYFCPKCQKK
>MS0916 nth, Nth protein
MNKQTRIEILTRLRDNNPQPTTELTYNSPFELLIAVILSAQATDKGVNKA
TERLFPIANTPEAILALGVEGLKEYIKTIGLYNAKAENIIKTCRDLIEKH
QSQVPEDRAALEALAGVGRKTANVVLNTAFGHPTIAVDTHIFRVSNRTGF
APGKDVVKVEEKLNKVVPNEFKVDVHHWLILLGRYTCIARKPRCGSCIIE
DLCEYKDKTDL
>MS0225 polA, PolA protein
MFLLYFEIVMAQIAQNPLVLVDGSSYLYRAFHAFPPLTNSLGEPTGAMFG
VLNMLKSLITQVQPSHIAVVFDAKGKTFRDELFEQYKSHRPPMPDDLRKQ
IQPLHDIIRALGIPLLSIEGVEADDVIGTLALQASSAGKKVLISTGDKDM
AQLVDDNIMLINTMNNTLLDREGVIEKYGIPPELIIDYLALMGDSSDNIP
GISGVGEKTALGLLQGIGSMAEIYANLDKVADLPIRGAKKLGEKLAAAKA
DADLSYVLATIKTDVELDLNPEQLIIGTANKDELIEYFARYEFKRWLNEA
LNDESSVTKPQEQAVKINNYQATPALAKQESAVKNSVKIDRTLYETVDNQ
AKLQQWIEKIRQVKLVAVDTETNALDPMLAELVGISFALENGEACYIPLA
HVHQVAAQAENAQGDLFAESEQSSESRWEPVVGQLNKAECLSQLKPLLEN
PEIKKIGQNIKYDLTIFANNGINMQGVTFDTMLESYVLNSTGRHNMDDLA
ERYLGHHTIAFEDIAGKGKNQLTFDQIELKKAAEYAAEDADVTMKLHQTL
WREVAQSPELVKLYQEMELPLVSVLSRIERNGVLIDSRALLAQSKEFSQK
LTALENKAHELAGQHFNLASTKQLQEILFDKLGLPVLKKTPKGAPSTNEE
VLEELAYEHELPKLLVEHRGLSKLKSTYTDKLPQMVNRKTGRVHTSYHQA
VTATGRLSSSDPNLQNIPVRNEEGRRIRQAFIARKGFKVIAADYSQIELR
IMAHLSADKGLTAAFSEGKDIHRSTAAEIFGLALENVTAEQRRSAKAINF
GLIYGMSSFGLSRQLGIARGDAQRYMDLYFQRYPGVQTFMTNIREKAKSQ
GYVETLFGRRLYLPDIQSANAMRRKAAERVAINAPMQGTAADIIKRAMID
IDKAITDDPDILMIMQVHDELVFEVKEDKIEHYSALIKSLMENAAQLHVP
LIVDVGVGDNWDEAH
>MS0449 priA, PriA protein
MILLMKFVRVALAVPLMRFFDYILPEQMQPVIGGRVLVPFGRQKRVAIVV
EFAQETDIPKEQLKPVLNVLDDAGLFNDDMWNLLKWGAGYYQFSLGDVLF
SALPVKLRNGESVVEKNKILWKLTALGEQAMVSGELKRAKKQLEALTELT
KNPLEKGNNEFSAAIWSQLKEKRFVEEVTQPLQIIPWQIRLGGKEIMRAE
QRLTLNKQQALALSRLLFHQGFAAWLLDGVTGSGKTEIYLQYIEEILKQD
KQVLVLVPEISLTPQTVQRFQARFNVDIDVIHSNMNDSQRLLVWQRARTG
QSAIVIGTRSALFTQFKRLGLIVIDEEHDNSFKQQDGGWRYHARDLAIVY
AKQLDIPIVLGSATPSLESLNNVKNRKFKHIVLSHRAGAGSGLKHEVIDL
KRQRIQHGLSDTLLRKMASHLEKGNQVMLFLNRRGFAPVMLCHECGWIAT
CTQCDKPYTYHQHQRVMKCHHCEIQKPVPMQCGACGSTHLVTTGIGTEQL
EFVLQQQFPQYEVTRLDRDSTVRKGALENHLSAIKQGKSRILIGTQILAK
GHHFPDVTLVALVNVDSALFSLDFRAEERLAQLYVQVSGRAGRAEKQGEV
VLQTHYPDHPLLQQLLHDGYHAFANSALQLRRQMGLPPFSAQALFRAQSK
SSEEAEQLLQQIASYFYDWKNRQNMPDLQLLGPMPAPFSKKAGRFRWQLL
LQHPSKSVLQHALGQFNFENEVKSSQARWILDVDPQDLS
>MS0470 priB, PriB protein
MKTTILRMLKSNLSINNRLSLEGFVTEQPKRTKSPNGIEHCRIWLEHRSE
QIEAGLKRQAWCKMPVHISGTQLVQKTQSITVGSHLLVVGFLTLHKTSKG
LSQLVLHAEHIEYL
>MS1940 radC, RadC protein
MEFSTQSNPSIKNKGERLMLQIEKENLMPREKLLKFGANTLDNKELLAIF
LRTGIKNCPVMQLSEAVLTHFGSLRQLINADRHNFAPLRASASLNLSNYR
PVRK
>MS1941 radC, RadC protein
MTKRYLLEELQQNQEFNSTDTARIYLQTALEQREREIFLVLFLDNQHRLI
KQEEMFLGTINSAVIHPREIIKTALYCNAAAMILAHNHLRESPNRVNRIA
ILRKGSVRRQI
>MS1800 rdgC, RdgC protein
MYWFKNAMIYKLTKELDWSEDKLQQNLAQCAYHPCGQSDMSKFGWTTPLR
GAELFCFSVGKQILLVAHKEEKIIPAHVIKRELDNRINELEEKENRKLKK
TEKQALKDDVVSVLLPRAFSKNQQTAIWIDTEKNLIYVDAASSKRAEDVL
ALLRKSLGSLPVVPLAFANEPSMVMTDWIIKNDMPQWLVPLEEAELKAAD
DRGIIRCKNQALDSEEMISHLQAGKFVTKLALEWEEHLTFVLNDDGTLKR
LKFADMIREKNDDILKEDFAQRFDADFILMTGELAKLTENLIEHFGGEKN
RL
>MS2243 recA, RecA protein
MATNDEKSKALAAALGQIEKQFGKGAIMKLGDTQALDVESISTGSIGLDV
ALGIGGLPMGRVVEIFGPESSGKTTLTLSVIAQAQKAGKVCAFIDAEHAL
DPIYAAKLGVDVKELLVSQPDNGEQALEICDALVRSGAVDVIIVDSVAAL
TPKAEIEGDMGDSHVGLQARLMSQALRKLTGQIKNANCLVVFINQIRMKI
GVMFGNPETTTGGNALKFYSSVRLDIRRVGAVKDGDEIIGNETRVKVVKN
KLAPPFRQVDFQILYGEGISKNGELIELGVKHKLVDKSGAWYAYNGDKIG
QGKANAMKWLAENPTVAAELENKIRAELLANPEQALLADIETNSEEKEDF
E
>MS1099 recB, RecB protein
MNSTLLIEASAGTGKTFTMASLYLRLLLQAGENCFFKPLEVEQILVVTFT
EAATQELRERIRHRIHLAKKQLTQYAENKNKQVFYGTENEILADLVDSLE
LPVAIQRLKIAEQNMDLAAIYTIHGFCRRMLVQYAFNSGIHFNLQLVKDE
TELLTRFSNELWREHFYNLSFSLTNFIHRNLKSPTDVLQKIRKFVTSENL
NVELNEPHLLQLEFNRFLSQYIEKNINEIKQLKTAWIESENEIQRLIEKA
KTQKLIKGASYKANHLPGRYEKIRQWAQDETDFSIPEPLSKYFSQSAVDS
YLTKNEPVNHAVFKQADSAVERAQSTELYVKVILYHYIQWMRDKLDRYKA
SHQEKSFDDLLRLLKEAVVSPEHGNELVKLIRYQYPFAMIDEFQDTDAQQ
YQIFSKIYIESAQAETGFIMIGDPKQAIYQFRGADIFTYLKAAQQAKYHF
TLGKNYRSEGNLIHAVNQLFNFSSAQPFLYENIEFSSVEPGKAQGRFILN
EQQEAPLGVYLGEEPSDEQLAETCANCISQWLQLALRERAGIQTAEKFLP
LEPKDIAVLVRNAKEAELIKNALQARQISSVYLSDKSNVFDCNEAKELLL
ILQACLNPFSERNIVNAIATAIFCLTGADIQHIKQHETDWEKWIDRFVGY
QRSWRQQGVLAMLHQLFLAEQIPQKLINMPNGERRVTDLFHLAELLQEAT
TLNESDAALLRWFERQIRGENTQDENIIRLESEQQLVKIVTIHKSKGLEY
NLVWLPFISAKAKVNPQHISTYYNAQAQAVQWDMDACHNDEVIKERLAEE
MRLLYVALTRAKYHLAMALPDNFTKNWNALLYALTRGEIGTQAKLTDEYQ
TKPLLDDFAQRISPANIHYYQTDEIQGGGYQQKDNHAQYVAQEFHGKIER
DWTISSFTSLTQMHEWNSQKGRHEAFSPIVTTESAVNFSLILDEAKDIDL
TFLPKINEDKNNFSDIVTGYRQGYSPFDFPHGINVGTALHRFFEKNEFNQ
PIIDEYVKNLCQTIQLSEEWKQPLIQWIEAILTTPLFNGEPLNLAQLDKK
DCIKEMQFYLKLEGRFKLHSFNRLLQKYHTIKREPYLFDEIQGMLRGFID
LVFRHESKYYVLDYKSNFLGKDMAFYARSQLTDVMKNHHYDLQYLLYTLA
IHRYLKQRVTDYDYDSHFGGVIYCFLRGMNGRNPDYGIYSAKPARELIEG
LDNLF
>MS0728 recC, RecC protein
MQLKINSLKITALLVIRKFIVFTVYHSNRLDVQKDILIELMQLLPPDDPF
QTEIILVQSPGMAQWLQLKIAEKKGIAANLKFPMPASFIWQQYINVLEDV
SQQTQFNKDAMTWRLMQLIPQFLSEPCFQALENYLKNSPYSEQQKLYQLA
RKVADLFDQYLVYRPNWIHAWENNQPESIEQAIGTYQKDDNPELITQIKR
DIKWQGILWRALIDEVQRGAGYKVRHRANLHQAFIDKLRSAKPENLPQRI
FIFGISALPQSYLETFEAMSRYCDIHLFFNNPSREYWGDIVDDRFLQKLQ
TRQRFDHYENNHTALLSSATLTNMQQENYEFSPDNEKLLVGNPLLAGWGK
LGRDFFYLLTDLMTRAEEHNREIIAFVDLDDKTLLSQVQGHILDLIPMAV
KKLNKPQEDNSLTIHACHSVMREVEVLHDYLLSLFELDKNLTPKDIVVMV
ADIDKYAPYIQAVFGQYQKDLQTNQFYQADKRYIPFSISDNKLTESDVLI
ASFLMLLNLKESQFSAEEVLAYLDIPAIRMRFQIELEDLETIREWVKNSG
IRFGLEKRTDNSLKNYNAWQSGLERMLLGYAMRAENGIWQDSLGFDDSHG
LQGKLAGLLAAFIERLYQWQQFLRNPHSYEEWGQALLELVDHFFLENEQS
LEAILYLKEIIQQLHEQLDEVNFTSKLEIDVIAEVMAEQLNDKNTSLKFL
VGKVSFCTLLPMRAIPFKAVCLLGMNDGEYPRQQTPNSFDLMQYHRQKGD
RFRRDDDRYLFLEALLAAENYFYVSYVGQSIIDNQQREPSVLVSQLLDYL
AENLANNDEEIEQIRTSLVQYHSMTIFSPDNFSAMHRSYAKEWLPLVNRN
QYPVPDFTQQISGEIDEVREIDILQLVQFVQHPVKFFFEKRLGVYFQQTD
EQIPETENFTLDNLDNFLIKDELIRFADDETDNYFERLKLEGILPYGHFG
DIYKRRLQNEAAELKNKISAYLSQEPAHQFVEITLDMGEQSVLLTGHLDH
LYQPFAQRVKWRVGEVKDKHIIENWLYYLLQLCTTDNVNPPLYYGKNGCI
GFKTLEKSTALSILKLYVKAYLQGLKQVQIVPTYKIDDYLKSCQPETEFD
TLSAFNNLRDLFKSSNNYTNEKEDIYWTRVFQQATELNSDKEKLMQIQQT
TRDWFGLMLNSVEKVKL
>MS1098 recD, RecD protein
MLEILAKLQQENVITAGDYHFAKMIAEKCEEGTDKSSRTKNNLTALLAAL
CNYSHQQGNTCLFLEEQIKSNLFGLAYRALEQDYLQQIDEKIGYLPVAQW
QQILKSHIAFTTEPKTKIAPFVFQFNALYFYRVWQDEYLVARYLKSAVKN
SKVLAEQPDTKIIHQLIGENTGLNQGQKIAIATALRQQFCLISGGPGTGK
TYTVARLLVALQQLHQGKLQIKLAAPTGKAAARLTESIENALQQMTLSAK
LKHCIPTEAMTIHRLLGGRSFKFNAQNPLPLDVLVIDEASMIDLALMSNL
LQALPSHARLILLGDKDQLASVEAGAILGELGQFLEQGYSASFIDYLNRV
TDSHLAFNSVQGDEIRDYLSHLTESRRFDEKSAIGHLAKAINSAEIDRSL
QLFSQLDDIEYVDFNRYFANGIQPESSAEYLAYCVNLVVERAVREYRDYL
LEIETRSAKSELTEQDIEKIFAGFKKVRFLSALRLGELGVEKLNLSIAEG
LRRQNLIQFKNSRDWYQGKPVMIIQNDANVGLFNGDIGLFIQGKVWFELG
ENHYRRISPSRIPSHETAFVMTVHKSQGSEFNHAFLVLPTENVPVLSREL
VYTAVTRAKQRFTLFATDNIWKSAVRKQVKRQSGLGRLLIENI
>MS0487 recF, RecF protein
MAIARLIVENFRNISAVDLEFDHGFNFLVGNNGSGKTSLLEALFYLGHGR
SFKSSVTTRVIRYDQPHFTLHGRIRELQHEWSVGLQKQRKDGNTIVKING
EDGNKISDLAHLLPMQIITPEGLTLLNGGPSYRRAFLDWGLFHHQPNFHS
AWSALHRLLKQRNAALNQTYDYNMLKPWDMELAKLAHQVSQWRADYAEAL
SPEIEQTCRLFLPELDIHVSFHQGWEKDTDYAQLLTENFERDKAIGYTVS
GPQKADFRFKSNGLPVEDVLSRGQLKLLMCALRLAQGEHLMAQKNRHCIF
LIDDFASELDETKRALLAQRLQNSNSQVFVTAISPEQLKQMQPEKHRTFQ
VVNGQIEQLL
>MS1735 recG, RecG protein
MTTQLLDAIPLTSLSGVGAAVSAKLSKIGINNLQDLLFHLPIRYEDRTRI
TPISDLRPEQYATIEGIVQTCEIQFGRRPILTVSLSDGTSKIMLRFFNFN
AGMRNGFQPGARVKAFGEVKRGRFMAEIHHPEYQIIRDKQPLQLEENLTP
IYSATEGLKQNSLRKLTDQALELLDKIQIAEILPDQFNPYPFSLKEAIRF
LHRPPPDVSVESLEKGTHPAQVRLIFEELLAHNLAMQKVRLGTQQFQALP
LHFQTDLKQRFLATLPFEPTNAQVRVTQDIERDLAKDYPMMRLVQGDVGS
GKTLVAALAALTAIDNGKQVALMAPTEILAEQHAENFRRWFEPFGIEVGW
LAGKVKGKARQSELERIKNAEVQMVVGTHALFQEEVAFSDLALVIIDEQH
RFGVHQRLLLREKGEKAGNYPHQLIMTATPIPRTLAMTVYADLDTSIIDE
LPPGRTPIKTIVVSEERRAEIVARVHNACTNENRQVYWVCTLIDESEVLE
AQAAEATAEDLHRALPHLRIGLVHGRMKPAEKQAIMASFKAAELDLLVAT
TVIEVGVDVPNASLMIIENAERLGLSQLHQLRGRVGRGSTASFCVLMYKP
PLGKISQKRLQVLRESQDGFVISEKDLEIRGPGEVLGTKQTGIAEFKVAN
LMRDRKMIPTVQHYARRLIVEYPDVADTLIKRWLNNREIYSNA
>MS1539 recJ, RecJ protein
MIYSGLIKCISVILDCIYPVNKLIQRRTIPHGSAVCADPLLDRLYRSRHI
KNSQQLDRTLHSMLAPNQLQGIDQAVQLLITAREKQQKVIIVGDFDADGA
TSTALTVSALRQLGFTDVDYLVPNRFEQGYGLSVAVAEMALAKGVELLIT
VDNGVSSLDGVAFLKGRGVRVLITDHHLPPEILPAADAIVNPNLADCHFP
SKALAGVGVAFYLMLALRAKLRESGEFNEKTQPNFTELLDLVALGTIADV
VPLDQNNRILAHQGLARIRAERCRYGIRALIEVANKDISQLSASDLGYSI
APRLNAAGRLDNMSVGVELLLADSMEQARALALELDGLNQTRKEIEQGMK
AEALEICRNLTALKTELPTGIALYQADWHQGVLGILASRIKDQFHRPVVA
FAQDQNGLLKGSARSIEGLHMRDALERINTLYPDMIVKFGGHAMAAGLTI
KEELFADFQRSFNQVVTDWLDKDMLQGIVWTDGDLPQTMMNMNTAELLKQ
AGPWGQAFPEPIFDGEFRILQQRLVGEKHLKMLVEPVNGGPLFDAIAFNI
DTRYYPDLSIRTAVLAYKLEINEFRGNRDVQLLVDYIQPRS
>MS0741 recN, RecN protein
MLTQLTINNFAIVRHLDIELSEGMSVITGETGAGKSIAIDALGLCLGQRT
EAAMLREGQERAEVCATFQLKADSPAARWLTDHELQDQDNPEECILRRLV
NQDGRSKAFINNTPVSASQLKEFGQYLVHINGQHASQLLLKNDFQLQALD
NFCAHNHLLEQMKTDYLNWKELQSQVKTFNQKCVENEAKKQLLQYQVNEL
NEFNLRPNEYQELEEEQRRLSNSEQLTQLSQSVLQILTENETVNVDSLLY
RTTQHLEDLAELDTRYVDAQALLQEALIQVQEAASEIQHLSANIEEDPQV
LREIEQRMNQAVQLARKHNVKPEELTQLHKQLKLELNQLVDFSESENELL
AQEQQAYEKMSASATKLHQSRRQGAEKLAKQVTKSVKQLAMENAEFFINL
TADYSKISVNGADNVIFNLQSNLGQSPQPLAKIASGGELSRIALAIQVLT
SDKTAIPTLIFDEIDVGISGATASVVGKLLRKLGHSCQVLCVTHLPQVAC
NGHHHFMVEKSTVEGKTETKMTALSSQQRIKALAKLLGGQHITDSVLANA
QEMLALVS
>MS0239 recO, RecO protein
MLHRKPYSETSLLVDLFTEESGRLTVLAKGARAKRSALKSVLQPFTPLLL
RWTGKSSLKILTKAEPAAIALPLQQTALFSGFYVNELITRVIEPETPNPQ
LFQDYLHCLTSLAVSQNFVEPALREFEFKLLNILGYGVDFLHCAGSGEPV
DENMTYRYREEKGFIASLIKDNLTFFGRELIAFERQDFSEKSVLQAAKRF
TRVALKPYLGNKPLKSRELFTQTILHLK
>MS2081 recQ, RecQ protein
MTAELSNRSEAIKPELIKSAVENPEISTALDVLHSVFGYQTFRKGQQEVI
QAALSGRDSLVVMATGNGKSLCYQIPALCFAGLTLVISPLISLMKDQVDQ
LLANGIAADFLNSTQSLEQQQQVQNKAISGELKLLYLSPEKVMTNSFFQF
ISLCNVSFIAIDEAHCISQWGHDFRPEYTQLGGLKGCFPHAPIMALTATA
DSTTRQDILQNLSLNEPHLYVGSFDRPNIRYTLVEKFKPMEQLCNFVAAQ
KGKSGIVYCNSRSKVERIAEALKKRGISAAAYHAGMESSQREAVQQAFQR
DNIQVVVATIAFGMGINKSNVRFVAHFDLSRSIEAYYQETGRAGRDDLPA
EAVLFYEPADYAWLHKILLEEPESPQRDIKRHKLEAIGEFAESQTCRRLV
LLNYFGENRQTPCNNCDICLDPPKKYDGLLDAQKILSTIYRTGQRFGTQY
VIGVMRGLQNQKIKENQHDELKVYGIGKDKSKEYWQSVIRQLIHLGFVQQ
IISDFGMGTRLQLTESTRPVLRGEVSLELATPRLSSITMVQAPQRNAVTN
YDKDLFARLRFLRKQIADKENIPPYIVFSDATLQEMSLYQPTSKVEMLQI
NGVGAIKWQRFGQPFMAIIKEHQALRKAGKNPLELQS
>MS1506 recR, RecR protein
MQTSPLLENLIESLRCLPGVGPKSAQRMAYHLLQRDRSGGMNLARALTEA
MSKIGHCEHCRTFTEEDICSICDNPRRQNSRLLCVVEMPADIQAIEQTGQ
FSGRYFVLMGHLSPLDGIGPREIGLDLLQRRLQQEQFNEVILATNPTVEG
DATANYIAELCNQQNIKVSRIAHGIPVGGELETVDGTTLTHSFLGRRTIG
>MS1571 rnhA, RnhA protein
MYQIMRKQIEIFTDGSCLGNPGAGGIGVVLRYKQHEKTLSQGYFKTTNNR
MELRAVIEALNLLKEPCAVTLHSDSQYMKNGITQWIFNWKKKNWKASNGK
PVKNQDLWMALDNAVQAHTIDWRWVKGHSGHRENELCDQLAKQGAENPTL
EDIGYQPD
>MS0423 rnhB, RnhB protein
MAEFEYPQGFELIAGVDEVGRGPLVGAVVTAAVILDPNNPIDGLTDSKKL
SEKKREKLAEEIKQKALAWALGRAEPEEIDALNILQATMLAMQRAIKNLK
IQPHFVLIDGNRIPQLAIPAQAVVKGDSLVAEISAASIIAKVSRDHEMEV
LDKQYPQYEFAKHKGYPTKVHLAKLAEFGVLPQHRRSFSPVRKLLENE
>MS0712 ruvA, RuvA protein
MANFIVNVKVCMIGRLQGILLEKQPPEILLDVHGIGYELLLPMTSFYNLP
EIGQETVLFTHLVVREDAHLLFGFSAKTDRTLFRELIKTNGVGPKLALAI
LSAMSVNEFAYAIEHEELSKLVKIPGVGKKTAERLLVELKGKFKGIKQPD
FFVESSHVGAVDPVTTSPEVPAEEAVAALMALGYKASDAEKMVKRIAKPH
LTSEQLIREALKAAL
>MS0713 ruvB, RuvB protein
MIEADRIISSNAQLGDEYIDRAIRPKLLTDYVGQPQVREQMGIFIQAAKL
RQDALDHLLIFGPPGLGKTTLANIVANEMGVNIRTTSGPVLEKAGDLAAM
LTNLEPHDVLFIDEIHRLSPAIEEVLYPAMEDYQLDIMIGEGPAARSIKL
DLPPFTLIGATTRAGSLTSPLRDRFGIVQRLEFYSVEDLTSIVARSAGCL
NLEMSDGASHEIARRSRGTPRIANRLLRRVRDFADVKNAGIISEDIAKSA
LSMLDIDQAGFDYLDRKLLSAVIERFDGGPVGLDNLAAAIGEERDTIEDV
LEPYLIQQGFLQRTPRGRIATSRTYRHFGLDKLTE
>MS0711 ruvC, RuvC protein
MFALFIWSFMAIILGIDPGSRVTGYGIIRQTGRTLEYLGSGAIRTQVEDL
PTRLKRIYAGVTEIITQFRPDMFAIEEVFLAKNPNSALKLGQARGTAIVA
AVNQNLPVFEYAARLVKQTVTGSGSADKVQVQDMVTRILRLSDKPQADAA
DALAIAITHAHTIQHSLQVATSAKSTENHEKTTALLRTRYSRGRFRLKI
>MS1964 sPS1, SPS1 protein
MRKDMLQVQHENHFFLFNFDENRPNQEHFFESYFWQKQNRIIGSAKGRGT
TWFIQSQDLFGVNTALRHYYRGGLWGKINKDRYAFSSLEETRSFAEFNLL
NRLYQAGLPVPKPIGAHVEKLAFNHYRADLLSERIENTQDLTALLPNTEL
TAEQWQQIGKLIRRLHDLQICHTDLNAHNILIRQQNNDTKFWLIDFDKCG
EKPGNLWKQENLQRLHRSFLKEVKRMRIQFSEKNWADLLNGYQN
>MS1081 sbcB, SbcB protein
MTDFSFFIYDFESFGVNPADDRPAQFAGIRTDKDFNIISDPVMFYCKQTN
DYLPAPEAVMVTGITPQECNEKGISEPEFAARILAEFSQPNTCIMGFNNI
RYDDEMTRYTFYRNFIDPYEYSWKNGNSRWDLLDLVRACYALRPEGINWP
LDEEGMPSFRLEKLTKANGIEHENAHDAMADVYATIAMAKLIKEKQPKLF
QFFFENRGKKEIEKWIDTAEMTPLVHVSGMLGNYRGNCTWIAPLAWHPIN
QNAVIACDLAQNIDDLLNKSAVELRENLYTQKTELENDGVLPVPLKLVHI
NKCPIIAPAKTLLPENAQRLGIDRQFCLDNLKKLQKSLDIRDKVIEVFNE
ERKFDDSDNVETELYSGFFSKADKNNMTILRTLEPEKLADSGLQFEDKRI
PDLLFHYRARHFYKTLNRGEQIKWQKYRRQKLEKSAVQFMESLQHLGEEN
SNHPDKLKLLQQIYDYGIKLLA
>MS0863 seqA, SeqA protein
MLREDRMKIIEVDEELYQYIASQTKSIGESASDILRRLLNLPVSGVNLTA
VDLTQSTMNSTNEEKGTQLPAEKNVVAETPKPSSEQEIRTPARKQSTQSI
QHIVTKVKNLLQSEAFQEESKMVVRFLNILSVLYRTNPESFAQATEQETS
QGRTRTYYARDEATLLAAGNHTKPRQIPDTPYWVITNTNSGRKMLMLERT
MQFMELPEELIDEVRPYFAVV
>MS0041 smf, Smf protein
MAQYSAEQLSEFDAAEWRKIGWNDQQIQTWLNPNMRYLEPALRWNEQPEQ
HILHYRQENYPELLKQIHSAPPLLFIKGNPELLTQPQIAIVGSRNCSDYG
EYWAKHFASELSATGFVITSGLALGIDGFCHQATVEQQGQTIAVLGSGLQ
HIYPARHKKLARRIIETNGALVSEFFPTHPPIAENFPRRNRIISGLSLAT
LIVEATERSGSLITARYALEQNREVFAIPGNIQNQYSQGCHTLIKQGAML
VERISDILENLPHFSINYRPPAKVRSQVQTAQLAAPEVQVSYPELYKHIS
SLPISIDDLINATGLNVNELLVQLLELELQNLICQQNGLYQRN
>MS1836 srmB, SrmB protein
MSLDHLSQQRFADLPLNAKVLEALESNGFEYCTPIQALSLPISLAGKDVA
GQAQTGTGKTMAFLTATFHHLLEHPVKTNHPRALIMAPTRELAVQIAHDA
ERMVKTTGLKTALAYGGDGYDKQLKAIEAGADIIIGTTGRIIDYVKQNII
ALSHIQVVVLDEADRMFDLGFIKDIRYLMRKCPSPKQRLTLLFSATLSYK
VRELAFEDMNDPEYVEVEPLQKTGHRIKEELFYPSNEDKMPLLITLLEEE
WPERCIIFANTKHQCEKIWGYLAADGHRVGLLTGDVAQKKRLSLLKQFTD
GALDILVATDVAARGLHIPDVTHVFNYDLPDDREDYVHRIGRTGRAGESG
VSISFACEEYAMNLPAIEEYIGHHIAVSQYDSDSLIRDLAKPYRLKPSLP
ASNRHNRNGAKPFKKRF
>MS1950 srmB, SrmB protein
MRYNFPQFYNLSHLRIFMPQPQFEDFDLSPELLKALAQKGYARPTAIQSE
AIPAAMDERDVLGSAPTGTGKTAAFLLPAIQHLLDYPRRKPGAPRVLVLT
PTRELAMQVAQQAEELAQFTKLSIATITGGVAYQNHGEIFNKNQDIVVAT
PGRLLQYIKEENFDCRAVEILIFDEADRMLQMGFGQDAEKISAETRWRKQ
TFLFSATLEGELLVDFAERILTDPVKIDAEPSRRERKKINQWYYHADSYE
HKVKLLARFIADEQVSKGIVFVRRREDVRELSEILRKRGIRSTYLEGEMA
QTQRNNAIDKLKNGIVTLLVATDVAARGIDIEDISHVMNFDLPYNADTYL
HRIGRTARAGKKGTAVSFVEGHDYKYLGKIKRYTEELLKPRIIEGLEPRT
KAPKDGEIKTVSKKQKAYIRQKREEKRKTTQKKAKLRRQDTKNIGKRRTP
KAVSEAQAKEIR
>MS0495 srmB, SrmB protein
MTETKITFGDLGLPEFILSAVSDMGFETPSPIQQACIPHLLNGRDVLGMA
QTGSGKTAAFSLPLLAQIDIEEKHPQMLVMAPTRELAIQVAEACELFTKN
AKGVHIATLYGGQRYDIQLRALRQGAQVVVGTPGRILDHIRRGTLNLSEL
KFIVLDEADEMLRMGFIDDVETVMAELPAQHQTALFSATMPEPIRRITKR
FMTDPQEVKIQSTQRTNPDIAQSCWYVRGYRKNEALLRFLEVEDFDGAII
FTRTKTGTLDVTELLEKHGFRAAALNGDMTQQLREQTLDRLRNGSLDILV
ATDVAARGLDVERISLVVNYDIPLDAESYVHRIGRTGRAGRSGSAILFVE
PRERRLLSNIERLMKKPIEEVDVPNHEALQARRREKFKAKITKQLEHHDL
EQYRLLLEGLFTPDQDQEDIAAAMLMLLQGKQKLILPPEPPMEKRGRRER
DDRRGERGDRRERRPEERRGYGNPQPMDLYRIEVGRADGVDVRHIVGAIA
NEGDINSRNIGHIKLYDEYSTVELPQGMPKELLQVFGKARVLNKQMRMTF
VSEAGETVGRERHEGRRNDRRDNGFRREERRFNDRGNRSFNERAPRREFR
ERNDRRDRRDRRS
>MS0585 ssb, Ssb protein
MAGINKVIIVGHLGNDPEIRTMPNGEAVANISVATSESWTDKNTGERREV
TEWHRIVFYRRQAEVAGEYLRKGSQVYVEGRLRTRKWQDQNGQDRYTTEI
QGDVLQMLGGRGQTADAGFAAPQPNQSFSRPQASAARQQPATRPAPAAEP
AMDNFDDDIPF
>MS2356 tag, Tag protein
MKKRCPWAEGSQLYRDYHDNEWGKAEFDSRKLFEKICLEGQQAGLSWITV
LKKRENYRRAFHQFCPEKIVRMTDQDIDKLMLDKGLIRHRAKLMAIVKNA
KAYLLMEKCGENFSNFVWSFVNNQPQINDCPDLTAVPAKTECSKALSKAL
KKRGFVFVGETTCYAFMQSMGLVDDHINDCFCKHK
>MS0625 tatD, TatD protein
MAFFDTHTHLDYLQRTTNTPLSALMENALNADVQKILIAAVMARDFENIL
NMTELFPRHLYCGLGLHPLFIKNHQKSHLDELETYLQKNPQNLTALSEIG
LERSVSELISDELWRRQCDFLEAQLYLAKQYKLPVNLHSRKSHDQLFTFL
KRIRLPKCGVLHGFSGSYQQAKNFVDLGYKIGVGGVISYLRANKTRQAIA
KLPLDSLLLETDTPDMPVFGFQGEANRPERLVQTFRYLCELRSEPPAQIQ
QQIWRNSCEMFAVK
>MS0571 tatD, TatD protein
MFIVDSHCHLDSLDYEKLHSNVDEVIEKAKARGVKHLLSIGVALNRFQAM
KTLLAHRDEVSFSCGVHPLDLAGETFDRQRLERYAKDEKVIAIGEIGLDY
YYDQDRKNEQLDAFSQQIEVANQLNKPVIVHTRDAREDTIRLLRENHAEK
CGGVIHCFTENLEFAKQALDLGFYISCSGIVTFKNAEEIRDVVRYVPADR
LLVETDSPYLAPVPYRGKQNQPAYTREVCEYVAALKGVSAEEFALITTQN
FERLFKINVL
>MS1096 topA, TopA protein
MSKSLVIVESPAKAKTINKYLGSDYVVKSSVGHIRDLPTAGASTGEKAKP
VSTKGLTAEEKQALKTEKEKNALVKRMGIDPYHGWKANYQILPGKEKVVA
DLKSLAKKADHIYLATDLDREGEAIAWHLREVIGGDDNRFSRVVFNEITK
NAIKQAFEKPEHLNLDRVNAQQTRRFLDRVVGFMVSPLLWKKVARGLSAG
RVQSVAVKLVVEREREIKAFQPQEYWEVAVVTKTADNQKITLDVAEYKGK
RFDPKNETEAQSAVDFLAKSDYIVSALETKPTTSRPRAPFITSTLQQTAS
TRLNFSVKKTMMLAQRLYEAGYITYMRTDSTNLSRDALNMARSYIERNFG
EKYLPEKPNFYSSKENAQEAHEAIRPSDVNISMNDLQGMEKDAVRLYDLI
WRQFVACQMPAAQYDSTTLTVKAGDYELKAKGRILRFDGWTKVLPQLGKS
AEDQELPALNVHNKLALDEIQPSQHFTKPPARFTEAALVKELEKRGIGRP
STYAAIISTIQERGYVRTENRRFYAEKMGEIVTDRLNQSFAHLMSYDFTA
SMEDMLDQIATGKKDWKTELNQFFKDFSGQLTTAELDELEGGMKPNSLVL
TDIQCPTCGRPMAIRTASTGVFLGCSGYALAPKDRCKTTINLIPEAELLN
VLDDASETKALMERKRCPKCDTAMDSYIIDPHRKIHICGNNPNCEGYLIE
QGTFKIKGYDGPIVECDKCGSDMHLKLGRFGKYMACTACDNTRRILANGE
VAPPKEEPIAFPELKCEKADAYFVLRNSAVGVFMSAHNFPRVRESRPAKV
AELAQYRERLPEKLQYLADAPQQDPEGNPAIISFSRKEKHQYVTSEKNGK
KTKWIVDYIDGNWIERKK
>MS0730 topA, TopA protein
MRLFVAEKPSLARAIADVLPKPHQRGDGFIKCGKNDCVTWCVGHLLEQAE
PDAYNPMFKQWRLEHLPIVPKKWRLIPRKEVAKQLKTVENLIHQADQLVN
AGDPDREGQLLVDEVFNYANLSTDKRNAIQRCLVSDLNPAAVEKAVKKLQ
PNTNFIPLATSALARARADWLYGINMTRAYTIRGRQAGYNGVLSVGRVQT
PVLGLIVRRDLEIENFQPKDFFEVLAHIQTEDETPQKFTALWQPSKACED
YQDDDGRVLSLGLAENVVKRITGQPAEVTEYTDKREKETAPLPYSLSALQ
IDAAKRFAMSAQDVLDTCQRLYETHKLITYPRSDCRYLPNEHFAERMPVL
NAISTHCKEYQPLPEVLNTEQKNRCWNDKKVEAHHAIIPTAKNRPVNLNS
QELNIYTLIARQYLMQFCPDAEYRKSKISLKIAGGNFVAQARNLQIAGWK
ELLGKEDENEQLEPSLPIVKKGQQLFCEKGEVISKKTQPPKPFTDVTLLS
AMTGIARFVQDKELKKILRETDGLGTEATRAGIIELLFKRGFLYKKGRNI
HSSEAGRILIQALPDMATQPDMTAQWEAQLDGISRKQASYQQFMATLTEL
LPELVQFVNFSALRKLSAVANNPKPKNFKKKAKIAQSTETKKEV
>MS0131 topA, TopA protein
MSEPLFQHTKTEECCPQCGSPLQIKQGKKGKFLGCSAYPACDYLKPLSNQ
SESRIIKQLDECCPQCGHPLLIRQGNFGMFIGCGNYPQCHFIVHEDEQPP
AEESVACPECGKGELISRRGRQGKYFYACNRYPHCKFTLPGKPYLQDCPQ
CGGHICLLKKENETYRTFLCVNKSCRHQFDRKKEKT
>MS1577 tra5, Tra5 protein
MSESAYYAHLRTAKKPAKHTALAVEIKAIFDASRSSAGKRTIQSHLKEKG
IFVGLYLIRKLMNKQGLFSKQPQKWRNPSKGNSQVFENILSREFTPDSQT
TVLCGDTTYIKINGIWCYLAVVINLLNRQVVGWKLSRYHDSELVKDALNH
AMLNIERTERMLFHSDQGSIYGSEIFTDSVKKHGLTQSMSRRGNCWDNAP
MERWFRSFKYEWMLKGGYSDFESAVNDVREYVMYYNHIRPHSYNQGLSPI
LAKTTYRRLLN
>MS1602 tra5, Tra5 protein
MSESAYYAHLRTAKKPAKHTALAVEIKAIFDASRSSAGKRTIQSHLKEKG
IFVGLYLIRKLMNKQGLFSKQPQKWRNPSKGNSQVFENILSREFTPDSQT
TVLCGDTTYIKINGIWCYLAVVINLLNRQVVGWKLSRYHDSELVKDALNH
AMLNIERTERMLFHSDQGSIYGSEIFTDSVKKHGLTQSMSRRGNCWDNAP
MERWFRSFKYEWMLKGGYSDFESAVNDVREYVMYYNHIRPHSYNQGLSPI
LAKTTYRRLLN
>MS2299 tra5, Tra5 protein
MSESAYYAHLRTAKKPAKHTALAVEIKAIFDASRSSAGKRTIQSHLKEKG
IFVGLYLIRKLMNKQGLFSKQPQKWRNPSKGNSQVFENILSREFTPDSQT
TVLCGDTTYIKINGIWCYLAVVINLLNRQVVGWKLSRYHDSELVKDALNH
AMLNIERTERMLFHSDQGSIYGSEIFTDSVKKHGLTQSMSRRGNCWDNAP
MERWFRSFKYEWMLKGGYSDFESAVNDVREYVMYYNHIRPHSYNQGLSPI
LAKTTYRRLLN
>MS1804 tra5, Tra5 protein
MSESAYYAHLRTAKKPAKHTALAVEIKAIFDASRSSAGKRTIQSHLKEKG
IFVGLYLIRKLMNKQGLFSKQPQKWRNPSKGNSQVFENILSREFTPDSQT
TVLCGDTTYIKINGIWCYLAVVINLLNRQVVGWKLSRYHDSELVKDALNH
AMLNIERTERMLFHSDQGSIYGSEIFTDSVKKHGLTQSMSRRGNCWDNAP
MERWFRSFKYEWMLKGGYSDFESAVNDVREYVMYYNHIRPHSYNQGLSPI
LAKTTYRRLLN
>MS0978 tra5, Tra5 protein
MSESAYYAHLRTAKKPAKHTALAVEIKAIFDASRGSAGKRTIQSHLKEKG
IFVGLYLIRKLMNKQGLFSKQPQKWRNPSKGNSQVFENILSREFTPDSQT
TVLCGDTTYIKINGIWCYLAVVINLLNRQVVGWKLSRYHDSELVKDALNH
AMLNIERTERMLFHSDQGSIYGSEIFTDSVKKHGLTQSMSRRGNCWDNAP
MERWFRSFKYEWMLKGGYSDFESAVNDVREYVMYYNHIRPHSYNQGLSPI
LAKTTYRRLLN
>MS0373 ung, Ung protein
MQTWKDVIGTEKTQPYFQHILQQVHAARDAGKTIYPPQHDVFNAFKLTEF
DQVKVVILGQDPYHGPNQAHGLAFSVLPGIVPPPSLLNIYKELENDIAGF
QIPRHGYLVKWAEQGVLLLNTVLTVERGLAHSHANFGWETFTDRVIAALN
RHRENLVFLLWGSHAQKKGQFIDRDRHCVLTAPHPSPLSAHRGFLGCHHF
SKANNYLQEHKITEIDWQLDTQLS
>MS0586 uvrA, UvrA protein
MDVIDIRGARTHNLKNINLIIPRDKLIVITGLSGSGKSSLAFDTLYAEGQ
RRYVESLSAYARQFLSLMEKPDVDHIEGLSPAISIEQKSTSHNPRSTVGT
ITEIHDYLRLLFARVGEPRCPTHNLALTAQTISQMVDKVLTLPEGRKMML
LAPVVKARKGEHVKILEHIAAQGYIRARIDGEICDLSDPPKLELQKKHTI
EVVVDRFKVRADLATRLAESFETALELSGGTAVVADMEDAKAEELVFSAN
FACPHCGYSVPELEPRLFSFNNPAGACPTCDGLGVQQYFDEKRVVQNPAV
SLAGGAVKGWDRRNFYYYQMLTSLAEHYHFDIEAPYEELQKNIQQVIMNG
SGKEEIEFKYMNDRGDVVVRRHPFEGILNNMARRYKETESMSVREELAKN
ISNRPCSDCGGSRLRPEARHVYIGQTNLPDISEMSIGEAYSFFEKLALAG
QKAQIAEKILKEIKERLSFLVNVGLNYLSLSRSAETLSGGEAQRIRLASQ
IGAGLVGVMYVLDEPSIGLHQRDNERLLNTLIHLRNLGNTVIVVEHDEDA
IRLADHIIDIGPGAGVHGGNVIAEGTAEQIMQNPNSITGKFLSGEEEIEI
PQKRTAVDKKKFLHLNGAAGNNLKNVNLALPVGLFTCITGVSGSGKSTLI
NDTLFPIAQNVLNRADNIEYAPYKSIEGLEFFDKVINIDQSPIGRTPRSN
PATYTGLFTPIRELFAGVPESRARGYNPGRFSFNVRGGRCEACQGDGVLK
VEMHFLPDVYVPCDQCKGKRYNRETLEIRYKGKTIHQVLDMTVEEAREFF
DVVPMIARKLQTLIDVGLSYIRLGQSSTTLSGGEAQRVKLATELSKRDTG
KTLYILDEPTTGLHFADIKQLLEVLHRLRNQGNTIVVIEHNLDVIKTADW
IVDLGPEGGSGGGEIIATGTPEEVAQNPLSHTGRFLKPILAKK
>MS1371 uvrB, UvrB protein
MSHKINSKPFILHSEFKPSGDQPQAIEILAENLNDGLAHQTLLGVTGSGK
TFTIANVIAKLNRPAMLLAPNKTLAAQLYAEMKAFFPENAVEYFVSYYDY
YQPEAYVPSSDTFIEKDASINDQIEQMRLSATKSFLERRDTIVVASVSAI
YGLGDPDSYLKMMLHLQTGAIIDQRQILVRLAELQYTRNDQAFQRGTFRV
RGEIIDIFPAESDDRAVRIELFDDEIERLSLFDPLTGTGFGAVPRFTVYP
KTHYVTPREQILDAIEKIKSELADRREYFIKENKLLEEQRITQRTQFDIE
MMNELGYCSGIENYSRYLSGRNEGEPPPTLFDYMPSDALLVIDESHVTVP
QIGGMYRGDRSRKETLVEYGFRLPSALDNRPLRFEEFERLAPQTIYVSAT
PGPYELEKSGTEIIDQVVRPTGLLDPEIEIRPVSIQVDDLLSEARQRADR
NERVLVTTLTKRMAEDLTDYLDEHGIRVRYLHSDIDTVERVEIIRDLRLG
EFDVLVGINLLREGLDIPEVSLVAILDADKEGFLRSERSLIQTIGRAARN
LKGKAILYADRITNSMEKAITETNRRREKQMKYNEEHGITPQGLNKKVGE
LLDIGQGGSNKSRNKPRSQKAAEPATTYAIPMTAKEYQQQIKKLEQQMYK
FAQDLEFEKAAAIRDQLHKLREQFVENG
>MS0937 uvrC, UvrC protein
MFDSKKFLANVTHDPGVYRMFDDKDTVIYVGKAKDLKKRLSSYFRANLSS
KKTEALVASICRIETTITTSETEALLLEHNYIKTFQPRYNVLLRDDKSYP
YILLTKERHPRITSHRGSKKVTGEYFGPYPHAGAVRETLSLLQKLFPIRQ
CENSVYANRSRPCLQYQIGRCLAPCVSGYVSDEEYNQQVGYARLFLQGKD
QQVLDHLIGKMERASRALNFEEAARYRDQIQAVRSVIEKQFVSNERLDDM
DIIAIAYKLGIACVHVLFIRQGKILGNRSYFPKVPENTSLSELTETFVGQ
FYLQAHQGRTIPNSIIVDRKLEEKAELESLLTDQAGRKVSIQDNIKGNKS
KYLHLAQMNAQAALALQLKQSSLIHERYKELQQLLGIEKIHRMECFDISH
TMGQQTIASCVVFNEEGPLKSDYRRFNIEGITGGDDYAAMEQALKKRYDK
DLELEKIPDIIFIDGGKGQLNRALKVFHELQVKWDKNRPHLIGVAKGVDR
KVGLETLIISKQEREINLPADSLALHLIQHIRDESHNHAISGHRKKRQKA
FTQSGLETIEGVGAKRRQALLKYLGGMQGVKNATQDEIASVPGISVALAE
KIFEALHH
>MS1368 uvrD, UvrD protein
MMDISELLDGLNDKQREAVAAPLGNYLVLAGAGSGKTRVLTHRIAWLIAV
EGISEGSIMAVTFTNKAAAEMRQRIESTLSQHSSRRLFGMWVGTFHSIAH
RLLRAHYLDANLPQDFQILDSEDQLRLLKRLLKLHNYDEKMFPAKQACWY
INNKKDDGLRPHQIDDNNDKQEREWINIYRIYQDTCDRAGLVDFAEILLR
AYELFLKKPVILQRYRQRFQQILVDEFQDTNKIQYAWIRLLAGETGNVMI
VGDDDQSIYGWRGAQVENIQRFLDDFHKAKTIRLEQNYRSTGNILQSANQ
LISNNSNRLGKDLWTEGDKGEPVGIYAAFNELDEALFVSSQIKIWWEDGG
ELNDCAVLYRSNSQSRVIEEALIRAQIPYRIYGGMRFFERQEIKDALAYL
RLIANRQDDAAFERVINTPTRGIGDRTLDVLRNLTREREITLWQATQLAI
GENKLAGRSATALLRFCELINSLAQETEEMPLFAQTDFVIKHSGLYEMYK
QEKGEKGEVRIENLEELVSATREFIKPDDAEDMSDLSAFLTHASLEAGEE
QASPHQSCVQMMTLHSAKGLEFPRVFMVGVEEGLFPSFMSLEEPGRLEEE
RRLAYVGITRAKQKLTICYAESRRLYGKEERHIPSRFINELPQECIQAVR
LRGTVTRAYNQSAVGSVKISPLNDSGWKTGQKVKHGKFGTGTVINVEGSD
NNTRLQIAFQGQGIKWLIAHLANLEKL
>MS0413 uvrD, UvrD protein
MKLNPQQQQAVEYTSGPCLVLAGAGSGKTRVIINKIAYLIEKCGYLPKQI
AAVTFTNKAAREMKERVAHSIGKELSKGLIVSTFHTLGFDIIKREYKHLG
FKANMTLFDEHDQMALLKELTEDYLQQDKDLLRELISVISNWKNDLIMPA
QAAKIARDEKQQTFAKCYERYANQIRAYNALDFDDLIMLPTLLFKTNEQV
RSKWQEKIRYLLVDEYQDTNTSQYELIKLLVGSRAKFTVVGDDDQSIYSW
RGARPQNMVRLRDDFPNLQVIKLEQNYRSTQRILHCANILIDNNQHVFDK
KLFSTIGEGEKLQIIEAKNEEHEAERVVGELIGHRFTNKTKYKDYAILYR
GNHQSRLLEKVLMQNRIPYKISGGTSFFSRLEIKDMMAYLRLLVNQDDDA
AFLRIVNTPKREIGAVTLEKLGSLANEKHISLFEAIFDFELIQRVTPKAY
NALQTFGRWIVELSDELVRSEPERAVRSMLAQIHYEEYLYEQAVSPKAAE
MQSKNVATLFDWVNDMLGGDEFNEPMTLNQVVTRLTLRDMLERGEEDDES
DQVQLMTLHASKGLEFPHVFLIGMEEGILPHQTSIDEDNVEEERRLAYVG
ITRAQRTLRFTLCKERRQFGELLKPEPSRFLLELPQDDLQWERDKPPMTE
EQKQEKAVANIANLRAMLKRN
>MS0523 xerC, XerC protein
MQTYLQKYWNYLRNERQVSSYTLTNYQRQMDAVMKILQENDIQNWRQVSP
SVVRFILAQSKKSGLHEKSLALRLSALRQFLAFLVLQGELKVNPAIGISA
PKQGKHLPKNINAEQLNKLLDNNSKEPIDLRDKAMLELMYSSGLRLSELQ
GLNLTSLNFRSREIRVLGKGNKERILPFGRHASHSVQEWLKVRLLFNPKD
DALFVSSLGNRMSNRSIQKRMEIWGVRQGLNSHLNPHKLRHSFATQMLEA
SSDLRAVQELLGHSNLSTTQIYTHLNFQHLAEVYDQAHPRAKRRK
>MS0746 xerC, XerC protein
MMKDSALIELFLNELWLGKGLSDNTVQSYRLDLTALSQWLQGQGKSLETL
DSSDLQAFLGERVDQGYKATSTARMLSAMRKLFQYLYQESYRTDDPSAIL
SSPKLPGRLPKYLTEQQVGDLLNAPSTDIPLELRDKAMLELLYATGLRVT
ELVTLSTDNINLEQGVVRVIGKGNKERIVPMGEEASYWVGQFILYGRPML
LNGQSSDVIFPSKRALQMTRQTFWHRIKHYAILADIDTDSLSPHVLRHAF
ATHLVNHGADLRVVQMLLGHSDLSTTQIYTHVAKERLKRLHEKYHPRG
>MS0560 xseA, XseA protein
MMNENIYSVSQLNYSVRQLLEGQLGLVWLTGEISNFSQPVSGHWYLTLKD
ENAQVRCAMFRMKNMRVAFRPQNGMQVLVRANVSLYEPRGDYQLIIESMH
PAGEGFLQQQFEALKIKLAAEGLFAQNLKKNLPHFAKTVGIVTSPTGAAL
QDILNILQRRDPSLKIIIYPTAVQGKDAANEIVQMIELANLRNEADVLIV
GRGGGSLEDLWCFNEETVARAIFRSSIPVISAVGHETDVTIADFVADVRA
PTPSAAAELVSRNQQELFQQLQYKRQRLEMALDRLFNEKQQHLQRFLLRL
QNRHPSARLLAQRQQTGQLEHRLNSAIRRLLDKNHYKLTALCERLEKNPL
PYLVRQQNYHIVQLATNLDFALKRLIVSKQTSLSALCGKLDGLSPLKVLA
RGYSIAETEQGETISSVNQVETGDKIKTRLRDGVIVSKVI
>MS1061 xseB, XseB protein
MARKPKESSTVDFETTLNQLETIVTRLEAGDLPLEEALKEFENGIKLAKL
GQERLQQAEQRIQILLQKSDTAELTDYQPTDE
>MS1048 xthA, XthA protein
MYFINRNNMKIISFNINGLRARPHQLDKIVEQYQPDIIGLQEIKVADEMF
PHELVDHLGYHVYHHGQKGHYGVALLCKQAPKAVHKGFSTDTEDAQKRLI
MADFETAFGALTVVNGYFPQGESRDHETKFPAKEKFYADLLNYVKNEHNP
ESNIIIMGDMNISPTDLDIGIGEDSRKRWLRTGKCSFLPEEREWYQRLYE
CGLEDTFRKLNPWTNDKFSWFDYRSKGFAENRGLRIDHILANSKLAERCV
DTGIALDIRAMEKPSDHAPIWATFK