TitleGenColors Logo

Gene list

Applied filters:

COG category: Intracellular trafficking and secretion
Organism: Chlorobium chlorochromatii CaD3, CaD3
Gene type: CDS

Number of genes found: 49

Free access
Sort by:

 



# Chlorobium chlorochromatii CaD3, CaD3

>Cag_1831 SecY protein
MKLTDSIKNINKIPELRQRILYTLLLLFIYRIGSHITIPGVDALAVSTAS
QSHANDLFGLFDLFVGGAFARASIFSLGIMPYISASIIVQLLGAVTPYFQ
KLQKEGEDGRQKINQLTRMGTVLIAILQAWGVSVSLASPASFGKVIVPDP
GFLFIVTTILILTASTMFVMWLGERITERGIGNGISLIIMIGILARFPQA
VVAEFQSVSLGSKNWIIEIIILALMGAIVASVIFLTVGTRRIPVQHAKRV
VGRKVYGGNTQYIPMRINTAGVMPIIFAQSIMFLPATFLSFFPENEMMQS
IAGAFAYDSWWYALIFGAMIVFFTYFYTALAFNPKDVADTMRRQGGFIPG
VRPGKSTAEFIENILTRITLPGAISLALIAVLPTFLTKFANVTPGFAQFF
GGTSLLIIVGVGLDTLQQVESHLLMRHYDGFMKSGKTRGRQGR
>Cag_0868 RND efflux system, outer membrane lipoprotein, NodT
MMLFPRKRESRKILMVGLSTTKRVRTKIIMKKIIWLALPTAIVLAGCSSS
HTLQSPTIALNDRYQQNSAHPQLTEAEGQQQQLVVESVAARWWEAFGSPK
LNRLIEQSLKQNPTLAAAEATLRQAEALANAKYNSTLYPRLDAVGSAQRL
QLNNSRNGVEGGEKRFNLYNGSLSSSYNFDLSGANNRQLDALQAKANYQH
YQLAGARLRLATEVAVTAIRQAQLGAQMEALERLIALGNEQLTINRERLR
LGAIASHELLEVERMVAEQRAALPAMRHAYQQSRHALALLEGSTPDNATL
PTFTLAEFQLPATLSMRIPSQFVRYRPDIQAAEALMMAANAEYGAAAAKA
YPQLTLSASLGSQALTTAALFGSGTAVWSVAGQLVQPLFNPSLGDEKKAA
NAAFEAATAHYRQSILAGLRDVADLLSALYNNAIALAALASGAAFADEQV
ALTEQRYKLGAASYLEVVQAQSEATQLQLELLAARAQRLSNSAVLYQAMG
GGEMLSPSGRE
>Cag_1198 RND efflux system, outer membrane lipoprotein, NodT
MKRHPNETGENDIVPQITWFPTIMPHTKKKTRLLLAATQLAIATTIVGCS
APKESMPPDVAMPDAYRGAATVAAPSDSTIAQMPYQNFFADTALTALIEQ
TLAHNADLQSALKNIELAEQTLDAAKVVWLPSLNLSAQTIRNESSEHGVR
RTPKEFTAAVSASWEVDVWGKIKNRKQSVLANYLKSQEAVKALKTRLVAD
VASGYYNLLMLDEQLAVARKNLALADKTLAMMQLQYQAGQFTHLAIRQQE
AARQQLAATIPQIEQAVAVQENALSVLSGSMPNAITRNPSLLQVKPTNTF
AVGIPAAMLHNRPDVQAAEFALKAATADMKESGAAFYPSFTITAQKGVSA
LQSSDWFNVPSSLFSVVQGTMLQPIFQRGQLEVTYKQSQVKRDQAALAFR
QSVVKAVAEVSDALVRIEKLQTQEQLAEERVATLQQAVRNADMLFRSGLA
TYVEVMSVQSNAHNAELTLADLRRQRLTATAELYRALGGGWR
>Cag_1242 VCBS
MQIIKVIPMAESVVVGRREVVFVLGNLADVKSLLDGVLLGLEVHLLDPLG
DGLTQMANILAGQSGYDAIHLLSHGSSGELQLGATMLNSSNVNSYAGVLG
QISGALAPSGDLLLYGCNVAASTEGQLLVDTLARLTQADVAASEDLTGSV
AIGGDWVLEYQAGTVESTLPFVDGMVVGYELTLVNSITLTVPSSPTINEE
ASYDFDGFDIANSGSGTAFEAIVTLTTPSNGTLSLSDYSGIEILSRGSLT
EVKTSLNDLVFQDAANYSGTVSITVTVNVYTANYVPSDLLRSDTKTFTIT
VNPVNDAPVFSDSYSPMLTGINEDVQDASNTGTLVSALVVDGSITDVDGT
AFEAIYVTAVDTAHGRWWYKVGTGSWTEFNFSGGNTSKGLLLSATDIVCF
VPAANWFGSPTLTFGAWDTSSGSVGTYATISSTGGETAFSSVTDTASITV
SPVNDDPTTSNAALSVNKNSTLTGINLTSYSHDNDTGSNNSTDAAITGYK
ILTVPTAEHGQLQKSDGTAVTVDMTLTPTEAAALKFVPTTNYTGSATFTF
QAIDAANVVSNTSTATISVQSVNMDPAISVPESLQTTQQIYEESTLTLDN
ISLSDADADSARVKVVVTATHGTVTLKQLTNLYDAATGGNTLSNATGASL
TLYGTLTDITNALDDLTYTPEKDFFGSASVTLTVDDLGNTGGNAKTDSET
INITVYNVPDKPVVSGEVTLEAINEDTLDPSGASIWQIIVTDSEAFSDAD
DNDLDGIAISADASTSAQGVWQYSANDGVTWKNIGTVTESSALMLSYETL
LRFVPVTNWNGEPGSLTFYAVDDSDYRDFTSNAERQSADFSDGNEKDIVG
ESQSLQATAATEQNGTRVEDLFETVFNNAKSEGETFTGIAVTLSGGDSEA
GVWQYSANNGETWSNVGAVAAGSALLLDGDTLLRFTGSTAGSLSCYMLDQ
SGDRTFTTGDERQSIKISDGGDDLAAAGHSLGTTITPVPDPFVIVNDFAL
RLDEGATKSINSNVLKLTSVDGTASEITYTVTALTLVGGEVQYDSDKDGS
FETVVTTGTTFTQDDLDNSRLQYVHNGGEPTSADQSITYTVWVPTSGGTT
LTNRKLTINVSPVNDIPTLYVPGDTPPSSTQLTANVATSGGSLTFSTSNI
QVVDPDNTNKQLVFRLVESLPQHGTLTIDGNEVALGTVFNYANLAKLVYT
HDGTSATTDSFRVTLRDGAGGEVTKVINLTIGTLATQAPSGIGNLTTTIY
EDPLTSTGSNPGVAIKNLTGYTFSDSDVGATVGGIAVVGNPQNSAQGTWE
YSTDGTHWAAVGTVGDNATTQALVLSPDTFVRFVPVTNYNGTPTPLTIRV
LDNTYGGAVSVSKLVDSTITETRVLLDTSTHGGSTAIADTTNTLGISVIA
VDDDPTLVNHSGTLDSSSNNTLTISSYSFYTLPITSSMLRVDDIDSSASQ
RTFTLTSQPTHGIVIKNVNSTWTKVLDNASFTQADIDSRLIRYLYFDHDI
PTTYSDSFTFTVTDGDVRIKPDPQRPGGIYADTSTTTLSTLTFNLTITDT
WSTSEGGGGGGTGGYTFPTLSPTAVPSVTTGTLTLDEGDQDVTVTTAILT
AIDSDTTDATQLVYTLTSLPTNGTLKLSGSTLQINSTFTQADIVAGSLKF
SHDGSEDFSSDFKFYVSDGGNVTTVKTLSIDITPVNDQPVIATATTAKVL
EGNSLVLRGGTLNPTTNVLSGGVVGAYDVDGVDDDKNLALDTLTYTVSTL
PTHGQVRLEVSGKTYSDSDASTYTVVATDTVISLADLNVGKLHYMHDGGE
STSETLTFTVNDNSGATNATASASSSFTIKIISLNDDPTVTVNTGLIGAN
AINEAATQVISKTDLTGYDPDNLTDEIQFRITTNVQYGQLLLDGKLLGAG
SAFTQADIVANKLSYKHDGLESEITAGHFTDFFNFRLSDGGGGNEPSGTF
TIHILPVNDAPTIIAPATRKVAEEQQLAISGVCVADLDSVNRDLSINSSF
GPIIVTLTALHGIIDLTASGSAVLADDGTASVTVTGTLGEVNATLASLVY
AGNANFNGDDSLTIDVSDQGYSGSGGTLTASQTITITVTPINDRPVNTVP
SATQTLDEDATRTFSSENGNALSVTDIYDTAMSGSTDSLRTIVSVEHGTL
RATTGGGAIISFNNSASVRIEGTAAQINAALEGLVYTPNEHYNGDDKLTI
YTNDFGYNGTGNILIDNDTVDITVNPINDAPTRSSATATATLSSIYEDRA
TSSLDANVVEPVGATVSSLFTSAFSDATDSVTDGSNANELAGVVIVGNSA
NAETQGTWQYYNDFSWSAVGTVSTSDGLYVAGGDKLRFVPVAEFNGTPTG
LTVRLADNSTGTLPTTGTRSLDVSDDTTTSGSTTRYSNSSNAVTLNTSVT
AVNDAPTMTIGTATGFTVTEDGSATVNLASANFTLGDIEAARNEGSGGTQ
GKVSITFSNANGVLHVNSGEWSVSGNDSSNLTVTGTIAEVTSALTGLTYK
PGDDPNSTETIAVLFSDLGNNGSSVTEAKTVSGSLEVTVTPVNDAPIATG
DATLADVSEDAGAAAWSSGTPTNPNYGDLAAPTGNTVSNLFGSLFSDVDE
TTSAHTFTGIAITANAEDGTNGHWEYSTDGGTNWTPIPTTGLSDSAALVM
GATANDKIRFNPDADNYNGTLGALTVRLSDGAGFAASSTVSDLKVLATSA
SDGWSNTITLSTAVSQVNDPPAIANLHDDNVAFVEAVGVSVAGTAVYLDN
TTEGFQAATFSDVELTLRKETTFNGATLTVHQQTTIDANDFFMLPTGGSI
SIQGAPVYVNGLTLFANGSSVKYYDGSTTKTVAVLTNNSLDGELRLTFNS
NATQAAVNAILQRLAYSNDNDKLENTNKNIDIIFVDGNGSTSNAQGTGGA
LTTTATVHIALTPSNDAPSFTTGVTLSGTEADAAGSPLLPSSPTTIATLF
DSKFSDPDNVSGNTLAGVAISAFVEAGRGVWQVDVDGGDNSWVALSTLRP
NSADISATNALLLSKDAQIKFVPNADANTAGLITPPRLTLFAVEDSIPTG
ANASADHAPAITFSTSGALQSYNTTTDTVEARVSATSVNVDVSISAVNDA
PVVTLATTSPNTYTEGIDTAENRSVLGEAVVIDGSVQIADVDITLGEDTF
AGTTLTVARNDGSSGFSANADDVFGFATSGSVTTTGTLASGTVSVSTVEV
GSYTYSSGTLTITFGNVTKEQVNAVAQAITYANSSDTPTASVSLRYRFND
DNHSSAQGSGNSLTGEDVITVNITAQNDMPLAVNDTHQITEDATSITGNA
ITGVGSPSTTADSDPESNSLTVSAIRTDTEVSGSGTSGTVGVSLSGSYGT
LVIAADGSYTYTLDNNNAAVNKLKTSEHLTEYFTYTLSDSALTDTAQLTI
TINGRTDGAPTITANDGNSTETGQATVSEVGLTSDGGTAETTTGTVAISA
LDGLTSITVGGTTVSREALASLSGNHVTIDTVEGTLTLTGYTSTSSVGGI
TTAGTLSYSYTLTARLAHSGTTESTDTIALQITDEGGATQNVNSLVICIV
DDVPTASNDAPSITEGTAGSPASNIVGNVVSGTTGGDAADRLGADVPTNP
VTAVIKGAVTPTTAVASGSTSSSNGTVVAGNYGSLTIGADGSYSYDLDDA
NADVNALKTGSSLTDTFTYKITDADGDSSTATLSITINGTTDNAPTITAV
DGNNGDTAGHVTVQEAGLTDVGVTSETTTGTITLTAPDGLLKVAIGGTEF
TVAQLATFTAQAPSTGIDTSEGTLTITGFTNTTGAISAPIEGTVHYSYTL
KAALTHTDATESTDTIAISITDKGNATVNGSDLVIRIVDDVPTANADAHS
VAEGTTTAPTTTSGNVVSGTSNGDVADRVGADTTATPVTAISFSGNAKTV
GTAFDSTYGSLTINSDGSYTYSVDNTNATVTALNASQSLTETFVYTITDA
DGDSQSANLVITITGTNDAPTITAGSTIATGAFTETADTTNSPTADTVSG
SIAFADVETGDTHTTSVTSRNYVWSGGTLSVAQQNALASAFTLGEKTDSN
GSGTQAWQFSAADSIFDFLAAGETVTATYTITVTDNGSPNASCTQNVVVT
ITGTNDAPTITLGTGDSDTAALPETDAKLTASDTLTITDVDVTNTVTASV
QSLETTGDVNYVNPETLLALFTVSPTNIISNTETSKSLTWTFDSGTHFFD
YLEKDETLTLAYTVQVTDSNNPAATADKVVTITITGTNDVPTLTIAAPDS
VEELAGASTQDLSAITGNLAIADKDVSNTLTPTQGTPTVVWSGGASLPAG
YNVSALTAENILTLGAAGTSTGGDVNISWTYNPSAVNLDFLANGETLTVT
YPITINDGKGATDTENLVITITGTNDAPDINVDSGDKAVDTLAETNAGLS
TSGTLTVTDLDYTNTVSAQVFSVSKSGTTVGIVPNDTTLKGYLTLTSPSI
INATNTTGDIAWNFNSGSQAFNYLAAGENLVLTYTIRATDSNTSAATDDQ
TVTITITGTNDAPVITTIAQTNLTEQTTTDALTTTINATFSDVDLTDVGH
TAQITTVSKDGVITGLSLTDEQLKVLITIGTVTKTSGAAAGSVPMTFTAA
STIFDYLAVNEVATLTYTLEVNDGDGGTHTQTFVVQITGSNDLPLLTATN
VTGEITELVTPSNNLTDSGTIAFTDVDLSNTHTVSVSIVASPLGALSAVE
NSDTTNGTGGQLTWSYSVAASAVEYLAEGETKVEQFDVLVNDGTGSSTQR
VSVTITGTNDAPTITGAIADFGFTETTDAAAQDLSRNGTLSFNDIDATNV
IDVTKSLKTAAVWSNGTIDTTLKSALEAGFAISGTDVAAPGSVNWTYNVN
DAALDFLAKDETVTLTYTVTITDNNGLTATDDVTITITGTNDTPDITATD
VNGTVTEDAALSLTDTGSISFTDLDTTDTSDATVALFSTTTTTGQAIPTA
LTDALANANAVVLSGDIVDKHAGAITWDFALDNSLTQYLAAGETVTATYQ
ITVTDDSGVTTASGSNEVNVRTQNVTVTITGTNDAPVLSNTPDLTIEQTE
DDAAPSGAVGTLVSALISGITDADATNPKGIAITATDSNRGTWYYSTTVT
PDWHSFTVSDASQSLLLSADANTRVYFKPNPDWHGEITSGLTICAWDGST
GSNGGTANITATGDITAFSTVTDTVSVTVSALNDQPTISSDVTISAFSED
VTAPTGTVLSGLTFGYSDVTDDQNDNNTATLIGGDTLTPFTFLAVVGSTD
YTAAQGTWQISKTTSPNANTSSDWIDIPTTGLSTTSALIFNADSKVRFVP
AGNYFGTPGTLTVRLADASVTLTASTSATDYKNLNDTANGDLDLTTGAWS
STDQTLGTTVTYVNDAPTISDDTQTHTAVNEDVATDDNSGALVSTLFSAS
YSDATDNQGANTDNAYENPGAAITGGDGEATPFGGIAIVKNDATADQGEW
QYSTNGTDWTPIVTDISNDKALFLPTTAKLRFAPAAHYNGTPGNLTVRLS
DATVSEIAIAQNISGIIGGSNQWSLGTVALSTSVSAVNDAPVLSATTVFT
GTITESSTAGVGTETPQALLTGITVSDIDLSAANLVSDVFGAGIITVSLT
DRTAGDKFTLNNNLSTSDGVALTTDGIADSGNYVINLTSSATLVQVKAIL
EAIRFEHTSDTPPTAARSFTVTLNDGNNDQGTPDAGGPSSLNATTTLTGS
ITITQANDPPAITDGPDSASLNETDAGLISSGTLTVTDVDTADTVTASRT
LAVSGNSKRSDAAAPSNETLLGMLTLSPTPVIDGLNTTGSLAWSFASGSE
TFNYLRKGETLILTYTVTATDNGSGTLTDTETVTITITGTNDTPAITGGS
DSASLTETDTTVTTTGSMTVTDVDTADTIVLTVDAVALSGTFTSSSSTLP
SSLSASSYQALLNMLVLSPNAALVADATSGTDFTWTFTSGASGDRAFDFL
RKGETLILTYTIKATDNSGATGGDQSASTTSTVTITLTGTNDTPAITDGA
DSANLTETDTTLTATGSMTVTDIDLTDTVSVAVTSVVRDGGTFAGTVPSA
LTDSSNAALKAMLSVTPNSELAADPNAGTSFTWNFASGGSGDSAFQFLAK
NETLVLVYTITATDSSGVSSGEVTTTTSTVTVTITGGNDAPTISNVVDLN
FAESAGDSSAQDIGATTGTLTITDQDLGDTLSITVSADATAKYNGGDVPT
EGSVSVATLVAKSAISFAPPVTTNGESQDVVWTYNPAAADLDWLRAGENL
ELTFVATISDDKGGSTTQDLVLTITGSNDVPSVTTTTPSAIVEITGDSSG
QDIGATTGTLTITDQDLGDTLTLSVSNDATAKYNGGTVPTEGSVSVAALI
ASGSISFAAPVVTNGESQDVVWTYNPAAADLDWLRSGENLVLTFVATISD
DNIGSTTQDLVFTITGSNDVPSVTTTTPSAIVEITGDSSGQDIGATTGTL
TITDQDLGDTLTLSVSNDATALYNGGTVPTDDSTVSVATLVAKSAISFAP
PVKTNGESQDVVWTYDPAAADLDWLRSGENLVLTFVATISDDNIGSTTQD
LVFTITGSNDVPSVTTTTPSAIVEITGDSSAQDIGATTGTLTITDQDLGD
TLTLSVSNDATAKYNGGDVPTEGSVSVATLVAKSAISFAPPVTTNGESQD
VVWTYNPAAADLDWLRKDDTLVLTFIATISDDKGGSTTQDLVFTITGSND
VPSVTTTTPSAIVEITGDSSGQDIGATTGTLTITDQDLGDTLTLSVSNDA
TAKYNGGTVPTDDSTVSVATLVAKSAISFAAPVVTNGESQSVVWTYDPAA
ADLDWLRAGENLVLTFVATISDDNIGSTTQDLVFTITGSNDVPSVTTTTP
SAIVEITGDSSGQDIGATTGTLTITDQDLGDTLTLSVSNDATAKYNGGDV
PTEGSVSVATLIAKGAISFATPVLTNGESQNVVWTYNPEAADLDWLKAGE
NLVLTFVATISDDNIGSTTQDLVITITGSNDVPSVTTTTPSAIAEIPSDS
SAQDIGATTGTLTITDQDLGDTLTLSVSNDATAKYNGGTVPTDDSTVSVA
TLVAKSAISFAPPVKTNGESQDVVWTYDPAAADLDWLRSGENLVLTFVAT
ISDDNIGSTTQDLVFTITGSNDVPSVTTTTPSAIVEITGDSSGQDIGATT
GTLTITDQDLGDTLTFSVSNDATAKYNGGPVPTADSTVSVATLVAKSAIS
FAPPVKTNGESQEVVWTYDPAAADLDWLRKDDTLVLTFVATISDDKGGST
TQDLVFTITGSNDVPSVTTTTPSAIVEITGDSSGQDIGATTGTLTITDQD
LGDTLTLSVSNDATAKYNGGPVPTADSTVSVATLVAKSAISFAPPVKTNG
ESQEVVWTYNPAAADLDWLRAGENLVLTFVATISDDKGGSTTQDLVFTIT
GSNDVPSVTTTTPSVISEVTGDSSAQDIGATTGTLTITDQDLGDTLTFSV
SNDATAKYNGGPVPTDDSTVSVATLVAKSAISFAPPVKTNGESQDVVWTY
DPAAADLDWLRTDDTLDLTFVATISDDKGGSTTQDLVFTITGSNDVPSVT
TTTPSAIVEITGDSSGQDIGATTGTLTITDQDLGDTLTLSVSNDATAKYN
GGPVPTADSTVSVATLVAKSAISFAAPVKTNGESQDVVWTYNPAAADLDW
LRAGENLELTFVATISDDKGGSTTQDLVFTITGSNDVPSVTTTTPSAIVE
ITGDSSGQDIGATTGTLTITDQDLGDTLTLSVSNDATAKYNGGPVPTDDS
TVSVATLVASGAISFAPPVTTNGESQDVVWTYNPAAADLDWLRAGENLEL
TFVATISDDKGGSTTQDLVFTITGSNDVPSVTTTTPSAIVEITGDSSGQD
IGATTGTLTITDQDLGDTLTLSVSNDATAKYNGGTVPTEGSVSVAALIAS
GSISFAAPVVTNGESQSVVWTYDPAAADLDWLRAGENLVLTFVATISDDN
IGSTTQDLVFTITGSNDVPSVTTTTPSAIVEITGDSSGQDIGATTGTLTI
TDQDLGDTLTLSVSNDATAKYNGGPVPTADSTVSVATLVAKSAISFAPPV
TTNGESQSVVWTYDPAAADLDWLRSGENLELTFVATISDDKGGSTTQNLV
LTLTGSNDVPSVTTTTPSAIVEITGDSSAQDIGATTGTLTITDQDLGDTL
TLSVSNDATAKYNGGTVPTDDSTVSVATLVAKSAISFAAPVTTNGESQDV
VWTYNPAAADLDWLRAGENLELTFVATIADNNGGSTTQDLVFTITGSNDV
PSVTTTTPSAIAEIPSDSSAQDIGATTGTLTITDQDLGDTLTLSVSNDAT
AKYNGGTVPTDDSTVSVATLVAKSAISFAAPVTTNGESQSVVWTYNPAAA
DLDWLRSGENLELTFVATISDDKGGSTTQDLVFTITGSNDVPSVTTTTPS
AIVEITGDSSGQDIGATTGTLTITDQDLGDTLTFSVSNDATAKYNGGTVP
TDDSTVSVATLVAKSAISFAPPVKTNGESQEVVWTYDPAAADLDWLRKDD
TLVLTFVATISDDKGGSTTQDLVFTITGSNDVPSVTTTTPSAIVEITGDS
SGQDIGATTGTLTITDQDLGDTLTLSVSNDATAKYNGGPVPTEGSVSVAT
LVAKSAISFAPPVKTNGESQDVVWTYNPAAADLDWLRAGENLELTFVATI
SDDKGGSTTQDLVFTITGSNDVPSVTTTTPSAIVEITGDSSGQDIGATTG
TLTITDQDLGDTLTLSVSNDATAKYNGGTVPTEGSVSVATLVAKSAISFA
APVTTNGESQDVVWTYNPAAADLDWLRAGENLELTFVATISDDKGGSTTQ
DLVITITGSNDVPSVTTTTPSAIAEIPSDSSAQDIGATTGTLTITDQDLG
DTLTLSVSNDATAKYNGGTVPTDDSTVSVATLVAKSAISFAAPVTTNGES
QSVVWTYNPAAADLDWLRSGENLELTFVATISDDKGGSTTQDLVFTITGS
NDVPSVTTTTPSAIVEITGDSSGQDIGATTGTLTITDQDLGDTLTFSVSN
DATAKYNGGTVPTDDSTVSVATLVAKSAISFAPPVTTNGESQDVVWTYNP
AAADLDWLRAGENLELTFVATISDDKGGSTTQDLVLTITGSNDVPSVTTT
TPSVISEVTGDSSAQDIGATTGTLTITDQDLGDTLTLSVSNDATAKYNGG
DVPTEGSVSVATLVAKSAISFAAPVVTNGESQSVVWTYNPAAADLDWLRS
GENLELTFVATISDDKGGSTTQDLVFTITGSNDVPSVTTTTPSAIVEITG
DSSGQDIGATTGTLTITDQDLGDTLTFSVSNDATAKYNGGTVPTDDSTVS
VATLVAKSAISFAPPVKTNGESQEVVWTYDPAAADLDWLRKDDTLVLTFI
ATISDDKGGSTTQDLVFTITGSNDVPSVTTTTPSAIVEITGDSSGQDIGA
TTGTLTITDQDLGDTLTLSVSNDATAKYNGGPVPTDDSTVSVATLVAKSA
ISFAPPVKTNGESQEVVWTYNPAAADLDWLRAGENLVLTFVATISDDKGG
STTQDLVFTITGSNDVPSVTTTTPSVISEVTGDSSAQDIGATTGTLTITD
QDLGDTLTLSVSNDATAKYNGGDVPTEGSVSVATLVAKSAISFAPPVTTN
GESQSVVWTYNPAAADLDWLRSGENLELTFVATISDDKGGSTTQDLVFTI
TGSNDVPSVTTTTPSAIVEITGDSSGQDIGATTGTLTITDQDLGDTLTFS
VSNDATAKYNGGPVPTADSTVSVATLVAKSAISFAPPVTTNGESQDVVWT
YNPAAADLDWLRAGENLELTFVATISDDKGGSTTQDLVLTITGTNDAPTL
TALDACSYTEGAEATLIDSYVTLADVDASTRMNGGTVTVSITEDGLTTDQ
LSILTQGSEAGEIGVSGSTVSYGGTAIGTIDSTSNGVNGVALLITLNGNA
TPTAVDALIQRLAYRSTSDDPTQASATRTLSITVVDGDGTANGGTDSVMA
TSTLTITPLNDAPTITPTAGAASYTENNGAITVDSAITVTDADDTQIANG
TVTISSNFLAGDLLAINLIKGTGDNEGKFILAGSVQTNISGSYTSGTLTL
SGTDSVANYQAVLQYLTYEHTSDDPTNNTLKPNRTLTYSLTDANSDGAGA
ATGTATRTINVTALQDNPQVTTTTATAQVYTENSDPVIVDSALTLTDADD
TEMSGATVQITENLKAGDLLAVNLTIGTDAHAGKFILAGTVQTNISASYA
DGTLTLSGTDTKEHYKAVLRAVTYVNTSNNPNTNNATDPLARTITFTVTD
ANSDAVGAANGINTRTLDVTAENDKPVINGTVISPTSVETNGEGSGTSVV
KLLSGSTVTDADFFTAGTNFGGGNLTVNFTDAYVVGDVLNVESCTLAVGA
IQRSGNDVQYSSDGTTWITLGTVDNTNSGVGKSFVINLNTNADQTNVAAL
LNAISYQSTSDNPTLNNSDTSRAYSITLNDGNNNNLAGGTDEASQTSIAV
TGTITITPTNDAPIVDLNGATEGAASSVTWAESSNATHQAVTISPSATLA
DVDNLNFTQMQLVISGLHNGNSEVLTIGGTVFPLDKNATNVDVGNFVVSY
DTSLHAFIIIPDESGTIETLTNFQTLLQGITYNNTTDNPTVGDRTVTVSV
TDAGHSDSATVSGAVTSVVATATITVTSVNDQPVITDVTNVSFSENAINA
TASVIDSSITLIDIDSAIYDGGSVTVSGLVAGQDKVALPLAPTDASGNVK
WTGVNGGAVSYYNGTAWIAIGTATGGDGNNFVVSFNSSATPAIAERVIEN
LTFANSSHNPSTERTLTIAVNDADGGTVQTADVAVTIVRDNDAPTISSLD
ATAATTYIQAGTAVALDNNVALSDFDLEAYGNGSGNWSGSTLTIQRQGGA
STDDLFGASGTLSLSEDNVVVGGTTIGTYTNSGGTLSMTFSTSATTALVN
SALQNITYSNADTVSGHLGYNSVVLAYTFNDQNSNATNGTAGTGQDQGVG
GYATASGTITVNINRLPVVVNDTNSVAEGLATTDSTTISGNVLTGVGNTS
NVGADSDADVGLLGRSDALVVVHAKDSSDGSYTAITASTTSANGSTIAGD
YGSLKIGADGSYIYRVNNALNVVQALAINETLTETFAYQVHDGVGGYNAA
ALTITITGTNDAPVTASITQTNLNEQITTSDLTSNITASFSDVDLTDIGH
TAQITAVTVTGVTAGLSLTEAQLKDLISIGTVTKATGSTAGSVPMTFTAA
STVFDYLAVNEVATLSYTLEVDDHDGGKPTKTFVVQITGTNDAPVITATD
VVGTITEGSTLSDSGSISFGDLDLTDRPTAAEATKSVSALQANGTTELVL
TNAQQTAIENAFTITADSGNDNDGTISWNYSISETALDFLAKDETVTVTF
TITVSDGKGGSDSEDVTVTIIGTNDAPVITATDVVGTITEGSTLSDSGSI
SFADLDLTDRPTAAEATKSVSALKANGSTVLVLTSAQQTAIENAFTITAD
SGNDNDGSISWDYSISETSLDFLAKDETVTATFTITVSDGKGGSDSEDVT
ITITGTNDAPLITAPNVAGTITEGSTLSDSGSISFGDLDLTDRPTAAEAT
KSVSALQANGSTALVLTSAQQTAIENAFTITAESGNDNDGTIAWNYNISE
TSLDFLAKDETVTATFTITVTDGKGGNDSEDVTVTIIGTNDAPVITATAE
NIAGTITEGSVSTLSDSGSISFGDLDLTDRPTAAEVTKSVSAVKADGSTA
LVLTSAQQTAIEDAFSITAAAENDNDGTISWDYSISETALDFLAKDETVT
ATFTITVSDGKGGSDSEDVTITITGTNDAPLITAPNVAGTITEGSTLSDS
GSISFGDLDLTDRPTAAEVTKSVSALKANGTTELALTDTQKTAIENAFII
TPNGVSGSNTHDGTISWDYSISESALDFLAKDETVTVTFTITVSDGKGGS
DSEDVTVTITGTNNAPVITATDVAGTITEGATATLSDSGSISFGDLDLTD
CPTATEATKLISALKANGSTALALTNAQQTAIENAFTITPNGVSGSNSND
GTIAWNYNISETSLDFLAKDETVTATFTITVSDGTGGSDSEDVTITITGT
NDAPVITGVDVIGTITEGAASTLSDSGSVSFGDLDLTDRPTAAEATKSVS
ALQANGSTALVLTSAQQTALENAFSITPNGVSGSNTNDGSISWDYSISES
VLDFLAKDETVTATFTITVSDGKGGSDSEDVTVTIMGTNDVPTITNQSTA
LAGTVIEAGNNDDGSEVAGTSTVSGTLSASDVDAGATQTWSIQGTPSTTY
GSIVINPTKGEWTYTLDNTKATTQALKEGQSVTQSYTARITDDKGAYVDQ
TITVTIMGTNDVPTITNQSTALAGTVIEAGNNDDGSEVAGTSTVSGTLSA
SDVDAGATQTWSIQGTPSTTYGSIVINPTKGEWTYTLGNSDSDTQALKEG
ESVTETYTARVTDDKGAYVDQTITVTITGTNDIPTITNATTALAGTVIEA
GNNDDGTAVAGTSTVSGILAASDVDANATKTWSIQGTPSTTYGSIAINAT
TGEWTYTLDNSDSDTQALKESESVTQSYTARVTDDKGAYVDQTVTVTITG
TNDAPVITNATTALAGTVIEAGNNDDGTAVAGTSTVSGMLAASDVDASAT
QTWSIADVSPSTTYGSIAINATTGEWTYTLDNSDSDTQALKEGESVTQSY
TARVTDDKGAYVDQTITVTITGSNDAPTVTNATTALAGTVIEAGNNDGGS
STAGTSTASGIFAASDVDASATKTWSIADVSPSTMYGSIAINSATTGEWT
YTLDNTKATTQALKEGEIVTQSYTARVTDDKGAFVDQTITVTITGTNDQP
IAFDDTKQTNEKSILSSQVPPATDVDGTIASYELVESVSEGSLTFNADGS
YSFNPANAFNDLGVGETRNVSFTYKAVDNNDGRSNAQTITITVTGTNHAP
TSTDDTVAVTEETAKTLTINDFGTFSDADAGDSLSAVVITTLPANGTLTL
NGTPISEGQSITVADINAGKLVYTPASQDDTDESLSFKVKDADGAESSSA
YTLTLDILPVDDPPVSTNDTVAVTEDTAKTLTISDFGTFSDPDSGDSQSA
VVITSLPSNGTLTLNGTPVTANQTISVADINAGKLVYMPALHDDTDESLG
FKVKDADGTSSNNPYTLTLDILPVEDAPSATNDAVTTNEDIFVVLALADF
GTYSDPEGAALASIKITSLPTNGVLHYNSGTVQTPLWVPVPLNHEFTIAS
LEAGMLRFTPDANENGTNYATIGFNVSDGTAYSTSASTLTVNVLPVNDTP
KSSDDLISIQENTPKVLALSDFGTYSDVEGSALSSVIISALPQKGVLEYF
DTTLATPAWRAVTVNQHITKADIDAGRVQFMPASNENGDNYATIGFKVSD
GEAISEGYALRVDVIATNDAPLRTEEDVALALTMYDISRYSNTASTSIAA
VKITTVDGSGELEYFNGTAWAPVTLNQVITKAAIEDGLVRFMPASNENGD
NYATVSFTVSNGTAFSATPSTFTVHVTPVNDAPTSTNSRIATDEDSSILL
SLTSFGTYSDVENTPLTAVQFTTLASNGVLQFNNGSQWGTVRVGQELSAA
AIEAGNLRFVPDSNEFGLAYAIAGFKVSEGGNVWSNSSYTLTVDVASKND
VPSTTDSVIRTNEDTSKVLTVGDFGDYRDAETTSFTVVKITSLPTNGELQ
CNSATLAAPVWRAVTLNQELLRESIEAGRVRFMPDSNESGDNYATLGYQV
FDGEAYSAASNTMTVHVTPTNDAPTSTNDGIVTNEDVAAILSLENFGDYR
DAEGAPLGMVQFTTLPTHGALQYNSGTADAPQWVAVTLNQPITREAIAAG
ALRFMPAANEFGDDYTTMSFKVGEVSANGDVWSEAAYQLTVDVKPLNDLP
TTTNSVVRTNEDTPKTISLSDFGTYQDVESSSFTSVKITSIASNGELQYN
IATVELPAWQAVTKGQTITREDIEVGKLRFMPDSNESGDNYATLGYQVFD
GTDYSVDSYSMRVDVTPVNDPPTATDDRISTNEDSAKVLGITDFGSYSDV
EGAVLGMVQFTALPADGKLQYNSGTADAPQWKAVTLNQPLTRADIEAGKV
RFMPDGNESGEGYASMSFKVGEVSPNGDVWSEAAYQLTVDVLPINDAPLT
TNSSATTNEDTTLPLTLADFGSYSDVEGSPLATVQITALPTNGILQYNNG
TLENPQWVAVTLNKEITREDIEAGKLRFVPDSNEYWTPYTTVGFKVSDGT
TYSFDNYTLTLNVTPVNDLPTSSDDAVTIKENQVALLSVEDFGSYTDEER
TPLASVTITTLPNNGALQFNSGTPTEPVWKAVSNNQTITRADIDAGNLRF
VPDHNGNGEPYTSFQFTVSDGKGSSEAAYTLKVNVTPYNEEPIAAPEDKL
LLVTINDVSTYSGINSSSIVSVTITELPAEGVFEYFNTTLATPAWQDVTV
NQQITKADIDAGNLRFVPDSNEYSDNYAAFGFTVSDGISINPEIYTIPIA
VTPVNDAPQSTGDAITTPEDTTKVLSLTDFGEYSDVENSALAELKITSLA
TNGKLQYNNGTQWIAVSEGQTITRADIDGGKLRFVPDSNEFGEHYAEVGF
AVSDGSDYSLDAYTLVVEVTPINDLPTATNGIFITNEDTADTLSLEDFGV
YNDVEGAALRALKITTLPNHGILQYNSGTADAPQWSAVSEGQSIARANVE
AGMLRFVPAPNEYGDAYTTISFSVFDGSDYSETPSSITVKVLPVNDAPLS
TNDSISTDEDMPVLLTVADFGAYSDIEQTPLAKVKITMLASNGVVQHHNG
TQWVAVTLNQEISRADIEADIEGGKLRFVPDSNESGEPYATVGFTVSDGT
DYSNEFYSLTVAVRPINDPPISTNDSVVTPEDTPRILGVDDFGTYYDAEN
APLAAVTITTLPNKGLLQYHNGTQWVAVTEGQAISREDIDGGMLRFVPNE
HEQGSPYTSLEFTVNDGVVDSAVYTLTVHVAAMNDAPTLRAFEPSVMLVE
KGGIDNAIDGTATATIAIEKRDADGTASYNHTALENAGWSTSNGGATYSK
AGTYGTATLTIATDSVSYQLDDSRTTTQWLQGGQQVKDSFAIYVQDNATP
PANGSGNAIFTITGANDTPVAAPKAFSVTEDAPLVTGTLSSTDADAGDSA
TYTLNAAVAGLTLNADGSYSFNPSDAAYHYLNNGERQTVVANYTVTDAQG
ATDESTLTITINGRNDVFLSVDDITVNETAGSATFTITRSGDTAVATSVH
YATSDGTAKKTFDYSEVNSTVTFAIGQTSKTVVVPILDDAIFEGSEMFNL
VLSSQPTGTTLSKNFAIGTIKDNEAAISTSSSSNDSGGSGTIDPATPLTI
QLSGKGDISESSDAIFTVTLNRATTEDVTEVALTLGVKGDSAIAGNNKDY
STDYSAYYFIGEGAEQQKIDLSIANNKVQLPIGVEEFFIAIPTKSDKEYE
GAERFTLSASLDNGQSATARSTILDDGSGQVYDEHGIVDATQKGDDDWYL
EIPDVTVNEAAPYAVFRVLASSNISFTMQLEDGGVDPDGNPYESDGIATM
GEDYTNALEIYNGEGWIPYTVGSPINVPKGGSVLLVRVPIKNDDSYEGAH
AFTLVATPSGNREVKRPLGIIGDFGTGAIYNDSGAEDRKADKDDDRQLKI
DSPIVNEGSTYSLFTITGKAGAVTLTIKDDESADTDPADKILEIADKNSL
IQLWNGSSWIPYNGTNAALVDADNNSATTETLLVRVNITKEQEQVGAAIE
REGSETFMLNVVQGSGADKAESFGVSTIRDDGTGVIYLFEKSAGVADKDG
TGVYVPPPSIKDLDDDYDQDGITPTTEEALATLAASQGIGYAKQGDMNGD
GKEDATQNALATLAWTTKEKFDEGNDGTLTDSTAIISIGVAAKEDSTTSE
ISDSLQLVAIEVKKYGEIDGATTVTENKNDKGEVESQTITLVNGSEVTTP
WDPIVFKIQGQDSDYDGVVDADKKLEENSVRDISSRQGTQVKVIIDVRAA
GLTSNDVNAYIKYVSSDVLKHLTLYDLHGKQITKAGWYDFTRLDPTTDND
GAHLIFDEEVEGEVKPLLEIELIITDNQFGDNDHVLGKIHDPGDLVKITK
NAADPSTPIYTADQTPNDVDFYGDTSGTSVPLKTWYNPITGDYFYAPATV
APPYNCYIERTDINAGTVLPVNDPARAYNVHLYLNDAGDTQLAGESSALL
NKGYRDLGAIFASAKAPVLDSSAPTVTAFAPTDDAVDVPLYKDVELIFNE
EVTKGLAGSISLHENTAAGTVVQAQVTFDGQKLIINPDYDLLPNTHYVVT
VDNGAVIDLAGNAYNPSTLAYDFTTGTQGADPYADGSDNGFSTGEVLGGI
AALGFITWLVL
>Cag_1704 Peptidase S49, protease IV
MNNSSIPQKRRGCFRPGCLWFLVVPLFIVVALFWAFRSSHDMPDRFVLVV
PLSGKLAEVNNERSSLPFMPSQGDLSLQEVLFVLHEAAKDEQVSEVLLQL
DGVEAAPAKIAEVRAAVADVRRKGKKVSAFLYRAEDSDYLLATAADTIIM
QRGASLLLDGLKAESLFYTGTLNKLGITVQAAQWKEYKSGIEPFTRTSAS
KEYREQINMLLDDVYNNYLSAVSERRKISRSAFEAIINNEALLSAERAKA
LGLVDRIATFWDVERSMTKQLTGEELSSENNALVHAADYRNAMDYPQHSS
TSDAIAVITMSGPIMRSVDNLDDGIDVATMQHSLEAALENKSVKAIVLRI
DSPGGEAIASADILQMINAAATKKTLVVSMSGVAASGGYMVALGGKTIVA
HPLTITGSIGVYALKPTIQGLAEKVGLQREVITRGRFADATSPFTPLEGE
AYNKFVASAGDVYNDFISKVATSRRMKVTAVDSVAGGRVWTGSRAKQVGL
VDRMGGLFDALALAKERAGISKDKEPTILLYPLQQGWLQSLLGGATLNSV
TKAIATALLGNVLPINVEQQPLSAMQPFYDMLIRSGKPHMVALMPAEVVV
K
>Cag_1346 Peptidase A8, signal peptidase II
MKLFFSLALFVVAADQFSKYVALRFLRDANQSISIIPNFFSFTYAENRGI
AFGLEPAPPALLLLFTMMISAAVLWYVLRSNNRRLIFLLPFSLILGGGVG
NMIDRMVRGYVVDFIYFNLYNGYVGNIYLSLWPIFNIADSAITIGGTMLL
LFHRTLFPDDPIA
>Cag_1056 Hemolysin activation/secretion protein-like
MVPKIITSLVAGSVVFSASLQAAPLVPNAGSLQQQQRPAAVSKQFKQNVQ
ADKKATEKSKPLAIKPSAEGKVFVKRFTFSGYEGTVSQDELQNMVKPYVG
KQFSMEQLDAVSANITSELRAKGWLALATLPPQDVTSGTVHVAINTGKAA
MTSITSDGSIRICKRPLRQIAEKTCPPGSPLNTNDQERAVLLMNDIPGIA
ATTSLSKGMQAGTTDVNYLIHEGALLSGVLWADNYGNRYTGSLMQYAVLN
INDPFHCGEQIMLNAAHSAGMWRGGANYSVPMPFLFAGLTGHAGVSGMQY
ELLEELEVLDYKGTSVKADAGFSYALHRSRKANLTSDVSYTYKGLKDRMS
NTDLRDGTIQFVTFGLSGNYHDDLFFGALTTADVSITKGSLDEKIRDIHL
SGAQGGYTRFNLELTRYQRFSEPCALDLTFSAQHTLKNLDSSDKFYLGGP
YTVRAYPLGEAAGDHGALFKADLRHRIPVPAEWGDMFVNAFYDVGHVTLN
KDRYAGDSATMNATGSNDYWLQGAGVGLRYDISETFTLQGCWAHTIGKNS
GRAFDGNNSDGKSDNHRFWVQGLMNF
>Cag_1212 Cell division transporter substrate-binding protein FtsY
MGFFDKFKLSRLKEGLEKTRDTLREKLSVITKGKTEIDDEFLEELETILV
GADVGVETTLAIVDAITERAKKETYHSETELNRMLIDEIQQMLQESSDEH
PVDFDAPLPAKPYVILVVGVNGAGKTTSIAKLAHNYDQAGKKVIIAAADT
FRAAAYEQLQIWADRAGVPMIGQGQGADPASVVFDAVSAAVSRNADVVLV
DTAGRLHNKSHLMEELAKIMRVAKKRIPEAPHEVLLVLDGTTGQNAVQQA
QEFTKFVQVTGLVVTKLDGTSKGGIVLSISRDLKLPVKYIGVGEKIDDLQ
LFDRRNFVGALLGKEEK
>Cag_0744 Type I secretion outer membrane protein, TolC
MRCHLKKIASLLLLLVLSVSAFPLHAETLDLATAYRKAMEYDARLRAAKA
DNAIYREEVGKARSQLRPNIRGNASRGRSTTQRGNKYGFYPADSYNTVNY
GVTFRQTIFNFSSTAAYDQAKLVAMKSDTDFRKEEEMVMVRIAEAYCNVL
FAEDNLAFNNSFKTAAKEQLQQAKKRFAKGVGTLIEVEEAQASYDQADAQ
GIDMQNNLEFSRRELEHLTGIYPSELRAVDAAKLPLFAQQESFEVWLERA
RTANASVESARHEILIAKKEAAKQRGAQYPSLELVAGRNYSESENNYSIG
AIYNTYSVSMQLSWPIYTGGYGSSSIRQADAKKIKAEEQYSLQVRQMESD
VRKYYNSVAGSIALVKAYQQAVNSREVALKGMKRGFQAGLRSNVEVLDAE
QKLFASRRDLAKSRYQYILNLLMLKQAAGVLQPQDVDEVNGWFAKASLK
>Cag_0616 Parallel beta-helix repeat
MKPRFYIEQLEPRILLSGDILSELVPLLSSREASQMQSDYLLEHPEARRV
APLSAQEAARACMVVVQNEAPPLLTEDGLMYPFEVGVGDERSSEANAEPT
LAADFSADYTFSKSEWDALEDGWRNLSSMVGDTLLDENLVAVESLLSGGS
RLYGGDELAALLQQPIDEYGSVFAQSSKGVLEALTQEWRNGDLVVVGKVL
GGYNATTQDERFELSTKSNDEHLSSANGILDVSWFDDDVTYLFNTTGELT
IGRGEWSFTDGVLCFDEGVLSFSLDDVDSLIGGTGDDTYVFAGDVPVYIA
DSAGDDTLMVLGGEATTWNVEGEGTGTVGGLWFQGMENLIGGINNQDTFV
FGERGSIAGAIDGSVGGYDTLVLAGGTYNSITYEAFSPQSGTITRDGDVI
TYYGLEPIIDNTSTVERVLGLSNASDTNAQLSSGANGTLTLSGSTFESIN
FIKPSSSLTIRGLDGTDTVTISSINLGATALTIEAENIIVSTDQVITSSS
DITFTAFDSKNSTSNSNVTTTLGATIEVDGTISTTGKLTLGAQVRSAITV
SNSSLSSSVSSTSLVRAHVGSHAVITANALSVTADTTTAITVTVTDVIAG
NTTVNSQQQTFAIIDGGATLAISTGAISANEPASVLVQATDNTSITTTVS
SDDDSFVSLTGFDVLVSSITLSRDTKATIGDANGRLNLTGLNGGRAGVVK
IIAEHGGRTLGNVASSFVGVHTNTITKDDVIAGVQNATFSIAALAISANN
SSTTQAISKVSTNNITGQTRAWLHNAIVDAHGLAGVSVIALDTSITYAES
SDFQGNTWQFPSIEVGKAAVSNEISKDITATVLTTTMTVPSGAVVVEAKN
LQDTRAIAKATTVVDSVWNPFNTFSMSLGGTYAWNQILGDVIASVTDSSL
SNAASLTVSALNQSVVDARTEATSQLTGGSGSALAVSVAFNAIGWSLGNF
LFAALDAIIGDDFTVTANSTDTLAFVSQSNISVVGDVIVSAVNNSEINST
VSNAAETKASALFNAVGMAAGGLIASNRMLGSTKAYVDESRNGKKVSAGG
NLLISATDATLIYSNTKIVSSSITTNDGGLTFTKDLAAVIAYDYTTNDGS
KQLQFGDLVFVENDYENGGTPRMLYKYLGQTATLDLGEIDYTNTDDWKPS
EVTNFFPSGINITDSDSVSIGGLVVRNDVRSTVEARISNAVVTAGSVTVI
AEENATIQATADSTSKSSGGSSFGTGTSLAVNGVIATNLVLADASALLSN
SDVTTTGNVTVAATNESNIDATTKAITESGNQAVGVVLAFNTMGWEAQNV
LFAAIDALLGTGIGNEDPCRVEALVTNTLLDVGGDLSVTADMTAQLTADI
SNDTTSAASAFIDASGMAVSALLASNMVSGSSKAAIDYTSTKGSVTVDGA
LTVASSDAAGIDATSSMKAVSSTTNDGGASLLGGMVDKVGALYKYSSHSG
SQSIANGDMVKVASDHEAGGVAGALYKYTGSTQTLNLGSVDYSGSNWERL
TVENLSSALFPNIGNITESDSIGVGGQVVRNDVRSSSIAYVNNATITLVG
LLTVTSEEASQLSADIESIVSSSGGSAFGEGTSLAVNGTIATNLVLSQSK
ATITNSTISGGTESGVEVSATNDAAIDAFIDSVTTTGNQAVGVTLAFNTM
GWKAQNILFQAIDALIGTDIGDEQASKAEAYIKDTTISVGKDVVVNADNA
VQLNATVSNAAESVASALFGATGAAASGVLASNMVSAGAKAYITYSTSGS
VTAGGDVTVTATDNAGVYANVKLVSSSITSNSGGMDVLNKLNNNRATVAL
VDFYSSDGTQPIKFGDYVSLAADYDEEQGEAGTLYEYLGSDATIDLSDTD
YTNADDWKQFPLTNIFPQGLNVASESDSIAIGGLVVRNDVRSGAEASISK
SNVIAGSVTVIAEENATIQATADSTSKSSGGSSFGTGTSLAVNGVIATNL
VLADASALLSNSDVTTAGDVIVAATNESNIDAITKAITESGNQAVGVVLA
FNTMGWEAQNVLFAAIDALLGTGIGNEDPCRVEALVTNTLLDVGGDLSVT
ADMTAQLTADISNDTTSAASAFIDASGMAVSALLASNMVSGSSKAAIDYT
STKGSVTVDGALTVASSDAAGIDATSSMKAVSSTTNDGGASLLGGMVDKV
GALYKYSSHSGSQSIANGDMVKVASDHEAGGVAGALYKYTGSTQTLNLGS
VDYSGSNWERLTVENLSSALFPNIGNITESDSIGVGGQVVRNDVRSSSIA
YVNNATITLVGLLTVTSEEASQLSADIESIVSSSGGSAFGEGTSLAVNGT
IATNLVLSQSKATITNSTISGGTESGVEVSATNDAAIDAFIDSVTTTGNQ
AVGVTLAFNTMGWKAQNILFQAIDALIGTDIGDEQASKAEAYIKDTTISV
GKDVVVNADNAVQLNATVSNAAESVASALFGATGAAASGVLASNMVSAGA
KAYITYSTSGSVTAGGDVTVTATDNAGVYANVKLVSSSITSNSGGMDVLN
KLNNNRATVALVDFYSSDGTQPIKFGDYVSLAADYDEEQGEAGTLYEYLG
SDATIDLSDTDYTNADDWKQFPLTNIFPQGLNVASESDSIAIGGLVVRND
VRSGAEASISKSNVIADSVTVEATETATITATADSTASSSGGSAFGEGTS
LAVNGVIATNLVLADASALLSNSDVTTTSDVTVAAVNESTIDATAKATTS
TGDTGVGVLLAFNTIGWQAQNILFAAIDALLGTSIGDEDSCRVEALVTNT
RLNVGGDLSVIADMTAQLNADISNDSTSAASALINASSLAVSALLASNMV
SSSSKAAIDYTSTKGSVTVDGVLTVASTDATGIDATSSMKAISSTTNDGG
ASLIGGMLNKALSLYEYSSHSGRQSIANGDMVRVASDHEAGGVAGAVYKY
IGSAQTLDLGSVDYSGAGWQRMILANTFPQFGNVTGSDSIGVGGQVVRND
VRSSSDAQINNATITLGGLLTVSSDEVSQISAYIESVASSSGGSMFGEGT
SLAVNGTIATNLVLSESSATVTNSAISGGALSGVEVLATNDAAIDATVSS
STSSGDTAVGVTLAFNTIGWQAQNILFQAIDALIGTDIGDEQPSTVEAYI
KDTTITVGQDITVSADNAVQLNATVSNAANAMASALFGASSAAGSIVLAS
NMVSAGAQSYISFSGTTQGQVTAGGDVSVTVTDDAGIYSNVKLESTASVS
NNGGVSVLNNSLRADEANKRADYLSSDGEQTLQFGDLIALTQDYDNGGIA
GGLYRYMGKDGDSVDLSTANYEDGGYWEQDNQSVGAVGEWLENLDFTNSD
APNVGGLIVRNDVRTGIEAYINASAVQAATVTVSAYENAIIKAINDSQVG
ADGGSSKGKGTSLAANGVIATNLVLSSADAVIKGSTVTTTGDVTVDATND
SFINATNLSATQSGDKAIGVTLAINTLGWEAQNILFQLLDTLLGADALGD
EDPVTTQAFIIDSTVQAGGALSVTATSTASIKATVSNETTSQADDIKGAS
GMAVGAILASNLVSSSANAEIISSTTAQYTITAGDDVTVVASDDAKIRAN
AKLSAVSSTVNDGGMSLIYQSINDIYPIAFTDRSGVQDLIFDEVDTPILV
RLDEADYKSFDQPEQVVAGDRVQLEFDCAGGASGDVFEYIGASPLEGDFA
LDEQNYSNTSLWNKIKGVTGAVYSYIGNNDSDVNLATEDYTDKTRWKPFV
SFSPSSLIPGLNLNITDSSSAGFGGLVVRNDVRSEVDAHIKRANLTAVGD
VLVQAIESAVILAQNDSVVKSSGGSMFGKGSSVAVNAMIVTNLVLSSADA
SITDSSITTTSGGDVSVLAENTSTINVKTVSSVESNGFGIGVNLAFNTVG
WEAQNFLFNTVDALFGTSIGDEVPADVKAWIQNTTINAAGGVHIEAISDA
NITAPIDSAARSISVTPAGGSKTVTVAAIIAMNKISTATTAFIAGASTVT
AALGDVVIHAEDTSLIDAVVHSSALSVAVGVKDGTAISISFAAARNEIRN
NVEAAFQNAGSAAAPVRVSGDVIVTAKKSATINADIKATAIAVAVSGKGG
LAVSGGGAIAFNTILGKNNAFIANSVVDVTGGDVTISTTDVSTIDALVRA
AAVSVAVGAKSSPAIAIGLSVARNLIGWDSESVSNKYTNTSKPSSLVKGD
TVKIVNGPLTGNVYKYVGENITDSTKVKLGAENYSDRSSWEQIGLASSAN
QVQAYIKDSSVTASGKLDLSATSTALIDAKVLTLAVAVAASGQSGVAVSV
GGVYTDNSIKTDVKAFIDGSGAGTSNIRAASLSLYASDGSSIFTTAAAAS
VAASLAGQSGIAVTIGLAIAINEITGSVDAYASHCDTLTTTSGGITATAI
SKGTPLFSIDLPSAGLSVAQLDDMAQHEGDSSDTKNVDEAVVDATADAAL
LTKLADALTAQGEDIADFESVRVDWLYTTTDASQKLKKGARVKLENGYRG
GGIGGVIYEYLGANDTTVDLSKADYSDTAKWKVVKPELKVARIDTVVGEN
SYDYTTSNGSTSISKGKQVKIGDTYKNGGEAGRVYVYTGEDTKTFNLSEL
DYQEESDWTLLDLPVLGTTWQIVTGDGTTYNLKLSQDGTKVEVSRINIRA
IAAAASLGVGVGGSTGVAVSGAGAVAINSVLSETAAHLDNSTIAAAGAVM
VSGTSNSMIDALVIAASAAVGAGGSTGVGASIGIAVARNFIGYTATANDG
AGGVRASITESSVNAAGAILVDAHANQTIDSLVFSGSVAIGAGGSTGLAA
SGSGVWSENRISMDIVASIDGDGSNGIRATALNLVAEDTSQISSFAAAVS
IAAGLGGSSGLSLSIGATFARNSISNSVNAFVSHVDQGVVTTVLGITITA
SEESNIEVIAAAASAAIGVGGSAGIALSGAGVDAKNVIQTGTLAYADSGS
LTSAADLNISATDESTIEALVAAISISVGVGGSAGVGASIGVSLARNTIG
WTSDPNTSYTYTTDSTTSSINKGNRVKVLHGVRENEVYEYIGDKAITGLC
TGDKPTLLNNLDYSNTKNWKRVDLVQVQAPVKAFTNDVSLTVDGDIAITA
KADQAIDAWVLAASAAIAVGGTVGVGLAGAGSSADNTIEVDVEAYMAGAG
TISANDITLLATDSSSIDSFVGAVAISVGVGGVVGVSVSIGISIADNRIS
TITKAYIADATTVTADAITITADEAATIDTFAVAASLAIGGGGVVGVSLA
GAGAIAENTINTITHAYILNSAVTATGDVTISATNDAEIDAYVGSVAGSL
AIGGVVGVAVGIGFSLAENFIGWNESGDAKAQVFAYVDGSSIDTIGDLSV
TAKNQAIIRSGVDAGAVAIGGGLVAGAASGAGTDSVNRIEVDVIARIANT
FGDGIIADNVLVQADDEAIIRARTLAASLAASFGAFGGSVSISVSLADNT
IADSSQALVDNADIMAGGDVTIKSRANADIAAISQAVSMAASVSLGFSLA
GGGAEATATIKTTTLALAERTTFTLDKGDLTINASNTTKADADVVAAAVS
LGLAAAAAAGSVTDIATDPITKASLGDSCVVLSGGDVSISATADNSAHAY
SAGLSVSTGISVGSTNALLAHDGEVSATVGDGTKVTADALRIKSNAESDF
LLTSEACSGALLAGITGSYSGLDDTIEVTSALGTDSEVKVNTFELNAKNN
HVFDSSSDSVTLGLGAGGAAVVENTLSSSSSALVGDNASVEAEAIIINAT
NKADKSKYANQNNVTAASASAASATALSSTTTFGTDTDPFTARVAVGDGA
ELIAIGNYLNPARLDIASFIDINGFDKVSVEGISLVGSMSVARSVLEAAT
LAEVDLGDARIENRSGDLYITTLTYNKINPATTLSVMSGLSGIAGAESKG
DINAINHIVTTGTTILGGTVYLKAGVDKGGDVNRIQASADATMTMASMFP
NIGVPLPDITVDETNLIELKGDSNIKAIGNVYLTAKQGIYGDKSGTETGS
QVSLSMVPYGQSIDRNGDYKNINKVAIATTAKVEAALNNQVFFWVKPMFV
SGKDGLTRQLASEKLGTIVTTEELTALNIETTIPYKYERLDLSAISSLGT
PEATTLATSLQDMFYVIQPVEMPAAKLTVANVQNMLVERQEALKKLMISQ
SNNAEAIARYQVQLDLVEAALTKLGLTETVITVTPNGEVSTTLVKKEYDQ
LFLDMPNVYAAPGSIFIDGTHTDGNTITTLLGTKNLVARAAALIDIFNGT
PINLRVQDAIIRDTTRVLPVNGELTTFLPGNVFLNNQNLTKKEAKVENTI
KIVQSSLPADLLGLGAFKQLSSGQQDLYLIGSVVNQDGNITIRNNEGSIN
VSGELRGKSIDIIAAGDFNLNVSGWQHIQDPRQYVDYMYIAKEDDLYNDE
GTPTSKEYTSLDGTELDDAVNHPDDTKSRIIALGMVNITAQYLNINGLIQ
SGVSELELNITKEFKPEDTVEFMDQSKTTAQTLDDIRVQDSLSITGVNFG
KLDIPVDGYYDGAKNRIVVEKLDLSPGQITLAGHLLSTGGGELRVSDGSP
KVTIKNESGIDLELQGISMDAESVGKITLFDTPMLTRTEYFVRNGKVEMV
FSRGTKEVDEKTGAASINYTQEGATVPYELTDEIIYQPRENQFYVWTEGQ
EKTQVEIRKYEENVFDFGFFEWDAIMADESYDFRSVEYLDEKPLLESEDI
FFPTDAMMPKGVTDTTYFFEAYFQATDEEIDVTNGVTQVLDISNYKIYRY
KDSASSESQNSVSMKLPEQTLTDTTKWEYVKTLVTKYDKNATESLTLTKD
ETVLYVPGNVVLSSGENAEGAEIIYPWSDQDGKTPDKFYLYIGGSTSKLP
SAIDLSDEDLWEELERKDSDHPAKWQDTKGDQFFSNFVNYTYSVRTWTTG
GGFLTKKTYHFETTTSTGLKDYYTYALRADYPIAISVEDSADAGIFVNTN
SNLILSGNLKVPDGSLHVINESGQVVVIPEDEIGVEGDPEGSYRIPNGEI
VLEATGSVTCGEGAAIFGDSPEVVAGGSVYLLLEGDKGELNVEAGGDITV
TVFSLDNKSSRLNAGDVVSDYGDVVIRAANGILGAAPFIQGNRIELDANK
GEILALGEESDFVTINSDILGTGGVAARATTGIALTEDVGDLKLIAPTAW
AGISVVATEGSVQLDAPHGSIRDAVYENSKFAATVVTAENGEEETEAERA
ENDRRRYALSQGLMGELFPHARLFEGGVTSSFETLNVSGINVTLTAGGAG
MVGNVSNVLTINRPDQFDAVTLEQKQALANAGASDIIGVRYTMYQYVGAD
AELDLTHIELLPNVTLVQDLSSGIIYRYVGAADKRASLEEITYATDSDWA
VTDINLKDFTANPTLHQYLSSDLNTTRFSDANVWREVTIDYSTNTDRKQS
QVVSLTTNSFVEVRYSKSEYGIYQYKGASGSVNLSSESFDNADRWVKREA
DHATDDGTIALKKGEWVENRFIAERLTLQVWDDVDIQATGLFKATGEHIA
VQATGNLTIDKVLAGGDVRIIGDGNIVLDKASEVLASDANSDVYLDAGLA
LHLLQGSGVTAGAEFEDVDGKPVPHVTGAHSTIYLISGKEMFIAGSVTAS
SEMTLKMGTSTMPYASYFDTIPGKELFTVAPTPALLDALEALTLPSAIST
AFTTNKITLSGTPTLRVIEEGKRWELTDGNGTQYIVYASDPQDLGVVEEI
QVLTPHYLHGQRGFGFLLTGTLTTLDGDADVSVSGKDDLIVRGNINLAGI
GSDLSLQSDKWSYWEGFAEVGGNIEILGGIERSGILLIDREGANDDDVSV
YVHTTSSLVTPYAGTAIAIRGSKDVVLDGAVVAGGTIGEHGVTFAEDGDA
TALITAGATLWMNNAVAASGDITINAGKVFLDTVSGLTSAGIVSGGIGST
ITVNATGDIQVLGHILSGGNTEQTFDDDGNLVSEVITWINDLSTVVLNAE
GQLYLGGMTETKSGGEIETGGYVRAAKSIALIGGTPTVGSIGVLVPGAAE
VLVHNTDGVISISAEGDAEVLGLLVAGGEVVEQRDSRGDYIGRVISTFNG
NSEIFIEAESQVRLGTDIRAGKTIDVRGGKKSADATSQYAADGLVLYGTA
QLATWAEQSNINLSGSGSVRILPAGWMREVEAEGFAEFADGTLSADVTLH
IVCDGVDKNVVITKQATLDNDSLTGLRLDVQAAVDAAFGAGKMAVYYRDG
RFLFTSAYEFSIKTDSVRAAALGFTQLTAGDAVAISHIALDAAAEGSTIN
IGSATESNAAIYLGAKVRAHSGVLFNGSSDVGGALELAITSEIETLSGTI
TINPGVNGVFAGSIIARGDNGGIVVNGGDSFTLKGSLAAETNILINAGKV
ITENTSTLKALGSNATIRIAGTNGVEINSTVGETESSPDLAKLFIESLEG
DVILKKESGKIITSAELQISGQNVQLLGWVTSNRNTTATYDNEVTLRVDN
TLTLDGTFELAGSLLLAGKDVTLSNTSITISGAGQHLRIEADNDVVIGNI
APQAGDTSSTAVDVSATAEVSIIAGGDVVVGFNAAIFSTADNSKVALSGE
NVMVAGTVRGGGYRNSANANTIEWSGKNALVTIDAAKLLYVGGTGLDEDG
AVVAQWGGNLESSGRMLISAGKNSSNVGVGIGTSSKVSVDATAGGKFTAV
TLGYLQLVSSGDVQIASLMESVDNGSTVSIKSDGLVLVDGLVRAEQSLTV
AGGSGTGGVGILVQPTVFDGATRLSGGTLDTADGGSINMMASGSILLQGT
IGQLVGATPAPTVASITAESTTGALSVGGSGRVDASATIALKGKSITVLA
GGRVVGWGNTSEVLLQSQTTNFIAAGGGVTAHALTHLVGSTVRIDGAVIA
SDESGKVLLNAATEATITGVVQSAGDIAINSGVNLRDWSLATLLAPITDA
NLAEGDIKVLASGSLAATGAITLQAGRDLVLLADATVAGTTTVNDPYVYT
APYEIKVVTGNIDVAVNTIQVPEEVWTPTTITVQTGTDQVKVGVEYHTME
VTLSQKGYYNPRAAEADRFREYFVEGVDYKNNAIDWSGLKTKLGITATVE
EPSADYTASTYKRFEQLDSNQRQIVLASLGYMPLFAFSYTNAFVHKTENG
NPSEAAWTPTWSGQPSVIYRVDVDGWRDRYIEMPKGAQDDVLRVVSQGVT
NYLTGDTTLDGNENGSGWASGSGTGELVAQYKEEANVAYDQKYSDFSLTD
NTPETGNRYTIVDEDTIPPDVDTDTYEYVDTDEKNDRWTVSYADGGLFTI
QEFGRGDVTLEQMPGWKVAQSGEIDAIDPKTDGPDGTDRNIYAPGTFVTA
LTSNTETLDLTNTTTIADQTIGTLTYTKMVDKWTSDKEEWLKTFDPEKYI
ADLNEVAAQLGFSITLTMANLNASLVKGWLDSHAVYFYEDGNYDGWQQGY
FPGSYTNTQNYSIDDDETGGDLDNDDFMSVKVPAGLRVTAYENNSYTGEK
VVITTNQPTLGALTLGDDNTWDNEITSIIVEWQDEDGNWSEDPVAYWATG
NANYVEFFLEDYYNSNDTNNSQTFWPGRYLNDSDSAWATTDLNEDDFTSV
TVPANMKVTAYWDDDFKGESIVYTSSSSNIGDHWNDEISSVKVEANVPVA
TTVTLDIKEDQYDYDYHWTSEWHEIRDERIQQRYNWVSQDHDIWGYRPVY
QTQDTWLKSITYHDITLWETQEVTGTQTVLASALGLTPSSVPYASFDDIS
ISASTITISVGRDSTLSGNISSTGTAQTDTLDVSAGRNLTVKGIVPTGSE
AGTLASVATLSSQTTVALHADTTLTLASSSLLQANQAGGSITLTSGKDSL
LSGQLSATQGSISSEAGGNIALQGKTTALNTITVSAGDVDQNPSQSGGIT
GTIRASLTVTAATGDISLSAGHYGGNITLTNSTVSAPDTLSFTADAGSVT
ATGNVTSDTLYGRAERGFDVSSSSTTTVNNVTTTKPVANATVNRLEVDVK
GVGNIIVNNSKAIELTDVQANDGSITILAYGSITVGDVQTLAISDRNDIT
LSALALGNAVSNLTVHTLKAGGSGDVILALNNGDFIQAGGVVVADELSLD
VRGAVSITTDVKSISLTTKEAGNVTITQSTAKALKLDTVRILDGSLMVSA
GGDVTLNDVRLLSNQDANDVTVMAADSIVLGYVSAGIYAATAGEVPLPDT
IKYPNAQSGISSHGDITLTATNGAIRSEVGAGALQLVADEVTLDAKTGIV
LDVAVNKLKDITTNAGDITINENDGFGERTIGLQVLKVAANTTDGDVRIT
AENALYVGTTSATTAAITGSTIRLTSTNDVLEVVAPTSGSTLNYTKGVAF
IAARDLKLYTFFNAPDFIEYRAGSYFNFTLPNAITAKSIILETGGVIDYE
GTLTAYDHLELISAADVFVSGNIYGTPDELIAVAKGRESYARTIQKLNAS
GNYVTVSSSDTGYVNFQVGSMDAAAYEIRALHDIFVSTTNNLTLNGFVGG
LSGFEKAVNVTIDTGSATLTVPSGIVSASGELTLRAGNINSSNGSIFIAN
HIDAQASGAISLNTLTATLDAASSGSGAIRINEADGLTVGEVIANSGDIE
IAAGDTFYVGLVRTIVDSDNDITLRSAGTLYVDNVEAGFAAGAQKTSSDV
TLDGKNGILERSSEEAGIDAFGFTVTLKGGGSYNVIKVPSDLPGSGIEVS
YISGTGGVTTGATTMSGGGIPSSVSGDYVLIAPTHSGSTNISVSGSLSVV
ELPTSAGNNVTLSAGNDLAVVVPLNVGIGTVTLSAGGGLSLGDKVTADTL
NVTTGGNLNLTSDVDHLIATINNGGDLVIQQTGDIVINSLSMSGGDVTIV
ATTGSVTINSFSGTGGKVTIIADKGIVLNNTAHLDSLTLNAKNGGVSGNI
NTSTLNLNATGTINLVNQGAVVVEQLATTTGAISLQSSGTMTVNSTVVAG
GANTIDLKTTAGDLNLNRALVSATGAITLQAAGDLAMSALADVTSTSGTV
TLNAGGVLTMTGDTWVKAGSGTIALQGGSTVTVGKLVTSSLTNLTITSTG
GAVHDGGDSPTDIYAPDATLVISAYNGIGGGVYGALETEVAAIEFTNSGS
GTTGGIFIEEVDDLAINTIVQQASGDISITTLNGAITTTAPTSGSGITAT
TGNITLYAGGTNGVIHHYADITATTAVGKTVALTAESGDIMLGAGIRVTG
AGDITLKALHGAIVNDHTTVGWRTVSSAFDAQIDWAMRLGKFVVTQATGE
IRTANIESYNVANHIANNQELRAENGNYLQTTGGRLTLKAQDEIGERYGS
FLFSPLALVVDAVELSMSSSERANVSVIATGSVKVVSDSGAGSLGGSTGV
SNLTGGQNISDAVDASGEDITIVANDVTFTDTLRSAGATITIKTLDPTRA
IQLGTLSGDVENTLYLSTEEIEKLQAGFDTIVFGSTEGSSVINIGDPDDD
DDIVEFHDDLLLMNPAQGGEIYFYGDLKAKSLTIKGSGHTTHIIDSALTS
DDFIDFNDSVIVEGTGSVTADTYIQIGATSSHSLNGDSDDTNNPDKLTLN
AGSYITVNGPVGNTDSLDGLYIIGGAGLDNIIGTDDDLAGATDVTFWGQV
IMDGDLIIKATGKVTFKDSVILNSGNLRITGATQIIFDDSVTVNGTGSSI
LLEGDEIDLPSGTSSVKGNGTLTIRPSHKTVNVEIADPAYPTDCLNLTLQ
EMKAIANTFSEVIIGWKDSGTSHTVNDVAGTVRIGADNGELGNPTFWNKT
SIYGSAITVEDYGVPTYTLLAYKDLTFDAISNITLKNQVKIYDGTTLHDL
YLYSENGKISEVDSGSDLKEPVYAKNLIATAQTGIDMRWIDVDTITATNE
GSGAIQLNVIAAGGDVTVLKMAQLSSNTSDTTSIALTTENGSITVSNTNI
TASNGVTPLNALGVWTAGNGSITIDANDTGTDTTLTVDKFVSGTTGLITL
EADGLVTLSALVSNSGAGGITIKSNNNNITQNANVTTVGGLITYNAGVTD
GSGSISMTSGTLTDAGAAGGVTYRAANDIALSIINAGGTVSLTADAGAIT
DNLDGETVNDLNIKGDTTALSLSATKGIGTSSEDIDTKVASVTATNTGVV
DSGIYIQERNALTVASGNISASGTGGNIVLDLLDGALTVNGTIGSTGTVG
NILLQTAESSGDVTDSSVTITKNITSSNGNISVLSSDGIVIDDSDIGTPR
LQVSAAGKTIDVQAADVVTMEAGAQMLTNAGNLRVKGGGTVTVGILDARI
VSDRSGSGSLTNQASWGSVSVVSAGGSILDNASDIAVNVFAKELRLTANG
AIGALGVGSSNALESEVATVTASAGGVINLLEATSLTLGSVTAVPVNRVT
TSGSAGSNDETDGQAQAGVVTTAGSAGTIVVVSGGAMTVSNVVTSDGSGN
VRLEATGVTGTLNVNAAVDGGSGNITIVSTGNQSYDANGDVSTTGGTIDV
QATGVGSTIGMNAGTEFKTNGGNIRVMSGTVDDSGVTLNAGGKITVGLLD
ARTTGDRGASVTNNQTSWGSVSVVSTGNSVEDNSADTAVNVYAKELRLTA
SVAIGALGATTSNALETEAATVTASAGTGGINLLESSALTIGSVTAVAAN
RVATTGVAGNGDQTDVAAQAGVVTTAASNGAIVVVAGGAMTVSNVVTANG
TGNVRLETTHATTGSMAINAALSSGTGHITVVAKTDITQSAAGDITTIGV
GTIDVEAGGFIQMATGAAGADTAVSGAKDIRYEAKGGNLTLGSFSTGTDA
ATGGTVVLIASGSIVDGDIGVDVTANKLYMQAGSTGAIAGGGDHLEIAVN
TLSLSAGSGGAFVKESNGLTVGAVALSTLQRVANTSVASTQSGSWEDLNT
TDGGALVLTVQAGGLTVNGGSTTATTGITASGSGNVLVDVTGTLNVNAKL
DGGSGNISIHSTGTQTYGADGDVATTNGTIDVQATAANSTIGMNGGTVFQ
TNGGNIRVMADSTLTVGVLDARVTADRPAAIDNQASWGSVSIISTSGSIY
DNDGDSSVNVYAKELKLTAAAADQAVGKGDQHFETEVAKVSANVAAGGLF
LTESTNIQIGTLSAINVQQVGVDGTTLTPTADSAQSTLTSAGDLVLVTTA
GSIETLAVGGAVSATGNMLLQAGGSGDITLRATVTNNDSGGNTTIDAADE
LFQNANIVANTSGTTIDLLAGRAITMGDSASTSTTNGDILLYAGTGDITI
ETLSSGTADIGITAKLGSIIDRDGTSSEDSENDITASSLILQAGNAIGGG
ANHIETTVTTLAANAGDGGLFITESNGVTVGSVTVTVNRVDDKADQSTPT
TDPSTQVIKEDLIATGTVTNTGNIVLVSTTGALTLGAGTSGSNALTAGSG
NILLDAQDGDLNINAKVESVGVLVDNVLVGSNISLHASGTVTQGASGAVV
TIGTGTVDVQAATITMTHGATTTTGSGNIRYVATSSLQLGALSTSGDVSL
SASKITDAFSSGSDTTNVTADELRLVATSATNSYGIGEYNDHLEISVNTL
AADSKGTGSYGGIFLTETDAIQIDLLNAINVNQVLVTGVLGAQTADTAQS
DLVSSSNLVLVAGGTITVNEGDNDTKAVEAVGNILLKTTGTASDIVLNAS
VISLNAPSGGNISLDAGQDIKQNAGGNITTQASPKTIDLVAGRHITMVGD
TSTTSNNGNILLYATSGNIELETLTAGTGSVSVTAAATPTEATPNVGKII
DIDGTSSEDSENDITASGVLLNAGNAIGDGSNHLEITVTTLTANTGADGL
FISAQEKVADGDIKVDTLTVNVNRVSTSASHATTLYAAQADLTSTGAGNI
VLRSTDGSIILNDGDINGVEADGTNGFAVKNTGGGNILLQTTTAADDITV
NADVVSSTGSISLLSGNDVTFIADADIRTEGTNSVGTIDVVAANGGDVVM
AANSTFASTNGAIRVVAADAIQLGIITTAATGTTGDGSGMVSLTATTGSI
VDAQNLGNLSNDTTVNVTASGLRLSAGSGVGETINHLETNVATLTARAAG
GGIFLYQYGSSDVTVGDVAVVVNRVKNDGDVTDSIQSDDAQSDVVTTAGD
GDIVLRTKNSKLTLNDGTAAVDLNISGVAVQAHGSGNILLETEQASTNVE
ATADVVSTSGNITVKAGGSIAFTDADIRTGTAGTIDVEAGVANTHNITMS
ASSLFTTNSGSGDIRLKAGNNIVVGDIATAADVSLIAAAGSITDADVVTT
TNDVNLNITSAGLRLWAGNGIGETVDHLETSVDTVSARATSGGIYLLETN
GITVGDVAVTVNRVKNDGDVTDSNQSDDLQSDVVTTAGGGSIVVVASAGN
IVLNDGTATVGLLNISGVAVQADTTGNIRLEAAAGSITVNANADVVSGTG
SISVISNVNVDFNSDGADIRTSTGGTIDVEATTGSITQSVTSLFTAGTTV
NDTGDIRLLAAQHVVVGDIATAGDVSITATAGSITDADVVTTTNDDNLNI
TSSGLRLWAGVGIGDAIDHLETSVDTVSARATSGGIYLKETSELNVGDVT
VTVNRVGIDATTTTANSSDPTQSDVAITSGNGNVVITTGGNLTLSEGSGD
TNDNPNPPLNYSGKALNAIGGGNVRLNVTGILTLESALDAGSGNVTLLAS
GLIKQEAAGDIFTTAGTIDVESTADAITMVDGAIAQTNGGNIRYQASGNV
TVGLLDARLAVDRGGSLTKQSDATTPWGSVSIISGASILDNSENTVDVYA
KELRLTATGAIGALGDGTSNALDTEVATVTASAGVGGINLLESTALTIGT
VTAVPVNRVATTGVAGNGNQTDALIQAGIVTTTGSDGSIVVVSGGAMTMS
NVVTSDGSGNVRLDVTGTLTHESAVDAGTGNVTLYATGLIEQKAAGDIFT
TAGTIDVESTAGAITMLDGAVAQTNGGNIRYKASGTVMAGVLDARTSADR
GGATIDDDKRDDQIKTTGGWGSVSITSTVGSILDNSEATADVYANELKLT
ATPAGAGAVGLYNQHLETEVAKVSANVGSAGMFITEATNLIVGQTALLSV
NRVEPNATTSITNSSDATQNNFVSKGALVLVTTAGSIETLAIGGAITATG
NMLVQAGGNTSDIKLGAVVTNTTLGGHISLNAGQDIRQNANIVANTTTKS
IDLVAGHDIKMADGTSTTSANGNILLYAGAGNITIETITAGNITNGYGNV
SVTAAATSGSSVGKILDEDAAGDNGDNPDITANNLILKAGYGIGLGSNHL
EATVTKLTANAGDGGFFVTAKERVTTGTSTDRGVTVESMTVNVNRVDAEA
NVPNTATGTATVTQEDLSVTSGGHLVLDVTSGALVLNAGSDAAYAVTAGS
GNTRISTQSGALTLNAKLDGGSGNISIISSGTFTQAETTGDIVTTGGTID
VSANAIDMKAGADTSAFGNIRYASASTITVGTMSSTGANVSLVAAGNITD
NESGTDIDISANNLRVEITGGTGGFGSGTNHLETTVTRLSGSVGSNGFFM
TETNDIELDSVAQISVNRVALTGVAGTGDVVDAAKSDLVSGGALVLQTFN
GSITTAVDNGDIQAAGYILLNASESATATVAGITLGGTVTTTSASNGSIS
LTAKDFVYQLATGAITAGGTGTIDVEVSTGTTSGVITMDDGAATASTSGN
IRYVATTTLSLGTIATLGNVSLQATSITDSADDDAVQLSSLPDIDVTASS
LRVQTTVNGFGEATKHIETTIGTLAATLGTIGNLFVTETNDITIDTVDTI
EVNRVTDAGSITNSIQTDNALSDIATGSGHVVIDATDITVKGGGDTTGIT
TTGAGNILLNARSGNITAQAIINGGTGNISLNAVGTNLNGNVVLWNTTSA
TNGTAFEGVLQTNNATIDVKAGDAIDMKNGSTILSKGGDIRFEAVNNINV
SYVDATTTTLAGDVALLSTSGSILDVDNNTTLDVYAAGLLMQAATGIGTS
TNHLDTTVTTLTASAGSGGMFISETDGVDVDTVTVVVNRVNDQAGTAVES
KTLSDLLTISNGNMVLVAGGTITLKEGDADNTGVSAAGNMLLKAKVDDID
IKSKVTSTDGNISLDAARDILQNANVEAQEITKSIDFVAGRDITMDNGTS
TTSANGNILLYAGTGNITIETITAGNSTNGYGNVSITAAAIPSGGNSDVG
KILDRDGTAAEDSEYDITANNLILKAGYAVGDGNNHIEETVTTLTANAGI
GGLYVTAKELVSGGNVTVDKLTVDVNRVGTDASVPTTATGTATVTQEDLI
ATGAGHIVLDVTSGDVVLNAGTSGTNAVTAVSGNIRLIAAAGALTLNAKL
DAGSGNVTLLASGLIEQKAAGDIFTTAGTIDVESTAGAITMNADAVTQTN
GGNIRYKANGTITVGLLDARVSGDRGGSLTTQSDATTPWGSVSIISGSSI
LDNSEATVDVYAKELKLTAIPAGTGAVGESTNHLETEVAKVSANVGSGGV
FITESTDIQIGRTAAVTVKRVDTDGTTPQALDQTDGVQDNLQSAGALVLV
TTAGNLETLATGGAVTATGNIFLQAKAKQTTTYDITIGAAVTSSNGSISL
DASNDIKQNSTITVSGGSGTVDLLAGHDIVMQQTTSSISTSASNGNILLT
ATSGSITIETINAGSGNVALYAANATNGFIYDGDDAGDSEVDITANGLIL
KAGNAIGSGTNHLETTVTTLTANAGVGGLYITAQEKVADSGITVDILTVN
VNRVDDKDATASTNNSAQVDLTSTNAGNIVLRSKDGSIILKDGDSNGFAV
KNTGSGNVLLQTTNSGSITAYADVVSTSGNISVLAAQSVTFTANSDIRTS
STSTTTGTIDVVAGSGGSITMSDSSLFTTSGTNGDIRLLASQNVIVGDIE
TTIADVSITATAGSITDSDALVGSANDNDLDITASGLRLNAGIGIGEVVD
HLETTVGTVSARATSGGIYLLESNGVIVGDVAVTTNRVGVTGATTTDNSS
DATQSDLRTTANNGNIVLVAGGTLILDDGTAADDDTAISANGSGNILLKT
TSGLLDINAAVKSGKGNITIWNTTGAIEQDAVTISTDGGTIDIEAMDATN
GSITMVAGSTIVSDGALATDGNIRIKSGADMSITGINAGSAHVNLLAGSF
IKDIGETTTDVVANHLRIEAGSWVGEASGTNFGLLDISVTRLSVRAGNSM
YLNELSDITIDTTDAITVKRVLADGSVLNSVETDAKQSDLVTTANDGNIV
LVAGGSITFNDGTANTNGAGVEGIAVSANGSGNILLKTTSGTLAINSAVK
SGEGNISIINTTGAITQGAVTISTDGGTIDIEATAGAITLVSGSRIISDG
VSTTDGNIRIKSGADMSITGINAGVANVSLFAGSFIKDIGEAIVDVLANH
LCIEAGTWVGEADGTNLGLLDLSVAVVSAKAATALFLKEANGVTVGTTSQ
IKVKRVGSNGLTTEDDTNGAAQSDLQTTNNGNIVLVATAGDITLQAGATQ
DDNFAVSANGIGNILVQTEAGSVIAQDHADIKSGSGSISVIGKTNVSFNS
DGADIRTSGGGTIDVLAETGKIEQSATSLFTTGTGNIRLLADDSIVVGDI
TTAGSVSLVATTGSITDADSADETIVDDDIQAVGLRLWAKSGIGTNSNHL
DTSVDNLSAYVDAGSLYVLESNGVTVQSVGVSVNRVVAAGTASVVAATTD
SAQSDLRTNSNSGNIVLRATAGDIELSDGIANSGTAGIAGTTVQANGNGN
ILIDAISGSLAVKSDLSSTTGHITLHANDSISLTSDVDVTTATSGTISLQ
AKHGEISMVSDATVMASNSSVRLAAHQDILLGDVAAQNVSLISAMGSIHS
AASNIQNIAATNLRIEAQQAIGKSDLHIKTAVDTLTAKANGTVTSGTAET
GIYLTEANSVTVDTVSVSVTEFSAIATTSIVKDSSQSDLVTGNNGNIVLV
ADGKITLHDGTDIASPFEDNTDGKAVKADGSGSILIDANSSNLLIYSDIE
SGTGHITVKAAIGVEIGSSSATDVDISTATMGTISVDAEGGELKMAGDAE
IKATSSSVRLNAATDVTVGNVVATNVSVVADNGSIINASGSSKNVTATNL
RLEAKQAIGAPTNHLTTDVTTLTLFAAGTVASGTPLSGSYISEVRDVKID
TVTVTVTEFTHVALTNDVIDAAQSDMVAGNNGNLVLIAGGTITVNDGSDN
DSLGVEAGGNIRLEATESNEAIESNIKLSSGIVSSGGNITLLAKDNIAMD
AAGDITTSSVGKTIDLQTDDAISMVNGAIIESNRGNVRLTALNDDITVGE
IKAGTANVAVDAQVGNIFAVDSSNKNILANDLILLAGNAIGENDNYLDVS
VTNIATQSGSGATYVENDGVNVNLGGLSVLVQRVMATGSTEDSSTSTQND
FKAGDDIYLVATSGNIVITANNENALTQAKNIVLIAEQGDITINCGGADQ
GFFASESIKLIAEAGKITINSTDANSAGLVATKNILIDAKETVEDTDATL
VVNAKITSKEGYISLLADDSITMTAFGDVTTEKSGNTIDIEANDSIAMSD
GALVATSNGTVRYQAFVGNITIGEINAGSGNVALLAGGSILDISNDTSSI
DITANELLLRAGAAIGTDGITVNHLETSVDSLSVKSTTGSAYVIENNSVE
VGVVTVTVSRVQEDDTVQALSADTLSGGESAGNLVIVTTAGTIETLAGGG
NITAAGNMLLDAKTNLMLGAAVSSTGGNVSMVVSGNFAQSAVGDVSAAGA
GTIDVRVSGTMTMTDGAEIKSDNGNIRLSVTGSLLLGALSTSGDVSISAS
TITDAGADASDTVNISADEVYLATTSTAVGAGIGSGSNHLELNASKLAAD
VNGTGTGGLYITENNGLQVGTLNAINVKNVASDGTSTASTSDAAQSNMSS
AGNLMIVTTAGNIETLATGGAINATGNILLDANGNGSDVVIGAAVSSTGG
NISMVSGGNFEQSAAGDISAAGAGTIDVRVSGMMTMNDGAEITSGSGNIC
LAVTNGLQLGALSTSGDVSISASTITDAGTGVSDTVNIGADEVYLSSTSS
ANGAGIGSGSNHLELNATKLTASVSGQGGMYITESNGLQVGTLSAINVKN
VAADGSSTASTTDAAKSSISSAGNLVIVTTAGNIETLASGGTITAAGNIL
LDANGNGSDVVIGAAVSSTGGNVSLVSGGNFEQSAVGDISAAGAGTIDVR
ISGAMMMTDGAEITSGSGNIRLAVANALQLGAFITSGDVSISASTITDAG
TDASDTVNISADEVYLATTSTAVGAGIGSGSNHLELNASKLAADVNGTGI
GGLFITESNGLQVGQLTAINVAQVANDGLSTVSTADAAQSNISNAGNLVI
VTNAGNIETLAVGGTLIAAGNMLLDAKTNLMLGAAVSSTGGNVSMVSGGN
FEQSAAGDVSAAGAGTIDVRVAGSMTMNDGVEITSGSGNIRLAVTSSLQL
GVLSTSGDVSISASTITDAGAGASDTVNISADEVYLATTSTAVGAGVGSG
SNHLELNANKLAASVSGQGGLFITESNGLQVGALTAINVNKVANDGSSTA
STADTAQSNMSSAGNLVIVTNAGNIETLAVGGTLTATGNMLLDAKTNLTL
GAAVSSTGGNVSMVSGGNFEQSAAGDVSAAGAGTVDVRVSGMMTMADGAE
ITSGSGNIRLAVTSSLQLGALSTSADVSISASTITDAGSSTSDTVNIIAD
EVYLSSTSSANGAGVGTGSNHLELNATKLAASVSGQGGMYIIESNGLQVG
TLTAINVNKVANDGSSTASTSDTAQSNISSDGNLVIVTSAGTIETLAVGG
TLTAVGNILLDANGNLTLGAAVSFTSGNVSLVSGGNFEQSAAGDVSAAGA
GTIDVRVSGMMTMTDGAEITSGSGNIRLAVTSSLQLGALSTSADVSISAS
TITDAGSSTSDTVNIIADEVYLSSTSSANGAGVGTGSNHLELNATKLAAS
VSGQGGLYITESDGLQVGALTAINVKKVASDGSSTASTSDTAQSNISSAG
NLVIVITVGNIETLAVGGTLTAAGNMLLDAKANLMLGAAVSSTAGNVSMV
VSGSMTQSAVGDISAAGAGTIDVRVSGTMTMNDGAEITSGSGNIRLTVTS
SLQLGALSTGGDVSISASTITDAGSGASDTVNISADEVYLSSTRSSNGAG
IGTGSNNLELNANKLAADVNGTGTGGLFITESDGLQVGTLNAINVKNVAN
DGSSTVSTADAAQSSVSSAGNLVIVTNAGSIETLATGGAINAAGNILLDA
NGSGSDVVIGADIKTPTGHITIKADDSIELASDVDITTAAAGTISVDAEG
GTLRMAGNSNISAVGSSMRLAATGTVTVGNTTAEFVSIVSRRGAIINAAG
STRNVTASDLRLQSYGSIGSANRHFTTQVVNLSIDPEEDGAGIYLSELDD
VVVTTVRVDVTEMTSFADTLGISDQSMADLVTSSNGTIVLVTIDGSITLT
DGDHNGVSISADGTGNVHLEANGADNNVIIEAAIQTDTGSITIVAAGDVE
QQANIVTNGNLVSVQAEQGSITMDQNVQTITNNGTIEYRSYEDVLLSLLH
AESGSVAVYAETGSIENNTTSNTTPNVTSETALFKAGADVGLREIQPVVI
SVERVAAEAVTGEMSLVNLGTVVIDVLEDADGNTVSGLSAGDGISLESLQ
GSIVVAAPVDTKGTADALLTFTNGQLIGKSAYFDDAGTFLKMQYKQFQFL
WNGEGATIRQELLNMVVGRQVDSDIARYRESASERQTVSPARSTMPMRSY
DPMESLRNVDVDVLEEQPGYVEVHNGYAFFRWAEVPGAQSYLLVLERDKL
EYASRWLEETAWAPFEELPEGIFEWSLYSWTTDGLQLVFGPMQFNV
>Cag_0491 Peptidase S26A, signal peptidase I
MKNNNKSQGQGEKKQSREWFDALIIAALIATLLRVFVIESYRIPTGSMER
TLLAGDFLFVTKFEYGAKVPFTNFRLPGITEVKRGDVIVFKFPKDRSLNY
IKRCIAMAGDTVEIRNREVLVNGVVQPLPPEAQFLASMEPSGVEDVMIFP
PFSGFNKDNYGPIRVPRKGDVIPLNMRSFPLYNALVSDEGHEITMQAGNV
FVDGIMVDSYTVEQNYYFAMGDNRDNSLDSRFWGFLPESDLVGKALMVYW
SWNPDVSLLTNPVEKISSIRLNRSGLMVH
>Cag_0122 LipD protein, putative
MKLSLADALSRAREQNYTVKAARSRIAQAEGQITQSRQSLLPKVTLSETF
MVTNDPGAALVYKLQHNTIEQSDFMPSKLNNADVIDDFHTSVQVMQPIYN
ADAKKGRSMALVAKKGQEFMAERTAETIALHVSKAYYGLLLARKNSEAID
GSLAIMQGYNAETARGFNVGMLSRSDKLSTEVRLAELQEQKMMMEDEIKN
ATDALRVLLNLDPTVTIVPTTDLNVDGSMPSVKDGGALEQRSDLQAMEVF
RQVASLQAEMADASRLPRVNAFAQGNLHGATPLEGGSSWALGVNVQWNIL
DAKVSEGQMQEAKAKKLEAMYSYEAAKSSGTAEINRALRSLKTAKARLAI
ASKSLEGAKVSFDHIGKQYKTGMAMTMELLMREQAFTYAKMRLNQAAFDY
NVAKSELEYYKGN
>Cag_0964 Sec-independent periplasmic protein translocase
MNFIEHLDEIRSRIIQSLIALVVVMALCATYVDFLVNEVLIGPLKRSSPT
LVLQNLVPYGQVSVYFQVVFFSGFILAFPFLVWQIWQFVAPGLHENERKA
GRFSILFVSLCFFAGIAFGYFVFLPVSLQFFSGFGSTLIQNNISIQDYIS
FFIGALLTAGLVFELPFISYILSKIGLLTPAFMRFYRKHAIVVLLMVAAL
VTPSTDLVTQLIIGVPMILLYEASILISAHVNRKNKALQAKA
>Cag_1563 SecA DEAD domain protein/helicase, putative
MIPSQEYRKSVVHQPENVPSGFRGATHWLAGKVHRRQSKQQALLEQAHTI
HTAAEAHRTLSLVDLQAQLLSFRDHFRRRARGYEQHISAAMALIVEASHR
QLGLRPFPVQIMGALALLEGSLIEMQTGEGKTLVAALAAVFLGWSGRSCH
VITVNDYLASRDYARLEPLYTFCGVTASCVIGELKRPERQRSYQAAVVYV
TSKELVADFLKDRLLLHGVSDPSRHFLHSSNTLREGDEVPVLNGLWAAIV
DEADSVLVDDAATPLIISRPVKNEPLMEACREAVRLAAKLQPTLHYTVEE
RYKQIALTSEGNATIEQMLPTLPPFWHSATRRNELLLLVLNAREFFRKGK
DYVVSDGKVVIIDEFTGRLMPDRKWQKGTQQIVELLEGVEPTDPVEVAAR
ISFQRFFRFYKLLCGMSGTVKGVTAELWHIYSLPYVAIPTNKPSRRTTQA
PEYFLEKGAKYAALIATLEALHRQGVPILVGTRSVRESEFLADLLRQKML
NFQLLNAIYHKEEAAIIARAGERGNITIATNMAGRGTDILLEQGVAALGG
LHVLLAEPNEAERIDRQFYGRCARQGDPGTSYSYIALDDRLLQRFFPERF
LNSVMAEVLLRRLPGSHALMQLLVYLAQQMAQRMAYQQRLSLLRRDEQLD
QLMSFAGSGPKF
>Cag_0550 conserved hypothetical protein
MARHKSQRKGIRLDMTPMVDVAFLLLTFFMLAARFRPPETLSVTPPASHS
TQSLPDADLLTITVSRNHALYLSLSSKRDREALFNRTIRPRLQARSVSHS
AIADSLRHFRISEQMPLQANELGQLIAHAKAANPELQAVIRADGEAALAP
VNEIMQAFRRAGITTFHLVTMPSKEAR
>Cag_0108 YajC
MQSLILSLLLFAPPAAGQGNPNPFIQLVPLVLIFVVFYFFMIRPQQKKQK
ERETTLDSLKRGDHVVTIGGVHGTVAGIDTEKKTVLVQVSDNTKIKFDRT
AIATIDKQETGDKLPGKE
>Cag_1512 Filamentous haemagglutinin-like
MKTHPLFFPLHGRDVFVVALCVTQLLLVVPQAQALPTGGAVVAGSANVTL
PSATTMQIEQASQKAIINWQSFGAERGERVQIVQPESSSVLLNRVIGNNP
TSFFGQLQANGQVFLVNPNGIYFAPTSQLNTGGLVASTLSLNDRDFLAGN
YAFVAQGAMGALLNEGTLQGGFVALLGSNVENRGAIVTTRGTAALAAGEA
MTLNLDASGLVALTVDQAAYNAHIRNSGILEAEGGTVVLNAGAAEDVLAG
VVNNSGRVVATSVSERNGAIVIEGGSLVQTGEVVAPTINVAVNRMVDAGS
WRAEQGNITIHAATTIEQTAASHISASGKQGGSVRLEAGKQLYLSGAIES
NGTDGQSGSGGTIAVTSPTTTIAGATLSANGGTDGGMVLIGGGWQGSEPN
LPNAATTTVTASSSISANASTVGNGGTVVVWSEQATTFAGTIAANGGSES
GNGGAVEVSGHEQLAMSGTVSTSAHHGEAGFLLLDPRNITIEQPLLLSQF
QFQLISLLDPNATAGNQHGSGAILELLNGNLLVTSPLDDVGGSDAGALRL
YRPDGTLLSTLTGSATGDLSGGTITPLQGNSNAVFLASNWSNGTAAKAGA
VTWIDGTNGVSGTISEGNSFVGTHANDGMDAEVIALSNGNYVAHLPSWQH
DEVLNAGAVAFGNGTSGSAGTISEANSLVGTKANDSDSAKVVALTNGNYV
VASPLWDNGSTTNVGAVTWGNGQTGKVGAISGSNSLIGTKSGDNVGLQVT
SLANGNYVIGSPNWDNGSTANVGAVTWADGNLSIHGALSATNSLVGAKSG
DYVGSSVTALTNSNYVVVSQSWSSDTATDVGAVTLGHGDAGTTGVVTADN
SLVGSSTGDGEKLSATALANGNFVVVAPKWDGDATNMDVGAVVLGNGVTG
SVGQISATNALVGTTANDLESATVTPLTNGNYVVAATKWDNGVVADAGAV
IVGSGTTSITGTISAANSLVGSVSNDLLSATITPLTNGNYVVAASKWDNG
AVLDAGAVAWGNGQAGTVGSISESNSLVGNKKDDFSGLTITALHNGNYVV
SASLWDNGSITNVGAVTWGNGQTGTVGTINSTNSLIGAKSGDKVGAVTVA
LSDGNYATASGECDNGSLANAGAVTFGNGGGGTVGVVSSANSVMGSEKDG
KIGSGGLTPLRVGSVSGGVVVSSPLAQASNGNVTLFAPSTANEAGMLSAD
YTYAADGSSNVTVTPTQLATLLNNGTSVRLQASNTITLNTLLTANASSST
TLELHAGKSILLNNSIVTGNGNLTLIANDSAEHGVDNTLRESGAAVISMA
SGTAINAGTGQVVVELRDGGERANNASGDITLGSVTAGTISVANNGSSNS
SGVVLAGAALTANESNGSTIVLSGQHFTNSANATLNTEPEARWLIYSSSP
EATQKGGLTSSFRSYNVLPATYAAAAVTEQGHGFLYASAPSQLGVNITLN
NGSASSVYGNEPNATLGYSLHGFADNEESANTIGLEGSMQVSGMPNTTSS
VGTYNVAYAGGLTSSKGFTFTAGTPLALTVEPQPITVNPDDQEKTYDDTD
PDLTWQVEAQGVGRGLLVGDVFSGELGREAGEDVGSYAITLNTLHNDNYA
ISFIPGTFTITQRPLTLSATSTQKVYGEADPTLAVTITSGSLASTLRQDA
LSDVVGTLNREVGNNVGSYDVVLGSGSRSSNYNITFAADNNAFTIAQRPL
TVTASPLTKTYGDADAALAWQAEAASSGRGLLANDTLHGELAREAGEDVG
NYAILQHTLGNNNYAISYQGSNLSITQRSLTLSATPTQKVYGEADPTLAV
TITSGSLASSSVQDALGDVTGLLSRQVGNNVGSYDLQLGSGSRASNYNIT
FTANNNAFTIMPRPVVVAANNFSKVYGDADPALTWQAESSDPALAAENLA
LLRSLELFNNTNNLSGITGAPSSNESLLSSTENNAQSSSDTASTSSTNNE
DEEMVGIRSPMGNIYISFPLAEYDFKVEWCQGSHILHGTKPAFIASERL
>Cag_1054 probable activation/secretion signal peptide protein
MVPKIITSLVTGSIMLSASLQAAPYVPDAGSLQQQQRPAAVSKQKKQMVQ
DNKGKSEPSKPFVIKPSANAKVPVKRFTFSGYEGTVSRSELQDMVKPYVG
KNLSMEQLHAVSANITSELRAKGWLASATLPPQDVTAGTVHITINSGKTA
MTSITGDESVRICERPLRQIAEKTCPSGSPLNTDDQERAVLLMNDIPGIA
ATTSLSKGMLAGTTDVNYLIREGALLSGVLWGDNYGNRYTGTWTQNAVLN
INDPIHYGEQFSLNVGHSAGMWRGGVNYRVPMPFLFAGLTGHTGVSGMQY
ELLEDFEVLDYEGSSINVDAGLSYALLRSRKANLTSDVSYTYKGLKDSMG
NTDLRDGTIQSVTFGLSGNYRDDLFFGALTTADLSITNGSLEEKIRDISL
SNSEGGYTRLNMGLARYQRFSEPFVLDLAFSAQRALNNLDSSEKFFLGGP
QRVRAYPLGEAAGDHGALFKADFRHRISVPEEWGDMFVNAFYDAGHVTLN
KDRYASDSATITATGRNDYWLQGAGLGLRYDISENFTLQGCWAHTIGKNS
GRSVDGNNSDGKSDNNRFWVQGLYYF
>Cag_1910 TolB protein, putative
MLPMPFFRKHVTCALLLCTPMLALPHPIIAADTEYIAIRKAGSTSIALVL
DTFEVTTGTSPALARQATTLVRDGLDFTGLFTLLQPPLNVKTSSLFSSST
INFKALDSIGGAFYAVGTLSSSGGEITLDGQVFEVATGKVLFGKRYRGTE
SQLRALSHAFSGDVVEFLTGKKSVFGSQIVFISNKSGSKEIYSCDFDGAN
VHQLTNFRSIALTPALSPDGAYLAFTDFTGGKPALAIRELATGKTTRVAK
KGNSIDPAWRNSRELATTFSFEGDQELYLLDSAGAVKQRLTSSSGIDLSP
TFSPDGRKMAFVSARSGNPQIFVYDFSSGKSQRLTFSGRYNTQPAWSPIG
DKIAFSTWESGGEINIFVINTDGSGLTQLTTQSGENESPSWSPDGRMIVF
ASNRQGVKKLYVMMADGKNQRPLLAIGGEQTQPSWSLFSR
>Cag_0529 hypothetical protein
MILKAFNSAHFITALRGFNSVYYLGVKLAQLQATPSSGWDSSKTIDDLLT
TLKAEGFTPETHYMRYGYRENLAPNAFFNAAEYIQAKANQLVTVDHRYAS
VEAAKAAFLAAWDGDVYQHYLRYGAAENVNPSNAFDESAYYALKLAALRA
DPLTSAEWTPKSVADLQRYFKNAGFTALTHYEAYGKAEGIVVTPVLSSLT
PSLFNPTEYTQAKANQLFLQHAYDSVDAAKTAFLKAWNQNVYQHYLQYGA
AENVNPSNAFDESAYYALKLAALRADPLTTVEWTSKSVADLQRYFKNAGF
TALTHYEAYGKAEGIVVTPVPVGEKVADTLFAVTIDGAATPTVTITSSSS
ALKAGETATITFTFSADPGASFVATDIVTTGGTLGDLSGTGRVRTATFTP
TASLKFGSASITIAVRNYTDAAGNTGSAGTTPTITIDTLAPTVAITSSTS
ALKAGETATITFTFSEDPGTSFVATDIVTTGGTLEDLSGTGRVRTAKFTP
TANLNFGSASITIAVRNYSDTIGNTGGAGTTPKITIDTLAPTVAITSSTS
ALKAGETATITFTFSEDPGTSFVATDIVTTGGTLEDLSGTGRVRTAKFTP
TANLNFGSASITIAVRNYSDTIGNTGGAGTTPKITIDTLAPMVVITSSAS
ALKAGETATITFTFSEDPGTSFVATDIVTSGGTLGTLSGTGLVRTAMFTP
TANLANGSASITVAAGNYAGPAGNTGSAGTTPVVTIDTLAPTLSSSIPAD
NAMAVLVGANIVLNFSESVTAVAGKNIVLHNVTDSTTTTIAANDAQISIV
AGVVTINPTADFLNGKNYYVTVDAGAFIDGAGNDYAGIADATLLNFTITP
DVTAPTLSSSIPADNAVAVAVGANIVLNFSESVTAVAGKNVVLHNVTDST
ITTIAANDAQVSIVADVVIINPTADFLNGKDYYVTVDAGAFIDGAGNGYA
GITDATLLNFTITPDVTAPTLSSSIPADNAVAVAVGANIVLNFSESVTAV
AGKNVVLHNVTDSTTTTIAANDAQVSIVAGVVIINPTADLLNGKDYYVTV
DAGAFIDGAGNGYAGIADATLLNFTITSDVTAPTLSSSIPADNALAVAVD
ANIVLNFSESVTAVAGKSVVLHNVTDSSTTTIAANDAQVSIVAGVVIINP
TADFLNGKDYYVTVDAGAFIDGAGNSYAGIADAATLNFTTTPDVTAPTLS
SSIPADNAVAVAVGANIVLNFSESVTAVAGKNVVLHNLTDSTTTTIAAND
AQISIVGSVVTINPTADFLNGKNYYVTVDAGAFIDGAGNGYAGIADAVTF
NFTTTPDVTAPTLSSSVPADNATAVALGTNIVLNFNESITAVAGKSVVLH
NVTDSTTTTIAANDAQISIIGSVVTINPTADFLNGKDYYVTVDAGAFIDG
AGNSYAGIADAATLNFTTTPDVTAPTLSSSIPADNAVAVAVGANIVLNFN
ESVTAVAGKSVVLHNVTDSTITTIAANDAQISIVGSVVTINPTADFLNGK
DYYVTVDAGAFIDGAGNGYAGITSATALNFTTTPDVTAPTLSSSVPADNA
LAVALGANIVLNFSESVTAVAGKNIVLHNVTDSTITTIAANDAQISIVGS
VVTINPTTDFLNGKDYFVTVDAGAFIDGAGNGYAGITSATALNFTTTPDV
TAPTLSSSVPADNAVAVSVGANIVLNFNESVTAVAGKNIVLHNVTDSTTT
TIAANDAQISIIGSVVTINPTANFLNGKDYYVTVDAGAFIDGAGNGYAGI
TSATALNFTTTPDVTAPTLSSSVPADNALAVAVGANVVLNFNESVIAVAG
KNVVLHNVTDSTTTTITANDAQISIVGSVVTINPTANFLNGKDYYVTVDA
GAFIDGAGNGYAGIADAVTLNFTTTPDVTAPTLSSSVPADNALAVAVGAN
VVLNFNESVTAVAGKNVVLHNVTDSTITTIAANDAQVSIVAGVVTINPTA
DLLNGKDYYVTVDTGAFIDGAGNGYAGIADPTALNFTITPDVTAPTLSST
VPADNATAVALGANIVLNFSESVTAVAGKNVVLHNVTDSTTTTIATNDAQ
VSIVAGVVTINPTADFLNGKDYYVTVDAGAFIDGAGNGYAGIADTVTLNF
TTTPDVTAPTLSSSIPADNAAAVALGANIVLNFNESVTAVAGKNIVLHNV
TDSTTTTIAANDAQISIIGSVVTINPTANFLNGKDYYVTVDAGAFIDGAG
NGYAGITSATALNFTTTPDVTAPTLSSTVPADNAAAVALGANIVLNFNES
VIAVAGKNVVLHNVTDSAITTIAANDAQISIVGSVVTINPTANFLNGKDY
YVTVDAGAFIDGASNGYAGIADTVTLNFTTTPDVTAPTLASSIPADNAMA
VLVEANIVLNFSESVTAVAGKNIVLYNMTDSAITTIAANDAQISIIGSVV
TINPTADFLNGKDYYVTVDAGAFIDGAGNSYAGIADAATLNFTTFLVVPP
PDLIPPTLSSSVPADNAMAVLVGANIVLNFNESVTTVAGKNVVLHNVTDS
TITTIAANDAQISIVGSVVTVNPTTDFLNGKSYYVTVDAGAFIDGAGNSY
AGIADPTALNFTITPDVTAPTLSSTVPADNAVAVAVGANIVLNFNESVTA
VAGKNIVLHNVTDSAITTIAANDAQISIVAGVVTINPTADFLNGKDYYVS
VDAGAFIDGAGNGYAGIADTVTLNFTTTPDVTAPTLASSVPADNAAAVAM
GANIVLNFNESVTAVAGKNIVLHNVTDSTITTIAANDAQISIVAGVVTIN
PTADFLNGKDYYVTVDAGAFIDGAGNAYAGIADPTALNFTTTPDVTAPTL
ASSVPTDNAAAVAVGANIVLNFNESVTAVAGKNIVLHNVTDSTTTTIAAN
DAQISIVAGVVTINPTADFLNGKDYYVTVDAGAFIDGAGNGYTGIANAAT
LNFTTTPDVTAPTLSSSIPADNAVAVAVGANIVLNFSESVTAVAGKNIVL
HNVTDSAITTIAANDAQVSIIAGVVTINPAADFLNGKNYYVTVDAGAFID
GAGNGYAGIADPTALNFTTTPDVTAPTLASSVPTDNAAAVAVGANIVLNF
NESVTAVAGKNVVLHNVTDSTTTTIAANDAQISIVGSVVTINPTADFLNG
KDYYVTVDAGAFIDGAGNSYAGIADVATLNFTTTPDVTAPTLSSSVPADN
AAAVAVGANIVLNFNESVTAVAGKNVVLHNVTDSTITTIAANDAQISIVA
GVVTINPTADLLNGKDYYVTVDAGAFIDGAGNAYAGIADPTALNFTTTPD
VTAPTLSSTVPADNAAAVALGANIVLNFNESVTAVAGKNVVLHNVTDSAI
TTIAANDAQVSIIAGVVTINPAADFLNGKNYYVTVDAGAFIDGAGNGYAG
IADTVTLNFTTTPDVTAPMLSSSVPADNAAAVALGANIVLNFSESVTAVA
GKNIVLHNVTDSTTTTITANDAQVSIVAGIVTINPTTDFLNGKDYYVTVD
AGAFIDGAGNGYAGIADTVTLNFTTTPDVTAPMLSSSVPADNAAAVALGA
NIVLNFSESVTAVAGKNIVLHNVTDSTTTTIAANDAQISIVAGVVTINPT
TDFLNGKNYYVTVDSGAFIDGAGNGYTGITDPTALNFTTTPDVTAPTLSS
SVPADNAAAVAVGANIVLNFNESVTAVAGKNIVLHNVTDSTITTIAANDA
QISIVAGVVTINPTADFLNGKDYYVTVDAGAFIDGAGNGYAGIADAATLN
FTTTPDVTAPTLSSSVPADNALSVALGANIVLNFNESVTAVAGKNIVLHN
VTDSTTTTIAANDAKVSIVGGVVTINPTADFLNGKNYYVTVDAGAFIDGA
GNGYAGIADAATLNFTTTPDVTAPMLSSSVPADNAAAVAVGANIVLNFNE
SVTAVAGKNIVLHNVTDSTTNTIAANDTQVSIVAGVVTINPTADFLNGKN
YYVTVDAGAFIDGAGNGYAGMADTTLLNFTTTPDVTAPTLSSSVPADNAT
AVALGANIVLNFSESVTAVAGKSVVLHNVTDSITTTIAANDAQVSIVAGV
VIINPTADFLNGKDYYVTVDAGAFIDGAGNNYAGIADAATLNFTTTPDVT
APTLSSSIPADNALSVAVGANIVLNFNESVTAVAGKNVVLHNVTDSTTTT
IAANDAQISIMGSLVTINPTADFLNGKDYYVTVDAGAFIDGAGNGYAGIA
DPTLLNFITAPDVTAPTLTSSVPADNATAVSVEDNIVLNFSENVLANTGY
IVLKATADNAIIESFNTATGQGNHGGTVTVTGVSVTVDPMAYLTANTGYY
VTVDSTAVKDVVGNNYAGIVSSTELNFTTPTPTSYNLTTFADIAPAFVGT
VGDDIFNGTYGDGAGPYTLDATDVLNGGTGVDTLSITTGAEASTPPDSLW
ANKTNFEKVEFHSTGAGAQSITTGVNFNTAFAGHVDLIVETYNGATTIEM
QAFDGTSTLVATTTLDGAQTITTSNTHAAIVKAINSAAGAQTISGQFLTE
VQATINGAGAQTIGNALGGGSHLINVTATVLGAGDQTITTTSTGNATVNA
TCTTGTQRIVTGVGNDSVTAHSTTASNNVITTDAGNDTIIAGQGNDSITG
GLGSDSMTGGGGTDTFVFGANGSIVGASMDIITDFNNAGADILTFGGNTT
VLAADASVLVAGTNVQTSDGGLITFDVSDNTLAFKIAAVEADAQLDVAGS
VAMFVDSGNTYLYYAGIAAGNLDDQVIQLTGITTFITITGGPTTTII
>Cag_0614 Parallel beta-helix repeat
MKPRFYIEQLEPRILLSGDILSELVPLLSSREASQMQSDYLLEHPEARRV
APLSAVEAARACMVVVQSEAPSLLTEDGLMYPFEVGVGEERSSEANAEPT
LAADFSADYTFSKSEWDALEDGWRNLSSMVGDTLLDENLVAVESLLSGGS
RLYGGDELAALLQQPIDEYGSVFAQSSKGVLEALTQEWRNGDLVVVGKVL
GGYNQSTNEVRFDLSLQTVQHGRTFIDGKEVQVEGMSVTLSGDSSFSIRA
ELEVSFGINLLTNSFFADEVEGLVEFTVEASELEATVTYAAPTGEVVSDG
DGNLRLEASFMVASSVEHVVADNAVPALTATPQASGMELTLSFAGDEVHQ
GIEGLTIIDADLFTDNALEVTLQGGHLHPWESGLTAANLYVGTGDVLAGS
GTFAGDLYNAGGIVAPGNSPGRESVSTFTQLAGGTLLIELQGKSTAGVDY
DWLDIAGAANFGGTLQVELLNGYKPTVGDTFDIITFGGSASGIFTNLSGL
YGFDSDHYFDVVQSANKIQLVTKEIIAGDTFSFATDALGSAYNSQLGMLL
NASYLTSAAPTSVSLSGDLNLGDGFQLGGSFTFAKETVPSTITLSDSSTV
SATSLKISGENLHALFGTPAEGAGVSFSDVDFAFARFTPVSTSDSRSWIV
TKGSVGTDGDASFVNLGDLSITAGTISFDISQGLGAGNTTVANLSSSPIT
LGSVTLNSNGSRGEYFDVAASGFGFSVADTVAVTGDFLFSSDGARLAAVG
SHVSAHFGTAEMYVGVTDATVALMSSKTQGTVLQALGGFAASLGSDISLS
ATSSSILWKEAGTTVLTDVNKTLTIGSSSFTFSQELVDAITLQEVRVSGA
ELRVGNFVAASGDLAFHKTTTNVYVSGTTTAVHADVLTLGASGLSIFVGT
NGADEANRMGLSVSGADFALAIIREQAGAARQWTALKGSAESAAALGMPD
VTLSGSTISLELNLQASDASVLDFSTQSLAVATGVGSSVTLDFDEALVRA
SGEFDIAIADFLELSGSMAFEKQSQQLAVQAADGTSSNILMDLLTLGGAG
IEAFVGMNGGAAEQVGLVLAGTRFALLMAQEKAVAKRKWSALKADADSAA
LVGIENLTLAGSELSVAINQSNSDGSLLDFSTTSYAVPVGPSETLALDFN
ADAGELLQASGNLEIDLFGFVQLSGDVAFQKSISTVTLADEASTSVAVEM
VTFGGHDLNAFAGINGGSEEAIGLELGGVEFGLALMTSTSDAARTWTSLQ
ASAESAAFVGVEASGGLTLSGDTLSVVINQSSLDGDSVVDYSAGKTDLTI
ATGTSTSMQFAMEGSQGEMLAASGNLSLDVFGFFQAEGGFAIEKRTDTLL
LSDATDTTPASQIAVDLLTIGGSGINAFAGLNGGSDEALGLALGDVNFGL
MLATEQGGAQRQFTSLKADAGSIEFVGLDGFVASGTNVVVEINRGVAGVG
EAAAVVADHGAMPLLVTTSPDSSIELDMDGAKGEITRASGAIDLNLYNFF
SLHGELAFEQSTSSITLANNPDTTDVNEAASPVTVNLLTIGGKNVSAFVG
MNGARDSEGALSDDAFGIDLDTATFGVAVMTEKGGAARSWSSVQATASGL
SFVGIDGLTVAGSELSVAINQSAADGSVVDYSSGKTEMTIATGSDDTSTL
SLNMDGSKGDTIQASGRLDINLFDFFTVEGYFAFEKSRGAVTLSDGDVIE
QADLLTLGGNDVSAFVGINGGSADELGLELGTADFALALITDSADATRKF
TSLQASAALASFVGVDGLKVEAKDLAVNINKGITLPATPEVITKVNTILS
LELPASLIGKLTLSKGSDTADVALNGKQSSEEIIALLTAAFASLEGIGAD
NVQVSGNSIDGYKVEFVGELAGVDVTGITVNATAAPITTSVNTVSEAQNG
VTEVKQIVVESLVGEQVPVTVDVSQVTQGVAGQSEINSIIFTNPSTSGSY
SVFLSANGTVTNGSSAVAGVNGVQRLTLDALGGEPSSATATITEEVAASS
ISTSEILAINFTVPNNNSGKYTLSTATRSVDINFVGNDVTNNARYLREGL
AKLLKTSEINISVSFDKTFYEDGGTLHTNIGHSYNIYFRGALATTDIPTI
SVNKGTVSGDVILTAKQQGGPARSETQRVSLETSGEGTFILSLLYEGKTY
QTKSLAFGATADKVQVALNAALMNISGTTKVTLDAATGDYLVTFGGNLQN
KNINMLSATLQPASTAPEGSFTLLLGGVTSSAITYSSNATTMASRLQSAL
AAMSNVASGNVTVAVDAAHSVGSATAFSITFKGALAGSNVEVLAINDGAL
SGVDATMQTVTNGVASVGETQRILVGSHPQSVGYTLALEYNGRTYNSGSI
ASGATQSAVQAALTAGFSTLSGADVQISSWTSATDYTIRFGGSLAGKDVA
LVAIKPNVEPTTAAVTGTGNFVVGNTAQNVANLKAAYATMLSTNQANISV
SYDPTYSGGGERYLVSFVDAFANTDLPDKSFLYSSNAIGYKLIQDGSAPI
AEVQRVAVDKGTSTGTFVLQFTHNSTTVTTSALAFDASAATVQSALNTAL
ANISGATASVALDSDGAYLVTFGGTLLGKNVANLKATNIAVDPILPSGNF
TIELNGLNGQMSSAIAYSTNNATLAASLQSALEGLGDIGAGNVSVSYSAT
ESTSKKSVFTITFKGEKVATNIPDITAHFGDLERATVTPYRITEGQEVTA
EVQRVTLDTIAEEGSFILSLTHGGSTYKTASIALQATKDEVQAAVSAAFA
GLASAEVTVESWTQEELTLSFGGSSLAGQNIAPIVVNATVAPVSAALASV
QAGYTEVQEAEPIRTLVVDYSAGKTDLTVTTGPSSSMKLTMDGSKGELLQ
ASGDLTLDVYGFFMVEGNLALEKSESSVTLNDSEVAADGTVTKPASQVNV
NLLTIGGSGLKAFAGINGAYDEDGELVADAVGLSLTDTSFGLVMAGEQAT
GLEPAGTTMRKWTSLQAEVGGASFEGIEGLKVSVDTLGVEINRVAMDGSL
IDYKAQNVAINTGTEANPSSMSLTMDGSEGALLRATGNLNVDIFGFVQVS
GSFGIEKKSGAVTLADIEATEDVDESLAPVSVDMLLLGASGVDAFVGAGD
VGLALSDVNIGLALLTEQLPTGSTALARKWTSVEAEVGSAGLVGIEASGG
LTAQVEELSVSINRAAVDTSVVDYSLKAGSTTVRKTDLTILTGPLSDMAL
TMDGSRGALLEANGRLVLDVFGFVQAEGEFAIEKASALETITLSNATTTE
AEVLRLGAHDLRAFAGINGGTDDAIGLELTGVDFALALVSEKPATGSTTQ
PRSWTSLQATAESAAFVGVDGLTAQADTIAITVNKASTDGLVVDYSLKTE
GGTERKTAMTVRTGISEESAITFDMDGAEGNLLRASANLELDLFGFFQVS
GGFAIEKKTAEVVLNDGVVSEDATKAKAPTELSVDLLTIGGSGVDAFAGM
NGGTADAIGLQLSDVEFGLALMTEQVEEGSTAAARKFTTLKANAGEISFV
GVDGITASATDLSVEINRGIAGTAGNPDVVVDFGYRQLEVLSSPDSTIVL
DSDGSLGQLMRASGTLDFNLYNFVSLNGNFAIESSSKEIHLAGADNATAG
EVVQANMLAIGGSEVNAFVGINGGTDDAIGLQLAKAEFGLALLSDKDDAT
RSWTTLEANAEELSFVGIEGLTASAKDITISINQAGKLNDKVVDYVGTGA
TATDLTIKTGQSSDLKLSQEGSEGETLKAAGNLDIDMFGFFSVKGGFAVE
QRSQEVTLSDGTVIKNADLITIGANEVDAFAGVNGGFDDKTGELNGDAMG
VSLGDVNFALALISDPSDKARSFTSLQATAADVGVEGIEGLTMQVNEMLV
NINHGITVQAEPAKTIKVNTQLKLNVPVDLIGTLTFNRTAGTGYAADSAV
VNVTANMTNDALITALTTGIESFDGIGAGNVQVTGNRYDGYVIEFIGTLS
GINIDDITVSAAGAGVTYGVTTTTAANAGVNEVKELTVQALREAPAPVAI
TIGTESDGRAGVNEANEIIFTTPKSAGTYTVYFVTDGLVQQTTAGVTGVS
EVQRLSLTGDTTAAGGSGSVTVTTVTEGSGSAVVNERYVETFTKEFGRQG
FKLFFVDNPKLSVTWDYTNYAEDTSATIGDLKSAYAELLNGYQSKTVTVS
DIQVSIDNSYKGSGHRYNVEFVGALAGVDVKAIGMRSEAGSFSHVNKQDG
ISGTSEVQKVVLNATGSGYFTLSLTYNSKSFTTDGIAFGASAATVRYALN
AALGRDGSVEVSSPAKGEYLISFGGKLAGQNISALTGSTLSEAPSGNFTL
SFGGQTTRSISYTTDGSALASRVQTELARLSNIGSGNVKVSYNASQSNDA
LLGLDIRFTGTLANQNVNAITVDGSNLANAGGSVRTITQGVANINQVQTI
TLGTDAVAKGYRLSLSYLGETYTTNLIAGNASATAIQSAINSAFGVISGA
SFSVSKSGTQVQLTVGGSLSGQSLNLINLQAEGATASGSQVTKNFVVSNV
TTNVANLKAAFAELLATDAANISVTYDSKYKSGERYVVSFVGALAGTDVA
NKGISISGTSISWKLLSDGTPAVSEDQTITVDREVTTNGVFRLSLQHNNK
LYTTADIALGATTEAVQTALRAAKASDNSVLSSLGTITVSGTTDNYTVSF
GGALAGTNVATMQQAALEVDQELPTGTFKISYLDTEGVRQYTGNIQYSAD
QTTLKTNIQTALNTLFGANNVVVALDATQSEGRKAVFALTFENGLACQNI
ANITSHFSELDCAVVTPMNLTQGEERTGEVQRISATSDATDIGYTLSLTH
SGKTATSATIESGMSQEEVQAILNTIMTSLNTAVGGGFAATATVDFWSGK
ALEVRFGGSLVGVDVADLVVTNVARTYESAVTQEQEGSTTNIEAKPQRTL
VVDYGFKEGSTTERKTALTVATSSTTSIAMSMEGAKGELLQAAGHLTLDV
YGFFMVEGNLALEKSESSVTLNDGTETTPASQVNVNLLTIGGSGLKAFAG
INGAYDEDGELVEDAVGLSLTDTSFGLVMAGEKATGLEPASTTMRKWTSL
QAEVGGASFEGIEGLTVSVDTLGVEINRAASDKTLIDYKAQNVAINTGTE
ANPSSMSLTMDGSEGALLRATGNLNVDIFGFVQVSGGFGIEKKSGAVTLA
DIEATEDVDESLAPVSVDMLLLGASSVNAFVGAGDVGLALSDVNIGLALL
GEQLSAADVKAGKVARKWTSVEAEVGSAGLVGIDDLTAQVEELSVSINRA
ALDTSVVDYSLKDGSTTVRKTDLTILTGPSSDMALTMDGSRGALLEANGR
LVLDVFGFVQAEGEFAIEKASALETITLSNASTTKAEVLRLGAHDLRAFA
GINGGSDDAIGLELTGVDFALALVSEKPATGSTTQPRSWTSLQATAESAA
FIGVDGLTAQADTIAITVNKASTDGLVVDYSLKTESETERKTAITVRTGI
DEASSITFDMDGTEGNLLRASANLELDMFGFFQVSGGFAFEKKSAEVVLN
DGVVSEDATKAKAPTELSVDLLTIGGSGVDAFAGMNGGTADAIGLQLSDV
EFGLALMTEQVEEGSTAAARKFTTLKANAGEISFVGVDGITASATDLSVE
INRGIAGTAGAADVVVDFSYRQLEVLSGTDSTIVLDSDGSLGQLMRASGT
LDFNLYNFVSLNGNFAIESSSKEIHLVGTDDSTETVQANMLAIGGSEVNA
FVGINGGTDDAIGLQLDKAEFGLALLSSKADATRSWTTLEANAEKLSFVG
IEGLTASADSITISINQAGKLNDKVVDYVGTGATDLTIKTGNTTDLKLSQ
EGSEGETLKASGNLDIDMFGFFSVKGGFAVEQRSQEVTLSDGTVIKNADL
ITIGANEVDAFAGVNGGFDDTTGDLNSDAMGVSLGDVNFALALISDPADK
ARSFTSLQATAAEVGVVGIEGLTMQVNEMLVNINHGITVQAEPAKTIKVN
TQLKLNVPVDLIGTLTFNRASDSAVVKVTAGMTNDALITALTTGIESLDG
IGTGNVQVSGNRYDGYVIEFIATLSGVNINDITVSAAGAGVTYGVTTTTA
ANGGVNEVKELTVQALREAPAPVTITIGTENDGRAGVNEANEIIFTTPKS
AGTYTVYFVTDGLVQQTTGGVTGVSEVQRLSLTGDTTAVGGSGSVTVSTM
TEGSGSAVVNEGYLVTFNENYGYQGFKLFFVADPVLPTTWTYRSSAASTS
DTINNLKGAYADLLDGYQGKEVTVDDIKVTVDTKYKESGYRYKVEFVGSL
AGVNIASIGMRAETGKISNVHATHGVSGTSEVQKVVVSSTGSGYFTLSLT
HNSKTYTTTGIAYGSNAATVRYALNAALGRDGSVEVSTPSKGEYLISFGG
KLAGANVAALTGSTLSEAPSGNFTLSFGGQTTRSISYTTDGTTLASRVQS
ALKALSTIGSGNVQVNYNAGQSNDGLIGLDIRFTGMLANQNVNAITLTPS
LSNASATIRTVTSGVANINQVQTISLGTDAVAKGYRLSLSYLGETYTTNL
IAGNASATAIQSAITSAFGVISGASFSVSKSGTQVQLTVGGSLSGQSLNL
VNLQAEGATASSSQVMKSFVVSNVSANIANLKAAFTDLLKTDAANISVTY
DSKYKSGERYVVSFVGALAGTDVANKGISISGTSISWKLLRDGTPAFSEE
QTITVDRASDTDGVFRLSLQHNTKLYTTGDIALGADAAIVQSALRAAKAS
DNSVLSSLGTITVSGTTDNYTVSFGGALAGTNVAALQQAALEVDQELPSG
TFQISYLDAEGVRQYSSDITYSSNQTTLKSNIQTALNTLFGTGNVTVTLD
ATQSEGRKAVFALSFKNGLAYQNIANITSHFSELDSAVVTPINLTQGEER
TGEVQRISATSDATDIGYTLSLTHSSKTATSATIESGMSQEEVQTILNTM
MTSLNTAVGGGFAATATVDFWSGKALAVRFGGSLVGVDVAALAVTNVART
YASTITQEQEGSTTNIEAKPQRTLVVDYSLKEGSTTERKTALSVSTSSTT
SMKLTMDGAKGELLQASGDLTLDVYGFFMVEGKLALEKSESSVTLNDSVV
DAEGKVTKPASQVNVNLLTIGGSGLKAFAGINGAYDKDGKLVDDAVGLSL
TDTSFGLVMAGEKATGLESAGTVMRKWTSLQAEVGGVEFVGVDGLTVSVD
TLGVEINRAASDKTLIDYKAQNVAINTGTEANPSSMSLTMDGSEGALLRA
TGNLNVDIFGFVQVSGGFGIEKKSGAVTLANITSTPANESLTPVNVDMLL
IGASGVNAFVGAGDVGLALSDVNIGLAMLGEQLSEADVKAGKVARKWTSV
EAEVGSAGLVGIDDLTAQVEELSVSINRAAVDTSVVDYSLKDGSETDRVT
DLTILTGPSSDMALTMDGSRGALLEANGRLVLDVFGFVQAEGEFAIEKAS
ALQTIALSNATTVQAEVLRLGAHDLRAFAGINGGTDDAIGLELTGVDFAL
ALVSEKPATGSTTQPRSWTSLQATAESAAFVGVDGLTAQADTIAITVNKA
STDGLVVDYSLKAESETERKTAITVRTGTDEASSITFDMDGAEGNLLRAS
ANLELDMFGFFQVSGGFAIEKKTAEVVLNDGVVSEDAKKAKAPTELSVDL
LTIGGSGVDAFAGMNGGTADAIGLQLSDVEFGLALMTEQVEEGSTAAARK
FTTLKANAGEISFVGVDGITASATDLSVEINRGIAGTAGAADVVVDFGYR
QLEVLSGPESTIVLDSDGSLGQLMRASGTLDFNLYNFVSLNGNFAIESSS
KEIHLVGTDDSTENVQANMLAIGVSEVNAFVGINGGTEDAIGLQLDKAEF
GLALLSSKSDTTRSWTTLEANAEELSFVGIEGLEASAKNITISINQAGKV
DDKVVDYVGTGATDLTIKTGNTTDLKLSQEGSEGETLKASGNLDIDMFGF
FSVKGGFAVEQRSQEVTLSDGTVIKNADLITIGANKVDAFAGVNGGYDDE
SGELSDNAMGVSLGDVNFALALISDPADKTRSFTSLQATAAEVGVEGIEG
LTMQVNEMLVNINHGITVAAEPAKTIKVNTQLKLNVPVDLIGTLTFHRAA
DNAVVNVTAGMTNEALITALTTGIESLDGIGAGNVQVTGNRYDGYVIEFI
ATLSGVNINDITVSAAGAGVTYGVTTTTAANGGVNEVKELTVQALREAPA
PVTITIGTENDGRAGVNEANEIIFTTPKSAGTYTVYFVTDGLVTETTQAV
TGVSEVQRLSLTGDTTAAGGSGSVTVSTITDGSGSAVVNERYVETFTKEF
GRQGFKLFFVDNPKLSVTWDYTNYAEDTSATIGDLKAAYAELLDGYQGKM
VTVSDIQVSVDNSYKGSGHRYIVEFVGALAGVDVKAIGMRSEAGSFSHVN
KQDGISGTSEVQKVVVSSTGAGNFTLSLTHNSKTYTTTGIAYGSNAATVR
YALNAALGRDGSVEVSTPSKGEYLISFGGKLAGANVAALTGSTLSEAPSG
NFTLSFGGETTGAISYTTDGTTLASRVQSALKALSTIGSGNVQVSYNAAQ
SNDALIGLDIRFTGTLANQNVNAITLTPSLSNASATIRNITQGVANINQV
QTISLGTDSVAKGYRLSLTYLGETYTTNLIAGNASATAIQTAVNSAFGVI
SGASFSVSKSGTQVQLTVGGSLSGQSLNLVNLQAEGATASGSQVMKSFVV
SNVSANIANLKAAFTDLLKTDAANISVTYDSKYKSGERYVVSFVGALAGT
DVANKGISISGTSISWKLLSDGTPAVSEEQTITVDRVSDTNGVFRLSLQH
NTKLYTTGDIALGATTEAVQTALRAAKASDNSLLSSLGTITVSGTTDNYM
VSFGGALTGMNVAALQQAALEVDQELPSGTFQISYLDAEGVRQYSSDITY
NADQAILKTNIQTALNGLFGANNVIVSLDATQSEGRKAVFALSFKNDLAY
QNIANITAHFGELDRAVVTPMNLTQGEEQTGEVQRISATSNATDIGYTLS
LTHSGKTATSATIESGMSQEEVQAILNTMIVNLDSNAKATVDFWSGKELE
VRFGGSLVGVDVAALAVTNVARSYESAVTQEQEGSTTEIAAKPQRTLVVD
YSTGKTELTVVTGYDDVNKKNTFITLAMDGSKGELLQASGDLTLDVYGFF
MVEGNLALEKSESSVTLNDGTETTPASQVNVNLLTIGGSGLKAFAGINGA
YDAKGELVDDAVGLSLTDTSFGLVMAGEKATGLEAAGTTMRKWTSLQAEV
GGASFEGIEGLKVSVDTLGVEINRAASDKTLIDYKAQTVAINTGTEANPS
SMSLTMDGSEGALLRATGNLNVDIFGFVQVSGGFGIEKKSGAVTLADVTT
TTTIHEDASPVNVDMLLLGGSGLDAFVGAGDVGLALSDVNIGLALLTEQL
PTGSTVVARKWTSVEAEVGSAGLVGIDDLTAQVEELSVSINRAAVDTSVV
DYSLKAGSTTVRKTDLTILTGPSSDMSLTMDGSRGALMQANGRLALDVFG
FVQAEGEFAIEKASALETITLSNAATTEAEVLRLGAHDLRAFAGINGGTD
DAIGLELTGVDFALALVSEKPATGSATQPRSWTSLQATAESAAFVGVDGL
TAQADTIAITVNKASTDGLVVDYSLKADSETERKTGLTVRTGIDEASSIT
FDMDGTEGNLLRASANLELDMFGFFQVSGGFAFEKKSAEVVLNDGVVSED
ATKAKAPKELSVDLLTIGGSGVDAFAGMNGGTVDAIGLQLSDVEFGLALM
TEQVEEGSTAAARKFTTLKANAGEISFVGVDGITASATDLSVEINRGIAG
TAGAADVVVDFGYRQLEVLSSPDSTIVLDSDGSLGQLMRASGTLDFNLYN
FVSLNGNFAIESSSKEIHLAGADKDTAGEVVQANMLAIGGSEVNAFVGIN
GGTDDAIGLQLAKAEFGLALLSDKDDATRSWTTLEANAEELSFVGIEGLT
ASAKNITISINQAGKLNDKVVDYKGTGATDLTIKTGNTTDLKLSQEGSEG
ETLKAAGNLDIDMFGFFSVKGGFAVEQRSQEVTLSDGTVIKNADLITIGA
NEVDAFAGVNGGFDDKTGELNGNAMGVSLGDVNFALALISDPSDKTRSFT
SLQATAADVGVEGIEGLTMQVNEMLVNINHGITVQAEPAKTIKVNTQLKL
NVPVDLIGTLTFNRTAGTGYAADRAEVSITANMTNAELITALTTGIESLD
GIGAGNVQVTGNRYDGYVIEFIGTLSGVNINDITVSAAGAGVTYGVTTTT
AANGGVNEVKELTVQALREAPAPVTITIGTENDGIAGVNEANEIIFTTPK
SAGTYTVYFVTDGLVQQTISGVTGVNEVQRLSLTGDTTAAGGSGSVTVST
ITEGSGSAVVNERYVETFTKEFGRQGFKLFFVDNPKLSVTWDYTNYAEST
SSTIGDLKSAYAELLNNYQGKTVTTSDIQVNVDTSYKGSGHRYIVEFVGV
LAGVDVKAIGMRSEAGSFSHLNKQDGISGTSEAQKVVVNATGSGYFTLSL
THNSKTYTTDGIAFGSSATTVRYALNAALGRDGSVEVSTPSKGEYLISFG
GKLAGSNVATLSGEILSEAPSGNFTLSFGGQTTRSISYTTDGTTLANRVQ
TELARLTNIGSGNVKVSYNAGQSNDALIGLDIRFTGMLANQNVNAITLTP
SLSNASATIRTVTSGGANINQVQEITLGTDAVAKGYRLSLTYLGETYTTN
FIAGNASAIAIQSAINSAFGVISGASFSVSKSGTQVQLTVGGSLSGQSLN
LVNLQAEGATASSSQVMKSFVVSNVTNNVANLKAAFADLLKTDAANISVT
YDSKYKSGERYVVSFVGELAGTDVANKGISISGTSISWKLLSDGTPAVSE
EQTITVDRASDTNGVFRLSLQHNNKLYTTGDIALGADAATVQSALRAAKA
SDNSVLSSVGTITVSGTTDNYTVSFGGALAGTNVATMQQAALEVDQELPT
GTFQISYLDAAGVRQYSSDIMYSSNQTTLKSNIQTALNTLFGAGNVTVTL
DATQSEGRKAVFALTFQNTLAYQNIANITSHFGKLDRAVVTPMNFMQGEE
RTGKVQRISATSDATDIGYTLSLTHSGKTATSATIESGMSKEEVQTILNT
MMTSLNTAVGSGFAATATVEFWSGKELEVRFGGSLVGVDVAALVVTNVAR
SYASAITQEQEGSTTNIEAKPQRTLVVDYGFTKDAEGKPTTTRATVLNVA
TSGSTSIKMSMEGSKGELLQAAGHLTLDVYGFFVVEGDLALEKSESSVTL
NDSEVAADGTVTKPASQVNVNLLTIGGSGLKAFAGINGAYDEDGELVADA
VGLSLTDTSFGLVMAGEKATGLEAAGTTMRKWTSLQAEVGSVEFVGIKDL
KIAATDLQVEINKAAKTTDGKSTVIDYAANPFEVITGKDKSITLSMDGRE
GDLISARGELEIDLFGFFQVSSGFAFEKKTETVQIRTGDTVTATEVNVLT
IGARGVNAFAGLNGGTEDEIGLKLKTTDEASTDFALVLASEKPAVSATPG
APVTPVRKWTSLQAEVGSVEFVGVKDLTIAATDLKVEINKAYVNPTTKVT
SIIDYAYKDTEGNSGLEVATGPDSSITLSMDGSEGDLISARGELEIDLFG
FFQVSSGFAFEKKTETVQIRTGDTVTATEVNVLTIGARGVNAFAGLNGGT
EDEIGLKLKTTDEASTDFALVLASEKPAVSATPGAPVTPVRKWTSLQAEV
GSVEFVGVKDLTIAATDLKVEINKAYINPTTKVTSIIDYAYKDTEGNSGL
EVATGPDSSITLSMDGREGDLISARGELEIDLFGFFQVSSGFAFEKKTET
VQIRTGDTVTATEVNVLTIGARGVNAFAGLNGGTEDEIGLKLKTTEEAST
DFALVLASEKPAVSATPGAPVTPVRKWTSLQAEVGSVEFVGVKDLTIAAT
DLKVEINKAYINPTTKVTSIIDYAYKDTEGNSGLEVATGPDSSITLSMDG
REGDLISARGELEIDLFGFFQVSSGFAFEKKTETVQIRTGDTVTATEVNV
LTIGARGVNAFAGLNGGTEDEIGLKLKTTEEASTDFALVLASEKPAVSAT
PGAPVTPVRKWTSLQAEVGSVEFVGVKDLTIAATDLKVEINKAYINPTTK
VTSIIDYAYKDTEGNSGLEVATGPDSSITLSMDGREGDLISARGELEIDL
FGFFQVSSGFAFEKKTETVQIRTGTTVTPTDVNVLTIGASNVNAFVGLNG
GTTEELGLKLEKTEFALVLASEKPATPTSTAPLQKWTSLQASVGKVSFVG
VKDLTIAASDLQVQINKAYVNPTTKATSIIDYAASPLDILTGYDAEKGED
TFITLDMDGSKGELLKASGHLTIDVFGFVHVEGDLALTKQTEQVVLAKKL
GQSTGEKVNVNLLAIGGSNIDVFAGVNYGTSDAIGLSLVDIKFGLALMTS
QTTPTRKWTALSASAASVGIAGLDDLLPTIKNLTVEVNQATKVGDQVVDF
ETKPLDIATGTGSFLTLDMSGSMGKLLRAEGDVTFTISEFAYFKGRIGFE
KYTPTKQLTLKNITTPVALPSYATATSMMAITGSNITAFVGYADGGFDTT
KTLEAQKDNLYGFGVEGVNFGIVKTKTASGAYTAIKADMSSAAIYGFDED
DFQLSAENLRFAYASADASGNVIDYEASFDGGLALGSGGDVVIDFTAKKL
GVYTEKATLSISKFLYFSGAIGFEQADYGSTLKVGALGLPVTGAKGFSIG
GSNITAFVGYAEDGIDSTQTLQAQKDSLYGFGVEGVNFGFLSLKDSSGKT
YKALKAHADNMAVYGFDPNDFQLSVSNLNIEYNSASVVGNELNFTMLTDG
KLAIPTGDPENPVELDFSGKRLGVFAGNVTLQISQFLYVQGAIGFQKADF
TNLIAGAMPVATIATPATGFTIGGSNIDVFVGYAADGLDLAKPFSEQVKY
ETEDGKEADNLFGFGAEGIDFGLIQVKTKTGISYTAAKAHADEVALYGFD
PEDFQLSLSGIDFKINTVNNQAMPALNFQASHGEAGFAVPTGNPDEPIML
DMTGKTIGASLQNATLRISEFVYVSGSFAFEKGGTQILSAKTVGGIHAPV
LADAFTLGASHVQAFVGVGGPYRLDSNEDGKITVDDEVANPNAIGLVIDD
FTFGLGLFQDQATKIKYTALKASAAKIGMNGLGEVIEFSLDDVVVAINRS
SNPLFVLDFTQNGDGSASEGLAIDTGDPDSPVVLDFDGELIQASVGHATA
QIAGILSLEGGFTFQKRMIDNIGFHGLGMNLELGAEALIIAGQDVYAFAG
INGPYKTDTNKDGKVDESDPINEDAIGFALSDLDFALALVAPSLGGGAKL
PINFFGLRASAGYAGLVGTDPYLTLNAQDLIFEFNGAIAQANGKFIPLPS
VYADFSVIDNGVDEEGNALPTGLNIPIGSDATAINMNYSSNFLRVGLTGE
LGIFDLFTIKPPRLDFTFELPAIDLGVGFSLKDIALPEFKMPSLPAFDAN
MLLPSISLKQLTQLAEDALNTTSAPDWLKDGMKYLEGIDIRIGLAGVTGT
ITIPDLKIDLGGFVHLEGDFKLTLGKTFVADMATGIDPTLAGIVTTTIDA
IGSTFMPEGITPTGLLTKLFKVSEDFSTFEKVTFRGLAFGASDVNLFVGV
GDPDFSNPTSNPLSNQDLVGFGLQDIDLAIGYFKADLPEWLGAESVFSFT
AHAGQMGVYGLGDILKIVTSDVTVDVNMGGNTKVKAGQTPILSARPIYNS
IVNEDGSKGLKIDTGGTPVLLTFAGSEIMGVDIGLAEIVVADFLHLRGSL
AFRKGELYDVAVDAGGLAPALSKIGSAAGVTLNPIPLQVETLTLAGANLV
GFAGVGGPYRYGADADGDLIPDKINESAIGVEVTNVDFGLAIMTPTLVTA
IPGMAEYAPKFISAKAYVGSASLVGVDPNILEVRAEDIEVNINTFVIPKA
PWPVNAAIQLFGPPSINYKLSTSFKNYTEDTNGDGVLSVSEDKDIDLILD
PGEDANGNGVLDLSEDRNQNGRIDRAGFMVPAGGNNGIFLDFAEEIIQVK
IGYAEINLAGFIRMSASMALTKKGSETVTLSDGDTTIVTSLALGINDAYG
FVGVPTFEDGKPRSYFWDSNNDGRVDERDSVNEGAIGLAIENLDLGLILA
KELVIDPSGVSIGVYIAGRATVDMIGLVGVPGVTMKAEEIAIEINTGLRA
TLEVGNIVKDEKTGAVSYKPGFSASFGFTTIDFSKSQWMDTSLAVNKDSD
DSNDLYYDGYAIDTGNPSEPIVLLYDEQYLRVFGRAEVNLFDMAKMHGAI
DFRFSESDGLTAFADVEVQIGPDGFNMKREGRGLLVINKGGVALRLDVGA
SLELGPVATITADMTLVLNSFGKKIVYTVPESFRQLLTSSKYPNWQYTID
EFPPGKDESWTGMYAAVVGKGELDLFDGALNLKGDFAVILSQVDSHVTLE
LGITAVLDLPIFEPLGVTGTIGLVIDVAPTGNQTGLYGSLEVGGANADSL
LIDGGSIFSLKGHFLLQINTTSVDQKVRGRDPVTGSFYDKDGKAVQVTVP
KQSLRISGSASLEIASVLTMEGSADLVIDKSGIQAALTMTLGLGGLGDVE
VKGAAAFGVDGNNTPFFAMRLELSVSLGVSVIGIDANALLQINTSHNNYT
TLHGDTIAGNTIFDMSLDGEIHLLAFDVDFSGRMSIVNSVFKLEFDGRLN
FFNALDINVGGFVSSDGSFEFRGKAEINIYLGPLHLNAGMSVLFSSQPRF
AAAAWGSLDFEIDLGLFEIDFTLAGFRAEIDITPASAYLAARVTVMGITV
SGSYCWRWGAPPNISHLSSDGTLYLHMGDNSGRYGSGDLYDDTIHESFNI
DQNDSTITVRSLGETDTYSATSVKKIVAVGGKGNDFIYVSKGVKADLDFD
GGDGNDSFMILGGGANSVVRGGAGKDEFSTGDYTKGYFLGGEGDDKFVGG
EGDDIIDLGAGNNSIFSGGGNDLIRVSGASDTVDAGGGDDTILASRGGYL
NLTTGSGEDQLYFGNFTATKPTLTLKEANITSTEAIELKESQITVTAQSS
GTRTVVFDTTLEVVNLNDKAATTTIKAATNANWHNTDLIIDAAGLLDVRT
ANFVAPDALVSISAKGIKGELTTNVAELSVINLGTAGDAADRAIVVREAN
DLLIVAAGRSNGGLYAAKGAVTIDVAEREAELTLQSGVIFAGAGADLTIY
ADDIDFESGNNKVSGTGKLIIRTKADAQNYRIGGAGQSRFGADRSPGVNT
GFMELGMKDLSALANGFSSITIGHNVAGSTMQIGDVEDATVGTYPFSARL
DDVATFIADLITITGDVQSSERLTLNARALEVQRQNNSNPLGAPDSGITA
PEIYLNVKEQMLLTGWVIADNLVDIKVTNSIGEGGFVTYGTEINSFTADK
GSTLQTLKSNSKIILTTSHSVYSATGIYAGVTNGTGASITINAGTGFTVL
EGGTVATRYANGVIDVTAGKYIHILSGGAVVSGATLNTTTKQYELTGTGS
TMKLSTTGEMTLAGSLTAAGAMTLKASEVQDEFADYFNNLAGKGITEVKD
ASTVSTIAAALAAGTIPSELTALFTGGNLTLDTGSDVLVSVANYIPFAEL
PEATKKAIAESKGYTEFAVDAATKVSGYFNAATGKFFTTISDGPVIGYTI
NDINWGSVTKPTTGTAFSVLSAAQQTVIANALGYTRHAGTVYFNPLAEAG
EEVKTTFIQGISADYNNAHIDWVAAGVAVPAANATFEQLTPVQKLVVANS
LGYMYDYSLIQPEAWSNQPFDYSTITKAEWIEASTLNYRVAISNDQWGEV
TKPTSGATYASLTAAQKEVVDKVVQFVPAQTDRLTLSGSFAENNTLALTI
NETVITYTVKTADIGATSEATLANVAKGLAQLINDTTSVSGAVSASDSTS
AAIAMVRMVSSATPAAEVTVVSTDSARLSVSDIAGGKAVTLFGKFNDGNV
LSLTVNGTTVSYTVKAADIGVTDDITRSRIATALASAMSVAGVTVTSQLI
APVTQVLISATATNTKFTLSATDGHVAIEHNPFDLLNQDQQQLVASKLRP
SLQTHYKDLTAGQKQAVATALSTAAKIEFFNYAAQPGKKLVTTFTQGIIT
DYRNDQIAWGTVAEPSSNSATFESLTQAQKDVVAHSLGYDRYDGVHFLKA
DAAPEKRWVSGFTEGGGSFDLSTMDWGGVATPDAGTSFEQLTIAQRDVVL
KKLGYDVYEREVYVSADGNTIKGSFVEGATNADYDATTITLEEWGKVLPV
APGTAWLDLTFEQQEFLLDRLNYSRWNGLVFHNAASTTAPYRLTFKEGTA
TGADYKNDDIEWSKTAFPNSSAGVTLSTVKDAFKVGDVVTITVSLTENGG
SPTNTNVSFTVTAADVTAKAVAKGLADAINAHDTLKTKVVAKSSEGALYV
SSLSRNAEVTFSATDSRISSSQANPLGALTVEQKGLVLQQAGLTEYATTV
YYKADVPVGQQVVTSFTVDYSSDDAPSTPTKRWLLSDNAGHRYLIYAYDA
TNDGVIDEIHIQEPHKLVGQRGAGFLLTGTITTLQENADFIIDVKDDAIV
SGGRFYLMGAGSDLTIASDRSVFWQGEAEINGDITLIGRGVQGAGMPLDG
ISVYIHASSTLSSVAAGSDITIIGADAGDVELHGAVLAGAERSNTGTHYL
GADSTVSVTTGQQILVNNALAAAKSVILTTTQTPGSDDAYQSVILDTVAG
LTSAGWTSDWSGGLVKIDAVGSVTLSGMVLSGGTVSQTFNSDGRLTAETF
TWSNEPSQVIINAKGQLNLGVETLALSGNMVNVGARIRANQYVELSGIVG
GADDRFAVKLPESAVVAVSNPDGVIKITSGQDAWLMGQLVAGGEVVDSYD
TAGYYLGSKVNTFKGDSQLIIEADEQIRIGRDLMAGKLLDVRGGTVSGRP
AKTTTITTTSSDGLTTTTTTTYLPNAPIGTSTTTNSDGSTTTTQTTEIPW
ANDGIIIGGNVQLRTWQEYSTITLSAGGNMSVLTPAWTQELLADGFAEFA
DGHLSSAVKFHLIVETGTVDEERDITVAATRTNGNGLGFLKEDIQAAIDT
AFGWTTDTRKVTVRLDDGRLVFTSNYQVRIAAVTNGYAELLGFTQIATTP
AKLTTGATTSSRPYAIDASGRGSVVNLGKANNPSGAISIAGAIRGHSAVN
MYAGNNPSGGAAVSFLATSLIETLSGSMIMSPAGAVTLEGDFIARGAGSD
IIINATGTLNLKGNLTAQSDIIVTAASTVLAGEKSITTYGTSTFTTLDAD
SRIVLVGTNDVEINSVIGKGNPNLAQVQIGSTDGNLRVVQGSGWIETGAS
MSLSGKNVDIAGVIRSNKDTAVTYDREVTIQATEDVYLHGALGVMGSLFI
KAGDDITIENMAIAAQASGHSMELEAGDAITLGGTTVGTAVILEANKLLS
LKTTGLVTLYENAQLYTSGDNSALTVEGQMIEARGTLRVGANHPYTFNPA
SEVMAFNAADSVTYTGKGGSLTLKATKDVVLGNLTSGFGGVLFATGAIAV
QSGSGSSGVGFDMSTASQIKVDATGYGAWSESTVNASPWKIVDGVTYTIA
IGGTTVATATATSESTINTVLNALVQQIEDHASYAAVRAGDVITITNNDG
TLLSQTVTATTSNVPSVGTAATVVQGNSGSSTQATVDTSSWTIVAGGRYT
ITIGSGTSAKEYTLTAAKDYTLAMVTEELVRMIEEGALYTASNIGNVITV
QNTLGGAILDVTLAASATSASGSAVVTAGTAVLADGQLSIISDGDILLRG
AVSTVDVGSDMYIRSRSLINVGGLITAQQSITLRGGMDSTKVGIWVQELK
LDGSGNYLSGGTLDTASGGTIDMEAVDSVVITGVLGQRTITDGDLGGAKV
GDIRIESLSGDVQLLRNTNVRDTLTVAGSTIGVLSGSYVYATGMESSLYL
NARSSLTLSGRAVQAGLDPAIAKASRLVHMVAPTMTINGTIDVTSLTGRV
LLSAGSSVTVGGTVVSKGSIAIHAGVDLVRWDRARMEATVTRADLTGGSI
EVKGQGLLSAVGTITLLAGGNVTLDADASVASLENVLVPVYSTSEKEVQV
VVDTVKVSDGVVLVPEITWVPTEITEQVGTDLVVVGSRYETMDVQLSQIG
YFNPNAPDERKFVEVLIEGVHYLNDNTRAKTAPSYAVQVTWSNAGNEQVP
TRSATGVTGDYTSSNYRGFQQLSDAQKWAVFNSTGYMPLYEFGYTNWKLN
QTINGTASQLSEGYVGSDGKALYPSWKPNGVLNTKKVFYVDVANWRDKYV
YMPVGAQEAILSVASYGEATYLTDETATTDATGVTMTGDLDGSNSGASWK
TLDEVANPTGELVGRYYESADVKYVQKDSAFTSSTIMGGTDLDGKAASWE
VSYANNGKRVYEVSNGLTSLFSNPLDDFTLAQAPTWKLEAAASKYGDDNN
NTAGASGANGYINWVDWTSYTQNSGTNSYGYGSAGGVDVRFAGEGLGFKL
GDKSWSSGTYTDSNTSDSIGVNNRPSGSSDEYISFWGGNLRGAVYFSKPV
VNPVMAIMSLGQPGDPASLWFGDEEFDVVTGYTNGGWGSGSIHEGNGGYV
YNSGEGNGVILFKGVYDHIDWSISDTEHYGNFTIGFDGIAPSTTGLRATD
NIYAPGSYITELASNTQSITYNGYSYTRYNQKVGYAERLADFYAISGTVW
DDPGYGTGDEGWGYIQSYGYLPLNDTVDAINLWDNAHHITVWYHYDWNSA
TYTFIPGNTGVEADGDVPNVNTATGSDEWGNNMSMYMVWGNRFEDFKDYG
YNWVSKWNPMYDQRIQLSYHLSTQAEDIYDYRPVYKTSTQMVKVEKMKSV
TVWRDEPVYAMQMQLVTDVTYEAVVGRSNNGAADSLSATNIVIDAGGDVN
ISGKMSAKGNFTIDAQKQFTLQGKSVGGAPLTSTLKATTLDVYAKGVMLL
ADSAKLVAAQVGATVLLDSDQGLTIGGIIGSQSGTTFATVALSSDRNINL
SGSIDAGAITVTAGAGSSGDGAVVADSETVLRAATGNITVSTGQYGGNIA
LDRVTLIASGATATISLTATSGALEQTKIDGTANGVAVKVIGGMVRAANL
VAKAETSIVLQTEVSTITEVSLNGSGNVEIVNSGNLVVTKAEATDGTIDI
RTFGTMNVVAATTLGNSNSNDIVLTTIQAPVTSGSKSAATLTLGNITNAG
RGDVVVTAEGAVLQSSGTQLVADELTITASMVGLLPIPEKLIDLATKVTT
LIITTAGEGDVRISQDAAAASVAVARTLTVDNTTISDGDLAITAKGSVVL
LDVTLAANKDTNELTVDADGNITVDYATVGIYLASTAAAKGSDYNDDGDY
TDSVKESDITGVGAPAEGATDLRVKRDLNNDGDTLDTLVEVAPPTVVSSA
GNITLTADGTIGQNVTDTAIDLIANTLTLRAGSGISLMQVAINQLNAETA
AGDIVISDADGELETSVGMEVMRAVTAKTATANTLTTTVDITVYSQLRVS
ADGLVQGDKVCLTSTTASVAVAKPTSWSAASPATNNSIIHNGGVAFVAEE
DVQLYQFFNAEKWMEYRAGNSFTFGVANYDAAGNFVDKGTVTEKLPTTLS
ADTLILETGGTLSLTGTLTAGKHLELVAGEDVLISGTIAAGYSKSVIDEL
KITAKGERTLLRGNDLNNNGVISGSVAEMLVGLDANKDGDYADTFMEKGF
SFDLNGNGNKTDLVSEVTLNRDINGDGDKLDSIHESAVDLNQDGDYTDTT
VSESDIYGTGDPAAGQPDRRVSRDLNGDGDALDTLSEVGFGLDLNCDGDA
LDTYSEALRGTDLNGDGDILDTINEVQGEQETGYITIQAKALPATNFELR
AKRDIYLALNDSSATVSNLTLTGFIGGLSAFDPAANVEMHIEGALTVLGG
IVRADAEHGGDIKVTAATVNVDGASVFIGDTLQVTATNGIVLNTLINTLV
ASSTDSGNIVVNEADGLTVESVIANNGAIKIFTAGNTYVGEIRNNVDASG
NNIEVRAAGALYVDLIEAASNAGAMKQYGSILLESTDNVQEWHTDQEAAD
LYGYAVKVIVPSTAVGSFTMPKKLTFSGDKGSGTEVEVRVISGAADAFTA
TTEERTLSDDDVRGKGGASVTITTATPITAAQPVKQLSHIRFNTMVTVGA
TYSVTVEGQTVTEVALATDDITALLQRLGDAIVTATQVSSVATLVATVDG
GIGTLYLEAVTANTPFTVGTVTVKEPYTENWTRNAVLNDGAVPEVAAGTS
VVQVSVVEFADSAAMVAGKRADVTLNSHLYSATYGANADVWITGADSKVV
TATVKEWDIASNLGSISPSSVTGTLGTASDRDVTYVTVDTANWNLANNNS
YTITLDTSNTFTFTAGGSSARADLIASLVQQINSNSSYKAAALDKLILIQ
NTADTLDTGNVGTSQTGSTPGTASIGTKTMVRVDASGWTLHNGARYTITL
NTSDNFSFDAVSGSTLIGLVSSVTTAIEYDGSYTATSHGNYILLSNNGYT
LDANNVTTSQTPPARTISLSGVTAEVGARYTVTFTPTSGQAKTFTVVHSD
TSKTVTQRLKEEIDGDGDLEAIFSGSVITVTGGSSLTDSITTKIERLTAT
NDAGKITVTKTTQGGQRVTFTGVDPTADRVFSILIDGTEVGTYTTASGNT
LDTVVTDLAADIDPYATYGATKTYANVTNWTSATAYLTATIQKGEPVAVT
VERPITFAANSSTTDTVAYVLGIGSGNSTTYNAPKNTSGQIIASEFKKQI
AIAPFNLTNTKVDGTTLWIASGAETSDITLTKGGTSQTVKTPEQSAQRLI
LTATSPNAAFVVNQVGITTLINLATVPVKTTTVAASGVKQESVVTFAGAT
PATDSRYSVTVNGNTYSTQTGENLLIKLSGIKRTDAISIKVLDEAGVVKS
DPLSVPAWVNNVRTTPWKDDTTTATPTDDGICLLDLSDMPIGPGYVFVLT
LGNFSYNYTVLGEDADNNSSTPNTLKAGESAAKVVTELVTAVNANSSTTK
IIATDVSFTVASDWAGVLGKLETLIEAGESSLLDSTNTTFDASAKTLTLA
AKTDNTSFTLSADVTATSAIVGNPAQSRTYAGANAYQKTIISFANDAVTT
DTYELTSGVEFSLTMTSQKNYSVTVGQANVTVTNADGTTSTVPTSAVEAT
WSSILSTLATAIQTTENSVVGRTTDIIITYNATADIVAGAPARSMTMVAD
TVNKSFSVSNVEVTYHGVRTVDNAVVESTTDKAVTTSRAQQSTISFASAT
LADTVTYTVSVAGSPYSVKVNDTVNSIPVTASWASILAALQYKIEAGNVV
TVSVSGTTLTLTAKQDNTPFTFNAYGMDAGINTLTQKGDFVLVVPDRPTG
PYSLKAIASSDGANDGSLTVVNLPTHSGESITLEAAKSLVVVSPLNVGSG
GTVTLTSGNGLTLGGTLVAGALTVTAGDDLSLKTQVGSMAINLSSAASNL
TIEQADDLRMVDFSGVTVPPAADYTLTVTLDGTAFTKSATSGTTLAATVS
ALRTLINNHANYDATIDDSNATQINVTKGAGTALITTTLGDGVTGTVSLT
AAVADLTITSLAMNGGDIDIVTDGSLIINGISGSVGKVRIVAGGSVTIKS
MASSANVTIQAGGDVTLGGTAEGWGTIEADTLSVTTSGAITVYEADALAI
SQLESTGKKAVFVQAGGALELSGAVETNSSDAITLKSGGALTVSNSLTCN
FSGAITLEAAAGMTLSDIADVNSKSGAVSLNAGTGALTMAASTMVDAGSG
QMTLSAGGAITLGALRSTYVGTFAITAQSLSAVQDGNVDIYAPNATLVVA
TADGFGSVENAVETKVASLTLSNTRTGTATGAINIEEADDLTITSIVQAA
IGSVTVRTLGGNITVVESGGSGIAATTGAVTLYASGGSVTLGGDGYGAAI
KTTGGAVTVTAESGNILLQSGIRVVGGQDEAGKDLVTGDIILRANSGAIK
VDSSATGWLKDGATFDADVNWAMNSGKFEVEKATGRVYVNNITAFEITQH
PPLVEDGTLRTAGEAYLQTTGGNLKLYAHGVIGEKFTGFTHSPLALFADA
ETIVARSNNRDNVSIITTFTVAVGSEDDGNSAGSRAGATQIITLAGIQSI
TSDMDAGGENMSLSGEDIEIDASIRSADAELKLTHKNPTGQTMVVGDADG
YADVWNLGTDDIGNIGAGFKTIIIGAEGGSNDIIFDSKSEGGLTFNAPLE
INSDGEGGSITINTDIKATSVVIRGSGETTTIQSSDITAEGGPVNIEDSL
RVSGEISITATGGSVGDINFTNGGNGFFIAGNSSSTGDYLILSASDDITF
DNEFAGADAESGADYLSGLTITSANDVTFNKAITIAGNLVIHASGDVIFE
NKVTLLNGGSLTITNANSITFTTTSNITLDNDSTIGNTLAAGGGNLLLEA
DEIDLYVGAAKVQGIGGTVTLRPKDHDMNIAVGSHDYATDDMLNLETTEL
LTLKEGFSKIVLGWQSGVTSHAESGATNVVLVGANTSTPGAALFKDDVEI
YGGFINVADYSSSSSVLRIAVDERLKLDAYSNIDIANDLEADSIELYSAM
GSIAQSDVSDDGLSDEQIRSLELVVTAATGINLDSIETAILDVQNTTSSN
VSLYVNDVRTSGSRLTQTHITGDVSVARLAQAGTGYLSLTTESGTITVLT
GNVSNASYLLLNGDATQSVVHAGSGSVSLTANGIGEDVLLQKDVSSVGNF
TITAADAITTESGVDITATGNASNITLTATAGNVVLGGNITAGTTDSGLI
SATAGGVLTMADGTTINATGTNGRVELQAQGRVSVSEINVGAAASIKSVT
ADIVDVLTAAVNPTANTGYNVDGDAAALTMEAATGVGSAGSAIQTRVAKL
EAHNSGEKGVFVVEATALSITDNPEATTPPVAMNIGGVTANSGVVSVVVT
TGNLTVTDEVKSTSTHANSGNVLLQTVAGSITVLDDVTSKSGNITVFASS
DISIGQAATAAIIKTEATGKTVELEATAGGVTMQAESGLTTTNGAMRVMA
ATDVVVGKLNAGATSGVVSINAGGSITDADADGGSQQVNVTASAVRFYGD
DGVGTSADDLELDVTTVAAKSVTSAGIYLSELSGVTVGTVNAVTINRVSA
AGITSSSVNVDGFVYGEEAALSGITTATGGAVTIDFATGEAGTLLVSQEI
TASGNGHVLLQSTGASSDVSIQNTVNAGTGSISVLTVGNQSYNASGQLLT
NGGTIDVHASGSGSTITMDAASLFDTNGGNIRVMAGNVNGSDATTTAGGA
IVLGVLDAQNSGDQATWGNVSVRSTGGLISDAASSDTTTNIYANNLRLEG
RTAGGVGTGVQHLEVEAIILSASAGTAGIYVADPSAVTVGNIAAQSVNRV
LSTGLLGTAQTDVALADFVSTGNVVLIATGALAINEGDADDMGVSASGNI
LLKSAGNTTDLDINADVESSAGNITLEATRDVLIDADINTTNKTIQITAA
HDVIQAQSVSPYTIGSAGGDVALTATSGSITFEKIDAKGVAATAGNVRLK
AFTTISDGDTTANETEVDIIANGLILEAGTGVGLGSNHIETTVATLSGKT
TTSGGFFVSDTDGITIGSVTVAVNSIGITGVTPTSTTNETVSGISTASGG
HIVVEAAGAFTVSNAVSAGGAGNILLKTTSGTLALNAAISSGTGNISILN
TTSAIEQGAFTVSTDGGTIDMEANGSITMVAGSSLDTAGTTHTAGGNIRL
KSGAGMTVTGIDAGTALVSLLSGGLIEDAGNTLTDVVAGTLRLQATTGVG
KKDDHLETSVGTLSANVGSEGFFVTEATAVTVGQTAAVTVKRVNADGSTL
TDTTDAAQSNLVSTGHLVLVTTAGSVTTLSTGALTATGNMLVQAVDAEAD
ITLGAAVSSSGAASANINVAHGSDTTYDRTIDLSNLSVQSNTTYSVIIDG
KALSYKSGTDDALNEIGEGLKDAIDADSYVATYDGNTHVITITSGAGTST
ISVSIAASISLNAGHDIFQNSTITTNGYAGTVDLRAGHDITMANGTSTST
NDGNILVYADGTVKLGLLDVRTTGDRSGNTLTKQSDASNPWGSVSVTSTA
GSILDNNGTAVNVYANELKLTATPAGTGAVGIGAEHLETEVATLSANVGS
GGLFITEATDITVGQTATVLTNRVSGTASVTDSTESATTQSNLTSAGHVV
VQTVAGSITTVVTNGNISAAGNILLNASETATATVAAMTLGGTVTTTAVS
NGSISLTAKDFIHQLETGDITAGDSGTVELSVSTTTSSGAITMDDGAVTA
STSGNIRYSAVSSMTIGSITTSGDVSLQATTITDSGTSDTDVSADELRIV
TTSNIAGAGVGTRTKHLQLGVTKLAASVAGTVDTTTTSPTYGSGGLFLTE
ADAITIDALSAITVNSVLATGSLSDPQLSDISLSDVVSAGHLVLVTTAGT
ITINEGDSDDTGISVAGNMLLQSGGNASDITLNADLRNSAGNISINAGRS
LLQNADIATSAANMTIDVVAAQAITMSQSGSNTVSITTNNSNILLQATAG
DITLETINADSGSVSITATAGSVFDGDANGDSDVDIIADKLLLKAGQTLG
WGENHLETTVPTLTANAESKNPAINAADSANVNSLRTVDFSGMVALTGGV
YSVTIGNTPAFTHTATAGQTLADIVGVLASKIHGATYTAVVDGSKINITA
GAGTVVISGAAVGGVYVTESNGVTFDTVTVNVNRQTNSLNSNYRRTIDFT
NVTVPSGAYTLAVTIDGTTFTKDAVSGATKEQTVAALATLINAHATYDAV
LATGNANQINVTKGAGIVAITTTVSDAVSGTVTVNNADNSNSNYRRTIDF
SGVTVPSGAYTLAVTIDGTTFTKDAVSGATKAQTVASLATLINDHATYDA
VIDTNNSSIINVTKGAGIVAITTTLNAAVSGSVAINNSADTGLEVTNNSA
QSNVSATNNGHVVVVSTTGDIVLTNNVSAAGSGNVLLQATAGALTLNNTV
DGGSGNVTLKASGLISQAAEGDISTTGGTIVVESTAGAITMADGAVAQTN
GGNIRYKASGSITVGVLDARDSNNRSAGTLSNQTSWGSVSIISGSSILDN
SETTTDIYANQLWMSAAVAIGAGDNHLETEVYRVSAKTTSSSIFVTEATA
VEIGATNAITVQDVGVDGTVTAHTDAAESKITSGGALVFQTKAGKLETIA
TSGEISAASNLLLRAGGVYTASVDSSNSKQINLTIGAGTEVISTEFGTGV
TGSSIISNAHATNLDTTRTINFSGVSAASGSASYTVKIGASTFTHTIAGQ
TIEQIVAALVAKINAVSASLCDVTLGALVSSAAGNITVIAGRTLRQSANI
SSSNADKKSIDLLAGNAITMDDGTSIMSGGGNIRLAAKSTITLGVVDART
STGRTGGNVTDQTNWGSISLVSGASILDASATENLATHFYANELRLNAAT
AIGFADNVVNHLETEVAKLSAEARSGGMFISEATAIEITQTAALTVKRVG
IDGTTLTDTTDVAQSDLTTTGSLSALVLQTLNGSITVNGGGDAAGISATG
NILLSAGEGESGDTEGSLVTANIILNASVTSSAGNISLLAKDSITQNATV
GDITASGSSKTIDLQADNAITMYDGAVTTTTNGNVRYEATAGNITVGEII
AGAAESSSAGKVALIATAGSILDISNDIAVDITASDLILTAGKAIGESGN
HLETTIVQLSTLSSNGGTWITESNGVTVTNLSFTVERVIASGALDTTKPS
ATQEDLTTVATTSTDSHLVLVATNGSITIYAGADAATTAVGVSATGNILL
SAGETAEATVANITLSASVTSTTGNISLLAKDSITQNANGDVTTSASSTT
IDVQADDSITMYDGALTTSMNGAIRYQAIMGSITVGEITTGAAASTTGKV
ALLAGGNILDLSSDTSTVDITASELILTAGGAIGKNGSLNALETAVAYLS
TLSSNGGTWITESDGVEVKRITLDVNRVLATGGLDTTKPSSTQEDLRTLG
TDSHLVLVTTNGSITIGGGNDKVGVSATGNILLSAGETLTAEEQAAQTTE
AATVANIILSASVTSTAGNISLLAKDSITQSATDGDITTSYAGKTIDLQA
DDAITMYDGALTTSTNGNVRYQTTTGNITVGEITTGAASTTTGKVALVAG
GNILDIANDTSTVDITASELILTAGGAIGKNGTTIDHLETAVAYLSTSSS
AGGTWITESDSVTVTNLSFNVERVLATGALQTSSKPSASQEDLRTLGENS
HLVLIATEGSITIGGGSDKEGVVAAGNLLLSAGEGATGDTTDTIVNANIL
LNASVKSTGGNISLLAEDSITQSLTDGDITTSADNKTIDVQADDAITMYD
GAVTSSKNGNIRYQAISGSIQVGEIKTGTASTTTGKVALIAGGSILDLGT
DTSSVDITASELILSAGAAIADKDNHLETSVAYITTSSSAGGTWITESDS
VEVKSLSLTVDRVIESGGLHTTQPSASQSNLSSSSHLVLVASGSITTNAT
GGALSAGSNILVKAGGTTSDITLGATVISSGGSISLDAGQNIQQNSTITV
SGGSGTVDLLAGGSIEMKQGSASISTSASNGNILLTATSGSITIETINAG
MGNVALYAANATNGIIYDGDAVDTSNTEIDIMASGILLNAGNAIGLGTNH
LEITVTTLTANAGDGGLFISAEEKVSEGDINRGITVDALTINVHRVDGKG
ETAFTNNNTQADITSTGEGNMVLRSKKGSIILNDGDTNGATVGGTNGFAV
KNTGSGNVLLETALATDDISAYADVVTSTGSVSVLAGHSVEFKTDADILT
QGTGSAGTIDVVAANGGDIVMSSNTVFASTNGAIRLLAATDIEVGVISTA
ASSTAGSGMVSLTATAGSIVDAQHLGNDNNTDATVNVTASGLRLSAGGGV
GQSVNHLETTVGTVSARATSGGIYLLESDGVTVGDVAVTVNRVTVDGSFN
NSTKTDNKQSDLHTTSGGGNIVLVSKTGNIVLNDGTAIADNTAISADGSG
NILLQTLSATGDILVNADLGASITNSISTGTGSVSLLAGHDVIFAATADI
RSQGVGSKGSIDVVAGNVANSSSVKAGSVKMAADSLFASTNGAIRVLAAD
SIEVGILTTAATTTANDGSGMVSLTANNGSIVDAQNLGNANNTDAIVNVT
ASGLRLSAKVGVGQTINHLETEVATVTARATSGGIYLKESDGVTVGDVAV
TVNRVKDDGSIPVALKQTDAKQSDLRTTSLGGSIVLTSTTGDIVLNDGTA
AADNTAISTDGTGNILLQTLSATGDILVNADLGTTTANSSSTGIGSISVL
AGNDVIFASGADIRSQGATSKGSIEVIAGNVVPTEGSANGSVKMASNTTF
ASTNGAIRVLAATNVELGIITTAASATLNDGSGMVSVTATNGSIVDAQNL
GNENNSDATVNVVASGLRLWAGVGVGQTINHLETTVDTVSARATSGGIYL
LESDGVTVSDVAVTVNRITVDGSFNNSTKTDDKQSDFRTTSGGGNIVLVS
KTGNIVLNDGTAIADNTAISADGSGNILIQTLSSTGDILVNADLGASTTN
SISTGTGSVSLLAGHDITFATNADIRSQGTDSKGSIDVVAGNIANGGVKA
GSVLMASNTLFASTNGAIRLLAADAIEVGIITTAATGTAGDGSGMVSLVT
TSATAGTITDAQALVNSANDTTVNVVASGLRLWAGVGIGETVDHLETTVD
TLSARATSGGIYLKETNALDVSDVAVTVNRVKDDGTVASSTQSDDKQSDV
AITSGNGSIVLTTGGNLTLYDGTGTTTGALPLNYVDKAINAIGTGNVRLD
VTGTLTLESAVDAGSGNVTILSTGNQSYEAAGDIFTTGGTIDVQATGVGS
TIGMDADTVFQTNGGNIRVMTGTVNSSGVTLTAGGSITVGVLDARTSADR
GLTTIDDDKRDDQIKTTGGWGSVSIVSTGGSILDNSETTVDVYANELRLT
AQAAIGALGDGTSNALETEVATVTASAGTGGINLLESSAITIGSVTAVAV
NRVATTGVAGSGDQTDVVVQAGVVTTANSSGSIVVVAGGAMTVSNVIIAN
GSGNVRLETTASTMAINAALSSGSGHITVVAKTNLTQLAAGDITTIGAGT
IDVEAGGSIQMTTGAVGADTAVSGAKDIRYQAKGGNLTVGSFSTGTDATT
GGTVVLIASGSIVDGDADVDVTANKLYMQSGSAHAIAGGSDHLEISVNTL
SLSAGSGGAFVTESNGVTVDTVALSTLKRVENTSILTTQSGSWEDLNAAT
TGNLVLDVTSGALVLNAGSNANYAVQAVSGNTRISTQSGALTLNARLDGG
SGNISIISSGNQSYGAAGDVVTTSGTIEVQATGVGSTIGMDVDTLFQTNG
RNIRVMAGTVNELGVTVNAGGAITIGVLDVRTAADRGAATRTDQTKTTGG
WGSISVTSTGGSIYDNDGDALVNVYANELKLSASASGKSVGKSNQHLETE
VATLSGNVGSGGFFVTEATDITVNQTAELTAKHVLLNGTITNANDSASVV
TDSAQNDLVSGGALVLQTKEGSITTAVTNGDIQAAGHILLNASETAVETE
AGITLGGTVTTTSASNGSISLTAKDFLYQLATGDITAGGTGTIDVEVSTG
TSSGAITMDDGAATASTSGNIRYVATTTLSLGTISTLGNVSLTATSITDS
TDDDSENVTDDVDVTAATLRVQTSANGFGEASKHIETTIGTLAATLGANG
NLFVTETDAITIDTVAAITVYRITSEGTAVSTSIQTDNALSDIATGSGHV
VIDATDITVKGGDTASGDNDVTTGIRTTGAGNILLNARSGNIIAQAIING
GTGNISLNAVGSNTTGNITLWNTTSDNNGTAFVGVLQTDNATIDVKAGNI
IDMKDGSTILSKGGDIRFEAVNNINVSYVDATTTTLAGDVALLSTSGSIL
DIDNGTALDVYGAGLLMEAATGVGVSTNHLDTTVTTLTALAGSGGMFINE
TNAVDVDTVTVVVNRVNDQAGTAVESKTLSDLVTISNGNMVLVAGGTITL
KEGDEDNTGVSAAGNMLLKATANDIVINSYVTSTGGHISLDAARDILQNA
NVEAQATTKSIDLVVGRDITMDNGTSTTSANGNILLYAGTGNIIIETITA
GNSTNGYGNVSITAAATSGNTVGKIIDRDVTVAEDSEFDITANGLILKAG
NAIGDGNNHIEVTVTTLTANAGVGGLFVTAKELVTTGTISRGVTVDKLTV
AVNRVGTDAAVPATASGTATVTQEDLSATGAGNIVLDVTSGALVINAGTS
NTNAVTAESGNIRLTAATGALTLNAKLDAGSGNVTLLASGLIEQKAAGDI
FTTAGTIDVESTADAITMVDGAVAQTNGGNIRYQASGNVTVGLLDARLAV
DRPAALTNQATWGSVSIVSTSGSILDNSENTVDVYAKELRLTATGAIGAL
GDGTSNALETEVVRVTAKAGVGGINLLESSALTIGTVTAVPVNRVATTGV
AGNGNQTDVSAQVGIVTTTGSNGSIVVVAGGAMTVSNGVTSDGSGNVRLD
VTGTLTLESAVDAGSGNVTILSTGNQSYEAAGDIFTTSGTIDVQATGVGS
TIGMDADTVFQTNGGNIRVMTGTVNSSGVTVNAGGSITVGVLDARTSADR
GEAISTDDKLLDQIKTTGGWGSVSIVSTGGSILDNSEATIDVYANELKLT
ATPTGSGAVGLYNQHLETEVAKVSANVGSAGLFITESTDMEVGRTVELVV
KRVKNDGTVGSVQTPSTASDPLQNNFVSKGTLVLVTTAGSIETLATGGAI
TATGNMLLQAGGSASDITLGAAVTNTATNGGNISIKAGQDILQNASIIGQ
ATDKSIDLVAGRHITMTDGTNTTTSTTSANGNILLYAGTGNITIETITAG
NSTNGYGNVSVTAAATSGSSVGKILDQDDAGDNGTNPDITANSLILKAGY
AIGLSDNHLETTVTKLTANAGAGGLFVTAKERVSGGMVTVESMTVSVKRV
DAEANVPADPSGTATVTQEDLSVTSGGHLVLDVTSGALVLNAGSNANYAV
QAVNGNTRISTQSGALTLNAKLDGGSGNVSVVSSGSQSYAAAGDVVTTDG
TIDVQATGVGSTIGMDVDTVLQTSGKNIRVMAGTVNELGVTVNAGGAITL
GVLDARSSTGRTNGGVSDQVNWGSVSVTSTGGSIYDNDDDVLVNVYAKEL
KLSASASGKAVGKSNQHLETEVATLSGNVGSGGFFVTEATDITVNQTAEL
IAKHVLLNGTIVNSDTTASVVTDSAQNDLVSGGALVLQTKEGCITTAVTN
GDIQAAGHILLNASETAVETEAAITLGGTVTTTSASNGSISLTAKDFVHQ
LSTGDITAGGSGTIDVEVSTSTSSGAITMDDGAATASTSGTIRYVATTTL
SLGTIATSGNVSLTATSITDSADDDAVQLPSLPDIDVTASSLRVQTSANG
FGEARKHIETTIGTLAATLGTIGNLFVTETNDITIDTVDTIEVNRVTDAG
SITNSIKTDNALSDIATGTGHVVIDATDITVKGGGDTTGITTTGLGNILL
NARSGNITAQAIINGGTGNISLNAVGTNLNGNVVLWNTTNATDGTAFVGV
LQTDNATIDVRSGNAIDMKDGSTILSKGGDIRFEAVNNINVSYVDAVNAS
PERAGDVAIISTSGSILDVDNNTTLDVYAAGLLMQAATGIGTSTNHLDTT
VTTLTASAGSGGMFISETDGVDVDTVTVVVNRVNDQAGTAVESKTLSDLL
TISNGNMVLVAGGTITLKEGDADNTGVSAAGNMLLKAKVDDIDIKSKVTS
TDGNISLDAARDILQNANVEAQEITKSIDFVAGRDITMDNGTSTTSANGN
ILLYAGTGNITIETITAGNSTNGYGNVSITAAAIPSGGNSDVGKILDRDG
TAAEDSEYDITANNLILKAGYAVGDGNNHIEETVTTLTANAGIGGLYVTA
KELVSGGNVTVDKLTVDVNRVGTDASVPTTATGTATVTQEDLIATGAGHI
VLDVTSGDVVLNAGTSGTNAVTAVSGNIRLIAAAGALTLNAKLDAGSGNV
TLLASGLIEQKAAGDIFTTAGTIDVESTAGAITMNADAVTQTNGGNIRYK
ANGTITVGLLDARVSDDRTPTAQLNAQSTWGSVSIISGASILDNSEATVD
VYAKELKLTATPAGTGAVGESTNHLETEVAKVSGEVGSAGIFITESTAIT
VGQTASLSVNRVLPTGLITKSDNTASVETDAAQDNFVSKGALVLVTTAGS
IESKATGGAITAAGNIFLQAKATQNATYDITIGAAVTSSNGSISLDASND
IKQNSTITVSGGSGTVDLLAGHDIVMQQTTSSISTSASNGNILLTATSGS
ITIENINAGSGNVALYAANATNGFIYDGDDAGDSEVDITANGLILKAGNA
IGSGTNHLETTVTTLTANAGVGGLYITAQEKVADSGITVDILTVNVNRVD
DKDATASTNNSAQVDLTSTNAGNIVLRSKDGSIILKDGDSNGFAVKNTGS
GNVLLQTTNSGSITANADVVSTSGNISVLAAQSVTFTANADIRTSSTSTI
TGTIDVVAGSGSITMSDSSLFTTSGTNGDIRLLASQNVIVGDIETTTADV
SITATAVSITDADALVGVANDNDLDITASGLRLNAGIGIGEVVDHLETTV
GTVSARATNGGIYLLESNGVTVGDVSVTTNRVGVTGATTTANSSDLAQSD
LRTTANNGNIVLVAGGDLVLNDGTATADNTAISANGSGNILLKTTSGLLD
INAAVKSGTGNITIWNTTGAIEQDAVTISTNGGTIDIEATNATNGSITMV
AGSTIVSDGTTTAGGNIRLKSGADMSITGINAGSANVSLLAGSFIKDIGE
TTTDVVANHLRIEAGSWVGEASGTNLGLLDISVTRLSVRAGNSMYINELS
DITVDTTDAITVQRVLADGSVLNSVKTDGKQSDLVTTANDGNIVLVAAGN
LTFNDGTDVLAGENVTEDNTNGEVVSANGNGNILLKTTSGTLAINSAVKS
GEGNISIINTTGAITQGAVTISTDGGTIDIEATAGAITLVSGSRIVSDGV
STTDGNIRIKSGADMSITGINAGAANVSLFAGSFIKDIGEAIVDVLANHL
RLEAGSVIGEALGTDNGLLDLSVAMVSVKAATAIFLKETNGITVGTTSEI
KVKRVGANGGTTDDNTFGAAQSDLQTTNNGNIVLVATAGDITLQAGAAVD
PQSNNFAVSANGIGNILVQAEVGSVIAEANADVVSGSGSISVIGKTNVSF
NSDGADIRTSGGGTIDVLAETGKIEQSATSLFTTGTGNIRLLAGTSVVVG
DITTGGSVSVIATTGSITDADSADETTADNDIQAVGLRLWAKSGIGTNSN
HLDTSVDNLSAYVDAGSMYLLESNGVTVQSVGVSVNRVVAAGTASVVDET
TDSAQSDLRTNSNSGNIVLRASAGNIELTDGIANSGTAGIAGTTVRANGS
GNILLDAISGSLAVKSDLSSTTGHITLHANDSISLTSDVDVTTATSGTIS
LQAKHGEISMVSDATVMASNSSVRLAAHQDILLGDVAAQNVSLISAMGSI
HSAASNIQNIAATNLRIEAQQAIGKSDLHIKTAVDTLTAKANGTVTSGTA
ETGIYLTEANSITVDTVSVSVTEFSATATTSIVKDSSQSDLVTGNNGNIV
LVADGKITLNDGTDIASPFEDNTDGKAVSADGSGSLLIDANSSNLLIYSD
IESGTGHITVKAAIGVEIGSSSATEVDISTATMGTISVDAEGGELKMAGD
AEIKATSSSVRLNAASDVTLGNIVATNVSVVADSGSIINAAGSSKNVTAT
NLRLEAKQAIGAPTNHLTTDVTTLTLFAAGTVASGTPLSGSYISEVSDVK
IDTVTVTVTEFTHVALTNDVIDAAQSDMVAGNNGNLVLTAGGTITVNDGS
DNDSLGVEAGGNIRLEATESNESVESNIKLSSGVVSNGGNITLLAKDDIA
MDVTGDITTQSDGKTIELQADGTIRMVDGTIIESNNGNVRLTALTDDITV
GEIKATTANVAISAKVGNIFAVDSSNKNILAKDLILNAGEAIGKNDNYLD
VSVTNMATASGSGATYVESNGVNVNLGGLSVLVQRVMATGSTEDSSTSTQ
NDFKAGDDIYLVATSGNIVITANNENALTQAKNIVLIAEQGNIIVNTGAA
NQGFSASESIKLIAEAGKITINSTDANSAGLVARKNILIDARETVEDTDA
TLVVNAKITSKEGYISLLADDSITMTVFGDVTTETSGNTIDIEANDSIAM
SDGSLVSTSNGTVRYQAFVGNITLGEINAGSGNVALLAGGSILDISNDTS
SVDITANELLLQAGAGIGTDGITVNHLETSVDRLSVKSTTGSAYVTENNS
VEVGVVTVTVSRVQENDTVQALSADTLSGGESDGNLVLVTNAGTIETLAG
GGTLTATGNILLDAKANLMLGAAVSSTGGNVSLVSGGNFEQGAVGDVSAA
AAGTVDVRVSGTMTMTDGAEITSGSGNIRLAVTSSLQLGALSTSGDVSIS
ASMITDAGSSTSDTVNISADEVYFSSTSNANGVGVGTGSNHIELNASKLA
ASVSGQGGMYITESDGLQVGALTAMNVKKVASDGSSTASTADTAQSNISS
DGNLVIVTNISNIETLATGGAINAAGNMLLDAKANLRFGAAVSSTGGNIT
MVSGGNFEQGAVGDVSAAAAGTVDVRVSGTMTMTDGAEITSGSGNIRLAV
TSSLQLGALSTGGDVSISASTITDAGSGASDTVNISADKVYLSSTSSANG
AGVGIGSNHIELNANKLAADVNGTGTGGLFITESDGLQVGALTAINVKKV
ANDGSSTVSTSDTAQSNISSDGNLVIVTNAGTIEMLVTGGTLKAAGNILL
DAKANLMLGAAISSTGGNISLVSGGNFEQSAAGDVSAAGAGTIDVRVSGS
MTMTDGAEITSGSGNIRLAVTSSLQFGALSTSDDVSISASTITDAGSGAS
DTVNISADKVYLSSTSSANGAGVGIGSNHLELNVNKLAADVNGTGTGGLF
ITENDGLQVGALTAINVKKVANDGSSTVSTTDSAQSNISSDGNLVIVTSA
GTIETLAVGGTLTAVGNILLDANGNLTLGAAVSSTSGNVSMVSGGNFEQG
AVMVSAAGAGTVDVRVSDAMTMTDGAEIKSGSGNIRLAVTSSLQLGVLST
SGDVSISASTITDAGSGASDTVNLSADEVYLSSTSSANGAGIGSGSSHLE
LNANKLAADVNGTGIGGLFITESDGLQVGALTAINVKKVASDGLSTVSTN
DVAQSNISSDSNLVIVTTAGSIETLMGGGTLTAAGNILLDAKANLTLGAT
VSSTAGNVSMVVSGNFEQSAAGDVSAAGAGTVDVRVSGTMTMADGAEIKS
DNSNIRLAVTSSLQLGALSTSGDVSISASTITDAGSGTSDTVNISADEVY
FSSTSSVNGAGIGTGSNHIELNASKLAADVNGTGVGGLFIIESNALQVGT
LNAINVNLVATDGTVSLVTQTTDAAQSNIVSDGNLVIVTTAGNIETLASG
GTITAAGNILLDAKTNLILGAAVSSTGGNVSMVSGGNFEQSAIGDISAAG
TGTVDVRVSGAMTMTDGAEITSGSGNIRLAVANALQLGALSTSGDISISA
STITDAGSGASDTVNLSADEFYLSSTSNANGAGVGTGSNPIELNVSKLAA
SVSGQGGMYITESDGLQVGALTAINVKNVASDGLSTVSTADAAKSSISSD
GNLVIVTTVGTIETLAIGGAINAAGNMLLDAKANLMLGAAVSSTGGNVSM
VSGGNFAQSAIGDLSAAGAGTVDVRVSGTMTMTDGAEITSGSGNIRLAVT
GSLQLGALSTGGDVSISASTITDAGAGTSDTVNISADEVYLSSTSSANGA
GVGTGSNHLELNVNKLAADVNGTGTGGLFITENDGLSTLSTSDIAQSNIS
SNGNLVIVTNAGNIETLATGGAITAAGNILLDAKANLMLGAAVSSTGGNV
SLVAGGNFEQSAAGDVSAAGAGTVDVRVSGTMTMTDGVEITSGSGNIRLA
VTSSLQLGALSTSGDVSISASTITDAGADASDTVNISADEVYLATTSTAV
GAGVGSGSNHLELNANKLAASVSGQGGLYITESDGLQVGALTAINVKKVA
NDGSSTASTADTAQSNISSAGNLVIVTSAGNIETLAIGGAINAAGNMLLD
AKANLVLGAAVSSTGGNISMVVSGNMSQSAVGDISAAGAGTIDVRVSGTM
TMTDGAEITSGSGNIRLAVTSSLQLGALGTSGDVSISVSTITDAGTGASD
TVNISADEVYLATTSTAVGAGVGSGSNHLELNANKLAASVSGQGGLYITE
SDGLHVGTLNAINVKNVANDGLSTVSTSDSAQSSISSAGNLVIVTNVGTI
ETLATGGAITAAGNILLDANGNLMLGAAVSSTGGNISMVSGGNFEQSAVM
VSAANAGTIDVRVSGTMTMNDGAEITSGSGNIRLAVTSSLQLGALSTSGD
VSISASTITDAGTGASDTVNISADEVYLATTSTAIGVGVGSGSNHLELNA
TKLAASVSGQGGLYITESDGLHVGTLNAINVKNVANDGLSTVSTSDSAQS
SISSAGNLVIVTNVGTIETLATGGAITAAGNILLDANGNLMLGAAVSSTG
GNISMVSGGNFEQSAVMVSAANAGTIDVRVSGTMTMTDGAEITSGSGNIR
LVVTSSLQLGALSTSDDVSISASTITDAGLSTSDTVNISADEVYLSSTSN
ANGAGVGTGSNHLELNATKLAASVSGQGSMYITESDGLQVGALTAINVKK
VASDGSSTVSTSDSAQSNISSDSTVVIVTNAGNIETLAAGGTLTAAGNIL
LDANGNLMLGAAVSSTGGNISMVSGGNFEQSAVMVSAANAGTIDVRVSGT
MTMTDGAEIKSGSGNIRLAVTSSLQLGAISTSGDVSISASTITDAGTGAS
DTVNISADEVYLATTSTAVGAGIGSGSNHIELNANKLAADVNGTGTGGMY
ITESDGLQVGALTAINVKKVASDGSSTASTSDTAQSNISSDGNFVIVTNA
GNIETLAAGGTLTAAGNILLDANGNLTLGTAVSSTGGNISLVSGGNFEQS
AVMVSATGSGTIDVRVSGSMTMVDGAEITSVSGNIRLTVTNGLQLGALST
SGDVSISASTITDAGTGVSDTVNISADEVYLSSTSSVNGAGIGTGSNHIE
LNASKLAASVSGQGGMYITESDGLQIGTLDAINVKKVSSDGLSTVSTADT
AQSNISSAGNLVIVITVGNIETLAVGGTLTAAGNMLLDAKANLMLGAAVS
STAGNVSMVVSGSMSQSAVGDVSAAGAGTVDVRVSGTMTMIDGAEIKSGS
GNIRLAVTSSLQLGVLSTSGDVSISASTITDAGAGASDTVNISADKVYLS
STSSANGAGIGTGSNHLELNANKLAADVNGTGTGGLFITESDGLQVGALT
AINVKKVANDGSSTVSTADAAQSNISSDSNVVIVTNVGTIEMLAVGGTLT
AAGNILLDANGSSSDVVIGADIKTPTGHITIKADDSIELASDVDITTATA
GTISVDAEGGTLRMAGNSTISAVGSSMRLAATGTVTVGNTTAEFVSIVSR
RGAIINAAGSTRNVTASDLRLQSYGSIGSANRHFTTQVVNLSIDPEEEGA
GIYLEELDDVVVTTVRVDVTEMTSVADTLGISDQSMADLVTSSNGTIVLV
TIDGSITLTDGDHNGVSISADGTGNVHLEANGADNNVIIEAAIQTDTGSI
TIVAAGDVEQQANIVTNGNLVSVQAEQGSITMDQNVQTITNNGTIEYRSY
EDVLLSLLHAESGSVAVYAETGSIENNTTSNTAPNVTSETALFKAGADVG
LREIQPVVISVERVAAEAVTGEMSLVNLGTVVIDVLEDADGNMVSGLSAG
DGISLESLQGSIVVAAPVDTKGTADALLTFSNGQLIGKSAYFDDAGTFLK
MQYKQFQFLWNGEGATIRQELLNMVVGRQVDSDIARYRESASERQTVSPA
RSTMPMRSYDPMESLRHVDVDVLEEQPGYVEVHNGYAFFRWAEVPGAQSY
LLVLERDKLEYASRWLEETAWAPFEELPEGIFEWSLYSWTTDGLQLVFGP
MQFTV
>Cag_1053 Filamentous haemagglutinin-like
MNRVFNVIWSITREKWVVVSERVKSNGSVPKSSLVSIAFLSALLGGGSVA
QAVDANQLPTGGVIAAGSGSIAASGNSMTIQQSSQKMVANWSSFNVGSDA
SVRFQQPNASAAALNRIAGQSPSQILGSLSANGRVFLVNPSGIVFGKNAR
VDVGGLVASTLNISDNDFLAGNYAFRSTGSAGTLRNEGVINAMPNGVVAL
LSPSVVNNGTINAAGGTVALAAGNAMTLDFGGDGLMTVRVDEGAVNALVE
NNALIKADGGLVVMSAKAADELALSAVNSSGVVQAMSVVEKNGRILLDAE
GGQSTISGTLDASSVDGKGGQVVVTGKQVMVADGAHLNASGLTGGGEVLV
GGSWQGSDASVRQAVGTVVMPGALLQANATGNGNGGTVVVWSDVNNPLSV
TRAYGTFEAYGGLLGGNGGRIETSGHWLDVAGSRGGASAVNGNAGVWLFD
PWNVIIGPDPTTSGTSFTNPFNPTGDSTILASNINTLLNAGTSVSITTGT
GGTVGVGDISVNAPILKTTVTGLNTLTLSLIAEGNIFINNSIGNSSGTLN
LNLTTVNGAISGTGNITGNGNGDTIFTVGAGSGTYSGNLVDRRFVEKKGV
GTLIVSGDNNHDGETRISAGTLVVQSSTALGKTTNGTQVVDGATLQLEAN
IAAQELLYLAGDGVNSNGALKNIGGNHVYGGDIILLNNSRIMSDANTLTL
NGSVNGAYSLTVNSVGSTIFNGLIGNSAPLGAFIGTAGTPITFNGSSITT
VGAINAAGVVTASNPLTISAGAGNISLSNTGNNFNSVNITSAGTVSLVDT
NALALTGVNATGDVSIATRSGDLTIDGHLLTTSPTSSAMILNAEQAQIAG
NGNGGNLVFSSGTLTVGSGGIATLYTGSVAGSTSIASVVNAGHFRYNSDE
AINGTHYTDPLTAGLNLIYREQPTLLVAPAATPTPYGTAPSYTPSYSGAV
NNDPTVGTVAGTPQWAFDNATIPTKSLSGQDEVGTYNVKYVGGLTSTLGY
GFADNGGNGELTIAPKEIVFGNGLTGGVNNKVYDGTLTGTITPLVLYVVA
GDNVSLNSTGATATFSNKNVGVGKTVTVAGLALTGDDAGNYSIGNQTTTA
NIIQASLTVTAPGNLTKVYDGTVTAIGVATVTGLVSGDTVAGTVAIAYAD
KMAGSSKAVNPLSVMIVDGSDMNMTGNYNIAYVPTVNNTITQASLTLTSP
DNVSKFYDGLMSAPGAPMVTGLVPNDVVVTPAPLSYNDPEVGNNKTVSPN
PAGLVIHDANGGDMTPNYVITTIPRNDGVIVEKTFTPYKEWNDIDPSTPE
VPTAAPEVSGNRDLGDVELAADDGGTTATRSLAMVAMDETAIQSDIVVTL
LEPAAKNKQGVVKVFVPKEVLAKPAFLFPLPDDVATAINQTAVQERVFLQ
NGDALPGWLSYDRDKKIFTAKSAPAGSLPLTVMVQAGSMAWQVIIQQ
>Cag_0986 outer membrane efflux protein, putative
MKHLRTWINQRKRTFYNISSTLAFLLTPLPALTLMAVSLQVYAGENATPT
RLTLEQCITIALERATPLKKADNNLTLQGTDVLQRYGSFLPRLTLSAGYT
PVQQQKSYTTLSGTMPPTLLTTESDALSMQLTTSLNLFNGFGDMAALQAG
LNRRDAARLSVARARETVVYDVTQAYYQALLDRELLLIARENLQASRDQL
TLTERQYQAGLKSLIDREQQAAETADSQLRVMKAESRAEQSLLELLRRLQ
LDPLTSLELQTAADVVNGDAPYTLAADELIARAREQRNDLKSQQAQSKAN
RWQEREAAAQRYPSLDLNLTASTSATGDVEQRIAGIEKKYSYPPLSDQLG
NATSYSVTLSMNWVLFDGFRSRYSLQSAHLNYLNQQLDVEDAKRNLAIDV
RKAIAEYDAARQQISAARVSLQAASAAFNGIKRKYELGAATFVELSSARA
ALFNARSSLSQATYSLALQKNILDYVSGSTSFSK
>Cag_0856 conserved hypothetical protein
MDRITKRLLLAFVLLAAAGGCVHAKETIVLQQGVDTFKEKKPAWFDYLPV
VSGITPVIIFLYLRKRRIKDELEKKEALSIAEQKAKKKYIDIENNKYAER
YQVALAKELDKSNLPASNALDSFSVKLTDTFVSLRLSETWKCDTKFIPDQ
SQDMLKEKHRVRTPEEVMGLVFEKFSLMLVIGDPGSGKTTLLRHYVLTCL
QKDGYNALGFTEPVMVFYLVLRELKKSGSNYASLSDNLYAWSEEHQLGIP
KALFFNWLHNQKTLVLLDGLDEISDVDDRISVCKWIDKTFAGFPKAYVVV
TSRTTGYRKGDGIEIVSEHVRVDIMDFSQSQQAEFLKKWFTAAFIRDQPL
DGVSQYQQKQSEALEKAATIIKYLNKAENKSLQSLAGVPLLLQIMATLWK
DREYLPGSRVKLYDAALDYLLDYRDRQKMINPLLPSEDARRVLAPISLWM
HEELKKDEVYKAELHMRMQYKLQTVKNAPSAEAFCKNLVERAGLLVEYGD
SEYVFRHKSFREYMAGVQLKEDHPDKQIDKLVAHFGNDWWEEPLRFFIAQ
VDENIFDLFMQKLFDSSVSEKLSPKQQDLLATLIKEARQTKIDALQVKLL
DPRTTPRKQRYILDCLKTISIGNQAALEVIRTFIETGITKDVEIVLKAAA
ITRKKDISDTIHVLLDQQGAQYILIKGGVFTYSVTKQQEAVSDFYISKYT
VTNQLYRRFISYLDAKEPEFEQILSLDAYKESLYAMAERIKGFSDYLQAE
TLLAGCICSHYANDKRFNQDEQPVVGVTWYDAKAYCLWLSLLESNSCDAN
LYRLPTEKEWEYAASGKENRTYPWSEADPTITCANYNQNEGVTTSVGCYP
DGATPEGLYDMAGNVWEWVEFLCDRDDGWRSMRGGAWNHLSNTLRCSARL
VTYQPNRVENNTGFRVILSGHAS
>Cag_0389 Peptidase S14, ClpP
MANINFGFEHHAKKLYSGAIEQGISNSLVPMVIETSGRGERAFDIFSRLL
RERIIFLGTGIDEHVAGLIMAQLIFLESEDPERDIYIYINSPGGSVSAGL
GIYDTMQYIRPEISTVCVGMAASMGAFLLASGNKGKRASLPHSRIMIHQP
SGGAQGQETDIVIQAREIEKIRRLLEELLAKHTGQPVEKVREDSERDRWM
NPQEALEYGLIDAIFEKRPTPEKKD
>Cag_1907 ExbB/TolQ family protein
MSLDAPSGIFALVADAGAVVLVVLFTLLAFSVVSWAIIAYKAIGLRAARY
ESKLFMDAFFDVAPERLFAESERLSGAPLARVYRAGYIAFRALDGKNVTF
KQAQAVVARAIKRATNAETKQLASLVPFLATVGNTAPFIGLFGTVWGIMT
SFQAIGVTRSASLSAVAPGISEALVATAVGLAAAIPAVMGYNYLTQQVGL
LERDIEEFAPEFVTALINEP
>Cag_1560 VCBS
MRCHLQSIKKFPTLTLYNLHAFFHINFLTIMAINTPSSLVRRELFIFDAS
VSNVATLASALPANSDYFVLDSTRDGLGQMADVLAGQTDIDALHIFSHGS
AGLLRLGNSSLSLANLNNYELPLSQIGSSLSPSSDILLYGCNVGAGDDGQ
QFVATLAELTGADVAASADVTGSAALGGDWELEVESGVVENEPMAVAGFE
GVLANSIPTISAPLATTVAAGDSPVSLNLLANAHDDDLTDTLSVGNVSYT
VNGVPSALPAGITMNGNALTIDSANTAYNGMAQGEQKTIVVTYKLLDSYA
NAEISFATKVDYAVGSGPVGTTSADVNGDGELDLIVANFQSDTVSVLKNN
GDGIFATKVDYPTGSCPQSVTSSDVNGDGKLDLIATNWGSDTVSVLENNG
EGTFATKVDYATGYSPWPVTSADVNGDGKFDLIVANFYSNTVSVLKNNGD
GTFVTKVDYPTGLSPLSVTSADVNGDSELDLIVANMYSDTISVLNNNGDG
TFATQVDYPTGSFPYSVTSSDVNGDGKLDLIVVNYYSNTVSVLNNNGDGT
FATQVDYPTGTWPSSVTSADVNGDGKLDLIVANAQSMVSVLKNNGDGTFA
TKVDYPTGLSPYSVTSSDVNGDGKPDLIIANRDSATVSVLINNSTGFSSV
YPTTTATITITGANDAPIVDVTDVIGTVTKPVPPIGNLTDSGTIHFTDVD
LSDSHSISSVTPSAGVLGTLTSTITADTTGTGLGGAITWHYSVAASAVEY
LAEGEHKVETFTFSLLDGHGGSVERTVGVTITSPNADTILPTLSNSTPAD
AATAVAVDSNITLTFSENVQASTGNIVITNGSDTRTIDVTDNTQVTFSGN
TVTINPTADLQAGHHYHVEMANGAITDEAGNAFAGISDVTALDFTTKGNV
APHIFAPVSLSFADKIDYVTGAQPNSVTAADINSDGNVDLIVANWGGNTV
SVLNNNGDGTFANKVDYTTGSGVISVTNADVDGDGSVDLIFANSISNTIS
VLKNNGDGIFSPKVDYSVGKNPWSIISTDIDNDGMPDLIVGTNGHDMPWD
MGLAQICNAISVFKNNGDGSFASKVDYAIENAFFSVASADVNGDGQTDLI
GANWTTGGLSILQNNGDGSFASKVDYAIPNSFYSVASTDLNSDGKPDIFG
SNLAVNGVSILQNNGDGTFASKVDYATGSNPWIVNSCDINGDGFSDISVV
NTGSNTVSVLINKGDGTFLDKKDYSTGNMPFGLSSADLNKDGKSDLIVVN
SSDSNTVSVFLNSTSSVLTHFTEQTPVAVCSDISSSDPDGDASWNGGALT
IQVTANAEATDTLSIATTNPGGNGVWLDTTIGYKLMAGTTEIGSANAALV
SNGSTLSFSFNANSTNAMVQDVARSVTFNNSSDTPSELERTVTFTVTDNF
GASASVEQIITVTAVNDPIDSISPVLTSSTPSDNTTGVAVSSNITLTFSE
NVHAGTGNITITDGTDTHTIAVANTTQITFNGKTVIINPTKNLQEGHHYH
VEVANGAIKDLAGNAFAGINDATTLNFTTVKSDSDHHDLTGTITFWKTGQ
ALSDVHVNLMPTASTGTAHLIDFRNIELHADGSRTVEIWKTATPTEAENV
DFELELQAGSTATWQSMLPNGWLSADGADGNLFSVQAAGLNAPLSANAVQ
LGVLTLTQPTDTQTFSLSLVDGIVGTQEATPFTLHSEQTISDAAGNYFFT
NLQESNYTISANKEYNTLHNAVTSADALAALKIAVGLTPNEDGSAILPYQ
YLAADVTHDGRVRSTDALTILKMAVGYEGAPENAWIFVAEEDVLATSMSR
KAVDWSIEKIDVPLENDTQVDLIGIVKGDIDGSWGMVG
>Cag_0627 outer membrane efflux protein, putative
MLHHKKRGVVTFTGKQLLVVVLLFLLPFAGVQGAENSVVKSGNAVTLEEA
LQIGLQRNRTLEVARLDRDIAHQKIRETWADVLPKLTLSGTYTRSLKPSV
LLLPPNPLFPSGELQTSSDNAAFVGLDLRQPLFNASAMAGIRAANIVRSL
SDASYRKTEMAVLTDIKLAYYDVLIAREQVKLIEQSIARWEQSRRDTRAL
FRQGIAADIDTLKAFLSVENLRPDFIQAESRVASAMTTLKNLMGVPADSA
IVLSGKLELPSGTKASYPATTELAAREAFEQRPDLRQIALQADAEAENVN
SLKAERYPLLSLFGKLEAQTSFNDGINPSESRWPVSSSAGVQLSLPLFTG
YRTSARIEQATLSRRQTLTRLEEQKASVRAELETALLHLHEAQQRIEVQS
KTIAVAERSYTISRLRFREGIGSRLELSDAELQLVKARTNYLQAVYDYLV
ATTRLDKSLGRRSALLPLTR
>Cag_0041 outer membrane protein, putative
MKQNISFHKKISATSLALLLATSSMSYAVEPTSSPSTAFAAPSVTPLTPL
TLAQALQKMQAHYPALHAASEEVMAADARVRQSKSSFLPQVTANAGYLWR
DPVSEMSFGGGTPMQFMPHNNYHATVSAEAILFDFGKRSRELALAQSGTR
TAEEQVALSRREAAWQVVQLFYGILFLQEEQRVQQKEFQALNKALEFTTK
RYQAGTATSFDLATTKARLAALQSRMADSAHALERSEMHFCRLTEMNATQ
PLALQGSLMASVAPSSNQAQLTEQALKNRVETRLAREAEAAAGQRQALAS
KGGAPQLRGNVAYGVANGYQPDIDEIRTTLSAGVTLDVPIFSGFRTTARQ
QESAAALRAATQRRLDAEAQAATEVAELLNALQHNGEKLNATAMQAEQAS
LAASHARARYENGMATTLDLLDTEAALSQAELARLQAAYAVTLNRYALQR
ATGEVFW
>Cag_1447 SMF protein
MDILNFLMLSQVPGIGAARIKALLTHWGNLSFLQHATIADLTHINGIGET
LATELYNTFHNAAKNDTVRRAAEAQLLALERCNGQVLTLLDEGYPPLLRE
IYDPPPCLFIRGTLPPNTEKSLAVVGTRHASAYGKQVTTHFCHAIAKQEM
PIISGLAYGIDMAAHQAALDAGGTTVAVLASGIDTIYTDPKGLLWPKILE
HGAIVSEEWIGSHITPAKFPKRNRIISGIAKGTLVVESDLKGGALITATT
ALEQNREVFAVPGSIFSHTSRGTNKLIQQGQAKAIMEVDDILMELQPSQP
HQAKPIHPTKATANATTTTATTQLPLLNPLESQIYQALSSSDPTHIDTLA
ATLQLDLSTLFLHLFELELQGVIEQQPGQLFLRKA
>Cag_0549 MotA/TolQ/ExbB proton channel family protein
MKQSLITALLIALTYAVSLGFYAWMGTMPHGTLWYAVWKGGWMVSVLLTL
ILLVIAYSVERLLAFNKAIGNGNLPNLVQSVQQDVQAGAIDRALERCNQH
QSLHATVLGAVVERYKWLNTQQISEHEKRRQELEKAATDATTIAMPTLER
NLVVLSTIASISTMVGLLGTTLGMIRAFAAMATNGAPDAAQLSLGISEAL
FNTALGICGGIFGIVAFNLLSNRVDRIGYEMDEAALKLIQTFATPSR
>Cag_0805 Signal recognition particle protein
MAMFESLSDKLEATFKKLAGQATINEINIGVAMRDIKRALLAADVNYKVA
KKLIEDIREKSLGEEVIKSVSPAQMIVKIVYDELTELMGGEQKPLNLSPK
KLPAIIMVAGLQGSGKTTFCAKLALRLRKNGKNPMLIAADVYRPAAVDQL
KALGEQVEVPVFSVDEKDAMKAALQGLEAAKAAAKDVVIVDTAGRLQIDQ
AMMAEAEALKNALKPDELLFVVDSMMGQEAVNTAKAFNDRLDFDGVVLTK
LDGDARGGAALSIRQVVEKPIKFISIGEKVDDLDIFYPDRMAQRILGMGD
IISFVEKAQENLDLDKAIEMQKKLMKNEFDLNDFFDQLQQLKKMGSIQGL
IEMVPGLNKMVPKQELENLDFKPIEAMISSMTKEERSNPEMINGSRRQRI
ARGSGRKVQEVNLLLKQFGEMKKMMKAVSKLSKSGRKITPQNLALDKFLK
R
>Cag_0470 hypothetical protein
MNILTSKRLVVTALVLLTGLNVALLGVIWWQNKQTTTTPPCTPNSKSYRT
KASPLAPLNLSAEQRTQFRTLRKEHQQSISDEMAEMALLKKSLIRESLKE
QPNQATIEKLSRSIGSLQAKVEEERGRHFHAMAKICSPEQRDSLQTMLER
FATKRHGKRGNNSNSAWQRR
>Cag_2030 Oxa1/60 kDa IMP family protein
MDKNSVTGLALIAVIMLVWLQFMTPAQKVQPPQQVATTEQQVASASLPLP
AALSPSTDTFGLFATASQGSEQVTVVENDLFRATLSSKGATLKSLVLKKH
LDGHLQPFDLLGKQKNGHLSLLFLTKDGKRIDTRDLYFRNVTLETKRTIS
GQERYTVRYRLDVAPQKAIEIAYLFSGESYAIDYDVKLIGFGNDIAGNEY
QVQWDGGLAYTEKNREEESQNALAGAYLGGSLVKLDAAKEKEVFREEQSG
EATWVGVRNKYFTAALIPQSKSNGIYLEGKREAGNHFENYLAALKMSLPA
SATEVHNTFTMYVGPLDYNTVKAQGVGLEKIMDFGWDWLTRPFAEWMILP
VFNWLNGFISNYGIIIIIFAFLVKLVTYPLSMASTKSMKKMAALQPVLQE
LQVKYKDNPAKMQSELSRIYREAGVNPVGGCLPTLLQMPLLFAMFYVFRS
SIQLRQHGFLWAKDLSVPDSIFDFGFAIPLYGDHIAFFPILMAGTVYLQQ
KITPTAQPNEQMKIMLVLFPVMMLFFFNNMPAGLGLYYLMFNIFSVAQQF
YINKTTTADDMPKVNLAPVASNASKKQKKGGAKK
>Cag_0351 SecE subunit of protein translocation complex
MGKYIGKVSQYYRDVVVEMRKVVWPTKQELKDLTVVVLTVSGILALFTFL
VDWVINGVMGWLL
>Cag_0335 FusA/NodT family protein
MTTKNFIKQVQIFSMKQYIASTLLLFLLIGNAPSVYAEVLSWEQCVAEAR
RAHPSLVQANAIVQQASANRRIVGSSRLPNVALALNAQQQGSSDGTSTDH
IGSSLSLHQLLYDGSKTSKQLSGADEALRAAEAAAQLTNAEVRYQLRSAF
VALLKAQELVELTNEIAERRQKNLRLIRLRYNGGREHIGSLRQAEADVAE
ATFEVEQAKRELTLAQRHLALALGRQKSVALRVQGSLQAAPFSLKKPDIE
QLLTIHPATQQAAAQSRAARYELEASRSAFSPTLALTSSLGRTAASYFPL
ESVDWQAGLSLAVPIYSGGEGKARVAKARAYALEQQAAAQAKVLQVTGAL
EAAWTRLQDAEQAIAVRRRFVEAANERATIASAQYSNGLLGFNEWMIIED
NLVNAKKRLLEASAALFVAEAQWLEAQGGGLNEAEK
>Cag_1235 hypothetical protein
MNIILADALIDDVALLLSSLPAATTCYLLHAQDDAVKVIQTAFQQPNTHL
HFLGHGEEGAITLGGKTFTADDFIALAPTHSSSGAIHFWSCKTGAGTKGV
AFVNSIAQAFNTVVSACSTLVGAAHKGGSWRLDVHSNERVAVACPFGKAA
AYQHTLDASSLLRVNAVALDNGLKVEIWIAPNTAFSTASLRLSFDPSIIA
PVWVNGKVVSTSGLTGWTWLSSPIGDTVLKMNGYTLTEVNRTTEVLLQSI
SFTFAADVQNCSISLGGTYLENEVTGKIALGTLPTLTYIAPALPVWDTFA
PPEALSYTAGTTAALDFAVQATDANGDTITYKAVVGQMVESLFTPTTSLS
TITLTSSNGHLTGSVVLPRTFSAGVYLFRLYADDKTTDANLGSVLDVPFS
LLAAPNALPTGTVTISGTPTQNQTLTAANTLADLDGIGTIAYQWNADGTA
ITGAIGNSLMLTEAHVGKKITVTATYTDNRGTLESVVSTATSAVVNINDA
PTGSVSISGTPTQGQTLTAANTLADLDGLGTIAYQWNADGTVITGAIGNS
FTLTETHVGKKITVTATYTDGHGTTESVVSAATVAVANVNDVPTGTVTIS
GSATQNQMLIAANTLADLDGLGTIAYQWNADGTAITGAIGNSFTLTETHV
GKKITVTATYTDNRGTLESVVSTATSDVVNINDAPTGSIYITGAATKGQI
LTVNTGTLSDADGLNGEFTYQWQANEIDITGATSSSYTLTNDDVGKNIRV
VASYTDNHGTKESVVSTATVAVANVNDVPTGAVTISGTPTQNQTLTAANT
LADLDGLGTIAYQWNADGTTITGAISNSLVLGETHVGKKITVTATYTDGH
STTESVVSAQTTSVANVNDAPTGTVTISGTPTQNQTLTAANTLADLDGIG
TIAYQWNADGTAITGVIGENLTLTEALVGKKITVTATYTDGHGTTESVVS
TATVAVANVNDAPTGTVTINGTPTQEQTLTAANTLADLDGLGTIAYQWNA
DGTAITGAIGNSFTLTEAHVSKKITVTAIYTDGHGTTESVVSAATTAVAN
VNDTPTGTVTITDSATQNQTLTAANTLADLDGLGTIDYQWNADGTAITGA
IGNSLMLTETHVGKKITVTATYTDGHGTTESVVSAQTTSVANVNDAPTGT
VTITGSATQGQTLTASNTLEDLDGMGSVAYQWQADGMAINGATGNSFTLT
EAHVSKKITVTAIYTDGHGTTENVVSAATSAVVNINDTPTGTVTITGSAT
QNQTLTAANTLADLDGIGTIAYQWNANGVAITGAVGDNLTLTEAQVGKKI
TVVASYIDGHSTTENVVSAQTTSVANVNDTPTGTVTITGSATQGQTLTAS
NTLEDLDGMGSVAYQWNADGTAITGAIGNSLMLTETHVGKQITVTATYTD
GHGTTENVVSAQTASVANVNDAPTGTVTISGTPTQGQTLTAANTLADADG
LGTIAYQWNADGTAITGAIGNSLVLGETHVGKKITVTATYTDGHGTTESV
VSAQTTSVANVNDTPTGTVTITGSATQGQTLTASNTLEDLDGMGSVAYQW
NADGTAITGAIGNSLVLSETHVGKKITVVASYIDGHSTTESVVSAATDII
SLDDTTPPYLISTTPINNSIGISTNSNITLTFSEAINKGNGTIALYLNSP
TKTLVENYNVADNVNLSIEGNKLTINPTADLEQGKNYLLAIENGAITDSA
NNLFEITDVYNFTTETLPIERYSLSGNISFWKDKATPLQDVSIVATSAMQ
TPDLLEFRNIQLHSDGSRTVELWTTSPSNTLHAIQVELELQEGSTATWQN
STSIPSNWTTVTHVNNNGHFVLGSMGIEPIAMEAPTVKLGELTLSAPIDQ
ERFEIAIVNGLTNEQAITPFALTSSEIISNKQGHYSFTHLMESLYYLEAN
KAADALADAVTIEDARAALMIAVGLNPNSDGTPLLPYQYLAADVNRDGKI
RASDALTILKMAIGVDSVPEHAWIFASESIESAEMGRSAVDWSHTVPTVL
LNQESNTIDFIGIVKGDVDGSALT
>Cag_0738 VCBS
MNYYTSTDLLLNSVSVVVTERREVAFVDTSVFNWQTLVADMRLGVEVVLL
DASQNALEQMASWSLTHSGYDSLHVLSHGSAGALQLGTVRLSADTLPDYS
AVLVQIGSALTADGDILLYGCNVAAGDAGQHFIAALAEVTGADVAASDDL
TGAADKGGDWELEANVGEVESESVSNDVFFDVLATITGDVTAPTIDGLSS
TPADNATGIAVDANIVIDFSENVAFGTSGTITVRNVTDNTTAGTFTINAN
HTATGNSGFGTATISGDKLTINPTNNLTAGKQYSVQFTAGSIVDTATSPN
SLAAISNDTTYNFATNIEEPATGALGGGEGIYIFAQSFTANKDGVINSIA
VAADFESNSQASTTASSTLKIYAGEGTSGTPFYTQVVGVIPDTVTTIDND
TAGGFNHVLTLTTFTLTTPVSVTNGGKYTFEFTPAGANALLYDNIGDYAG
GDLYLDGSQQSGLDLVFKVVLGDAAADTTAPTASVTAATVNNTTSVTTVQ
STETGTVYLVKQGSAVTNKASLDTLASGNNANSATVTTASSNTTISTSGL
TDGTYYVYAVDAAGNVSVASTNAVTLDSTAPTFDVAPATDDVTTTTLDLS
ASINEAGTIYYIVVQNNATAPTSAQVKAGVNYTGGTVVADGSQAVSSGDF
SHTFDNVAGLSEGTAYDVYVVGEDSANNLMTSPTKLDVTTSSFTAAVDAN
GVLSFGGTATGNILLSVTNAGVITATRGGQPFTAPFTLSNIHSVNIPTGT
TVSVSGSYDISTFNQDPAPANTTLLNFGQVFRKVTMGSSGTPVVYYLPAT
VDDLGQTDVFVLKNGTDAYKNSNLKTGFAFYTSDSINAITSNDTKDITAS
SIDAEGALTIYGMTSGEGRDLLNIKSFTEADFIDALKGNVGSVEVKISDT
AYKNVFANKSFVTVKITVDLGSGNSKVIELVDLTATDVVVAESTTVAQAL
YAALGNHSLTTSYQTVLDDNISDVMRLMADSLDFNDAPGITVTQTSGTTV
VTEGGATDTYSIVLDSAPTGNVVVTLDDTNQQIDLDKTTLTFTSSNWNTP
QIVTVSADNDTVGEGKHYGVIKHTVTSADTNYSNKTIGDIRVTITDNDLA
TGTPTFTSQASNFGISMGSYASPTLVDIDADGDLDAFVGNWDGNVLYFKN
QGEDVSHPQFVTTASNPLQGVNVGQSAQPTFADIDGDGDLDAFVGSYENG
ILFFRNTGNASMAAFAVSVDATQFGLTNVGAYVAPTFADIDGDGDFDAFV
GNKDGNTLFFRNTGNVTSAAFVSSANFGITDIGSYAAPTFADIDGDGDLD
VFVGSYKSGILFFRNTGNATSAAFVSSANFGITNVGSYSAPTFADIDSDG
DLDAFVGYSGGNTLFFLNAPTVTLSANPSSVAEAAGTSVITATLSAAATT
ATTVTIGRKSNSTAALNDDFTLSAATITIAAGSTTGTATLTAVQDVVDDD
SETAIIEITAVSGGATESGTQSVTVTITDDDAPAADTTAPTIDGVNSTPA
DNATSVAVDANIVIDFSENVAFGTSGTITVHNITDDNTLGTFTVSNGSAT
STIGTATISADKLTLNPTNNLLAGKQYSVLFTAGSIVDTAATPNSLAAIT
DDDTYNFTVAPAANPGITVTQTSGTTAVTEGGATDTYSIVLDSAPTANVV
VTLDDTNQQIDLDKATLTFTSSNWDTPQIVTVSADNDTVGEGKHYGVIKH
TVTSADANYSTKTIGDIRVTITDNDLSTATAVFTSQASNFGISDIGSAAS
PTLVDIDSDGDLDAFVGNFDGFTRFFRNTANATSAAFVSSGNFGITDVGF
YASPRLVDIDGDGDLDVFVGNTDGNTLFFRNTGNATSAAFVSASNFGITD
VGSSASPRLVDIDNDGDLDVFVGNSDGNTLFFRNTGNATSAAFVSASNFG
ITDVGGYAAPTFADIDGDGDLDAFVGNYEGNTLFFRNTGNATSAAFVSSG
NFGITDVGYDASPTLADIDADGDLDVFVGNYDGVTLFFLNTPAPAGDTTA
PTFDVAPATNNVATTSFDLSASIDEAGTIYYVVVADGATAPTAAQVFDPT
TYTGEIASSSSAVATTPFTSSFSAVTGLTASTAYDVYFVAADDESTPNKM
ATATKVDVATSAAPTVTLSATPSSVAEAAGTSVITATLSAIATTDTTVTI
GGSADSTATLTDDFTLSSTTITIAAGETTGTATLTAVQDVVDDDSETAII
ELTAVSGGDGATESGTQSVTVTITDDDTVPTLSVTDNTTLFTVGGAAVAL
APDAAIENPDNLAITEARIFITGALATDLLSFTDIDDITGSYDANVGMMV
LSGTGTTEEWQAAIRSVTYSSSDESPDMDPRDVTISVKTGVLGSEILANG
ASSGTPATAPVSLNQDEASIAKLTGGGFVVVWYAPDSEGNGVYGQLFNAD
GEHVGSEFLINQKEITDDSSDQDFPVVTGLTNGNFVVAWNSDEQDTPEEE
DYDREVVARIFNASGTAVTDEFTVNTWKGNNSGSDNQWEPAITALANGKF
VIVWESDEQDGSTEDNIYGQVFNADGTKSGSEFLVNTTTADEQDTPEITA
LSDGGFVVVWQSITVDGDYYQICGQRYNADGTTNGNEFVVIDTTTDDVAV
EVPFVSSLPAGGFIVAWTQGDPLVDSEVYFKRYANDGTPANAIQVGADLQ
GAQSEVSISYLNNGGFVIVIESTDNGVSGGVFAQPYNANNEPVGTVFQIN
TTTQYDQDSPVVAPTTEGGFIIAWEGEEQSGDGVDSDNDVYIQRFGSSIS
VSTATVALSILAPGITVTQSSGTAVTEGGATDTYSVALTMQPTADVTVTL
DDTNGQVSFDQESLTFTSSNWNIPQIVTVTADNDTVGEGTHYGVIKHTLE
SSDAAYDGIEGDNVRIIITDDDLPLNTDPTFTQQISNFGISDVGDYASPT
FADIDGDGDLDAFFGNEYGDVLFFKNEGEDVSHPLFVTTASNPFEGIDVG
IYASPTFADIDGDGDLDAFVGGNYYDNDSSESVSKVLYFRNTGSAESPTF
AAAEDAATLGLSNVGYRAKPTFLDIDGDGDLDAFIGKNDGVTAFFRNTGS
AESPTFAAAEDAATLGLSDVGYHASPTFADIDGDGDLDAFVGNQDGVTAF
FRNTGSAESPTFAAAEDAVTLGLSEVNKYASPTFADIDGDGDFDAFVGEK
YGEVLFFLNAPLASPGISITQSNDTTAVTEGGVTDTFEVVLTSEPSADVV
VTLDFDDDQLSLDHTTVTFTSSNWDEPQTVTVTAIDDTDDEGVDISPIQI
TVSSSDGDYSGISVTDLDITITDNVTFVPPQTNPFGLSDVGISAKPTFVD
IDHDGDLDAFVGNRDGKTLFFENEGNATSAAFAASVNASTIGISDVGNFA
ALTFGDIDGDGDLDLIVGNDDGTLSYFKNVGEDINPSFSMVTFSSPFATI
DVGSGSAPTLVDIDADGDLDLFVSDLYGKTFFYENVGEDASHPQFTSSVN
ASTFGIKDVGSCATPIFADLDGDGDYDAFIGKSNGSTVYFENVGDATEAY
FVTAGTNPFSLRNVGYSAAPTFADIDGDGDLDAFVGNHDGNVLYFESHDG
DVTPPVFDANFTVSGVTTSSFKLSASIDEAGTIYYVVVAHGSVEPSAEQV
QEGKNVFGIPVHLSNSADAATGEFTTEFTLSGLTAGTTYDVYVVAEDVAG
NLMEAATLVEVTVPTTTASQYLPEFEFSTVNPFGLTNSGYYAAPIFADIN
GDGDLDAFVGDVFGNVHFFKNTGSATSAAFTEVSTNFFGLQNTHHAVPTF
GDVDGDGDLDAIVGDSDGNQLYFENVGTTSSASYTAPITNPFNFSDVGYY
AAADLADIDGDGDLDLFVGTYDGDLLFFKNVGTAVCEDATPCENPCENET
PTFCENDSNTPLFESALTNPFGLANTGHHVAPTLADIDRDGDLDLLLGNC
AGNLFFYQNTGNASNPEFLFAATQIPAESLCAPILSTTLFGLSNKGTFAK
PTLADLDGDGDVDAFVGTSSGDIYYFENVAPVPAGVTITQTDGSTAVSED
GVTTDTYTVVLDSAPTADVTITLSTSNGQVRFGSAGDDTITLTFTTTDWN
VAQTVTVVANDDDVLEGAHVEFITHTVSSDDECYDGFEVNPLEVSIADDA
TDKSDIRLEFILHSTNPYGLTAVDAHAKPTFVDIDNDGDLDAFVGSMLSE
VTYFRNDGNASSASFVTVSGVLSTNAGWSAAPTFADIDGDGDLDAFVGNY
EGSILFYQNWEQEKYASQPIFVSVETNPFGLTRADNIFSAPAFADIDNDG
DLDLFVGNYKGDMLFFENIGTVSSASFAAPLTNPFGLRNIQASSYPCECN
PQNGAQFATPTFVDVDGDGDLDLFVGNANGDTLFFHNIGGEDSPLFALPS
TNPFDLTNVGGYAAPAIVDIDKDGDLEALIGNADGNIVLFEQNIRPTLTD
VDTLSVATEDTEFTITFASLTASADEADVDGDVVGFVVKEVSSGTLMIGE
DAASATAWNLATNNTIDADHHAYWTPAQDANGSALNAFTVVALDDDDDES
ATPVQVTVAVTAINDAPTFMVGSGVVTTSFGSANDGAYELTIDGNGRIFV
VGYTGAYNDWYNFALACYKSDGTLDNDFGTNGIVTTAINDYDWAESVAIQ
NDGKIVVAGLTWNNDANPDNYDFALIRYNSNGSLDSSFGEDGIVVTAISD
EWDDEIYDVTLQADGKIVVAGSVGNYYEDDWFNFALARYNSNGTLDTSFD
GDGVVTTELWDFEEAFDVTVQADGKILAAGYTWDDVEGAYEFALVRYNNN
GSLDATFGEDGVVASDITDYWDEGRSVTVQADGKIIVAGFIGEDDDWYNF
ALTRYNSNGTLDTTFDDDGIVVTVINDWELAYSVTLQNDGKILVAGKTYN
YDTQSYEFALVRYNNNGSLDTTFDDDGIVTTSINGWDYAYSVTAQNDGKI
LVAGETYNYDTKSYEFALVRYNNDGSLDKRFGIQANTLDESPTYIENGSA
IILDSNVQIFDAELSVLDNGVGNFAGATLTIARNGGADAEDIFSGAGIIS
GEDSGSIIVDTTDIGSYTFAGGELKITFDEDATQELVNEALQSIAYANSR
ESLGEDETDIVTLDWTFNDGNTGDQGFGEDLSGSGSTVVTLVGVNDVPTL
STVDTFTGATEDTKLTITFSDLTEHADEADVDLYGTVDGFVVKAVTSGTL
MIGEDANSATAWNLATNNTIDADHHAYWTPAQDANGSALNAFTVVALDND
DDESATPVQVTVAVTAINDAPTFVVGSGVVTTNIAEIDGSKSFDFSSGII
ALQDGDFLVGGTSMFITIGSALLRYNTDGSLDNAFGNNGIVTTPIPISIQ
SPFLLPNAITTVNDGYIVSGTTYYGSGDSDFVLVRYDVDGDVNTSFGESG
IVTIARTTSNNIFGNGHYGIAVDGDNRILVAGLNFDSVSSTNDILLSRYD
EIGTLDTTFGDNGVVAFNIGAISPFSYTNVVVVEDGYLVIGTAYNGNSGS
DVVLIRYNESGTLDTGFGDNGVVDFGSNNQEWGAIATSVFVDSAHESILI
VGAKGFNESETDFVLARFNTQTGALDTSFGTGGVVTTNIYSYSDAGTSYN
SIDIATSVTIDSQNNILVAGYSLDPVFSIATISIVRYNEQGELDETFGIN
HNGIVTTELNVPAELLYEMLFFFGASLNVTTQLDGKILVSTTNFDLATNN
ADIELLRYNSDGSLDTTFGIPTNTLDESPIYIENGSAIILDSNVQIFDAE
LSVLDNGVGNFAGATLTIARDGGADAEDIFSGAGIISGEDSGSIIVDTTY
IGSYTLSDGELQITFGEDATQELVNDALQSIAYANSRESLGEDETDTVTL
DWTFNDGNFADEQGLGEDLSGSGSTVVTLVGVNDAPTITSGIDDVSFTED
VSASAQDLTEGGTLSFDDVDTNDVIDVKYSVKNGATWSGATASVAMPSGL
AAQLEAGFAISGEDEAAPGSVSWSYGVTDANLDFIAEGEQVTLSYTVTVT
DNHGATATDDVVITINGTNDAPTITSGIDDVSFTEVSGDSSAQDLTEGGT
LSFNDLDTNDVIDVTYSVKSGAAWSGATTGVAMPSGLAAQLEAGFAISGE
DEAAPGSVSWSYGVSDANLDFIAEGEQVTLSYTVTVTDNHGATATDDVVV
TINGTNDAPTITSGIDDVSFTEDVSASAQDLTEGGTLSFNDLDTNDVIDV
TYSVKSGAAWSGATTGFAMPSGLAAQLEAGFAISGEDEAAPGSVSWSYGV
SDANLDFIAEGEQVTLSYTVTVTDNHGATATDDVVVTINGTNDAPTITSG
IDDVSFTEDVSASAQDLTEGGTLSFDDLDTNDVIDVKYSVKNGATWSGAT
TGVAMPSGLAAQLEAGFAISGEDEAAPGSVSWSYDVSDANLDFIAEGEQV
TLSYTVTVTDNHGATATDDVVITINGTNDAPTITTGIADHSFTEVSGDSS
AQDLVTGGTLSFNDLDTNDVIDVTYSVKNAAVWSGATGSVAMPSGLAAQL
GAGFAISATDVAAPGSVSWSYGVTDANLDFIAEGEQVTLSYTVTVTDNHG
ATATDDVVITINGTNDAPTITSGIDDVSFTEDVSASAQDLTEGGTLSFND
LDTNDVIDVKYSVKNGATWSGATASVAMPSGLAAQLEASFAISGEDEAAP
GSVSWSYGVSDANLDFIAEGEQVTLSYTVTVTDNHGATATDDVVITINGT
NDAPTITSGIDDVSFTEDVSASAQDLTEGGTLSFNDLDTNDVIDVKYSVK
SGAAWSGATASVAMPSGLAAQLEAGFAISGEDEAAPGSVSWSYGVSDANL
DFIAEGEQVTLSYTVTVTDNHGATATDDVVITINGTNDAPTITSGIDDVS
FTEDVSASAQDLMEGGTLSFDDLDTNDVIDVKYSVKNGATWSGATTGVAM
PSGLAAQLEAGFAISGEDEAAPGSVSWSYDVSDANLDFIAEGEQVTLSYT
VTVTDNHGATATDDVVITINGTNDAPTITSGIDDVSFTEDVSASAQDLTE
GGTLSFNDLDTNDVIDVKYSVKSGAAWNGGTIDSTLKAALEAGFTISATD
VAAPGSVSWSYGVTDANLDFIAESEQVTLSYTVTVTDNHGATATDDVVIT
INGTNDAPTITSGIDDVSFTEDVSASAQDLMEGGTLSFDDLDTNDVIDVK
YSVKNGATWSGATTGVAMPSGLAAQLEAGFAISGEDEAAPGSVSWSYDVS
DANLDFIAEGEQVTLSYTVTVTDNHGATATDDVVITINGTNDAPTITTGI
ADHSFTEVSGDSSAQDLVTGGTLSFNDLDTNDVIDVTYSVKNAAVWSGAT
GSVAMPSGLAAQLGAGFAISATDVAAPGSVSWSYGVTDANLDFIAEGEQV
TLSYTVTVTDNHGATATDDVVITINGTNDLPSISALDVVGAVTEDSNTVS
DNPQTVGVENGSYLTESGSVMFSEVDDTDILTSTVALQGTPVASSGASVS
AGLGTALSEAVTIAQTGDNDGSIAWSFALDNSLVQYLAKDETVTATYRIT
VTDDSGAENNSQTQDVTVTITGTNDIPTIIIGSTDAVGAVTEDAAATTLS
DSGTITFNDVDLIDVHNASVVASNSNTLGGTLTFGSVTESASTESGSVSW
TYAVANSAVQYLAKNETATESFTVTVSDGQGGSVTETVAVTVTGTNDIPT
ITGTNTGDVTEDSNVTSDDYITTSGKLTISDTDQNQSFFTPHASYQAQYG
TFTLDANGNWTYSANNEQAAIQNLGAGQSLTDSFTAVSKDGSEQQTVTVT
IHGTTNASVSVGDATVNEAVETAIFTIYRLDDTYGDVYVNYATQDGTATA
GSDYVATNGTVHFADGETEKSVTVAITNDSLFEGSESFNVVLSNPVPSAV
TVSKVSGVVTIEDNDTPPTVSVSSVTVGESSPYAVVAVTLSNPTTQAVSF
TPSLHNGVENEQSKAATIGQDTTPIDNTTGVLQYYNGTAWTNVSEAVTIN
AGATSVLLRVGIYNGTLYEGSESFTIATGEITGTVTNNASLAGTVTIIDD
GSSSNGFTPTNTTGQATSKPEFANDDRPTISIHNLTVSEAQSHAIVTVSL
SNASTQAISFTPSLVSGTATVGTDTGVLEYFNVNKVNGAGWDTVNGAITI
DAGKFSVQLRTSLVHDQEFTEGAERFTITTGAITGTVANSTGVTSTVTIT
DVTPLSAPIITDVTEETSGDPTPDDLLTGDTTQVVQLTGEAGCTVTLYKV
GQVEPIKIFAPQQDSLATTYTLDLTDISLSHGDYVVQLSKNDYESKVSNS
FTIDSTPGLFDIIERREVVMLTDTDAVTTGTVAGMDQNRQQAKWDSVNSQ
WIDSDGEIIHFSFGTSSSLNIESTTDGFKLTLVNGSTLQLNTQTGEYTYN
PAEGAVLDKFTIYASDGTYNSSLTLTFDAKDTLDRDGISAVVENKLATLA
NPTSDVLGDLNNDGIADEHQNAVATLAWITSANFEDAKSAGDTGDFSQIK
PESVISLQVVEAAANTADGTTTKETVDATSQLTDVKVLDDTKVEALTGGS
KPIGAEWDPIQFTVESLQSTGLVDIYPDYIFPLRTDKQIRLLIDISRAGQ
VEGSFVGYEKYVSTDTINAAKEWATDTNKVVDQDKLLKDLDGNLITTAGW
YDFMQRSTNPDGTKPDGARFIVDPITKIITAIELILTDNAFGDSDMTEGR
ITDPGVPITLNSVERSTVDPAIVDFYGFITQTSPLQQELKRWYNPITGDY
FYGVDASQVPYNCYESPTTGYGYVLGANNATGIYKVNLYLNSEGDTQLVG
ESRANELGLLANGYRNLGAVFASAPHLDGTNPNPIFAGIDEATNVSVSDD
IIIPFDERITQGAGDVNTNIQLINKTTGLPVAAKISFVGDKLVINPDADL
DANTGYYATIANSAVLDYGGNAYAGTNTVTNEDYDFTTGADPYAGVNDDD
LSTGEILGGVAALGLLAWLVL
>Cag_1920 hypothetical protein
MNTDMLVSSNAQSLLATAKSCCENIACSLVIADAHVDDVTLLTTSLTPFT
DIVLVTHEADALATLQAAFAAGYEHIHFLGHGEQGGITLGGKLWQTNDFV
ALAAEVDSARETSLHFWSCYTGAGDKGLAFVSQLSEVFGDAVTAFSGLVG
AASKGGSWVPDVIVGSVHVPEVPFINALTYAHTLDVTSNVYLTSVGRDEE
GDGDIDGVDVQLWLKAGTTINAVDFTLAYPSVATVNGIITHPAFSSWTWN
INNHSNEGVIIAGLAGDITNSSVYNSFTAPSDMWIGRVSFDYAPTPTVAP
SFVVSLTDVFLNDVELVTTSAEWPILSTDLSTVPVWNTDLMLPPSAPYEY
APGETVSLSFPISATDPDSGDVVSYSAVIGQVVDNVFQPLSGFSPIPLML
SNDVIGGSFTVPSIAPVGSYVVRLLADDHAGDAYLGTAFDVPFSIVMGGG
DLTFNTSGTIDGSPVAGEGYYKFAPGTISGELAIAGDTGFQFVITTDYDE
NPMTFNASWEWLNESDGADYGTVTFFDISSGIAGPETWSATFEDNTIGMV
IADSSTDADTLPDGIIVRDDMDNQVAVPLAWQQRDANGAIATFSATVKNE
DNEDISFSGSLIDSDENGEPDRVVGNWGDEQFNDSFLFADVYGDSQPDEW
MVTSTKIRAGRVQNDANGNPAGLYITWDNQRPVWNVPVQLPPLMFTQGQN
INFSDYALADLYATDPNGDAITYSAVVGYISPVGFVPVQEFSELPVWMEE
AGLQGSFTIPTNAPTGSYVLRLLADDHAGDTYAGTALDVLFTIEGVEPVG
NILLNTTQEVEGNPGTLESYYKFRTGSTGIAAVFGDSGFQVNLFEVASDA
NPYTFNAAWTWFDNGTYSDTNEGVLTFIDTNSNLTDGLEQWQAAINDRTI
GEVIADGNDADTLPDGIVVEDDMDNLVDVDLNWQTRDEVTGAIATFSTTV
KNKDNEDIAFSGSLIDINNDGVADRVVGNWGNDQFNDAFTFADINMDEQP
DEWVATQTKMYSGRVQNDASGTPAGVYMEKEPEPIPDPPYITQAELTYDI
GITGASLAETGAIVVKIASPYMGMSNITIPVTELTLQGSLLTIPLTSFIS
TYPQMGAALLVQIPAGVVVGQNELVNAWQIGEPYSGYYALSSMPVLPNDN
SSDGADWVLGTSNNDSIAAGAGDDVLDWSVGNDTIDAGDGYDHQYLPIPG
MYPHLMPQLDESGVLHLVKYNYEDSLTGGSTTDVYRITRLAPSEYRIDSM
DSIGVTVVQTLHLSNAEVLSAGYHPTYLAVQYNTESHYVSGTAWDDVISV
DLQSFIASPFTSVWGDSGDDMFVLNLPAIYSALELVPEGENMYLLQGIGS
GPLATTTTLGQLQVTSTGYVTLTVGSGDTALSVSLSNIEKYQFVAGSVVE
ELDVAASHENHLPVGTVTISGDPTEGWMLNALLDFTDEDGMSNSIITYQW
YANGVAISGATDSSYELTQTELGKQLSVTVSYVDDYGGHESVNSLATTAI
QNSNDEPEGKPTITGTAAQGKTLTVDVSGITDEDGLENATFSYQWYAGGM
PIDDTTASTFTLQETQVWHQISVAVSYTDDFGQEETVYSDYTDIVENVND
KPTGTVTIIGTVAQNEWLSVDPSAINDPDGLDGLFEYQWKADGAIIEGAN
ESQFLLTADYAAKALSVTVSYYDEHGTYEQVTSTATTPFSRVNNLPDGYV
FIVGNQQENETLTVGYYLYDADYANGEVNPNDISYQWQVWSDSAGTNGDW
VDLQGATSSTLLLDESLSDKWVWLTLSYTDPHNTTESLSSYYSVFIYNLN
DEPTGEITIYGTIKEGETLTVNTSTLADADGLGELYYQWYANGEEIGGAN
YSTYDLTQFDVGKRISVAAGYWDGHGTWESVASELTATVARDTTTNNEPT
GWVTISGTATQNRMLLANFNIVDSDGLSDAVYSYQWKASSDGINWDDIFG
ATQRSYKLTQADVDKHITVEISYTDDANHLNTISSDPTRAVWNVNDAPTG
KPTLSGTLTEDQTLTIVTSAITDADGIAQDTMSYQWQADGVTFAWTTENT
YILTQDEVGKAISVIVSYYDNGGTYESVTSSPTVAVANVNDQPQGEVLVI
GSAVVDETLWVSTGMLTDEDGPDLLYLNGNMSYQWQSSTDDGVNWNDIIG
ATESGYDVTLDESGEKIRVQVTYTDNGGKTEVVYSSATDAVVSNAIDPNG
TIAITGTFKQGETLNATVTDADGMGTVSYQWQSSTNGTTWDPISGATSAS
FILTEAQVVKQIRVIASYTDGGGTIESPSATTTTIENLNDNPIGSVTITG
TAKQGEALTAKNTLADADGMGTVSYQWQSSSDGTNWSAINGATASTYKLT
AAEVGKQISVVANYTDGHNTPESKASVATVAVANTNDAPTGTVKITGSGQ
QGAILAADTSTLADADGLPTTLAYQWYAGGVIITGATNGTYQLTKNEVGK
AITVKVSYTDGGGTPESVTSLATSAISNVNDAPTGGVTIDGLAKQGQRLT
VDTSTLFDDDGIPTNKLGYQWQAGGLNIANATESSYKLTQAEVGKAITVK
VTYTDLQGTTEAVTSDATASVANVNDTPTGTITISKIDDDGNKVDLTAAP
QQNDILVASNTLVDGDGPPALAVTYQWQANGADINGAVGRYFEVTQAEVG
KTMGVVASYTDAFKNPESVSSTATAAVVNVNDAPTGSVTISGNPTQGQEL
TAITSTLADADGFKSTLSYQWQSSSNNIDWSNITGATNRTYTLTNSEADK
VIRVVVSYTDKGNTDESVNSKATRSVTNDNDAPTGTVTITGTIKEGQTLT
ASNSIVDPDGIPAGTITYQWKANDENIYGATYATYTLTQEEVGKHISVVA
SYTDNGGTSESVSSTSTTKAENVDNDPIGTITITGTAKEKSTLTFVNTLQ
DADGMGIVAYQWQSSTDNGSTWSNIAGANASSLTLTELQVGQRISVVATY
TDGYGNPETVRSSNATSKVKNENNNPEGKLTIVGNAKAGKTLYADHTLTD
EDGMGAILYKWQSSTDNGSIWNDIDDATDSFYTLTKDDVGNNIRVVATYT
DGHGTVENVFSEKTATVKKVISGSSHDGYLVNALVWVDEDSDNTLDWTDT
NRNSKWDEGEGESWTLTDNTGQFTGLEGDGTKPLRITANPNGGTIDISTG
NEFDGSFFAPADATVISALTTLIAAAMDSTTNAAAAETKVETALGLDAAT
LGATLSLTSYDPLAEASKTSTTDAAKINAVKVHAATIQLNNIMDVAISVA
DAAGSTLSKAQIVENVSDSLLAQAGTDTVDVTSDAVIEVAIKTGLSTGLT
TKPNFNDVVAAIADALALANREIATIATNATGTNAVASITDIVEAQIVAQ
STIVPDAYAAVVADDSSAITTKADTFSSQLGEAAKEVETIFVNHAPTGSV
VINGVVMPGEILTAATDSIADNQGVGAISYQWLRGGEVISGATNATYQLV
AADIGKAISVKASYTDGAGFSESMNSNATIAVPDAPTSLSDVTVDVANTL
TNDATPTVEVDLTNKALEVGDVIQIIDSNHGNAVLYTETITTTGITLKEI
QLAVALIDDAHALQVRLVDSAGNEGLASNGVTTITVDTTISHLSGAVYNA
SSGTVTALLDMVLDSGDKLYGSVNNGNWEDITAKVNGTSINWDGVGSNAT
KIDLKVQDEAGNTDTEAVTIPVSTGHNLTIHTAYWKDSKAISGVTLENGA
QTDSVGAHLYTAVTDATKTISPELAVATADKAAIGLLDAVGILKSLVGLT
TLNKYQEIAADYDGSGKVGLLDAVGVLKYLVGLPGAAPEWVFAESTASEP
SAIDDMTVSLNDDKTVELIGILRGDVDGSWVNLH
>Cag_1919 hypothetical protein
MADFITLSNPSYSYNASKGKTTVQFDICFASNEMAGSKITGAKIDLQYNT
SLVTAYQITNPTFSFEGDFGTETASVWVAAFDQTANLTGSGATGQIAMLA
TSNDANPIIVNGKVLTVTLSVTGEVNADTFAITLQKTADGGNNSISNATT
EYFLDGGTYVAPPTSLADVTVDLHVNSDTGTSNTDNLTNDDTPTVTVNLT
GKSLSEGQTLQIIDTSNSNAVVGTYTITSTDATNGITTKDVTLSTLTSGA
HALKAQLNAGSTAGTPSATATTVTIDTTAPTSLADVPVDLKSSSDSGLST
DNITNATTPVITVNLTGKTLVAGDIVQVIDTSNGNAVVGSYTVTTGGTGS
SLDITLTTPLSLGAHALKAQLVDVAGNVGTASTNALTVTVDTTAPTAPTL
ALATDSGSSNSDGITNVGTVNVTGIETNATWQYSTNGGTNWSNGTGTSFT
LAAATYAVDAIRVRQTDVAGNVSGEGKIATAVTIDSSAPVAPTLAFTDAG
TSTTDGHTSNNTITVTGIESNATWQYSTNGGTNWSNGTGTSFTIVDGTYN
ANTIKVKQTDVAGNVSGEGSLAPAITVDTVRPTVTVTPVTTALSAQGTTT
ITMTMSEAVTGFAADDIKTSSKYSISNFSATSSTVYTATYTANEATTDVA
KELKFETNWTDAAGNQPKFGPTVDITLNDAALKIGETATVTFTFSEVPTG
FDSSDISVTNANGQLSGLAVKSGSNGLVYEATFTPTANVTSATNKITVGK
DWTNAEGVAPTNDTTDSPNYAVDTFRPTATIVVADIALKAGETSLVTITF
SEAVSGFDNADLTIQNGTLTNVASSDGGITWSATLTPTADISDTTNVITL
ANTGVNDVAGNAGTGTTDSNNYAIDTARPTATIVVADTALKAGETSAVTI
TFSEAVTGFDNSDLTIANGTLTPVASSDGGITWTATLTPTTNLEDATNVI
TVNKAGVTDAAGNAGVSTTDSNNYTIDTQAPAAPTLSITDNGQSTSDNLT
NNGTVTVSGLETGATWQYSTNGGTNWTTGSGTSFTLGAGTYAANNIQVKQ
TDAAGNVGIVGQITSQVDVDKVAPTLKSVVVNGTSVVITYNEALDATNKP
ATTDFTVSNNTVNNVAVDSTAKTVTLTLGTTVVSGADVTVSYADPTTVDD
SNAIQDVAGNDAAKFTTTISGTKTTTKVEVPQSSTAVNNIPIGTNAAGNP
VIQLDIPANVDVIAKEVTDTNATTLTDKLNDSLDALTTASTGQIDSIAVQ
TGIDNYVATLSTPDQANVVVRTLELKSANATTGAELVVTGNSAIGSNEAL
VIDTRGLQPGSVLNLENVEFAIIIGDNVTIRGGDGANIVYAGAGRQDIKL
GDESDTLHGGTGDDIVASEGGDDWLYGDDGNDTVSGGADNDHLFGGTGDD
SLDGGTGNDTLDGGDGNDMLNGGTGNDVFTGGVGTDTIQFAGLFSNYTIT
YNPGAHQYVLTDTTGATKTVSSTDFELFSFTDGVKSDDDVYAVAANPYGQ
PEHIIANDPAFVGVAGLGLIAALLFL
>Cag_0020 conserved hypothetical protein
MERPMSAPNSALMSSKISSPISPTTLHHLLDIPLTTPLTLEAMCRNLRPI
YYPAPHLSPRLERFSLALVEAMQGLGIQVHSPEELALHDGRFPAGTVIVA
PGIFDDDALPINRVSTLYNNIIVGIYDEAAPVSNSSLPQERLDAIVGRLA
RDMVHILIFVTDESWTICTMNGGIATFATPLPHVADVRSTLVPKLTAQVV
PPRNEAFTFVDGALDIASPTFSAIAEDFVQCSALWSQSSALLTHTSTEGL
HYRNSFYKRIVARYLDERSGMSYGFFARQLPIPTLQPAQKKKADGLMEVQ
LAGEQWFVAIPEVSIITTRSGCRKHCLNPLEDLVALGLKEEQGKRVASIT
TPSTSCNTVIKPSFDTLAILAHALGNAIVGSILLVLQPNAPFSRHLARNG
ATITHWHGYPQKSDLPDGYWLHGAENPPVACSTPQSAAYSLLGKLSALEQ
ALTQQGIYHGDVHTEPHHGTNIVGILSLTEVARHFAR
>Cag_0026 SecD export membrane protein
MFASNNFFYLMKNKRFNLLLIALITLLSLWSLWPTWRDYSISQELQNART
PKDSAAVAVKHRAELEEVRQKSLKLGLDLKGGMHLVMEVDQVDLFEQKAW
NKDATFTAIMQSVRAQALAQSDARVIDLLVQEFNKRNIRLSRYFYDIRNS
DKEIIGKLEKESEEALSRAKEIIRNRIDQYGVAEPMITTQGSRKLVIELP
GVSDEGRVRNLLKGTAKLEFKLLREPELLVRALDRINSGLASGTMATSLA
PTVAPDSAASAQSVSVSASATPSLPAKANVAPTSAVAPAPRSLSNLIVLM
QNGMAYTEERNRAEVKALLERADVQALLPPDSELLLAAKPEVDAEGKKFY
PLYLIKKTPELTGGVITEAKATFGSQGIQPEVTMAMNTEGTSRWARITGA
NIGKRIAIVLDGAVYSAPVVQSKIPNGNSVINGIESLEEAKDLEIVLKAG
ALPAPVRITEERSVGPSLGADYIRAGMLSLVWAFVAVSFFMLVYYRQAGI
AANIALILNILIVLSVLAGFNASLSLPGIAGIVLTIGMAVDANVLIYERV
REELAEGKSIAAAVAQGYDRAFSSILDSHVTTLAAGFLLYTYGIGPIQGF
AVTLMIGTAASLFTAIVVTREIFNFMLFKEKLSTKSFG
>Cag_1055 Filamentous haemagglutinin-like
MNRIFNVIWSVTREKWVVVSEKVKSNGSVPKSSLVSIAFLSALLGGGSVA
QAVEPGQLPTGGVITAGSGSIATNGNSMTIQQSSQKMVANWNNFNVGSDA
SVRFQQPNASAAALNRIAGQNPSQILGSLSANGRVFLINPSGIVFGQNAR
VDVGGLVASTLDISDYDFLAGNFAFRSTGSAGTLRNEGLINAMPGGVVAL
LSPSVINNGTITAVGGSVALAAGNQMTLDFGGDGLMTVRVDDGAVNAFVE
NNSLIKADGGLVVMSAKAANNLAFSAVNNNGVVQAMSVVEKNGRILLDAE
GGQSTVSGTLNASSVDGKGGQVVVTGKQVMIADGAHLNASGLTGGGDVLV
GGSWQGSDASVRQAVGTVVMPNTLLQANAISNGNGGTVVVWSDVNNPLSV
TRAYGTFEAFGGTNGGNGGRIETSGHWLDVAGSRGGASAVNGNAGVWLLD
PYNVTISSSNANGSWGGVFPNAIWTASGDNSNLLASDITTRLNAGTSVTV
QTGTAGSQAGDITVDGAINMTNDSGEVSLQLDAAGSIAINNNITNSTGTL
HLVFNSGTGAISGTGALGSGQGRTLFNVGASTGTFSGIISGASRTVTKQG
AGTLIFSGANTYGGLTSIEAGVLRVANAQGLGDVTNGTQVSNNGALELSG
GIVITGDEVLRLVGTGVSNSGALHSIGNNSFGGHIILTGNSTITSDTNGT
LILGNASQGIYGAYGLTLSGGGSVVFNGAIGATIPLASFHGLTGTSIELN
GGSITTTGVISALGQVKATNPLTLSSGISDISLSNETNDFTTVTVTNAGA
VSLIDDTALTLAGVNASGDVNIATHTGNLTVTGNVATTSATPTALTLNAD
QSKDAGNGNGENLILSSGTLTVGSGGIAKLYTGSVAGSTSIASVVNAGHF
RYNSDEAVQHYTDPLTAGLNLIYREQPTLSVMFAPVTTTYGTTPTFAISS
YSGYINGDTSPGIVTGTPTWLVDGTPSFAGYYTAGTHNVSYNNGLISSLG
YGFVDNAISFNDLVVNPLVLAATSLTGLTASDKIYDGQITATISNYGTLT
GILTGDRVALNSAGSSAAFADKNVGTGKTVTVSGLTLSGLDNGNYRIVPQ
TTTASITQKSLNVTAPSNVTKVYDGTVAAPGVATVTGLAIGDVVAGTATI
EYADKMAGSNKVVNPLSVTILDGFDMIMTNNYAITYVGDHGTITQAPLTL
TAPDNVTKYYDGLLTVPGTPSVNGLVPNDVVVIPASLLYTDPEVGIGKTV
NPDSAGLVIHDAIGNNMTPNYAITDIASHTGIIVEKTFTPFKKWNDADPS
VPEIPTNAPEVTGSRDLAGSDFEPATDSGVTATRSLTMATMDESAVQSDI
VVKLAEPASKNKQGVVKVFVPKEVFAKPAFLFPLPEEVAVEINKTNVQEK
VFMQNGDALPGWLSYDYEKKIFTATSAPAGSLPLTIMVQSGTMAWQVIIQ
Q
>Cag_0027 SecF protein
MRIFHKTNFNFLAARKVAYIISLVLLLVGIGSLALRGLNYGIDFRGGSEV
VIRFEKDIDVSHIRSVLDAAGVSGTLKQYGMDRSFLFSTVFQGDSGELKT
LLENALNDRITSNKHEIVRIDAVGPSIATDLKWSALKALAGALFAILLYV
GFRFEVKFAAAGVVAIFHDIIVVLGLFSLLGGVFPFMPLEMDQSIIAAFL
TIAGYSITDTVVVYDRIRERIRNQKPSEYERIFNESMNQTLSRTVITSGT
VLIAVLVLFLFAGPAIRGFAFAVFSGILIGTYSSIFVAAPLVFDWLKRTN
STVQLRGSQK
>Cag_1748 Twin-arginine translocation protein TatA/E
MFGLGGQELVLILLIVLLLFGAQKLPELAKGLGKGMKEFKRAQNEIEEEF
NKSMDDNPKKEKATTASKS
>Cag_1018 SecA protein
MLKIFEKLFGSKHEKDVKKIQPTIQRINELQRALASLSDEQLRQKGRELK
QKVRGVLEPMELEQQKLFHQLDSPNISLDEAESVNNKLDDLAVAYETATA
SVLEEILPDTFALVKETCARLKGHTYNVMGRQFVWNMVPYDVQLIGGIVL
HSGKIAEMQTGEGKTLVSTLPTFLNALTGRGVHVVTVNDYLAQRDKEWME
PLFAFHNLSVGVILTSMHPALRRAQYLCDITYGTNNELGFDYLRDNMANT
PEEMVQRKFYYAIVDEVDSVLIDEARTPLIISGPVPNADNSKFQEIKPWI
EQLVRAQQQQIAAWLGDAETRMKTNATDPEAGLALLRVKRGQPKNSRFIK
MLSQQGVAKLVQITENEYLKDNSSRMHEVDDALFYAVDEKANTIDLTDKG
RDFLSKLSHQDSDIFLLPDVGTEIATIESNAALSTNDKIQHKDALYRLFS
DRSERLHNISQLLKAYSLFERDDEYVVQNGQVMIVDEFTGRILPGRRYSD
GLHQAIEAKENVKIEGETQTMATITIQNFFRLYKKLAGMTGTAETEASEF
YEIYKLDVVVIPTNASVVRKDMDDLVYKTRREKYNAIAQKVEELQKRGQP
VLVGTTSVEVSETLSRMLRTRRIAHNVLNAKQNDREAEIVAEAGQKGTVT
IATNMAGRGTDIKLGDGVRELGGLYILGSERHESRRIDRQLRGRAGRQGD
PGESVFYVSLEDELMRLFGSDRVIAVMDRLGHEEGDVIEHSMITKSIERA
QKKVEEQNFAIRKRLLEYDDVLNQQREVIYSRRKNGLLKERLTSDILDLL
KDYSDTIVKKYHKDFDTAGLEEQLMRDLSIEFQLDRATFEREGIDAVVDK
VYETALTFYRRKEESLPADIMCQIEKYAVLTVIDQRWREHLREIDSLREG
INLRAYGQKDPLIEYKQEAFRLFITLLKEIEAETLSLAFKLFPIDPEEQQ
QIEERQRQSAIRQEKLVAQHDVAESFVGLNDDDEPLPAQPITTEQKPGRN
DLCPCGSGKKYKACCGQ
>Cag_0471 hypothetical protein
MKKEITIALSALLLAVGATNVEARPGMMRNGGNAGMNNNCQQMMMQERLD
VTDKQQEQLDALRVKYFEKLSAERRKLMTLERELNTETLKSTPDKGQINK
LADQIGKQYSELMRLKSTHMADISAILTPAQRDSMRAWKNFRPMRNGAAH
PMMMCP
>Cag_0615 Outer membrane protein-like
MSQQIFLTINQLVIMKQHQNISTMGGKIIAIALLAPLFGFSQPSTSKAAE
GDSAPSQATLAPAISAADMQASPSVQTAPTIVAAPQVPTASGLRLQQFLA
SVVDNNDEIKVQKLEWLSNERLLKASRGMYEPVLKVSATRESNHMQNTAQ
EYLQTYSQHYEFSEANNIWSSSIEGLTPFGSTYRLGYDYKKLQNSLQSAM
AVPTDEEYVTFLGLTLTQPLLKGSGQEATNANIRISRANADIAYEGYRQA
SVEAVARAVQLYWQCYGAQEKLAMRQRSATIAEELLQANKSRYEAGKVDY
TAVLDAESGLRLRQALVAAAEQTELTSRKNLLSLAGESAMAQVPATIRME
DVPDCSPLSPDYKQVYEKALTSYPQYLSALATVERENFRATYAHNQEKPQ
LDVKGSYGYNGLGTTVDNSLDRLGSTDFPSWSVGLELTFPLIGDMKSRNE
ATAARLKKEQAIRRLEMQKIELSNQMDIVAGLVSRVYSQVQNYEKVVAIN
AELVRIEDTRFKLGKSDTRMLLEREEEYLKVSESLLDSRLAYQYALVNLY
ALEGSLLTRYGLTLSDKTSATTLTQGM
>Cag_1908 ExbD/TolR family protein
MMTNGGKSRLMADINVTPFVDVMLVLLIIFMVTAPMMTHGVKVDTPQTTH
EKIDVDPRSVMVSLDGSGNLFVNDAKIPRSEIRERLPQLLNVKEVHEVYL
KADKSLPYGVVMEVMASIRDAGIEKIGMVTEPSVPAPQAGE