304 vlekvrye staal gelaste opgerolde buis / buis zhemiese zomponent, biosintetiese potensiaal van die globale mariene mikrobioom

Dankie dat jy Nature.com besoek het.Jy gebruik 'n blaaierweergawe met beperkte CSS-ondersteuning.Vir die beste ervaring, beveel ons aan dat jy 'n opgedateerde blaaier gebruik (of versoenbaarheidsmodus in Internet Explorer deaktiveer).Daarbenewens, om deurlopende ondersteuning te verseker, wys ons die webwerf sonder style en JavaScript.
Sliders wat drie artikels per skyfie wys.Gebruik die terug- en volgende-knoppies om deur die skyfies te beweeg, of die skyfiebeheerknoppies aan die einde om deur elke skyfie te beweeg.

Gedetailleerde produkbeskrywing

304 Vlekvrye staal gelaste opgerolde buis/buis
1. Spesifikasie: Vlekvrye staal spoelbuis / buis
2. Tipe: gesweis of naatloos
3. Standaard: ASTM A269, ASTM A249
4. Vlekvrye staal spoelbuis OD: 6mm tot 25.4MM
5. Lengte: 600-3500MM of soos per kliënt se vereiste.
6. Muurdikte: 0.2mm tot 2.0mm.

7. Toleransie: OD: +/-0.01mm;Dikte: +/-0.01%.

8. Spoel binneste gat grootte: 500MM-1500MM (kan aangepas word volgens die vereistes van die kliënt)

9. Spoelhoogte: 200MM-400MM (kan volgens klantvereistes aangepas word)

10. Oppervlak: Helder of uitgegloei
11. Materiaal: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, legering 625, 825, 2205, 2507, ens.
12. Verpakking: geweefde sakke in houtkas, houtpallet, houtskag, of volgens die kliënt se vereiste
13. Toets: chemiese komponent, treksterkte, treksterkte, hardheidmeting
14. Waarborg: Die derdeparty (byvoorbeeld :SGS TV ) inspeksie, ens.
15. Toepassing: Versiering, meubels, olievervoer, hitteruiler, reling maak, papier maak, motor, voedselverwerking, medies, ens.

Al die chemiese samestelling en fisiese eienskappe vir vlekvrye staal soos hieronder:

Materiaal ASTM A269 Chemiese Samestelling % Maks
C Mn P S Si Cr Ni Mo NB Nb Ti
TP304 0,08 2.00 0,045 0,030 1.00 18.0-20.0 8,0-11,0 ^ ^ ^ . ^
TP304L 0,035 2.00 0,045 0,030 1.00 18.0-20.0 8,0-12,0 ^ ^ ^ ^
TP316 0,08 2.00 0,045 0,030 1.00 16,0-18,0 10,0-14,0 2.00-3.00 ^ ^ ^
TP316L 0,035 D 2.00 0,045 0,030 1.00 16,0-18,0 10,0-15,0 2.00-3.00 ^ ^ ^
TP321 0,08 2.00 0,045 0,030 1.00 17,0-19,0 9,0-12,0 ^ ^ ^ 5C -0,70
TP347 0,08 2.00 0,045 0,030 1.00 17,0-19,0 9,0-12,0 10C -1,10 ^

 

Materiaal Hitte behandeling Temperatuur F (C) Min. Hardheid
Brinell Rockwell
TP304 Oplossing 1900 (1040) 192HBW/200HV 90HRB
TP304L Oplossing 1900 (1040) 192HBW/200HV 90HRB
TP316 Oplossing 1900(1040) 192HBW/200HV 90HRB
TP316L Oplossing 1900(1040) 192HBW/200HV 90HRB
TP321 Oplossing 1900(1040) F 192HBW/200HV 90HRB
TP347 Oplossing 1900(1040) 192HBW/200HV 90HRB

 

OD, duim OD Toleransie duim (mm) WT Toleransie % Lengte Tolernasie duim (mm)
+ -
≤ 1/2 ± 0,005 ( 0,13) ± 15 1/8 ( 3.2 ) 0
> 1/2 ~1 1/2 ± 0,005(0,13) ± 10 1/8 (3.2) 0
> 1 1/2 ~< 3 1/2 ± 0,010(0,25) ± 10 3/16 (4,8) 0
> 3 1/2 ~< 5 1/2 ± 0,015(0,38) ± 10 3/16 (4,8) 0
> 5 1/2 ~< 8 ± 0,030(0,76) ± 10 3/16 (4,8) 0
8~< 12 ± 0,040(1,01) ± 10 3/16 (4,8) 0
12~< 14 ± 0,050(1,26) ± 10 3/16 (4,8) 0

Natuurlike mikrobiese gemeenskappe is filogeneties en metabolies divers.Benewens onderbestudeerde groepe organismes1, hou hierdie diversiteit ook 'n ryk potensiaal in vir die ontdekking van ekologies en biotegnologies beduidende ensieme en biochemiese verbindings2,3.Om hierdie diversiteit te bestudeer om die genomiese weë te bepaal wat sulke verbindings sintetiseer en aan hul onderskeie gashere bind, bly egter 'n uitdaging.Die biosintetiese potensiaal van mikroörganismes in die oop oseaan bly grootliks onbekend as gevolg van beperkings in die ontleding van heelgenoom-resolusiedata op 'n globale skaal.Hier ondersoek ons ​​die diversiteit en diversiteit van biosintetiese geengroepe in die see deur ongeveer 10 000 mikrobiese genome van gekweekte selle en enkelselle te integreer met meer as 25 000 nuut gerekonstrueerde konsepgenome van meer as 1 000 seewatermonsters.Hierdie pogings het ongeveer 40 000 vermoedelike meestal nuwe biosintetiese geengroepe geïdentifiseer, waarvan sommige in voorheen onvermoede filogenetiese groepe gevind is.In hierdie populasies het ons 'n geslag geïdentifiseer wat verryk is in biosintetiese geengroepe ("Candidatus Eudormicrobiaceae") wat aan 'n ongekultiveerde bakteriese filum behoort en van die mees biosintetiese diverse mikroörganismes in hierdie omgewing ingesluit het.Hiervan het ons die fosfatase-peptied- en pitonamiedbane gekarakteriseer, wat onderskeidelik gevalle van ongewone bioaktiewe verbindingstruktuur en ensiemologie identifiseer.Ten slotte, hierdie studie demonstreer hoe mikrobioom-gebaseerde strategieë die verkenning van voorheen onbeskryfde ensieme en natuurlike voedsel in 'n swak verstaanbare mikrobiota en omgewing moontlik kan maak.
Mikrobes dryf globale biogeochemiese siklusse aan, handhaaf voedselwebbe en hou plante en diere gesond5.Hul enorme filogenetiese, metaboliese en funksionele diversiteit verteenwoordig 'n ryk potensiaal vir die ontdekking van nuwe taksa1, ensieme en biochemiese verbindings, insluitend natuurlike produkte6.In ekologiese gemeenskappe voorsien hierdie molekules aan mikroörganismes 'n verskeidenheid fisiologiese en ekologiese funksies, van kommunikasie tot kompetisie 2, 7 .Benewens hul oorspronklike funksies, bied hierdie natuurlike produkte en hul geneties gekodeerde produksieweë voorbeelde vir biotegnologiese en terapeutiese toepassings2,3.Die identifikasie van sulke paaie en verbindings is grootliks vergemaklik deur die studie van gekweekte mikrobes.Taksonomiese studies van natuurlike omgewings het egter getoon dat die oorgrote meerderheid mikroörganismes nie gekweek is nie8.Hierdie kulturele vooroordeel beperk ons ​​vermoë om die funksionele diversiteit wat deur baie mikrobes gekodeer word, te ontgin4,9.
Om hierdie beperkings te oorkom, het tegnologiese vooruitgang oor die afgelope dekade navorsers in staat gestel om direk (dws sonder voorafgaande kultuur) mikrobiese DNA-fragmente van hele gemeenskappe (metagenomika) of enkelselle te orden.Die vermoë om hierdie fragmente in groter genoomfragmente saam te stel en onderskeidelik verskeie metagenomies saamgestelde genome (MAGs) of enkelversterkte genome (SAGs) te rekonstrueer, bied 'n belangrike geleentheid vir taksosentriese studies van die mikrobioom (dws mikrobiese gemeenskappe en die mikrobioom).nuwe paaie baan.eie genetiese materiaal in 'n gegewe omgewing) 10,11,12.Inderdaad, onlangse studies het die filogenetiese voorstelling van mikrobiese diversiteit op Aarde1, 13 aansienlik uitgebrei en het baie van die funksionele diversiteit in individuele mikrobiese gemeenskappe aan die lig gebring wat nie voorheen deur gekweekte mikro-organisme-verwysingsgenoomvolgorde (REF's) gedek is nie14.Die vermoë om onontdekte funksionele diversiteit in die konteks van die gasheergenoom (dws genoomresolusie) te plaas is van kritieke belang vir die voorspelling van nog ongekarakteriseerde mikrobiese lyne wat vermoedelik nuwe natuurlike produkte kodeer15,16 of om sulke verbindings terug te spoor na hul oorspronklike vervaardiger17.Byvoorbeeld, 'n gekombineerde metagenomiese en enkelsel genomiese analise benadering het gelei tot die identifikasie van Candidatus Entotheonella, 'n groep metabolies ryk spons-geassosieerde bakterieë, as vervaardigers van 'n verskeidenheid geneesmiddelpotensiale18.Ten spyte van onlangse pogings tot genomiese verkenning van diverse mikrobiese gemeenskappe, ontbreek 16,19 meer as twee derdes van die globale metagenomiese data vir die aarde se grootste oseaan van ekosisteme16,20 steeds.Dus, oor die algemeen, bly die biosintetiese potensiaal van die mariene mikrobioom en sy potensiaal as 'n bewaarplek van nuwe ensiematiese en natuurlike produkte grootliks onderbestudeer.
Om die biosintetiese potensiaal van mariene mikrobiome op 'n globale skaal te verken, het ons eers mariene mikrobiese genome saamgevoeg wat verkry is deur gebruik te maak van kultuur-afhanklike en nie-kultuur metodes om 'n uitgebreide databasis van filogenetika en geenfunksie te skep.Ondersoek van hierdie databasis het 'n wye verskeidenheid biosintetiese geenklusters (BGC's) aan die lig gebring, waarvan die meeste aan nog ongekarakteriseerde geenkluster (GCF) families behoort.Daarbenewens het ons 'n onbekende bakteriese familie geïdentifiseer wat die hoogste bekende diversiteit van BGC's in die oop oseaan tot op datum toon.Ons het twee ribosomale sintese en post-translasie gemodifiseerde peptied (RiPP) paaie gekies vir eksperimentele validering gebaseer op hul genetiese verskille van tans bekende weë.Die funksionele karakterisering van hierdie weë het onverwagte voorbeelde van ensiemologie sowel as struktureel ongewone verbindings met protease-inhiberende aktiwiteit aan die lig gebring.
Aanvanklik het ons daarop gemik om 'n globale datahulpbron vir genoomanalise te skep, met die fokus op die bakteriese en argeale komponente daarvan.Vir hierdie doel het ons metagenomiese data en 1038 seewatermonsters van 215 wêreldwyd verspreide monsternemingsplekke (breedtegraadreeks = 141.6°) en verskeie diep lae (van 1 tot 5600 m in diepte, wat die pelagiese, mesopelagiese en afgrondsones dek) saamgevoeg.Agtergrond21,22,23 (Fig. 1a, uitgebreide data, Fig. 1a en Aanvullende Tabel 1).Benewens die verskaffing van 'n wye geografiese dekking, het hierdie selektief gefiltreerde monsters ons in staat gestel om verskeie komponente van die mariene mikrobioom te vergelyk, insluitend virusryk (<0.2 µm), prokarioties-ryk (0.2–3 µm), partikelryk (0.8 µm). ).–20 µm) en virus-uitgeputte (>0.2 µm) kolonies.
a, 'n Totaal van 1038 publiek beskikbare genome (metagenomika) van mariene mikrobiese gemeenskappe versamel vanaf 215 wêreldwyd verspreide liggings (62°S tot 79°N en 179°W tot 179°O .).Kaartteëls © Esri.Bronne: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ en Esri.b, hierdie metagenome is gebruik om MAG's (metodes en bykomende inligting), wat verskil in hoeveelheid en kwaliteit (metodes) in die datastelle (in kleur gemerk) te rekonstrueer.Die gerekonstrueerde MAG's is aangevul met publiek beskikbare (eksterne) genome, insluitend handgemaakte MAG26, SAG27 en REF.27 Stel OMD saam.c, in vergelyking met vorige verslae wat slegs op SAG (GORG)20 of MAG (GEM)16 gebaseer is, verbeter OMD die genomiese karakterisering van mariene mikrobiese gemeenskappe (metagenomiese leeskarteringtempo; metode) met twee tot drie keer met meer konsekwente voorstelling in diepte en breedtegraad..<0.2, n=151, 0.2-0.8, n=67, 0.2-3, n=180, 0.8-20, n=30, >0.2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD-groepering in spesiegroeperingsvlak (95% gemiddelde nukleotiedidentiteit) identifiseer 'n totaal van ongeveer 8300 spesies, waarvan meer as die helfte nie voorheen gekarakteriseer is volgens taksonomiese aantekeninge deur gebruik te maak van die GTDB (weergawe 89) e nie, klassifikasie van spesies volgens genoomtipe het getoon dat MAG, SAG en REF's mekaar goed aanvul in die weerspieëling van die filogenetiese diversiteit van die mariene mikrobioom.Veral 55%, 26% en 11% van die spesies was onderskeidelik spesifiek vir MAG, SAG en REF.BATSE, Bermuda Atlantic Time Series;GEM, genome van die Aarde se mikrobioom;GORG, globale oseaan verwysing genoom;WARM, Hawaiian Ocean-tydreeks.
Deur hierdie datastel te gebruik, het ons 'n totaal van 26 293 MAG's gerekonstrueer, meestal bakteriële en argeale (Fig. 1b en uitgebreide data, Fig. 1b).Ons het hierdie MAG's geskep uit samestellings van afsonderlike eerder as saamgevoegde metagenomiese monsters om die ineenstorting van natuurlike volgordevariasie tussen monsters vanaf verskillende plekke of tydpunte (metodes) te voorkom.Daarbenewens het ons genomiese fragmente gegroepeer op grond van hul voorkoms-korrelasies oor 'n groot aantal monsters (van 58 tot 610 monsters, afhangende van opname; metode).Ons het gevind dat dit 'n tydrowende maar belangrike stap24 is wat in verskeie grootskaalse MAG16, 19, 25-rekonstruksiewerke oorgeslaan is en die hoeveelheid (gemiddeld 2,7-voudig) en kwaliteit (+20% gemiddeld) van die genoom.gerekonstrueer vanaf die mariene metagenoom wat hier bestudeer is (uitgebreide data, Fig. 2a en bykomende inligting).In die geheel het hierdie pogings gelei tot 'n 4,5-voudige toename in mariene mikrobiese MAG's (6-voudig as slegs hoëgehalte-MAG's in ag geneem word) in vergelyking met die mees omvattende MAG-hulpbron wat vandag beskikbaar is16 (Metodes).Hierdie nuutgeskepte MAG-stel is toe gekombineer met 830 met die hand uitgesoekte MAG26's, 5969 SAG27's en 1707 REF's.Sewe-en-twintig spesies mariene bakterieë en archaea het 'n kombinatoriese versameling van 34 799 genome uitgemaak (Fig. 1b).
Ons het toe die nuutgeskepte hulpbron geëvalueer om sy vermoë om mariene mikrobiese gemeenskappe te verteenwoordig te verbeter en die impak van die integrasie van verskillende genoomtipes te evalueer.Ons het gemiddeld gevind dat dit ongeveer 40-60% van mariene metagenomiese data dek (Figuur 1c), twee tot drie keer die dekking van vorige MAG-net verslae in beide diepte en breedtegraad More serial 16 of SAG20.Daarbenewens, om sistematies taksonomiese diversiteit in gevestigde versamelings te meet, het ons alle genome geannoteer met behulp van die Genome Taksonomy Database (GTDB) gereedskapstel (metodes) en 'n gemiddelde genoomwye nukleotiedidentiteit van 95% gebruik.28 om 8 304 spesiegroepe (spesies) te identifiseer.Twee-derdes van hierdie spesies (insluitend nuwe klades) het nie voorheen in die GTDB verskyn nie, waarvan 2790 ontdek is met behulp van die MAG wat in hierdie studie gerekonstrueer is (Fig. 1d).Daarbenewens het ons gevind dat verskillende tipes genome hoogs aanvullend is: 55%, 26% en 11% van spesies is onderskeidelik geheel en al saamgestel uit MAG, SAG en REF (Fig. 1e).Daarbenewens het MAG al 49 tipes wat in die waterkolom gevind is, gedek, terwyl SAG en REF slegs 18 en 11 van hulle onderskeidelik verteenwoordig het.SAG verteenwoordig egter beter die diversiteit van die mees algemene klades (uitgebreide data, Fig. 3a), soos Pelagic Bacteriales (SAR11), met SAG wat amper 1300 spesies dek en MAG slegs 390 spesies.Veral, REF's het selde oorvleuel met MAG's of SAG's op spesievlak en verteenwoordig >95% van die ongeveer 1000 genome wat nie gevind word in die oop oseaan metagenomiese stelle wat hier bestudeer is nie, hoofsaaklik as gevolg van interaksies met ander tipes geïsoleerde verteenwoordigende mariene monsters (bv. sedimente) .of gasheer-assosieerde).Om dit wyd aan die wetenskaplike gemeenskap beskikbaar te stel, kan hierdie mariene genoomhulpbron, wat ook ongeklassifiseerde fragmente insluit (bv. van voorspelde fage, genomiese eilande en genoomfragmente waarvoor daar onvoldoende data vir MAG-rekonstruksie is), vergelyk word met taksonomiese data .Toegang tot annotasies saam met geenfunksie en kontekstuele parameters in die Ocean Microbiology Database (OMD; https://microbiomics.io/ocean/).
Ons het toe begin om die rykdom en nuutheid van biosintetiese potensiaal in oop oseaan mikrobiome te verken.Vir hierdie doel het ons eers antiSMASH gebruik vir alle MAG's, SAG's en REF's wat in 1038 mariene metagenome (metodes) gevind is om 'n totaal van 39,055 BGC's te voorspel.Ons het dit dan gegroepeer in 6907 nie-oortollige GCF's en 151 geengroeperingspopulasies (GCC's; Aanvullende Tabel 2 en metodes) om rekening te hou met inherente oortolligheid (dws dieselfde BGC kan in veelvuldige genome gekodeer word) en metagenomiese data Fragmentasie van gekonsentreerde BGC's.Onvolledige BGC's het nie, indien enige (Aanvullende Inligting), onderskeidelik die aantal GCF's en GCC's wat ten minste een ongeskonde BGC-lid bevat, aansienlik verhoog in 44% en 86% van gevalle nie.
Op die GCC-vlak het ons 'n wye verskeidenheid voorspelde RiPP's en ander natuurlike produkte gevind (Fig. 2a).Onder hulle, byvoorbeeld, behoort arielpoliene, karotenoïede, ektoiene en siderofore aan GCC's met 'n wye filogenetiese verspreiding en 'n hoë oorvloed in oseaniese metagenome, wat kan dui op 'n wye aanpassing van mikroörganismes tot die mariene omgewing, insluitend weerstand teen reaktiewe suurstofspesies, oksidatiewe en osmotiese stres..of ysterabsorpsie (meer inligting).Hierdie funksionele diversiteit staan ​​in kontras met 'n onlangse ontleding van ongeveer 1,2 miljoen BGC's onder ongeveer 190 000 genome wat in die NCBI RefSeq-databasis (BiG-FAM/RefSeq, hierna verwys as RefSeq)29 gestoor is, wat getoon het dat nie-ribosomale Sintetase-peptiede (NRPS) en polyketied (PKS) BGC's (Aanvullende Inligting).Ons het ook 44 (29%) GCC's gevind wat net ver verwant is aan enige RefSeq BGC (\(\bar{d}\)RefSeq > 0.4; Fig. 2a en metodes) en 53 (35%) GCC's slegs in MAG , wat die potensiaal beklemtoon. om voorheen onbeskryfde chemikalieë in OMD op te spoor.Aangesien elkeen van hierdie GCC's waarskynlik hoogs diverse biosintetiese funksies verteenwoordig, het ons data verder op die GCF-vlak ontleed in 'n poging om 'n meer gedetailleerde groepering van BGC's te verskaf wat voorspel word om vir soortgelyke natuurlike produkte te kodeer29.'n Totaal van 3861 (56%) geïdentifiseerde GCF's het nie met RefSeq oorvleuel nie, en >97% van GCF's was nie teenwoordig in MIBiG nie, een van die grootste databasisse van eksperimenteel bekragtigde BGC's (Figuur 2b).Alhoewel dit nie verbasend is om baie potensiële nuwe roetes te ontdek in omgewings wat nie goed verteenwoordig word deur die verwysingsgenoom nie, verskil ons metode om BGC's in GCF's te dereplikeer voor benchmarking van vorige verslae 16 en stel ons in staat om 'n onbevooroordeelde beoordeling van nuwigheid te verskaf.Die meeste van die nuwe diversiteit (3012 GCF of 78%) stem ooreen met voorspelde terpene, RiPP of ander natuurlike produkte, en die meeste (1815 GCF of 47%) word in onbekende tipes geënkodeer as gevolg van hul biosintetiese potensiaal.Anders as PKS- en NRPS-klusters, is hierdie kompakte BGC's minder geneig om gefragmenteer te word tydens metagenomiese samestelling 31 en laat meer tyd- en hulpbron-intensiewe funksionele karakterisering van hul produkte toe.
'n Totaal van 39 055 BGC's is in 6 907 GCF'e en 151 GCC'e gegroepeer.a, datavoorstelling (intern ekstern).Hiërargiese groepering van BGC-afstande gebaseer op GCC, waarvan 53 slegs deur MAG vasgestel word.Die GCC bevat BGC's van verskillende taksa (ln-getransformeerde hekfrekwensie) en verskillende BGC-klasse (sirkelgrootte stem ooreen met sy frekwensie).Vir elke GCC verteenwoordig die buitenste laag die aantal BGC's, die voorkoms (persentasie van monsters) en die afstand (minimum BGC cosinusafstand (min(dMIBiG))) vanaf BiG-FAM na BGC.GCC's met BGC's wat nou verwant is aan eksperimenteel geverifieerde BGC's (MIBiG) word met pyle uitgelig.b Deur GCF met voorspelde (BiG-FAM) en eksperimenteel bekragtigde (MIBiG) BGC's te vergelyk, is 3861 nuwe (d–>0.2) GCF'e gevind.Die meeste (78%) hiervan kodeer vir RiPP, terpene en ander vermeende natuurlike produkte.c, alle genome in die OMD gevind in 1038 mariene metagenome is in die GTDB basisboom geplaas om die filogenetiese dekking van die OMD te wys.Klades sonder enige genome in die OMD word in grys getoon.Die aantal BGCs stem ooreen met die grootste aantal voorspelde BGCs per genoom in 'n gegewe klade.Vir duidelikheid is die laaste 15% van die nodusse ingevou.Pyle dui klades aan wat ryk is aan BGC (>15 BGC), met die uitsondering van Mycobacterium, Gordonia (slegs tweede na Rhodococcus), en Crocosphaera (tweede slegs na Synechococcus).d, Onbekend c.Eremiobacterota het die hoogste biosintetiese diversiteit getoon (Shannon-indeks gebaseer op natuurlike produktipe).Elke band verteenwoordig die genoom met die meeste BGC's in die spesie.T1PKS, PKS tipe I, T2/3PKS, PKS tipe II en tipe III.
Benewens rykdom en nuutheid, ondersoek ons ​​die biogeografiese struktuur van die biosintetiese potensiaal van die mariene mikrobioom.Groepering van monsters volgens gemiddelde metagenomiese GCF-kopiegetalverspreiding (Metodes) het getoon dat lae-breedtegraad, oppervlak, prokariotiese-ryk en virus-arm gemeenskappe, meestal van oppervlak of dieper sonlig water, ryk was aan RiPP en BGC terpene.Daarteenoor is pool-, diepsee-, virus- en partikelryke gemeenskappe geassosieer met hoër oorvloede NRPS en PKS BGC (uitgebreide data, Fig. 4 en bykomende inligting).Ten slotte het ons gevind dat goed bestudeerde tropiese en pelagiese gemeenskappe die mees belowende bronne van nuwe terpene is (Augmented Data Figure).Hoogste potensiaal vir PKS, RiPP en ander natuurlike produkte (Figuur 5a met uitgebreide data).
Om ons studie van die biosintetiese potensiaal van mariene mikrobiome aan te vul, het ons daarop gemik om hul filogenetiese verspreiding te karteer en nuwe BGC-verrykte klades te identifiseer.Vir hierdie doel het ons die genome van mariene mikrobes in 'n genormaliseerde GTDB13 bakteriële en argaeale filogenetiese boom geplaas en die vermeende biosintetiese paaie wat hulle kodeer, oorgelê (Fig. 2c).Ons het verskeie BGC-verrykte klades (verteenwoordig deur meer as 15 BGCs) maklik opgespoor in seewatermonsters (metodes) wat bekend is vir hul biosintetiese potensiaal, soos sianobakterieë (Synechococcus) en Proteus-bakterieë, soos Tistrella32,33, of het onlangs aandag getrek vir hul natuurlike produkte.soos Myxococcota (Sandaracinaceae), Rhodococcus en Planctomycetota34,35,36.Interessant genoeg het ons verskeie voorheen onontginde afstammelinge in hierdie klades gevind.Byvoorbeeld, daardie spesies met die rykste biosintetiese potensiaal in die filums Planctomycetota en Myxococcota het onderskeidelik aan ongekarakteriseerde kandidaatordes en genera behoort (Aanvullende Tabel 3).Saamgevat dui dit daarop dat die OMD toegang bied tot voorheen onbekende filogenetiese inligting, insluitend mikroörganismes, wat nuwe teikens vir ensiem- en natuurlike produkontdekking kan verteenwoordig.
Vervolgens het ons die BGC-verrykte klade gekarakteriseer deur nie net die maksimum aantal BGC's te tel wat deur sy lede geënkodeer is nie, maar ook deur die diversiteit van hierdie BGC's te assesseer, wat die frekwensie van verskillende tipes natuurlike kandidaatprodukte verduidelik (Fig. 2c en metodes) )..Ons het gevind dat die mees biosinteties diverse spesies verteenwoordig is deur spesiaal gemanipuleerde bakteriese MAG's in hierdie studie.Hierdie bakterieë behoort aan die ongekultiveerde filum Candidatus Eremiobacterota, wat grootliks onontgin bly, afgesien van 'n paar genomiese studies37,38.Dit is opmerklik dat “ca.Die genus Eremiobacterota is slegs in 'n terrestriële omgewing ontleed39 en dit is nie bekend dat dit enige lede insluit wat in BGC verryk is nie.Hier het ons agt MAG's van dieselfde spesie gerekonstrueer (nukleotiedidentiteit > 99%) 23. Ons stel dus die spesienaam "Candidatus Eudoremicrobium malaspinii" voor, vernoem na die nereid (see-nimf), 'n pragtige geskenk in Griekse mitologie en ekspedisies.'Ka.Volgens filogenetiese annotasie 13 het E. malaspinii geen voorheen bekende familielede onder die volgordevlak nie en behoort dus aan 'n nuwe bakteriese familie wat ons voorstel “Ca.E. malaspinii" as die tipe spesie en "Ca.Eudormicrobiaceae” as die amptelike naam (Aanvullende inligting).Kort metagenomiese rekonstruksie van 'Ca.Die E. malaspinii genoomprojek is bekragtig deur baie lae insette, lang gelees metagenomiese volgordebepaling en geteikende samestelling van 'n enkele monster (Metodes) as 'n enkele 9.63 Mb lineêre chromosoom met 'n 75 kb duplisering.as die enigste oorblywende onduidelikheid.
Om die filogenetiese konteks van hierdie spesie vas te stel, het ons gesoek na 40 nouverwante spesies in addisionele eukarioties-verrykte metagenomiese monsters van die Tara Oseaan-ekspedisie deur doelgerigte genoomrekonstruksie.Kortliks, ons het metagenomiese leeswerk gekoppel aan genomiese fragmente wat verband hou met "Ca.E. malaspinii” en het veronderstel dat 'n verhoogde werwingsyfer in hierdie steekproef die teenwoordigheid van ander familielede (metodes) aandui.As gevolg hiervan, het ons 10 MAG's gevind, 'n kombinasie van 19 MAG's wat vyf spesies in drie genera verteenwoordig binne 'n nuut gedefinieerde familie (dws "Ca. Eudormicrobiaceae").Na handmatige inspeksie en kwaliteitbeheer (uitgebreide data, Fig. 6 en bykomende inligting), het ons gevind dat "Ca.Eudormicrobiaceae spesies bied groter genome (8 Mb) en ryker biosintetiese potensiaal (14 tot 22 BGC per spesie) as ander "Ca" lede.Clade Eremiobacterota (tot 7 BGC) (Fig. 3a–c).
a, Filogenetiese posisies van die vyf 'Ca.Spesies van Eudormicrobiaceae het BGC-rykheid getoon spesifiek vir die mariene lyne wat in hierdie studie geïdentifiseer is.Die filogenetiese boom sluit alle 'Ca.MAG Eremiobacterota en lede van ander filums (genoomgetalle tussen hakies) verskaf in GTDB (weergawe 89) is gebruik vir evolusionêre agtergrond (Metodes).Die buitenste lae verteenwoordig klassifikasies op gesinsvlak (“Ca. Eudormicrobiaceae” en “Ca. Xenobiaceae”) en op klasvlak (“Ca. Eremiobacteria”).Die vyf spesies wat in hierdie studie beskryf word, word voorgestel deur alfanumeriese kodes en voorgestelde binomiale name (Aanvullende Inligting).b, ok.Eudormicrobiaceae-spesies deel sewe algemene BGC-kerne.Die afwesigheid van BGC in die A2-klade was as gevolg van die onvolledigheid van die verteenwoordigende MAG (Aanvullende Tabel 3).BGC's is spesifiek vir "Ca.Amphithomicrobium” en “Ca.Amphithomicrobium” (klade A en B) word nie getoon nie.c, Alle BGC's geënkodeer as "Ca.Eudoremicrobium taraoceanii is gevind om uitgedruk te word in 623 metatranskriptome wat uit die oseane van Tara geneem is.Soliede sirkels dui aktiewe transkripsie aan.Oranje sirkels dui log2-getransformeerde vouveranderinge aan onder en bokant die huishouding geen-uitdrukkingtempo (metodes).d, relatiewe oorvloedkrommes (metodes) wat 'Ca.Spesies van Eudormicrobiaceae is wydverspreid in die meeste seebekkens en in die hele waterkolom (vanaf die oppervlak tot 'n diepte van minstens 4000 m).Gebaseer op hierdie skattings, het ons gevind dat 'Ca.E. malaspinii' is verantwoordelik vir tot 6% van prokariotiese selle in diepsee pelagiese graan-geassosieerde gemeenskappe.Ons het 'n spesie as teenwoordig op 'n terrein beskou as dit gevind word in enige fraksie van die grootte van 'n gegewe dieptelaag.IO – Indiese Oseaan, NAO – Noord-Atlantiese Oseaan, NPO – Noord-Stille Oseaan, RS – Rooi See, SAO – Suid-Atlantiese Oseaan, SO – Suidelike Oseaan, SPO – Suid-Stille Oseaan.
Bestudeer die oorvloed en verspreiding van Ca.Eudormicrobiaceae, wat, soos ons gevind het, oorheers in die meeste seebekkens, sowel as in die hele waterkolom (Fig. 3d).Plaaslik maak hulle 6% van die mariene mikrobiese gemeenskap uit, wat hulle 'n belangrike deel van die globale mariene mikrobioom maak.Daarbenewens het ons die relatiewe inhoud van Ca gevind.Eudormicrobiaceae spesies en hul BGC uitdrukkingsvlakke was die hoogste in die eukariotiese verrykte fraksie (Fig. 3c en uitgebreide data, Fig. 7), wat 'n moontlike interaksie met deeltjies, insluitend plankton, aandui.Hierdie waarneming het 'n mate van ooreenkoms met 'Ca.Eudoremicrobium BGC's wat sitotoksiese natuurlike produkte deur bekende weë produseer, kan roofgedrag toon (Aanvullende Inligting en Uitgebreide Data, Figuur 8), soortgelyk aan ander roofdiere wat spesifiek metaboliete soos Myxococcus41 produseer.Ontdekking van Ca.Eudormicrobiaceae in minder beskikbare (diep oseaan) of eukariotiese eerder as prokariotiese monsters kan verklaar waarom hierdie bakterieë en hul onverwagte BGC-diversiteit onduidelik bly in die konteks van natuurlike voedselnavorsing.
Uiteindelik het ons probeer om die belofte van ons mikrobioom-gebaseerde werk eksperimenteel te bekragtig om nuwe weë, ensieme en natuurlike produkte te ontdek.Onder die verskillende klasse BGC's is dit bekend dat die RiPP-weg 'n ryk chemiese en funksionele diversiteit kodeer as gevolg van verskeie post-translasionele modifikasies van die kernpeptied deur volwasse ensieme42.So ons het twee 'Ca.Eudoremicrobium' RiPP BGC's (Figure 3b en 4a-e) is gebaseer op dieselfde as enige bekende BGC (\(\bar{d}\)MIBiG en \(\bar{d}\)RefSeq bo 0.2) .
a–c, In vitro heteroloë uitdrukking en in vitro ensiematiese toetse van 'n nuwe (\(\bar{d}\)RefSeq = 0.29) groep van RiPP biosintese spesifiek vir diepsee Ca spesies.E. malaspinii' het gelei tot die produksie van gedifosforileerde produkte.c, modifikasies geïdentifiseer deur gebruik te maak van hoë-resolusie (HR) MS/MS (fragmentasie aangedui deur b- en y-ione in die chemiese struktuur) en KMR (uitgebreide data, Fig. 9).d, hierdie gefosforileerde peptied toon lae mikromolêre inhibisie van soogdierneutrofielelastase, wat nie in die kontrolepeptied en die dehidrerende peptied gevind word nie (chemiese verwydering geïnduseerde dehidrasie).Die eksperiment is drie keer herhaal met soortgelyke resultate.Byvoorbeeld, heteroloë uitdrukking van 'n tweede nuwe \(\bar{d}\)RefSeq = 0.33) groep van proteïenbiosintese verduidelik die funksie van vier volwasse ensieme wat die 46 aminosuur kernpeptied modifiseer.Residue word gekleur volgens die plek van modifikasie wat voorspel word deur HR-MS/MS, isotoop-etikettering en KMR-analise (Aanvullende Inligting).Gestreepte kleur dui aan dat die modifikasie by enige van die twee residue plaasvind.Die figuur is 'n samestelling van talle heteroloë konstrukte om die aktiwiteit van alle volwasse ensieme op dieselfde kern aan te toon.h, Illustrasie van KMR data vir ruggraat amied N-metilering.Volledige resultate word in fig.10 met uitgebreide data.i, Filogenetiese posisie van die volwasse FkbM-proteïenkluster-ensiem onder alle FkbM-domeine wat in die MIBiG 2.0-databasis gevind word, openbaar 'n ensiem van hierdie familie met N-metieltransferase-aktiwiteit (Aanvullende Inligting).Skematiese diagramme van BGC's (a, e), voorloperpeptiedstrukture (b, f), en vermeende chemiese strukture van natuurlike produkte (c, g) word getoon.
Die eerste RiPP-pad (\(\bar{d}\)MIBiG = 0.41, \(\bar{d}\)RefSeq = 0.29) is slegs in diepseespesies “Ca.E. malaspinii” en kodes vir Peptied-voorloper (Fig. 4a, b).In hierdie volwasse ensiem het ons 'n enkele funksionele domein geïdentifiseer wat homoloog is aan die dehidrasiedomein van lantipeptied sintase wat normaalweg fosforilering en die daaropvolgende verwydering van 43 kataliseer (Aanvullende Inligting).Daarom voorspel ons dat die modifikasie van die voorloper-peptied so 'n twee-stap dehidrasie behels.Met behulp van tandem massaspektrometrie (MS/MS) en kernmagnetiese resonansspektroskopie (KMR), het ons egter 'n polifosforileerde lineêre peptied geïdentifiseer (Fig. 4c).Alhoewel dit onverwags was, het ons verskeie bewyse gevind om dit die eindproduk te ondersteun: twee verskillende heteroloë gashere en geen dehidrasie in in vitro-toetse nie, identifikasie van sleutelresidu wat in die katalitiese dehidrasieplek van die volwasse ensiem gemuteer is.alles gerekonstrueer deur "Ca".Die E. malaspinii-genoom (uitgebreide data, Fig. 9 en bykomende inligting) en, laastens, die biologiese aktiwiteit van die gefosforileerde produk, maar nie die chemies gesintetiseerde gedehidreerde vorm nie (Fig. 4d).Trouens, ons het gevind dat dit 'n lae mikromolêre protease inhiberende aktiwiteit teen neutrofiel elastase vertoon, vergelykbaar met ander verwante natuurlike produkte in die konsentrasiereeks (IC50 = 14.3 μM) 44, ten spyte van die feit dat die ekologiese rol nog toegelig moet word.Op grond van hierdie resultate stel ons voor om die pad "fosfeptien" te noem.
Die tweede geval is 'n komplekse RiPP-pad spesifiek vir 'Ca.Die genus Eudoremicrobium (\(\bar{d}\)MIBiG = 0.46, \(\bar{d}\)RefSeq = 0.33) is voorspel om natuurlike proteïenprodukte te kodeer (Fig. 4e).Hierdie weë is van besondere biotegnologiese belang as gevolg van die verwagte digtheid en verskeidenheid van ongewone chemiese modifikasies wat gevestig is deur die ensieme wat deur die relatief kort BGCs45 gekodeer word.Ons het gevind dat hierdie proteïen verskil van voorheen gekarakteriseerde proteïene deurdat dit beide die hoof NX5N-motief van poliseramiede en die lantionienlus van landornamiede 46 ontbreek.Om die beperkings van algemene heteroloë uitdrukkingspatrone te oorkom, het ons dit saam met 'n pasgemaakte Microvirgula aerodenitrificans-stelsel gebruik om vier volwasse padensieme (metodes) te karakteriseer.Deur 'n kombinasie van MS/MS, isotoop-etikettering en KMR te gebruik, het ons hierdie volwasse ensieme in die 46-aminosuurkern van die peptied opgespoor (Fig. 4f, g, uitgebreide data, Fig. 10-12 en bykomende inligting).Onder volwasse ensieme het ons die eerste verskyning van 'n FkbM O-metieltransferase familielid 47 in die RiPP pad gekarakteriseer en onverwags gevind dat hierdie volwasse ensiem ruggraat N-metilering bekendstel (Fig. 4h, i en bykomende inligting).Alhoewel hierdie modifikasie in natuurlike NRP48 produkte bekend is, is ensiematiese N-metilering van amiedbindings 'n komplekse maar biotegnologies beduidende reaksie49 wat tot dusver van belang was vir die RiPP familie van borosiene.Spesifisiteit 50,51.Die identifikasie van hierdie aktiwiteit in ander families van ensieme en RiPP kan nuwe toepassings oopmaak en die funksionele diversiteit van proteïene 52 en hul chemiese diversiteit uitbrei.Gebaseer op die geïdentifiseerde wysigings en die ongewone lengte van die voorgestelde produkstruktuur, stel ons 'n padnaam "pytonamied" voor.
Die ontdekking van 'n onverwagte ensiemologie in 'n funksioneel gekarakteriseerde familie van ensieme illustreer die belofte van omgewingsgenomika vir nuwe ontdekkings, en illustreer ook die beperkte kapasiteit vir funksionele inferensie gebaseer op volgordehomologie alleen.Dus, tesame met verslae van nie-kanoniese bioaktiewe polyfosforileerde RiPPs, toon ons resultate hulpbron-intensiewe maar kritieke waarde vir sintetiese biologie pogings om die funksionele rykdom, diversiteit en ongewone strukture van biochemiese verbindings ten volle te ontbloot.
Hier demonstreer ons die reeks biosintetiese potensiaal wat deur mikrobes gekodeer word en hul genomiese konteks in die globale mariene mikrobioom, wat toekomstige navorsing vergemaklik deur die resulterende hulpbron aan die wetenskaplike gemeenskap beskikbaar te stel (https://microbiomics.io/ocean/).Ons het gevind dat baie van sy filogenetiese en funksionele nuwigheid slegs verkry kan word deur MAG's en SAG's te rekonstrueer, veral in onderbenutte mikrobiese gemeenskappe wat toekomstige bioprospekteerpogings kan lei.Alhoewel ons hier op 'Ca.Eudormicrobiaceae" as 'n geslag veral biosinteties "talentvol", baie van die BGC's wat in die onontdekte mikrobiota voorspel word, kodeer waarskynlik voorheen onbeskrewe ensiemologieë wat verbindings met omgewings- en/of biotegnologies beduidende aksies lewer.
Metagenomiese datastelle van groot oseanografiese en tydreeksstudies met voldoende volgordebepalingsdiepte is ingesluit om dekking van globale mariene mikrobiese gemeenskappe in seebekkens, diep lae en oor tyd te maksimeer.Hierdie datastelle (Aanvullende Tabel 1 en Figuur 1) sluit in metagenomika van monsters wat in die oseane van Tara versamel is (viraal verryk, n=190; prokarioties verryk, n=180)12,22 en die BioGEOTRACES-ekspedisie (n=480).Hawaiian Oceanic Time Series (HOT, n = 68), Bermuda-Atlantic Time Series (BATS, n = 62)21 en die Malaspina-ekspedisie (n = 58)23.Volgorde-lesings van alle metagenomiese fragmente is gefiltreer vir kwaliteit deur gebruik te maak van BBMap (v.38.71) deur volgordebepalingsadapters van lees te verwyder, leeswerk wat na kwaliteitbeheerreekse (PhiX-genome gekarteer is) te verwyder en trimq=14 te gebruik, maq=20 weggooi swak leeskwaliteit, maxns = 0 en minlength = 45. Daaropvolgende ontledings is uitgevoer of saamgevoeg met QC-lesings indien gespesifiseer (bbmerge.sh minoverlap=16).QC-lesings is genormaliseer (bbnorm.sh-teiken = 40, minddepth = 0) voor bou deur metaSPAdes (v.3.11.1 of v.3.12 indien nodig)53.Die gevolglike steier-kontigs (hierna na verwys as steiers) is uiteindelik volgens lengte (≥1 kb) gefiltreer.
Die 1038 metagenomiese monsters is in groepe verdeel, en vir elke groep monsters is die metagenomiese kwaliteitskontrolelees van alle monsters afsonderlik by die hakies van elke monster gepas, wat gelei het tot die volgende aantal paarsgewyse groeplesings: Tara Mariene Virusse – Verryk (190×190), Prokariote Verryk (180×180), BioGEOTRACES, WARM en VLEERMURE (610×610) en Malaspina (58×58).Kartering is gedoen met behulp van Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 wat dit moontlik maak om lesings by sekondêre terreine te pas (met die -a vlag).Belynings is gefiltreer om ten minste 45 basisse lank te wees, het ≥97% identiteit, en span ≥80% lees.Die gevolglike BAM-lêers is verwerk met behulp van die jgi_summarize_bam_contig_depths-skrip vir MetaBAT2 (v.2.12.1)55 om intra- en inter-steekproef dekking vir elke groep te verskaf.Laastens is hakies gegroepeer om sensitiwiteit te verhoog deur MetaBAT2 individueel op alle monsters te laat loop met –minContig 2000 en –maxEdges 500. Ons gebruik MetaBAT2 in plaas van 'n ensemblebokser omdat dit in onafhanklike toetse getoon is dat dit die doeltreffendste enkelbokser is.en 10 tot 50 keer vinniger as ander algemeen gebruikte boksers57.Om te toets vir die effek van oorvloed korrelasies, het 'n ewekansige geselekteerde substeekproef van metagenomika (10 vir elk van die twee Tara Ocean-datastelle, 10 vir BioGEOTRACES, 5 vir elke tydreeks en 5 vir Malaspina) addisioneel slegs monsters gebruik.Interne monsters word gegroepeer om dekkingsinligting te verkry.(Bykomende inligting).
Bykomende (eksterne) genome is by die daaropvolgende analise ingesluit, naamlik 830 met die hand geselekteerde MAG's uit 'n subset van die Tara Oceans26-datastel, 5287 SAG's uit die GORG20-datastel, en data van die MAR-databasis (MarDB v. 4) van 1707 geïsoleerde REF's en 682 SAG'e) 27. Vir die MarDB-datastel word genome geselekteer op grond van beskikbare metadata as die monstertipe ooreenstem met die volgende gereelde uitdrukking: '[S|s]ingle.?[C|c]ell|[C|c]kultuur| [I|i] geïsoleer'.
Die kwaliteit van elke metagenomiese houer en eksterne genome is geassesseer met behulp van CheckM (v.1.0.13) en Anvi'o's Lineage Workflow (v.5.5.0)58,59.As CheckM of Anvi'o ≥50% volledigheid/volledigheid en ≤10% kontaminasie/oortolligheid rapporteer, stoor dan metagenomiese selle en eksterne genome vir latere ontleding.Hierdie tellings is dan gekombineer in gemiddelde volledigheid (mcpl) en gemiddelde kontaminasie (mctn) om genoomkwaliteit volgens gemeenskapskriteria60 soos volg te klassifiseer: hoë kwaliteit: mcpl ≥ 90% en mctn ≤ 5%;goeie gehalte: mcpl ≥ 70%, mctn ≤ 10%, medium kwaliteit: mcpl ≥ 50% en mctn ≤ 10%, billike gehalte: mcpl ≤ 90% of mctn ≥ 10%.Die gefiltreerde genome is dan soos volg met kwaliteittellings (Q en Q') gekorreleer: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (stamveranderlikheid)/100 + 0.5 x log[N50] .(geïmplementeer in dRep61).
Om vergelykende analise tussen verskillende databronne en genoomtipes (MAG, SAG en REF) moontlik te maak, is 34 799 genome afgewys op grond van genoomwye gemiddelde nukleotiedidentiteit (ANI) met behulp van dRep (v.2.5.4).Herhaal)61 met 95% ANI-drempels28,62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) en enkelkopie-merkergene wat SpecI63 gebruik wat genoomgroepering op spesievlak verskaf.'n Verteenwoordigende genoom is vir elke dRep-kluster geselekteer volgens die maksimum kwaliteittelling (Q') hierbo gedefinieer, wat as verteenwoordigend van die spesie beskou is.
Om die karteringspoed te evalueer, is BWA (v.0.7.17-r1188, -a) gebruik om al 1038 stelle metagenomiese leeswerk te karteer met 34 799 genome wat in die OMD vervat is.Kwaliteit-beheerde lesings is in enkel-einde-modus gekarteer en die gevolglike belynings is gefiltreer om slegs belynings ≥45 bp in lengte te behou.en identiteit ≥95%.Die vertoonverhouding vir elke monster is die persentasie lesings wat oorbly na filtrasie gedeel deur die totale aantal kwaliteitbeheerlesings.Deur dieselfde benadering te gebruik, is elk van die 1038 metagenome verminder tot 5 miljoen insetsels (uitgebreide data, Fig. 1c) en by GORG SAG in OMD en in alle GEM16 aangepas.Die hoeveelheid MAG's wat uit seewater in die GEM16-katalogus herwin is, is bepaal deur sleutelwoordnavrae van metagenomiese bronne, deur seewatermonsters te kies (bv. in teenstelling met mariene sedimente).Ons kies spesifiek "akwaties" as "ekosisteem_kategorie", "mariene" as "ekosisteem_tipe", en filtreer "habitat" as "diep oseaan", "mariene", "maritieme oseanies", "pelagiese mariene", "seewater" , "Oseaan", "Seewater", "Opervlakte Seewater", "Opervlakte Seewater".Dit het gelei tot 5903 MAG's (734 hoë kwaliteit) versprei oor 1823 OTU's (kyke hier).
Prokariotiese genome is taksonomies geannoteer met behulp van GTDB-Tk (v.1.0.2)64 met verstekparameters wat GTDB r89 weergawe 13 teiken. Anvi'o is gebruik om eukariotiese genome te identifiseer gebaseer op domeinvoorspelling en herroeping ≥50% en oortolligheid ≤ 10%.Die taksonomiese annotasie van 'n spesie word gedefinieer as een van sy verteenwoordigende genome.Met die uitsondering van eukariote (148 MAG), is elke genoom eers funksioneel geannoteer deur gebruik te maak van prokka (v.1.14.5)65, die naam van volledige gene, die definisie van "archaea" of "bakterieë" parameters soos nodig, wat ook gerapporteer word vir nie- koderende gene.en CRISPR-streke, onder andere genomiese kenmerke.Annoteer voorspelde gene deur universele enkelkopie-merkergene (uscMG) te identifiseer deur gebruik te maak van fetchMG (v.1.2)66, ken ortolooggroepe toe en doen navraag deur epper (v.2.0.1)67 gebaseer op eggNOG (v.5.0)68.KEGG-databasis (gepubliseer 10 Februarie 2020) 69. Die laaste stap is uitgevoer deur proteïene by die KEGG-databasis te pas deur DIAMOND (v.0.9.30)70 te gebruik met 'n navraag- en onderwerpdekking van ≥70%.Resultate is verder gefiltreer volgens NCBI Prokariotiese Genome Annotation Pipeline71 gebaseer op bitrate ≥ 50% van maksimum verwagte bitrate (skakel self).Geenvolgordes is ook gebruik as insette om BGC's in die genoom te identifiseer deur antiSMASH (v.5.1.0)72 met verstekparameters en verskillende trosontploffings te gebruik.Alle genome en aantekeninge is saamgestel in OMD saam met kontekstuele metadata wat op die web beskikbaar is (https://microbiomics.io/ocean/).
Soortgelyk aan voorheen beskryfde metodes12,22 het ons CD-HIT (v.4.8.1) gebruik om >56.6 miljoen proteïenkoderende gene van bakteriese en argaeale genome van OMD in 95% identiteit en korter gene (90% dekking)73 te groepeer tot >17,7 miljoen geengroepe.Die langste volgorde is gekies as die verteenwoordigende geen vir elke geengroepering.Die 1038 metagenome is toe by >17.7 miljoen BWA (-a) groeplede aangepas en die gevolglike BAM-lêers is gefiltreer om slegs belynings met ≥95% persentasie identiteit en ≥45 basisbelynings te behou.Lengte-genormaliseerde geen oorvloed is bereken deur eers invoegings vanaf die beste unieke belyning te tel en dan, vir fuzzy-gekarteerde invoegings, fraksionele tellings by die ooreenstemmende teikengene te voeg eweredig aan hul aantal unieke invoegings.
Die genome van die uitgebreide OMD (met addisionele MAGs van "Ca. Eudormicrobiaceae", sien hieronder) is by die mOTUs74 metagenomiese analise-instrumentdatabasis (v.2.5.1) gevoeg om 'n uitgebreide mOTU-verwysingsdatabasis te skep.Slegs ses enkelkopie-genome (23 528 genome) het uit tien uscMG's oorleef.Die uitbreiding van die databasis het tot 4 494 bykomende trosse op spesievlak gelei.1038 metagenome is ontleed met behulp van verstek mOTU parameters (v.2).'n Totaal van 989 genome vervat in 644 mOTU-klusters (95% REF, 5% SAG en 99.9% wat aan MarDB behoort) is nie deur die mOTU-profiel opgespoor nie.Dit weerspieël verskeie bykomende bronne van mariene isolasie van die MarDB-genome (meeste van die onopgespoorde genome word geassosieer met organismes wat uit sedimente geïsoleer is, mariene gashere, ens.).Om voort te gaan om op die oop see-omgewing in hierdie studie te fokus, het ons hulle uitgesluit van die stroomaf-analise, tensy hulle opgespoor of ingesluit is in die uitgebreide mOTU-databasis wat in hierdie studie geskep is.
Alle BGC's van MAG, SAG en REF in OMD (sien hierbo) is gekombineer met BGC's wat geïdentifiseer is in alle metagenomiese steiers (antiSMASH v.5.0, verstekparameters) en gekarakteriseer deur gebruik te maak van BiG-SLICE (v.1.1) (PFAM-domein )75.Gebaseer op hierdie kenmerke, het ons alle cosinus-afstande tussen BGC's bereken en hulle (gemiddelde skakels) in GCF en GCC gegroepeer deur afstanddrempels van 0.2 en 0.8 onderskeidelik te gebruik.Hierdie drempels is 'n aanpassing van drempels wat voorheen gebruik is deur Euklidiese afstand75 saam met kosinusafstand te gebruik, wat sommige van die foute in die oorspronklike BiG-SLICE groeperingstrategie (Aanvullende Inligting) verlig.
BGC's is dan gefiltreer om slegs ≥5 kb gekodeer op steiers te behou om die risiko van fragmentasie te verminder soos voorheen beskryf16 en om MarDB REF's en SAG's wat nie in 1038 metagenome gevind is nie (sien hierbo) uit te sluit.Dit het daartoe gelei dat 'n totaal van 39 055 BGC's deur die OMD-genoom gekodeer is, met 'n bykomende 14 106 wat op metagenomiese fragmente geïdentifiseer is (dws nie in MAG's gekombineer nie).Hierdie "metagenomiese" BGC's is gebruik om die proporsie van mariene mikrobioom biosintese potensiaal te skat wat nie in die databasis vasgelê is nie (Aanvullende Inligting).Elke BGC is funksioneel gekarakteriseer volgens voorspellende produktipes gedefinieer deur anti-SMASH of growwer produkkategorieë gedefinieer in BiG-SCAPE76.Om steekproefvooroordeel in kwantifisering te voorkom (taksonomiese en funksionele samestelling van GCC/GCF, afstand van GCF en GCC na verwysingsdatabasisse, en metagenomiese oorvloed van GCF), deur slegs die langste BGC per GCF vir elke spesie te hou, is 39 055 BGCs verder gededupliseer, wat 'n totaal van 17 689 BGC tot gevolg het.
Die nuwigheid van GCC en GCF is geassesseer op grond van die afstand tussen die berekende databasis (RefSeq databasis in BiG-FAM)29 en die eksperimenteel geverifieerde (MIBIG 2.0)30 BGC.Vir elk van die 17 689 verteenwoordigende BGC's het ons die kleinste cosinusafstand na die onderskeie databasis gekies.Hierdie minimum afstande word dan gemiddeld (gemiddeld) volgens GCF of GCC, soos toepaslik.'n GCF word as nuut beskou as die afstand na die databasis groter as 0.2 is, wat ooreenstem met 'n ideale skeiding tussen die (gemiddelde) GCF en die verwysing.Vir GCC kies ons 0.4, wat twee keer die drempel is wat deur GCF gedefinieer is, om 'n langtermynverhouding met skakels te sluit.
Die metagenomiese oorvloed van BGC is geskat as die gemiddelde oorvloed van sy biosintetiese gene (soos bepaal deur anti-SMASH) beskikbaar vanaf geenvlakprofiele.Die metagenomiese oorvloed van elke GCF of GCC is dan bereken as die som van verteenwoordigende BGCs (uit 17 689).Hierdie oorvloed kaarte is daarna genormaliseer vir sellulêre samestelling met behulp van die per-monster mOTU telling, wat ook verantwoordelik was vir volgorde-pogings (uitgebreide data, Fig. 1d).Die voorkoms van GCF of GCC is bereken as die persentasie monsters met 'n oorvloed > 0.
Die Euklidiese afstand tussen monsters is uit die genormaliseerde GCF-profiel bereken.Hierdie afstande is in grootte verminder deur gebruik te maak van UMAP77 en die gevolglike inbeddings is gebruik vir digtheid-gebaseerde groepering sonder toesig deur gebruik te maak van HDBSCAN78.Die optimale minimum aantal punte vir 'n groepering (en dus die aantal groepe) wat deur HDBSCAN gebruik word, word bepaal deur die kumulatiewe waarskynlikheid van groepslidmaatskap te maksimeer.Die geïdentifiseerde trosse (en 'n ewekansige gebalanseerde substeekproef van hierdie trosse om vooroordeel in permutasie-meerveranderlike variansieanalise (PERMANOVA) in ag te neem) is getoets vir betekenisvolheid teen onverminderde Euklidiese afstande deur gebruik te maak van PERMANOVA.Die gemiddelde genoomgrootte van die monsters is bereken op grond van die relatiewe oorvloed van mOTU en die beraamde genoomgrootte van die lede van die genome.In die besonder is die gemiddelde genoomgrootte van elke mOTU beraam as die gemiddelde van die genoomgroottes van sy lede gekorrigeer vir volledigheid (na filtering) (byvoorbeeld, 'n 75% volledige genoom met 'n lengte van 3 Mb het 'n aangepaste grootte van 4 Mb).vir medium genome met integriteit ≥70%.Die gemiddelde genoomgrootte vir elke monster is dan bereken as die som van mOTU-genoomgroottes geweeg deur relatiewe oorvloed.
'n Gefiltreerde stel genoomgekodeerde BGC's in die OMD word in bakteriese en argaeale GTDB-bome getoon (in ≥5 kb-raamwerke, uitgesluit REF en SAG MarDB wat nie in 1038 metagenome gevind word nie, sien hierbo) en hul voorspelde produkkategorieë op grond van die filogenetiese posisie van die genoom (sien hierbo).Ons het eers die data per spesie verminder deur die genoom met die meeste BGC's in daardie spesie as verteenwoordigend te gebruik.Vir visualisering is die verteenwoordigers verder in boomgroepe verdeel, en weer, vir elke selleklade, is die genoom wat die grootste aantal BGC'e bevat as 'n verteenwoordiger gekies.BGC-verrykte spesies (ten minste een genoom met >15 BGCs) is verder ontleed deur die Shannon Diversiteitsindeks te bereken vir die produktipes wat in daardie BGCs gekodeer is.As alle voorspelde produktipes dieselfde is, word chemiese basters en ander komplekse BGC's (soos voorspel deur anti-SMAH) beskou as om aan dieselfde produktipe te behoort, ongeag hul volgorde in die groep (bv. proteïen-bakteriosien en bakteriosien-proteoproteïensamesmelting liggaam).baster).
Oorblywende DNA (na raming 6 ng) van Malaspina-monster MP1648, wat ooreenstem met biologiese monster SAMN05421555 en ooreenstem met Illumina SRR3962772 metagenomiese leesstel vir kortlees, verwerk volgens PacBio-volgordebepalingsprotokol met ultra-lae insette om PacBio-monster gDNA-monster te gebruik kit (100-980-000) en SMRTbell Express 2.0-sjabloonvoorbereidingstel (100-938-900).Kortliks, die oorblywende DNA is gesny, herstel en gesuiwer (ProNex-krale) met behulp van Covaris (g-TUBE, 52104).Gesuiwerde DNA word dan onderwerp aan biblioteekvoorbereiding, amplifikasie, suiwering (ProNex-krale) en grootteseleksie (>6 kb, Blue Pippin) voor 'n finale suiweringstap (ProNex-krale) en volgordebepaling op die Sequel II-platform.
Rekonstruksie van die eerste twee ca.Vir MAG Eremiobacterota het ons ses bykomende ANI's > 99% geïdentifiseer (dit is ingesluit in Figuur 3), wat aanvanklik gefiltreer is op grond van kontaminasietellings (later geïdentifiseer as geenduplisering, sien hieronder).Ons het ook 'n skinkbord met die etiket "Ca" gekry.Eremiobacterota” uit verskeie studies23 en het dit saam met agt MAG's uit ons studie gebruik as 'n verwysing vir metagenomiese lesings van 633 eukariotiese verrykte (>0.8 µm) monsters met behulp van BWA (v.0.7.17) Ref -r1188, – 'n vlag) vir afbemonsterde kartering (5 miljoen lees).Gebaseer op verrykingspesifieke kaarte (gefiltreer deur 95% belyningsidentiteit en 80% leesdekking), is 10 metagenome (verwagte dekking ≥5×) gekies vir samestelling en 'n bykomende 49 metagenome (verwagte dekking ≥1×) vir inhoudkorrelasie.Deur dieselfde parameters as hierbo te gebruik, is hierdie monsters ingegooi en 10 bykomende 'Ca's is bygevoeg.MAG Eremiobacterota is herstel.Hierdie 16 MAG's (nie die twee wat reeds in die databasis ingesluit is nie) bring die totale aantal genome in die uitgebreide OMD op 34 815 te staan.MAG's word taksonomiese rangorde toegeken op grond van hul genomiese ooreenkoms en posisie in die GTDB.18 MAG's is gedeepliseer met dRep in 5 spesies (intraspesifieke ANI >99%) en 3 genera (intrageniese ANI 85% tot 94%) binne dieselfde familie79.Spesieverteenwoordigers is met die hand gekies op grond van integriteit, kontaminasie en N50.Voorgestelde nomenklatuur word in die aanvullende inligting verskaf.
Evalueer die integriteit en kontaminasie van 'Ca.MAG Eremiobacterota, het ons die teenwoordigheid van uscMG geassesseer, sowel as afstamming- en domeinspesifieke enkelkopiemerkergeenstelle wat deur CheckM en Anvi'o gebruik word.Die identifikasie van 2 duplikate uit 40 uscMGs is bevestig deur filogenetiese rekonstruksie (sien hieronder) om enige potensiële kontaminasie uit te sluit (dit stem ooreen met 5% gebaseer op hierdie 40 merkergene).'n Bykomende studie van vyf verteenwoordigende MAG's 'Ca.Die lae vlak van kontaminante in hierdie gerekonstrueerde genome is bevestig vir Eremiobacterota spesies deur gebruik te maak van die interaktiewe Anvi'o koppelvlak gebaseer op oorvloed en volgorde samestelling korrelasies (Aanvullende Inligting)59.
Vir filogenomiese analise het ons vyf verteenwoordigende MAG's "Ca" gekies.Eudormicrobiaceae”, alle spesies “Ca.Die genoom van Eremiobacterota en lede van ander filums (insluitend UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria en Planctomycetota) is beskikbaar by GTDB (r89)13.Al hierdie genome is geannoteer soos voorheen beskryf vir enkelkopie merker geen ekstraksie en BGC annotasie.Die GTDB-genome is bewaar volgens die bogenoemde integriteit en kontaminasie kriteria.Filogenetiese analise is uitgevoer met behulp van die Anvi'o Phylogenetics59 werkvloei.Die boom is gekonstrueer met behulp van IQTREE (v.2.0.3) (verstek opsies en -bb 1000)80 op 'n belyning van 39 tandem ribosomale proteïene geïdentifiseer deur Anvi'o (MUSCLE, v.3.8.1551)81.Sy poste is verminder.om ten minste 50% van die genome82 te dek en Planctomycecota is gebruik as 'n uitgroep gebaseer op die GTDB-boomtopologie.Een boom van 40 uscMGs is gebou met dieselfde gereedskap en parameters.
Ons het Traitar (v.1.1.2) met verstekparameters (fenotipe, vanaf nukleotiede)83 ​​gebruik om algemene mikrobiese eienskappe te voorspel.Ons het 'n potensiële roofsugtige lewenstyl ondersoek gebaseer op 'n voorheen ontwikkelde predatoriese indeks84 wat afhang van die inhoud van 'n proteïenkoderende geen in die genoom.Ons gebruik spesifiek DIAMOND om proteïene in die genoom te vergelyk met die OrthoMCL-databasis (v.4)85 deur die opsies –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 te vergelyk EN tel die gene wat ooreenstem met die merkergene vir roofdiere en nie-roofdiere.Die indeks is die verskil tussen die aantal roof- en nie-roofmerke.As 'n bykomende kontrole het ons ook die "Ca"-genoom ontleed.Die Entotheonella TSY118 faktor is gebaseer op sy assosiasie met Ca.Eudoremicrobium (groot genoomgrootte en biosintetiese potensiaal).Vervolgens het ons potensiële skakels tussen roofdier- en nie-roofdiermerkergene en die biosintetiese potensiaal van Ca getoets.Eudormicrobiaceae” en gevind dat nie meer as een geen (van enige tipe merkergeen, maw predator/nie-predatorgeen) met BGC oorvleuel, wat daarop dui dat BGC nie predasieseine verwar nie.Addisionele genomiese annotasie van deurmekaar replikons is uitgevoer met behulp van TXSSCAN (v.1.0.2) om spesifiek die afskeidingsisteem, pili en flagella86 te ondersoek.
Vyf verteenwoordigende 'Ca's is gekarteer deur 623 metatranskriptome van die prokariotiese en eukariotiese verrykingsfraksies van die Tara-oseane22,40,87 te karteer (met gebruik van BWA, v.0.7.17-r1188, -a vlag).Eudormicrobiaceae genoom.BAM-lêers is met FeatureCounts (v.2.0.1)88 verwerk na 80% leesdekking en 95% identiteitsfiltrering (met opsies featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Tel die aantal invoegings per geen.Die gegenereerde kaarte is genormaliseer vir geenlengte en merker geen oorvloed mOTU (lengte-genormaliseerde gemiddelde invoegingtelling vir gene met invoegingtelling >0) en log-getransformeer na 22.74 om die relatiewe uitdrukking per sel van elke geenvlak te verkry, wat ook die veranderlikheid van monster tot monster tydens volgordebepaling.Sulke verhoudings maak voorsiening vir vergelykende analise, wat samestellingsprobleme versag wanneer relatiewe oorvloed data gebruik word.Slegs monsters met >5 van die 10 mOTU-merkergene is oorweeg vir verdere analise om 'n groot genoeg gedeelte van die genoom te laat waarneem.
Die genormaliseerde transkriptoomprofiel van 'Ca.E. taraoceanii is onderwerp aan dimensionaliteitsvermindering deur gebruik te maak van UMAP en die gevolglike voorstelling is gebruik vir groepering sonder toesig deur gebruik te maak van HDBSCAN (sien hierbo) om uitdrukkingstatus te bepaal.PERMANOVA toets die belangrikheid van verskille tussen geïdentifiseerde trosse in die oorspronklike (nie verminderde) afstandspasie.Differensiële uitdrukking tussen hierdie toestande is oor die genoom getoets (sien hierbo) en 201 KEGG-bane is in 6 funksionele groepe geïdentifiseer, naamlik: BGC, sekresiestelsel en flagellêre gene van TXSSCAN, afbraakensieme (protease en peptidases), en predatoriese en nie- roofsugtige gene.roofsugtige indeks merkers.Vir elke monster het ons die mediaan genormaliseerde uitdrukking vir elke klas bereken (let op dat BGC uitdrukking self bereken word as die mediaan uitdrukking van biosintetiese gene vir daardie BGC) en getoets vir betekenisvolheid oor state (Kruskal-Wallis toets aangepas vir FDR).
Sintetiese gene is van GenScript aangekoop en PCR-primers is van Microsynth gekoop.Phusion-polimerase van Thermo Fisher Scientific is vir DNA-amplifikasie gebruik.NucleoSpin-plasmiede, NucleoSpin-gel en PCR-suiweringstel van Macherey-Nagel is vir DNA-suiwering gebruik.Beperkingsensieme en T4 DNA-ligase is van New England Biolabs gekoop.Chemikalieë anders as isopropyl-β-d-1-tiogalaktopiranosied (IPTG) (Biosynth) en 1,4-ditiotreïtol (DTT, AppliChem) is van Sigma-Aldrich gekoop en sonder verdere suiwering gebruik.Die antibiotika chlooramfenikol (Cm), spektinomisiendihidrochloried (Sm), ampicillien (Amp), gentamisien (Gt) en karbenisillien (Cbn) is van AppliChem gekoop.Bacto Trypton en Bacto Yeast Extract media komponente is by BD Biosciences gekoop.Tripsien vir volgordebepaling is by Promega gekoop.
Geenvolgordes is uit anti-SMASH voorspelde BGC 75.1 onttrek.E. malaspinii (Aanvullende inligting).
Die gene embA (lokus, MALA_SAMN05422137_METAG-raamwerk_127-geen_5), embM (lokus, MALA_SAMN05422137_METAG-raamwerk_127-geen_4), en embAM (insluitend intergeen-gebiede in sintetiese) is gekonstrueer met (insluitend intergeen-streke in sintetiese) en optimA-reekse in pUC7-opeenvolgings vir uitdrukking in E wanneer.Die embA-geen is gesubkloneer in die eerste meervoudige kloningsplek (MCS1) van pACYCDuet-1(CmR) en pCDFDuet-1(SmR) met BamHI- en HindIII-splitsingsplekke.Die embM- en embMopt-gene (kodon-geoptimaliseer) is in MCS1 pCDFDuet-1(SmR) gesubkloneer met BamHI en HindIII en geplaas in die tweede meervoudige kloningsplek van pCDFDuet-1(SmR) en pRSFDuet-1(KanR) (MCS2) met NdeI/ChoI.Die embAM-kasset is in pCDFDuet1(SmR) gesubkloneer met BamHI- en HindIII-splitsingsplekke.Die orf3/embI-geen (lokus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) is gekonstrueer deur oorvleueling verlenging PCR deur gebruik te maak van primers EmbI_OE_F_NdeI en EmbI_OE_R_XhoI, verteer met NdeI/XhoI, en geligeer in (-1 pSF-ensieme) en gelig in (-1 pSF-ensieme) aanvullend tabel).6).Beperkingsensiem vertering en afbinding is uitgevoer volgens die vervaardiger se protokol (New England Biolabs).

 


Postyd: 14-Mrt-2023