De Novo-transkriptomsamling og genopdagelse af Cistanche Deserticola kødfulde stamme-Ⅱ
Sep 18, 2024
Funktionel klassificering af alle udtrykte transskriptioner baseret på genontologi og KEGG-databaser
Gene Ontology (GO) annotation blev hentet fra UniProt annotations- og identitetsforeningsfil. I alt blev 20.907 transkripter, der tegner sig for 32,69% af de samlede udtrykte sekvenser, tildelt 1.745 funktionelle termer. Af de samlede funktionelle GO-termer udgjorde tildelinger til den biologiske proces størstedelen (1.116, 63,95%) efterfulgt af cellulær komponent (329, 18,85%) og molekylær funktion (300, 17,20%). De tildelte funktioner af udtrykte transkriptioner dækkede en bred vifte af GO-kategorier, og de 10 bedste GO-termer med de mest kommenterede transkriptioner blev anført i tabel 3. Vi leverer alle udtrykte transskriptionsfordelinger i tre genontologikategorier (molekylær funktion, cellulær komponent og biologisk proces) i den supplerende fil (S3 Dataset). GO-udtryk relateret til bindingsfunktioner og transferaseaktivitet var overvejende repræsenteret i kategorien molekylær funktion. Med hensyn til bindingsfunktionerne repræsenterede kationbinding (4.394 transkripter) den mest udbredte, efterfulgt af nukleotid/nukleosid-binding (3.404 transkripter i gennemsnit) og proteinbinding (2.422 transkripter). Mens de er i transferaseaktivitetsgruppen, er de fleste dem med overførende phosphorholdige grupper (2.256 transkriptioner, 65,77%). Blandt den cellulære komponentkategori var transkriptioner mere lokaliseret intracellulære (10.581 transkriptioner i gennemsnit), mens transkripter blandt den biologiske proceskategori var mere involveret i den biopolymermetaboliske proces (6.683 transkripter i gennemsnit), efterfulgt af regulering af cellulære proces (4.841 transkripter). ), genekspression (4.678 transkripter) og transport (3.512 transkripter).

NATURLIG CISTANCHE TUBULOSA TIL FOREBYGGELSE AF ALZHEIMER SYGDOM PHGS75% ECH 30% ACT 12%
For at udvinde gener involveret i biosyntesen af lignin og PhG blev 21.358 ikke-redundante potentielle proteinsekvenser søgt mod gensekvenser fra 13 planteorganismer i KEGG-databasen, og de blev tildelt 275 KEGG-veje med mindst 5 hits. De 10 bedste veje med flest tilpassede sekvenser er anført i tabel 4. De fleste veje var involveret i primære metaboliske processer, såsom aminosyre- eller proteinmetabolisme (ko01230, ko04141 og ko04120), kulhydratmetabolisme (ko01200 og ko00500) og nukleotid eller nukleosidmetabolisme (ko03018, ko00230 og ko00240). Desuden er der 27 sekundære metabolisme-relaterede veje (fig. 2), såsom terpenoid rygrad biosyntese, phenylpropanoid biosyntese, carotenoid biosyntese, isoquinolin alkaloid biosyntese og tropan, piperidin og pyridin alkaloid biosyntese. Disse resultater giver yderligere indikation af, at aktive metaboliske processer var undervejs iC. deserticolastammevæv. Alle udtrykte transkriptioner forbundet med KEGG-veje blev opført i den supplerende fil (S4-datasæt). Selvom der er nogle væsentligt ændrede veje mellem C. deserticola og andre planter, såsom ris(S5-datasæt), er vores hovedmål i denne undersøgelse at afsløre hele transkriptomprofilen af C. deserticola-stammen og at se de relaterede veje for PhGs biosyntese som kunne være nyttige til vejledning i dyrkningen.

Kandidatgener, der koder for enzymer involveret i biosyntesen af lignin
Lignin er den anden mest udbredte naturlige terrestriske polymer i planteriget, der udgør op til en tredjedel af det materiale, der findes i plantecellevægge. Som en vigtig bestanddel af cellevægge hjælper ligniner vandtransport, giver mekanisk støtte og strukturel integritet og forsvarer mod patogener og planteædere. Disse roller af lignin er meget værdifulde til at understøtte den underjordiske erektive vækst af C. deserticola i ørkenen. I denne undersøgelse præsenterede vi det komplette billede af ligninbiosynteseveje i C. deserticola (Fig. 3), hvor ligninmonomererne biosyntetiseres fra phenylalanin gennem en række enzymatiske reaktioner, herunder hydroxylering, methylering, reduktion og oxidativ polymeriseringsproces. Ligninbiosyntese-relaterede enzymer blev påvist for tre hovedsageligt syntetiserede former i vaskulært væv (p-hydroxyl-phenyl (H), guaiacyl (G) og syringyl (S) lignin) og 5-hydroxyl-guaiacyl lignin, som kun blev identificeret i COMT (koffeinsyre 3-O-methyltransferase, EC 2.1.1.68) mangelfulde (såsom knock-down) planter.

Phenylalanin ammoniak-lyase (PAL, EC 4.3.1.24) er det første nøgleenzym i ligninbiosyntesevejen (fig. 3), som omdanner phenylalanin til kanelsyre ved ikke-oxidativ deaminering. I alt 6.297 PAL-aflæsninger blev sekventeret, og 7 PAL-transkripter blev samlet i C. deserticola (tabel 5). Ved sammenligning af sekvensligheder fandt vi, at 4 af dem (comp28550_c1_seq1/2/3/5) havde mere end 95 % lighed med den kendte mRNA-sekvens af C. deserticola (gi| 289595227|gb|ADD12041.1|), mens comp28550_c1_seq4 og comp25940_c0_seq1 havde henholdsvis 77 % og 82 % ligheder. ORF-forudsigelse afslørede, at 5 transkripter havde potentialer for kodende proteiner og båret med aromatisk aminosyrelyasedomæne (PF00221.14). Blandt dem kunne kun comp28550_c1_seq4-transkriptet kode for en komplet proteinsekvens på 718 aminosyrerester. Det er blevet rapporteret, at PAL blev kodet af en lille multigenfamilie i de fleste plantearter, såsom 4 i Arabidopsis thaliana, 5 i Populus trichocarpa, 3 i Scutellaria baicalensis og 7 Cucumis sativus osv. Vores fylogenetiske analyse antydede, at der var 4 PAL-kodende gener i C.


deserticola, og vi navngav dem henholdsvis CdPAL1, CdPAL2, CdPAL3 og CdPAL4 (S2 Fig.). 4-coumarat-CoA-ligase (4CL, EC 6.2.1.12) og trans-cinnamat 4-monooxygenase (CYP73A, EC 1.14.13.11) er to enzymer, der er ansvarlige for at transformere kanelsyre til dicoumarol-CoA i to omvendte ordrer. De er også i rygraden, og deres udtryks-FPKM-værdier er henholdsvis 39,57 og 51,93.

De fire typer ligniner blev biosyntetiseret af forskellige veje, som blev kontrolleret af tre nøgleenzymer, cinnamoyl-CoA-reduktase (CCR, EC 1.2.1.44), shikimat o-hydroxycinnamoyltransferase (HCT, EC 2.3.1.133) og ferulat{{1{ {56}}}}hydroxylase (F5H, EC 1,14.-.-). CCR blev rapporteret som et kontrolpunkt for ligninvejen [50, 51], som katalyserede X-CoA (X inklusive dicoumarol, caffeoyl, feruloyl, 5-hydroxyl-feruloyl og sinapoyl) til Y-aldehyd (Y inklusive p -cougar, caffeoyl, coniferyl, 5-hydroxyl-coniferyl og snap), mens HCT katalyserede p-coumaroyl-CoA til p-coumaroyl shikiminsyre/p-coumaroyl kininsyre. De to enzymer regulerede ligesom en switch biosyntesen af P-hydroxyl-phenyl ligniner eller de tre andre typer ligniner. F5H var en anden grenafbryder, der regulerede syringyllignin og 5-hydroxyl-guaiacyllignin. Andre vigtige enzymer, herunder koffeinsyre 3-O-methyltransferase (COMT, EC 2.1.1.68), caffeoyl-CoA O-methyltransferase (CCoAOMT, EC 2.1.1.104) og cinnamyl-alkohol-dehydrogenase (CAD, EC 1.51.1.1. ) blev også detekteret udtrykt. Detaljeret ekspressionsinformation er anført i tabel 6. Disse enzymgener identificeret i denne undersøgelse vil give en værdifuld ressource til funktionelle genomiske undersøgelser i denne vigtige lægeplante. 10 gener relateret til ligninbiosyntesevejen i tabel 6 blev udvalgt til RT-qPCR-verifikation for at bekræfte vores RNAseq-resultater (fig. 4), og deres høje korrelationer (Pearson-korrelationskoefficient: 0,90343) indikerede høj nøjagtighed og reproducerbarhed af vores transkriptomanalyse. S1 Dataset viser de primersekvenser, der er brugt i denne analyse.

NATURLIG CISTANCHE TUBULOSA TIL FORBEDRING AF SEKSUEL FUNKTION PHGS75% ECH 30% ACT 12%
Kandidatgener, der koder for enzymer involveret i biosyntesen af phG'er
Phenylethanoid glycosider (PhG'er) er kendt for at være de primære aktive ingredienser i C. deserticola med aktiviteter til forbedring af seksuel styrke, fjernelse af frie radikaler og anti-aging. Tre kemiske komponenter i PhG'er er organisk syre, saccharid og phenylethanolaglycon (fig. 3). De organiske syrer inklusive koffeinsyre, ferulsyre og coumalsyre er produkter af phenylpropanoid biosyntesevejen. Komponenterne af saccharid, herunder glucose og rhamnose, er produkter af kulhydratmetabolismeveje, såsom stivelses- og saccharosemetabolisme, aminosukker- og nukleotidsukkermetabolisme, fructose- og mannosemetabolisme osv. Biosyntesevejen for phenylethanol-delen er dog ikke klar endnu. Her foreslog vi to mulige phenylethanol-biosynteseveje baseret på vores sekvensdata. Den ene er den rapporterede koffeinsyre- eller ferulinsyre-vej, også kendt som kanelsyre-vejen, som ligner ligninbiosyntese-rygraden. En anden er baseret på phenylalanin-metabolismevejen (fig. 3), hvor phenylalanin til phenylethanol blev opnået ved en kendt 'Enrlich-vej', der først blev fundet i gær for et århundrede siden og valideret i petunia-blomster, tomat og rose. Fire enzymgener, der koder for aspartat/tyrosinaminotransferase, histidin-phosphataminotransferase og primær-aminoxidase, som er ansvarlige for omdannelsen af phenylalanin til phenylethanol, blev påvist udtrykt i stammen af C. deserticola. Produktet af phenylethanol kan oxideres yderligere af monooxygenase eller methyleres med methyltransferase til dets derivater (phenylethanolaglycon), som deltager i PhG-biosyntesen. Sammenfattende blev der foreslået to formodede biosynteseveje for phenylethanolaglyconC. deserticolamen har stadig brug for mere undersøgelse.
Diskussioner
I de seneste år har plantegenomik udviklet sig hurtigt med anvendelse af næste generations sekventeringsteknologi, mens få forskning har været fokuseret på genomikken af ørkenmedicinske planter. Det er påtrængende nødvendigt at udføre genomisk eller transkriptomisk forskning for at forstå dens tilpasning til tørke- og saltholdighedsmiljøer og biosyntesevejen for de vigtigste bioaktive komponenter. De novo transkriptomopdagelsen for nogle medicinske planter,


såsom Panax ginseng, Ginkgo biloba og Glycyrrhiza uralensis er først blevet udnyttet ved hjælp af Roche 454-platformen for dens lange læselængde. På grund af den effektive samlingsevne med korte læsninger, især de fordelagtige par-ende læsninger, er Illumina-baseret transkriptomsekventering og samling også blevet brugt i vid udstrækning til model- og ikke-modelorganismer. I den nuværende undersøgelse genererede vi omkring 8G af 101 bp parrede ende-læsninger og producerede længere unigen-sekvenser med 725 bp gennemsnitlig længde. Storskala stamspecifikke transkriptomdata kunne give nyttige referencedata og bruges til at udvinde den sekundære metabolisme af bioaktive komponenter i C. deserticola. Der er 81,62 % af de samlede rålæsninger, der har bestået stringente kvalitetsfiltre (inklusive adaptertrimning og kassering af lavkvalitetslæsninger) før samling, hvilket tyder på den høje kvalitet af vores sekvensdata, og 82,08 % af højkvalitetslæsningerne var nyttige til samling. Andre læsninger, der ikke blev brugt til montering, kan komme fra sekventeringsfejl, monteringsparametre et al. Disse ubrugte læsninger af høj kvalitet forblev nyttige til at forbedre de novo-samlingen kombineret med længere læsninger fra en anden platform (såsom Roche 454) i fremtiden.

NATURLIG CISTANCHE TUBULOSA TIL FORBEDRING AF SEKSUEL FUNKTION PHGS75% ECH 30% ACT 12%
Et stort antal samlede transkripter (30.098) viste høje sekvensligheder med kendte gener i offentlige databaser, hvilket tyder på, at vores Illumina-baserede parrede data dækkede en væsentlig del af transkripter af C. deserticola. Transkripter uden BLAST-hits kan skyldes 3'- eller 5'-utranslaterede regioner, ikke-kodende RNA eller nye gensekvenser af C. deserticola. De udtrykte transkripter blev annoteret til en bred vifte af GO-kategorier og KEGG-veje (tabel 3 og 4), hvor mange transskriptioner blev tildelt sekundære metabolisme-relaterede veje. Som vi ved, kan phenylpropanoid fungere som en inducerbar antimikrobiel forbindelse med stor gavn for en underjordisk livsstil [1], og også fungere som et signalmolekyle i plante-mikrobe interaktioner udover dets medicinske nytte [68, 69]. Terpenoid bruges til biosyntese af bioaktive komponenter (såsom 6- deoxycatalpol) [70]. Vi fandt gener involveret i phenylpropanoid og terpenoid rygrad biosyntesevejen var meget rigelige i C. deserticola. Endnu vigtigere er det, at opdagelsen af velrepræsenterede veje til ligninbiosyntese (fig. 3) indikerede den aktive metaboliske proces af lignin i C. deserticola-stammen. Alle kendte enzymgener involveret i biosyntesen af lignin (fig. 3) blev påvist udtrykt, og fire nøgleenzymer inklusive PAL, CCR, HCT og F5H havde lavere ekspressionsoverflod (henholdsvis FPKM 26.47, 3.89, 3.4 og 3.83) sammenlignet med andre enzymgener (tabel 6). Hvorvidt ekspressionsændringen af disse tre gener kunne påvirke ligninproduktionen i C. deserticola er værdig til yderligere undersøgelse. PAL er et nøgleenzym i ligninbiosyntesen og er også involveret i biosyntesen af phenylpropanoid, resveratrol, flavonoid og coumarin [71-74]. Vi påviste fire forskellige PAL-gener i C. deserticola-genomet (S2 Fig), hvilket var sammenfaldende med, at PAL blev kodet af en lille multigenfamilie [39, 43, 45-49] og beviste yderligere, at det kan spille vigtige roller i metabolisk kulstofflux .
PhG er den primære aktive ingrediens i C. deserticola. Gener involveret i biosyntesen af phenylethanol er vigtige for kvaliteten af C. deserticola. Vi udledte to forskellige biosynteseveje for phenylethanol og 17 enzymgener involveret i PhG-biosyntese i C. deserticola-stammen. De mulige post-kaffein/ferulinsyre-processer (fig. 3) blev også udledt for første gang baseret på en strukturel formel af mellemprodukter og katalytiske egenskaber af tilsvarende enzymer, hvor koffein/ferulinsyren først ville blive oxideret til phenylpyruvatderivat; derefter blev carboxylgruppen frataget af decarboxylaser; endelig blev aldehydgruppen omdannet tilbage til alkoholgruppe ved dehydrogenase. Dette er den første anvendelse af Illumina paired-end sekventeringsteknologi til at undersøge hele transkriptomet af C. deserticola og til at samle RNA-seq-aflæsninger uden et referencegenom. Denne undersøgelse vil give nyttige ressourcer og gensekvenser til funktionel genomik og proteomisk forskning på C. deserticola i fremtiden.
Konklusioner
I denne undersøgelse har vi profileret transkriptomet af C. deserticola-stammen baseret på high-throughput sekventeringsdata, identificeret gener involveret i biosynteseveje for lignin og også udledt den potentielle biosyntesevej for PhG'er for første gang, hvilket helt sikkert vil accelerere forståelsen af de tvetydige fysiologiske processer og den store medicinske værdi på molekylært niveau. Indtil nu er dette det første forsøg på de novo at samle hele transkriptomet af C. deserticola-stammen og påvise biosyntesevejen for medicinske komponenter ved hjælp af Illumina-baserede sekventeringsdatasæt. Vores undersøgelse kan fremme udviklingen af naturmedicin og udvælgelsen af sorter med medicinske egenskaber.

NATURLIG CISTANCHE TUBULOSA TIL FORBEDRING AF SEKSUEL FUNKTION PHGS75% ECH 30% ACT 12%







