banner
Casa / Blog / acCRISPR: un'attività
Blog

acCRISPR: un'attività

Jan 03, 2024Jan 03, 2024

Biologia delle comunicazioni volume 6, numero articolo: 617 (2023) Citare questo articolo

Dettagli sulle metriche

Gli schermi CRISPR ad alto rendimento stanno rivoluzionando il modo in cui gli scienziati svelano le basi genetiche dei fenotipi ingegnerizzati ed evoluti. Una delle sfide cruciali nella valutazione accurata dei risultati dello screening è tenere conto della variabilità nell'efficienza di taglio dello sgRNA. Le guide scarsamente attive che prendono di mira i geni essenziali per le condizioni di screening oscurano i difetti di crescita che ci si aspetta dalla loro interruzione. Qui sviluppiamo acCRISPR, una pipeline end-to-end che identifica i geni essenziali negli schermi CRISPR in pool utilizzando i conteggi di lettura di sgRNA ottenuti dal sequenziamento di prossima generazione. acCRISPR utilizza efficienze di taglio determinate sperimentalmente per ciascuna guida nella libreria per fornire una correzione dell'attività ai risultati dello screening tramite il calcolo di una metrica di ottimizzazione, determinando così l'effetto di fitness dei geni interrotti. Gli screening CRISPR-Cas9 e -Cas12a sono stati effettuati nel lievito oleaginoso non convenzionale Yarrowia lipolytica e acCRISPR è stato utilizzato per determinare un set ad alta sicurezza di geni essenziali per la crescita sotto glucosio, una fonte di carbonio comune utilizzata per la produzione industriale di prodotti oleochimici. acCRISPR è stato utilizzato anche negli screening che quantificavano l'idoneità cellulare relativa in condizioni di sale elevato per identificare i geni correlati alla tolleranza al sale. Collettivamente, questo lavoro presenta un quadro sperimentale-computazionale per studi di genomica funzionale basati su CRISPR che può essere esteso ad altri organismi di interesse non convenzionali.

Lo screening genetico funzionale con librerie aggregate di guide CRISPR ha avuto successo nella scoperta della funzione genetica, nell'identificazione dei geni essenziali e nell'evoluzione di nuovi fenotipi1,2,3. Questi screening funzionano inducendo mutazioni nel genoma per interrompere la funzione genetica. La regolazione trascrizionale dell'intero genoma è possibile anche quando un'endonucleasi Cas cataliticamente disattivata (tipicamente Cas9 o Cas12a) fusa in un dominio di attivazione o repressione viene mirata ai promotori4,5. Affinché questi screening siano efficaci, la libreria dovrebbe contenere uno o più RNA guida attivi per ciascun gene bersaglio. La creazione di tali librerie è impegnativa a causa degli algoritmi di progettazione imperfetti e di una comprensione incompleta di come funzionano le endonucleasi Cas nelle diverse specie. Ulteriore confusione nella progettazione della guida è l'effetto bloccante della struttura della cromatina sull'endonucleasi Cas9 mirata all'RNA guida6,7. Come risultato di questa progettazione imperfetta, gli screening CRISPR vengono condotti con librerie raggruppate di RNA guida che hanno un'ampia gamma di attività8,9. Le guide ad alta attività possono assegnare cambiamenti fenotipici alle modifiche del genoma con elevata sicurezza, mentre le guide inattive e a bassa attività possono oscurare i risultati dei geni producendo falsi negativi. Sono necessari metodi computazionali e sperimentali in grado di quantificare l'attività di ciascuna guida in una libreria e tenere conto della varianza dell'attività per correggere i risultati dello screening, identificare accuratamente le relazioni genotipo-fenotipo e identificare i geni essenziali con elevata sicurezza.

Una strategia comune di progettazione delle librerie CRISPR consiste nell'includere molte guide mirate a ciascun gene o promotore. Questa strategia aiuta a garantire che ogni gene sia preso di mira da una guida attiva, ma così facendo aumenta la complessità analitica nella valutazione dei risultati. Gli attuali metodi di analisi utilizzano un quadro bayesiano per dedurre l'attività guida da schermi ottenuti in diverse condizioni sperimentali; gli RNA guida che provocano un effetto di fitness in diverse condizioni sono indicativi di un'attività elevata10,11. Misurazioni affidabili dell'attività della guida possono anche essere generate direttamente da esperimenti di screening. Nelle specie di lievito che abbiamo studiato12, ciò può essere ottenuto interrompendo il meccanismo primario di riparazione del DNA (tipicamente, non-homologous end-joining o NHEJ) e utilizzando selezioni di crescita negative per quantificare l'attività di ciascuna guida, risultando in profili di attività attraverso il genoma. I dati sull'attività delle guide, prodotti computazionalmente o sperimentalmente, vengono utilizzati per identificare e tenere conto delle guide inattive e con scarsa attività, con conseguente miglioramento della chiamata degli hit e della precisione dello schermo. Qui mostriamo che, date le misurazioni sperimentali dell'attività della guida da un singolo schermo, è possibile identificare risultati significativi utilizzando la variazione media log2 volte, eliminando così la necessità di elaborare più schermi ed eseguire la modellazione probabilistica dei dati.

98.5% of CDSs, for Cas9 and Cas12a respectively). A guide's cutting score (CS) is equal to the −log2 fold-change of normalized guide abundance in PO1f Cas9/12a ΔKU70 to the control strain. Fitness scores (FS) are similarly defined, but with the PO1f Cas9/12a strain as the sample. b acCRISPR takes normalized sgRNA read counts from the control, CS, and FS strains and computes a series of outputs: CS per guide, FS per gene, the ac-coefficient (the product of CSthreshold and library coverage), and p-value per gene from significance testing against a non-essential gene population at the maximum ac-coefficient. The data sets shown here are from Cas9 screens in Y. lipolytica PO1f. Screens were conducted at 30 °C with glucose as the sole carbon source. Genes with an essentiality p-value < 0.05 were classified as essential./p>2, since a genome coverage of <2 would reduce statistical power to accurately determine gene essentiality./p> 10-fold excess in colonies for the number of library variants. The plasmid library was isolated from the transformed cells after a short outgrowth./p>40% identity from BLASTP were deemed as homologs./p>5.0; see Supplementary Table 10 for a complete list). For construction of sgRNA expression vector, pCas9yl-GW was digested with AvrII, similar to the construction of sgRNA library plasmids. Primers for sgRNA cloning were obtained from Integrated DNA Technology (IDT). Each primer contained 20 bp of homology flanking either side of a 20 bp target sequence. A mixture of two primers was placed in a thermocycler to anneal the oligos together and create double stranded DNA. Next, the annealed oligonucleotide was inserted by HiFi DNA Assembly (New England BioLabs, NEB) into a linearized pCas9yl-GW vector. Successful cloning of the sgRNA fragment was confirmed by Sanger sequencing./p>