CRISPR的英文全稱Clustered regularly interspaced short palindromic repeats,直譯為規律性成簇間隔的多個短回文重復序列。它細菌內部自然存在的一種基因修改系統,細菌采用這套工具用來對付攻擊自身的病毒。后來,研究人員發現,它可以作為精確的基因編輯工具,用來刪除、添加、激活或抑制其他生物體的基因序列。這此基因序列可以是是人、老鼠、豬、牛、羊、猴、水稻、小麥等。它不僅可以用來讓細菌按照人的意愿進行工作,也可以用來修改給人體帶來疾病的致病基因。

基因矯正,基因病的終極解決方案
基因矯正,基因病的終極解決方案

CRISPR擔當細菌的防護罩

CRISPR簇是一個廣泛存在于細菌和古生菌基因組中的特殊DNA重復序列家族,其序列由一個前導區(Leader)、多個短而高度保守的重復序列區(Repeat)和多個間隔區(Spacer)組成。前導區一般位于CRISPR簇上游,是富含AT長度為300~500bp的區域,被認為可能是CRISPR簇的啟動子序列。重復序列區長度為21~48bp,含有回文序列,可形成發卡結構。重復序列之間被長度為26~72bp的間隔區隔開。間隔序列是由侵入機體的異體DNA組成,類似免疫記憶,當含有同樣序列的異體DNA入侵時,可被細菌機體識別,并進行剪切使之不再產生功能,達到保護自身安全的目的。

通過對CRISPR簇的側翼序列分析發現,在其附近存在一個多態性家族基因。該家族編碼的蛋白質均含有可與核酸發生作用的功能域(具有核酸酶、解旋酶、整合酶和聚合酶等活性),并且與CRISPR區域共同發揮作用,因此被命名為CRISPR關聯基因(CRISPR associated),縮寫為Cas。目前發現的Cas包括Cas1~Cas10等多種類型。Cas基因與CRISPR共同進化,共同構成一個高度保守的系統。

基因矯正,佳學基因品牌產品
基因矯正,佳學基因品牌產品

CRISPR的工作原理

當細菌抵御噬菌體等外源DNA入侵時,在前導區的調控下,CRISPR被轉錄為長的RNA前體(Pre RISPR RNA,pre-crRNA),然后加工成一系列短的含有保守重復序列和間隔區的成熟crRNA,最終識別并結合到與其互補的外源DNA序列上發揮剪切作用。

目前發現的CRISPR/Cas系統有三種不同類型即I型、II型和III型,它們存在于大約40%已測序的真細菌和90%已測序的古細菌中。其中II型的組成較為簡單,以Cas9蛋白以及向導RNA(gRNA)為核心組成,也是目前研究得最深入的類型。

在II型系統中pre-crRNA的加工由Cas家族中的Cas9單獨參與。Cas9含有在氨基末端的RuvC和蛋白質中部的HNH2個獨特的活性位點,在crRNA成熟和雙鏈DNA剪切中發揮作用。此外,pre-crRNA轉錄的同時,與其重復序列互補的反式激活crRNA(Trans-activating crRNA,tracrRNA)也轉錄出來,并且激發Cas9和雙鏈RNA特異性RNase III核酸酶對pre-crRNA進行加工。加工成熟后,crRNA、tracrRNA和Cas9組成復合體,識別并結合于crRNA互補的序列,然后解開DNA雙鏈,形成R-loop,使crRNA與互補鏈雜交,另一條鏈保持游離的單鏈狀態,然后由Cas9中的HNH活性位點剪切crRNA的互補DNA鏈,RuvC活性位點剪切非互補鏈,最終引起DNA雙鏈斷裂(DSB)。CRISPR/Cas9的剪切位點位于crRNA互補序列下游鄰近的PAM區(Protospacer Adjacent Motif)的5'-GG-N18-NGG-3'特征區域中的NGG位點,而這種特征的序列在每128bp的隨機DNA序列中就重復出現一次。研究結果表明,Cas9還可以剪切線性和超螺旋的質粒,其剪切效率堪比限制性內切酶。

基因矯正,佳學基因品牌產品
基因矯正,佳學基因品牌產品
由于crRNA參與并且起到精確導向的作用,所以CRISPR/Cas9打靶系統也被稱為RNA導向(RNA guided)精確矯正系統。