北京時間1月28日凌晨,《自然》(Nature)雜志發表了西北大學生命科學與醫學部功能基因組學研究組嚴健教授團隊及其合作者的最新研究成果《系統解析非編碼DNA突變對轉錄因子結合的影響》,在國際上首次公布了該團隊成功利用SNP-SELEX技術,分析人類基因組中近10萬個常見的非編碼位點突變對270個轉錄因子蛋白質結合的影響。

  研究成果為揭示2型糖尿病等復雜疾病的遺傳機制提供了重要的理論依據,是后基因組時代的一項突破性研究進展。SNP-SELEX技術為全面、快速解析代謝疾病、癌癥等遺傳疾病的分子機理,尋找診斷、治療的靶標提供了新的思路與策略。

  論文共同第一作者為西北大學嚴健教授、美國加州大學圣迭戈分校邱耘疆博士、巴西帕拉聯邦大學的André M Ribeiro dos Santos博士。通訊作者為嚴健、任兵、Jussi Taipale教授。該成果由中國西北大學、美國路德維西癌癥研究所和瑞典卡羅林斯卡醫學院等單位共同合作完成。

  什么是全基因組關聯分析(GWAS)?

  全基因組關聯分析(GWAS)是廣泛用于尋找復雜遺傳疾病關聯基因的重要手段。目前,全世界范圍內已開展了4000多項GWAS研究,發現了超過10萬個與各種疾病以及重要生理性狀關聯的基因位點。

  但GWAS在找到基因序列差異與疾病風險關聯的時候,并不能同時反映出這種關聯背后的原理,這就阻礙了我們從關聯中尋找預防和治療這些疾病的分子靶標,成為一直困擾遺傳學和醫學研究者的一大難題。

  近年來,越來越多的研究表明,這些疾病風險位點大部分位于基因組非編碼區域,它們并不會改變蛋白質的序列與結構,而可能在基因表達調控上發揮作用。例如這些突變位點能夠改變一些序列特異性結合蛋白與DNA結合的親和力,從而影響下游目標基因的調控作用。但是,搞清楚一個位點突變的分子機理往往需要大量的時間和人力投入,單個突變一般需要有經驗的研究組2-3年的時間完成,而且實驗室之間、實驗系統之間的差異還會干擾數據之間的可比性??紤]到目前已積累超過10萬個疾病關聯位點,而且GWAS還遠遠沒有到達平臺期出現飽和,隨著研究手段的進一步改進,這樣的位點還會越來越多。因此亟需開發一種可以高通量、系統性的辦法來研究這些突變位點的分子功能。

  近年GWAS數據增長與功能研究增長對比

  紅色表示GWAS發現的位點隨著時間推移的增加,藍色表示對GWAS發現位點的功能研究的積累。

  從HT-SELEX到SNP-SELEX技術

  8年的沉淀與改進

  2013年,嚴健在Jussi Taipale教授指導下發明了HT-SELEX技術,通過在體外表達純化DNA結合蛋白,與人工合成的長度為40bp隨機序列DNA片段結合,再經過多輪緩沖液的清洗去除非特異性結合,最后洗脫結合力強的DNA,經過高通量測序計數,定量分析轉錄因子的DNA序列結合特異性。

SELEX原理示意圖SELEX原理示意圖

  紅色波浪線表示長度為40bp的雙鏈DNA片段,每一輪循環表示一次富集過程,可以通過增加循環來提高富集度。

  由HT-SELEX技術所產生的數據可以用于生成位置權重矩陣模型(PWM),該模型被廣泛應用于預測轉錄因子能否與某DNA序列片段相結合。但經過對比發現,在預測SNP對于轉錄因子結合力影響時,PWM的效果并不理想,尤其是一些位于低親和力結合位點的SNP。

  為了擺脫對預測模型的依賴,在實驗水平直接分析SNP對轉錄因子的影響,嚴健、任兵、Jussi Taipale教授于2015年再次聯合提出改進HT-SELEX方法:在合成長度為40bp配體DNA時,不再使用隨機序列的DNA,而以包含待研究的SNP及其附近的基因組序列取而代之,再利用HT-SELEX實驗進行分析。研究團隊利用該方法,定量分析了270個轉錄因子,在與95,886個非編碼SNP結合時,不同等位基因序列(allele)與其結合強弱的差異,并記錄了量化這些差異的大量數據。這些數據為解釋疾病機理提供了重要的理論依據。

  類似的研究手段可以進一步擴展到

  其他遺傳疾病的研究中

  以2型糖尿病風險位點SNP rs7118999為例,研究團隊發現該位點可以影響轉錄因子HLF結合,并通過染色質長距離相互作用參與APOC3基因的表達調控,調節血脂水平。

  左圖展示了在基因組瀏覽器中觀察到的SNP rs7118999可以影響HLF轉錄因子的親和力,從而通過三維基因組折疊的方式,引起下游APOC3基因表達的差異。右圖展示了在肝臟細胞中敲低HLF會導致APOC3基因表達的下降,進一步驗證了該團隊的科學假設。

  “之前的類似研究都是以單個或幾個突變作為對象,這樣要完全了解2型糖尿病這樣同時受到幾百上千個突變影響的復雜疾病,在短時間內是無法完成的,大大阻礙了開發治療手段的進程。而這項研究一下子就解決了近10萬個突變的分子機制問題,是一項重大突破?!眹澜≌f道。

  該研究所產生的這些數據在后GWAS時代,對于揭示突變位點,尤其是非編碼突變的分子機理,以及疾病的遺傳模型有著重要的意義。

  任兵表示:“目前我們的研究只包含了270個轉錄因子的SNP-SELEX數據,相比人類基因組中存在的1200-2000個轉錄因子還僅僅是一小部分。因此,我們的研究還會繼續,期待能夠全面了解非編碼SNP的分子功能?!?/span>

  嚴健介紹到:“以此為基礎,我們相信類似的研究手段可以進一步擴展到其他遺傳疾病的研究中,包括腸癌、前列腺癌等,將對解釋這類疾病的遺傳特性,找到臨床診斷的分子標記物等工作都具有建議和指導作用?!?/span>

  嚴健帶領的功能基因組研究團隊自2018年建立以來,在非編碼基因組功能方向的研究取得一系列重大突破。此前,嚴健還以通訊作者身份在《自然方法》(Nature Methods)、《自然通訊》(Nature Communications)、《核酸研究》(Nucleic Acids Research)等國際知名期刊發表論文多篇。

  為了方便其他研究人員使用這些實驗數據,文章中的所有SNP-SELEX結果可以通過GVAT網頁公開訪問。研究人員在該網頁內輸入感興趣的轉錄因子名字或者SNP的rsID,便可快速找到與其相互作用的SNP或者轉錄因子,以及它們之間的量化影響。

  

  該成果是西北大學生命科學與醫學部自成立以來的首篇Nature雜志論文,也是以西北大學為第一作者單位在Nature和Science正刊發表的第16篇論文,是學??茖W研究多點突破的標志性成果。

  近年來,西北大學在持續推進“一院一策”改革的基礎上,逐步打破學科邊界,圍繞學科交叉融合,促進學術協同創新,加快論證推進相關學科大部的建立。生命科學與醫學部作為學校首家學部制試點單位,立足“大健康”學科集群,凝練和突出生物與醫學學科優勢特色,構建跨學科創新團隊,建設大平臺、承擔大項目、產出大成果,逐步形成了面向國家需求、服務區域發展、彰顯西大特色的“大健康”學科內涵式發展新路徑。