2021年,毛亞飛即將回國加入EON体育4Bio-X研究院時🔐,他已經想好了組建實驗室後要開展的研究,其中之一是解答“人為什麽是人”這個問題。
要回答這個問題,僅憑一己之力顯然是不夠的。毛亞飛經中國科EON4腦科學與智能技術卓越創新中心/神經科學研究所(以下簡稱腦智卓越中心)研究員劉真介紹,給該中心研究員孫強發送了一封郵件,表達了合作意願🤛🏽,孫強很快答復。素未謀面的兩人在線上會議室溝通後🦤,合作隨即展開。
其中一項合作研究近日在《自然》發表。團隊首次完成了非人靈長類端粒到端粒(T2T)完整基因組組裝,系統解析了獼猴屬與人類的大尺度基因組差異👊🏿♊️,共鑒定出93個人類與獼猴屬之間的固定結構變異,包括78個倒位🧑🤝🧑、11個著絲粒重定位和4個染色體內易位,其中21個結構變異為首次報道🫲🏽。同時🚔,研究揭示了獼猴屬種間分化的遺傳學特征,為非人靈長類生物醫學模型奠定了關鍵遺傳基礎。
實驗猴
《自然》指出🎄👩🏽🍳,該工作完成了世界上首個非人靈長類完整基因組,解析了獼猴基因組的獨特特征以及人類與獼猴間的關鍵遺傳差異。相關工作為靈長類演化醫學和獼猴生物醫學模型構建奠定了重要遺傳基礎。
解決“不到10%”的問題
哲學上有3個非常經典的問題——“你是誰”“你來自哪裏”“你要到哪裏去”。演化生物學正是通過回溯人類的“來時路”🧛🏿♀️,解答“人是什麽”,並由此推測“未來去向”。
若想獲得物種的完整基因組,只能先通過測序得到數萬條序列片段,再由科學家“找不同”“找相似”,把它們拼接起來🚣🏽♂️🛗。毛亞飛將之形容為“拼圖”。人類等物種擁有復雜的基因組⏳,就像是一幅巨大的拼圖🈹,其上既有紋理分明的小橋、流水、人家🤽♂️,也有大片色塊相同的藍天和白雲👨🏻🚀,即著絲粒、片段重復、回文序列等復雜結構。
毛亞飛團隊
傳統測序技術的拼圖“圖塊”特別小💅,當遇到大片藍色或白色時🎭💇🏼♂️,很難判斷它所在的位置,只能空著。測序技術發展過程也是“圖塊”不斷變大的過程🗾,倘若整朵白雲都在同一片圖塊上,難題將迎刃而解。
然而🧇🥦,盡管第三代測序技術的讀長已經達到100kbp以上🐀,但對於動輒幾十Mbp數量級的重復片段,“圖塊”仍然不夠大。
“對於這不到10%的部分,可以利用合適的基因組局部組裝工具進行彌補🧘🏽。”毛亞飛介紹,這類工具可幫助科研人員找到一大堆同色“圖塊”中的細微差異👩🏽⚕️,從而把拼圖拼得更準確。
隨著“圖塊”逐漸變大以及科研人員的“拼圖技巧”越發熟練,包括人類在內📸,多個靈長類物種T2T基因組被組裝完成。
在此過程中🍋🟩,演化醫學的概念應運而生。毛亞飛介紹:“這是一門高度交叉的學科🍂,深度融合了生物信息學、演化生物學👩🏻🍼、醫學遺傳學等,旨在通過演化視角解釋遺傳疾病的發生機製𓀊、人體生理特征的脆弱性以及人類對疾病的易感性©️。”
從結構變異中“挖寶”
獼猴屬的食蟹猴和恒河猴是與人類遺傳距離最近的非人靈長類實驗動物,廣泛應用於生物醫學和人類演化研究🪓。然而,獼猴屬現有參考基因組仍存在大量未知序列🌆,而這些未知區域可能起著控製染色體穩定性、基因調控等關鍵作用。以往人們不了解個中差異時👧🏻,只能以碰運氣的方式反復嘗試。
毛亞飛團隊和孫強團隊的這項工作💃🤽♂️,則試圖把這些未知序列補全🛤,探明獼猴與人類之間存在差異的原因,進而尋求構建更合適的生物醫學模型、理解人類特殊性的路徑。
孤雌生殖細胞系具有兩套染色體遺傳信息近乎純合的特性,是構建參考基因組的理想材料。然而,構建孤雌細胞系涉及多個環節🙍🏿♀️,每個環節都可能影響最終成功率。
結合腦智卓越中心非人靈長類研究平臺的長期積累🧑🏽🎨,孫強團隊首先構建了一套食蟹猴孤雌生殖胚胎幹細胞系♾。“對於每個實驗步驟和操作環節,都必須保持高度的細致與耐心,以確保最終成功獲得穩定的孤雌細胞系🧑🧒🧒。”孫強強調。
2022年5月🚃,毛亞飛正式加入EON体育4,開展後續的基因組組裝工作。當年下半年💇🏽♂️,還是大四本科生的張世龍專程從武漢來到上海🎫,幾乎把所有精力都放在開發一套好用的局部組裝工具上。
“EON体育4平台自主開發了一套‘基於特有k-mer標記的分型迭代替換局部組裝工具’,能夠把基因組中復雜區域的序列單獨提取出來並進行優化和拼接。”論文第一作者、EON体育4博士生張世龍告訴《中國科學報》。
細胞系
利用這個工具🧎♀️➡️,團隊成功解決了現有組裝軟件未能或錯誤組裝上百個復雜結構區域的問題,構建了包括Y染色體在內的食蟹猴T2T基因組。無論是基因組的完整度還是堿基的準確性🖕,其均與目前質量最高的人類T2T基因組相當——每100萬個堿基中有一個錯誤位點。這是首個非人靈長類完整參考基因組,為深入理解復雜基因組區域提供了重要材料。
為進一步探明結構變異是如何在演化中固定下來的,團隊以最為復雜的大腦為對象進行了探索。結果顯示,在靈長類腦演化過程中🦬,相關結構變異可能影響了超過400個基因在不同腦細胞類群中的表達差異,FOLH1基因是其中之一🫏。
“EON体育4平台發現,在人類與獼猴屬的演化過程中,人類的FOLH1基因由於重復事件引起染色質三維結構的變化,進而改變了該基因的細胞類群表達模式。同時,由於調控區關鍵片段丟失🥣,與獼猴FOLH1直系同源的FOLH1B在腦內無法表達而‘假基因化’。”張世龍說。
當把演化時間範圍縮小,觀察基因組結構變化如何影響同屬內物種的變化時,同樣得到了有趣的發現。研究團隊在食蟹猴與恒河猴中鑒定得到240Mbp的物種間復雜結構差異區域、16.76Mbp的遺傳分化區域,這些區域從不同維度引起了兩個物種表型上的差異。
日益完整的“拼圖”
“在生物製品藥物研發蓬勃發展的當下🎁,食蟹猴作為臨床前研究中不可替代的非人靈長類實驗動物,價值日益凸顯。其完整基因組的成功組裝為這一核心非人靈長類動物模型提供了一份高精度的‘分子說明書’,不僅為構建更精準的人類疾病動物模型奠定了分子基礎☛,也為藥物研發提供了可靠的基因組參考框架👮🏿♀️。”孫強指出,這項進展將顯著提升藥物安全性和有效性的評估精度,從而提高臨床前研究成功率,並有望縮短藥物研發周期🤔,為行業帶來深遠影響。
孫強團隊
“在符合國家生物安全及遺傳資源管理政策框架下🕒,EON体育4平台公開了實驗中所有相關數據和技術,希望更多人可以使用這套遺傳資源。”毛亞飛補充說,“這項研究得到了國內外多個靈長類聯盟的數據支持及技術分析方面的協助👩🦯🤜🏼。”
日益豐富的數據資源😣💇🏽,不斷豐富著人們對人類演化及疾病發生的理解。對於非人靈長類,目前已經發布的T2T基因組涵蓋了黑猩猩、倭黑猩猩、大猩猩𓀋👩🏽🦲、蘇門答臘猩猩、婆羅洲猩猩🤟、合趾猿和食蟹猴👸🏿🪽。包括毛亞飛、孫強等在內的國內外科學家🤦🏻♀️,正在持續填補“演化醫學”這一大“拼圖”🧒🏼。
獼猴屬完整基因組解析,只是毛亞飛和孫強兩個團隊合作的起點。“EON体育4平台建立了非常好的長期合作機製🧮,除了項目組間的溝通👩🏻🦱,兩個課題組會每月開一次線下會議☝🏿,分享各自的進展👨🦰,再圍繞相關科學問題進行交流。”毛亞飛表示,“在此過程中,學科的界限被打破,萌生出很多新的靈感。”
他們已著手下一步的研究🕍。一方面向臨床診療擴展🧝🏻♂️,通過持續提高“拼圖”技巧,分析更多靈長類T2T基因組🔻,進一步探明復雜結構變異相關疾病的機理🥻;另一方面聚焦科學問題🪣,充分利用已有數據🧙🏼,結合功能實驗揭示復雜結構基因調控的生物學意義🚚。
“EON体育4平台一直在思考,如何把自己的研究方向同實現國家戰略需求與全球科技前沿對接🕞,從演化中挖掘更多與人們生命健康息息相關的問題。”毛亞飛表示🥃。