清華新聞網(wǎng)11月26日電 蛋白質(zhì)工程領(lǐng)域在生物技術(shù)、醫(yī)學(xué)和基礎(chǔ)研究方面具有巨大潛力,但其發(fā)展往往受限于序列-功能關(guān)系理解不足、AI設(shè)計(jì)復(fù)雜性質(zhì)的困難以及勞動(dòng)密集型的定向進(jìn)化過(guò)程。定向進(jìn)化技術(shù)模仿自然選擇,通過(guò)人為引入基因突變并根據(jù)目標(biāo)功能進(jìn)行篩選,可以建立序列-功能的直接映射關(guān)系,是目前蛋白質(zhì)工程領(lǐng)域最核心的設(shè)計(jì)改造策略。但是定向進(jìn)化技術(shù)本身需拆解成多個(gè)繁瑣流程,并需要經(jīng)過(guò)多輪迭代,極大限制了技術(shù)的應(yīng)用發(fā)展和提供高質(zhì)量序列-功能數(shù)據(jù)用于訓(xùn)練AI算法。因此將定向進(jìn)化技術(shù)進(jìn)行多模塊整合,實(shí)現(xiàn)一體化、標(biāo)準(zhǔn)化的工業(yè)標(biāo)準(zhǔn)蛋白質(zhì)智能進(jìn)化,并集成機(jī)器人、軟件、機(jī)械控制系統(tǒng)降低人為干預(yù),提高通量水平,獲取標(biāo)準(zhǔn)化蛋白質(zhì)序列-功能數(shù)據(jù),將成為未來(lái)的發(fā)展趨勢(shì)。

圖1.研究成果以封面文章形式發(fā)表于《自然·化學(xué)工程》
近日,清華大學(xué)藥學(xué)院張數(shù)一副教授團(tuán)隊(duì)合作建立了一個(gè)工業(yè)級(jí)自動(dòng)化平臺(tái)iAutoEvoLab,該平臺(tái)相比傳統(tǒng)自動(dòng)化工作站的重要?jiǎng)?chuàng)新在于實(shí)現(xiàn)了真正的無(wú)人值守和極高的工作效率,能夠不間斷運(yùn)行約25天實(shí)現(xiàn)“近乎零活性”到“完全功能”進(jìn)化。
硬件方面,iAutoEvoLab無(wú)縫集成了包括液體處理工作站、培養(yǎng)箱、自動(dòng)化機(jī)械臂、酶標(biāo)儀、冰箱和計(jì)算控制系統(tǒng)等一系列關(guān)鍵組件。所有核心設(shè)備安置在一個(gè)半封閉環(huán)境中,除培養(yǎng)箱和冰箱等設(shè)備外,整套系統(tǒng)處于無(wú)菌環(huán)境,防止反應(yīng)池受到污染。軟件方面,MegaFluent控制軟件負(fù)責(zé)協(xié)調(diào)和執(zhí)行整個(gè)工作流程。硬件設(shè)備獲得讀數(shù)以后,由MegaFluent進(jìn)行處理和評(píng)估,并根據(jù)結(jié)果對(duì)流程分支進(jìn)行決策,以完成后續(xù)諸如保存培養(yǎng)物、傳代、稀釋、更換培養(yǎng)基及調(diào)節(jié)篩選壓力的一系列流程。

圖2.iAutoEvoLab硬件和軟件示意圖
該系統(tǒng)另一重要?jiǎng)?chuàng)新在于“智能版”生物連續(xù)定向進(jìn)化方案:基因回路+OrthoRep,實(shí)現(xiàn)多樣復(fù)雜功能蛋白質(zhì)的生長(zhǎng)耦合連續(xù)進(jìn)化。包括蛋白質(zhì)與DNA、蛋白質(zhì)與蛋白質(zhì)、蛋白質(zhì)與小分子相互作用以及新型融合蛋白的定向進(jìn)化都可采用這一方案。為實(shí)現(xiàn)復(fù)雜功能的同時(shí)進(jìn)化,團(tuán)隊(duì)成員設(shè)計(jì)了NIMPLY、雙選擇等合成基因電路,實(shí)現(xiàn)“既要結(jié)合DNA又要結(jié)合小分子”等復(fù)雜邏輯的自動(dòng)篩選。

圖3.LmrA的基因電路控制與生長(zhǎng)耦合可編程進(jìn)化
利用該系統(tǒng)對(duì)活性近乎為零的前體CapT7進(jìn)行蛋白質(zhì)功能進(jìn)化。為了賦予T7 RNAP加帽能力以擴(kuò)大其應(yīng)用效果,團(tuán)隊(duì)將非洲豬瘟病毒的加帽酶與其進(jìn)行融合,有望應(yīng)用于哺乳動(dòng)物細(xì)胞中的正交基因表達(dá)和疫苗開(kāi)發(fā)等領(lǐng)域。在該平臺(tái)上進(jìn)行了一個(gè)完全自動(dòng)化多組平行的定向進(jìn)化過(guò)程,在96孔板中并行啟動(dòng)超過(guò)100條獨(dú)立進(jìn)化線(xiàn),每天9個(gè)循環(huán)進(jìn)行連續(xù)25天,再接入連續(xù)流式裝置追加10天高濃度篩選,最終獲得變體CapT7-V14。該變體在酵母內(nèi)使靶基因表達(dá)提升30倍;在體外轉(zhuǎn)錄反應(yīng)中可合成帶帽mRNA;在HEK293T細(xì)胞中,其驅(qū)動(dòng)的熒光蛋白水平與CMV、EF1α等哺乳動(dòng)物強(qiáng)啟動(dòng)子相當(dāng),實(shí)現(xiàn)“原核啟動(dòng)子直接用于人源細(xì)胞”的跨界表達(dá)。

圖4.CapT7的可編程進(jìn)化及功能驗(yàn)證
以上案例證明了iAutoEvoLab系統(tǒng)具有極強(qiáng)的進(jìn)化篩選能力,將生物進(jìn)化系統(tǒng)與工業(yè)自動(dòng)化框架相結(jié)合,進(jìn)一步提升了應(yīng)用潛力,使蛋白質(zhì)在進(jìn)化過(guò)程中快速生成大量高質(zhì)量且標(biāo)準(zhǔn)化的數(shù)據(jù),此過(guò)程有助于推進(jìn)蛋白質(zhì)設(shè)計(jì)的計(jì)算建模和人工智能研究。在蛋白質(zhì)進(jìn)化實(shí)驗(yàn)中,平臺(tái)全程記錄每孔OD、突變譜、選擇壓力等20余項(xiàng)參數(shù),每輪生成海量、高質(zhì)量、AI可讀的數(shù)據(jù)點(diǎn),成為訓(xùn)練下一代蛋白質(zhì)設(shè)計(jì)AI模型的工業(yè)級(jí)蛋白數(shù)據(jù)收集引擎。生物進(jìn)化、工業(yè)自動(dòng)化和人工智能的進(jìn)一步深度融合有望揭示蛋白質(zhì)執(zhí)行功能的分子機(jī)制以及繪制蛋白質(zhì)進(jìn)化的適應(yīng)性景觀(guān),最終建立起蛋白質(zhì)序列與功能之間的直接聯(lián)系,從而滿(mǎn)足生物技術(shù)和生物醫(yī)學(xué)應(yīng)用中對(duì)蛋白質(zhì)設(shè)計(jì)的多樣化需求。

圖5.iAutoEvoLab收集高質(zhì)量、標(biāo)準(zhǔn)化數(shù)據(jù)
研究成果以“一種工業(yè)自動(dòng)化尺度的蛋白質(zhì)編程進(jìn)化實(shí)驗(yàn)室”(An industrial automated laboratory for programmable protein evolution)為題,于11月19日以封面文章形式發(fā)表于《自然·化學(xué)工程》(Nature Chemical Engineering)。
清華大學(xué)藥學(xué)院2025屆博士畢業(yè)生沈達(dá)為論文第一作者,藥學(xué)院副教授張數(shù)一為論文通訊作者。研究得到國(guó)家自然科學(xué)基金、國(guó)家科技部重點(diǎn)研發(fā)計(jì)劃、清華大學(xué)篤實(shí)專(zhuān)項(xiàng)和北京生物結(jié)構(gòu)前沿研究中心的資助。
論文鏈接:
https://www.nature.com/articles/s44286-025-00303-w?sessionid=
供稿:藥學(xué)院
編輯:李華山
審核:郭玲