2023年5月25日,中國醫(yī)學(xué)科學(xué)院基礎(chǔ)醫(yī)學(xué)研究所于洋團(tuán)隊(duì)在Current Biology《當(dāng)代生物學(xué)》發(fā)表了題為“Unanticipated broad phylogeny of BEN DNA-binding domains revealed by structural homology searches”(結(jié)構(gòu)同源搜索發(fā)現(xiàn)BEN家族DNA結(jié)合結(jié)構(gòu)域存在廣泛跨種系分布)的論文。該研究利用基于人工智能的蛋白結(jié)構(gòu)預(yù)測和三維同源搜索方法,發(fā)現(xiàn)了大量含有未注釋BEN結(jié)構(gòu)域的重要基因。研究同時(shí)證實(shí)該方法可以推廣用于其他蛋白未知結(jié)構(gòu)的研究與功能注釋,將為未來的分子生物學(xué)和生物化學(xué)研究提供重要輔助手段。
于洋課題組在以往研究中發(fā)現(xiàn),基于人工智能的蛋白結(jié)構(gòu)預(yù)測工具可以精確預(yù)測BEN結(jié)構(gòu)域的空間結(jié)構(gòu)并能輔助區(qū)分BEN結(jié)構(gòu)亞型(Zheng et al., Genes & Development, 2022)。在最新的研究中,該團(tuán)隊(duì)利用基于AlphaFold2蛋白預(yù)測結(jié)構(gòu)數(shù)據(jù)庫的3D結(jié)構(gòu)比對方法,在不同物種中鑒定與BEN結(jié)構(gòu)域具有空間相似性的蛋白。該團(tuán)隊(duì)首先在以往無法檢出BEN結(jié)構(gòu)域的線蟲蛋白組中進(jìn)行了結(jié)構(gòu)比對,檢出了含有與BEN高度類似片段的LIN-14和SEL-7等重要已知的轉(zhuǎn)錄因子。LIN-14已經(jīng)被發(fā)現(xiàn)近四十年,作為第一個被發(fā)現(xiàn)的miRNA靶向基因而廣為人知。LIN-14長期被認(rèn)為不存在哺乳動物同源蛋白,但本研究發(fā)現(xiàn)LIN-14結(jié)合DNA的區(qū)域具有典型BEN結(jié)構(gòu)特征。在其他物種中,研究團(tuán)隊(duì)也發(fā)現(xiàn)大量未被注釋的BEN結(jié)構(gòu)域,其中最有代表性的是DUF4806。DUF4806是一個預(yù)測發(fā)現(xiàn)的未知功能域,在不同物種中有數(shù)千成員。結(jié)構(gòu)比對顯示預(yù)測的DUF4806結(jié)構(gòu)也具有BEN結(jié)構(gòu)的特征,進(jìn)一步研究顯示DUF4806為BEN結(jié)構(gòu)域的亞型。最后,研究團(tuán)隊(duì)還將該方法推廣運(yùn)用于其他蛋白的研究,發(fā)現(xiàn)人類TOP1等基因中含有未注釋的DUF3504結(jié)構(gòu)域。
于洋課題組以蛋白結(jié)構(gòu)預(yù)測為基礎(chǔ)針對BEN等結(jié)構(gòu)域進(jìn)行了跨蛋白組比對和注釋,拓展了對BEN這一結(jié)構(gòu)域的理解。更重要的是,該工作建立的方法將為相關(guān)研究提供新的范式。
本研究工作得到中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)與健康科技創(chuàng)新工程(2021-I2M-1-019)項(xiàng)目的資助?;A(chǔ)醫(yī)學(xué)研究所于洋為論文通訊作者,課題組研究生潘安宇、曾揚(yáng)帆、劉靜靜為論文的共同第一作者。
論文鏈接:https://www.cell.com/current-biology/fulltext/S0960-9822(23)00605-X