世俱杯规则-虎牙直播-比利亚vs西班牙人-德国杯|www.cnyhmy.com

生菜bHLH轉錄因子家族的鑒定與生物信息學分析

時間:2023-07-14 15:35:02 來源:網友投稿

隋心意,趙小剛,毛 欣,李亞靈,溫祥珍

(山西農業大學園藝學院,山西太谷 030801)

bHLH轉錄因子是廣泛存在于動物、植物中的轉錄因子超家族,因其含有‘螺旋-環-螺旋’結構域而得名[1]。bHLH結構域由50~60個氨基酸組成,包括N端的堿性區(Basic region)和C端HLH區(Helix Loop Helix)[2]。其中N端的堿性區域由10~15個氨基酸組成,植物中50%以上的堿性氨基酸區含有高度保守的H5-E9-R13(His5-Glu9-Arg13)序列,該序列通過和特定DNA的順式作用元件結合激發基因轉錄;
HLH區域主要由40個左右的疏水性氨基酸組成,有利于HLH區域二聚體的形成和蛋白質二級結構的穩定[3-4]。依據進化關系、基因功能、與DNA的結合模式,動物中bHLH轉錄因子被分為 6個組(A、B、C、D、E、F),45個家族[5]。與動物相比,植物的bHLH蛋白較少,大多數植物bHLH蛋白在動物家族分類中屬于B組[6]。目前在擬南芥中鑒定出了162個bHLH家族轉錄因子,與水稻中的bHLH轉錄因子一起被分成了25個亞家族[7-9];
將水稻中的165個轉錄因子分為22個亞家族[9],將擬南芥中161個轉錄因子分為21個亞家族[10];
PIRES等[11]利用對來源于藻類和陸生植物的500多個bHLH蛋白的分析,將植物bHLH蛋白分為26個亞家族。隨著全基因組測序技術的發展,越來越多物種中的bHLH轉錄因子正在被鑒定出來。

在擬南芥中的大量研究表明,bHLH轉錄因子參與了形態建成、生長發育、抗逆反應、信號轉導和次生代謝等多種生物學過程[2,12],比如PIF4參與調控擬南芥下胚軸的伸長過程[13],GL3和EGL3基因控制根表皮的細胞分化[14],EMBRYO1基因控制胚胎發育[15],DYTl控制絨氈層的分化和發育[16],SPATULA基因控制雌蕊的發育[17];
同時有研究表明AtbHLH112對抗鹽、抗旱和抗滲透脅迫有正調控作用,但抑制根系發育[18-19],OsHLH013和OsHLH016調控花青素的生物合成,PIF3和PIF4在光敏色素信號傳導中起調控作用[13,20]。在水稻的大量研究中表明bHLH轉錄因子在氣孔發育、腋芽原基形成、胚乳發育、種皮顏色、鐵元素吸收利用、耐鹽性和抗旱性方便也發揮著非常重要的作用。

生菜(Lactuca sativa L.)又名葉用萵苣,為菊科菊苣屬一年生草本植物,富含維生素C、維生素E、葉酸、多酚、膳食纖維、生育酚和類胡蘿卜素等營養物質,是日常生活不可或缺的蔬菜之一[21]。隨著生菜全基因組數據的公布,有必要對生菜bHLH家族基因進行全基因組挖掘和全面、系統分析。因此本研究計劃使用生物信息學的方法,從基因組水平上對生菜bHLH家族的蛋白特性、保守域結構、內含子與外顯子數量、motif分布和功能分化等方面進行研究,以期為生菜bHLH家族基因的克隆、功能解析提供理論基礎。

1.1 數據來源

從NCBI(https://www.ncbi.nlm.nih.gov/)數據庫中下載生菜基因組數據和蛋白組數據,通過Pfam(http://pfam.xfam.org/)數據庫中下載bHLH結構域的隱馬氏模型(登錄號為:PF00010)。利用HMMER3.0軟件,以隱馬氏模型文件PF00010對生菜蛋白組數據進行搜索,獲得生菜中含有bHLH結構域的候選蛋白家族成員的蛋白序列。用SMART(http://smart.emblheidelberg.de/)數據庫比對得到的蛋白序列,將無bHLH結構域的序列剔除,確定最終候選基因。

1.2 生菜bHLH蛋白的特性分析

通過ExPASy ProtParam tool(https://web.expasy.org/protparam/)預測bHLH蛋白氨基酸序列的基本信息,包括氨基酸數量、相對分子量、等電點、疏水性和不穩定性等理化性質。通過在線軟件Cell Ploc 2.0進行亞細胞定位預測(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc/);
通過在線軟件THHMM 2.0(http://www.cbs.dtu.dk/services/TMHMM/)進行跨膜結構分布和數量的預測。

1.3 生菜bHLH蛋白的保守域序列分析

利用序列分析軟件DNAMAN 5.0和在線軟件WebLogo(http://weblogo.berkeley.edu/logo.cgi)對生菜bHLH蛋白的保守結構域分析。

1.4 生菜bHLH基因基序預測分析

將生菜bHLH家族的蛋白序列提交到在線網站MEME 4.11.4(http://web.mit.edu/meme_v4.11.4/share/doc/overview.html)進行motif預測分析,搜索基序設置為10,基序長度介于6~50之間,導出meme.xml結果文件。將生菜bHLH基因家族每個成員的CDS序列和其對應的基因組序列進行比對,利用GSDS(http://gsds.cbi.pku.edu.cn/)在線軟件進行內含子和外顯子圖譜的繪制。

1.5 生菜bHLH基因的進化分析

將最終獲得的135個生菜bHLH轉錄因子用Clustal**行比對,序列比對的結果用MEGA 7.0的NJ法(Neighbor Joining)構建系統發育樹,其中檢驗參數為Bootrap 1000次,模式設置為Poisson model,缺口設置為pair gap deletion。將制作好的進化樹導出,利用ITOL網站進行美化和豐富顏色(https://itol.embl.de/)。

2.1 生菜bHLH基因家族成員鑒定

從Pfam數據庫中下載bHLH家族的隱馬氏模型文件(Pfam碼PF00010),搜索生菜的全基因組蛋白數據庫,共得到163條bHLH類似基因;
用SMART數據庫和hammer網站結構域分析工具鑒定得到的蛋白序列,檢查序列缺失、去除冗余,最終獲得135條bHLH序列。利用expasy在線程序對生菜bHLH蛋白的理化性質進行分析,bHLH蛋白特性分析表明,最長的bHLH蛋白有685個蛋白質殘基,而最短的只有162個蛋白質殘基;
它們的等電點分布在0.63~9.51之間,其中有92個酸性蛋白,43個堿性蛋白;
相對分子量在17843.82~75409.15 Da之間;
不穩定指數分布在32.5~76.39之間,其中有123個蛋白的不穩定系數大于40,說明大部分bHLH蛋白為不穩定蛋白;
135個蛋白的疏水性指數均小于0,為親水性蛋白。cell plot的預測表明有100個蛋白屬于細胞核蛋白,是生菜bHLH家族中數目最多的一部分,有16個蛋白定位于葉綠體,有3個蛋白定位于細胞質,有1個蛋白定位于內質網,有1個蛋白定位于細胞膜;
有1個蛋白定位于線粒體。跨膜結構域分析表明,有134個蛋白無跨膜結構域,有1個蛋白有1個跨膜結構域。但目前這些轉錄因子還未被定位于染色體上。

2.2 生菜bHLH基因保守域的鑒定和分析

使用DNAMAN 5.0對135個生菜bHLH蛋白結構域進行鑒定和分析,并用WebLogo 3獲得生菜bHLH蛋白的結構域序列標簽。分析發現135個生菜bHLH基因保守域基本由50個氨基酸組成,最長為53個氨基酸,最短為43個氨基酸;
該保守域由N端堿性結構域和C端HLH結構域組成;
其中N端堿性結構域由10~15個氨基酸組成,該區域富含堿性氨基酸精氨酸(R)、賴氨酸(K)、組氨酸(H)和酸性氨基酸谷氨酸(E),谷氨酸可以和DNA的大溝結合。DNAMAN分析表明有103條bHLH序列同時在9位點和12位點同時為E和R,該序列組成可以結合E-Box,有59條bHLH序列同時在5位點、9位點和13位點同時為H、E和R,主要有結合G-Box的功能。C端的HLH結構域的α螺旋富含疏水性氨基酸纈氨酸(V)、亮氨酸(L)、異亮氨酸(I)、脯氨酸(P)、丙氨酸(A),其中第23位點的L高度保守,這對維持bHLH蛋白二級結構的穩定有重要作用(圖1、圖2)。

圖1 生菜bHLH結構域的氨基酸序列比對

圖2 生菜bHLH轉錄因子家族的保守結構域

2.3 生菜bHLH轉錄因子家族進化分析

為了研究生菜bHLH家族成員間的進化關系,利用MEGA7.0對135個蛋白的序列進行進化樹分析,結果表明135個bHLH基因被分為10個亞家族(圖3),其中第Ⅷ、Ⅳ和Ⅶ亞家族的bHLH蛋白成員最多,分別包含43、27和15個bHLH蛋白;
第Ⅰ、Ⅲ、Ⅵ、Ⅸ、Ⅱ、Ⅹ亞家族的bHLH蛋白成員為5~10個;
而第Ⅴ亞家族的成員最少,只含有1個bHLH蛋白。

圖3 生菜中bHLH蛋白家族的系統進化樹

2.4 生菜bHLH蛋白的保守基序確定

為了進一步研究生菜中bHLH蛋白質結構的多樣性,通過MEME在線軟件對135個bHLH蛋白質進行了保守基序分析,搜索參數設置為50,共獲得10條保守基序。由圖4可知,135個bHLH蛋白含有2~4個基序,相同家族的bHLH蛋白傾向于有相同的基序,不同的家族間bHLH蛋白基序數量和類型存在差異,推測正是由于這些特異motif的存在導致了bHLH家族基因功能的分化。但不同的家族均包含基礎基序motif 1和motif 2,在Inter Pro Scan中這兩個基序被注釋為Helix-loop-helix DNA-binding domain。在同一家族間內根據motif的差異和基因長度的不同劃分為不同的亞家族,一些基序僅存在于特定基因中,這些基序可能有助于形成這些基因的特定功能。其中motif 3特異分布于Ⅷ亞家族,該基序被注釋為Basic helix-loophelix leucine zipper transcription factor;
motif 4分布于Ⅱ、Ⅲ、Ⅳ、Ⅵ、Ⅶ和Ⅹ六個亞家族;
motif 5特異分布于Ⅱ亞家族;
motif 6特異分布于Ⅷ亞家族;
motif 7分布于Ⅶ和Ⅷ兩個亞家族;
motif 8特異分布于Ⅷ亞家族;
motif 9特異分布于Ⅳ亞家族;
motif 10特異分布于Ⅹ亞家族,motif 4-10在Inter Pro Scan中均被注釋為未知結構。

2.5 生菜bHLH基因的外顯子和內含子結構分析

基因家族各成員的基因結構往往呈現多樣性,其中內含子和外顯子的數量是基因家族進化過程中的重要標志,本研究根據生菜基因組信息獲取了每一個基因的CDS序列信息,并繪制了外顯子—內含子基因結構圖,結果顯示生菜bHLH基因家族內含子數目變化差異較大,介于0~10之間,且內含子的數量在不同的家族間差異較大。由圖5可知,生菜bHLH基因家族分為內含子富集和內含子缺失2類,其中XP_023753528.1、XP_023733363.1、XP_023736226.1、XP_023750890.1、XP_023742628.1、PLY63858.1、PLY992 56.1、XP_023753746.1、XP_023751742.1、PLY91151.1、PLY63479.1、 PLY77525.1、 XP_023737733.1、 XP_023748410.1、PLY66263.1無內含子,PLY67254.1、XP_023746624.1、 XP_023736955.1、 XP_023737512.1、PLY62526.1、XP_023748593.1、XP_023735519.1、XP_023756084.1、XP_023750458.1、XP_023762189.1 僅 1個內含子,以上成員均屬于內含子缺失組;
PLY86498.1、XP_023767110.1含10個內含子(占比1.5%);
XP_023754083.1、XP_023759112.1含9個內含子(占比1.5%),PLY73746.1、PLY96464.1含8個內含子(占比 1.5%),XP_023756964.1、XP_023748571.1、XP_023748493.1、 PLY67087.1、 PLY74352.1、 XP_023767039.1、 XP_023771981.1、 PLY62734.1、 XP_023736669.1、 XP_023746595.1、 XP_023751248.1、PLY79054.1含7個內含子(占比8.9%),含6個內含子的bHLH基因18個(占比13.3%),含5個內含子的bHLH基因15個(占比13.3%),以上成員均屬內含子富集組。其中含有2個內含子的bHLH基因高達25個,所占成員總數最多,占比18.5%。

圖5 生菜bHLH家族基因外顯子與內含子基因結構分布

植物bHLH蛋白參與抗逆、生長發育、生物合成及信號傳導等生理生化過程[22-23]。目前已從一些植物如擬南芥[8]、水稻[9]、人參[24]、西瓜[25]、茶樹[26]、葡萄[27]、蘋果[28]等分別鑒定出162、167、169、96、120、110、188個bHLH蛋白,但生菜bHLH家族的研究鮮見報道。本研究基于生菜全基因組數據,利用生物信息學的手段鑒定了生菜bHLH轉錄因子家族,并且對它們的理化性質、保守結構域、基因結構和系統進化和等情況進行了詳細的分析。

通過驗證,去除冗余,共鑒定到135個bHLH蛋白。這些bHLH蛋白的蛋白質殘基介于162~685之間,它們的等電點分布在0.63~9.51之間,相對分子量在17843.82~75409.15之間;
不穩定指數分布在32.5~76.39之間。這135個蛋白包括100個細胞核蛋白,16個葉綠體蛋白,3個細胞質蛋白,1個內質網蛋白,1個細胞膜蛋白,1個線粒體蛋白;
其中僅有1個蛋白有跨膜結構域。

生菜bHLH蛋白bHLH保守結構域由兩部分組成,堿性氨基酸區和HLH區。堿性氨基酸區位于N端,HLH區位于C端[7,29-30]。堿性氨基酸區含有高度保守的His5-Glu9-Arg13序列,第10位和第12位的Arg也高度保守,而HLH區第23位和第55位的Leu高度保守,且保守位點與西瓜[25]、蓮[31]和芒果[32]bHLH蛋白的分析結果相似。135個生菜bHLH蛋白中的103個具有E-box的結合功能,59個具有結合G-box的結合功能,該結果與擬南芥(60.54%)和水稻(56.89%)[9]的分析結果相似。

聚類分析表明,135個bHLH蛋白被劃分為10個亞家族,共獲得10條保守基序。由圖可知,135個bHLH蛋白含有2~4個基序,相同家族的bHLH蛋白傾向于有相同的基序,不同的家族間bHLH蛋白基序數量和類型存在差異,推測正是由于這些特異motif的存在導致了bHLH家族基因功能的分化。外顯子—內含子基因結構圖,結果顯示生菜bHLH基因家族內含子數目變化差異較大,介于0~10之間,且內含子的數量在不同的家族間差異較大。

本研究在生菜全基因組中共鑒定出135個bHLH家族蛋白,共發掘出10條保守基序,其中基序motif 1和motif 2是生菜bHLH家族成員均包含的保守基序,為今后生菜bHLH家族蛋白的研究提供了基礎。但本研究僅對生菜bHLH蛋白進行了功能預測,其具體功能還需進一步驗證。

猜你喜歡基序內含子生菜脆嫩爽口的生菜中老年保健(2022年6期)2022-08-19帶TRS基序突變的新型冠狀病毒威脅更大南方醫科大學學報(2022年3期)2022-04-13芥藍Aux/IAA家族基因生物信息學與表達分析浙江大學學報(農業與生命科學版)(2021年3期)2021-07-10線粒體核糖體蛋白基因中內含子序列間匹配特性分析內蒙古師范大學學報(自然科學漢文版)(2021年3期)2021-06-01鼠傷寒沙門菌小RNA GcvB 靶基因篩選和驗證分析中國預防獸醫學報(2020年8期)2020-11-05通過合成生物學可改造非豆科植物進行固氮(2020.8.8 iPlants)三農資訊半月報(2020年15期)2020-08-25生菜怎么吃更健康農家參謀(2020年5期)2020-06-15不同方向內含子對重組CHO細胞中神經生長因子表達的影響生物工程學報(2019年6期)2019-07-10更 正生物學通報(2019年1期)2019-02-15陸地棉GhDHN1基因結構及內含子生物信息學分析中國棉花(2018年6期)2018-07-06

推薦訪問:轉錄 生菜 因子

最新推薦
猜你喜歡