基于家蚕转录组测序的SSR序列分析
来源:用户上传
作者:王晖 王敬 高妍夏 杨帆 马宝俊 谷苗 张乘云 薛翠翠 谢岩
摘要:本研究对家蚕中肠、脂肪体进行转录组测序,分析SSR位点的分布规律和特征。结果表明,从17915个Unigene中共检测到1339个SSR位点,分布在960个Unigene中。SSR位点的基序长度以1bp为主,随着基序长度的增加,SSR位点数量逐渐减少,SSR位点间的距离和平均长度逐渐增加。家蚕SSR单核苷酸基序类型以A/T为主,占总基序数量的53.10%。SSR位点重复次数主要集中在5~12次,占总SSR位点数的87.60%,其中单核苷酸重复10次的SSR位点最多,共有368个。家蚕转录组SSR基序长度分布范围为10~688bp,高度多态性SSR位点(长度≥ 20bp)有253个,占比18.89%。960个Unigene中分别有125、122个在GO、KEGG数据库中得到功能注释,主要包括蛋白结合、DNA结合、剪接体、代谢途径等通路。随机选择20对EST-SSR引物进行验证,发现19条引物扩增成功。
关键词:家蚕;转录组测序;简单重复序列(SSR);特征分析
中图分类号:S881.2+6 文献标识号:A 文章编号:1001-4942(2022)01-0014-07
家蚕作为目前唯一被人类完全驯化的无脊椎动物,具有生长周期短、经济效益好等优点。中国家蚕养殖历史悠久,古代中国的家蚕通过丝绸之路传播,逐渐演化出许多地方品系,之后传播到欧洲、东亚、南亚等国家,并形成当地特有品种[1]。目前国内常见的家蚕品系可分为中系、日系等,中系家蚕品种主要有菁松、新松、苏春、浙蕾甲等,日系家蚕品种主要有皓月、东肥、白云、玉种等[2]。此外,还有一些特色地方品种,如孝丰17号、安吉7号、余杭11等;一部分由引进的日系品种改良选育而成的新品种,如苏7、苏10、K14等[3]。由于家蚕品系、品种、杂交种众多,根据形态特征已难以进行准确的种间鉴定。
分子标记是能反映生物基因组差异的特异性的DNA片段,由于具有位点数量多、多态性高、检测技术简单快捷等优点,已广泛应用于动植物品种选育、物种亲缘关系鉴定、基因定位等领域[4]。目前已报道的分子标记主要有RFLP(限制性内切酶片段长度多态性)、RAPD(随机扩增多态性DNA)、SSR(简单重复序列)等。SSR为目前最常用的分子标记,基于基因组或转录组序列信息开发,可分为基因组SSR标记和表达序列标签SSR(EST-SSR)标记。EST-SSR标记在团头鲂[5]、文蛤[6]、蚂蟥[7]、红腹锦鸡[8]、绵羊[9]等物种的种群遗传结构分析、遗传多样性分析、QTL定位方面已有报道。基于不同的家蚕品种,AFLP[10]、RAPD[11]、SSR[12]分子标记均表现出较好的鉴别力。随着高通量测序技术的进步和成本的降低,从转录组测序数据中可以挖掘出更多的SSR分子标记。
本研究选择代表性家蚕品种,获得家蚕重要的消化(中肠)、免疫器官(脂肪体)的转录组数据,对转录组数据库中的SSR位点进行筛选和分析,研究其分布规律,并通过设计引物,初步验证SSR标记的有效性,以期为家蚕品种鉴定提供有效的分子标记工具。
1 材料与方法
1.1 试验材料
2019年6月将家蚕品种‘东肥’‘彩3’‘彩4’‘菁松×皓月’幼虫饲养于温度(25±2)℃、湿度60% ~70%和自然光周期的环境中。7月份解剖‘东肥’与‘彩4’蚕体(5龄最后一天、预蛹期、排净粪便),分离得到中肠、脂肪体组织,迅速投入液氮中,保存于-80℃,送北京诺禾致源科技股份有限公司进行转录组测序。
1.2 试验方法
1.2.1 SSR位点分析 采用MISA程序(1.0版,http://pgrc.ipkgatersleben.de/misa/misa.html)检测基因的SSR位点,参数设置默认,1、2、3、4、5、6个unitsize的最少重复次数分别为10、6、5、5、5、5,统计不同SSR类型在转录本(Unigene)中的分布规律。
1.2.2 PCR扩增 使用动物组织/细胞基因组DNA提取试剂盒(北京索莱宝科技有限公司,D1700)提取4种家蚕蚕体的DNA,NanoDrop2000检测DNA浓度和纯度,1.5%琼脂糖凝胶电泳检测DNA的完整性,-20℃保存备用。选择与家蚕抗氧化途径相关的、含有SSR位点的重要基因,采用Primer3设计引物。PCR反应体系:DNA0.2μL,引物F、R(10μmol/L)各0.8μL,2×ReactionMix10μL,Taq酶0.4μL,ddH2O8.2μL。扩增程序:94℃ 3min;94℃ 30s,55℃ 30s,72℃1min,35个循环;72℃ 10min。反应结束后,采用2.5%琼脂糖凝胶电泳进行检测。
1.3 数据分析
采用MicrosoftExcel2010软件进行数据统计分析,OriginPro2021b软件作图。
2 结果与分析
2.1 家蚕SSR位点数量与分布
从家蚕的脂肪体和中肠共检测到1339个SSR位点,分布于960个Unigene,平均每个Unigene含有1.39个SSR位点;192个Unigene含有1个以上SSR位点,SSR发生频率和出现频率分别为5.35%、7.47%;每10kb长度序列包含1.53个SSR位点(表1)。SSR位点的基序长度以1bp为主;基序长度为1、3bp时,SSR位点总长度较大;随着基序长度继续增加,SSR位点数量大幅减少,位点间的平均距离和平均长度总体呈增加趋势(表2)。
2.2 家蚕转录组SSR位点基序类型
家蚕SSR位点基序类型共有66种,从单核苷酸至六核苷酸均含有多种基序类型。单核苷酸基序类型以A/T为主,占总基序数量的53.10%,C/G基序出现频率很低;二核苷酸基序类型有8种,以AC/GT为主;三核苷酸基序类型有20种,以CCG/CGG为主;四核苷酸、五核苷酸、六核苷酸基序类型分别有12、8、14种,分别以AAAT/ATTT、ACAGG/CCTGT、ACCGAG/CGGTCT为主要类型(图1)。
转载注明来源:https://www.xzbu.com/8/view-15424319.htm