慢直播:泛基因组分析
2023年1月3日 - 2023年1月15日(1月8日休息) |20:30 - 22:00 | 线上直播
课程安排
目前常见的参考基因组仅为单一个体的基因组,远不能涵盖整个物种的所有遗传序列,需要构建来自多个个体的泛基因组。
本次课程详细介绍基于de novo assembly策略和基于迭代组装(二代)策略的泛基因组分析,包括泛基因组序列构建、gene PAV分析、核心基因和可变基因鉴定和比较、序列PAV分析以及图形泛基因组构建等。课程包含理论和全套流程代码的演示。
课前预习
基础知识
1. Linux 基础、Singularity容器的使用
2. R 语言基础
3. 测序原理
4. 基因组组装、注释基础
第一天
背景知识概要
1. 泛基因组概念
2. 泛基因组发展史
3. 泛基因组常用构建方法
4. 经典文献解读
第二天
基因组数据准备
1. 基因组和基因注释数据下载
2. 基因组数据预处理
3. 基因注释文件(gff/gtf)预处理
4. 提取最长转录本
5. 基因组长度、N50、gene条数等信息统计
第三天
核心和可变基因家族分析|de novo assembly策略
1. 使用orthofinder鉴定基因家族
2. 核心和可变基因家族统计
3. 核心和可变基因家族饱和曲线和柱状图绘制
4. 核心和可变基因基因长度、exon个数等比较
5. 核心和可变基因功能富集分析
第四天
sequence-PAV检测|de novo assembly策略
1. 使用mummer进行基因组比对
2. 基于比对结果提取PAV序列
3. 鉴定PAV相关基因
第五天
变异检测|de novo assembly策略
1. 基于基因组比对的SNP/InDel鉴定
2. 基于基因组比对的SV检测
3. 变异检测结果注释
第六天
数据准备及测序数据质控|迭代组装策略
1. 参考基因组数据准备
2. nt数据库及taxonomy数据库准备
3. 二代测序数据质控和过滤
4. 二代测序数据质控过滤统计
第七~八天
泛基因组序列构建|迭代组装策略
1. 基于metagenome-like 策略进行序列构建
2. 基于迭代组装策略进行序列构建
3. 基于unmapped reads独立组装进行序列构建
4. 基于map-to-pan 策略进行序列构建
5. blast比对nt库去除污染
(包含reads比对、unmapped reads 提取、组装、contig比对基因组,CD-HIT去冗余、nt库比对等步骤)
第九天
泛基因组注释|迭代组装策略
1. 使用repeatmasker进行重复序列注释
2. 使用maker进行基因预测
3. 使用eggnong-mapper进行功能注释
第十天
核心和可变基因分析|迭代组装策略
1. 二代测序数据比对、排序和过滤
2. 使用SGSGeneLoss进行gene PAV 鉴定
3. 核心和可变基因统计
4. 核心和可变基因饱和曲线和柱状图绘制
5. 核心和可变基因基因长度、exon个数等比较
6. 核心和可变基因基因功能富集分析
第十一天
核心和可变基因家族分析|迭代组装策略
1. 使用orthofinder鉴定基因家族
2. 基于gene PAV 判断gene family PAV
3. 核心和可变基因家族统计
4. 核心和可变基因家族饱和曲线和柱状图绘制
第十二天
图形泛基因组构建及应用
售后服务
答疑
[1] Liu Y, Du H, Li P, et al. Pan-Genome of Wild and Cultivated Soybeans. Cell. 2020;182(1):162-176.e13.
[2] Cai X, Chang L, Zhang T, et al. Impacts of allopolyploidization and structural variation on intraspecific diversification in Brassica rapa. Genome Biol. 2021;22(1):166.
[3] Golicz AA, Bayer PE, Barker GC, et al. The pangenome of an agronomically important crop plant Brassica oleracea. Nat Commun. 2016;7:13390.
[4] Torkamaneh D, Lemay MA, Belzile F. The pan-genome of the cultivated soybean (PanSoy) reveals an extraordinarily conserved gene content. Plant Biotechnol J. 2021;19(9):1852-1862.
[5] Song JM, Guan Z, Hu J, et al. Eight high-quality genomes reveal pan-genome architecture and ecotype differentiation of Brassica napus. Nat Plants. 2020;6(1):34-45.
[6] Bayer PE, Golicz AA, Scheben A, Batley J, Edwards D. Plant pan-genomes are the new reference. Nat Plants. 2020;6(8):914-920.
[7]Li W, Liu J, Zhang H, et al. Plant pan-genomics: recent advances, new challenges, and roads ahead. J Genet Genomics. 2022;49(9):833-846.
讲师介绍
十年以上经验生物信息工程师授课
基因课介绍
成立于 2017年7月,专注于生物信息学培训。
基因课网校:已完成30余门视频课程的开发,累计学员 20000 余人。
主讲老师 王莹
曾任华大基因、贝纳基因高级生物信息工程师。
擅长基因组拼接、比较基因组和进化分析。
发表文章:甲藻基因组(Science)、穿心莲基因组(The Plant Journal)、野生大豆基因组(Nature Communications)、菊花基因组(Molecular Plant)、鹰嘴豆基因组计划(Nature Biotechnology)、 芝麻基因组计划(Genome Biology)、猕猴桃群体研究(New Phytologist)。
基因组套餐
学习基因组系列课程
¥7900
4门相关课程
以下4门课程:
1.《22天生物信息入门》
23天大课,¥899
2.《基因组与比较基因组专题》18天大课,¥4800
3.《泛基因组分析》
12天大课,¥4400
4.《转座子分析》
5天大课,¥2400
赠送:
全套分析流程、教材
服务器账号供练习
超级会员
可学习基因课线上线下全部课程
¥10900.00
每年
基因课课程全部开放
会员专享免预约腾讯会议答疑
包含:
《基因组与比较基因组专题课程》
《重测序与群体遗传专题课程》
《转录组与表达挖掘专题课程》
《ChIP-Seq数据分析专题课程》
《单细胞转录组分析专题课程》
《生物信息平台搭建专题课程》
《R语言与出版级绘图专题课程》
《叶绿体、线粒体专题课程》
《细菌真菌基因组专题培训班》
《长非编码RNA与表达调控专题》
《 蛋白质组学专题培训》
《代谢组与脂质组学》
《甲基化测序数据分析》
《生物信息入门之 Linux》
《生物信息入门之 R》
《生物信息入门之 Python》等
赠送:
全套分析流程、教材
服务器账号供练习
常见问题
1. 如何咨询?
2. 在哪里学习?
PC 端:www.genek.cn 点视频课;
微信端:"基因课" 公众号-视频课-学习地址-移动端;
课程有效期内可以不限次回放。
3. 我是零基础,能学会吗?
1. 本次课程为基因组进阶课程,需要掌握基因组组装及注释分析相关知识,如果没有相关基础建议先学习《基因组与比较基因组》课程;
2. 相比线下培训,线上培训给了学员充足的时间练习,配合答疑,完全可以掌握。
4. 没时间参加直播怎么办?
1. 当天直播结束后10分钟左右,回放会自动生成。
2. 课程期间每天课前或课后都会安排腾讯会议答疑;课程结束后,每周一到周四都会安排腾讯会议答疑。
3. 视频回放结合持续的答疑,可以实现和看直播相当的效果。
5. 电脑配置有什么要求?
平时使用比较流畅就可以,没有特别要求。我们会为大家提供高性能服务器练习使用,大多数据分析都是在服务器完成,个人电脑通过远程访问方式登录服务器。
6. 如何报名?
推荐直接线上购买,如需对公转账,请联系我们。
--------------------------------------
银行对公转账
户名:武汉简并科技有限公司
开户银行:汉口银行股份有限公司光谷分行
账 号:005041000451905
开户行行号:313521000982
转账备注“单位-姓名”。
7. 关于合同、发票、培训通知