专题六:机器学习代谢组学
简介

机器学习代谢组学:是将机器学习技术应用于代谢组学领域的研究。 
代谢组学是研究生物体内代谢产物(代谢物)的整体组合及其在生物体内的变化过程,旨在揭示生物体的生理状态、代谢通路和疾病机制等方面的信息,对于生命科学、药学研发和临床诊断等领域具有重要意义 
机器学习代谢组学的目标:
熟悉代谢组学和机器学习相关硬件和软件;熟悉代谢组学从样本处理到数据分析的全流程;能复现至少1篇CNS或子刊级别的代谢组学文章图片。
代谢物分类和识别:通过机器学习算法,将复杂的代谢物组合归类并识别,从而了解代谢物的特征和功能。

生物标志物的发现:通过分析代谢组学数据,找到与特定生理状态、疾病或治疗反应相关的生物标志物,以提供疾病的早期诊断和个体化治疗的依据。
代谢通路分析:通过机器学习算法,分析代谢组学数据中的代谢通路,揭示不同代谢通路在生理和病理过程中的重要性,为疾病机制的理解提供线索。
代谢网络建模:通过机器学习算法,构建代谢网络模型,模拟和预测代谢物之间的相互作用和调控关系,从而深入理解生物体内代谢的复杂性。
机器学习代谢组学的研究内容涉及多个学科领域,包括生物信息学、统计学、模式识别和计算机科学等,它为代谢组学研究提供了新的方法和工具,有助于加深对生物体代谢系统的理解,并为个体化医学和疾病治疗提供新的思路和策略
近年来发过哪些顶刊以及方向:
communications biology  代谢组学和机器学习技术揭示了发芽增强了色素大米的多种营养特性
scientific reports  使用机器学习从基于生物流体的代谢组学预测人体健康
nature communications 空间代谢组学揭示糖原是肺纤维化的可操作靶标
nature protocols 系统生物代谢组学数据的认知分析
nature reviews molecular cell biology 使用活性代谢组学鉴定生物活性代谢物
nature reviews drug discovery代谢组学在药物发现和精准医学中的新兴应用
目前机器学习代谢组学受众群体众多,例如肿瘤生物学 ,移植免疫,细胞培养工艺优化,肠道菌群与消化系统疾病,肿瘤免疫,入侵植物,抗癌药物,内分泌,病害防控,神经系统疾病诊断,动物遗传育种,等众多科研人员
讲师介绍
机器学习代谢组学主讲老师来自985高校神经科学博士,主要利用代谢组学、转录组学和分子生物学等技术研究神经内科慢性病的发病机制和生物标志物。擅长高效液相色谱-质谱联用(LC-MS)技术进行非靶向和靶向代谢组学从样本制备到数据分析的全流程研究,以及多组学大数据的生物信息学整合分析。5年内在J Clin Invest, EBioMedicine, Cell Death Dis, Cell Death Discov, Nanotoxicology等杂志发表SCI论文10篇。
课表内容
第一天
A1 代谢物及代谢组学的发展与应用
(1) 代谢生理功能;
(2) 代谢疾病;
(3) 非靶向与靶向代谢组学;
(4) 空间代谢组学与质谱成像(MSI);
(5) 代谢流与机制研究;
(6) 代谢组学与药物和生物标志物。
A2 代谢组学实验流程简介
A3 色谱、质谱硬件原理
(1) 色谱分析原理;
(2) 色谱的气相、液相和固相;
(3) 色谱仪和色谱柱的选择;
(4) 质谱分析原理及动画演示;
(5) 正、负离子电离模式;
(6) 色谱质谱联用技术;
(7) LC-MS 的液相系统
A4 代谢通路及代谢数据库
(1) 几种经典代谢通路简介;
(2) 能量代谢通路;
3) 三大常见代谢物库:HMDBMETLIN  KEGG;
4) 代谢组学原始数据库:Metabolomics Workbench Metabolights.
第二天
B1 代谢物样本处理与抽提
(1)组织、血液和体液样本的提取流程与注意事项;
(2)用 ACN 抽提代谢物的流程与注意事项;
(3)样本及代谢物的运输与保存问题;
B2 LC-MS数据质控与搜库
(1)LC-MS 实验过程中 QC 样本的设置方法;
(2)LC-MS 上机过程的数据质控监测和分析;
(3)XCMS 软件数据转换与提峰;
B3 R软件基础
(1)R 和 Rstudio 的安装;
(2)Rstudio 的界面配置;
(3)R 的基本数据结构和语法;
(4)下载与加载包;
(5)函数调用和 debug;
B4 ggplot2
1)安装并使用 ggplot2
(2)ggplot2 的画图哲学;
(3)ggplot2 的配色系统;
(4)ggplot2 画组合图和火山图;
第三天
机器学习
C1无监督式机器学习在代谢组学数据处理中的应用
(1)大数据处理中的降维;
(2)PCA 分析作图;
3)三种常见的聚类分析:K-means、层次分析与 SOM
(4)热图和 hcluster 图的 R 语言实现;
C2一组代谢组学数据的降维与聚类分析的 R 演练
(1)数据解析;
(2)演练与操作;
C3有监督式机器学习在代谢组学数据处理中的应用
(1)数据用 PCA 降维处理后仍然无法找到差异怎么办?
(2)PLS-DA 找出最可能影响差异的代谢物;
(3)VIP score 和 coef 的意义及选择;
(4)分类算法:支持向量机,随机森林
C4一组代谢组学数据的分类算法实现的 R 演练
(1)数据解读;
(2)演练与操作;
第四天
D1 代谢组学数据清洗与 R 语言进阶
(1)代谢组学中的 t、fold-change 和响应值;
(2)数据清洗流程;
3语言 tidyverse
(4)R 语言正则表达式;
(5)代谢组学数据过滤;
(6)代谢组学数据 Scaling 原理与 R 实现;
(7)代谢组学数据的 Normalization;
(8)代谢组学数据清洗演练;
D2在线代谢组分析网页 Metaboanalyst 操作
(1)用 R 将数据清洗成网页需要的格式;
(2)独立组、配对组和多组的数据格式问题;
(3)Metaboanalyst 的 pipeline 和注意事项;
(4)Metaboanalyst 的结果查看和导出;
(5)Metaboanalyst 的数据编辑;
(6)全流程演练与操作
第五天
E1机器学习与代谢组学顶刊解读(2-3 篇);
(1)Nature Communication 一篇代谢组学小鼠脑组织样本 database 类型的文献;
(2)Cell 一篇代谢组学患者血液样本的机器学习与疾病判断的文献;
(3)1-2 篇代谢组学与转录组学和蛋白组学结合的文献。
E2 文献数据分析部分复现(篇)
(1)文献深度解读;
(2)实操:从原始数据下载到图片复现;
(3) 学员实操。                                                            
案例图片:

培训特色及福利
学员好评截图
课程特色

1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿
2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握
3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答
福利及授课方式:
福利:报名缴费成功赠送报名班型全套预习视频,课后学习完毕提供全程录像视频回放,针对与培训课程内容进行长期答疑,微信解疑群永不解散,参加本次课程的学员可免费再参加一次本单位后期组织的相同的专题培训班(任意一期都可以)
        授课方式:通过腾讯会议线上直播,理论+实操的授课模式,老师手把手带着操作,从零基础开始讲解,电子PPT和教程开课前一周提前发送给学员,所有培训使用软件都会发送给学员,有什么疑问采取开麦共享屏幕和微信群解疑,学员和老师交流、学员与学员交流,培训完毕后老师长期解疑,培训群不解散,往期培训学员对于培训质量和授课方式一致评价极高!
欢迎关注了解
继续阅读
阅读原文