随着高通量生物技术的发展,已经开发了多种组学技术来表征不同但互补的生物信息,包括基因组学、表观基因组学、转录组学、蛋白组学和代谢组学
最近的人工智能技术已经从“浅层”学习架构发展到“深度”学习架构。作为人工智能的一个重要分支,机器学习(ML)可以自动学习捕捉复杂的模式,并根据数据做出智能决策。ML在癌症研究和临床肿瘤学中有着非常广泛的应用。特别是,在多组学数据快速增长的推动下,属于ML子领域的基于深度学习(DL)的方法已成为生物医学数据分析的强大工具
下面是近两年人工智能与组学在顶刊发表的部分研究方向
Science Adcances   机器学习代谢组学在胰腺癌的研究
Seminars in Cancer Biology  机器学习多组学在癌症诊断的研究
Nature Protocols    机器学习代谢组学在药物代谢与疾病病理的研究
 2022国自然基金机器学习代谢组学在糖尿病视网膜病变的研究
Cell Systems   机器学习蛋白质组学在生物标志物发现的研究
Nature Medicine  机器学习蛋白质组学在酒精相关肝病的研究
Cancer Cell  深度学习对泛癌基因组学进行整合分析
 Science Adcances  基因组图谱基于深度学习预测癌症依赖性
人工智能与组学的研究到底有多热,以及为何要举办培训,下面的内容给出了答案
近两年国内外顶尖课题组MIT、Harvard University、UPenn、清华大学、复旦大学、西湖大学等都在从事人工智能与组学的研究,这一研究成果更是多次发表在Nature Reviews Genetics、Nature Methods、Science Advances、Cancer Cell、Nature Biotechnology等知名国际顶刊上,为我们发表顶刊鉴定了基础
 由于该项研究资料和学习平台较少,信息技术不公开,培训学习迫在眉睫,特此诚挚邀请您参加“人工智能与蛋白组学”线上培训课,参会会员已达2000余名!发顶刊!快上车!
授课专家
机器学习蛋白组学主讲老师来自国内高校李老师授课,有十余年的蛋白质组数据分析经验。研究领域涉及机器学习,芯片数据分析,蛋白质组数据分析,DNA,RNA,甲基化测序数据分析,单细胞测序数据分析,miRNA及靶基因分析等,发表SCI论文30余篇,其中一作及并列一作15篇。
课程一:机器学习蛋白组学课表内容
第一天
机器学习及蛋白组学简介
 1.机器学习基本概念介绍
 2.常用机器学习模型介绍
 3.混淆矩阵
 4.ROC曲线
 5.主成分分析(PCA)
 6.蛋白组学基本概念
R语言简介及实操
 1.R语言概述
 2.R软件及R包安装
 3.R语言语法及数据类型
 4.条件语句
 5.循环
 6.函数
 7.常用的机器学习相关R包介绍
第二天
机器学习在蛋白组学数据分析中的应用案例分享
1.利用机器学习鉴定疾病相关蛋白标志物
 2.利用机器学习基于蛋白组学数据预测表型
 3.利用机器学习基于蛋白组学数据进行分类
 4.利用机器学习基于蛋白组学数据构建预后模型
蛋白组学相关数据库介绍
 1.Uniport
 2.HPA
 3.TCPA
 4.CPTAC
第三天:零代码工具利用机器学习分析蛋白组学数据
利用PLOS Computational Biology(IF:5分)发表零代码工具,轻松完成差异表达分析,常见统计分析,常见可视化,内置7种机器学习方法,轻松调用。
 1.数据导入(两套数据,二分类,多分类)
 2.数据可视化(散点图,热图,柱形图,相关性热图,火山图,层次聚类图)
 3.缺失值填充
 4.数据归一化
 5.离群值检测/清理
 6.常见统计方法应用(t-test, limma, Kruskal-Wallis ,ANOVA, PCA, k-means, 相关性分析)
7.机器学习方法应用(RF, lasso, SVM等)
第四天
利用机器学习基于蛋白组学数据预测表型,基于蛋白组学数据复现cell中机器学习分析结果
实操内容
1.蛋白组学数据处理,差异表达分析
 2.火山图,多分组热图,多组箱型图展示差异表达分析结果
 3.构建Random Forest模型
4.重要蛋白筛选
 5.绘制ROC曲线
6.独立测试集检测模型表现
利用机器学习鉴定疾病相关蛋白标志物,基于Olink数据,复现影响因子17分文章中,蛋白数据常规分析+时序蛋白聚类分析+机器学习分析结果
实操内容
1.读取蛋白表达数据
2.差异蛋白挑选,火山图绘制,箱型图绘制
 3.时序蛋白表达数据聚类分析
4.构建随机森林模型
5.挑选重要特征
 6.独立测试集进行验证
第五天
利用机器学习基于质谱的蛋白质组学数据,构建肝病相关分类和预后模型,复现Nature Medicine文章中的机器学习,生存分析,预后模型相关的结果。
实操内容
 1.鉴定与不同肝病显著相关的蛋白
 2.比较22种不同的机器学习分类器,挑选最优算法构建不同肝病的分类模型
3.独立队列验证模型准确性
4.构建预后模型
 5.绘制生存曲线和时间依赖的ROC曲线
报名咨询联系方式
报名咨询方式(请二维码扫描下方微信)
                                      引用往期参会学员的一句话: 
发现真的是脚踏实地的同时  需要偶尔仰望星空
非常感谢各位对我们培训的认可!  祝愿各位心想事成
继续阅读
阅读原文