推荐语:上次推荐的 stackgbm 包是用来解决模型叠加问题的,单一模型总有预测性能的天花板,多模型整合后则可实现更好的预测效果,毕竟只有小孩子才做选择。这是肖楠版主在一次研讨会上对这个包相关案例的介绍,非常有启发性,3小时7分30秒开始。
推荐人:于淼
链接:http://dwz.date/dMpv

推荐语:可视化发展还是很快的,有时候还没搞明白一种方法这个方法就被更好的替代了。在降维可视化上,t-SNE还没等普及到教科书里,同样基于流形分析的UMAP就跑出来宣告全面压制了。作为用户,UMAP最直观感受就是比t-SNE速度快了很多。
推荐人:于淼
链接:https://towardsdatascience.com/how-exactly-umap-works-13e3040e1668

推荐语:斯坦福大学 Stats366/Bios221 的配套在线电子书,主要内容是基于R语言的现代生物统计方法,案例很丰富,讲解深入浅出,适合生物统计入门。
推荐人:于淼
链接:https://www.huber.embl.de/msmb/

推荐语:医疗诊断算法由于传统习惯考虑了种族,结果会导致黑人得到肾移植的机会低于白人,这种算法习惯会放大歧视问题且很难被察觉,《连线》也对此进行了报道,机器学习算法设计时预测变量选择不能单纯照搬经验,要更多考虑背景原理来选择更底层的独立变量。
推荐人:于淼
链接:https://link.springer.com/article/10.1007/s11606-020-06280-5

推荐语:今年是 Github Actions 大规模取代 Travis 的一年,这篇文章给出了容器技术在 R 包调试上的作用,如果你还没着手学习持续集成技术,现在应该是个好时机。
推荐人:于淼
链接:https://kbroman.org/blog/2020/12/03/debugging-with-docker-and-r-devel/

推荐语:统计月读2019年第一期我们推荐了 Radix 包,目前已经改名为 distill,如果说 rticles 包是对当前期刊的一种妥协,输出仍然是 tex 文档,那么新版 distill 包可以看做是完全基于网页输出的学术期刊的技术基础,直出静态网页且支持文献引用,非常适合学术人员快速分享自己的一页纸式的研究成果。
推荐人:于淼
链接:https://blog.rstudio.com/2020/12/07/distill/

推荐语:flowingdata 选出的年度可视化项目,疫情可以说占了大部分主题。
推荐人:于淼
链接:https://flowingdata.com/2020/12/23/best-data-visualization-projects-of-2020/

推荐语:Gelman 总结的过去50年中最重要的统计思想,包括 counterfactual causal inference, bootstrapping and simulation-based inference, overparameterized models and regularization, multilevel models, generic computation algorithms, adaptive decision analysis, robust inference, and exploratory data analysis.
推荐人:于淼
链接:https://arxiv.org/abs/2012.00174

推荐语:PLS-DA 可以说是最简单的机器学习模型了,但如何用好用对也是需要了解原理的,这篇名为“So you think you can PLS-DA?” 用真实数据研究了该方法与 PCA 的比对并解释了优缺点,适合实验学科人员阅读。
推荐人:于淼
链接:https://www.biorxiv.org/content/10.1101/207225v3

推荐语:这是一本向 R 用户介绍 javascript 的电子书,适合 R 用户特别是 shiny 用户阅读。
推荐人:于淼
链接:https://book.javascript-for-r.com/

请回复统计之都 Github 主站相关 issue[1] 进行文章推荐与招聘投稿,内容须与统计/数据科学相关,是否采纳取决于编辑部意见。
文章推荐包括学术论文、博客、书籍、教程或软件等的推荐,如果是英文文章在月报发布后自动作为翻译备选文章。
招聘主要面向学术界与工业界的招聘信息发布且岗位要与统计/数据科学相关。

注:统计月报每月月初发表,月底前三天截稿转入编辑阶段,当月投稿不满十篇则合并入下月(或下下月直到够数)发表。

参考文献

[1] https://cosx.org/2021/01/monthly/
往期回顾
CapStat
稿
继续阅读
阅读原文