推荐语:前两周刚用 blogdown 新建了自己的博客,本月则推荐一篇与此相关的内容——blogdown 相关的更新。这篇文章的目的是强调一些作者用来重建 他的网站 的步骤,并试图恢复网站中的图形渲染。这篇文章能帮助建立个人博客的“小白”更好地理解如何建立一个个人网站。
推荐人:任怡萌
链接:
https://solomonkurz.netlify.app/post/2021-05-03-blogdown-updates-prompted-a-website-overhaul-these-are-my-notes/


推荐语:文章给出了用 R 绘制足球运动员的属性百分比图(Percentile Radars/Pizza's),现在你也可以看看自己喜欢的球员是不是“六边形战士”了。当然也不仅限于球员,可以拓展到学生成绩可视化、国家地位可视化等等。
推荐人:王祎帆
链接:
https://www.gettingbluefingers.com/tutorials/RadarPizzaChart


推荐语:R 的4.1.0版本在5月18日发布,这一版本涵盖了许多有意思的变化,而这篇文章正是介绍了这些有意思的变化。首先,4.1.x 系列将会是最后支持32位的 R 系列。其次,R 的4.1.x系列引入了一些新语法,而这些新语法不能在之前的版本运行,这就要求开发者在使用新引入的语法时非常谨慎。除此之外,在 magrittr 包、匿名函数、合并因子、分割数据框等方面,新的 R 版本也有一定的变化。
推荐人:操懿
链接:
https://www.jumpingrivers.com/blog/new-features-r410-pipe-anonymous-functions/


推荐语:列举了新手会犯的一些小错误,例如
1. 对 c() 的用法;
2. 不加空格(亲测新手常犯,会让人读起来很难受,尤其是判作业的助教(T▽T));
3. 对向量操作中的每个元素用for循环(需要注意的是 for 循环并不是不好的,对于复杂的操作,用 for 循环会更清晰);
4. 强行用 lapply 等操作代替 for 循环;
5. 在熟悉 R 基础操作前就使用 tidyverse;
6. 不看 vignettes(包的详细文档);
7. 不使用 debug 等等。
推荐人:王祎帆
链接:
https://davidhughjones.medium.com/rookie-r-mistakes-ea00a0ef4d9


推荐语:VAE 作为经典的生成模型,经常和 GAN 进行比较,CVAE 常用于控制生成风格,VAE 和 CVAE 学了后还是不懂?就这代码学习更佳,这个仓库是一个在 MNIST 手写字体图片数据集上实现的极简 VAE 和 CVAE 模型代码。
推荐人:苏锦华
链接:
https://github.com/timbmg/VAE-CVAE-MNIST


推荐语:如何假模假式地用贝叶斯网络开始数据分析与评估边的稳健性。Data Analysis with Bayesian Networks: A Bootstrap Approach
推荐人:苏锦华
链接:
https://arxiv.org/pdf/1301.6695.pdf


推荐语:如果你和我一样,“画图五分钟,调色一小时”,那么你一定喜欢这条“五彩缤纷”的推特。打开它,解锁经典 rainbow 调色板以外的新世界。
推荐人:向悦
链接:
https://twitter.com/moriah_taylor58/status/1395431000977649665?s=20


推荐语:torchaudio 包提供了'pytorch”和'torchaudio'的 R 端接口,为音频方面的深度学习提供数据集、模型和预处理设施的访问。
推荐人:李璇
链接:
https://cran.r-project.org/web/packages/torchaudio/index.html


推荐语:用随机森林训练完模型我们通常都会绘制 importance plot 来尝试解释模型,要小心这可能是靠不住的。文章作者实验以后发现,就预测 accuracy 而言,“重要”的变量未必真的在模型解释层面上重要。
推荐人:任焱
链接:
https://eranraviv.com/random-forest-importance-measures-are-not-important/

推荐语:作者一步一步教我们使用 blogdown 时如何对模板进行简单的改造,生成悬浮体目录(floating toc),写长篇博客或者比较复杂的报告时候,这个技巧会很有用。
推荐人:任焱
链接:https://mickael.canouil.fr/post/floating-toc-in-blogdown/

请回复统计之都 Github 主站相关 issue[1] 进行文章推荐与招聘投稿,内容须与统计/数据科学相关,是否采纳取决于编辑部意见。
文章推荐包括学术论文、博客、书籍、教程或软件等的推荐,如果是英文文章在月报发布后自动作为翻译备选文章。
招聘主要面向学术界与工业界的招聘信息发布且岗位要与统计/数据科学相关。

注:统计月报每月月初发表,月底前三天截稿转入编辑阶段,当月投稿不满十篇则合并入下月(或下下月直到够数)发表。

参考文献

[1]https://github.com/cosname/cosx.org/issues/942
2021年往期回顾
CapStat
稿
继续阅读
阅读原文