推荐语:Daily R (https://dailyr.netlify.app/) 是一个很棒的基于 blogdown 包搭建的关于 R 的聚合博客,每天定时自动更新,每篇文章都会显示标题和摘要,点击标题后它会自动重定向到文章原始来源地址。认真研究该聚合博客的源码(https://github.com/yufree/daily/),有助于学习 blogdown 搭建博客、GitHub Action 定时任务、字符串批量清洗加工等技能。同时,为了使该聚合博客汇聚更多高质量的文章,欢迎各位博主增加您的博客地址。

推荐人:楚新元
链接:https://dailyr.netlify.app/,https://github.com/yufree/daily/

推荐语:一年一度的 kaggle 数据科学家调查活动又来了。目前数据已经完成收集工作,分析数据的任务当前正在作为 kaggle 竞赛开放,感兴趣的数据科学家可以来看看今年的数据,说不定还能拿到大奖呢。
推荐人:孔令仁
链接:https://www.kaggle.com/c/kaggle-survey-2021/overview

推荐语:Chirag Patel, 一位哈佛大学医学院的副教授,在开设生物医药的数据科学时遇到了种种问题,例如学生们使用的是什么版本的R、如果他们的电脑不允许他们安装必要的软件包怎么办等等。而他发现,用 RStudio Cloud 是一个好方法。RStudio Cloud 能帮助学生高效入门,并帮助进行可重复分析来支持医药决策。
推荐人:操懿
链接:
https://blog.rstudio.com/2021/10/06/teaching-data-science-with-rstudio-cloud/

推荐语:如果你是一个忠实的 R 粉丝,但也十分想像 Harry Potter 一样成为Parselmouth (说蛇语的人)随时随地使用 Python,那么 R 中的 reticulate 包将帮助你直接在 RStudio 里使用 Python 控制台。不仅如此,使用者还可以将 Python 对象和 R 对象自由转换,在 RStudio 环境框中直接看到 Python 对应的换镜框,甚至还能直接使用 R 的语法完成 Python 的功能!
推荐人:任怡萌
链接:https://awong234.github.io/reticulate_pres/

推荐语:最优传输是统计学、机器学习、深度学习、图形学等领域中的热门话题。尽管在应用层面取得了较大成功,其背后的理论解释仍有待完善,如何快速精确实现最优运输问题求解也是当下研究的热点、难点。近日,顾险峰团队推出了“最优传输理论与计算”系列网上教程以及实体书籍,旨在系统地讲解最优传输的数学原理以及高效算法实现。系列教程涉及概率论、黎曼几何、偏微分方程、优化等内容。
推荐人:梁杰昊
链接:
https://mp.weixin.qq.com/s/5BOdLE3o_LswALDbxn6vcg

推荐语:这是一个使用 reticulate 包的有趣示例,利用 R 和 Python 的联动,从而实现把一个图片转化为其对应样子的数据集,例如下图就是一个对猩猩图片的处理结果。
推荐人:王祎帆
链接:
https://ivelasq.rbind.io/blog/reticulate-data-recreation/

推荐语:一个利用 sapply 和 expand.grid 等方式来遍历所有可能参数组合的小技巧,配合并行运算和服务器,可以快速完成科研任务。
推荐人:王祎帆
链接:
https://www.seascapemodels.org/rstats/2021/10/01/lapply-karate.html

推荐语:作者提供了一个可以用 R 获得不同领域的空间数据的平台,用户可以在其中找到相应的 R 包来获取数据,并且项目提供了简单的 Tutorials 帮助用户快速熟悉对应的 R 包。
推荐人:赵昊蛟
链接:
https://ropensci.org/blog/2021/09/28/rspatialdata/

推荐语:Kaggle 打得好,模型一到生产环境就傻眼,说明是时候还 ML 的技术债了。如何使训练和生产部署的链路和数据 gap 完全打通,Google Cloud 团队开始关注Continuous Training(CT),并借鉴 CI&CD 的思路提出了一种 CT 的 pipeline,见下图。现有的 CT 工具推荐 K8S 的 Jenkins X 和 iterative.ai 的 CML 和 DVC,链接是NIPS 2014 workshop 的一篇论文《Machine Learning: The High Interest Credit Card of Technical Debt》。
推荐人: 苏锦华
链接:https://research.google/pubs/pub43146/

推荐语:近期热剧《鱿鱼游戏》中,玻璃桥是淘汰率极高的一关。选手每一步都必须在两块外观相同的普通玻璃和钢化玻璃中做出选择,踩到普通玻璃就会掉下去;一旦前面的选手踩到普通玻璃掉下去,那块玻璃就会换成钢化玻璃。如何高效地预测幸存者数量呢?蒙特卡洛模拟可以派上用场。
推荐人:向悦
链接:https://www.jhelvy.com/posts/2021-10-19-monte-carlo-bridge-game/

推荐语:疫情还是没有停止,加强针各位都安排上了吗?要客观了解加强针是否真的有效,以及以前打的两针疫苗作用有多大,可以看看链接这篇文章,其主要结论是:未接种疫苗的人接种疫苗比已接种疫苗的人接种加强疫苗更有效。
推荐人:任焱
链接:
https://blog.ephorie.de/covid-19-the-incredible-shrinking-boost-of-the-booster-shot

请回复统计之都 Github 主站相关 issue[1] 进行文章推荐与招聘投稿,内容须与统计/数据科学相关,是否采纳取决于编辑部意见。
文章推荐包括学术论文、博客、书籍、教程或软件等的推荐,如果是英文文章在月报发布后自动作为翻译备选文章。
招聘主要面向学术界与工业界的招聘信息发布且岗位要与统计/数据科学相关。

注:统计月报每月月初发表,月底前三天截稿转入编辑阶段,当月投稿不满十篇则合并入下月(或下下月直到够数)发表。

参考文献

[1]https://github.com/cosname/cosx.org/issues/972
2021年往期回顾
统计之都:专业、人本、正直的中国统计学社区。
关注方式:扫描下图二维码。或查找公众号,搜索 统计之都 或 CapStat 即可。
往期推送:进入统计之都会话窗口,点击右上角小人图标,查看历史消息即可。
点击阅读原文,进行投稿
继续阅读
阅读原文