推荐语:可以称得上划时代的几何学教学技术,通过网页实现交互式高亮,随着阅读流程一同标记文本和对于绘图的内容,把几何原本做成了一本网页上可以动态看的教科书。另外提醒一下,网页配色有黑白两种模式,切换在右上角。
推荐人:孔令仁
链接:https://elements.canberead.com/

推荐语:Bin Yu 老师在ICM 2022上的最新报告 Interpreting Deep Neural Networks towards Trustworthiness,从可信赖的角度解释深度神经网络。
推荐人:梁杰昊
链接:https://www.youtube.com/watch?v=hyanrQZfuxM

推荐语:基于 magick 包和脸部识别算法批量制作个人头像。
推荐人:黄湘云
链接:https://www.garrickadenbuie.com/blog/process-profile-picture-magick/

荐语:这篇论文将迁移学习(机器学习的一个分支)应用于高维线性回归模型。除了目标模型的样本之外,它还使用了来自其他相关的回归模型的辅助样本,以提高估计和预测的最优收敛率。 显然,如何寻找合适的、能给目标模型提供有用信息的辅助样本是一个需要考虑的问题。如果已知哪些辅助样本是有用的,就相应的提出一个estimator和一个predictor,并建立它们的最优性。如果不知道哪些辅助样本是有用的,可以应用作者提出的一个数据驱动的迁移学习过程(名为Trans-Lasso)来找到它们。作者还将Trans-Lasso方法应用于有关基因表达之间关联的数据集。结果表明,Trans-Lasso通过合并来自多个不同组织的数据作为辅助样本,提高了目标组织中基因表达预测的性能。
推荐人:朱书慧
链接/论文信息:Li, S., Cai, T. T., & Li, H. (2022). Transfer learning for high-dimensional linear regression: Prediction, estimation and minimax optimality. Journal of the Royal Statistical Society Series B, Statistical Methodology, 84(1), 149–173. https://doi.org/10.1111/rssb.12479

推荐语:介绍了如何利用 R Markdown 写学术论文、利用 Zotero 进行文献管理以及利用 Notion 做笔记。其中 Zotero 可以与 R Studio 直接集成,Notion 也可以和 Zotero 集成,从而更加便捷地进行论文写作。
推荐人:王祎帆
链接:https://www.ds-econ.com/write-your-whole-paper-in-r-it-is-better/

推荐语:面对晦涩难懂的学术著作,如何较快地确定这个文章的主题是不是符合自己所需求,通过文本分析关键词和主题挖掘可以较快地粗略地了解其内容。这个案例中对希罗多德的希波战争的著作《Histories》做了一些分析。
推荐人:赵昊蛟
链接:https://boiled-data.github.io/Histories.html

推荐语:在大学中建立一个R社区,特别是在covid-19的影响下,这件事会显得更有意义。文章通过采访的形式介绍了这个R社区,还提供了相关R项目的github链接。
推荐人:操懿
链接:https://www.r-consortium.org/blog/2022/07/19/growing-an-r-community-at-a-state-university

推荐语:R 可以把地形图画得如此精细,甚至还可以绘制出阴影效应。
推荐人:任焱
链接:https://dominicroye.github.io/en/2022/hillshade-effects/

推荐语:这篇文章比较详细的讨论了 R 中的编码问题(即使用了 R 很久也未必清楚),正确使用正则表达式可以提高运行效率,而 useBytes=TRUE 是一个危险的参数设定。
推荐人:任焱
链接:https://blog.r-project.org/2022/07/12/speedups-in-operations-with-regular-expressions/index.html

推荐语:一个小巧的文本分析软件 AntConc ,用于文本聚类、关键词提取、词云绘制等。之前用过一款叫 KH Coder 的软件,与 AntConc 功能相似,同样小巧实用。
推荐人:宋文轩
链接:
  • https://www.laurenceanthony.net/software/antconc/ (AntConc)
  • https://khcoder.net/en/ (KH Coder)

荐语:一步一步、一行一行地介绍 ggplot2 绘图的过程,对新手应该十分友好,是快速入门 ggplot2 绘图的好文章。
推荐人:黄湘云
链接:https://www.miriamheiss.com/posts/graphing-with-ggplot/

推荐语:一个生成模型的 tutorial,主要围绕Bayesian inference和Langevin dynamics等非参方法进行讨论,同时从optimal transport (Wasserstein) 角度出发讨论了这些生成模型的一阶优化方法。
推荐人:聂宇舟
链接:https://akorba.github.io/resources/Baltimore_July2022_ICMLtutorial.pdf

推荐语:近年来机器学习的各大顶会上,图神经网络(GNN)的相关文章数量暴涨;在工业界的搜索、推荐、反欺诈等场景,GNN也取得了不错的效果。相较于学术界所关注的模型结构,工业界更看重模型的可扩展性等,本文对GNN在工业界的具体应用做了系统总结。
推荐人:向悦
链接:https://zhuanlan.zhihu.com/p/423342532

参考文献
[1]https://github.com/cosname/cosx.org/issues/1049
2022年往期回顾
统计之都:专业、人本、正直的中国统计学社区。
关注方式:扫描下图二维码。或查找公众号,搜索 统计之都 或 CapStat 即可。
往期推送:进入统计之都会话窗口,点击右上角小人图标,查看历史消息即可。
点击阅读原文,进行投稿
继续阅读
阅读原文