MLNLP
(
机器学习算法与自然语言处理
)社区是国内外最大的自然语言处理社区之一,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。

社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步。
来源 | 量子位
arXiv几乎是每个科研人员都必须用到的网站,但是它已经快31岁了。

1991年诞生的arXiv,网站排版显得与这个时代有些格格不入了。
尤其是在移动网络普及的今天,科研文献一般使用两列排版,手机上不放大根本没法看PDF。
虽说也有arXiv-vanity这样的网页,但是你看到下面排版不会血压飙升吗?
为了让你能够更高效地搞科研,最近一位程序员开发了一个ar5iv网站,将arXiv中的X换成了5,即HTML5版arXiv。
它能够以现代HTML5格式显示论文。我们先来看一下显示效果:
LaTeX公式显示准确无误。
我们再来看看手机版效果如何:
即使在狭窄的手机页面上,浏览体验仍然保持不错,还能调用手机自带翻译词典。你以后还敢说自己没时间看文献了吗?(doge)
据Deyan Ginev这位开发者介绍,目前ar5iv已经收录了175万篇论文,约占arXiv总数的97%。
01
ar5iv特点
ar5iv的使用非常简单,只要将网址中的arXiv中的X换成5再回车,页面就能自动跳转。
一般只需稍候一两秒,网页版论文就闪现在眼前:
像开头那个arXiv-vanity排版混乱的问题,ar5iv上根本不存在:
调节浏览器宽度时,公式排版依旧不乱:
而且ar5iv还支持右键复制公式的LaTeX代码
相比简陋的arXiv-vanity,ar5iv具有以下特点:
  • 对大屏显示进行优化,尤其适合Firefox;

  • 支持移动端浏览器;

  • 文本对齐,带有连字符;

  • 支持浅色/深色模式切换;

    ……

开发ar5iv的Deyan Geniv认为,公众需要一个方便使用的网页TeX/LaTeX排版。
目前在埃朗根-纽伦堡大学读博士的他,正在研究的LaTeXML,就是一种将LaTeX转换成XML、HTML的工具。
其实早在十几年前就有人研究将arXiv转换成LaTeX,随着NLP技术的发展,这种转换的正确率也得到了明显提升。
作为开源项目LaTeXML的贡献者之一,Geniv便开发了ar5iv。
02
网友开发一键转换插件
这波操作看下来,研友们着实被秀到了,在Twitter上和作者展开热烈讨论,纷纷建言献策。
其中还有人更进一步,想着能不能出一个浏览器插件,简化使用ar5iv的步骤。
老哥有没有考虑出一个插件一键切换格式,不用手动改字母?
没想到还真有热心的网友做了一个。
只需在GitHub中下载一个插件库(链接在文末),或者直接去Chrome应用商店下载withAr5iv
这样下次再打开论文时,就可以一键转换格式,再点一下还可以转换回原格式:
不过也有网友注意到ar5iv目前的一些缺点。
反映比较多的一个问题就是,对于有多个修订版的论文,ar5iv只支持显示论文v1版:
转换论文时只会显示v1版本,但是在arXiv上点“PDF”时显示的是最新版。
作者把这些意见都收录了起来,表示将来希望和arXiv合作一把,一起解决最新版的问题。
浏览器插件:

https://github.com/yobibyte/ar5iv_chrome_ext
参考链接:

[1]https://ar5iv.org/

[2]https://twitter.com/dginev/status/1488157927001268231

[3]https://kwarc.info/people/dginev/
技术交流群邀请函
△长按添加小助手
扫描二维码添加小助手微信
请备注:姓名-学校/公司-研究方向
(如:小张-哈工大-对话系统)
即可申请加入自然语言处理/Pytorch等技术交流群

关于我们

MLNLP(机器学习算法与自然语言处理) 社区是由国内外自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外最大的自然语言处理社区之一,旗下包括万人顶会交流群、AI臻选汇、AI英才汇以及AI学术汇等知名品牌,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。
社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。
继续阅读
阅读原文