什么是RSS

本文原内置于RSS Reader Prime软件中

RSS是英文Really Simple Syndication的缩写,中文翻译叫简易信息聚合

准确的说,RSS仅仅是一种协议,或者说一种规范,规定了一套信息组合的规则,同样作用的协议还有Atom,关于两种协议的细节可以查阅以下文档:

RSS2.0协议

Atom协议

二者都是以XML格式作为信息聚合的组织标准,RSS2.0协议目前已经冻结,今后不会再做修改。Atom协议是改进版的RSS,今后仍有可能进行调整。

订阅源

RSS和Atom协议提供的是数据组织的规范和标准,订阅源则是众多网站和博客将内容按照RSS或Atom等协议为用户提供的标准化内容输出接口,这些接口以URL(统一资源定位符)的形式公布在互联网上,使用HTTP协议访问,和普通的网址没有什么区别。当你使用一般的浏览器访问的时候,只能看到接口提供的XML原始数据,只有使用RSS阅读器订阅这些源,才能将其中的内容转换为多媒体网页进行浏览。

例如下面是优质的订阅源知乎每日精选的URL

1
https://www.zhihu.com/rss

时效性

和一般的网站一样,订阅源的URL会失效的,当一个订阅源突然断更,没有更新的文章提供的时候,请不要给Reader差评,因为我仅仅是一个订阅工具,我的作者并不是千千万万个订阅源维护者,他仅仅拥有Reader官方源这一个RSS订阅源的管理权限。

另外订阅源并不提供旧文章的回查功能。例如上面提到的知乎每日精选,这个源会给订阅者返回最近的60篇文章,你无法查看更早的文章。

全文订阅

再一次提到上面说的优秀源知乎每日精选,她是一个全文输出源,当你订阅她的时候,每一篇文章的全部内容她都会包装在订阅包中,这样你在Reader中可以直接全文浏览内容。

但优秀的全文订阅源并不多,更多的订阅源采取的策略是摘要输出,而将全文留在了改源网站上,所以当你订阅了一些没办法看到全文,甚至一点正文都没有的源时,请不要给Reader差评,这个和我这个订阅工具是没有关系的,我能做的仅仅是帮你直接通过内置浏览器打开原文进行阅读。

不合规矩

规矩是RSS和Atom协议定的,但也会有许多不合规矩的订阅源,这些源让我在做解析的时候会非常头疼。虽然我已经适应了很多特别订阅源的“不合规矩”,但仍不能保证能兼容全部的订阅源。

最显而易见的是时间戳格式问题,有些订阅源的时间格式不规范,会导致我无法正确解析文章发布的时间,从而无法按照时间对文章进行归类。例如有个源的时间格式中仅包含月日,没有年份信息,我都无法知道这是否是几年前的旧文章;有些源就更过分了,干脆不带时间信息,这样的源订阅到的文章,是不会出现在按照时间分类的阅读列表里,只能通过源分类查看。

万物皆可RSS

最近,《连线》杂志网站上刊出了一篇题为《是时候让 RSS 复兴了》(It’s Time for an RSS Revival)的文章。文章开篇便动员道,「Twitter 让你心累了吗?Facebook 让你厌倦了吗?是时候回归 RSS 了。」之后,作者介绍了几个主流 RSS 服务的功能,采访了它们的负责人。文章认为,RSS 最吸引人之处,就在于它能让你看到开放互联网未经过滤的样子,给你一个自己决定看什么的机会。

上面这段话摘自Platycodon的文章。论 RSS 的「复兴」

RSS是否复兴了,我并不清楚,但有趣的是一个有趣的项目诞生了——RSSHub

RSSHub – 据说这是 RSS 复兴运动的开始

RSSHub是一个轻量、易于扩展的 RSS 生成器, 可以给任何奇奇怪怪的内容生成 RSS 订阅源。作者是就职于B站的大佬DIYgod,他们的口号是万物皆可 RSS

这是他们的官网

这是他们的Github

用这个nodejs写的工具,都不需要买服务器,理论上你可以将你想要订阅的所有公网上的资源转化为RSS订阅源,并且他们已经转化好了许多许多,详情见上面的官网。