RSS 概述
RSS(Really Simple Syndication)是一种用于发布和共享网页内容的技术,广泛应用于新闻网站,博客和其他在线内容平台.
作用:
- 可以脱离抖音/小红书等平台算法推送的机制;
- 变被动获取信息, 为主动获取信息;
- 集中管理/查阅, 无需逐个访问;
- 及时获取信息, 而不是去原网站刷新;
- 无广告干扰, 不需要去原网站, 故没有广告;
我的使用场景
RSS >>> [学习/Copy + 套路(Blog/BBS/Video)] >>> 内容创作 >>> 分发/分享 >>> 流量获取
寻找RSS订阅源
- 查找网站自带RSS
RSSHub Radarcrx插件网站RSS- 网站自带的RSS按钮;
- Google搜索: "网站名 + RSS"
- 自己制作RSS
使用RSSHub
使用 RSSHub 可以轻松的订阅很多原来不支持的信息, 比如 Bilibili/Telegram...
但是由于国内网络的问题, https://rsshub.app/ 在国内不能访问, 此时自己利用 vps 搭建RSSHub; 也可以使用别人已经搭建好的共享的服务:
自己搭建步骤: 1.创建挂载目录; 2.创建yml文件; 3.启动容器; 4.NPM反代
mkdir -p /root/data/docker/freshrss && cd /root/data/docker/freshrss
vim docker-compose.yml
docker-compose up -d
yml文件内容如下:
services:
rsshub:
image: diygod/rsshub
restart: always
ports:
- "1200:1200" # 映射端口
使用自制RSS
如果有些网站/信息 RSSHub 不支持怎么办呢? 也有方法:
- 手动撰写
RSSHub路由解析目标网站(难度稍大); - 使用一些RSS生成器工具, 比如:
- https://rsseverything.com/, 免费4条;
- https://fetchrss.com/, 免费5条;
FreshRSS可以使用XPath解析目标网站
FreshRSS服务
FressRSS可以实现多终端同步RSS;
FressRss可以通过Xpath解析不支持RSS的网站;
FreshRSS搭建
步骤: 1.创建挂载目录; 2.创建yml文件; 3.启动容器; 4.NPM反代
mkdir -p /root/data/docker/freshrss && cd /root/data/docker/freshrss
vim docker-compose.yml
docker-compose up -d
yml内容如下:
services:
freshrss:
image: freshrss/freshrss:latest
container_name: freshrss
environment:
- CRON_MIN=*/20 #每20分钟刷新一次
- TZ=Asia/Shanghai
volumes:
- ./data:/var/www/FreshRSS/data
- ./extensions:/var/www/FreshRSS/extensions
ports:
- 8061:80 #左边的8080可以改成服务器上没有用过的端口
restart: always
FreshRSS配置
- 开启: 系统配置 > 认证 > 勾选"允许 API 访问"
- 设置API密码: 系统配置 > 账户 > API管理 > 设置API密码
- 点击[https://rss.douzidh.com/api/]查看
API endpoints是否可用; - 使用 Fluent Reader 调用
Google Reader API;- Endpoint: https://rss.douzidh.com/api/greader.php
- Username: wyzh97
- Password: 设置的 API 密码
FreshRSS解析教程
需要 XPath 插件, 比如: CSS and XPath checker 和 XPath Tester
- 添加源, 比如: https://www.dsb.cn/kuajing
- 订阅源类型选择"HTML + XPath(Web 抓取)"
- 定位
文章 XPath(各个Item) - 定位其他 XPath(标题/内容/URL/缩略图/作者/日期).
- 使用
./代表文章XPath - 使用
@href,@src提取属性,text()html中的文本内容 - 使用:
//div[contains(@class, 'artic_item')]所有包含artic_item类的元素- 其他使用问 ChatGPT
- 设置日期格式(可选):
Y-m-d- 抓取全文(可选): 订阅源设置 >
Content retrieval>原文的CSS选择器> 文章主体部分的CSS选择器(如:#post-body, 文章页获取)正文完
- 使用