RSS订阅_PKM个人知识管理

345次阅读
没有评论

RSS 概述

RSS(Really Simple Syndication)是一种用于发布和共享网页内容的技术,广泛应用于新闻网站,博客和其他在线内容平台.

作用:

  • 可以脱离抖音/小红书等平台算法推送的机制;
  • 变被动获取信息, 为主动获取信息;
  • 集中管理/查阅, 无需逐个访问;
  • 及时获取信息, 而不是去原网站刷新;
  • 无广告干扰, 不需要去原网站, 故没有广告;

我的使用场景

RSS >>> [学习/Copy + 套路(Blog/BBS/Video)] >>> 内容创作 >>> 分发/分享 >>> 流量获取

寻找RSS订阅源

  1. 查找网站自带RSS
    • RSSHub Radar crx插件网站RSS
    • 网站自带的RSS按钮;
    • Google搜索: "网站名 + RSS"
  2. 自己制作RSS

使用RSSHub

使用 RSSHub 可以轻松的订阅很多原来不支持的信息, 比如 Bilibili/Telegram...

但是由于国内网络的问题, https://rsshub.app/ 在国内不能访问, 此时自己利用 vps 搭建RSSHub; 也可以使用别人已经搭建好的共享的服务:

  1. 官方服务, 有些源不能用, 比如知乎
  2. 别人共享
  3. 自己搭建

自己搭建步骤: 1.创建挂载目录; 2.创建yml文件; 3.启动容器; 4.NPM反代

mkdir -p /root/data/docker/freshrss && cd /root/data/docker/freshrss
vim docker-compose.yml
docker-compose up -d

yml文件内容如下:

services:
  rsshub:
    image: diygod/rsshub
    restart: always
    ports:
      - "1200:1200"  # 映射端口

使用自制RSS

如果有些网站/信息 RSSHub 不支持怎么办呢? 也有方法:

  1. 手动撰写 RSSHub 路由解析目标网站(难度稍大);
  2. 使用一些RSS生成器工具, 比如:
  3. FreshRSS 可以使用 XPath 解析目标网站

FreshRSS服务

FressRSS可以实现多终端同步RSS;
FressRss可以通过Xpath解析不支持RSS的网站;

FreshRSS搭建

步骤: 1.创建挂载目录; 2.创建yml文件; 3.启动容器; 4.NPM反代

mkdir -p /root/data/docker/freshrss && cd /root/data/docker/freshrss
vim docker-compose.yml
docker-compose up -d

yml内容如下:

services:
  freshrss:
    image: freshrss/freshrss:latest
    container_name: freshrss
    environment:
      - CRON_MIN=*/20       #每20分钟刷新一次
      - TZ=Asia/Shanghai
    volumes:
      - ./data:/var/www/FreshRSS/data
      - ./extensions:/var/www/FreshRSS/extensions
    ports:
      - 8061:80        #左边的8080可以改成服务器上没有用过的端口
    restart: always

FreshRSS配置

FreshRSS解析教程

需要 XPath 插件, 比如: CSS and XPath checkerXPath Tester

  1. 添加源, 比如: https://www.dsb.cn/kuajing
  2. 订阅源类型选择"HTML + XPath(Web 抓取)"
  3. 定位 文章 XPath (各个 Item )
  4. 定位其他 XPath(标题/内容/URL/缩略图/作者/日期).
    • 使用 ./ 代表 文章XPath
    • 使用@href, @src 提取属性, text() html中的文本内容
    • 使用: //div[contains(@class, 'artic_item')] 所有包含 artic_item 类的
      元素
    • 其他使用问 ChatGPT
  5. 设置日期格式(可选): Y-m-d
  6. 抓取全文(可选): 订阅源设置 > Content retrieval > 原文的CSS选择器 > 文章主体部分的CSS选择器(如: #post-body, 文章页获取)
正文完
 0
评论(没有评论)
验证码