书源开发概述
书源是 Reader-Rust 的核心,定义了如何从网站获取书籍信息、目录和正文。
书源结构
书源是一个 JSON 对象,包含以下主要部分:
json
{
"bookSourceName": "书源名称",
"bookSourceUrl": "https://example.com",
"bookSourceType": 0,
"enabled": true,
"ruleSearch": { /* 搜索规则 */ },
"ruleBookInfo": { /* 书籍信息规则 */ },
"ruleToc": { /* 目录规则 */ },
"ruleContent": { /* 正文规则 */ }
}解析方式
Reader-Rust 支持多种解析方式:
| 方式 | 标识 | 用途 |
|---|---|---|
| CSS选择器 | 默认/ @css: | HTML网页解析 |
| JSONPath | @json: 或自动检测 | JSON API解析 |
| XPath | / 开头或 @xpath: | XML/HTML解析 |
| 正则 | @regex: 或 :开头 | 文本提取 |
| JavaScript | js: 或 @js: | 复杂逻辑处理 |
规则流程
搜索关键词
↓
ruleSearch → 书籍列表 → 选择书籍
↓
ruleBookInfo → 书籍详情
↓
ruleToc → 章节列表
↓
ruleContent → 章节正文调试技巧
- 使用
/reader3/testBookSource接口测试书源 - 检查
log_level=debug的日志输出 - 使用浏览器开发者工具分析网页结构