Skip to content

书籍信息规则 (ruleBookInfo)

定义如何从书籍详情页提取详细信息。

规则字段

json
{
  "ruleBookInfo": {
    "name": "",
    "author": "",
    "coverUrl": "",
    "intro": "",
    "kind": "",
    "wordCount": "",
    "lastChapter": "",
    "tocUrl": ""
  }
}

字段说明

字段必需说明
name书名
author作者
coverUrl封面图片URL
intro书籍简介
kind分类标签
wordCount总字数
lastChapter最新章节标题
tocUrl目录页URL(默认当前页)

示例

标准详情页

json
{
  "ruleBookInfo": {
    "name": ".book-info h1@text",
    "author": ".book-info .author a@text",
    "coverUrl": ".book-cover img@attr[src]",
    "intro": ".book-intro@html",
    "kind": ".tags a@text",
    "wordCount": ".book-status .words@text",
    "lastChapter": ".book-status .latest a@text",
    "tocUrl": ".read-link@attr[href]"
  }
}

简介处理

简介可能需要清理 HTML 标签或换行:

json
{
  "intro": "div.intro@html##<p>##\n##<br>##\n"
}

或使用 JavaScript:

json
{
  "intro": "js:result.replace(/<[^>]+>/g, '\\n').trim()"
}

注意事项

  1. tocUrl 如未指定,默认使用当前页面作为目录页
  2. 某些网站目录在单独页面,需要指定 tocUrl
  3. bookUrl 会自动作为入参传入 ruleBookInfo 上下文