添加链接

注册登录

link管理

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

不敢表白的台灯 · 世和基因· 2 月前 ·

道上混的炒粉 · qml要用什么语言编程 • Worktile社区· 2 月前 ·

考研的葡萄 · 放大招！新命令addbefore来了~· 4 月前 ·

拉风的剪刀 · iPhone手电筒不能工作的几种修复办法，总 ...· 4 月前 ·

买醉的闹钟 · S常用函数参考· 4 月前 ·

Zhao Zhengyang

Welcome to my personal blog

方法	返回值
css(query)	SelectorList对象
xpath(query)	SelectorList对象

属性/方法	返回值
css(query)	SelectorList对象
xpath(query)	SelectorList对象
re(regex)	字符串列表
re_first(regex)	字符串
getall()	字符串列表，包含每个元素的get()方法的返回值
get(default=None)	字符串，第一个元素的get()方法的返回值，如果列表为空则返回default
attrib	字典，第一个元素的attrib属性，如果列表为空则返回空字典

属性/方法	返回值
css(query)	SelectorList对象
xpath(query)	SelectorList对象
re(regex)	字符串列表
re_first(regex)	字符串
get()	字符串，包含该选择器匹配的内容
attrib	字典，包含该选择器匹配节点的属性

选择器	例子	描述
`element`	`p`	选择所有 `<p>` 元素
`#id`	`div#firstname`	选择id=”firstname”的 `<div>` 元素
`.class`	`p.intro`	选择所有class包含”intro”的 `<p>` 元素
`element1,element2`	`div,p`	选择所有 `<div>` 元素和所有 `<p>` 元素
`element1 element2`	`div p`	选择 `<div>` 元素内部的所有 `<p>` 元素
`element1>element2`	`div>p`	选择父元素为 `<div>` 元素的所有 `<p>` 元素
`[attribute]`	`div[target]`	选择带有target属性的所有 `<div>` 元素
`[attribute=value]`	`a[href=/page/2]`	选择href=”/page/2”的所有 `<a>` 元素
`:first-child`	`p:first-child`	选择属于父元素的第一个子元素的每个 `<p>` 元素
`:last-child`	`p:last-child`	选择属于父元素最后一个子元素的每个 `<p>` 元素
`:nth-child(n)`	`p:nth-child(2)`	选择属于父元素的第2个子元素的每个 `<p>` 元素
`::text`	`p::text`	（Scrapy特有）选择所有 `<p>` 元素内部的文本
`::attr(attribute)`	`a::attr(href)`	（Scrapy特有）选择所有 `<a>` 元素的href属性值

语法	解释
`/node`	选择根节点
`//node`	选择所有匹配节点，不考虑在文档中的位置
`@attr`	选择属性
`[pred]`	谓语
`.`	选择当前节点
`..`	选择当前节点的父节点

表达式	描述
`/html`	选择根节点 `<html>`
`//p`	选择所有 `<p>` 元素，不考虑在文档中的位置
`//@href`	选择所有href属性的值
`//div[@id="firstname"]`	选择id=”firstname”的 `<div>` 元素
`//p[@class="intro"]`	选择所有class=”intro”的 `<p>` 元素
`//div/p`	选择所有 `<div>` 元素的所有直接子元素 `<p>`
`//div//p`	选择所有 `<div>` 元素内部的所有 `<p>` 元素
`//div/p \| //div/span`	选择所有 `<div>` 元素的所有直接子元素 `<p>` 和 `<span>`
`//div[@target]`	选择带有target属性的所有 `<div>` 元素
`//a[@href="/page/2"]`	选择href=”/page/2”的所有 `<a>` 元素
`//div[@id="main"]/p[1]`	选择id=”main”的 `<div>` 元素的第一个 `<p>` 子元素
`//div[@id="main"]/p[last()]`	选择id=”main”的 `<div>` 元素的最后一个 `<p>` 子元素
`//div[@id="main"]/p[position()< 3]`	选择id=”main”的 `<div>` 元素的前两个 `<p>` 子元素
`//p/text()`	选择所有 `<p>` 元素内部的文本
`//a/@href`	选择所有 `<a>` 元素的href属性值

推荐文章

不敢表白的台灯 · 世和基因

2 月前

道上混的炒粉 · qml要用什么语言编程 • Worktile社区

2 月前

考研的葡萄 · 放大招！新命令addbefore来了~

4 月前

拉风的剪刀 · iPhone手电筒不能工作的几种修复办法，总有一种适合你|手机|相机|应用程序|重新启动|iphone_网易订阅

4 月前

买醉的闹钟 · S常用函数参考

4 月前

Link管理 · 51好读 · Sov5搜索 · 小百科

link管理 - 链接快照平台