XPath 使用笔记

xpath 的语法主要是使用的 /name/*[]|//*[@name] 的语法规则。

  • 定位节点

节点主要是使用的 id 或者是 classname 进行匹配的,这种情况下,如果是 / 则表示找某一层,如果是 // 进行匹配,则表示是任意位置的某个层,如果用 * 则表示任意名称。

比如:/cd 是指的 classname 为 cd 的结构,而且是第一层就是 cd,如果是 //cd 则表示其中某层为 cd 但是可以不是最外层。

  • 选择分支

使用中括号可以选择分支。以下的语法从 catalog 的子元素中取出第一个叫做 cd 的元素。XPath 的定义中没有第 0 元素这种东西。而且当我们想要选取某类值的时候,可以认为 [] 中的是属性的名称,比如 //cata[@name] 是找的任意 cata 层中包含 name 属性的元素位置。

在属性之外,还有一种是索引查找方式,比如 //cata[1] 表示查找任意 cata 层中的第一个分支,这里索引是从 1 开始,而不是 0 开始,如果查找最后一个,则需要使用 cata[last()] 去找,这里只有 last() 方法,不存在 first() 方法。

如果是 [] 中的内容没有 @ 符号,又不是索引值(数字)或者是 last() 方法的话,则表示找出包含某个子元素的情况,比如 //cata/cd[pr] 表示包含 pr 的 /cata/cd 层。如果想指定元素的值,则可以在括号中增加对应的匹配 //cata/cd[pr=1.0]

| 在 xpath 中表示或者关系,即符合前面的,或者后面的内容,比如 /cata/pr | /cata/pm 两种我全要的意思。

  • 选择属性

如果某一个值是用 @ 作为开始,则表示是属性,基本的语法和层的 / 是一致的,区别是可以多个属性并存,即 /ca[@na='uu'][@nb='zz'] ,这样就是找到 cd 层中属性 na 是 uu 且 属性 nb 是 zz 的元素。

  • 特殊方法

contains(): 包含语法,比如 /ca[contains(@name,'na')] name 属性中包含 na 的元素 text(): 显示文本信息,这里对应的可以用来查询,而且进行其它操作,是对元素属性的补充 starts-with(): 开始于,比如 /ca[starts-with(@name,'na')] name 属性开始位置包含 na

Author
Tags
总结(3) Emacs(2) org mode(4) 年度清单(2) 读书清单(2) 电影清单(2) 电视清单(2) Python(3) 学习计划(1) 子弹笔记(1) 手帐体系(1) 时间管理(1) 时间使用效率(1) 形意拳(1) 知识管理(1) 简历(1) 技能水平(1) 生活(1) 减法生活(1) 阅读(1) 阅读分组(1) org(1) docx(1) markdown(2) cmder(1) 图床(1) jsdelivr(1) github(1) 安卓系统(1) 手动更新手机系统(1) post link(1) post path(1) hexo(2) hugo(2) GitHub Pages(1) travis(1) 自动部署博客(1) presentation(1) gcc(1) g++(1) 默认表格(1) 复杂表格(1) multimd table(1) google adsense(1) evil(1) surround(1) librime(2) emacs-rime(1) liberime(1) dot(1) graphviz(1) use-sub-superscripts(1) ditaa(1) Evil Multiple cursors(1) turn evil mode off(1) modifier keys(1) keymap(1) super(1) hyper(1) install Emacs(1) Mac OS(1) keybinds(1) clocktable(1) coding system(1) image library(1) keybind(1) spacemacs(1) org babel(1) homebrew(1) dd(1) diskutil(1) tmux(1) xcode(1) xcrun(1) node-gyp(1) tar(1) tree(1) pacman(1) plantuml(1) find(1) grep(2) du(1) apt-get(1) apt(1) regex(1) wildcard(1) zsh(1) gdb(1) lsof(1) netstat(1) rebase(2) workflow(1) 工作流(1) .gitignore(1) postbuffer(1) hung up(1) merge(1) cache(1) reset(1) Git(1) command(1) submodule(1) GitHub Pull Request(1) pr(1) Matplotlib(1) beautifusoup(1) 下载小说(1) SOLID(1) Leetcode(2) 透视表(1) read_excel()(1) pandas(1) conda(1) django(1) markdown-deux(1) mysql(1) oracle(1) 模糊查询(1) logging level(1) reflex(1) Field(1) Maven(1) Selenium(1) 下拉框(1) select into(1) insert into select(1) CAST(1) CONVERT(1) timestamp(1) concat(1) concat_ws(1) group_concat(1) union(1) grant privileges(1) 重置 root 密码(1) 报错 10060(1) 清理连接数(1) create user(1) set password(1) exists(1) in(1) markdown-it(1) emoji(1) tasks(1) valine(1) Code 504(1) Hugo(1) theme(1) substring(1) indexOf(1) RegExp(1) 定位节点(1) 正则匹配(1) async(1) 异步请求(1) css(2) layui(1) 滚动条(1) JavaScript(1)