mechanizePython的HTML解析

联合创作 · 2023-09-22 00:09

当您希望与 Web 页面中找到的内容进行某种比较复杂的交互时，您需要使用 mechanize 库

示例代码：

import re
from mechanize import Browser

br = Browser()
br.open("http://www.example.com/")
# follow second link with element text matching regular expression
response1 = br.follow_link(text_regex=r"cheese\s*shop", nr=1)
assert br.viewing_html()
print br.title()
print response1.geturl()
print response1.info()  # headers
print response1.read()  # body
response1.close()  # (shown for clarity; in fact Browser does this for you)

br.select_form(name="order")
# Browser passes through unknown attributes (including methods)
# to the selected HTMLForm (from ClientForm).
br["cheeses"] = ["mozzarella", "caerphilly"]  # (the method here is __setitem__)
response2 = br.submit()  # submit current form

# print currently selected form (don't call .submit() on this, use br.submit())
print br.form

浏览 16

点赞

收藏

分享

举报

评论

图片

表情

wiseparserPHP的HTML解析

wiseparser 是一个 PHP 语言用来解析 HTML 文档的开发包。示例代码：require

htmlspriteFlash的HTML解析

htmlsprite 是一个 Flash 用来解析 HTML 文档的开发包。示例代码：import

afterworkC#的HTML解析

afterwork是一个C#语言用来解析HTML文档的开发包。

htmlspriteFlash的HTML解析

htmlsprite是一个Flash用来解析HTML文档的开发包。示例代码：importcom.redurban.HTMLSpritevarhtmlsprite:HTMLSprite=newHTMLS

wiseparserPHP的HTML解析

wiseparser是一个PHP语言用来解析HTML文档的开发包。示例代码：require_once('treebuilder.php');$mytree=newTree();<br>$m

jScraperJava的HTML解析包

jScraper提供了简单的接口用来解析HTML文本，它将HTML文本转成Java的对象。查看jScraper的JavaDoc文档：http://sharkysoft.com/software/jav

tagparserPython的HTML文档解析

很多人需要提取网页的一些内容, 可以利用正则表达式提取,也可以用beautifulsoap等工具.

jScraperJava的HTML解析包

jScraper 提供了简单的接口用来解析HTML文本，它将HTML文本转成Java的对象。查看 j

Requests-HTMLPython 的 HTML 解析库

Requests-HTML 对 Requests 进行了封装，添加了解析 HTML 的接口，是一个

gohtmlJava的HTML解析库

gohtml 是一个很小的 Java 类库，用来解析 HTML 文档，目前尚未公开发布版本。

点赞

收藏

分享

举报