public class SimpleHtmlParser extends java.lang.Object implements HtmlTableParserUtil.IHtmlParserCall
PARAM_END_PAGE_COUNT, PARAM_FORMAT_PAGE_URL, PARAM_HOME_URL, PARAM_MANUAL_TASK_URLS, PARAM_MAX_PAGE_COUNT, PARAM_MAX_THREAD_COUNT, PARAM_RECORD_COUNT, PARAM_RETURN, PARAM_START_PAGE_COUNT, PARAM_XPATH_CONTENT, PARAM_XPATH_PAGE_COUNT, PARAM_XPATH_TITLES, RETURN_CONTENT, RETURN_PATH, RETURN_TITLE, RETURN_TITLE_HREF
构造器和说明 |
---|
SimpleHtmlParser() |
限定符和类型 | 方法和说明 |
---|---|
java.lang.String |
content(com.gargoylesoftware.htmlunit.html.HtmlPage page,
java.lang.String xpathContent)
获取内容
|
java.util.List<java.lang.String> |
getTasks()
获取任务url
|
int |
pageCount(com.gargoylesoftware.htmlunit.html.DomElement element)
获取页面总页数
|
java.lang.String |
pageUrl(java.lang.String url,
int page)
获取分页地址
|
java.lang.String |
title(com.gargoylesoftware.htmlunit.html.DomElement element)
获取标题的名称
|
com.gargoylesoftware.htmlunit.html.DomElement |
titleDomElement(com.gargoylesoftware.htmlunit.html.DomElement element)
获取标题的DomElement
|
java.lang.String |
titleHref(com.gargoylesoftware.htmlunit.html.DomElement element)
获取标题的链接
|
public int pageCount(com.gargoylesoftware.htmlunit.html.DomElement element)
HtmlTableParserUtil.IHtmlParserCall
pageCount
在接口中 HtmlTableParserUtil.IHtmlParserCall
element
- 当前节点对象public java.lang.String pageUrl(java.lang.String url, int page)
HtmlTableParserUtil.IHtmlParserCall
pageUrl
在接口中 HtmlTableParserUtil.IHtmlParserCall
url
- 替换的urlpublic com.gargoylesoftware.htmlunit.html.DomElement titleDomElement(com.gargoylesoftware.htmlunit.html.DomElement element)
HtmlTableParserUtil.IHtmlParserCall
titleDomElement
在接口中 HtmlTableParserUtil.IHtmlParserCall
element
- 当前节点对象public java.lang.String title(com.gargoylesoftware.htmlunit.html.DomElement element)
HtmlTableParserUtil.IHtmlParserCall
title
在接口中 HtmlTableParserUtil.IHtmlParserCall
element
- 当前节点对象public java.lang.String titleHref(com.gargoylesoftware.htmlunit.html.DomElement element)
HtmlTableParserUtil.IHtmlParserCall
titleHref
在接口中 HtmlTableParserUtil.IHtmlParserCall
element
- 当前节点对象public java.lang.String content(com.gargoylesoftware.htmlunit.html.HtmlPage page, java.lang.String xpathContent)
HtmlTableParserUtil.IHtmlParserCall
content
在接口中 HtmlTableParserUtil.IHtmlParserCall
page
- 当前节点对象xpathContent
- 内容路径public java.util.List<java.lang.String> getTasks()
HtmlTableParserUtil.IHtmlParserCall
getTasks
在接口中 HtmlTableParserUtil.IHtmlParserCall