获得“参见”一节中
维基百科页面
我希望得到一个维基百科的文章,在“又见”一节中的所有链接,但蟒蛇维基API(Wikipedia documentation)不提供这些信息。即使我使用“页面”功能获得一个网页的全部内容以“另见”部分中提取,这部分通常是空的! (如果你使用浏览器浏览该网页,它不会是空的!)。获得“参见”一节中
所以,我认为,对于获取这些信息的唯一方法是解析HTML页面。任何意见,帮助我提取这些信息,而不解析HTML页面,是值得赞赏的。
回答:
似乎是一个合理的问题给我。无论如何,你可能还是要解析HTML,但RESTBase API提供了“移动部分”端点组由部分的标题输出HTML。该API端点看起来是这样的:
https://en.wikipedia.org/api/rest_v1/page/mobile-sections/Facebook
Documentation provided here
的API响应包含的对象与 '部分' 财产这样
"remaining": { "sections": [
{
"id": 39,
"text": ...,
"toclevel": 1,
"line": "See also",
"anchor": "See_also"
},
...
]
}
有了这种反应,你可以选择HTML从其line
属性字符串“又见”相匹配的部分。
以上是 获得“参见”一节中 的全部内容, 来源链接: utcz.com/qa/263720.html