获得“参见”一节中

维基百科页面

我希望得到一个维基百科的文章,在“又见”一节中的所有链接,但蟒蛇维基API(Wikipedia documentation)不提供这些信息。即使我使用“页面”功能获得一个网页的全部内容以“另见”部分中提取,这部分通常是空的! (如果你使用浏览器浏览该网页,它不会是空的!)。获得“参见”一节中

​​

所以,我认为,对于获取这些信息的唯一方法是解析HTML页面。任何意见,帮助我提取这些信息,而不解析HTML页面,是值得赞赏的。

回答:

似乎是一个合理的问题给我。无论如何,你可能还是要解析HTML,但RESTBase API提供了“移动部分”端点组由部分的标题输出HTML。该API端点看起来是这样的:

https://en.wikipedia.org/api/rest_v1/page/mobile-sections/Facebook

Documentation provided here

的API响应包含的对象与 '部分' 财产这样

"remaining": { 

"sections": [

{

"id": 39,

"text": ...,

"toclevel": 1,

"line": "See also",

"anchor": "See_also"

},

...

]

}

有了这种反应,你可以选择HTML从其line属性字符串“又见”相匹配的部分。

以上是 获得“参见”一节中 的全部内容, 来源链接: utcz.com/qa/263720.html

回到顶部