不能让PHP接受来自美丽的汤姆Python脚本的POUND标志

因此,我有一个脚本可以从事件网页中获取信息。网址是:http://everguide.com.au/melbourne/event/2012-jul-14/colour/不能让PHP接受来自美丽的汤姆Python脚本的POUND标志

这个PHP脚本调用一个python脚本" title="python脚本">python脚本(其循环的一部分):

${"tmp" . $i} = utf8_encode (exec("python myscrape.py ${"eu" . $i}")); 

它通过一个URL。该Python脚本是这样的:

# -*- coding: utf-8 -*- 

import sys

URL = sys.argv[1]

#$URL = 'http://everguide.com.au/melbourne/event/2012-jul-14/colour/'

import urllib2

req = urllib2.Request(URL)

response = urllib2.urlopen(req)

html = response.read()

from BeautifulSoup import BeautifulSoup

soup = BeautifulSoup(html.decode('utf-8'))

soup.prettify()

import re

for node in soup.findAll(itemprop="name"):

n = ''.join(node.findAll(text=True))

for node in soup.findAll(itemprop="url"):

v = ''.join(node.findAll(text=True))

for node in soup.findAll("div", { "class" : "time" }):

d = ''.join(node.findAll(text=True))

for node in soup.findAll("a", { "id" : "ctl00_holderBody_ctl00_lnkCat" }):

c = ''.join(node.findAll(text=True))

vu = v

vu.encode('utf-8', 'xmlcharrefreplace')

re.escape(vu)

print n,"|", d,"|", vu,"|", c

其中的作品真的很好,但只返回达VU前或管道 - 它不能走过去的!

UTF-8编码设置在所有文件,HTML和php上。

当V变量中存在特殊字符时,它会中断并停止。如果没有特殊字符,它可以很好地工作。

预期成果是:

Colour | 14 July @ 7:30PM | 1000 £ Bend | Clubs & Parties 

这ouutput可以在服务器上运行脚本时(以相同的蟒蛇命令),但在PHP中可以看出 - 我不能让场馆串回来!

请帮

里克编码字符串

回答:

vu.encode回报......因为你不分配编码的结果,这是刚刚扔掉。你试过

vu = vu.encode('utf-8', 'xmlcharrefreplace')

您还需要跳过逃逸,因为它会弄乱编码的Unicode。

以上是 不能让PHP接受来自美丽的汤姆Python脚本的POUND标志 的全部内容, 来源链接: utcz.com/qa/263617.html

回到顶部