问题描述: python unicode 编码 转成 UTF-8

python 取值如果 \u5e94\u653641\u4e07\u5374\u4ec5\u6536\u4e94\u5343\uff0c\u5b98\u65b9\uff1a\u88ab\u8b66\u544a\u5904\u5206 把 unicode 转成 utf-8 保存到 txt 或者 xmlx
参考: https://blog.csdn.net/fm345689/article/details/89669076
newContent = ' \u5e94\u653641\u4e07\u5374\u4ec5\u6536\u4e94\u5343\uff0c\u5b98\u65b9\uff1a\u88ab\u8b66\u544a\u5904\u5206' [取值里面转换成字符串,会自动 \]

str(newContent).encode('utf-8').decode('unicode_escape')
// 在遍历的时候会失效,直接对内容进行编码
# 4: 获取内容并编码
content = response.read().decode('utf-8')
# content = content.replace("\\u", "\\\\u")
print(str(content))
# print(str(content).encode('utf-8').decode('unicode_escape'))

myArr = re.findall(r'"youlike".*","u":"http', content)  # 得到 你喜欢的新闻的所有
myTitle = re.finditer(r'"t":".*"', str(myArr))


# 5: 输出内容

fo = open('05repitle.txt', 'w', encoding='utf-8')
# for title in myTitle:
#     newContent = str(title.group())
#     print(newContent.encode('utf-8').decode('unicode_escape'))
#     print(newContent)
#     fo.write("\r\n" + newContent)

问题解决:

对需要重新编码的内容:

content = response.read().decode('unicode_escape')                    # 用 unicode 进行解码
Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐