首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >无法从python的URL中获取内容

无法从python的URL中获取内容
EN

Stack Overflow用户
提问于 2015-12-17 05:54:54
回答 2查看 162关注 0票数 1

当我打印结果时,我正在尝试从一个使用python和BeautifulSoup.However的中文网页中获取内容,有人能告诉我为什么吗?(ps:我也会更改其他一些网页,有时代码工作,但有时不工作)下面是我的代码:

代码语言:javascript
复制
# _*_ coding:utf-8 _*_
from bs4 import BeautifulSoup
import urllib2
import urllib
import urllib2

url='http://finance.sina.com.cn/chanjing/cyxw/2015-12-17/doc-ifxmttcn4893506.shtml'
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
headers = { 'User-Agent' : user_agent }
try:
  request=urllib2.Request(url)
  response=urllib2.urlopen(request)
  html=response.read()
  content=BeautifulSoup(response)
  print content
except  urllib2.URLError,e:
   if hasattr(e,"code"):
      print e.code
   if hasattr(e,"reason"):
      print e.reason

这是我的结果:在这里输入图像描述

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-12-17 06:07:37

试试这个:

代码语言:javascript
复制
page = requests.get('http://finance.sina.com.cn/chanjing/cyxw/2015-12-17/doc-ifxmttcn4893506.shtml')
print page.text
soup = BeautifulSoup(page.text)
soup.prettify()
print soup
票数 0
EN

Stack Overflow用户

发布于 2015-12-17 06:01:55

试一试

代码语言:javascript
复制
content=BeautifulSoup(html)
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34327553

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档