我使用的是Python Spark,并且我试图访问每个分区中的http。但它始终停留在那里,示例如下:
sc = SparkContext(appName="Fetch Http")
lines = sc.textFile("urls.txt", 10)
lines.map(fetch).saveAsTextFile("hdfs://node1/pages")
def fetch(url)
http = urllib3.PoolManager()
postResponse = http.request('POST',url,headers=JSON)
jData = json.loads(postResponse.data)
vectorStr = contertFun(jData)
return vectorStr发布于 2016-11-07 06:12:26
您的代码存在一些问题:
总体而言,这没有多大意义。
https://stackoverflow.com/questions/40409163
复制相似问题