用Python怎样爬取火锅店数量,并通过可视化展示出来呢
Admin 2022-08-24 群英技术资讯 319 次浏览
本文数据来自于某度地图,通过python技术知识去获取数据并进行可视化。
首先先看一下数据源,在某度地图里面按照下方操作,就可以请求到全国的火锅店情况(从下图来看没有显示出来,但是通过Network,可以看到数据)
再network中,找到下面这个数据包:
打开之后可以看到json数据:
对网页分析好之后,接下来可以借助Python技术进行获取数据,并保存到excel中。
import json import requests import openpyxl
下面开始编写请求数据代码(请求时记得带上headers)
###请求头 headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36", 'Referer':'https://map.baidu.com/@12949550.923158279,3712445.9716704674,6.28z', "Cookie":";"你的cookie", } ##请求链接 url = "https://map.baidu.com/?newmap=1&reqflag=pcmap&biz=1&from=webmap&da_par=direct&pcevaname=pc4.1&qt=s&da_src=searchBox.button&wd=%E7%81%AB%E9%94%85%E5%BA%97&c=1&src=0&wd2=&pn=0&sug=0&l=6&b=(10637065.476146251,2368134.592189369;12772445.910805061,5056757.351151566)&from=webmap&biz_forward={%22scaler%22:1,%22styles%22:%22pl%22}&sug_forward=&auth=NTSwAZUMzIaTTdWD4WAv0731cWF3MQEauxLxREHzERRtykiOxAXXw1GgvPUDZYOYIZuVt1cv3uVtGccZcuVtPWv3GuztQZ3wWvUvhgMZSguxzBEHLNRTVtcEWe1GD8zv7ucvY1SGpuxVthgW1aDeuxtf0wd0vyMySFIAFM7ueh33uTtAffbDF&seckey=c6d9c7e05d7e627c56ed46fab5d7c5c792064779599d5e12b955a6f18a1204375d1588206c94d22e4bdd1ade0ad06e78c21917e24c6223b96bc51b75ca38651a1b203a0609f126163c5e82fd0549a068e537303424837ab798acfc9088e5d76a66451c20ebd9599b41c9b4f1371850d20fa442ad464712f54c912422f4fa20b3052f8bb810f30d41c7c0e55af68f9d9d973537f03d0aa0a1d1617d78cae29b49c64c2d2dc3f44cf0f8799234b124a7a2dec18bfa011e097e31a508eae37b8603f97df8f935f04b3652f190eac52d04816f302a582c53971e515ff2e0e2b4cc30446e0bee48d51c4be8b6fe4185589ed9&device_ratio=1&tn=B_NORMAL_MAP&nn=0&u_loc=12677548,2604239&ie=utf-8&t=1618452491622" ###响应数据 response = requests.get(url,headers=headers).json()
这里的cookie可以在浏览器network中复制即可。
通过返回的json数据可知道,我们的目标数据在more_city中,里面是列表数据是省份(provice是省份名称,num是火锅店数量),紧接着每一个省份里都有city(列表),里面是对应着省份的城市(name是城市名称,num是对应城市火锅店数量)
response = response['more_city'] for i in response: city = i['city'] print(i['province']) print(i['num']) for j in city: print(j['name']) print(j['num'])
省份和城市分别保存到两个不同的excel中
outwb_p = openpyxl.Workbook() outws_p = outwb_p.create_sheet(index=0) outws_p.cell(row=1, column=1, value="省份") outws_p.cell(row=1, column=2, value="数量") outwb_c = openpyxl.Workbook() outws_c = outwb_c.create_sheet(index=0) outws_c.cell(row=1, column=1, value="城市") outws_c.cell(row=1, column=2, value="数量") ################## ###在循环中写入数据 ################## ### 保存全国省份火锅数量-李运辰” outwb_p.save("全国省份火锅数量-李运辰.xls") # 保存 ### 保存全国城市火锅数量-李运辰” outwb_c.save("全国城市火锅数量-李运辰.xls") # 保存
datafile = u'全国省份火锅数量-李运辰.xls' data = pd.read_excel(datafile) attr = data['省份'].tolist() value = data['数量'].tolist() name = [] for i in attr: if "省" in i: name.append(i.replace("省","")) else: name.append(i) from pyecharts import options as opts from pyecharts.charts import Map from pyecharts.faker import Faker c = ( Map() .add("数量", [list(z) for z in zip(name, value)], "china") .set_global_opts(title_opts=opts.TitleOpts(title="全国火锅店数量分布情况")) .render("全国火锅店数量分布情况.html") )
还可以这样画:
datafile = u'全国省份火锅数量-李运辰.xls' df = pd.read_excel(datafile) province_distribution = df[['省份', '数量']].values.tolist() geo = Geo() geo.set_series_opts(label_opts=opts.LabelOpts(is_show=False)) geo.add_schema(maptype="china") geo.set_global_opts(visualmap_opts=opts.VisualMapOpts(max_=110000)) # 加入数据 geo.add('全国火锅店数量分布情况图2', province_distribution, type_=ChartType.EFFECT_SCATTER) geo.render("全国火锅店数量分布情况图2.html")
为了绘制城市的分布图,选择了四川省为例进行绘制(如果要绘制全国的所有城市,那样出来的图密密麻麻,不美观)
datafile = u'全国城市火锅数量-李运辰.xls' data = pd.read_excel(datafile) city = data['城市'].tolist() values2 = data['数量'].tolist() ###四川 name = [] value = [] flag = 0 for i in range(0,len(city)): if city[i] =="绵阳市": flag = 1 if flag: name.append(city[i]) value.append(int(values2[i])) if city[i] =="甘孜藏族自治州": name.append(city[i]) value.append(int(values2[i])) break c = ( Map() .add("四川火锅店数量分布", [list(z) for z in zip(name, value)], "四川") .set_global_opts( title_opts=opts.TitleOpts(title="四川火锅店数量分布"), visualmap_opts=opts.VisualMapOpts() ) .render("四川火锅店数量分布.html") )
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
简单来说,K-近邻算法采用测量不同特征值之间的距离方法进行分类;优点:精度高、对异常值不敏感、无数据输入假定;缺点:计算复杂度高、空间复杂度高
这篇文章主要介绍了pytorch_detach 切断网络反传方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
这篇文章主要介绍了Python基本知识点总结,Python基本知识,Python字符串,Python函数,Python模块,Python创建类,Python类的继承,Python重载,Python单下划线说明,Python双下划线说明,Python头尾双下划线说明,需要的朋友可以参考下
这篇文章主要为大家介绍了python计算机视觉opencv矩形轮廓顶点位置确定,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
这篇文章主要为大家详细介绍了Python实现FIFO(先进先出)缓存置换算法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008