你的城市哪家烤肉最香?Python爬取美团2万烤肉商家数据

python

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

以上文章来源于菜J学Python,作者 J哥

前言

美国作家杜鲁门·卡波特曾说:“梦是心灵的思想,是我们的秘密真情。”在笔者的内心深处,也曾有一个小小的梦想,那就是开一家烤肉店。几串烤肉、一杯美酒,即可享受深夜路边的自由得意与平凡热辣的市井人生。

可是,想开烤肉店可没那么容易,首先你得了解市场。于是,打开了美团,一顿操作爬取了深圳所有的烤肉店数据,然后清洗数据并做可视化分析,试图摸到一点开烤肉店的门道。

数据获取

美团网很明显是动态网页,需要通过解析接口或用Selenium爬取,本文通过解析接口的方法爬取数据。

找到真实URL

美团网URL:https://sz.meituan.com/

 

分析真实URL

主要参数:

  • 30:城市id(30代表深圳)
  • limit:每页店铺数量
  • offset:翻页参数(每增加32翻页一次)
  • q:关键字(本例为烤肉)

按上述接口爬取只能获得1024个店铺数据,为了获得更全面数据,还需找到areaId参数(子地区),然后遍历子地区,即可获得完整数据。限于篇幅,仅给出核心代码。

 

数据处理

短短几分钟就爬下了2万多个烤肉店信息,为了方便可视化分析,还需要对爬取的数据进行简单清洗。

本文数据清洗主要用到Python的Pandas库。

导入数据

导入数据并添加列名,用sample()方法随机抽取5个样本数据预览。

 

 

查看数据类型

用Info()方法查看各字段数据类型,符合预期,无需转换。

df.info()

输出:

 

删除重复数据

df = df.drop_duplicates()

缺失值处理

由上文可知,仅联系方式字段含有缺失值,用文本填充。

df = df.fillna("暂无数据")

店铺地址清洗

通过店铺地址字段截取所属区县,另外,“南澳大”属于龙岗区,直接用replace()方法替换。

 

店铺评分清洗

根据美团评分方法,对店铺评分字段进行切分,获得评分类型列。

 

描述性统计

1.查看基本统计量

df.describe()

 

2.计算相关系数

df.corr()

 

3.绘制回归图

 

 

通过绘制回归图,我们发现人均消费与店铺评分具有正相关,评论人数和店铺评分具有正相关。这与我们的常识也较为接近。

数据分析

本文数据可视化主要用到pyecharts库,它能轻松实现酷炫的图表效果。

地区分布

深圳烤肉店主要分布在龙岗区、龙华区、南山区和福田区,盐田区和坪山区烤肉店较少。烤肉店的选址一个重要因素就是人流量,龙岗区和龙华区为深圳主要的生活居住区,而南山区和福田区为深圳的核心商业聚集地,巨大的需求为烤肉店的布局奠定了基础。

 

 

所在商圈

仅仅知道烤肉店行政区分布,对于烤肉店选址作用其实不大。于是,我们进一步细化到商圈,看看哪些商圈的烤肉店较多。在深圳所有商圈中,龙华区的民治和龙华、光明区的公明烤肉店数量都超过了150家。

 

 

 

评分排行

烤肉店的评分在一定程度上反映了消费者对烤肉店的态度和看法。通过计算各个行政区烤肉店平均评分,我们发现,深圳烤肉店普遍评分不高,都在3分以下,且各地区评分差异不大。

 

 

评分类型

根据不同评分类型绘制饼图,我们发现深圳评分为“一般”的烤肉店数量占比高达73.9%。评分类型为“不错”的烤肉店仅占6.52%。烤肉店较低的评分意味着,作为市场的进入者,如果新开烤肉店能够提供较好的质量和服务,且获得消费者好评,将比较容易在众多烤肉店中脱颖而出。

 

 

我们继续将评分类型分析细化到深圳的各个行政区,罗湖区评分为“一般”的烤肉店占比相对低一些。其他地区占比都超过了一半。这进一步反映了深圳烤肉店评分的整体情况,排除了某个或某几个行政区评分异常值的影响。

 

 

人均消费

从深圳各行政区烤肉店人均消费来看,南山区和福田区人均消费较高,坪山区和光明区人均消费较低。

在消费量一致的假设下,人均消费的多少取决于烤肉的价格。南山区和福田区高昂的开店成本以及消费者较强的消费能力,是烤肉人均消费较高的重要动因。

 

 

由上图可知,深圳各行政区烤肉人均消费普遍低于50元,那是不是意味着如果要开烤肉店的话,定价不能太高。

为此,我们可以筛选出人均消费大于1000元的烤肉店,看下消费者的评价情况。由下表可知,虽然三家烤肉店定价很高,却获得了消费者较高的评价。因此,烤肉的定价还需根据你的市场定位来,如果定位高端人群,那么较高的价格消费者也是可以接受的。

 

 

店铺类型

从深圳烤肉店店铺类型来看,烤串、烧烤和融合烤肉最多,韩式烤肉、日式烤肉等店铺相对更少一些。

 

 

从评分来看,串串香、牛排和怀石料理的烤肉评分较高。另外,日式自助烤肉评分也排到了前十名,日式烤肉对肉要求比较高,日式肉类也会稍微腌制,但是总体以体现肉的鲜美为主。精致的日式烤肉,博得了众多深圳消费者的青睐。

 

 

评论人数

从评论人数来看,综合自助和韩式烤肉店评论人数均在10万左右,而评论人数在一定程度上反映了烤肉店的热度。不同的综合自助烤肉店一般价格和肉质差异较大,获得较多的评论也不足为奇。而韩式烤肉通常会对肉类进行腌制,口感偏重,也被深圳消费者广泛讨论。

 

 

店铺取名

当然,开烤肉店除了要了解消费者的偏好以及竞争对手的优劣势,还一个重要步骤就是给自己开的烤肉店取名了。

一个响亮的烤肉店名字,能够给消费者留下较深的记忆度,同时也能带来品牌效应。于是,J哥对深圳所有烤肉店名进行分词并绘制了词云图,发现除了烧烤、烤肉等字样,词频较高的还有音乐、木屋和炭火等。差异化市场定位,给烤肉搭配多样化的元素,在店名中凸显出来,不失为一个不错的选择。

 

以上是 你的城市哪家烤肉最香?Python爬取美团2万烤肉商家数据 的全部内容, 来源链接: utcz.com/z/530536.html

回到顶部