利用大数据技术分析中国地方菜系间的“远亲与紧邻”

发布者:李静东发布时间:2019-08-13浏览次数:74

       中国是一个幅员辽阔、历史悠久、人口众多的国家,不同地区和民族的人们,培育了各具特色的多种菜系。中国菜系大致可划分为四川(川菜)、湖南(湘菜)、广东(粤菜)、福建(闽菜)、浙江(浙菜)、山东(鲁菜)、江苏(苏菜)、安徽(徽菜)等地的八大菜系。不同的菜系是地区差异、民族文化和习俗的重要体现。

 近年来随着社交应用的兴起,人们热衷于在线上分享各地的美食,而专门以食谱制作与分享为主题的在线社区也应运而生。在线美食社区的出现,聚集了全国各地爱好美食制作的人们。以美食杰在线食谱网站为代表,截止至目前,该网站拥有国内领先数量的视频菜谱及图文菜谱近百万篇,每年超过1亿次的浏览量,目前为止超过5000万家庭享用该网站提供的饮食指南。对在线食谱数据进行分析,有助于加强我们对中国饮食习惯、民族特色、地区差异等方面的认识,丰富我们对中国饮食文化在数据层面上的认知。

 计算机学院荣垂田老师的研究团队基于大数据技术,对中国在线食谱的数据进行了大数据分析,通过分析结果可以量化表示不同菜系之间相似度关系。

1 各菜系菜谱的相似性分析

上图中每个节点代表一个菜谱,不同颜色的节点团簇代表着不同的菜系。两个菜谱节点之间连线的长度与它们之间相似度值的大小成反比,即两个节点之间的连线长度越短,说明两个菜谱之间的相似度就越高,从图中还可以观察出属于相同菜系的菜谱之间相似度较高,因此连接更加紧密。川菜和湘菜的食谱连线较为紧密,说明两个菜系较为相似。同时,江苏菜系和浙江菜系之间的相似性也较高。这与它们在地理位置上邻近、气候类型相近有关。我们还可以发现,山东菜和福建菜所在的地区地理位置相距较远、气候差异较大,它们之间的相似性较小。因此,我们推测地理位置上的相近对菜谱相似性可能有着重要的影响。

 

基于此项研究发表的论文:

  1. Yan Bai, Chuitian Rong, Xiangling Zhang. Food Pairing Based on Generative Adversarial Networks. CCF BigData 2020

  2. Zhaopei Liu, Chuitian Rong, Xiangling Zhang. Comparisons of Deep Neural Networks in Multi-Label Classification for Chinese Recipes. CCF BigData 2020