2020第四届全国应用统计专业学位研究生案例大赛企业选题信息发布

时间:2020-05-11

按照竞赛章程,参赛队伍除可以自选题目参赛之外,还可以选择选题审核委员会发布的选题参赛。经全国应用统计专业学位研究生案例大赛组委会选题审核委员会一致审核,最终确定“2020第四届全国应用统计专业学位研究生案例大赛”的下列四道赛题(相关数据集点击文末地址链接获取)。其中部分赛题是本次案例大赛新增加的企业案例选题,使赛题更加聚焦实践,从而更好的实现数据资源的充分利用。


由于网盘平台原因,原选题数据下载地址被停止,现已更新,欢迎下载!


案例A:汽车经销商客户流失预警与回厂预测


随着社会经济的快速发展和交通基础设施的不断完善,我国汽车市场也得到了迅速增长。但与此同时4S店售后服务却没有得到强有力的发展,合资品牌车和国产车客户的流失严重,这无疑给4S店造成了极大损失。近两年来随着汽车新车销量增长有所减缓,作为汽车服务行业拥有大量存量客户的汽车4S店,也开始越来越重视售后市场服务。因此,通过对汽车4S店存量客户流失预警与客户回厂预测的研究,可以为汽车4S店对流失客户制定针对性的挽回策略提供依据,对提高汽车4S店的管理效率,促进汽车服务行业中客户管理的发展具有重要意义。请根据所提供的数据集(训练集:dataA1.csv,测试集:dataA2.csv,必要时可以补充相关数据),按照案例写作要求,解决如下问题:

1.建立汽车4S店客户的流失预警分级标准,将测试集数据划为五级,并给出相应的流失得分(1-5分)及其比例。

2.建立汽车客户回厂预测模型,预测客户下次可能回4S店的时间(精确到日)。

3.对上述标准和预测模型进行评判。

4.按格式:客户ID、流失得分(1-5分)、下次回厂时间(YYYY-MM -DD)附提交结果。


案例B:新冠肺炎疫情对市场主体进入的影响


企业作为宏观经济发展的微观主体,是中观产业发展的基本组织,经济发展归根结底需要企业发展予以实现。无论是推动我国经济平稳有序发展、经济结构优化升级,还是缓解失业压力,都离不开企业主体的作用。因此,通过研究新冠肺炎疫情对我国市场主体进入的影响,不仅可以为深化商事制度改革,激发市场主体活力提供重要参考,也将为政府制定相关政策提供数据支撑,有利于发挥各项政策的协同效应,增强经济回升动力。请根据所提供的数据集(训练集:dataB1.csv,测试集:dataB2.csv,必要时可以补充相关数据),按照案例写作要求,解决如下问题:

1. 分析新冠肺炎疫情对市场主体进入(包括但不限于对不同地区、不同行业、不同企业主体群)的影响,并输出整体方案设计文档。

2.结合政府针对疫情实施的经济扶持政策,对市场主体进入(包括但不限于对不同地区、不同行业、不同企业主体群)政策实施效果的影响进行评估,并提出建议。


案例C:车企舆情正负面识别与预测


随着互联网快速发展和移动端的普及,网络发声更容易引爆舆情,企业对舆情的关注越来越重视。通过对互联网中与自身企业相关舆情的分析,可以很好的为企业在决策上的修正、危机公关处理、产品改进、竞争力优化、用户粘度增长等等方面提供依据。随着人民生活质量的提高,汽车成为人们青睐的出行工具,各个车企竞争逐渐白热化,尤其是车企舆情就是重要一环。因此对互联网上车企相关舆情的预测分析对车企的成长与发展具有十分重要的意义与价值。请根据所提供的数据集(dataC.csv,必要时可以补充相关数据),按照案例写作要求,解决如下问题:

1.评估所给数据的质量;设计数据分析、特征提取的流程和方法。

2.给出解决舆情预测整体方案和思路的设计文档(包括但不限于解决思路、算法选择、模型工具选择的阐述);具体建立车企的正负面识别模型,给测试集数据打上情感倾向标签。

3.给出模型结果的评估报告(包括但不限于模型阐述、训练集和测试集数据的模型结果解释、评价指标解释以及未来模型的优化方向)。


案例D:旅游行业游客满意度分析


游客满意度是指游客对旅游地的旅游景观、基础设施、旅游环境和社会服务等方面满足其旅游活动需求的全面评判。因此,游客满意度是最能体现旅游景区旅游服务质量的指标。作为文化型旅游景区,在旅游开发过程中,对其资源合理开发与利用具有一定的特点,保护方面也具有与其他景观不同的特征。研究结果可为景区规划和旅游地环境管理等方面提供一定的科学依据,对促进景区经济更快更好的发展具有重要的社会意义。请根据所提供的数据集(dataD.csv,必要时可补充相关数据),按照案例写作要求,解决如下问题:

1.根据需求设计解决游客满意度分析的整体方案和思路,输出整体方案设计文档(包括但不限于解决思路、算法选择、模型工具选择等的阐述)。

2.给出数据质量评估、数据处理分析和方法以及数据变量特征提取和变量选择分析报告。

3.进行数据处理和特征提取,建立旅游行业的客户满意度分析模型,将测试集数据打上正、中、负的一种情感倾向性标签。

4.给出模型结果评估报告(包括但不限于模型阐述、训练集和测试集数据的模型结果解释、评价指标解释以及未来模型的优化方向)。


获取赛题数据网址:

https://pan.baidu.com/share/init?surl=OP6YaAcTkQBx4Ah1F02gkg(提取码:kvxq