三分钟带你看完第一届统计学青年学者与产业论坛

12月7日,第一届(2019)统计学青年学者与产业论坛在北京圆满举行,腾云大学(TalkingData University)执行校长杨慧博士应邀出席并向各位来宾分享了腾云大学在数据人才培养方面的理念及经验。

论坛上还有来自学界和业界的多位专家带来的精彩分享,以下是转载自北大光华的各报告精华摘录。

以下为原文:

2019年12月7日,节逢大雪,仲冬伊始,由全国工业统计学教学研究会青年统计学家协会主办,北京大学光华管理学院承办的“第一届(2019)统计学青年学者与产业论坛”在燕园顺利举行。

本届论坛由全国工业统计学教学研究会青年统计学家协会副秘书长、光华校友赵琬迪教授主持,共计报告7篇,来自中国科学院、厦门大学、中央财经大学的多位获得国家杰出青年科学基金和国家优秀青年科学基金的专家学者,以及来自美团点评、腾云大学、金风科技与浩鲸科技等多家国内外知名数据科学产业企业的相关负责人就数据分析方法、人工智能数据挖掘等方面的数据应用在会上进行了分享与讨论。

论坛会场

京大学光华管理学院商务统计与经济计量系系主任、全国工业统计学教学研究会青年统计学家协会会长王汉生教授为论坛致辞。 王汉生教授首先表达了对与会学者的欢迎与对本次论坛的期待。 他表示,好的问题往往来自产业研究,统计学科的整体发展与产业的发展密切相关,希望通过本次论坛为数据科学产业与统计学及相关学科的青年学者搭建交流合作平台,进一步加强统计学以及相关数据学科同数据产业的交叉融合,促进学界研究成果在数据产业需求中的运用,共同助益我国数据产业的未来发展。

数据的价值就是核心业务需求。

——王汉生 

主题报告

No.1 模型不确定性和模型平均方法

“在分析数据时要考虑模型不确定性,更好地践行数据的商业价值。

                                 ——张新雨 

中国科学院数学与系统科学研究院系统科学研究所研究员张新雨教授首先做出了题为“模型不确定性和模型平均方法”的报告。 张新雨教授指出,在实际问题建模中,通常会面临多个备选模型但又无法确定使用哪个模型的困境,这就是模型上的不确定性。 模型的不确定性主要来源于三个方面: 理论不确定性、异质性不确定性、以及函数形式的不确定性。 在统计分析中忽视模型的不确定性会导致信息遗失和不稳健预测,造成预测失效,从而决策失误。

而模型平均方法则是处理模型不确定性的主要方法之一。 通过对来自不同模型的估计进行加权平均,得到一个更优的估计。 张新雨教授重点介绍了频率模型平均和贝叶斯模型平均两种平均方法,并对频率模型平均中的权重确定以及统计推断问题进行了深入解读。 以模型平均在全国航空客运的需求预测与旅游业影响两个案例中的应用为例,张新雨教授表明由于存在理论和供给无效(supply inefficient)服从分布的不确定性,需要使用模型平均方法进行分析。 结果表明基于模型平均得到的预测效果要优于ARMA、BPNN等其他模型。

最后,张新雨教授就模型平均方法和人工智能的结合做出补充,并引用英国伟大的统计大师乔治·伯克斯(George E. P. Box)的名言“本质上说,所有模型都是错误的,但有些是有用的。 ”希望透过模型平均方法的应用,对数据分析有所助益。

No. 2 在线人才招聘市场的智能匹配和数据挖掘

统计学是人工智能不可分割的一部分。

——钟威

接着来自厦门大学王亚南经济研究院和经济学院统计系钟威教授做了题为“在线人才招聘市场的智能匹配和数据挖掘”的报告。 钟威教授针对当前人才招聘市场中存在的人才流失、信息不对称、缺乏效率等缺陷,结合了业界和学术界相关研究,希望建立一个人才智能推荐系统,为市场提供智能的人才推荐,实现自动推荐,数据驱动与方便维护。

钟威教授所提出的的智能匹配系统立足于人性化思考,通过机器语言编译,实现简历筛选的智能化。 在精选过程中钟威教授与其团队基于51job上的数据进行了模型检验,构建了absolute distribution difference指标,用于刻画简历中词语的重要性。

通过多组案例展示如何使用Word2Vec统计模型实现多个维度进行匹配,透过加权评分计算个人简历与招聘信息的匹配度,从而实现岗位配对。 基于该实践项目,钟威教授进一步进行了薪资数据挖掘。 研究薪资和技能的潜在关系有助于提升技能的回报率,指导人才培养机构进行人才培养。

No.3 数据分析在智慧供热中的应用

“一切解决问题的思路都来源于我们对业务的深刻理解。

——李季

来自中央财经大学商学院市场营销系的李季教授做了题为“数据分析在智慧供热中的应用”的报告。 李季教授提到当前市场营销人才培养面临的困惑,认为随着大数据时代的到来,在数据分析技能加持下的大数据营销专业得以崛起。 随后,她分享了数据分析在供热这样一个传统行业中的应用研究。

本着数据分析围绕业务需求的原则,李季教授的团队深入走访供热企业,了解到供热企业最核心的业务需求并不仅仅是提高收入、控制成本,还有降低投诉率。 基于此,研究团队认为终端用户数据具有数据量大,种类多,实时采集的特点,因此对于业务目标的实现具有更大的价值。 李季教授与其团队对济南某智慧供热试点项目的供热数据进行建模分析,主要基于户型数据、户外数据、供热数据和邻居数据建立了用户室温预测模型、供水温度以及热耗预测模型。 在深入分析业务场景的过程中,发现用户网络特征,即周围邻居的供暖数据对核心用户的影响是非常巨大的。 在数据分析的支持下,该试点项目的供热水力平衡问题得到明显改善,节约能源方面也取得不错的效果。

李季老师的分享结合了传统行业和数据分析。 一切解决问题的思路都来源于我们对业务的深刻理解,在细致展示数据分析产生价值过程的同时,带给大家很多启发和思考。

No.4 数据赋能 美观大数据应用实践分享

透过现象看本质——没有大数据,只有数据”

——曹国骏

来自美团资深总监、用户平台商业分析负责人曹国骏先生首先带来“美团大数据应用实践分享”。 作为中国最大的互联网+生活服务平台,美团点评构建了覆盖“吃、住、行、游、购、玩”的全域服务生态,在此基础上,围绕“用户+商户”双核,美团点评形成了包括海量用户消费交易数据、点评UGC数据和商户数据的大数据资产库。 通过提供对外数据服务,美团点评实现了对政府、企业、商户和用户的数据赋能,达成社会效益和经济效益的“双赢”。 曹国骏先生通过美团在外卖、配送、酒旅三个方面的商业分析应用为例,剖析了在美团发展过程中数据的重要价值。

大数据的分析应用,为美团在线上发展、数字化营销、产品合作、系统融合等提供决策依据; 基于场景的用户精准画像增强用户体验,使大数据全面渗透至美团配送业务全流程多场景中; 同时动态地优化基础网络,从而保证配送业务中运力需求的动态平衡。

No.5 新工科背景下商科学生的数据分析培养

“我们致力于培养从事数据业务的核心技术人才。

——杨慧

腾云大学的执行校长杨慧博士为论坛带来了“新工科背景下商科学生的数据分析培养”报告。 杨慧博士指出,在新工科背景下,各行各业纷纷进行数字化转型,在这些行业转型的背后,是从事数据业务核心技术人才的巨大缺口。 如何对接高校资源和业界信息,如何帮助数据行业更多地培养创造高质量的商业价值的人才,是目前数据行业的重要问题。

腾云大学致力于专业数据人才培养,通过教育培训引入数据人才,推动生态中的人才转化与提升,提供人才服务。 杨慧博士以腾云大学与中国人民大学商学院产学研三位一体合作,向人大商学院本科、MBA 输出项目,培养杰出的商业数据分析师为例,介绍了腾云大学的人才培养模式。 腾云大学的数据人才培养项目在于高效地利用学生的碎片化时间,采用数据科学导师+行业导师双师制培养模式,提供基于真实案例与真实生产环境脱敏数据集的实战训练,配合社群激励制度,培养杰出商业数据分析师。 最后,杨慧博士提到,复合交叉型人才离不开高校和业界的共同努力,希望能够集结包括企业与高校在内的各方力量,推动专业数据人才教育的发展,培养出更多符合时代要求、符合行业需求的人才,从而赋能整个数据行业的发展。

No.6 基于备件分类的风机库存策略研究

“数据从业务中来回到业务中去。

——严斌

来自北京金风科创风电设备有限公司服务技术部管理数字化团队的负责人严斌先生为论坛带来了题为“基于备件分类的风机库存策略研究”的报告。 金风科技作为目前国内最大的风力发电机组整机制造商,制定合理的风机备件供应与库存策略对于平价上网背景下的风电企业尤为重要。 严斌先生通过风机库存的案例,对于备件如何分类、该制定怎样的存储策略,并结合自己的工作经验,做了精彩的分享。

对于备件分类,严斌先生表示可以从备件的本身属性和所处的环境两个方面考虑。 备件本身拥有一定的寿命与维修可行性,当备件出现故障时,需要停机进行处理,此时就会产生运输成本、维护成本等,如果不知道其属性就无法快速提供备件,从而造成成本上的浪费。 同样备件本身的属性也会影响发电量收益。 另一方面,备件所处的环境也需要考虑,如是否限电、风速、季节等因素都会直接影响到收益。 综合这两个方面的考虑,以定性与定量两种方式对备件进行分类,并制定相应的库存策略,最后根据三个同一配置项目的优化结果进行对比,发现库存金额明显下降,同时发电量获得了提升。 严斌先生总结,业务需求决定了策略,只有根据业务的属性决定相应的库存策略,才能在节约成本的同时为客户带来更多的发电量收益。

No.7 人工智能在运营商企业的应用

“在数据质量和算力都受限的情况下,优选出最佳算法,实现特定场景下的效果最大化。

——李百成

论坛最后,浩鲸科技大数据产品线AI团队的负责人李百成先生为论坛带来题为“人工智能在运营商企业的应用”报告。 浩鲸科技是阿里巴巴和中兴通讯共同投资的一家基于云计算、大数据、人工智能技术驱动的数据智能科技公司。 李百成先生表示,在面向行业在现阶段所面临的挑战(小场景、人才短缺、工程化 落地、可持续优化等问题),浩鲸科技希望能建立一个平台提供预处理工作,降低企业实现数字化的门槛,让AI成为行业人工智能的底座,赋能企业生产属于自己的AI。

李百成先生以运营商行业为例,分别从精确管理、精准营销、精细服务、精益运维四个方面分享了浩鲸科技在人工智能方面的实践。 在精确管理方面,提升投资的精准性; 实现精准的人力资源配置和管理; 进而实现营业风险的可控性。 比如人工稽核耗人力且效率低,工作量大且费用高; 而营业稽核采用实名制稽核,可以提升效率、节约成本。 在精确营销方面,应用AI技术改变千篇一律的营销模式,实现精准客户画像识别,并针对客户群体进行推荐,从贡献、活跃、增长三个维度来评价客户价值,构建用户价值行为宽表,进行客户价值评分及分值划分,从而提升潜在优质客户的价值。 在精细服务方面,以智能装维为例,无源设备的维护非常依赖人工,效率低本高,而基于AI的技术,可以通过对结构化的图片进行识别,从而实现智能装维。 在精益运维方面,主要以异常检测为例,随着运维规模逐步增大,监控指标爆发式增长,通过人工设立合理告警阈值的配置成本极高、效率低; 通过AI算法进行自动异常检测可以增加效率,保证准确率,其中异常检测有两种途径: 一步到位(端到端分类)和分布求解(回归+异常判别)。

我来评几句
登录后评论

已发表评论数()

相关站点

热门文章