供应链与运营管理学会-杉数科技实践驱动研究竞赛

举办方:微信图片_20220525174327.png   微信图片_20220525174332.png

奖金:-                                                                                 截止时间:2023-07-31

介绍

供应链与运营管理学会(简称为ISCOM)是全国管理科学与工程学会下的二级分会,于2018年10月正式成立。学会的宗旨是为中国供应链与运营管理领域的学术界和工业界、建设一个最好的学术交流平台。学会的会训是联合、奋发、成就。ISCOM关注供应链和运营管理领域的顶尖前沿研究,旨在为供应链管理、运营管理研究领域的各位专家学者、业界人士及相关政府机构打造交流与合作的平台。

杉数科技致力于利用运筹学和机器学习等前沿技术将企业的实际问题转化为数学模型求解,在杉数优化求解器(COPT)的驱动下,解决生产、仓储、配送、销售等一系列场景中的优化问题,实现数据驱动的人工智能决策。合作方包括顺丰、京东、德邦、中外运、滴滴、中国商飞、百威、宝洁等在内的诸多标杆企业。

本次研究竞赛由ISCOM和杉数科技联合举办,旨在为供应链管理、运营管理研究领域的学者、研究生提供实业界供应链管理的实际场景和数据,构建产学研融合的桥梁。

竞赛中,杉数科技提供了一家大型饮料供应商的数据。该公司提供多种饮品从生产到配送的一体化业务。公司自建有生产工厂和DC仓库(Distribution Center,发运中心),通过公司管理的供应链网络,满足不同地区的产品需求。近年来,随着新冠疫情的肆虐,需求波动进一步加剧,从而对公司的生产、运营和管理提出了更高的挑战。因此公司想要构建其智慧供应链体系,用更高效、更科学的方式管理生产、库存和运输,从而降低运营成本、提高组织工作效率和服务满足率、适应更具挑战的新零售环境,推动公司业务更好地成长。

本次公开的数据来自于公司在某地区的供应链网络结构和销售情况。公司在该地区有2个生产工厂和18个DC仓库,销售77种不同细分子类商品,包含88万余条历史销售数据、10万余条运输提前期数据,和工厂、DC和运输相关信息。出于公司战略隐私的需要,介绍中隐去了公司的具体信息,所有数据都经过了脱敏和匿名处理,但数据结构仍能够代表公司的整体业务运行情况。更详细的数据介绍可以参见数据介绍。

比赛规则

1.比赛时间为2022年7月1日至2023年7月31日

2.比赛欢迎供应链管理、运营管理研究领域的广大师生参加。此次竞赛提供的数据仅供领域内学者在竞赛期间撰写学术论文使用。参赛者必须首先将论文投稿至竞赛主办方,在竞赛期结束后,参赛者可以自行选择期刊将投稿参赛论文。

3.参与者应遵守数据保密协议,包括但不局限于:不得私自传播数据,不得将竞赛数据用于撰写学术论文以外的其它用途。

参与与提交

此次竞赛的最终成果为学术论文,希望参与者基于提供的背景与数据自主探究、提炼并解决问题,期待此次竞赛能够涌现出一批具有行业洞见的实践驱动文章。

参与竞赛的论文,需在论文的适当位置注明数据由供应链与运营管理研究会-杉数科技实践驱动研究竞赛提供。

参与竞赛的师生,请于2023年5月31日前将论文(中、英文论文均可)的电子版提交到邮箱:ISCOM_DataContest@163.com。论文没有特定的格式要求。但由于论文将采用双盲的方式进行评选,提交的论文中需要隐去与本文作者有关的信息,同时请在提交邮件中列出作者信息(或提交一个单独的文件说明作者信息)。

结果评选

供应链与运营管理学会与杉数科技的技术专家将组成评审委员会,此次竞赛的结果将由该评审委员会进行评审,最终的评判标准包括论文的实践驱动性、创新性、独立性、严谨性和启发性。

本次竞赛的获奖结果,将在供应链与运营管理学会2023年的年会(上海财经大学信息管理与工程学院承办)公布并举行颁奖仪式。

本次竞赛设有两类奖项:优秀论文奖和杉数COPT优秀论文奖。其中,第二类奖项只针对论文中声明使用了杉数COPT求解器的参赛论文。因此,参赛者在提交论文时,请注明是否使用了杉数COPT求解器。

设置的奖项及名额如下:

优秀论文奖:一等奖1名,奖金5000;二等奖2名,奖金3000;参与奖3名,奖金1000。

杉数COPT优秀论文奖:一等奖1名,奖金6000;二等奖2名,奖金4000。

除奖金外,获奖的中文论文将被推荐到《管理工程学报》,进行快速评审。

赞助支持

本次竞赛的数据与奖金由杉数科技提供。《管理工程学报》为本次竞赛的获奖论文提供快速评审通道。

杉数基于公司的运筹与智能决策教学平台(CORIDM),为参赛者免费提供基于Python的数据分析平台以及杉数COPT求解器的算力资源,让参赛者更方便地进行数据分析与建模。参赛者可以发邮件至:sales@shanshu.ai (抄送:yang.chaolin@sufe.edu.cn )进行账号申请,邮件标题:ISCOM论文竞赛-CORIDM申请。

在论文撰写过程中,使用了杉数COPT求解器的参赛者需在论文中相应的部分声明使用,以参与杉数COPT优秀论文奖项的评选。除了通过CORIDM教学平台,参赛者亦可以到杉数科技官网,在官网右上角点击“衫数数学求解器 -- 衫数求解器COPT”自行下载、安装使用COPT。

CORIDM(全称Center for Operation Research and Intelligent Decision Making)是杉数科技推出的运筹与智能决策的案例教学平台,集成了多个经典运筹学问题以及多个行业多个领域的真实案例,并且提供一站式的Jupyter Notebook编程环境,旨在为教授和学生带来“理论结合实践”的案例教学/学习体验。

  • 内嵌Python编程/COPT/运筹优化等基础知识介绍。用户可以在平台中学习各种基础知识,为解决工业界的实际问题做充足的准备;

  • 汇聚零售、消费、制造、物流、航空等多个行业的智能决策案例。对于每个案例,平台提供了详细的案例介绍、解决方法和数学模型、实现代码、总结拓展等,提供了充足的学习资源,能够让学习者充分掌握每个案例的内容和思想;

  • 提供开箱即用的Jupyter Notebook编程环境。所需的Python第三方包包括COPT求解器已经部署完成,用户不需要自行安装任何软件即可运行代码。


问题描述

X公司是一家大型饮料供应商,提供多种饮品从生产到配送的一体化业务。公司自建有生产工厂和DC仓库(Distribution Center,发运中心),通过公司管理的供应链网络,满足不同地区的产品需求。本次公开的数据来自于其一类产品在某地区的供应仓网结构和销售情况,公司在该地区有2个相应的生产工厂和18个DC仓库,销售77种不同细分子类商品。

sc chain.png

在业务中,每一种细分子类产品(Stock Keeping Unit,SKU)是库存管理中的最小可用单元。不同种类、包装、容量的商品,均对应不同的SKU,比如同品牌的听装和罐装饮料便属于不同的SKU。

在物流供应环节中,DC是一处物流结点,存放现货库存,为下游经销商、零售商、客户提供配送服务。各个DC每天需要对仓库的库存进行盘点并制定补货计划、从工厂补货。在DC下好补货订单后,需要经过一段时间的等待,即补货提前期后,才能收到所订货物。由于工厂生产和物流运输过程中均可能出现延期,补货提前期具有不确定性。公司收到来自下游客户(电商平台/超市/餐厅等)的订单后,会根据DC和客户的履约对应关系,用DC的现货满足客户需求。当DC库存不足时则出现缺货,这会给公司带来一定的收益损失。公司的工厂和各个DC均设有储存仓库,但仓库的容量是有限的。

在生产和运输过程中,公司也面临着众多运营层面的约束。出于生产方面的考虑,工厂生产线需要一直运行,因此存在每日最低产量;同时,由于人工和时间限制,日产量亦存在上限。每个工厂每日未能发出的产品将暂时储存在工厂仓库,而工厂每日的发货量不能超过该日的生产量加上之前的库存量;超出该工厂发货量的订单将从另一个工厂调拨,超出两工厂发货总量的订单需要等待排期。同时,产品在工厂内按箱存放、通过托车运输,因此工厂要求DC补货的最小单元是箱。而从工厂发往DC的过程中,需要经过人工拣选、装车、道路运输三个环节,因此每天可运输的总量是有上限的。

受益于餐饮业的不断扩张,对于各类饮料产品的消费需求显著抬升,尤其是在特定时间、特定场合下对现货的需求。这些现货渠道的需求受到很多随机因素和突发事件的影响,比如线下店庆活动、大型竞技比赛举办、传统节日聚餐等,这极大地加剧了需求的不确定性。近年来,随着新冠疫情的肆虐,筹备中的大小型活动都面临着突然取消的风险,这进一步加剧了饮料需求的波动,从而对准确的需求预测和稳健的库存管理都提出了更高的要求和挑战。

因此,公司想要构建其智慧供应链体系,用更高效、更科学的方式管理生产、库存和运输,从而降低运营成本、提高组织工作效率和服务满足率、适应更具挑战的新零售环境,推动公司业务更好地成长。

数据描述

在本节,我们将详细介绍本次公开的数据集。出于公司战略隐私的需要,公司的实际信息,以及原始数据中的敏感信息,比如产品名称等,将会被隐去,并以唯一标识码替代,并不影响会数据结构和后续分析。

历史销售数据

历史销售数据(sales_data.csv)由72个SKU商品在18个DC仓库的销售数据构成。该数据集包含了从2018年1月1日到2020年7月30日每个DC*SKU组合的日销售信息,共有1080个不重复的DC∗SKU组合共83余万条记录。历史销售数据的字段含义及数据样例如下所示:

数据字段名称字段含义格式样例





date销售日期日期2018-01-01
dc_id仓库ID字符DC002
sku_id商品ID字符SKU047
idxDC*SKU组合ID字符DC002_SKU047
sale销量(箱)整数2751

我们选择SKU008考察需求的总体分布情况。我们分别绘制了日度和周度总销量的直方图,可以看到,在真实的业务场景下,需求分布距离正态分布差距较大。同时,产品的日度销量分布比周度销量分布更加不均匀,在较小的数值大量集中。结合销量分布的长尾性,不难看出这种产品日度销量会出现较高的波动性。


daily sales of SKU008.png

weekly sales of SKU008.png

我们选取SKU001和SKU002,用历史日销量数据绘制出每日销量的波动图如下。横轴表示销售日期,取值范围在2018年1月1日-2020年7月30日之间,纵轴表示历史销量。橙色和蓝色分别表示SKU001和SKU002每日销量情况。可以看出SKU001的绝对销量较小,SKU002的绝对销量更高,但两种产品的销量波动都较为剧烈,其日度销量经常出现短期内突然升高的情况。

sales comparison.png

历史提前期数据

历史提前期数据(leadtime_data.csv)包含了1080个DC*SKU组合从2019年1月到2019年3月间补货提前期信息,共计96120条记录。历史提前期数据的字段含义及数据样例如下所示:

数据字段名称字段含义格式样例





date补货日期日期2019-01-01
idxDC*SKU组合ID字符DC001_SKU009
leadtime提前期(天)整数6

我们考察所有产品历史提前期的总体分布。一般来说,产品进行补货的提前期小于4天,但也有一定的概率出现提前期超过一周的情况。

leadtime.png

我们选取DC001中的SKU002和SKU010,考察其历史提前期波动性。横轴表示历史补货日期,取值范围在2019年1月1日-2019年3月31日之间,纵轴表示每次补货的提前期天数。可以看出实际供应提前期存在较大的波动性,当供应商在生产或运输过程中出现紧急情况导致延期交货时,提前期会明显高于历史均值,例如会出现提前期为8天的情况。长时间不到货导致现货库存无法及时补充,这会大大影响下游的销售,严重的情况下甚至会导致顾客大量流失,损害顾客忠诚度和品牌信誉。

leadtime comparison.png

工厂信息

工厂发送上下限 (push_limit.csv)给出了工厂每日发货量的最小和最多发货量,其字段含义及数据样例如下所示:

数据字段名称字段含义数据类型样例





factory_id工厂ID字符串F001
push_lb发送下限(10L)数值159000
push_ub发送上限(10L)数值161000

由于一些生产考虑,工厂的产线需要一直运行、不断生产,但工厂自身的库容存在容量限制,因此需要保证每天向外发运一定量以上的产品,以保证工厂不会爆仓。同时,要将产品从工厂发到DC,首先需要工厂里的工作人员将产品从工厂仓库中拣出来,装运到卡车上,再通过承运商运到DC(每个工厂有各自负责运输的承运商)。工作人员的拣货能力、装运能力,以及承运商的车队资源都是有限的,因此每个工厂每日的发货量存在上限。

工厂原有库存 (factory _inventory.csv)给出了两个工厂中各个SKU的起始库存,其字段含义及数据样例如下所示:

数据字段名称字段含义数据类型样例





factory_id商品所在工厂ID字符串F001
sku_id商品ID字符串SKU001
available_inv工厂可用库存(箱)整数1020

工厂每日会按照生产计划生产,每日发出量既不能超过当日产量加上结余库存(即当日总库存),也不能超过每日的发送上限。当工厂库存不足时,各个DC就需要考虑去其它更远的工厂补货。面对超出库存量的订单需求,工厂需要考虑有限库存在不同DC之间的分配。

DC数据

DC可用容量(dc_capacity.csv)给出了各个DC的仓储容量上限,其字段含义及数据样例如下所示:

数据字段名称字段含义数据类型样例





dc_id仓库ID字符串DC001
capacityDC可用容量(10L)数值181978.71

DC每天完成补货并满足下游客户的需求后,仓库内的剩余产品容量不能超过DC库容,否则DC无法储存产品。在旺季时,DC可能会出现爆仓现象,即产品总体需求大大超出了仓储限制,此时,DC需要考虑如何在不同的SKU之间分配有限的库容容量。

DC原有库存(dc_inventory.csv)记录了每个DC种各SKU的起始库存量,其字段含义及数据样例如下所示:

数据字段名称字段含义数据类型样例





dc_id仓库ID字符串DC001
sku_id商品ID字符串SKU001
available_invDC 原有库存(箱)整数109

我们选取SKU001在各个DC的原有库存数据绘制直方图如下,该图横轴表示SKU001库存大于零的DC仓库,纵轴表示产品SKU001在各DC中的原有库存量。从图中可以看出各个DC当前持有SKU001的库存水平存在一定差异,在进行补货决策时需要综合考虑各个DC的当前库存水平与目标库存水平之间的差异,将工厂库存合理分配给各个DC。

dc_inventory.png

运输信息

单箱运输费用 (transport_tariff.csv)给出了从两个工厂到各个DC的单箱运输费用,其字段含义及数据样例如下所示:

数据字段名称字段含义数据类型样例





factory_id工厂ID字符串F001
dc_idc仓库ID字符串DC001
unit_cost单箱运输成本(元)数值224

运输成本是公司补货中的主要成本,每个DC都可以从任何一个工厂补货,但是由于距离远近,不同工厂到DC会有成本差距。很显然,DC希望尽量能够从运输成本更低的工厂补货,除非是优先工厂库存不足,再考虑从非优先工厂补货。

工厂F001和F002到DC001-DC006的单箱运输费用数据对比如下,该图横轴表示6个DC仓库,纵轴表示工厂运输到每个DC仓库的单箱费用,两种颜色分别表示工厂F001和F002。从图中可以看出两个工厂向各个DC发货的运输费用具有很大差异,从F002工厂发货的运输费用基本是从F001工厂发货的1.5倍,因此DC选择从哪个工厂进行补货的决策会对整体运输成本产生很大影响。

transport_tariff.png

转化率(unit_rate.csv)给出了产品运输过程种不同计量单位的转换率,即箱、托和升之间的关系,其字段含义及数据样例如下所示:

数据字段名称字段含义数据类型样例





sku_id商品ID字符串SKU001
pt_box一托所含箱数整数80
box_volume单箱体积(10L)数值0.852

工厂内产品生产和原始储存是以升为单元,而DC进行储藏和销售时,则往往会选择箱作为计量单位;从拣货和运输的角度来看,则是按照托盘来操作更加方便。在这个过程中,便涉及到各个产品在不同计量之间的转换。需要注意的是,工厂要求DC补货的最小单元是托,不同饮料一托的瓶数会有所不同,DC进行补货时必须进行整托补货,这对于DC补货决策也进一步做出了限制。

开放性问题

我们积极欢迎供应链管理、运营管理的广大学者,基于本次开放的数据集进行开放性研究,可能跟本数据集相关的领域有:端到端供应链管理、网络中的库存布局优化、数据驱动研究、智能优化算法等,我们亦欢迎研究者利用本数据集支持其它领域的研究。

就公司实际运营的角度,公司比较关注的问题有如下几个方面:

1.需求预测问题

由于销售市场的激烈竞争,准确的需求预测对公司利润和市场地位能够起到显著的推动作用。面对随机性较高、波动较大的需求时,如何利用历史信息做出较好的需求预测?当需求预测服务于具体的库存管理场景时,应该如何改进对需求预测的手段,以使其更好地服务于后续的运营环节

2.安全库存问题

面对需求不确定性时,储备安全库存是一种常用手段。如果安全库存储备过少,可能导致频繁的补货调拨行为;同时,由于工厂产能有限,在销售旺季可能会面对与其他订单冲突而被迫延长等待时间的问题。但如果安全库存储备过多,DC又可能无法及时将某一产品全部售出,进而影响其后续对其他产品的补货和销售。公司应该如何选择合适的安全库存,如何制定安全库存策略?

3.补货策略

在该问题中,公司在供应端的补货问题面临较多约束。除基本的工厂库存、DC库存、排期等因素外,由于工厂的生产线需要不断运行,因此需要保证每天向外发运一定量以上的产品才能保证工厂不会爆仓;同时,由于产品往往以整托进行储藏、以车进行运输,导致DC无法提出连续的补货请求,经常会面临公司为满足运输时的整托约束而过量补货的情况。这样的实际约束对于补货策略的建模、优化和求解都提出了新的挑战,在这样的场景下,DC应该采取什么样的补货策略?

4.工厂排期

在旺季时,总体的需求数量往往超过工厂的产能上限,在这种时期,工厂应该如何处理订单顺序、最高效地分配有限产能?而在淡季,工厂又需要维持产线运行、不断地向外发运订单,当供应大于需求时,又该如何安排生产和发运,减少不必要的浪费、实现最大的产能—销量转换?

数据下载

汇总打包下载