You are on page 1of 6

基于数据挖掘的供应商画像研究综述

马美娟, 潘善亮
( 宁波大学信息科学与工程学院,宁波 315211)

摘要: 随着数据时代的到来和数据挖掘技术的不断发展 ,分析供应商数据对供应商管理者


来说更为重要,通过数据挖掘技术结合供应商画像的理论来对供应商进行全面分析 ,可以为供
应链发展、政府监管部门等各方面提供可靠的数据分析 。 本文首先对当前的供应商画像发展
现状及其构建过程进行总结和分析 ,其次构建基于数据挖掘技术对供应商画像指标体系和建
模框架; 然后基于数据挖掘算法的多准则决策模型和分类预测模型在供应商画像中的研究进
展进行了总结; 最后提出了对供应商画像未来的研究方向 。
关键词: 数据挖掘; 供应商评估选择; 供应商画像; 多准则决策; 供应商指标体系
中图分类号: TP311 文献标识码: A 文章编号: 1003-8329( 2020) 04-0055-06

Research on Supplier Portraits Based on Data Mining


MA Mei-juan, PAN Shan-liang
( Department of Information Science and Technology,Ningbo University,Ningbo 315211,China)

Abstract: With the advent of the era of data and the continuous development of data mining technol-
ogy,data analysis of suppliers for supplier management is more important,through the data mining
technology in combination with a picture of the suppliers of theory to the comprehensive analysis on
the supplier,to supply chain development,government regulators and so on various aspects to pro-
vide reliable data analysis. This paper firstly summarizes and analyzes the current development status
of supplier portrait and its construction process. Secondly,it constructs the index system and model-
ing framework of supplier portrait based on data mining technology. Then the research progress of
multi - criteria decision model and classification prediction model based on data mining algorithm in
supplier portrait is summarized. Finally,the future research direction of supplier portrait is put for-
ward.
Key words: data mining; supplier evaluation and selection; supplier portrait; multi - criteria decision
making; supplier index system

[1]
生产、流通及销售的管理方式 。 其中,供应商管
1 引 言 理是供应链中必不可少的一个环节。 一直以来,供
应商管理的核心是供应商的选择和评估 ,其实现主
供应链管理是集供应商、制造商、分销商、零售 要是对已有的供应商评价信息做挖掘分析 ,研究者
商等各个企业以一定的规则结合在一起的进行产品 大量的工作着重于如何使将专家模糊的评价语言通

* 基金项目 : 浙江省公益性应用研究计划项目 ( 2017C33001) 。


作者简介: 马美娟,硕士生,主研领域: 数据挖掘。

《无线通信技术》2020 年第 4 期 — 55 —
[2 - 6]
过有效的决策方法进行定量分析 。 这并不涉及 行整合,研究者对供应商本身产生的数据并不关心 ,
到供应商本体及其行为数据本身的内容 。随着供应 更多的研究数据来源倾向于专家对供应商的评分信
商市场的不断变化,仅仅分析专家的评价信息已不 息。运用数据挖掘有关决策分析的方法对专家评分
[12,
13]
足以应对供应商的选择评估问题,市场希望能通过 数据进行精确分析,此后不断改进决策方法 ,
[14,
15]
分析供应商的属性及行为数据内容并构建分类及预 在处理 专 家 评 分 语 言 上 也 有 不 少 研 究 进 展 。
测模型去帮助供需双方更好的发展。 为此,研究者 中期在大数据时代兴起之后,供应商数据能够运用
[7,
8]
基于画像技术提出供应商画像的概念 。 供应商 大数据技术进行更好的整合和归纳存储,研究者们
画像是用一连串的标签简短而形象的描述一个供应 意识到对供应商本身产生的数据进行研究得到的客
商的特征,其核心实现是运用机器学习算法建立多 观结果比以往的根据专家评分数据研究得到的主观
[16]
层次指标体系,在指标体系的指导下构建分类预测 结果在供应商的选择评估问题上更高效 。 针对
模型。指标体系比评价信息有着更宽更精准的分析 供应商数据的研究,有学者提出构建供应商画像模
维度,是现有的供应商模型常用的构建方法 。 型,引入机器学习和深度学习的分类预测方法 ,对供
本文以供应商画像和数据挖掘为导向,梳理了 应商数据集进行深度挖掘和分析,这能够得到一个
[17]
供应商画像的发展阶段,对供应商画像模型的构建 客观的选择和评估结果 。 后期在大数据技术成
过程进行了阐述,并对其中涉及到的几种数据挖掘 熟之后,机器学习和深度学习的技术不断发展 ,构建
方法进行了相关介绍,最后提出了数据挖掘下供应 供应商画像所运用到的分类预测方法更加成熟和高
[18]
商画像的未来研究前景。 效,得到的结果也更加精确 。 此时,前期根据专
家评分的方式解决供应商选择评估问题的研究也逐
2 研究现状 渐和机器学习和深度学习结合发展,是供应商选择
评估问题的另一个研究方向。
2. 1 供应商画像发展阶段
供应商画像主要的应用场景是解决供应商选择 2. 2 供应商画像构建方法现状
评估问题。一直以来,供应商的选择评估是依据不 供应商画像,实质是对供应商数据的形象化展
同的评价准则 ( 成本,风险,机会和收益等 ) 进行判 示。图 1 总结了供应商画像的构建过程。 由图可
定,其中挖掘不同的评价标准并依据这些标准对供 知,供应商画像由四个阶段组成,数据收集和数据处
应商分类和评估是供应商画像领域研究的热点问 理可划分为建立供应商模型的准备阶段; 特征工程
题,而引入数据挖掘的相关方法是解决这些问题的 主要是指标体系构建,需要分类模型辅助完成,是供
[9]
最有效途径 。很早以前,有学者提出构建多标准 应商画像构建的核心阶段,其中主要涉及到机器学
决策模型,利用多准则决策模型挖掘分析专家评分 习以及深度学习相关的分类方法
[19]
; 供应商画像的
[10]
的数据集的有效信息,得到最后的评估结果 。 后 应用主要是面向供应商选择评估场景,是供应商画
续也有不少学者通过改进多准则决策模型 ,为了在 像的完成阶段,也是另一个核心阶段,其中涉及到的
专家评分数据集上取得更好的效果。 近年来,有学 分类预测方法也是研究者一直在研究的课题
[20]

者发现,仅仅对专家评分数据集进行分析挖掘 ,并不
能精确的反映供应商的各个方面。 文献[11]提出
对供应商自身产生的数据集进行深度挖掘 ,在供应
商选择评估结果的精确度上能够有一个更好的效
果。此后,利用供应商数据集训练机器学习和深度
学习的分类预测模型成为供应商画像领域的研究方
向。
供应商画像的发展阶段可概括为前期 、中期、和
后期三个阶段,以大数据技术发展时间为界限。 前
期为大数据时代还未兴起之前,供应商数据并未进 图1 供应商画像体系架构

— 56 — 《无线通信技术》2020 年第 4 期
下节主要介绍多准则决策模型和分类预测模型 称为 D - AHP。 显然,它具有更有效地处理 MCDM
在供应商画像背景下的发展现状 。 问题的能力。文献[26]进一步完善了模型融合,使
模型应用在供应商选择和评估问题上更加高效 。
3 关键技术发展

在供应商评估和选择问题中,研究者注重在两
类数据集上进行研究。一是专家对供应商的评分数
据集,二是供应商自身属性和行为数据集。 针对两
个不同特点的数据集,关键技术分为多准则决策模
型和分类预测模型。

3. 1 多准则决策模型
图2 AHP 层次结构图
多准则决策模型是在有限或无限的决策方案中
选择最佳的决策方案。通过决策模型分析专家评分
并构建供应商评价模型,是供应商画像研究的前期
阶段。如何确定标准并整合多位专家的评估已成为
[21]
供应商选择领域中最重要的两个重点 。 有学者
提出运 用 层 次 分 析 法 ( AHP) 解 决 多 准 则 决 策 问
[22]
题 。后续 AHP 模型被广泛应用在供应商选择的
问题上,其主要实现原理如图 2 所示。
AHP 法主要通过构建分层结构解决简单的决
策问题,应对更为复杂的决策问题,ANP 的网络层 图3 ANP 层次结构图
[23]
次结构 比 AHP 的 分 层 结 构 会 有 更 好 的 效 果 。 3. 2 分类预测模型
ANP 图解如图 3 所示。
ANP 虽然有网络层次结构,在解决复杂决策问 预测模型挖掘任务在当前数据上进行归纳,以
[27]
题上有更好的表现,能够根据比较矩阵来表示偏好 便做出预测 。分类预测模型运用在供应商画像
关系。但无法处理细节,即专家语言的不确定性。 的指标体系构建阶段和供应商评价选择阶段 。它的
为此,通过模糊集扩展了层次分析法,在一定程度上 主要工作过程为,将带有标签的处理好的数据用来
发挥了作用,但关于不确定的信息,它仍然显示出低 训练分类器,得到分类模型,然后用该模型对未带标
效的解决结果。 为此,有学者提出 DS 理论,其扩展 签的数据集进行分类和预测。数据挖掘里的分类预
了贝叶斯理论,在解决不确定信息是非常有效和方 测模型包含机器学习和深度学习模型的分类预测算
[24]
便的 。为了完善多准则决策 ( MCDM) 模型,文献 法,算法基于树模型、网络模型、线性模型进行拓展。
[25]中提出了一种基于 D 数的新颖 AHP 方法,也 表 1 罗列了现有的分类预测模型。
表1 分类预测模型以及其优缺点

算法类型 模 型 优 点 缺 点

贝叶斯分类器 速度快; 支持增量式训练 无法处理基于特征组合所产生的变化结果

支持向量机 适合大规模数据 分类过程复杂。


分类
决策树分类器 能够同时处理分类数据和数值数据; 适合小规模数据 不擅长对数值结果进行预测

神经网络 能够处理复杂的非线性函数 没有明确的规则可以遵循

《无线通信技术》2020 年第 4 期 — 57 —
灰色预测 能将无规律原始数据进行生成得到规律较强的生成序列 只适用于中短期的预测,

神经元网络 具有自学习功能 所需的数据量大、计算成本高


预测
时间序列预测 可以预测该时间序列未来值 长期预测的效果不好

马尔科夫预测 适用于随机现象的数学模型 不适宜用于系统中长期预测

不同的算法模型有其不同的特点,根据供应商 则中的 Apriori 算法来对供应商数据进行分析,得出


数据集的特点及最终目的选择合适的算法模型能够 风险事件之间的关联性即潜在风险事件,然后将风
[28]
得到精确的结果。Jiang,Chen,Zhang 和 Pan 提出 险事件以及潜在风险事件通过代入模型中求出当风
了 DEA - SVM 模型,目的是将供应商的效率和绩效 险事件发生时对各种类型服务供应链风险的影响程
分为四类,其分类结果对供应商绩效的评估有更好 度。文献[39]基于 FP - growth 关联规则算法挖掘
的效果。文献[29]针对绿色供应商,提出了一系列 质量、价格、技术、服务、交付能力和企业状况 6 个一
评估指标,并考虑了环境绩效对基于贝叶斯网络进 级指标,为企业构建了一套新的手机配件供应商评
行不确定性事件推理的影响,为零售企业和下游客 价指标体系。
户建立了完整的选择和评估系统。 文献[30]提出 综合以上的应用场景,图 4 归纳了分类预测模
了一种层次分析法和神经网络的混合群决策支持系 型训练得到的供应商指标体系结果 。
统,为供应商选择问题提供群决策支持。 文献[31]
提出了一种基于优化的 xgboost - LMT 模型,即使用
ACROA 算法对 xgboost 框架进行参数寻优,并将基
于反正切 Lasso 惩罚函数的 LMT 算法引入 xgboost
框架作 为 框 架 的 基 分 类 器。 文 献[32]使 用 K -
means 聚类分析法和 Apriori 关联分析法对客户特性
和需求进行识别,描绘出 5 类特性鲜明的购车客户
群体并基于决策树的数据挖掘技术进行了分析 。文
献[33]应用聚类分析中的 K - means 算法对供应商
评价指标分值进行聚类分析。 将供应商进行分类, 图4 供应商画像指标体系
挖掘供应商评价指标分值的分布特点及规律 ,构建 如图 4 可知,指标体系主要在三个维度上进行
适合油田企业的科学、规范、高效的供应商选择体 了细分。履约能力能够准确辨别出供应商履约能力
系。文献[34]也提出运用 k - means 算法计算最近 和质量水平,强化供应以及质量等业务部门对供应
的 k 个供应商,并对算法进行了改进,最后通过该算 商具体能力水平以及历史绩效表现的了解 ; 财务能
法计 算 得 到 供 应 商 指 标 具 有 普 遍 适 用 性。 文 献 力能够判断供应商的资金是否可以维持企业的正常
[35]运用层次分析法并结合现有的供应商选择指 运转,同时对供应商财务的不良行为以及交货及时
标体系和企业的物流需求,首先对现有决策问题建 率进行预判; 技术能力则偏重生产前提,技术和人才
立层次结构模型,构造供应商选择因素的判断矩阵 , 是衡量产品生产质量的决定因素,可以通过该指标
经过一致性检验总结了十个供应商选择评价指标 , 反映供应商的具体能力。
建立了较为科学合理的指标体系。 文献[36]运用
灰色关联分析法对收集到的数据进行处理 、计算、排 4 未来研究方向
序、择优。建立了一个定性定量相结合的综合供应
商评价指标体系。 文献[37]提出了面向产品维护 4. 1 细粒度模型实现供应商画像的全面化
成本与零部件物流成本的备件供应商选择优化模 现有的供应商画像在维度划分方向仍存在粗粒
型,并使用关联规则确定模型中的环境变量同时提 度的情况,如何根据不同的业务场景更有针对性的
出了针对应用问题的关联规则处理策略,以便于对 设计出高效的评价标准,使维度划分的更精准,是未
所发现知识的理解和利用。 文献[38]使用关联规 来亟待解决的一个问题。

— 58 — 《无线通信技术》2020 年第 4 期
4. 2 利用学习模型辅助决策标准生成 2020( 16) : 184 - 186.
[9] William Ho,Xiaowei Xu,Prasanta K. Dey. Multi - crite-
在模型标签化生成过程中,如何改进现有模型
ria decision making approaches for supplier evaluation and
使更自适应并涵盖供应商评估原有的多重标准 ,同 selection: A literature review[J]. European Journal of
时结合专家的打分意见,提高最终的分类结果的准 Operational Research,
2009,
202( 1) .
确度。后期可以在数据集上做一个融合处理,将供 [10] Kannan Govindan,Sivakumar Rajendran,Joseph Sarkis,
应商本身产生的数据和专家评分意见数据做综合考 P. Murugesan. Multi criteria decision making approa-
量。 ches for green supplier evaluation and selection: a litera-
ture review[J]. Journal of Cleaner Production,2015,
5 结束语 98.
[11] 宋斌,刘春辉,赵艳丽,张洪青,基于数据挖掘的电网
供应商画像可以被用来改善传统供应商管理的 企业 战 略 供 应 商 评 价 选 择[J]. 物 流 技 术,2014
选择评估问题。在各项研究工作上证明,供应商画 ( 15) : 444 - 447.
像提供了优于传统供应商管理策略的结果 ,而当前 [12] H. Liao,X. Wu,X. Liang,J. Xu and F. Herrera. A
数据挖掘领域的技术显著提升也为它提供了基础支 New Hesitant Fuzzy Linguistic ORESTE Method for Hy-
持。但供应商画像目前依然存在缺点 ,如数据量少、 brid Multicriteria Decision Making[J]. in IEEE Trans-

搜集困难、标准未统一等,这些缺点阻碍了其在真实 actions on Fuzzy Systems,vol. 26,no. 6,pp. 3793 -


3807, Dec. 2018, doi: 10. 1109 / TFUZZ. 2018.
生产环境下的使用,仍值得进一步研究。
2849368.
[13] Ting Zhu,Li Luo,Huchang Liao,Xinli Zhang,Wenwu
参考文献
Shen. A hybrid multi - criteria decision making model
for elective admission control in a Chinese public hospi-
[1] 王宁,王澍,张江,陶鹏. 大数据背景下融资企业信用
tal[J]. Knowledge - Based Systems,
2019,
173.
2019( 35) : 131 - 132.
特征分析[J]. 经济研究导刊,
[14] He,Z. ,Jiang,W. & Chan,F. T. S. Evidential Sup-
[2] Cooper A. ( 1999) The Inmates are Running the Asylum
plier Selection Based on Interval Data Fusion[EB / OL].
[Z]. In: Arend U. ,Eberleh E. ,Pitschke K. ( eds)
Int. J. Fuzzy Syst. 20,1159 - 1171 ( 2018) . https: / /
Software - Ergonomie '99. Berichte des German Chapter
doi. org /10. 1007 / s40815 - 017 - 0426 - 7.
of the ACM,vol 53. Vieweg + Teubner Verlag,Wiesba- [15] Rukiye Kaya,Barbaros Yet. Building Bayesian networks
den. https: / / doi. org /10. 1007 /978 - 3 - 322 - 99786 - based on DEMATEL for multiple criteria decision prob-
9_1. lems: A supplier selection case study[J]. Expert Sys-
[3] 刘海,卢慧,阮金花,等. 基于" 用户画像" 挖掘的精准 2019,
tems With Applications, 134.
营销细分模型研究[J]. 丝绸, 52( 12) : 37 - 42,
2015, [16] 樊炜,刘延华,杨光昊,陶银. 基于大数据分析技术的
47. 供应商全息 画 像 模 型 分 析 与 应 用[J]. 电 气 时 代,
[4] 吴行惠,王光昕,虞海江,张东,孙呈梅,王剑. 质监大 2019( 11) : 75 - 78.
数据企业画像的研究及应用[J]. 数字通信世界,
2018 [17] 李汐. 大数据驱动的供应商管理策略研究[J]. 科技
( 02) : 204 - 208. 经济导刊, 27( 28) : 245.
2019,
[5] 王庆丰. 基于知识图谱的企业画像技术研究与实现 [18] Jianghong Feng,Zongrong Gong. Integrated linguistic
[D]. 哈尔滨工业大学,
2019. entropy weight method and multi - objective program-
[6] 林海. " 双创" 背景下科技型中小企业创新项目风险评 ming model for supplier selection and order allocation in
估模型构建[J]. 科技管理研究,2019,39 ( 21) : 83 - a circular economy: A case study [J]. Journal of
90. Cleaner Production,
2020,
277.
[7] 蔡承佑,李莹,毛浩地,何真可,李志敏. 基于画像技术 [19] 宋吉昌,郭珊珊,刘春辉,等. 基于主成分加权 TOP -
的僵尸企业分类识别系 统 的 设 计[J]. 信 息 与 电 脑 SIS 法的电网物资供应商评价研究[J]. 物流工程与
( 理论版) , 32( 10) : 109 - 110.
2020, 2016( 6) : 150 - 153.
管理,
[8] 白旭飞,线江南,单强,孙圆. 基于知识图谱的供应商 [20] 魏茂胜. 数据挖掘中的分类算法综述[J]. 网络安全
360 度全息画像场景应用[J]. 电子技术与软件工程, 2017( 06) : 65 - 66.
技术与应用,

《无线通信技术》2020 年第 4 期 — 59 —
[21] 万欣,赵书广,邢哲骞,孙榕池. 基于层次分析法的供 [29] 林勇,马士华,供应链管理环境下供应商的综合评价
应商选择策略研究[J]. 辽宁工业大学学报( 自然科 2000( 5) : 30 - 32.
选择研究[J]. 物流技术,
学版) , 40( 04) : 268 - 270.
2020, [30] 汪宏. 供应链管理下制造业供应商选择的研究[D].
[22] Wu Chia Huei,Tsai Sang Bing. Using DEMATEL - 南宁: 广西大学,
2007: 42 - 46.
Based ANP Model to Measure the Successful Factors of [31] 樊鹏. 基于优化的 xgboost - LMT 模型的供应商信用
E - Commerce[J]. Journal of Global Information Man- 评价研究[D]. 广东工业大学,
2016.
agement ( JGIM) ,
2018,
26( 1) . [32] 李燕仪. 基于数据挖掘方法的汽车客户画像分析及
[23] He - Yau Kang,Amy H. I. Lee,C. - Y. Yang. A fuzzy 流失客户预测[D]. 华南理工大学,
2017.
ANP model for supplier selection as applied to IC packa- [33] 李春生,张岩. 基于数据挖掘的油田企业供应商选择
ging[J]. Journal of Intelligent Manufacturing,2012,23 [J]. 计算机技术与发展, 30( 03) : 137 - 141.
2020,
( 5) . [34] Viswanath Nagarajan,Baruch Schieber,Hadas Shachnai.
[24] Yucheng Dong,Weijun Xu,Weidong Xu. An automatic The Euclidean k - Supplier Problem[J]. Mathematics of
method to reach consensus in a local context for AHP 2020,
Operations Research, 45( 1) .
group decision making[J]. European J. of Industrial [35] Y. ZHANG,Y. LV,L. TU and Y. HOU. Intelligent
Engineering,
2013,
7( 4) . Logistics Supplier Selection Based On Improved Agglom-
[25] Xinyang Deng,Yong Hu,Yong Deng,Sankaran Mahade- erative Hierarchical Clustering Algorithm [C]. 2019
van. Supplier selection using AHP methodology extend- IEEE 17th International Conference on Industrial Infor-
ed by D numbers[J]. Expert Systems With Applica- matics ( INDIN) ,Helsinki,Finland,2019,pp. 1309
tions,
2014,
41( 1) . - 1314,doi: 10. 1109 / INDIN41052. 2019. 8972146.
[26] Liguo Fei,Yong Deng,Yong Hu. DS - VIKOR: A New [36] 薛振飞. 基于因子分析法 - 灰色关联分析法的供应
Multi - criteria Decision - Making Method for Supplier 商评价研究[J]. 科技资讯, 18( 01) : 189 - 190.
2020,
Selection[J]. Liguo Fei; Yong Deng; Yong Hu,
2019,
21 [37] 倪旻,徐晓飞,邓胜春. 基于关联规则的零部件供应
( 1) . 商选择优化[J]. 计算机集成制造系统 - CIMS,
2004
[27] 梁辰,陈明浩. 数据挖掘 ID3 分类算法研究综述[J]. ( 03) : 317 - 321 + 335.
2015( 05) : 26 - 28.
信息通信, [38] 覃钟槺. 基于 Apriori 关联规则算法的服务供应链风
[28] Ge Wang,Samuel H. Huang,John P. Dismukes. Prod- 险预测研究[D]. 广西民族大学,
2017.
uct - driven supply chain selection using integrated multi [39] 贾慧敏. 基于数据挖掘的手机配件供应商的评价研
- criteria decision - making methodology[J]. Interna- 究[D]. 昆明理工大学,
2016.
tional Journal of Production Economics,
2004,
91( 1) . ( 收稿日期: 2020-10-15)

檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽檽

( 上接第 54 页)
1335 - 1338. Effects of Meandering on Dipole Antenna Resonant Fre-
[9] I. J. Lukas,Xianming Qing,Zhi Ning Chen and A. Al- quency[J]. Journal of IEEE Antennas and Wireless
phones. UHF omnidirectional bent dipole antenna for item 11( 27) : 122 - 125.
Propagation Letters,2012,
- level RFID applications[J]. Journal of IEEE Antennas [12] V. Pillai. Impedance Matching in RFID Tags to Which
and Propagation Society International Symposium,2008: Impedance to Match[C]. 2006 IEEE Antennas and
1 - 4. Propagation Society International Symposium,Albuquer-
[10] 胡中皓,张麟兮,郭斌. 弯折线偶极子射频识别标签 que,NM,2006: 3505 - 3508.
天线设计方法研究[J]. 计算机仿真, 28( 01) :
2011, [13] 杜晓阳,闻扬,金根顺. RFID 系统中的阻抗匹配技术
162 - 165. 研究[J]. 控制工程, 21( S1) : 67 - 69.
2014,
[11] O. O. Olaode,W. D. Palmer and W. T. Joines. ( 收稿日期: 2020-08-25)

— 60 — 《无线通信技术》2020 年第 4 期

You might also like