Professional Documents
Culture Documents
基于近邻传播聚类的地铁运营时段划分 王文宪
基于近邻传播聚类的地铁运营时段划分 王文宪
基于近邻传播聚类的地铁运营时段划分
王文宪 , 肖 蒙 , 成琳娜 , 杜延帅 , 倪少权
1 1 1 2 3
摘 要: 地铁在每天不同时段客流量差异较大,运营时段的科学划分,是低峰与高峰列车运行计划合理交替的前
提。目前地铁运营时段划分主要依据人工经验,主观性强且难以保证精度。以 10min 为时间间隔,把全天运营时
间 6∶ 00 ~ 23∶ 00 分为 102 个时间点样本,将地铁沿线各车站每个时间点的进站客流量作为样本描述变量。采用近
邻传播聚类算法将各时间点归并为不同类别,并引入 CH、Hart 以及 IGP 等聚类有效性评估指标对聚类结果加以检
验以确定最优类别数,从而得到运营时段的最优划分方案和最佳时段分割点。天津地铁二号线实例研究表明,基
于近邻传播聚类算法得到的运营时段划分结果更能体现实际客流需求波动特性,在此基础上优化行车计划后,旅
客等待时间明显下降。
关键词: 地铁运营时段划分; 进站客流量; 近邻传播聚类; 聚类有效性评估; 旅客平均候车时间
中图分类号: U491. 5 文章标识码: A 文章编号: 1007-3221( 2018) 12-0187-06 doi: 10. 12005 / orms. 2018. 0295
WANG Wen-xian1 ,XIAO Meng1 ,CHENG Lin-na1 ,DU Yan-shuai2 ,NI Shao-quan3
( 1. School of Railway Tracks & Transportation,Wuyi University,Jiangmen 529020,China; 2. China Railway
Shanghai Design Institute Group Company Limited,Shanghai 610031,China; 3. School of Transportation and
Logistics,Southwest Jiaotong University,Chengdu 610031,China)
Abstract: Passenger quantity of subway normally varies significantly by different time period like peak and non-
peak hours. Reasonable classification of operation intervals is essential for adaptable adjustment of traffic plan for
peak and non - peak hours. Actually,the classification method which is manually set based on experiences,is
subjective and lack of accuracy. Taking 10 minute as a unit time interval,the daily operating period ( 6∶ 00 ~ 23
∶ 00) can be divided into 102( 10-min) time intervals. This article proposes affinity propagation algorithm merge
time samples into different categories,together with arriving passenger volume alongside stations which are used
as describing variables. Clustering validity indexes such as CH Hart and IGP are introduced to examine cluste-
ring result,so optimal operation intervals classification and switch time are finally confirmed. The study of Tian-
jin subway 2th line indicates that operation intervals classification based on clustering algorithm could respond the
fluctuation of real passenger quantity more accurately. On the base of that,the optimized traffic plan causes
obvious decrease of passenger average waiting time.
Key words: subway operation intervals classification; arriving passenger volume alongside stations; affinity
propagation cluster; clustering validity assess; passenger average waiting time
使其逐渐成为城市交通中旅客重要出行交通方式。
0 引言 由于客流具有动态特性,
地铁运营管理部门每天需要
调整高峰与低峰列车运行计划,使其符合不同运营时
地铁所具有的运量大、 节能环保等特性,
速度快、 间的客流需求。由此可见,基于客流动态特性的运营
收稿日期: 2017-06-24
基金项目: 国家自然科学基金资助项目( 61403317, 61273242,
60776826)
作者简介: 王文宪( 1986-) ,男,博士,研究方向: 交通运输组织、算法设计; 肖蒙( 1974-) ,男,硕士,研究方向: 交通运输工程; 杜延帅
( 1991-) ,女,硕士,研究方向: 地铁运营组织; 成琳娜( 1988-) ,女,硕士,研究方向: 优化算法; 倪少权( 1967-) ,男,博士,研究方向: 交通运输
组织、算法设计。
188 运 筹 与 管 理 2018 年第 27 卷
{∑
min{ 0,r( k,k) + ∑ max[0,r( i',k) ]} ,i ≠ k 性质 4 若有 E( k,k) = 0,则存在 j ≠ k,满足
a( i,k) ← i'≠{ i,
k} ( 3)
E( k,k) = E( k,j) = max{ E( k,i) } = 0,此时 x k 与 x j
max[0,r( i',k) ],i = k i
i'≠k 都是类代表点。
对于任 意 样 本 x i ,可 信 度 r ( i,k ) 和 可 用 度
证明 如果 E( k,k) = 0,则有 AS( k,k) - max
a( i,k) 之和的最大值所对应样本 x k 即为类代表。 j'≠k
r( i,k) + a( i,k) ←s( i,k) + a( i,k) - AS( k,k) - max{ AS( k,j') }
j'≠k
max{ a( i,k') + s( i,k') } ( 4) = AS( k,j) - max{ AS( k,j') } = 0 ( 9)
k'≠k j'≠j
假设 E = 珋 a,AS = 珔
r +珔 s,则有 E( i,k) ← AS( i,
a +珋 即 E( k,k) = E( k,j) = 0。
k) - max{ AS( i,k') } ,其中,矩阵 E 具有如下几个 对于某 i 个存在 E( k,i) > 0,则 AS( k,i) - max
k'≠k j'≠i
[15]
性质 { AS( k,j') } > 0,此时 AS( k,i) 是矩阵 AS 中第 k 行
性质 1 对 于 任 意 样 本 x i ,均 有 E ( i,k ) 的最大元素,故 AS( k,k) - max { AS( k,j') } = 0 不
j'≠k
E( k,k) 。
成立,与假设矛盾。
证明 在 a( i,k) 的计算中 由性质 1 可知, 0 = E( k,j) E( j,j) ,因此是类
( 1 ) 当 i ≠ k 时,若 r( k,k) + ∑ max{ 0, 代表点。
i'≠( i,k)
r( i',k) } 0 ,则 3. 3 地铁运营时段划分方法
4 聚类结果有效性评估 以天津地铁二号线为研究对象,该线路现行运
营时段包括早平峰、早高峰、过渡期、午平峰、晚高
聚类有效性指标通过对不同聚类结果进行量化
[16]
峰、晚平峰以及夜平峰,各运营时段所对应的时间
评估 以确定最优的聚类数目 ,
, 由于 AP 算法的聚
以及实施运输计划如表 1 所示。
类输出结果包含一系列不同聚类数目,故需采用聚 表1 天津地铁二号线运营时段划分现状
类有效性指标以确定最佳聚类数,进行确定最优聚
运营时段 名称 时间 运行计划
类结果, 常用聚类有效性指标及计算方法如下: 1 早平峰 06∶ 00 ~ 07∶ 00 平峰运行计划
( 1) CH 指标 ( Calinski-Harabasz) 用 于 测 度 全 2 早高峰 07∶ 00 ~ 09∶ 30 高峰运行计划
部样本的类内离差矩阵和类间离差矩阵 ,该指标取 3 午平峰 09∶ 30 ~ 16∶ 30 平峰运行计划
4 晚高峰 16∶ 30 ~ 19∶ 30 高峰运行计划
最大值所对应的类数为最佳聚类数 。
5 晚平峰 19∶ 30 ~ 21∶ 30 平峰运行计划
trB( k) / ( k - 1)
CH( k) = ( 13) 6 夜平峰 21∶ 30 ~ 23∶ 00 平峰运行计划
trW( k) / ( n - k)
图2 聚类结果及聚类有效性指标值
第 12 期 王文宪,等: 基于近邻传播聚类的地铁运营时段划分 191
对天津地铁二号线中曹庄、咸阳路、长虹公园 表3 聚类前后车底使用数与旅客平均候车时间对比
由图 2 聚类有效性评估曲线可以看出,天津地 由表 3 可知,基于近邻传播聚类算法的客流时
铁二号线客流时段的最佳聚类数为 4,将所有样本 段划分结果编制的列车行车计划后 ,旅客平均等待
类别中相邻时间点再次合并,获得天津地铁二号线 时间均有较为明显的下降,其中,
客流时段划分结果如表 2。 ( 1) 根据运营时段划分结果编制列车运行计
表2 基于聚类分析的运营时段划分结果 划,旅客全天平均候车时间下降 10. 7% ;
编号 称 对应时段 运行计划 ( 2) 聚类后除晚低峰 ( 19∶ 30 ~ 23∶ 00) 外,其余
早平峰 06∶ 00 ~ 07∶ 10 时段旅客平均候车时间均优于现状,其中,早高峰
聚类 1 午平峰 09∶ 10 ~ 17∶ 00 平峰运行计划
( 07∶ 10 ~ 09∶ 10) 和晚高峰 ( 17∶ 00 ~ 18∶ 30) 旅客平
晚平峰 18∶ 30 ~ 19∶ 30
均候车 时 间 减 少 率 为 11. 2% 和 10. 1% ,早 平 峰
聚类 2 早高峰 07∶ 10 ~ 09∶ 10 高峰运行计划 1
( 06∶ 00 ~ 07∶ 10) 、午平峰 ( 09∶ 10 ~ 17∶ 00) 和晚平
聚类 3 晚高峰 17∶ 00 ~ 18∶ 30 高峰运行计划 2
峰( 18 ∶ 30 ~ 19 ∶ 30 ) 的 车 均 延 误 减 少 率 分 别 为
聚类 4 晚低峰 19∶ 30 ~ 23∶ 00 低峰运行计划
9. 6% 和 8. 9% 。
9. 2% 、
通过表 1、表 2 的对比分析,可以发现: ( 3) 聚类后晚低峰 ( 19 ∶ 00 ~ 23 ∶ 00) 旅客平均
( 1) 基于聚类分析的时段划分法也将地铁全 候车时间变长是采用低峰列车运行计划的结果 ,相
天运营时段分为 3 个平峰期、
2 个高峰期以及 1 个 对于其他运营时段,该时段客流量较低,实施的列