基于近邻传播聚类的地铁运营时段划分王文宪

第 27 卷第 12 期运筹与管理 Vol． 27，No． 12
2018 年 12 月 OPEＲATIONS ＲESEAＲCH AND MANAGEMENT SCIENCE Dec． 2018
基于近邻传播聚类的地铁运营时段划分
王文宪，肖蒙，成琳娜，杜延帅，倪少权
1 1 1 2 3
（ 1．五邑大学轨道交通学院，广东江门 529020； 2．中铁上海设计院集团有限公司，上海 200070； 3．西南交通大学交通运输与

物流学院，四川成都 610031）
摘要：地铁在每天不同时段客流量差异较大，运营时段的科学划分，是低峰与高峰列车运行计划合理交替的前
提。目前地铁运营时段划分主要依据人工经验，主观性强且难以保证精度。以 10min 为时间间隔，把全天运营时
间 6∶ 00 ～ 23∶ 00 分为 102 个时间点样本，将地铁沿线各车站每个时间点的进站客流量作为样本描述变量。采用近
邻传播聚类算法将各时间点归并为不同类别，并引入 CH、Hart 以及 IGP 等聚类有效性评估指标对聚类结果加以检
验以确定最优类别数，从而得到运营时段的最优划分方案和最佳时段分割点。天津地铁二号线实例研究表明，基
于近邻传播聚类算法得到的运营时段划分结果更能体现实际客流需求波动特性，在此基础上优化行车计划后，旅
客等待时间明显下降。
关键词：地铁运营时段划分；进站客流量；近邻传播聚类；聚类有效性评估；旅客平均候车时间
中图分类号： U491． 5 文章标识码： A 文章编号： 1007-3221（ 2018） 12-0187-06 doi： 10． 12005 / orms． 2018． 0295
Classification of Subway Operation Intervals Based on Affinity Propagation Cluster
WANG Wen-xian1 ，XIAO Meng1 ，CHENG Lin-na1 ，DU Yan-shuai2 ，NI Shao-quan3
（ 1． School of Ｒailway Tracks ＆ Transportation，Wuyi University，Jiangmen 529020，China； 2． China Ｒailway
Shanghai Design Institute Group Company Limited，Shanghai 610031，China； 3． School of Transportation and
Logistics，Southwest Jiaotong University，Chengdu 610031，China）
Abstract： Passenger quantity of subway normally varies significantly by different time period like peak and non-
peak hours．Ｒeasonable classification of operation intervals is essential for adaptable adjustment of traffic plan for
peak and non － peak hours． Actually，the classification method which is manually set based on experiences，is
subjective and lack of accuracy． Taking 10 minute as a unit time interval，the daily operating period （ 6∶ 00 ～ 23
∶ 00） can be divided into 102（ 10-min） time intervals． This article proposes affinity propagation algorithm merge
time samples into different categories，together with arriving passenger volume alongside stations which are used
as describing variables． Clustering validity indexes such as CH Hart and IGP are introduced to examine cluste-
ring result，so optimal operation intervals classification and switch time are finally confirmed． The study of Tian-
jin subway 2th line indicates that operation intervals classification based on clustering algorithm could respond the
fluctuation of real passenger quantity more accurately． On the base of that，the optimized traffic plan causes
obvious decrease of passenger average waiting time．
Key words： subway operation intervals classification； arriving passenger volume alongside stations； affinity
propagation cluster； clustering validity assess； passenger average waiting time
使其逐渐成为城市交通中旅客重要出行交通方式。
0 引言由于客流具有动态特性，
地铁运营管理部门每天需要
调整高峰与低峰列车运行计划，使其符合不同运营时
地铁所具有的运量大、节能环保等特性，
速度快、间的客流需求。由此可见，基于客流动态特性的运营
收稿日期： 2017-06-24
基金项目：国家自然科学基金资助项目（ 61403317， 61273242，
60776826）
作者简介：王文宪（ 1986-），男，博士，研究方向：交通运输组织、算法设计；肖蒙（ 1974-），男，硕士，研究方向：交通运输工程；杜延帅
（ 1991-），女，硕士，研究方向：地铁运营组织；成琳娜（ 1988-），女，硕士，研究方向：优化算法；倪少权（ 1967-），男，博士，研究方向：交通运输
组织、算法设计。
188 运筹与管理 2018 年第 27 卷
时段划分是列车运行计划调整的基础。实际工作中对列车运行计划的调整是一项涉及机车周转、交路

现行的地铁运营时段划分依据为工程技术人员的主变化等诸多要素的复杂工程，准确的运营时段划分
观判断，
这种方法易产生不合理的时段划分结果，无结果是列车运行计划适应性调整的基本前提。
法精确描述规律性波动变化的客流需求。地铁运营时段划分，是通过有限时间点集合
地铁运营时段划分问题类似于道路交叉口信 T = ｛ t1 ，t2 ，…，t n ｝描述地铁全天运营时间基础上，
号设计中的交通时段划分问题，国外学者针对该问以不同时间点客流量 X （ t） = ｛ x1 （ t），x2 （ t），…，
［1］［2］
题的研究成果罗列如下： HAUSEＲ和 Scherer x m （ t）｝为属性描述变量，将相似时间点归并已形
结合系统状态的概念，将层次聚类算法应用于交通成若干个两两相互无交集｛ T1 ，T2 ，…，T p ｝的非空子
［3，
4］
时间的自动划分。PAＲK B 引入遗传算法及定集的过程，该问题在本质上是一个有限样本聚类分
义高分辨率状态以自动识别各个时间点的所属时析问题，如图 1 所示。
［5］
间段。Wayne 使用 K-means 聚类方法来划分时
［6］
段，但该方法要预设时段划分类数。Ｒatrout 在交
叉口时段划分中构建了包含不同相位流量的数据
向量，并以减法聚类的方式对原 K 均值聚类法进
［7］
行改进。国内学者中，宫晓燕结合感应控制与
有序样本聚类算法划分 TOD 时段，并实现交叉口
［8］
交通信号实时控制仿真。杨立才提出了一种基
于人工免疫的交通时段分割法，为道路交叉口开发
［9］图1 地铁运营时段划分问题描述
多周期定时控制方案。杜长海针对模糊 C 均值
算法在交通时段划分过程中容易陷入局部极值的图 1 中数据来源于城市轨道交通线网指挥中
缺陷，提出蛙跳—模糊均值聚类混合算法（ SFLA- 心 TCC 子系统（ Traffic Control Center）的检测器数
FCM）。刘东波［10］以小时为单位时长获取交叉口据，其中横坐标为时间跨度，纵坐标为地铁线路在
交通流量的均值，并用韦伯斯特法确定时段划分临不同时间点的旅客发送量。
［11］
界值。沈吟东对传统 K-means 算法的簇中心初需要说明的是，道路交叉口信号设计中是以交
始化算子及更新算子进行改进并采用该方法划分通时段划为交叉口信号配时依据，以降低车辆在交
［12］
城市公交的运营时段。赵伟明采用经典谱聚类叉口的排队等待时间，而地铁运营组织计划中亦是
算法划分交叉口车流时段，并使用 Synchro 和运营时段划分为行车计划编制依据，以减少整个地
SIMTraffic 软件进行信号配时方案模拟评估。姚铁线路中的旅客总候车等待时间。
［13］
佼在对历史交通流量数据预处理后，采用 Ward
最小方差法聚类得出 TOD 模式下时段分割点。 3 运营时段划分方法
可以发现，上述研究是以交叉口为研究对象，
首先将全天时间分割为 N 个时间点，然后将客流 3． 1近邻传播算法原理
量相近的相邻时间点归并形成一个交通时段，其研近邻传播算法（ Affinity Propagation， AP）于 2007
究方法为地铁运营时段划分提供了一定的思路，本年由 Frey 等人提出，
［14］
该算法在处理大规模复杂数
文借鉴该领域相关研究成果，结合地铁客流动态特据时具有更快的收敛速度，故本文选择 AP 算法对
性，将地铁沿线各车站客流量作为样本描述的变地铁运营时段进行划分。该算法的基本原理是：
量，采用近邻传播聚类算法对各时间点进行归并以（ 1）原始数据集中 N 个样本都可能成为为类
形成不同的运营时段，并引入聚类有效性评估指标中心的代表，同时对任意两个样本 x i 和 x k 间的相
检验聚类结果，从而确定最佳聚类数，在此基础上似度进行计算，并存储在维相似度矩阵中；
实现运营时段的准确、自动化分，为地铁高峰、低峰（ 2）矩阵中 s（ i，k）表示样本 x k 与样本 x i 的相
列车运行计划过渡调整奠定基础。似度，即样本 x k 在多大程度上适合作为样本 x i 的
类代表，其计算公式为
1 地铁运营时段划分问题 s（ i，k） = － ‖x i － x k ‖2 （ 1）
算法初始化时取， s（ k，k） ← 即所有样本被
p，
地铁运营管理部门需根据客流波动变化调整为类代表的可能性相同。
实施运营时间内的高峰与低峰列车运行计划，然而（ 3）引入可信度矩阵珋 r 和可用度矩阵珔 a 两类信
第 12 期王文宪，等：基于近邻传播聚类的地铁运营时段划分 189
息量参数，其中，r（ i，k）表示样本 x k 适合作为样本性质 3 若有 E（ k，则 xk 不是类代表点。

k）＜ 0，
x i 的类代表的量化程度，a（ i，k）表示样本 x i 选择证明如果 E （ k，k）＜ 0，则 AS （ k，k）－ max
j'≠k
样本 x k 作为类代表的合适程度。｛ AS（ k，j'）｝＜ 0，即存在 j≠k，满足
可信度 r（ i，k）迭代更新公式为： AS（ k，k）＜ max｛ AS（ k，j'）｝ = AS（ k，j）（ 7）
j'≠k
r（ i，k） ←s（ i，k）－ max｛ a（ i，k'） + s（ i，k'）｝（ 2）
k'≠k 此时 E（ k，j） = AS （ k，j）－ max ｛ AS （ k，j'）｝＞ 0 ＞
j'≠j
可用度 a（ i，k）迭代更新公式为：
E（ k，k），故 x k 不是类代表点。
{∑
min｛ 0，r（ k，k） + ∑ max［0，r（ i'，k）］｝，i ≠ k 性质 4 若有 E（ k，k） = 0，则存在 j ≠ k，满足
a（ i，k） ← i'≠｛ i，
k｝（ 3）
E（ k，k） = E（ k，j） = max｛ E（ k，i）｝ = 0，此时 x k 与 x j
max［0，r（ i'，k）］，i = k i
i'≠k 都是类代表点。
对于任意样本 x i ，可信度 r （ i，k ）和可用度
证明如果 E（ k，k） = 0，则有 AS（ k，k）－ max
a（ i，k）之和的最大值所对应样本 x k 即为类代表。 j'≠k
｛ AS（ k，j'）｝ = 0，即存在 j≠k，满足

3． 2 近邻传播算法性质
AS（ k，k） = max｛ AS（ k，j'）｝ = AS（ k，j）（ 8）
在公式（ 2）左右两边同时加上多项式 a（ i，k）， j'≠k
可以得到新的公式（ 4）如下所示此时，AS（ k，j） = max｛ AS（ k，j'）｝，所以

j'≠k
r（ i，k） + a（ i，k） ←s（ i，k） + a（ i，k）－ AS（ k，k）－ max｛ AS（ k，j'）｝
j'≠k
max｛ a（ i，k'） + s（ i，k'）｝（ 4） = AS（ k，j）－ max｛ AS（ k，j'）｝ = 0 （ 9）
k'≠k j'≠j
假设 E = 珋 a，AS = 珔
r +珔 s，则有 E（ i，k） ← AS（ i，
a +珋即 E（ k，k） = E（ k，j） = 0。
k）－ max｛ AS（ i，k'）｝，其中，矩阵 E 具有如下几个对于某 i 个存在 E（ k，i）＞ 0，则 AS（ k，i）－ max
k'≠k j'≠i
［15］
性质｛ AS（ k，j'）｝＞ 0，此时 AS（ k，i）是矩阵 AS 中第 k 行
性质 1 对于任意样本 x i ，均有 E （ i，k ）  的最大元素，故 AS（ k，k）－ max ｛ AS（ k，j'）｝ = 0 不
j'≠k
E（ k，k）。
成立，与假设矛盾。
证明在 a（ i，k）的计算中由性质 1 可知， 0 = E（ k，j）  E（ j，j），因此是类
（ 1 ）当 i ≠ k 时，若 r（ k，k） + ∑ max｛ 0，代表点。
i'≠（ i，k）
r（ i'，k）｝  0 ，则 3． 3 地铁运营时段划分方法
a（ i，k） = r（ k，k） +∑ max｛ 0，r（ i'，k）｝－ max｛ 0，r（ i，k）｝地铁沿线车站是客流量产生与消失的源头，故

i'≠k 本文以地铁线路上的主要车站为研究对象，统计其
= r（ k，k） + a（ k，k）－ max｛ 0，r（ i，k）｝（ 5）在全天的不同时间点进站客流量，并以此作为时间
①如果有 r（ i，k） 0，则有 a（ i，k） + r（ i，k） = 点类别划分的属性变量。基于上述算法基本原理，
a（ k，k） + r（ k，k），即 E（ i，k） = E（ k，k）；设计地铁运营时段划分方法基本步骤如下：
②如果有 r（ i，k）＜ 0，则有 a（ i，k） + r（ i，k）＜ Step 1 读取地铁线路拓扑结构以及线路上
a（ k，k） + r（ k，k），即 E（ i，k）＜ E（ k，k）。所有重要车站在每个时间点的旅客发送量，设置算
（ 2）当 i ≠ k 时，若 r （ k，k） + ∑ max ｛ 0，r （ i'，法最大迭代次数 N max ；
i'≠i，k
k）｝＞ 0，由公式（ 3）知 a（ i，k） = 0，此时①如果有其中，时间点样本属性变量的数据设计如下：
r（ i，k） 0，则有 a（ i，k） + r（ i，k）＜ a（ k，k） + r（ k， X（ t） = ｛ x1 （ t），x2 （ t），…，x i （ t），…，x n （ t）｝（ 10）
k），即 E（ i，k）＜ E（ k，k）； ②如果有 r（ i，k）＜ 0，则式中，X（ t）为时间点 t 的地铁客流状态向量，
有 a（ i，k） + r（ i，k）＜ a（ k，k） + r（ k，k），即 E（ i，k） x i （ t）为地铁线路第 i 个车站在时间点 t 的进站客
＜ E（ k，k）。流量；
性质 2 若有 E（ k，k）＞ 0，则 x k 是类代表点， Step 2 初始化，令可信度矩阵珋 r 和可用度矩
即 E（ k，j）＜ E（ k，k）。阵珔 a 的初始值为 0；
证明根据公式 E（ i，k） ← AS（ i，k）－ max ｛ AS 采用欧式距离即公式（ 1）为测度计算样本相
k'≠k
（ i，k'）｝可知似度矩阵 s（ i，k），同时设置矩阵对角线元素s（ k，k）

E（ k，k） = AS（ k，k）－ max｛ AS（ i，k'）｝＞ 0 （ 6）为相同的吸引度中值
k'≠k
即矩阵 AS 中第 k 行的最大元素是 AS（ k，k）。 p = ∑ s（ i，k） / N·（ N － 1）（ 11）

i≠j
若 j≠k，则 j≠k 不是矩阵 AS 中第 k 行的最大
式中，为 N 样本数量；
元素，即 AS（ k，j）＜ max｛ AS（ k，j'）｝。 Step 3 迭代
j'≠j
190 运筹与管理 2018 年第 27 卷
（ 1）根据公式（ 2）与（ 3）更新可用度和可信度。式中，k 为聚类数，trB（ k）为间离差矩阵的迹，

（ 2）消除算法迭代中可能产生的数字震荡，其 trW（ k）为类内离差矩阵的迹，
计算公式如下（ 2） Hart 指标（ Hartigan）可在聚类数为 1 的情
{r new （ i，k） = λ·r old （ i，k） + （ 1 － λ） ·r（ i，k）

a new （ i，k） = λ·a old （ i，k） + （ 1 － λ） ·a（ i，k）
（ 12）
况条件下使用，其满足 Ha 10 的最小类数作为最
佳聚类数。
式中， rnew （ i，k）和 rold 分别为迭代更新前后的可信 Hart（ k） = （
trW（ k）
－ 1）（ n － k － 1）（ 14）
度矩阵； anew （ i， k）和 aold （ i， k）分别为迭代更新前后的 trW（ k + 1）
可用度矩阵； λ∈（ 0， 1）为阻尼因子，此处取值 0． 9。（ 3） IGP 指标（ In-Group Proportion）用于测度在
（ 3）计算所有样本的可信度与可用度之和，根某一类别中距离每个样本最近的样本是否位于同一
据 arg max｛ r（ i，k） + a（ i，k）｝找到每个样本的类中类别，该指标最大值所对应的类数为最佳聚类数。
k
#｛ j | Class（ j） = Class（ j N ） = u｝
心样本； IGP（ u） = （ 15）
#｛ j | Class（ j） = u｝
（ 4）当前迭代次数更新 n←n + 1；
式中，u 为某聚类的类标，Class（ j）为样本 j 的
Step 4 结果输出，判断当前迭代次数是否小
类标，j 为距离样本 j 最近的样本，# 为满足条件的
N
于最大迭代次数，即 n ＜ N max ，是则算法终止，输出

个数。
所有时间点类别划分结果，否则返回 Step3；
运营时段划分后，根据各时段客流需求均值编
Step 5 聚类数的确定，根据各类聚类结果有
制列车运行计划并进行客流分配模拟，并采用旅客
效性评估指标选择最优时间点分类数及其对应的
平均候车时间指标对各时段客流需求与列车运行
类别划分结果；
计划的适应程度进行量化评估。
Step 6 地铁运营时段确定，对所有类别中的
所有相邻样本再次合并，视为同一个运营时段。
5 实例分析
4 聚类结果有效性评估以天津地铁二号线为研究对象，该线路现行运
营时段包括早平峰、早高峰、过渡期、午平峰、晚高
聚类有效性指标通过对不同聚类结果进行量化
［16］
峰、晚平峰以及夜平峰，各运营时段所对应的时间
评估以确定最优的聚类数目，
，由于 AP 算法的聚
以及实施运输计划如表 1 所示。
类输出结果包含一系列不同聚类数目，故需采用聚表1 天津地铁二号线运营时段划分现状
类有效性指标以确定最佳聚类数，进行确定最优聚
运营时段名称时间运行计划
类结果，常用聚类有效性指标及计算方法如下： 1 早平峰 06∶ 00 ～ 07∶ 00 平峰运行计划
（ 1） CH 指标（ Calinski-Harabasz）用于测度全 2 早高峰 07∶ 00 ～ 09∶ 30 高峰运行计划
部样本的类内离差矩阵和类间离差矩阵，该指标取 3 午平峰 09∶ 30 ～ 16∶ 30 平峰运行计划
4 晚高峰 16∶ 30 ～ 19∶ 30 高峰运行计划
最大值所对应的类数为最佳聚类数。
5 晚平峰 19∶ 30 ～ 21∶ 30 平峰运行计划
trB（ k） / （ k － 1）
CH（ k） = （ 13） 6 夜平峰 21∶ 30 ～ 23∶ 00 平峰运行计划
trW（ k） / （ n － k）
图2 聚类结果及聚类有效性指标值
第 12 期王文宪，等：基于近邻传播聚类的地铁运营时段划分 191
对天津地铁二号线中曹庄、咸阳路、长虹公园表3 聚类前后车底使用数与旅客平均候车时间对比
以及屿东城等站点进行客流量采样，以 10min 为单聚类前聚类后

位采集 2016 年 12 月 5 号至 2016 年 12 月 9 号工时段名称平均候车时间时段名称平均候车时间
作日统计的进展客流数据，数据来源于天津市城市早平峰 163s 早平峰 148s
轨道交通线网指挥中心 TCC 子系统（ Traffic Control 早高峰 107s 早高峰 95s
Center）的检测器数据。在对历史交通流量数据进午平峰 167s 午平峰 151s
行修补后，根据公式（ 4）设计聚类数据样本，利用晚高峰 119s 晚高峰 107s
数学软件 MATLAB2010b 按照前文设计方法进行晚平峰 168s 晚平峰 153
聚类，结果及有效性评估值如图 2 所示。晚低峰 170s 晚低峰 186
由图 2 聚类有效性评估曲线可以看出，天津地由表 3 可知，基于近邻传播聚类算法的客流时
铁二号线客流时段的最佳聚类数为 4，将所有样本段划分结果编制的列车行车计划后，旅客平均等待
类别中相邻时间点再次合并，获得天津地铁二号线时间均有较为明显的下降，其中，
客流时段划分结果如表 2。（ 1）根据运营时段划分结果编制列车运行计
表2 基于聚类分析的运营时段划分结果划，旅客全天平均候车时间下降 10． 7% ；
编号称对应时段运行计划（ 2）聚类后除晚低峰（ 19∶ 30 ～ 23∶ 00）外，其余
早平峰 06∶ 00 ～ 07∶ 10 时段旅客平均候车时间均优于现状，其中，早高峰
聚类 1 午平峰 09∶ 10 ～ 17∶ 00 平峰运行计划
（ 07∶ 10 ～ 09∶ 10）和晚高峰（ 17∶ 00 ～ 18∶ 30）旅客平
晚平峰 18∶ 30 ～ 19∶ 30
均候车时间减少率为 11． 2% 和 10． 1% ，早平峰
聚类 2 早高峰 07∶ 10 ～ 09∶ 10 高峰运行计划 1
（ 06∶ 00 ～ 07∶ 10）、午平峰（ 09∶ 10 ～ 17∶ 00）和晚平
聚类 3 晚高峰 17∶ 00 ～ 18∶ 30 高峰运行计划 2
峰（ 18 ∶ 30 ～ 19 ∶ 30 ）的车均延误减少率分别为
聚类 4 晚低峰 19∶ 30 ～ 23∶ 00 低峰运行计划
9． 6% 和 8． 9% 。
9． 2% 、
通过表 1、表 2 的对比分析，可以发现：（ 3）聚类后晚低峰（ 19 ∶ 00 ～ 23 ∶ 00）旅客平均
（ 1）基于聚类分析的时段划分法也将地铁全候车时间变长是采用低峰列车运行计划的结果，相
天运营时段分为 3 个平峰期、
2 个高峰期以及 1 个对于其他运营时段，该时段客流量较低，实施的列
低峰期，整个线路在早晚高峰均处于饱和状态，且车运行计划需考虑如何削减车底使用数，该结果恰

好能够反映地铁实际运营中的具体状况。
两者无明显差异。
（ 2）相对于 2 号线的运营时段划分现状，根据
6 结论
聚类方法得到的早平峰以及从晚平峰持续时间较
短，大约 1 小时左右，这段时间内的客流需求主要本文针对地铁运营时段划分问题进行深入研
包括市民的休闲娱乐以及购物等无规律性出行。究，首次将基于聚类分析的时段划分方法引入该研
（ 3）对于客流需求本质上具有相似性不同运究领域。结合沿线车站每天的进站客流量调查数
营时段，地铁运营管理部门可以采用相同的列车运据，采用近邻传播算法对全天运营时间内客流量相
行计划，如本文将早平峰、午平峰以及晚平峰聚为似的时间点进行聚类归并，并根据 CH、Hart 以及
一类，就是因为这几个时段的客流需求较为类似。 IGP 指标确定最佳聚类数，在此基础上设计地铁运
（ 4）早高峰（ 07∶ 20 ～ 09∶ 10）和晚低峰（ 19 ∶ 30 营时段划分方法，主要结论如下：

（ 1）基于聚类分析的地铁运营时段划分，以及
～ 23∶ 00）需单独设置列车运行计划，这两时段的
结合聚类有效性指标评估的结果检验方法，可以更
客流出行目的较为单一，几乎为上班通勤以及外出
加准确地反映地铁全天运营时间内不同时段的客
返家，且在流量上与其他时间段有较大差异。
流需求，从而为地铁列车运行计划交替奠定基础。
根据聚类前后各运营时段的客流需求均值，分（ 2）以天津地铁二号线的实例研究表明，将全
别编制相应的列车运行计划，进而运用 Anylogic 软天运营时间划分为 6 个运营时段时，各个聚类结果
件模拟仿真得到聚类前后的平均旅客候车时间，结有效性评估指标达到最优。
果如表 3 所示。（ 3）聚类后除晚低峰（ 19∶ 30 ～ 23∶ 00）外，其余
192 运筹与管理 2018 年第 27 卷
时段旅客平均候车时间均优于现状，其中，早高峰［6］Ｒatrout N T． Subtractive clustering-based k-means tech-

（ 07∶ 10 ～ 09∶ 10）和晚高峰（ 17∶ 00 ～ 18∶ 30）旅客平 nique for determining optimum time-of-day breakpoints
［J］． Journal of Computing in Civil Engineering，2011，
均候车时间减少率为 11． 2% 和 10． 1% ，早平峰（ 06
25（ 5）： 380-387．
∶ 00 ～ 07 ∶ 10）、午平峰（ 09 ∶ 10 ～ 17 ∶ 00）和晚平峰
［7］宫晓燕，陈德望，刘小明．基于有序样本聚类的交叉口
（ 18∶ 30 ～ 19∶ 30）的车均延误减少率分别为 9． 2% 、
交通信号控制算法研究［J］．公路交通科技，2003，20
9． 6% 和 8． 9% 。
（ 1）： 101-104．
需要说明的是，本文研究所参考的数据为工作［8］杨立才，贾磊，孔庆杰等．基于人工免疫算法的交通时
日内客流数据，相关节假日运营时段划分亦可参照段自动划分方法［J］．控制理论与应用， 23（ 2）：
2006，
前文思路与方法制定。 193-198．
［9］杜长海，黄席樾，杨祖元等．改进的 FCM 聚类在交通
参考文献：时段自动划分中的应用［J］．计算机工程与应用，
45（ 24）： 190-193．
2009，
［1］ Hauser T，Scherer W． Date mining tools for real-time ［10 刘东波，代磊磊，李娅等．基于信号周期计算的交叉口
traffic signal decision support and maintenance［C］/ / 管控时段划分［J］．吉林大学学报（工学版），2013，43
Proc of IEEE Int Conf on Systems，Man，and Cybernet- （ 6）： 1471-1475．
ics． Tucson，USA： IEEE Press，2001： 1471-1477．［11］沈吟东，张仝辉，徐甲．基于 K-means 聚类算法的公
［2］ Smith B L，Scherer W T，Hauser T A． Data-mining tools 交运营时段分析［J］．交通运输系统工程与信息，
for the support of signal-timing plan development［J］． 14（ 2）： 87-93．
2014，
Transportation Ｒesearch Ｒecord，2001，1768： 141-147．［12］赵伟明，王殿海，朱文韬等．基于改进 NJW 算法的交
［3］ Park B，Lee Do-Hoon，Yun Hsoo． Enhancement of time 通控制时段划分［J］．浙江大学学报（工学版），2014，
of day based traffic signal control［C］． / / Proc of IEEE In- 48（ 12）： 2259-2265．
ternational Conference on Systems，Man，and Cybernet- ［13］姚佼，徐洁琼，韩印．基于聚类分析的城市交通 TOD
ics． Tucson，USA： IEEE Press，2003： 1471-1477．优化控制方法［J］．交通运输工程学报，2014，14 （ 6）：
［4］ Park B，Lee Joyoung． A procedure for determining time- 110-116．
of-day break points for coordinated actuated traffic signal ［14］ Frey B J，Dueck D． Clustering by passing messages
systems［J］． KSCE Journal of Civil Engineering，2008， between data points［J］． Science，2007，315 （ 5814 ）：
12（ 1）： 37-44． 972-976．
［5］ Xiaodong Wang，Wayne Cottrell，Sichun Mu． Using k- ［15］赵宪佳，王立宏．近邻传播半监督聚类算法的分析与
means clustering to identify time-of-day break points for 改进［J］．计算机工程与应用， 46（ 36）： 168-171．
2010，
traffic signal timing plans［C］． / / IEEE Conference on ［16］周世兵，徐振源，唐旭清．基于近邻传播算法的最佳
Intelligent Transportation Systems， Vienna， Austria：聚类数确定方法比较研究［J］．计算机科学，2011，38
IEEE Press，2005： 519-524．（ 2）： 225-228．

基于近邻传播聚类的地铁运营时段划分 王文宪

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

基于近邻传播聚类的地铁运营时段划分 王文宪

Uploaded by

Copyright:

Available Formats

第 27 卷 第 12 期 运 筹 与 管 理 Vol． 27，No． 12

2018 年 12 月 OPEＲATIONS ＲESEAＲCH AND MANAGEMENT SCIENCE Dec． 2018

（ 1． 五邑大学 轨道交通学院，广东 江门 529020； 2． 中铁上海设计院集团有限公司，上海 200070； 3． 西南交通大学 交通运输与

Classification of Subway Operation Intervals Based on Affinity Propagation Cluster

时段划分是列车运行计划调整的基础。实际工作中 对列车运行计划的调整是一项涉及机车周转 、交路

息量参数，其中，r（ i，k） 表示样本 x k 适合作为样本 性质 3 若有 E（ k， 则 xk 不是类代表点。

｛ AS（ k，j'） ｝ = 0，即存在 j≠k，满足

可以得到新的公式（ 4） 如下所示 此时，AS（ k，j） = max｛ AS（ k，j'） ｝ ，所以

a（ i，k） = r（ k，k） +∑ max｛ 0，r（ i'，k） ｝ － max｛ 0，r（ i，k） ｝ 地铁沿线车站是客流量产生与消失的源头 ，故

（ i，k'） ｝ 可知 似度矩阵 s（ i，k） ，同时设置矩阵对角线元素s（ k，k）

即矩阵 AS 中第 k 行的最大元素是 AS（ k，k） 。 p = ∑ s（ i，k） / N·（ N － 1） （ 11）

（ 1） 根据公式（ 2） 与（ 3） 更新可用度和可信度。 式中，k 为聚类数，trB（ k） 为间离差矩阵的迹，

{r new （ i，k） = λ·r old （ i，k） + （ 1 － λ） ·r（ i，k）

于最大迭代次数，即 n ＜ N max ，是则算法终止，输出

以及屿东城等站点进行客流量采样 ，以 10min 为单 聚类前 聚类后

作日统计的进展客流数据，数据来源于天津市城市 早平峰 163s 早平峰 148s

轨道交通线网指挥中心 TCC 子系统（ Traffic Control 早高峰 107s 早高峰 95s

Center） 的检测器数据。 在对历史交通流量数据进 午平峰 167s 午平峰 151s

行修补后，根据公式 （ 4） 设计聚类数据样本，利用 晚高峰 119s 晚高峰 107s

数学软件 MATLAB2010b 按照前文设计方法进行 晚平峰 168s 晚平峰 153

聚类，结果及有效性评估值如图 2 所示。 晚低峰 170s 晚低峰 186

低峰期，整个线路在早晚高峰均处于饱和状态，且 车运行计划需考虑如何削减车底使用数 ，该结果恰

（ 4） 早高峰 （ 07∶ 20 ～ 09∶ 10） 和晚低峰 （ 19 ∶ 30 营时段划分方法，主要结论如下：

时段旅客平均候车时间均优于现状，其中，早高峰 ［6］ Ｒatrout N T． Subtractive clustering-based k-means tech-

You might also like

基于近邻传播聚类的地铁运营时段划分王文宪

基于近邻传播聚类的地铁运营时段划分王文宪

第 27 卷第 12 期运筹与管理 Vol． 27，No． 12

（ 1．五邑大学轨道交通学院，广东江门 529020； 2．中铁上海设计院集团有限公司，上海 200070； 3．西南交通大学交通运输与

时段划分是列车运行计划调整的基础。实际工作中对列车运行计划的调整是一项涉及机车周转、交路

息量参数，其中，r（ i，k）表示样本 x k 适合作为样本性质 3 若有 E（ k，则 xk 不是类代表点。

｛ AS（ k，j'）｝ = 0，即存在 j≠k，满足

可以得到新的公式（ 4）如下所示此时，AS（ k，j） = max｛ AS（ k，j'）｝，所以

a（ i，k） = r（ k，k） +∑ max｛ 0，r（ i'，k）｝－ max｛ 0，r（ i，k）｝地铁沿线车站是客流量产生与消失的源头，故

（ i，k'）｝可知似度矩阵 s（ i，k），同时设置矩阵对角线元素s（ k，k）

即矩阵 AS 中第 k 行的最大元素是 AS（ k，k）。 p = ∑ s（ i，k） / N·（ N － 1）（ 11）

（ 1）根据公式（ 2）与（ 3）更新可用度和可信度。式中，k 为聚类数，trB（ k）为间离差矩阵的迹，

以及屿东城等站点进行客流量采样，以 10min 为单聚类前聚类后

作日统计的进展客流数据，数据来源于天津市城市早平峰 163s 早平峰 148s

Center）的检测器数据。在对历史交通流量数据进午平峰 167s 午平峰 151s

行修补后，根据公式（ 4）设计聚类数据样本，利用晚高峰 119s 晚高峰 107s

数学软件 MATLAB2010b 按照前文设计方法进行晚平峰 168s 晚平峰 153

聚类，结果及有效性评估值如图 2 所示。晚低峰 170s 晚低峰 186

低峰期，整个线路在早晚高峰均处于饱和状态，且车运行计划需考虑如何削减车底使用数，该结果恰

（ 4）早高峰（ 07∶ 20 ～ 09∶ 10）和晚低峰（ 19 ∶ 30 营时段划分方法，主要结论如下：

时段旅客平均候车时间均优于现状，其中，早高峰［6］Ｒatrout N T． Subtractive clustering-based k-means tech-