您的当前位置:首页 >学术交流

基于大数据收费系统辅助决策系统的研究与应用

发布日期:2023-01-06 09:23 信息来源:河北交通报 访问量:? 字体 :[ 大 ][ 中 ][ 小 ]

随着经济的发展,高速公路的车流量日益增长,积累了大量数据。如何能够破解信息孤岛、综合应用数据,深度挖掘数据间的关系,得到数据价值,做到用数据决策、用数据管理、用数据服务,成为了新的研究方向。事实证明,通过采用大数据技术建立辅助决策系统,能更好地服务高速公路运营和大众出行。

一、京石高速概括

京石高速,即京港澳高速公路涿州(京冀界)至石家庄段,连通石太、石安、石黄等多条高速,双向八车道,全长224.678km,路网交通作用十分重要。目前共有17个收费站、48个门架。截至2022年7月,京石高速进站数据累计2.15亿条,共270G,日均8万条;出站数据累计2.35亿条,共850G,日均8万5千条;门架数据累计11.68亿条,共5T,日均140万条。

二、大数据系统架构及计算流程

(一)大数据系统介绍

Hadoop是一种分布式系统,包括数据存储系统HDFS、计算系统MapReduce、资源调度系统Yarn。除了Hadoop,大数据生态还包括日志收集系统Flume、消息队列Kafka、快速计算引擎Spark等。本系统的大数据系统采用CDH套件,包含Hdfs、Hbase、Kafka、Flume、Spark、ZooKeeper等大数据生态组件,不仅版本统一、安装方便,而且提供了管理界面,用户可以在界面上轻松进行监控管理。

(二)本系统架构及计算逻辑

本系统首先采集收费数据,使用Flume将数据传入Kafka,然后使用Spark将数据存入Hive,留作原始数据记为ORG库,同时进行实时计算存入Oracle。根据原始数据,使用Hive SQL做ETL后再存入Hive作为计算数据记为ETL库,然后使用Spark对ETL库进行批量计算多种指标存入Oracle和Clickhouse数据库中供应用系统调用。

三、辅助决策系统应用

基于大数据的收费系统负责决策系统主要功能包括大屏展示、指标统计、算法分析、车辆查询、报告报表生成、指标库等。

(一)大屏展示

大屏展示将多种重要指标分类放在大屏上用于展示,包括以下三个场景。

1.交通态势场景:通过本场景能够实时掌握流量情况,包括当日出入口车流量、当日车型占比、当日每个小时的出入口和门架的车流量、各个路段的实时拥堵情况等。

2.收费运营场景:通过本场景能够实时掌握收费额情况,主要的指标包括各互通分时段的车流量、当日分时段的ETC和MTC收费额、每日的单车收费额和节假日的免费金额等。

3.分站运营场景:通过本场景能够掌握各收费站的情况,主要的指标包括年度收费目标完成情况、出入口流量、单车费额和新增上道车辆数等。

(二)指标统计

指标统计功能可对各类指标进行分析,可以自定义查询指定时间段下的收费站、车型、车种等合计、同比、环比数据,并支持折线图、柱状图和表格多种样式展示。指标主要包括车流量、收费额、免费车、有效征收率、车道占有率、车道拥堵指数、互通流量和跨省车流量等,通过对各类指标的查询能够使用户从多种角度了解运营情况。

(三)算法分析

本系统提供基础算法实现收费数据的自定义分析,算法包括时间序列预测、聚类、异常值检测和相关系数等。由于高速公路在车流量管控方面需要对车流量进行预测,本系统支持对不同场景下的车流量预测,预测算法包括SARIMA、Holt-Winters、Prophet等。

1.多周期车流量预测:车流量在不同周期的变化有较明显的规律,根据京石高速多年的历史流量数据,对未来一段周期(月、天、小时)进行预测,能够对各个入口、出口等通行车流做到实时监控、短期预测、长期预判。

2.节假日流量预测:节假日期间的流量一般比平时高很多,为了更好服务出行,需要进行流量预测。本功能根据历史节假日的流量趋势数据,对特定法定节假日的流量进行预测,掌握流量趋势,同时可实现主题报告生产。

3.恶劣天气影响预测:恶劣天气对车流量产生一定的影响,结合气象局数据对未来几天的恶劣天气进行预警,并使用算法分析恶劣天气影响流量情况辅助决策。

(四)车辆查询

平台具备车辆画像功能,通过车辆通行数据,生成了近40个指标来描述车辆,使用户多维度了解车辆情况,包括消费总金额、通行长度、最近一次通行时间、最多出入站口、总通行次数等。同时对车辆的轨迹进行查询,对稽核也有一定的意义。具体的应用功能如下。

1.车辆信息查询:本功能实现对特定车牌号的查询,展示该车辆的画像指标,可以精确了解每一个车辆的信息。

2.重点车辆查询:首先,用户可以根据消费总金额等指标进行排序,查询排名较高的车辆。其次,用户可以根据自定义指标的区间范围来查询满足条件的车辆,由此筛选出重点车辆。

3.车辆轨迹查询:根据车辆的通行信息,对特定车牌号在特定时间段内的通行纪录进行查询,并在GIS上展示。本功能可以实时查看每一辆车在一定时间段内的轨迹,有助于稽查稽核,及时发现车辆。

(五)报告报表生成

在工作中有很多常用的报告需要重复计算编制,也有一些需要根据原始数据自行计算指标并画图生成的图表报告。通过本功能,用户不仅可以选择常用报告直接生成,也可以从计算完成的指标库中选择需要的指标,直接组合生成自定义报告,改进了报告的编制方式,提升了工作效率。用户可以导出Word、Excel格式,方便进一步编辑。

本部分包含多种预制的报告报表,包含营收报告、进出站报告、门架报告、拥堵点位报告、分车型交通量表、单车费额对比表等。比如,营收主题对某月的营收流量和各站的营收流量生成对应的月报,报告中不仅有文字描述,也有图表,使用户清晰地了解某月的营收情况;拥堵点位报告则展示某一时间段内京石路的拥堵情况,能够使用户了解哪个是易拥堵点位,以更好地进行预警提醒和运营。

(六)指标库

在指标库中,预制了100多种常用指标,包括实时指标和定时指标,用于满足用户的多种查询需求,并将指标分为了流量、收费、路况、经营任务、收费员和称重等几类。用户可以单独在指标库页面进行查看下载等操作,也可以将自己更加关注的指标放入自己的关注列表中,方便查看。

四、结语

针对高速公路积累的大量数据,通过大数据技术搭建存储计算平台,并结合业务需求进行分析,在一定程度上可以提高收费运营效率和更好地服务公众出行,本文给出了具体的方案和应用可供参考。随着高速公路的信息化发展,未来可能会出现更多的需求,这也对如何继续挖掘数据背后的价值提出了新的挑战。大数据技术不断更新,及时将新的技术应用在数据挖掘中,也能进一步提升平台的计算能力和分析的准确性,发挥越来越大的作用。(狄洋)

(审核专家 程志恒)

版权所有:河北省交通运输厅 网站标识码1300000014 冀ICP备13004026号-3   联系方式
主办单位:河北省交通运输厅 冀公网安备 13010202002299号 维护单位:河北省交通运输厅宣传中心
分辨率1280*720以上;
访问量:
建议使用IE9.0以上浏览器或兼容浏览器

版权所有:河北省交通运输厅

网站标识码1300000014 冀ICP备13004026号-3

冀公网安备 13010202002299号

维护单位:河北省交通运输厅宣传中心

主办单位:河北省交通运输厅