7月中旬开始第一篇论文的阅读,至今将近两个月了,除去半个月的休息,实际上也有一个半月了,走马观花的看了不少文献,今天坐下来,思考一下,有哪些收获。
先是大方向定了一下,时空大数据的挖掘应用。之前也没有注意网上搜索文献阅读的方法,只是依稀的记得,要先从综述文献阅读开始,了解领域的全景和相关的技术应用。时空大数据也是大数据,一些基本的方法也是继承应用的,譬如数据的收集、预处理,分析方法中的聚类、分类、关联分析和预测等等。
大数据包括图像、语音和视频等。大数据到地理空间大数据再到时空大数据,是一个地理位置和时间约束的增强,再到轨迹方面是一个具体应用范畴。不知道这样理解对不对,权当如此把,期待以后认识加深再加以修正。轨迹方面,基于目前所看论文来讲,主要是基于出租车的GPS来研究出租车的调度,居民出行方式的选择,城市的居住区和工作区的分布发现,交通流量预测,城市规划等等,基于手机定位方面,宏观上有人物迁徙热力图,旅游景点的规划,基于客流量的商家选址研究,共享单车的投放,另一方面的微观形式,个人的出行和活动的发现,基于历史轨迹的目的地预测,伴随人员的发现等等。
数据的来源多是GPS和手机信令数据,还有多数据的融合方面,有GPS和POI数据的结合,用准确的签到数据取修正GPS误差,我以为这是一个新方向,不想也有很多人加以研究实现了,再读在想吧。
最近KDD2018上京东金融和摩拜单车合作的一篇论文《利用共享单车轨迹数据的违章停车检测》,应该是相对较新,而且轨迹大数据的应用新领域扩展吧。
摘要:
违章停车是大城市中普遍存在的问题。占道的违章停车引起交通拥堵,也会引发交通事故。仅仅通过目前的交警巡逻、摄像监控方案,很难覆盖整个城市,并且会耗费的不小的人力物力。近年来,共享单车的兴起产生了大量且质量高的轨迹数据,为我们检测违章停车提供了新的机遇。因为我们观察到,大多数违章停车发生在路边,会对自行车骑行轨迹造成影响。为此,我们提出了基于共享单车轨迹数据的违章停车检测技术。
这项工作包括一个预处理模块,进行有针对性的相应轨迹清洗、路网匹配、轨迹索引;以及一个检测模块,基于假设检验与轨迹融合进行检测。
在预处理部分,通过路网匹配去掉了匹配到高速路等自行车罕至地域的轨迹、与道路几乎垂直的、偏离道路过远的轨迹,同时因为违章停车对正向和反向骑行的自行车影响程度不同,因此将轨迹按其行进方向分开,用不同的模型分别刻画。
在检测部分,主要强调三点考量:1. 不区分不同模式的违章停车,将其全部视为一类。将其多样性内化。2. 不检测单条轨迹,而是把不同轨迹合在一起进行一次判断,排除可能影响单条轨迹的诸多误差。3. 对每条路单独建模,排除不同地区障碍物不同带来的 GPS 误差分布差异。检测模型将深夜的自行车轨迹视为基线数据,然后用 KS 检验判断白天与深夜的样本是否处于同一个分布,输出一个属于同一分布的置信度,然后用真实违停检验数据集确定分类的阈值。
这项研究的成果已经投入实际应用,能够实时检测整个城市里面什么地方出现了违章停车,不需要派管理员去看就能够自动识别,然后把有限的人力精准地投放到那些违章的路段。交管人员从“扫街”式监管,变成针对核心路段重点监测,提高了效率,节省了人力,有助于治理违章停车现象。
科研的大门何时才能入 ……