组会随笔(2018-05-12)

Categories DM

两个报告,分别是关于轨迹中的交通流,以及深度学习在推荐系统中的应用。

由于主要是在做应用,是典型的问题驱动,所以这里仅仅列出一些有趣的问题。至于方法,我目前对深度学习不了解,所以不评述。

轨迹交通流有关的研究问题:

  • 某个地区出租车的供需预测
  • 交通灯控制(红绿灯 – 交通摄像头)

其中,第一个问题可以抽象成 时序数据上的回归问题,和传统的机器学习比较接近。第二个问题,在我自己了解到的方向中较少出现,因为是涉及到决策的东西。摄像头提供交通流数据,以此作为切换红绿灯或者红绿灯频率的决策基础,而决策也会影响下一个时间点的交通流。这个过程可以建模成强化学习。

此外,姚还提到了一些当前轨迹交通流研究的热门:

  • coordination in the transportation network
  • continual adaption with changing environment
  • events detection
  • data quality(sparsity, noise)

确实是很有趣的问题,但以实验室目前的环境,做不了。相信大部分同学都有这样的感觉,实验室研究的东西,虽然还是数据挖掘的主流方向,但已经脱离应用很远了;至于数据挖掘的基础理论研究,也不见得做的有多深入,因此处于很尴尬的境地。

失落会有一些,但乐观一点想,我们在研究的问题,至少是自己喜欢的,很好奇的问题。即使目前看,它对于学科的发展和社会的推动毫无作用。但我们自己还是在前进,每次向前走一点点,也是一件开心的事情。

何况,目前的环境和研究的内容,对于长期发展,还是存在一定的帮助:

虽然研究的内容是传统的数据挖掘与机器学习,以shallow model为主,但其中涉及到的基础问题也是DL中关注的问题。与一开始就做DL的同学相比,我们对于各种基础理论的学习,如压缩感知,线性代数,各种凸优化非凸优化;以及一些不入流的“小技巧”,锚点的学习,信息的传播和最大化间隔,等等;要更加熟悉。这些思想,在DL中也存在,也还待发掘。保持一种积极学习的心态,兼收并蓄,相信长期的积累,还是会带来回报。

十年了。