Menu Home

Neural Relational Inference 初探

最近看了一些 NRI工作,从 18 年 Kipf 的 ICML 到 22 年 23 年的一些工作。这短短五年,已经有非常多的学者投入到了 NRI 这个分支。

在读 Kipf 那份工作的时候,我有个问题是,这个和一般的 time series prediction 有什么不同?还是说,它们其实一样,只是又换了个名字?Kipf 的 abstract 里是这么描述的:

The neural relational inference (NRI) model: an unsupervised model that learns to infer interactions while simultaneously learning the dynamics purely from observational data.

我对于这个问题的理解是:现有的 time series prediction 相关工作,可能更多的是判别模型,但NRI,希望学习内在的dynamics,偏向于生成模型。这个观点不一定对。

方法层面,Kipf 的这个工作用了 VAE,encoder 和 decoder 两个部分。后续的挺多工作,在它的基础上,玩出了花。

因为我自己主要是做超图相关的工作,所以又去检索了 hypergraph+NRI,最早的一篇可能是 22 年的一篇 CVPR,从数据中学习出 multi-scale hypergraph,然后把 node-edge 交互改成了 node-hyperedge 交互,名曰可以更好地刻画 agents 之间的活动。而在实验层面上,依旧使用的是 NBA 这样的简单数据集,预测球员将要移动的一系列位置。到今天,引用它的工作,已经超过了 30 个,果然是热门领域。

尽管热门,我觉得 NRI 还是挺虚的,不清楚它落地的方向。直到朋友和我说,这个在自动驾驶中很受关注,我才恍然大悟:

绝大多数的自动驾驶轨迹预测都需要这些表示学习,比如车辆和多个路人之间的交互。

Categories: DM

Tagged as:

peiyan