Menu Home

Interpretable Subgraph Feature Extraction for Hyperlink Prediction

最近刷到一位教授谈做会议报告的心得:可以沿着论文本身的逻辑叙述,但更重要的是阐述背后的东西,要像讲故事一样的讲论文报告。会上的时间有限,如果报告不足够吸引人,做的问题也不相关,没多少人愿意去读你的论文。

那么我可以以什么样的逻辑来讲这份工作呢?如果按照论文本身的逻辑:目前没有基于子图做超图上的链路预测的工作,基于子图的方法可以更好地找到 local characteristics也可以一定程度上解决 scalability concern,于是我填补了这个空白,然后介绍方法。这样看是不怎么吸引人。

如果换个思路呢?我可以从一些大家都很熟悉的东西出发,比如 SEAL,回顾一下相关的 labeling trick,然后讲这一系列方法的核心在于区分核心点(focal edge 的两点)与其它点,然后把这么个结果丢到 GCN 里头去,提取特征并且做binary classification。这么做,如果网络再深一些,加一些非线性映射进来,提取到的特征就不太好解释了。从源头上思考,很多图上的特征都能用随机游走的角度来解释,那么围绕 focal nodes,通过 permutation 提取相关的子图特征,不就可以有较好的解释性,又可能有较好的分类结果?在另一边,考虑到不同密度的超图投影到普通图,带来的边的权重可能很不一样,所以,需要设计一种策略,让对不同密度的超图都能提取到好的特征。于是。我们对 permutation 做了细化,不同于之前的 permutation-based subgraph feature extraction,只考虑 focal edge 是否存在,这里采取了 edge weakening 的策略,计算了在不同程度 permutation 下,loop 与 non-loop walk 相关概率的变化,并以此构建特征,结果挺好的。

这份工作做完的时候的感觉很舒畅,提取到的特征可以解释,在不同密度的超图上的结果都挺好,做了大量实验分析提取到的特征,对 edge weakening scheme 的效果也做了实验验证。最后,这份工作一投就中,在预期之中。

ICDM23,上海见。

Categories: DM

Tagged as:

peiyan

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注