接下来的两天,肖宿几乎泡在计算机系的实验室里。

他还在思考流形正则化的具体形式。

社交网络的高维嵌入本质上是一组向量,这些向量应该位於某个低维流形上,这是他的直觉,但需要严格的数学证明。

他在白板上画著示意图。

一个高维空间,里面有一个弯曲的低维流形,数据点分布在这个流形上。

“就像宇宙中的星系。”

李雨薇看著示意图说,“看起来散布在三维空间,但实际上可能分布在某些二维的膜上,这是弦理论的说法对吧?”

肖宿点头。

他最近在读理论物理,確实看到过类似的概念。

数学的奇妙之处就在於,不同领域的结构常常惊人地相似。

第二天上午,他在图书馆翻阅一本关於李群表示论的专著时,突然有了灵感。

那本书叫《李群与李代数的表示》,作者是法国数学家塞尔日·朗。

书中有一章讲齐性空间的几何,提到每个齐性空间都可以看作某个李群模去一个闭子群的商空间。

而在这个商空间上,李群自然地作用,给出丰富的对称性。

肖宿盯著书中的一段话看了很久:

“齐性空间上的几何由李群的表示理论完全决定。”

突然之间,之前模糊的想法变得清晰起来。

社交网络中用户的相似性关係可能构成某种近似对称性。

如果用户a和用户b相似,用户b和用户c相似,那么用户a和用户c也应该有某种相似性。

这不完全是对称的,但近似满足传递性。

这种“近似对称性”可以用李群的“软”作用来描述,即允许作用有小的误差。

如果把嵌入空间取为某个李群的齐性空间,那么嵌入向量之间的变换就可以用群元素表示,而嵌入的稳定性就对应於群作用的连续性。

这个想法非常大胆。

因为李群理论通常应用於理论物理和纯数学的深奥领域,很少有人把它用到算法设计这种“世俗”的问题上。

但肖宿觉得这很自然,数学工具没有高低贵贱之分,只有適用与否。

下午,肖宿带著这个想法回到实验室。

赵明远和几个博士生围过来,听他解释。

肖宿在白板上画了一个新的示意图。

“我们要找的不是一般的低维流形。”

“而是某个李群作用的轨道。更精確地说,是李群g模去一个闭子群h得到的齐性空间g/h。”

他在白板上写下:

设g是李群,h是闭子群,则齐性空间m=g/h上有一个自然的g作用:g·(xh)=(gx)h。

“如果我们的嵌入映射f:v→m把图的节点映射到齐性空间m中,那么节点间的相似性就可以用m上的距离来度量。”

“而这个距离在g作用下是不变的,如果两个嵌入向量相差一个群元素的作用,它们代表的节点应该具有相同的结构角色。”

实验室里很安静,只有肖宿的笔划过白板的声音。

几个博士生努力跟上,黄伟良偶尔点头,李雨薇皱著眉头,显然有些地方还没完全理解。

“但实际问题中,对称性不是完全的。”

赵明远指出,“社交网络中的关係不是完全对称的。”

“所以要用『软』作用。”

肖宿说,“允许群作用有误差。我们可以定义一个损失函数,包含两部分:一部分度量嵌入在齐性空间上的擬合优度,另一部分度量对称性破缺的程度。”

他写下了一个优化问题:

min_{f:v→m, g∈g} Σ_{v∈v} d(f(v), g·f(π(v)))2 + λ·Σ_{(u,v)∈e} |d(f(u),f(v)) - w(u,v)|

其中d是齐性空间上的距离,π是某个节点映射,w是边的权重,λ是正则化参数。

“这个优化问题可以用交替叠代法求解。”

肖宿说,“固定f优化g,固定g优化f。每一步都是凸优化或者有闭式解。”

当肖宿放下笔时,一套完整的理论框架已经呈现在白板上。

从李群和齐性空间的定义,到嵌入模型的构建,到优化算法的设计,再到理论性质的分析。

本章未完,点击下一页继续阅读。

其他类型小说相关阅读More+