接下来的两天,肖宿几乎泡在计算机系的实验室里。
他还在思考流形正则化的具体形式。
社交网络的高维嵌入本质上是一组向量,这些向量应该位于某个低维流形上,这是他的直觉,但需要严格的数学证明。
他在白板上画着示意图。
一个高维空间,里面有一个弯曲的低维流形,数据点分布在这个流形上。
“就像宇宙中的星系。”
李雨薇看着示意图说,“看起来散布在三维空间,但实际上可能分布在某些二维的膜上,这是弦理论的说法对吧?”
肖宿点头。
他最近在读理论物理,确实看到过类似的概念。
数学的奇妙之处就在于,不同领域的结构常常惊人地相似。
第二天上午,他在图书馆翻阅一本关于李群表示论的专著时,突然有了灵感。
那本书叫《李群与李代数的表示》,作者是法国数学家塞尔日·朗。
书中有一章讲齐性空间的几何,提到每个齐性空间都可以看作某个李群模去一个闭子群的商空间。
而在这个商空间上,李群自然地作用,给出丰富的对称性。
肖宿盯着书中的一段话看了很久:
“齐性空间上的几何由李群的表示理论完全决定。”
突然之间,之前模糊的想法变得清晰起来。
社交网络中用户的相似性关系可能构成某种近似对称性。
如果用户a和用户b相似,用户b和用户c相似,那么用户a和用户c也应该有某种相似性。
这不完全是对称的,但近似满足传递性。
这种“近似对称性”可以用李群的“软”作用来描述,即允许作用有小的误差。
如果把嵌入空间取为某个李群的齐性空间,那么嵌入向量之间的变换就可以用群元素表示,而嵌入的稳定性就对应于群作用的连续性。
这个想法非常大胆。
因为李群理论通常应用于理论物理和纯数学的深奥领域,很少有人把它用到算法设计这种“世俗”的问题上。
但肖宿觉得这很自然,数学工具没有高低贵贱之分,只有适用与否。
下午,肖宿带着这个想法回到实验室。
赵明远和几个博士生围过来,听他解释。
肖宿在白板上画了一个新的示意图。
“我们要找的不是一般的低维流形。”
“而是某个李群作用的轨道。更精确地说,是李群g模去一个闭子群h得到的齐性空间g/h。”
他在