沃瑟斯坦度量(英語:Wasserstein metric)又稱為沃瑟斯坦距離(Wasserstein distance)、坎托羅維奇–魯賓施泰因度量(Kantorovich–Rubinstein metric),在數學中是指某一給定度量空間
上概率分布之間的距離函數,其名稱源於俄裔美國數學家列昂尼德·沃瑟斯坦。
直觀而言,可以將每個概率分布都看作
上堆積的單位數量的土堆,則沃瑟斯坦度量便是指將一個土堆變成另一土堆的最小代價,可定義為需要移動的土壤量乘以需要移動的平均距離。這一問題於1781年由法國數學家加斯帕爾·蒙日首次正式提出。基於上述土堆類比,該度量在計算機科學中也被稱為推土機距離。
「沃瑟斯坦距離」這一名稱是蘇聯數學家羅蘭·多布魯申於1970年提出的,他在沃瑟斯坦關於描述大型自動機系統的馬爾可夫過程的工作中了解到了這一概念。[1]不過早在1939年,另一位蘇聯數學家列昂尼德·坎托羅維奇就在研究貨物的最優運輸問題時最早定義了該度量。[2]因此一些學者認為使用「坎托羅維奇度量」或「坎托羅維奇距離」來稱呼此度量更為恰當。
對於一個度量空間
,假設
上每個博雷爾概率測度都是拉東測度(即該度量空間為拉東空間)。對有限
,
表示
上所有有
階矩的概率測度
的集合,即
中存在
滿足
![{\displaystyle \int _{M}d(x,x_{0})^{p}\,\mathrm {d} \mu (x)<\infty .}](https://wikimedia.org/api/rest_v1/media/math/render/svg/cfdd7f0ee5750bd24d5fc9b91705a02a463b0849)
於是,
中兩個概率測度
和
之間的
階沃瑟斯坦距離可定義為
![{\displaystyle W_{p}(\mu ,\nu ):=\left(\inf _{\gamma \in \Gamma (\mu ,\nu )}\int _{M\times M}d(x,y)^{p}\,\mathrm {d} \gamma (x,y)\right)^{1/p},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/29baf892051625c69a9c3ba2f0604f0fbf153330)
其中
表示
上所有測度的集合,即
與
的所有耦合組成的集合。
此外,沃瑟斯坦度量也可等效地定義為
![{\displaystyle W_{p}(\mu ,\nu )=\left(\inf \operatorname {\mathbf {E} } {\big [}d(X,Y)^{p}{\big ]}\right)^{1/p},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/73ee91d98dfcac223e1a4eaa2c3161358c57ed21)
其中
表示隨機變量
的期望值,下確界則由隨機變量
和
的所有聯合分布確定,它們分別對應邊緣分布
和
。
與最優運輸問題的聯繫[編輯]
x軸與y軸上分別繪有兩個一維分布
和
,中間是兩者一種可能的聯合分布(不唯一),而這一聯合分布即定義了
和
之間的一個運輸方案。
理解上述定義的一種方法是將其與最優運輸問題聯繫起來。對於空間
上的某一質量分布
,我們希望以某種方式運輸其質量,使其轉化同一個空間中的另一分布
,即將「土堆」
轉換為「土堆」
。兩者的總質量必須相同,因而可以不失一般性地假設
和
是總質量為1的概率分布。此外還需假設代價函數
![{\displaystyle c(x,y)\mapsto [0,\infty ),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9bb8e8a98b1406f1a072a664bf27e5c9b16f74bd)
表示從點
運輸質量到點
的代價。一個從
到
的運輸方案可以用函數
來描述,該函數表明從
移動到
的質量。一個運輸方案
必須滿足以下性質
![{\displaystyle {\begin{aligned}\int \gamma (x,y)\,\mathrm {d} y=\mu (x),\\\int \gamma (x,y)\,\mathrm {d} x=\nu (y),\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/949fbd9d46bd7db425a82837346572b6d31a7332)
前者表示從某一點
移到其他所有點的土堆總質量必須等於最初該點
上的土堆質量,後者則表示從所有點移到某一點
的土堆總質量必須等於最終該點
上的土堆質量。
這一性質相當於要求
是邊緣分布
與
對應的聯合概率分布。於是可得到運輸方案
的總代價
![{\displaystyle \iint c(x,y)\gamma (x,y)\,\mathrm {d} x\,\mathrm {d} y=\int c(x,y)\,\mathrm {d} \gamma (x,y).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/81544b44245fd9158bed715cd19bcd005b261679)
方案
並不是唯一的,所有可能的運輸方案中代價最低的方案即為最優運輸方案。最優運輸方案的代價為
![{\displaystyle C=\inf _{\gamma \in \Gamma (\mu ,\nu )}\int c(x,y)\,\mathrm {d} \gamma (x,y).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/dba03c4615f3b21da4569e8b1993ed36cf91b777)
如果兩點之間移動的代價等於兩點之間的距離,那麼最小代價則與
距離等價。
參考文獻[編輯]