Copula

时间：2023-12-20

导读：Copula.金融数据常体现相关性，传统多元分析的统计方法通常假设联合正态分布，然而这种做法的局限性很强，因为金融数据通常并不体现“正态”。.Copula: 提供灵活与通用的生成给定单变量边际分布的多元分布。由于边际分布已确定，联合分布则能通过这已确定的边际分布变换到单位立方体

Copula

金融数据常体现相关性，传统多元分析的统计方法通常假设联合正态分布，然而这种做法的局限性很强，因为金融数据通常并不体现“正态”。

Copula: 提供灵活与通用的生成给定单变量边际分布的多元分布。由于边际分布已确定，联合分布则能通过这已确定的边际分布变换到单位立方体 cube: \([0, 1]\) 上。

一个 \(n\) 元的 copula 是在单位立方体 cube \([0, 1]\) 上的多元分布，并且其边际的分布为 \(\mbox{Uniform}(0, ~ 1)\)。

先从二元的 copula 入手

Definition 1.

设有一个定义在 \([0, 1] \times [0, 1]\) 上的二元函数 \(G\)，如果：

\[\forall u, v \in [0, 1]: ~ G(u, 0) = G(0, v) = 0 \]

则称 bivariate function \(G\) is grounded 。

定义 1. 的意思即是说一个 grounded bivariate function，必定满足定义域为 \([0, 1] \times [0, 1]\)，并且函数在定义域正方形靠在 \(x, y\) 两轴上的边上取值为 \(0\)。

Definition 2.

如果：

\[\forall u{1} \leq u{2}, ~ v{1} \leq v{2}: ~ G(u{2}, v{2}) - G(u{2}, v{1}) - G(u{1}, v{2}) + G(u{1}, v{1}) \geq 0 \]

那么称：bivariate function \(G\) is 2-increasing 。并且，如果 \(G\) 同时二阶可微，那么：

\[\mbox{2-increaing} \quad \iff \quad \frac{\partial^{2}G(u, v)}{\partial u \partial v} \geq 0 \]

这里前半句的意思实际是，在 \([0, 1] \times [0, 1]\) 的正方形区域内，任意再取一个小正方形，使得四个点坐标分别为：左下： \((u{1}, v{1})\)，右下：\((u{2}, v{1})\)，左上：\((u{1}, v{2})\) 以及右上： \((u{2}, v{2})\)。那么此处条件实际为：

\[\mbox{左下 + 右上 \(\geq\) 左上 + 右下} \]

Definition 3.

一个二元 copula \(C\) 是一个定义在 \([0, 1] \times [0, 1]\) 上的函数，同时满足：

(a) \(C\) is grounded.

(b) \(C\) is \(\mbox{2-increasing}\).

Corollary 1.

一个二元函数 当且仅当 它定义在 \([0, 1] \times [0, 1]\) 上且边际分布服从均匀分布时（很显然只能是\(\mbox{Unif}[0, 1]\) 的均匀分布）为一个 copula。

Proof.

\(\Longleftarrow\)

假设有一个二元函数 \(f_{X, Y}(x, y)\) 其中 \(x, y \in [0, 1]\)，并且对于 marginal distribution 有：

\[\int^{1}{0} f{X, Y}(x, y) ~ dy= f{X}(x) = a \in \mathbb{R}\
\int^{1}{0} f{X, Y}(x, y) ~ dx= f{Y}(y) = b \in \mathbb{R}\\ \]

首先，copula 的定义域条件（i.e. \([0, 1] \times [0, 1]\)）已经给出。并且显然 \(a = b = 1\)，因为：

\[\int^{1}{0}\int^{1}{0} f{X, Y}(x, y) ~ dy~dx = 1 = \int^{1}{0} a ~ dx = a\\ \int^{1}{0}\int^{1}{0} f{X, Y}(x, y) ~ dx~dy = 1 = \int^{1}{0} a ~ dy = b\\ \]

其次，当 \(x=0\) 时，

\[\begin{align} \int^{1}{0} f{X, Y}(0, y) ~ dy = f{X}(0) = a \quad & \implies \quad \frac{\partial \int^{1}{0} f{X, Y}(0, y) ~ dy}{\partial y} = \frac{\partial f{X}(x)}{\partial y} = 0\\ & \implies \quad f_{X, Y}(0, y) = 0 \end{align} \]

同理，当 \(y = 0\) 时，

\[\begin{align} \int^{1}{0} f{X, Y}(x, 0) ~ dx = f{Y}(0) = b \quad & \implies \quad \frac{\partial \int^{1}{0} f{X, Y}(x, 0) ~ dx}{\partial x} = \frac{\partial f{Y}(y)}{\partial x} = 0\\ & \implies \quad f_{X, Y}(x, 0) = 0 \end{align} \]

因此函数 \(f_{X,Y}(x,y)\) is grounded.

令：

\[F{X, Y}(x, y) = \int^{y}{0} \int^{x}{0} f{X, Y}(s, t) ~ ds ~ dt \]

那么对于：

\[\begin{align} \forall y \in [0, 1]: ~ F{X, Y}(1, y) & = \int^{y}{0} \int^{1}{0} f{X, Y}(s, t) ~ ds ~ dt \\ & = \int^{y}{0} f{Y}(t) ~ dt \\ & = \int^{y}_{0} 1 ~ dt \\ & = y \end{align} \]

同理：

\[\begin{align} \forall x \in [0, 1]: ~ F{X, Y}(x, 1) & = \int^{1}{0} \int^{x}{0} f{X, Y}(s, t) ~ ds ~ dt \\ & = \int^{x}{0} \int^{1}{0} f{X, Y}(s, t) ~ dt ~ ds \\ & = \int^{x}{0} f{X}(s) ~ ds \\ & = \int^{x}{0} 1 ~ dt \\ & = x \end{align} \]

对于 \(\forall x{1} \leq x{2}, ~ y{1} \leq y{2}, ~ x{1}, x{2}, y{1}, y{2} \in [0, 1]\)：

\[\begin{align} & F{X, Y}(x{2}, y{2}) + F{X, Y}(x{1}, y{1}) - F{X, Y}(x{2}, y{1}) - F{X, Y}(x{1}, y{2}) \\ = & \int^{y{2}}{0} \int^{x{2}}{0} f{X, Y}(s, t) ~ ds ~ dt + \int^{y{1}}{0} \int^{x{1}}{0} f{X, Y}(s, t) ~ ds ~ dt ~ - \& \int^{y{2}}{0} \int^{x{1}}{0} f{X, Y}(s, t) ~ ds ~ dt - \int^{y{1}}{0} \int^{x{2}}{0} f{X, Y}(s, t) ~ ds ~ dt\\ = & \int^{y{2}}{0} \left( \int^{x{2}}{0} f{X, Y}(s, t) ~ ds - \int^{x{1}}{0} f{X, Y}(s, t) ~ ds \right) ~ dt ~ + ~ \\ & \int^{y{1}}{0} \left( \int^{x{1}}{0} f{X, Y}(s, t) ~ ds - \int^{x{2}}{0} f{X, Y}(s, t) ~ ds \right) ~ dt \\ = & \int^{y{2}}{0} \int^{x{2}}{x{1}} f{X, Y}(s, t) ~ ds ~ dt ~ - \int^{y{1}}{0} \int^{x{2}}{x{1}} f{X, Y}(s, t) ~ ds ~ dt \\ = & \int^{y{2}}{y{1}} \int^{x{2}}{x{1}} f_{X, Y}(s, t) ~ ds ~ dt \end{align} \]

因此，由于 \(x{2} \geq x{1}, ~ y{2} \geq y{1}\)，并且对于 \(\forall x, y \in [0, 1]: ~ f_{X, Y}(x, y) \geq 0\)，所以根据 Riemann Integration 的基本性质，可得：

\[ \int^{y{2}}{y{1}} \int^{x{2}}{x{1}} f_{X, Y}(s, t) ~ ds ~ dt \geq 0 \]

这意味着：

\[\forall x{1} \leq x{2}, ~ y{1} \leq y{2}, ~ x{1}, x{2}, y{1}, y{2} \in [0, 1]: ~ F{X, Y}(x{2}, y{2}) + F{X, Y}(x{1}, y{1}) - F{X, Y}(x{2}, y{1}) - F{X, Y}(x{1}, y{2}) \geq 0 \]

因此函数 \(F_{X,Y}(x, y)\) is 2-increasing 。

综上所述，由 copula 的定义，即证毕函数 \(F_{X,Y}(x,y)\) 为一个 copula。

\(\Longrightarrow\)

假设函数 \(C(u, v)\) 是一个 copula，那么它定义在 \([0, 1] \times [0, 1]\) 之上，即 \(u, v \in [0, 1]\)。

Copula 满足 2-increasing , 那么对于 \(\forall u{1} \leq u{2}, ~ v{1} \leq v{2}\)：

\[C(u{2}, v{2}) - C(u{2}, v{1}) - C(u{1}, v{2}) + C(u{1}, v{1}) \geq 0 \]

同时 \(C(u, v)\) 还应当满足：

\[\forall u, v \in [0, 1]: ~ C(u, 1) = C(1, v) = 1, ~ C(u, 0) = C(0, v) = 0 \]

那么自然能够求得二维 copula \(C\) 的两个边缘分布：

\[C{U} = \int^{1}{0} C(u, 1) ~ du = \int^{1}{0} 1 ~ du = 1\\ C{V} = \int^{1}{0} C(1, v) ~ dv = \int^{1}{0} 1 ~ dv = 1 \]

故 Corollary 1. 证毕。

Corollary 2.

以下三个函数都为 copulas：

（a） \(C^{-}(u, v) = \max(u + v - 1, ~ 0)\)

（b） \( C^{+}(u, v) = \min(u, ~ v)\)

（c） \(C^{\perp}(u, v) = u \cdot v\)

Definition 4.

对于两个 copulas: \(C{1}\) 和 \(C{2}\)，如果对于 \(\forall u, v \in [0, 1]\)，都满足 \(C1(u, v) \leq C{2}(u, v)\)，则称 \(C{1}\) 小于 \(C{2}\)，记作 \(C{1} \prec C{2}\)。

Corollary 3.

对于任意一个 copula \(C\), 都有：\(C^{-} \prec C \prec C^{+}\)。

Proof.

Copula \(C\) 是一个如下所示的二元函数：

\[C: [0, 1] \times [0, 1] \longrightarrow \mathbb{R}, \qquad (u, v) \longrightarrow C(u, v) \]

根据定义，有：

\[\forall u \in [0, 1]: ~ C(u, 1) = u\\ \forall v \in [0, 1]: ~ C(1, v) = v \]

现在，我们在函数的正方形定义域 \([0, 1] \times [0, 1]\) 内构造另外一个正方形，其中它的四个顶点的坐标分别为：

\[(u, 0), ~ (1, 0), ~ (1, v), ~ (u, v) \]

根据 2-increasing 的性质，我们有：

\[C(1, v) + C(u, 0) \geq C(1, 0) + C(u, v) \]

一个 copula 根据定义必须 grounded，这意味着：

\[C(u, 0) = C(1, 0) = 0 \]

因此：

\[C(1, v) \geq C(u, v) \]

相似地，我们可以建立另外一个正方形，通过相同操作得到：

\[C(u, 1) \geq C(u, v) \]

因此我们已经证明：

\[\min(u, v) \geq C(u, v) \]

欲想证明 \(C(u, ~ v) \geq C^{-}(u, v)\)，首先注意到：

\[\begin{align} C(u, v) & = P(U \leq u, ~ V \leq v) = P(U \leq u) + P(V \leq v) - P(\left\{ U \leq u \right\} \cup \left\{ V \leq v \right\})\\ & \geq u + v - 1 \end{align} \]

根据定义，我们有：

\[C(u, v) \geq 0 \]

因此：

\[C(u, v) \geq \max(u + v - 1, ~ 0) = C^{-}(u, ~v) \]

我们最终可得：

\[C^{-}(u, v) \leq C(u, v) \leq C^{+}(u, v) \]

Sklar Theorem (Sklar, 1959)

令 \(F{1}\) 和 \(F{2}\) 为两个单变量分布函数，那么以下结论成立：

如果 \(C\) 是一个 copula，那么 \(C(F{1}(x), ~ F{2}(y))\) 是一个 bivariate distribution function。
若 \(F(x, y)\) 是一个 bivariate distribution function，且拥有边界分布 \(F{1}\) 和 \(F{2}\)，那么恰好存在一个 copula \(C\) 使得 \(F(x, y) = C(F{1}(x), ~ F{2}(y))\)。

注：在 2. 中，copula 可以被表示为 \(C(u, v) = F\left( F^{-1}{1}(x), ~ F^{-1}{2}(y) \right)\)

Gaussian Copulas

对于一个二元高斯（正态）分布，其边际密度函数（marginal P.D.F.）分别为 \(N(\mu{1}, \sigma{1}^{2})\) 和 \(N(\mu{2}, \sigma{2}^{2})\)，且两个随机变量的相关系数为 \(\rho\)，我们则可以通过 Sklar Theorem 中的 1. 来求得 copula C。因为在对两个正态随机变量进行标准化（即 \(\frac{X - \mu{1}}{\sigma{1}}\) 和 \(\frac{Y - \mu{2}}{\sigma{2}}\)）后，copula C 不再取决于边际函数（即两个正态随机变量）的变量与方差，而是仅仅取决于相关系数 \(\rho\)，即：

令 \(\phi\) 记为标准正态分布，令 \(\phi_{\rho}\) 记作两个边际函数皆为标准正态分布的二元高斯分布，且两边际随机变量的相关系数为 \(\rho\)，我们则有：

\[C^{G}{\rho}(u, v) = \phi{\rho}\left( \phi^{-1}(u), ~ \phi^{-1}(v) \right) \]

同时，我们称 \(\left\{ C^{G}_{\rho} : \rho \in [−1, 1] \right\}\) 为 “the family of Gaussian Copulas“。

Archimedean Copulas

生成器（Generator） \(g\) 是一个在 \([0, 1]\) 上严格递减的函数，且 \(g(1) = 0\)。一个 generator \(g\) 所对应的 Archimedean Copula 记作：

\[C^{A}_{g}(u, v) = g^{-1}\left( g(u) + g(v) \right) \]

其中，当 \(g(0) < \infty\) 时，定义：\(g^{-1}(x) = 0\) for \(\forall x \geq g(0)\)。

Gumbel

令：

\[g_{\alpha}(u) = (−\log{u})^{\alpha}, \qquad \alpha \in [1, \infty] \]

此时：

\[C_{\alpha}(u, v) = e^{-\left[ (-\log{u})^{\alpha} + (-\log{v})^{\alpha}\right]^\frac{1}{\alpha}} \]

Clayton

令：

\[g_{\alpha}(u) = \begin{cases} \alpha^{−1} \left( u^{-\alpha} − 1 \right) \qquad \quad \alpha \in \left[−1, 0 \right) \cup \left(0, \infty \right)\
-\log{u} \qquad \qquad \qquad \alpha = 0 \end{cases} \]

那么其对应的 Copula 为：

\[C_{\alpha}(u, v) = \frac{1}{\left[ \max(u^{-\alpha} + v^{-\alpha} - 1, ~ 0) \right]^{\frac{1}{\alpha}}} \qquad \qquad \alpha \in \left[−1, 0 \right) \cup \left(0, \infty \right) \]

Frank

令：

\[g_{\alpha}(u) = \begin{cases} -\log\left[ \frac{e^{-\alpha u}-1}{e^{-\alpha}-1} \right] \qquad \quad \alpha \in \mathbb{R} \setminus \left\{ 0 \right\} \\ -\log{u} \qquad \qquad \qquad \alpha = 0 \end{cases} \]

那么其对应的 Copula 为：

\[C_{\alpha}(u, v) = -\frac{1}{\alpha} \cdot \log\left[ 1 + \frac{(e^{-\alpha u}-1)(e^{-\alpha v}-1)}{e^{-\alpha}-1} \right] \qquad \qquad \alpha \in \mathbb{R}\setminus \left\{ 0 \right\} \]

上一篇：软件开发项目文档系列之三如何撰写

下一篇：代码大全-如何建立一个高质量的子

阅读

内容

Kurator v0.3.0版本
2023-12-08

摘要： 2023年4月8日，Kurator正式发布v0.3.0版本。.本文分享自华为云社区《华为云 Kurator v0
智能智能保健设备
2023-10-04

智能保健设备产品介绍.产品概述.我们的智能保健设备结合了最新的智能技术和保健功能，旨在帮助用户监控和**自身的健康状况。
智能智能娱乐设备
2023-10-04

产品功能介绍.1. 智能娱乐设备.我们的智能娱乐设备是一款结合了智能技术和娱乐功能的产品。它拥有丰富的娱乐资源，包括音乐
***容量规划与扩展服务
2023-10-02

***容量规划与扩展服务.产品功能.我们的服务器容量规划与扩展服务旨在帮助客户有效地规划和扩展其服务器容量，以满足不断增
数据分析和挖掘软件
2023-10-01

数据分析和挖掘软件.产品功能.我们的数据分析和挖掘软件提供了丰富的功能，能够帮助用户快速有效地实现数据分析和挖掘，包括数
智能手机
2023-10-01

产品功能介绍：智能手机.智能手机是一款集通讯、娱乐、办公等功能于一体的移动智能设备。首先，智能手机具有强大的通讯功能，支
电子元件连接器
2023-10-02

电子元件连接器.产品功能.电子元件连接器是一种用于连接不同电子元件的重要组件。它可以提供可*的电气连接，从而实现各种电子
*****与保养服务
2023-10-02

*****与保养服务.产品介绍.我们的服务器维护与保养服务是为了帮助企业解决***运行过程中出现的各种问题，确保服务器的
智能智能安防设备
2023-10-05

产品介绍.我们的智能安防设备是一款结合了最新科技和人性化设计的智能家居产品。它不仅拥有传*安防设备的监控功能，还具备智能
智能医疗设备
2023-10-02

智能医疗设备产品介绍.智能医疗设备是一款集成了先进技术的高科技产品，旨在提高医疗保健的效率和质量。该设备主要应用于医院、
***性能优化服务
2023-10-02

***性能优化服务.我们的服务器性能优化服务是针对企业和个人用户的***性能提升及优化解决方案。无论您是在使用自己的服务