相关性
什么是相关性?¶
在金融和投资行业中,相关性是一种统计量,用于衡量两种证券彼此相关的变动程度。相关性用于高级投资组合管理,计算为相关系数,其值必须介于 -1.0 和 +1.0 之间。
主要内容¶
- 相关性是一种统计量,用于衡量两个变量彼此相关的变动程度。
- 在金融领域,相关性可以衡量股票与基准指数(如标准普尔 500 指数)的变动关系。
- 相关性与多元化密切相关,多元化是指通过投资于不相关的资产来减轻某些类型风险的概念。
- 相关性衡量的是关联性,但不能表明 x 是否导致 y,反之亦然,或者关联性是否由第三个因素引起。
- 相关性最容易通过散点图识别,特别是当变量具有非线性但仍然很强的相关性时。
相关性可以告诉你什么¶
相关性显示了两个变量之间关系的强度,并以相关系数的数值表示。相关系数的值范围在 -1.0 和 1.0 之间。
完全正相关意味着相关系数正好是 1。这意味着当一种证券向上或向下移动时,另一种证券以相同的方向同步移动。完全负相关意味着两种资产向相反的方向移动,而零相关意味着根本没有线性关系。
例如,大盘共同基金通常与标准普尔 (S&P) 500 指数具有高度正相关性,接近于 1。小盘股票往往与标准普尔指数呈正相关,但相关性不高,约为 0.8。
然而,看跌期权价格及其标的股票价格往往呈负相关。看跌期权赋予所有者权利(但没有义务)在指定的时间范围内以预先确定的价格出售特定数量的标的证券。
当标的股票价格下跌时,看跌期权合约会变得更有利可图。换句话说,随着股票价格上涨,看跌期权价格下降,这是一种直接且高幅度的负相关。
如何计算相关性¶
有几种计算相关性的方法。本文将进一步讨论最常用的方法,即皮尔逊积矩相关。皮尔逊积矩相关衡量两个变量之间的线性关系。它可以用于任何具有有限协方差矩阵的数据集。以下是计算相关性的步骤。
重要提示: 为了避免复杂的的手动计算,请考虑使用 Excel 中的 CORREL 函数。
使用皮尔逊积矩相关方法,可以使用以下公式找到相关系数 r:
相关性示例¶
投资经理、交易员和分析师发现计算相关性非常重要,因为多元化带来的风险降低收益依赖于此统计量。金融电子表格和软件可以快速计算相关性的值。
作为一个假设的例子,假设分析师需要计算以下两个数据集的相关性:
X: (41, 19, 23, 40, 55, 57, 33)
Y: (94, 60, 74, 71, 82, 76, 61)
找到相关性涉及三个步骤。首先是加总所有 X 值以找到 SUM(X),加总所有 Y 值以找到 SUM(Y),并将每个 X 值与其对应的 Y 值相乘,然后将它们相加,以找到 SUM(X,Y):
SUM(X) = (41 + 19 + 23 + 40 + 55 + 57 + 33) = 268
SUM(Y) = (94 + 60 + 74 + 71 + 82 + 76 + 61) = 518
SUM(X,Y) = (41 x 94) + (19 x 60) + (23 x 74) + ... (33 x 61) = 20,391
下一步是取每个 X 值,将其平方,然后将所有这些值相加,以找到 SUM(x^2)。对于 Y 值也必须这样做:
SUM(X^2) = (41^2) + (19^2) + (23^2) + ... (33^2) = 11,534
SUM(Y^2) = (94^2) + (60^2) + (74^2) + ... (61^2) = 39,174
注意到有七个观察值 n,可以使用以下公式找到相关系数 r:
在这个例子中,相关性将是:
r = 0.54
相关性与投资组合多元化¶
在投资中,相关性在与多元化投资组合相关时最为重要。希望降低风险的投资者可以通过投资于不相关的资产来实现。例如,考虑一位拥有航空公司股票的投资者。如果发现航空业与社交媒体行业的相关性较低,则投资者可能会选择投资社交媒体股票,因为他们知道一个行业受到的负面影响可能不会影响另一个行业。
这通常是考虑跨资产类别投资时的方法。股票、债券、贵金属、房地产、加密货币、商品和其他类型的投资彼此之间具有不同的关系。虽然有些可能高度相关,但如果它们不相关,则另一些可能会作为对冲来分散风险。
注意: 可以分散掉的风险称为非系统性风险。这种类型的风险特定于公司、行业或资产类别。投资于不同的资产可以降低投资组合的相关性,并减少您面临的非系统性风险。
特别注意事项¶
相关性通常由其他统计考虑因素决定并与之相关。当使用统计数据分析变量时,通常会引用相关性。
在统计学中,p 值用于指示研究结果是否具有统计学意义。可以确定两个变量是相关的,但可能没有足够的佐证来将其作为强有力的主张。高 p 值表明有足够的证据可以有意义地得出结论,即总体相关系数与零不同。
可视化两个变量是否相关的最简单方法是使用散点图以图形方式描绘它们。散点图上的每个点代表一个样本项目。散点图的 x 轴代表正在测试的变量之一,而散点图的 y 轴代表另一个变量。
两个变量的相关系数通常以图形方式表示为一条线性线,用于显示两个变量的关系。如果两个变量呈正相关,则可以在散点图上绘制一条递增的线性线。如果两个变量呈负相关,则可以绘制一条递减的线性线。数据点关系越强,每个数据点就越接近这条线。
当分析可能具有变化关系的更复杂数据时,散点图可能更有用。例如,两个变量可能在某个点之前呈正相关,然后它们的关系变为负相关。这种非线性关系可能更难使用公式识别,但在散点图上绘制时更容易发现。
最后,当散点图包含密度阴影时,可以轻松地描绘相关性。密度阴影或密度椭圆是散点图上的阴影区域,以可视方式显示散点图上数据点最密集的区域。如果变量相关,则密度椭圆通常会反映线性相关线的方向。否则,没有明确方向的更圆形的密度椭圆表示较低的相关性。
统计学中的另一个固有困难是确定两个变量之间的关系是否由这些变量引起。考虑以下陈述:
“大多数篮球运动员都很高。因此,如果你打篮球,你就会变高。”
很明显,上面的陈述是不正确的。身材高大并了解这种优势的个人可能会被篮球所吸引,因为他们天生的身体能力最适合这项运动。然而,由于身高和篮球运动可能呈正相关,因此统计学家和数据科学家必须意识到,两个变量之间的强关系可能是由任何一个变量引起的。
相关性的局限性¶
与其他统计分析方面一样,相关性可能会被误解。即使两个变量之间的相关性看起来很强,小样本量也可能产生不可靠的结果。或者,当两个变量实际上相关时,小样本量可能会产生不相关的结果。
当存在异常值时,相关性通常会发生偏差。相关性仅显示一个变量如何与另一个变量相关联,并且可能无法清楚地识别单个实例或结果如何影响相关系数。
如果两个变量之间的关系是非线性的,则相关性也可能被误解。识别具有正相关或负相关的两个变量要容易得多。但是,两个变量可能仍然以更复杂的关系相关。
什么是相关性?¶
相关性是一个统计术语,描述了两个变量彼此协调移动的程度。如果两个变量向同一方向移动,则称这些变量具有正相关性。如果它们向相反的方向移动,则它们具有负相关性。
为什么相关性在金融领域很重要?¶
相关性在金融领域发挥着重要作用,因为它们用于预测未来趋势和管理投资组合中的风险。如今,可以使用各种软件程序和在线服务轻松计算资产之间的相关性。相关性以及其他统计概念在衍生品和其他复杂金融工具的创建和定价中发挥着重要作用。
相关性如何使用的一个例子是什么?¶
相关性是现代金融中广泛使用的概念。例如,交易员可能会使用历史相关性来预测公司股票是否会因利率或商品价格的变化而上涨或下跌。同样,投资组合经理可能会通过确保其投资组合中的各个资产彼此之间没有过度相关来降低其风险。
高相关性更好吗?¶
投资者可能对其投资组合中的相关性水平有偏好。一般来说,大多数投资者更喜欢较低的相关性,因为这可以降低其不同资产或证券投资组合中受类似市场条件影响的风险。然而,寻求风险的投资者或希望将其资金投入到非常特定类型的行业或公司的投资者可能愿意在其投资组合中拥有更高的相关性,以换取更大的潜在回报。