前言


(资料图)

农产品期货价格的影响因素多且复杂,对大多数投资者来说很难把握趋势性行情,尤其在当前宏观经济、货币政策、地缘政治、气候变化这类不可控的影响因子权重逐渐加大的情况下。另外,农产品期货单一品种对资金的容纳能力也相对有限,导致了农产品套利交易越来越受到市场的青睐与推崇。

套利是一种特殊的交易模式,也可以叫作价差交易,是利用资产的价差变化,在相关市场上进行方向相反的交易,以期望价差发生变化而获利的交易行为。

本文探讨的套利交易是豆油、棕榈油和菜油的跨品种套利,其交易逻辑基于三者在现实生产活动与消费结构中的可替代关系。

如果农产品的可替代性很弱,那么即使做跨品种套利的基本面支撑很强,实际交易的风险也很大,比如淀粉和白糖就不适合;淀粉的下游产品淀粉糖仅能够替代30%的白糖用量,因此二者价差的缩减是有限的。

▲资料来源:Wind,Python绘图,中财期货

相较之下,三大油脂就非常适合进行跨品种套利。首先,三大油脂的主要成分都是不饱和脂肪酸和甘油,相互间的差别仅仅是脂肪酸的种类和占比不同,因此可替代性较高。当油脂间价差缩小到一定水平的时候,下游的生产商就会选择价格稍高但营养更好的植物油;当价差扩大到一定程度时,下游生产生就会更多地考虑成本,往往会倾向于购买更便宜的植物油。因此,油脂之间的价差通常存在上限与下限(本文由于是对统计套利的研究,所以将上下限定为 +- 1个标准差,但对于基本面套利研究来说并不见得完全适用)。

三大油脂历史收盘价的相关性矩阵也为跨品种套利的可行性提供了有力的证据。总的来说,相关性越强,套利的风险越低。

▲资料来源:Python绘图,中财期货

然而值得注意的是,棕榈油和菜油价格的相关性较低,并且在我们进行协整检验后,发现p值为0.12,远远高于0.05的阈值;这意味着统计上我们必须接受原假设(棕榈油和菜油价格不存在协整关系),因此我们得出结论,上述两种油脂不适合进行统计套利。

这里简单介绍一下相关性和协整关系的区别;虽然字面意思接近,但实际上是完全不同的两个概念。高相关性意味着“同涨同跌”,而高协整性却意味着“即使二者走势在中途会有所偏离,但最终都会趋向一致”。

两个变量之间可以相关性强,但协整性却很弱,好比两条直线,y=x和y=2x,它们之间的相关性是1,但协整性却很差;方波信号和白噪声信号之间的相关性很弱,但是却有很强的协整性。

▲资料来源:Wind,中财期货

例如,从豆油和棕榈油的历史每日收盘价折线图中我们就能看出,二者具有高相关性(走势一致),但不见得具有高协整性(无法从图中看出)。相关性无法体现油脂品种间价差长期的均值回归情况,因此不是我们统计套利研究中所探讨的对象。

好在豆油、棕榈油和豆油、菜油之间都存在协整关系,在通过ADF检验确定了其对数价格序列的平稳性之后,我们着手搭建两个对子之间的协整价差模型:

图5:协整模型的数学表达

▲资料来源:中财期货

通过训练集数据(测试集与训练集“二八开”)使用最小二乘法拟合出回归系数alpha和beta,于是我们就可以根据这两个数值计算出协整价差spread的序列。

图5:OLS回归结果诊断

从豆油和棕榈油价差的回归结果诊断来看,R方接近1,P值接近0,说明我们的模型和数据的拟合度高且变量显著性高。

从价差图中我们能很明显地看出,豆油、棕榈油协整价差具有很强的均值回归属性;这意味着当价差偏离均值时,我们将会面临潜在的盈利机会。

目前为止,我们一直在对训练集数据进行数据挖掘(2007年10月到现在历史收盘价数据的前80%)。现在,我们将使用测试集数据(后20%)来生成交易信号和回测使用的样本外数据集。我们将计算协整价差的Z值来生成交易信号并设置上限和下限阈值。

Z值将告诉我们每个价差数据点偏离均值标准差的个数。如果它是正的并且该值高于上限阈值,则说明价差高于历史平均值;因此基于均值回归的思想,价差大概率会收敛,所以此时做空价差(空豆油多棕榈油)是最优选择。反之亦然。

▲资料来源:Python绘图,中财期货

最后我们对豆油和棕榈油之间的套利策略进行回测。我们将从5000万的初始资金开始,并使用初始资本计算每个品种的最大持仓。

在任何一个交易日,第一个油脂品种的总损益将是该品种的总持有量和该股票的现金头寸。同样,第二个油脂品种的损益将是该品种的总持有量和该品种的现金。由于统计套利意味着持有市场中性头寸,这意味着我们将会以大致相同的资金同时做多和做空。最后,要获得总损益,我们必须将这两者相加。

▲资料来源:Python绘图,中财期货

最终,我们计算出豆油、棕榈油跨品种套利策略的复合年增长率(CAGR)为29.5%。然而,在我们下任何结论前还需要考虑下述因素:

1. 该套利策略是两个市场中性策略,因此策略的成功与否很大程度上取决于套利者的做空能力;在实际市场环境中,做空有可能会受到诸多因素的限制。

2. 我们没有考虑交易成本、借贷成本与交易中可能出现的滑点损失。

3. 以历史数据来预测未来存在局限性(归纳法的局限性)。

另外,当前的策略还很不稳定,尤其是在去年,投资组合的净值出现了很大的回撤。至于原因是什么,还有待后续的基本面研究,来解释数据上让人费解的地方。

资料来源:Python绘图,中财期货

相比之下,豆油和菜油的套利结果要更好。虽然CAGR和豆、棕套利差不多,为30.735%,但投资组合的净值曲线回撤要小很多,而且向上增长的趋势更稳定。

(文章来源:中财期货)

推荐内容