1.数据预处理层面放弃原始价格序列,采用对数收益率、差分序列、收益率滚动标准化等方式将非平稳序列转为平稳序列,避免模型学习虚假趋势产生伪拟合;对多币种面板数据做去趋势、去均值处理,消除全局共同趋势带来的非平稳干扰。
2.引入时序平稳化特征工程,构造动量、波动率、偏离均线、相对强弱等平稳型技术特征,对宏观类趋势因子做滚动窗口标准化、截面中性化处理,抑制特征随时间漂移引发的分布偏移。
3.使用协整建模结合机器学习,对同阶单整的汇率与宏观变量构建协整残差作为输入特征,捕捉长期均衡关系的同时规避非平稳直接建模的缺陷,常用搭配线性正则模型、树类模型训练套利类策略。
4.选用对分布漂移鲁棒的机器学习模型,优先随机森林、XGBoost、LightGBM等非线性树模型,相比线性回归不易受非平稳趋势误导;避免直接用原始价格做线性拟合类模型训练,减少伪回归风险。
5.采用滚动窗口训练与在线学习机制,固定时间窗口重新训练模型,动态更新参数适配汇率时序分布变化,缓解概念漂移、特征非平稳漂移带来的模型失效,拒绝全历史静态训练模式。
6.加入平稳性约束正则化,对特征系数设置时序平滑约束,限制参数短期内大幅突变;通过特征稳定性筛选,保留不同样本区间内分布稳定的因子,剔除随宏观周期(883436)出现结构性漂移的非平稳特征。
7.模型输出做后处理约束,对预测值采用区间限制、滚动均值修正,过滤模型捕捉到的虚假长期趋势;搭配残差平稳性校验,若模型残差存在单位根则重新做特征差分或窗口调整。
8.利用时变因子分解,将汇率拆解为确定性趋势项、周期(883436)项、平稳噪声项,仅把平稳噪声与周期(883436)部分作为机器学习输入,趋势项单独做宏观规则约束,防止模型过度拟合长期非平稳趋势。
