A. 参数的选择
在支持向量机方法中,要选择的参数主要有惩罚系数C、核函数参数g和不敏感损失函数参数ε。对于C和核函数参数g的选择可采用交叉验证(crossvalidation)和网格搜索(gride searching)方法,这样可以选择符合实际情况的最优参数。径向基核函数为:
基坑降水工程的环境效应与评价方法
其中σ为径向基函数的宽度,令γ=1/2σ2(γ>0),则核函数就化为下式:
基坑降水工程的环境效应与评价方法
在考虑训数据有噪音的情况时,使用一个惩罚因子C,用来控制经验风险。要纯型确定的参数为径向基函数的γ值以及惩罚程度的常数C值。在实际问题中,最佳参数C、γ值是未知的,故为了达到准确分类或回归测试数据的目的,需要去搜索最佳参数。交叉验证:就是将数据首先分成n个同样大小数量的互不相交的子集。先用n-1个子集作为训练样本,预测那个没有参加训练的子集。这样一个接一个,进行n次。这样全部数据中的每个样本点都被预测了一遍,准确率是比较稳定的。
网格搜索是交叉确敬悄认的一种方法。即尝试所有的参数对(C,γ),计算其交叉确认正确度,挑出最佳参数对的过程。首先选定一组(C,γ)的范围C=(2-5,2-4…215),和γ=(2-15,2-12…23),每一参数对(C,γ)相互独立,ε可取0.005~0.5之间的值。为确保SVM模型有优良的预测性能,并考虑到回归性能分亮裤渣析的结论:不敏感系数ε可控制模型的泛化推广能力,惩罚因子C可控制拟合曲线复杂性,核函数宽度系数σ可影响回归曲线的光滑程度。从大量的实验分析比较可知,最终选定取如下值:C=0.01,g=10000,σ=0.01。