SigmaPlot平滑例程SigmaPlot 2D和3D图形平滑
SigmaPlot提供了七种不同的数据平滑算法,应能满足大多数平滑需求:负指数、loess、运行平均值、运行中值、bisquare、反平方和反距离。 每个平滑器都包含使其非常灵活的选项。例如,最好使用最近邻法而不是固定带宽方法来分析出现在束中的不等距数据。此外,在一些平滑器中可以使用异常值抑制。 二维平滑 平滑用于从噪声数据中提取趋势。图基的《探索性数据分析》(Addison-Wesley,1977)一书中的三个例子说明了平滑的必要性。从1872年到1956年,美国黄金产量的趋势相当明显,见图1A。 平滑曲线上的每个点都是从靠近曲线点的数据点回归得到的,其中最近的点权重更大。影响回归中点数的平滑量由用户确定。对平滑曲线上的每个点执行加权回归。 图1.随着趋势数据增长越来越难以可视化 图1中三个示例的loess平滑曲线如图2所示。图2A和2B中的平滑曲线使黄金和小麦数据的趋势非常清晰。在原始数据中,仍然很难可视化图2C所示的降水趋势。为了确认loess平滑曲线的结果,计算了十年间隔的平均降雨量直方图,并将其叠加在平滑曲线上。直方图和loess平滑之间有很好的比较。 改变loess平滑参数以获得最佳可视化效果。在所有情况下均使用多项式次数为1。图2A和B中使用0.1的取样比例,图2C中使用0.3的取样比例。由于数据沿x轴分布不均匀,因此使用了最近邻带宽法。 生成平滑曲线的默认间隔数(100)被认为是最佳的。这将使用曲线点之间的直线生成一条直线。有时这会导致平滑中出现锐角,因此使用了样条线插值线型(平滑(样条线))。 包括loess在内的几种平滑方法是基于局部多项式回归的,多项式阶数是可选的。 增加顺序往往会在平滑中包含更多高频分量。从1阶(局部线性回归)增加到2阶(局部二次回归)的效果如图3所示。其效果是增加峰高幅值,并在B中引入额外的高频分量(摆动)。随后增加C中的采样比例会导致平滑,非常类似于A中1阶的原始值。 图3.增加回归多项式阶数的影响。A中的顺序为1,采样比例为0.1。B中的顺序增加到2,然后C中的采样比例增加到0.2。 三维平滑 在三维散点图中可视化空间关系可能非常困难。最强大的三维提示是由数据的动画旋转提供的。由于这在纸质出版物中是不可能的,我们必须使用下降线,用附加轴等将图形包围起来。 该数据相对稀疏,因此需要较大的抽样比例0.6,以避免loess 表面出现振荡和峰值。使用多项式次数1和最近邻带宽方法。预览功能允许快速比较给定数据集上的平滑方法。对于该数据,基本上等效的光滑表面是通过负指数和双平方法获得的。 带宽方法选项也非常有用。最近邻法适用于间距不等的数据。图3中的数据在X和Y中的间距不相等。使用图5中所示的最近邻法和固定法比较平滑结果。固定法的结果大约是通过改变采样比例(显示的值为0.8)可以获得的最佳结果。 其他计算细节 Smoothers是各种技术的通用名称,可用于通过删除不需要的高频分量(快速变化的位置,如噪声污染)来平滑数据集,或使用附近点的数据值对因变量值重新采样到其他独立变量位置。 SigmaPlot中提供的平滑方法通过加权平滑位置附近的数据,并应用线性或非线性方法来组合加权值以产生平滑值。这些非参数平滑技术为SigmaPlot中的参数化曲线/曲面拟合工具(回归向导)提供了很好的补充。对于受到测量误差、噪声等影响的数据,任何一种方法都可以用于预测行为或估计真实值。 下表给出了平滑计算中使用的核,平滑方法下表给出。
每个核使用的方程式为:
在线留言尊敬的客户朋友,如您有任何意见建议,请通过下表反馈给我们,我们会尽快与您联系。
|
|
|