上海卡贝信息技术有限公司

 

SigmaPlot平滑例程

SigmaPlot 2D和3D图形平滑

概述
SP15 中的新增功能
图形功能
统计功能
转换
系统要求
附加模块
曲线拟合/回归
21 CFR 11
Section 508节
SigmaPlot仪器框架

平滑例程
授权

SigmaPlot提供了七种不同的数据平滑算法,应能满足大多数平滑需求:负指数、loess、运行平均值、运行中值、bisquare、反平方和反距离。

每个平滑器都包含使其非常灵活的选项。例如,最好使用最近邻法而不是固定带宽方法来分析出现在束中的不等距数据。此外,在一些平滑器中可以使用异常值抑制。

二维平滑

平滑用于从噪声数据中提取趋势。图基的《探索性数据分析》(Addison-Wesley,1977)一书中的三个例子说明了平滑的必要性。从1872年到1956年,美国黄金产量的趋势相当明显,见图1A。

 
美国小麦产量的高峰和低谷,如图1B所示,不太清楚。我要求您直观地找到图1C所示的纽约市年降雨量数据的趋势。loess 算法将用于平滑这些数据集。loess 是指局部加权回归。

平滑曲线上的每个点都是从靠近曲线点的数据点回归得到的,其中最近的点权重更大。影响回归中点数的平滑量由用户确定。对平滑曲线上的每个点执行加权回归。

图1.随着趋势数据增长越来越难以可视化

图1中三个示例的loess平滑曲线如图2所示。图2A和2B中的平滑曲线使黄金和小麦数据的趋势非常清晰。在原始数据中,仍然很难可视化图2C所示的降水趋势。为了确认loess平滑曲线的结果,计算了十年间隔的平均降雨量直方图,并将其叠加在平滑曲线上。直方图和loess平滑之间有很好的比较。

改变loess平滑参数以获得最佳可视化效果。在所有情况下均使用多项式次数为1。图2A和B中使用0.1的取样比例,图2C中使用0.3的取样比例。由于数据沿x轴分布不均匀,因此使用了最近邻带宽法。

生成平滑曲线的默认间隔数(100)被认为是最佳的。这将使用曲线点之间的直线生成一条直线。有时这会导致平滑中出现锐角,因此使用了样条线插值线型(平滑(样条线))。

 
图2.图1中数据的平滑曲线。十年平均降雨量直方图也显示在C中。

包括loess在内的几种平滑方法是基于局部多项式回归的,多项式阶数是可选的。

增加顺序往往会在平滑中包含更多高频分量。从1阶(局部线性回归)增加到2阶(局部二次回归)的效果如图3所示。其效果是增加峰高幅值,并在B中引入额外的高频分量(摆动)。随后增加C中的采样比例会导致平滑,非常类似于A中1阶的原始值。

图3.增加回归多项式阶数的影响。A中的顺序为1,采样比例为0.1。B中的顺序增加到2,然后C中的采样比例增加到0.2。

三维平滑

在三维散点图中可视化空间关系可能非常困难。最强大的三维提示是由数据的动画旋转提供的。由于这在纸质出版物中是不可能的,我们必须使用下降线,用附加轴等将图形包围起来。
图4显示了光滑的表面也有帮助。该数据描述了己烷异构体的反应特征。光滑表面B清楚地显示了温度和反应速率的趋势,而在散点图A中很难可视化。

 
图4.A中的数据趋势很容易通过黄土光滑表面B可视化。

该数据相对稀疏,因此需要较大的抽样比例0.6,以避免loess 表面出现振荡和峰值。使用多项式次数1和最近邻带宽方法。预览功能允许快速比较给定数据集上的平滑方法。对于该数据,基本上等效的光滑表面是通过负指数和双平方法获得的。

带宽方法选项也非常有用。最近邻法适用于间距不等的数据。图3中的数据在X和Y中的间距不相等。使用图5中所示的最近邻法和固定法比较平滑结果。固定法的结果大约是通过改变采样比例(显示的值为0.8)可以获得的最佳结果。

 
图5.不等间距数据的带宽方法比较。左边是最近的邻居,右边是固定的。

其他计算细节

Smoothers是各种技术的通用名称,可用于通过删除不需要的高频分量(快速变化的位置,如噪声污染)来平滑数据集,或使用附近点的数据值对因变量值重新采样到其他独立变量位置。

SigmaPlot中提供的平滑方法通过加权平滑位置附近的数据,并应用线性或非线性方法来组合加权值以产生平滑值。这些非参数平滑技术为SigmaPlot中的参数化曲线/曲面拟合工具(回归向导)提供了很好的补充。对于受到测量误差、噪声等影响的数据,任何一种方法都可以用于预测行为或估计真实值。

下表给出了平滑计算中使用的核,平滑方法下表给出。


算法

Weighting Kernel

计算平滑值的方法

Negative Exponential

Gaussian

Polynomial or Loess Fitting

Loess

Tricube

Polynomial or Loess Fitting

Running Average

Uniform

Mean

Running Median

Uniform

Median

Bisquare

Biweight

Polynomial Fitting

Inverse Square

Cauchy

Mean

Inverse Distance

Inverse Distance

Mean

每个核使用的方程式为:

Kernel

Kernel Formula (y=0 for 2D Smoothers)

Uniform

1

Biweight

(1 – x2 ? y2)2

Tricube

(1 – sqrt(x2+y2)3)3

Gaussian

 exp(-x2-y2)

Cauchy

1/(1+x2+y2)

Inverse Distance (3D only)

1/sqrt(x2+y2)

 

 

 

 

 


 

在线留言

尊敬的客户朋友,如您有任何意见建议,请通过下表反馈给我们,我们会尽快与您联系。

 

 

 

 

联系我们

 

微信公众号

咨询微信

企业店铺

400-621-1085

(节假日期间办公室座机如无人接听,请选择其他联系方式,感谢理解!祝您节日快乐!)

 

联系我们 快速链接 相关产品 上海卡贝信息技术有限公司

©2024  上海卡贝信息技术有限公司

产品中心

下载中心

站点地图

隐私政策

 

销售QQ咨询

产品QQ咨询

淘宝店铺

Stata 12-数据分析和统计软件

概述

图形特征

最新更新:v15

相关文档

试用下载

Analyse-it

GraphPad Prism

SmarPLS

Stata

IBM SPSS Statistics

SAS

EndNote

Citavi

StatTools

NCSS

Statgraphics

PASS

PLA 3.0

PeakFit

Systat

TableCurve 2D

TableCurve 3D

SigmaStat

Litera

Office Timeline

HLM

IRTPRO

flexMIRT