PeakLab™ 高级峰拟合与化学计量学建模
高精度高斯(Gaussian)、洛伦兹(Lorentzian)和Voigt峰拟合,配备强大的预测建模能力。PeakLab提供最先进的光谱学和色谱分析,具有真正的Voigt反卷积、高级IRF建模和下一代化学计量学预测建模。
光谱学(Spectroscopy)
用于UV/VIS、IR/FTIR、NIR/FTNIR光谱的高斯、洛伦兹和纯Voigt峰拟合。PeakLab包含46个内置光谱函数和一个全精度解析Voigt函数。
光谱吸光度通常涉及高度卷积的重叠峰。PeakLab的全精度解析Voigt函数是46个内置光谱函数之一,用于上述峰拟合以分离单个IR光谱组分。
图1:红外光谱峰拟合——46个内置光谱函数之一用于分离IR光谱组分
真正的Voigt反卷积(True Voigt Deconvolution)
自动分离光谱峰的洛伦兹和高斯分量,去除仪器失真,揭示真实的峰结构。
在上述最优UV-VIS拟合中,九Voigt模型拟合数据的方差误差仅为4.5 ppm,F统计量为160万。反卷积后的洛伦兹光谱峰是在没有高斯仪器响应函数信号拖尾的理想仪器中所见的峰,以红色显示在每个峰上。这种优化的Voigt拟合揭示了有效化学计量学建模系统将看到的主要波长。
图2:Voigt反卷积——分离洛伦兹和高斯分量,去除仪器失真
含IRF的Voigt模型用于不对称XPS和拉曼峰
XPS和拉曼光谱峰通常具有内在的不对称性,可使用包含仪器响应函数的Voigt模型进行有效拟合。
上述XPS峰形采用含IRF的Voigt模型拟合,该IRF由最简单的概率和动力学失真之和组成。图中红点为原始数据,蓝线为峰拟合,绿峰为去除不对称失真后的反卷积Voigt。
图3:含IRF的Voigt模型拟合XPS和拉曼不对称光谱峰
荧光光谱学(Fluorescence Spectroscopy)
荧光激发和发射光谱可能很复杂,具有高度卷积的吸光度。通常一个简单的多高斯模型就足以捕获主要的激发和发射波长。
上图为Coumarin 6的激发和发射光谱。请注意整体激发和发射曲线的异常形状。
图4:Coumarin 6荧光激发和发射光谱
化学计量学预测建模(Chemometric Predictive Modeling)
PeakLab引入了一种新的化学计量学建模方法,优于PLS和PCR,提供更高的精度和更快的性能。
色谱学(Chromatography)
高精度色谱峰拟合——用于系统适用性和色谱柱与流路系统的质量控制
当您需要确定色谱柱健康状况时,需要测量仅来自色谱柱分离的理论塔板数,而不是进样器、检测器单元或流体流路变化的伪影。
PeakLab将色谱峰拟合到近乎完美的拟合优度值。在上述UHPLC C18峰拟合中,0.59 ppm的未解释方差对应大于0.999999的r²拟合优度,从而可以将色谱柱峰与所有仪器失真分离。在上面的拟合中,蓝线是观测峰,红线是仅来自色谱柱分离(减去所有仪器效应)的峰。传统高斯FWHM对N的估计仅使用品红色半峰宽,得到N=20,671。矩方法计算整个蓝峰,但这包括仪器效应和拖尾,导致N=13,234。红色反卷积峰仅包含色谱柱分离减去仪器失真,N=26,905。
PeakLab更进一步提供基于模型的N,它消除了更高阶矩的差异,例如窄直径色谱柱的填充变异和其他非理想性可能产生的差异。对于上述峰,基于模型的N=35,137,即如果填充和相间传质完全均匀时所见的数值。
量化仪器响应函数(IRF)参数也很有价值。IRF参数可以检测老化进样器、流路变化和检测器差异。识别IRF还有助于设计最小化这些仪器失真(如流动相溶剂差异)的制备方法。
图5:UHPLC C18色谱峰理论塔板数拟合
高精度重叠峰色谱建模——无需重新配置或重新配方!
PeakLab引入了两项基于模型的创新,实现对真实世界色谱峰的近乎完美拟合。第一是IRF的卷积积分拟合,第二是具有更高阶矩统计泛化的高级HVL模型。两者都能熟练处理真实世界色谱峰的非理想性。
上述分离代表了姜黄色素分析中BDMC区域的最优分离。在大多数已发表的研究中,该位置仅看到一个峰。在此优化分离中,有三个额外组分,几乎没有实现基线分离峰的希望,无论是梯度还是等度。尽管所有四个峰共享拖尾-前伸因子和三阶矩不对称性,但上述峰拟合产生的未解释方差误差仅1.52 ppm,并给出了四个组分面积的准确估计。PeakLab还能够处理3D DAD数据,提取并确认四个组分的不同UV-VIS姜黄色素光谱。
PeakLab的色谱峰建模非常精确,只要峰每侧的上部30%振幅暴露在外,您就可以用每个峰各自的宽度拟合重叠峰;如果二阶导数方法能检测到数据中峰的存在,您就可以成功拟合任何具有共享宽度和拖尾-前伸因子的重叠峰组。
对于研发工作,无需重新配方或重新设计分离方法即可获得基线分离的峰及其常规积分面积。如上例所示,重叠峰可以实现高度准确的面面积估算。
图6:姜黄色素分析中BDMC区域的最优等度分离
梯度UHPLC反相C18色谱分离
梯度UHPLC和HPLC分离为峰形增加了一个额外的复杂性层级。虽然等度分析峰通常需要对基础密度进行三阶矩调整,但梯度峰需要同时进行三阶和四阶矩调整才能实现真正有效的建模,以及估计分析物在色谱柱内整体传输过程中存在的累积梯度。
精心设计的梯度有时可以抵消IRF的大部分拖尾,但梯度峰的压缩形状仍需要这种额外的四阶矩级别的峰形建模。此外,即使梯度可以抵消大部分IRF,也不意味着这对单个峰有效,对于部分或全部在等度保持期间通过的峰肯定无效。如果使用较慢的梯度,或者流路具有无法被梯度完全抵消的强IRF,IRF仍将存在。
上述梯度峰由近乎共洗脱的β和α姜黄酮组成。使用具有三阶和四阶矩调整的双重泛化HVL模型,同时拟合IRF中未被抵消的部分,产生了0.75 ppm的未解释方差拟合优度。该建模能够将峰拟合到与积分基线分离峰相匹配的精度。
图7:梯度UHPLC反相C18色谱分离姜黄酮
热梯度气相色谱(Thermal Gradient GC)
热梯度GC峰通常跨越非线性色谱形状区域的大部分范围,可以从低浓度时的接近对称峰变化到高浓度时的尖锐左右三角拖尾和前伸形状。重叠峰很常见,尤其是对于具有多种组分的天然材料。
虽然热梯度通常会抵消常规GC常见的IRF拖尾,但这些是梯度峰,需要双重泛化HVL模型的三阶和四阶调整,以及能够独立成功处理小浓度峰的拟合能力。PeakLab具有多种智能拟合策略,使即使这些困难的拟合也变得相当容易实现。
在上述姜黄中姜黄酮洗脱区域的峰拟合中,上部图中的颜色代表基线分段选项中的不同数据区域。该过程用于隔离洗脱的基线分离区域,并独立拟合每个分段中的不同重叠峰。在每个拟合中,重叠特征中的单个峰被进一步单独拟合,以更好地实现全局或最优拟合。
图8:热梯度GC峰拟合——姜黄酮洗脱区域
制备色谱(Preparative Chromatography)
制备分离通常在色谱柱过载水平或以上运行。在这种情况下,您需要密切监测色谱柱的健康状况。
在上述IC制备分离中,色谱柱内的过载状态显而易见。蓝线是仪器记录的峰,红线是如果没有仪器失真会看到的峰,绿线是没有更高阶矩非理想性且色谱柱容量足以不发生过载时看到的纯HVL。对于仪器记录的峰(蓝线),高斯FWHM的N为125,矩方法的N为150。对于反卷积过载状态的参数模型(绿线),色谱柱在无限容量下会看到的分离结果为N=6,518,基本上与分析分离中期望的值相当。
图9:IC制备分离——色谱柱过载状态分析
高速、小直径色谱柱分离
如果您使用小直径色谱柱进行快速分离,您可能会看到重叠峰、明显的IRF以及显著的三阶矩偏斜和可能的四阶矩膨胀。
在上述研究色谱图中,八个峰中只有一个基线分离,可以使用传统积分进行准确定量。PeakLab的拟合不仅准确确定了所有八个峰的面积和质心位置,还量化了仪器的IRF以及分离中的更高阶矩非理想性。当您看到像上面这样的峰时,PeakLab分析所需的短暂时间将为您提供比所有峰基线分离时进行的精细优化分离更多的分析信息。
图10:高速小直径色谱柱研究色谱图
基于光谱数据的色谱化学计量学预测建模
色谱测量可能耗时且昂贵,对于某些低精度、高通量的筛选应用,建立基于将色谱分析值映射到UV/VIS、IR、FTIR、FTNIR或其他快速光谱测量的预测模型可能很有价值。PeakLab引入了一种创新的化学计量学建模解决方案,是传统PLS和PCR建模的有吸引力的替代方案。这些直接光谱模型在预测精度和基于Web的计算性能方面优于PLS和PCR"解混"算法。
化学计量学建模(Chemometric Modeling)
最先进的峰拟合和直接光谱建模
PeakLab独特地结合了峰拟合和直接自动多变量预测模型创建,为您提供任何软件产品中最准确的化学计量学预测模型。
PeakLab预测建模通常用于从更快速和更简单的光谱学估计色谱或其他实验室密集型数值。PeakLab建模是一种通用的统计建模程序,可用于从任何来源的任何数据矩阵、任何实验室测量值创建多变量预测模型。该矩阵系列可以是波长或频率的光谱、时间域的色谱数据集或任何其他数据系列集合,包括主成分和傅里叶域反卷积光谱。
比PLS和PCR模型更准确且更简单的替代方案
光谱建模主要依赖于偏最小二乘法(PLS)或主成分回归(PCR)预测。我们没有提供这些现已无处不在的程序的又一个实现,而是有意识地选择产生一种全新的、更简单的鲁棒方法来生成这些预测模型。如果您已将PLS和PCR用于化学计量学模型,请参阅本页面底部关于这项新技术的分析推理。
图11:化学计量学预测建模——可视化与数据图
完整的、自动化的、简单的化学计量学建模解决方案
PeakLab的化学计量学建模解决方案包括以下内容:
异常光谱检测的可视化
在构建预测模型之前,使用一组等宽高斯或Voigt峰对已知目标分析物的光谱进行拟合是很有用的。这将为预测建模提供两个关键信息。最优拟合将确定仪器的光谱分辨率,用于设置预测模型中波长的x间距。拟合还将估计应作为化学计量学模型中主要预测变量的波长。
图12:FTNIR参考标准光谱——等宽高斯峰拟合
一键拟合——一个对话框——智能专家系统设计
与复杂的化学计量学建模程序不同,PeakLab将所有建模设置呈现在一个对话框中,大多数选项可以保留默认值。只需选择要建模的数据矩阵中的变量、要使用的波长范围,并在需要时使用过滤器以产生合理的建模时间。在此示例中,6000万个候选模型将在约10秒内完成拟合。PeakLab的高参数计数过滤器使得不切实际的全排列拟合变得可行。没有这些智能过滤器(在拟合算法进行时智能地移除无用的预测变量),下面的拟合将需要接近12小时和2200亿个模型的拟合。
图13:一键拟合——简洁的建模对话框
PeakLab特有的智能逐步PLS模型
PeakLab特有的功能是,可以通过"智能逐步"程序添加九个及以上参数计数的模型,该程序从较低参数计数的最佳保留全排列拟合开始。然后算法使用智能多维搜索,其中可能已被移除或过滤的波长在特定波长组合使其成为可能时获得重新添加的机会。
PeakLab特有的稀疏PLS模型
PeakLab还特有稀疏PLS模型。这些不是传统意义上的偏最小二乘模型,而是由最佳全排列和逐步模型的加权组合组成,包含保留拟合模型中最具统计显著性的波长。与PLS模型(每个波长都被加权到整体模型中)不同,这些稀疏PLS鲁棒模型最多包含15个选定波长,所有这些波长都需要在按预测拟合优度加权到整体模型中的各个模型中检验为统计显著。稀疏PLS模型是一种便利,提供了跨确定性波长复合集组合许多不同单独有效预测模型的鲁棒性。
完整的预测建模科学
PeakLab建立在为金融时间序列开发的高级专有预测建模科学基础之上。您会发现PeakLab的预测建模是世界上最有效的商用化学计量学预测建模,但我们也相信您会发现它是最易于访问、最直接和最智能的。
图14:预测模型图——光谱预测与色谱参考值对比
相关波长确认
在直接光谱拟合中,可以得到显著波长的更好估计。这些估计往往较少受到次要和逆相关或从生成因子阵列产生的其他伪影的影响。在下方的显著性图中,等值线反映了出现在保留(最佳拟合)模型中的每个波长的加权统计显著性。在一定的参数计数及之后,显著波长变得清晰明确。
图15:波长显著性等值线图
建模技术与代码导出
从允许您在移除异常值后重新拟合和检查预测模型的最先进异常值移除方法,到为您用C++或Visual BASIC编写模型代码,PeakLab提供从开始到结束的完整建模解决方案。
C++生成的模型代码示例:
double glm01(double *spec)
{
// spec[0] X Predictor 1 (1658, index=8)
// spec[1] X Predictor 2 (1660, index=10)
// spec[2] X Predictor 3 (1662, index=12)
// spec[3] X Predictor 4 (1664, index=14)
// spec[4] X Predictor 5 (1670, index=20)
// spec[5] X Predictor 6 (1672, index=22)
// spec[6] X Predictor 7 (1758, index=108)
// spec[7] X Predictor 8 (1760, index=110)
// spec[8] X Predictor 9 (1762, index=112)
// spec[9] X Predictor 10 (1766, index=116)
// spec[10] X Predictor 11 (1782, index=132)
// spec[11] X Predictor 12 (1816, index=166)
// spec[12] X Predictor 13 (1818, index=168)
// spec[13] X Predictor 14 (1822, index=172)
// spec[14] X Predictor 15 (1828, index=178)
double p[16] = {
4.06405812524123, -198.551348386628, -177.594084516741,
-141.842381803743, -59.6348303087346, 280.22152394363,
538.494036162069, -216.618929884493, -759.483492213287,
778.463631058768, -830.474230583933, 852.825799066597,
244.969804203827, 173.817451045103, 148.18538374493,
-630.888207432142
};
int nx = 15;
double estimate = p[0];
for(int i = 1; i <= nx; i++)
estimate += p[i] * spec[i - 1];
return estimate;
}
比PLS和PCR模型更准确且更简单的替代方案(详细说明)
最佳直接光谱模型在理论上应优于最优PLS和PCR模型。例如,在PLS中,某些相关潜变量的度量将由随机噪声相关性和与非目标组分、水分或溶剂的关系组成。经验丰富的预测建模者知道,这种预测关系是可疑的、不可靠的、远非鲁棒的,并且明智的做法是永远不要将其纳入预测系统,因为这些关系可能在真实世界系统中无预警地意外消失。总的来说,这些相关性即使被理解也非常有限,并且常常被盲目地包含在PLS和PCR建模中。
我们从未遇到过一个"简单"的建模场景,其中PLS和PCR的最优因子计数能够匹配直接光谱模型中的参数计数,或者预测性能同样好。即使是一个从单一光谱波长就能有效预测组分的简单案例,通常也会在三个或四个PLS因子或PCR主成分处优化。此外,由于PLS和PCR模型通常需要从因子变量转换回原始光谱域,这些模型可能涉及数百个参数来处理一个简单的单波长直接光谱模型就能以更高预测精度管理的问题。
同样,我们也从未遇到过一个"困难"的建模场景,其中PLS和PCR因子计数低于最优光谱模型中的参数计数,也没有看到过PLS或PCR模型在预测精度上优于直接光谱拟合的情况。
坚实的数学和统计科学基础
PeakLab的直接光谱拟合使用全排列程序,可以在一分钟内拟合多达一亿个候选模型,并且在此过程中更准确地确定确定性信息所在的波长。由于不使用任何派生或潜变量,没有任何隐藏,随机机会相关和逆相关关系不会主导预测。
PeakLab直接光谱建模产生真正的多变量线性模型,这些模型已在预测模型中使用了数十年,是每个主要统计软件产品中都有的GLM模型的主力。与PLS和PCR(此因子生成通常是隐藏和专有的,且不同的PLS和PCR软件不会产生完全相同的结果)不同,PeakLab模型可以在任何专业统计软件的GLM过程中以全精度复制。
在使用PeakLab生成光谱模型时,您使用的是最稳定、最可靠和最鲁棒的数学和统计科学,其编码效率和简便性使您可以轻松创建Web服务器、嵌入式系统手持光谱仪。作为PeakLab分析工具套件的一部分,该建模功能的软件成本仅为通常为化学计量学建模购买的商业统计或解混软件价格的一小部分。
高级建模科学(Advanced Modeling Science)
为真实世界科学应用设计的强大统计和预测建模框架。
完整的预测框架 — 支持光谱学、色谱学和任何多变量数据集的预测建模。
波长显著性 — 识别统计上重要的波长,去除噪声驱动的相关性。
代码导出 — 自动生成C++和Visual Basic代码,用于实际系统部署。
技术优势:
- 无隐藏变量
- 完全透明的模型
- 基于GLM(广义线性模型)
- 比PLS和PCR更准确
- 稳定且可重复的预测
最先进的化学计量学建模解决方案
PeakLab在峰拟合、预测建模和科学分析方面提供无与伦比的精度。
在线留言
尊敬的客户朋友,如您有任何意见建议,请通过下表反馈给我们,我们会尽快与您联系。
|