|
IBM SPSS Data Preparation简化数据准备流程,以便您可以快速做好分析准备,得出更准确的结论。它对贵公司有何用途 IBM SPSS Data Preparation 是 IBM SPSS Statistics 的完全集成模块。它执行先进的技术,简化了数据准备阶段,可更快速、更准确提供数据分析结果。分析人员可以从完全自动化的数据准备过程中进行选择,从而最快地获得结果,或者从其他几种方法中进行选择来准备更具有挑战性的数据集。利用该软件,您可以轻松发现可疑或无效的个例、变量和数据值。验证数据工具帮助您发现活动数据集中可疑和无效的个例、变量及数据值。 简化流程 自动执行数据准备过程,避免复杂且耗时的人工数据准备工作。 加速验证 无需人工检查即可验证数据,更快速更准确地执行数据验证。 确保结果的准确性 防止异常值使分析出现偏差,自动检测可能影响结果的异常情况。 主要功能
功能聚焦 “变量”选项卡 “变量数据”对话框用于验证您的数据。“变量”选项卡显示了文件中的变量。首先选择需要的变量,并将它们移动到“分析变量”列表中。 基础检查 您可以指定应用于文件中变量和案例的基础检查。例如,您可以获取相关报告,确定具有很高比例的缺失值或空白案例的变量。 标准规则和定制规则 将规则应用于识别无效值(有效范围之外的值或缺失值)的个别变量。您还可以创建自己的规则,创建交叉变量规则或应用预定义规则。 建议 自动化数据准备过程可提供建议,支持用户反复斟酌这些建议。 自动一步准备好数据 手动数据准备过程复杂且耗时。在您亟需结果时,ADP 过程可帮助您以一步有效的方式,检测和纠正质量错误并插补缺失值。ADP 功能提供易于理解的报告,包含全面的建议和可视化效果,帮助您确定可用于分析的合适数据。 数据准备过程的其他选项 通过使用验证数据过程,执行自动数据检查,并帮助消除耗时且繁琐的手动检查。您可以通过此过程应用相关规则,根据每个变量的度量级别(无论是分类还是连续性的)执行数据检查。然后,在分析之前,由您自行决定数据有效性,以及除去或更正可疑的个例。 对尺度变量进行分箱或设置尺度变量的分割点 利用最佳分箱过程,您可以更准确地使用专为标称属性而设计的算法(如朴素贝叶斯和 Logit 模型)。最佳分箱过程使您能够对尺度变量进行分箱或设置尺度变量的分割点。 从三种最佳分箱类型中进行选择 在构建模型之前,选择其中一种最佳分箱类型对数据进行预处理。1) 无监督:创建相同计数的分箱。2) 监督:考虑目标变量以确定分割点。这种方法比“无监督”方法更准确;但是,它的计算也更密集。3) 混合方法:将“无监督”和“监督”方法相结合。如果您拥有大量的不同值,那么这种方法非常有用。 相关下载
在线留言尊敬的客户朋友,如您有任何意见建议,请通过下表反馈给我们,我们会尽快与您联系。
|
|
|