统计模型使用数学方程式对从数据中提取的信息进行编码。在某些情况下,统计建模方法可以非常快速地给出合适的模型。甚至对于那些只有更加灵活的机器学习方法(例如神经网络)才能最终给出更好结果的问题,仍然可以将某些统计模型用作基线预测模型以判断更先进方法的性能。
提供了下列统计建模节点。
线性回归模型根据目标与一个或多个预测变量之间的线性关系预测连续目标。
Logistic 回归是一种统计方法,它可根据输入字段的值对记录进行分类。它类似于线性回归,但采用的是类别目标字段而非数字范围。
“PCA/因子”节点提供用于降低数据复杂程度的强大数据降维技术。主成份分析(PCA)可找出输入字段的线性组合,该组合最好地捕获了整个字段集合中的方差,且组合中的各个成分相互正交(相互垂直)。因子分析则尝试识别底层因素,这些因素说明了观测的字段集合内的相关性模式。对于这两种方法,其共同的目标是找到可对原始字段集合中的信息进行有效总结的少量派生字段。
判别分析所做的假设比 logistic 回归的假设更严格,但在符合这些假设时,判别分析可以作为 logistic 回归分析的有用替代项或补充。
广义线性模型对广义线性模型进行了扩展,这样因变量通过指定的关联函数与因子和协变量线性相关。而且,该模型还允许因变量为非正态分布。它包括统计模型大部分的功能,其中包括线性回归、logistic 回归、用于计数数据的对数线性模型以及区间删失生存模型。
广义线性混合模型 (GLMM) 扩展了线性模型,使得目标可以有非正态分布,通过指定的连接函数与因子和协变量线性相关,并且观测值可能相关。广义线性混合模型涵盖了各种模型,从简单线性回归模型到非正态纵向模型数据的复杂多级模型。
使用 Cox 回归节点,您可以在已有的检查记录中建立时间事件的生存模型。该模型会生成一个生存函数,该函数可预测在给定时间 (t) 内对于所给定的输入变量值相关事件的发生概率。
最新发布