引言
在多学科优化与仿真分析中,理解变量间的相关性是挖掘设计规律、简化模型及指导优化的关键。modeFRONTIER作为集成化优化平台,提供了一套完整的数据后处理工具链。本文将深入解析其变量相关性分析模块,涵盖相关矩阵、主效应分析、交互效应等核心功能。
一、相关性分析基础工具
1.1 相关矩阵图(Correlation Matrix Chart)
主要功能:
全局变量相关性图,用于快速识别变量间的相关性强弱,支持多维数据探索与因果关系初步分析。
核心特点:
a.可视化
•三角矩阵:对称布局呈现变量对的相关系数(Pearson/Spearman)
•矩形矩阵:自定义行列变量组合,聚焦特定参数对比
b.智能交互设计
•动态色值:红→蓝映射相关系数(+1至-1),白色标注弱相关(小于阈值)
•阈值筛选:滑动条实时过滤低相关性,突出显著关联性
•统计面板联动:
►直方图:降序排列相关性系数值,红/蓝区分正负相关
►排名表:自动生成高相关变量对
c.多维度分析
•支持4种相关系数类型切换(Pearson/Spearman/PCC/PRCC)
•NaN数据排除功能,确保计算准确性
技术要点:
相关系数类型选择:
案例如下:
上图中,WWR(窗墙比)与lux_average、heating、cooling、EUI之间的相关性系数较高,均在0.9以上,则可以得出,窗墙比(WWR)与这些参数变量之间存在很强的相关性,且都是是正相关,但无法读出是怎样的关系,只能得出两者之间是否存在很强的相关性。
1.2 散点矩阵图(Scatter Matrix Chart)
主要功能:
多维变量关联性与分布形态联合分析工具,通过散点图矩阵实现"一图看全"数据特征,支持线性/非线性关系探索与异常值检测。
核心特点:
a.矩阵化诊断视图
•主对角线:概率密度曲线(PDF)展示单变量分布形态(正态/偏态/多峰)
•非对角线:散点图+Pearson相关系数标注,同步呈现变量对的关联强度与数据离散模式
b.交互式深度分析
•子图穿透:点击任意散点图/PDF区域可:
♦双击放大局部细节
♦拖拽至新窗口独立分析
♦联动高亮同行/同列矩阵单元
•动态着色:通过「分类变量」对散点赋予颜色编码,揭示隐藏的群体分布规律
c.智能数据处理
•NaN值自动过滤:确保相关系数计算有效性
•离群点可视化:通过散点分布快速定位异常样本
技术要点:
案例:
上图的散点矩阵图,左下角是Pearson相关系数图,斜对角是概率密度PDF分布图,右上角是变量对之间的散点分布图。这张图就是为了展示参数之间的分布趋势,把散点图、PDF、相关矩阵图放在一张图中进行展示。
二、因子效应深度解析
2.1 主效应图(Main Effects Chart)
主要功能:
因变量影响力评估工具,通过均值差异与分布离散度量化单变量对响应值的平均效应,支持因子重要性排序与最优水平选择。
核心特点:
•双模式效应解析
►水平模式:因子高低水平箱线图对比,检测线性主效应(斜率=Δμ)
►水平模式:增加中位水平分析,捕捉二次项等非线性效应
•可视化决策要素
连接线斜率:红/蓝线表示正/负相关性,斜率绝对值越大因子越关键
►箱线图细节:
♦箱体:均值±标准误差(SEM)
♦触须:均值±标准差(SD)
♦虚线:全局响应均值基准线
•动态分析能力
►范围滑块:水平缩放/滚动因子数量,聚焦关键变量
►统计面板:显示各因子效应量、组别均值、标准差等量化指标
案例:
如上图所示,可以读出三个变量的高、低水平,对于目标变量EUI的影响程度,比如WWR(窗墙比)在低、高水平下的均值差异达到18.788,且呈正相关,也就是说,随着WWR数值的增大,EUI指标也会随着增大;但是阴影构件的深度depth和方向north而言,效应值偏小,但不排除非线性效应,可以通过增加至三水平再次探查之间的关系情况。
2.2 交互效应图(Interaction Effects Chart)
主要功能:
高阶效应探测工具,通过双因子组合效应可视化揭示变量间的非线性协同作用,支持交互效应强度排序与最优组合筛选。
核心特点:
•多维度效应解析
►2水平模式:检测一阶交互效应(xy项影响),通过交叉线斜率判断协同方向
►3水平模式:捕捉二阶交互效应(x²y/y²x项),识别复杂非线性关系
•可视化决策要素
►交叉线形态:非平行线暗示显著交互作用(夹角越大效应越强)
►组合箱线图:
♦X轴:主因子水平分布
♦线条色阶:协同因子水平编码(红=高/蓝=低)
♦虚线:全局响应均值基准
•动态分析能力
►因子矩阵导航:通过范围滑块水平滚动多因子组合视图
►效应量化面板:显示交互效应量、协同系数等统计指标
案例:
通过上图的交互效应图,比如WWR*depth两者交互对于EUI的影响可以看出效应值最大,达到9.5,说明两者对EUI的影响较大。
2.3 效应矩阵图(Effect Matrix Chart)
主要功能:
实验设计全景诊断工具,集成主效应与二阶交互效应分析,支持混杂结构检测与多因子协同优化决策。
核心特点:
•矩阵化效应视图
►主对角线:主效应箱线图(斜率=单因子影响力)
►非对角线:交互效应交叉线图(夹角=协同作用强度)
►热力映射:通过颜色深度标注效应量级(红=正效应/蓝=负效应)
•混杂结构诊断
►主-交互效应对比:当主效应斜率与对应交互效应模式冲突时,提示混杂风险
►混杂因子定位:红色警示框标记高概率混杂变量组合
•动态优化能力
►热区探针:框选矩阵区域自动计算最优因子组合(最大化/最小化响应)
►层级穿透:双击任意子图展开三维响应曲面分析
案例:
可以效应矩阵图中得出单变量变量对对EUI的影响程度,就是把主效应和交互效应放在一张图中进行展示。比如第二行的第一张图,在WWR低水平时,depth的高水平EUI值明显低于depth的低水平值,从而可以获取某种规律或者参数关系。
三、统计显著性检验
3.1 半正态图(Half-Normal Plot)
主要功能:
实验设计显著性筛选工具,基于效应量分布形态快速识别关键因子与交互项,支持效应方向判别与重要性分级排序。
核心特点:
•效应强度可视化
►坐标系统:
♦X轴:标准正态分布分位数(理论分布参考线)
♦Y轴:效应量排序(实际观测值,升序排列)
►显著性判据:远离参考线的点位(偏离线性趋势)标示显著影响因子
•多维度编码系统
►颜色映射:
♦红色:正效应(响应值随因子增大而提升)
♦蓝色:负效应(响应值随因子增大而降低)
►符号尺寸:直径与效应量绝对值成正比(视觉权重强化)
•动态分析能力
►阈值辅助线:可拖拽虚线标记显著性临界值(默认±2σ)
►焦点模式:框选区域放大,支持局部密集点群分析
案例:
从半正态图可以获取WWR的主效应值最大,并对各参数和参数交互效应进行排序,方便获取最主要的参数和参数组合。
3.2 学生图(Student Chart)
主要功能:
基于t检验的因子影响力双维度诊断工具,量化变量间关系的统计显著性,支持效应强度与方向的可视化验证。
核心特点:
•双层级可视化系统
►主视图:效应量条形图
♦X轴:输入变量排序(按|效应量|降序)
♦Y轴:标准化效应量(Cohen's d值)
♦色码:红色=正相关,蓝色=负相关
►联动视图:2水平箱线图
♦点击条形触发:展示高低水平组分布对比
♦连接线斜率:反映均值差异趋势(>30°视为显著)
•统计指标集成
•动态交互诊断
►阈值过滤器:滑动条动态调整显著性阈值(0.01-0.1)
►数据剖面穿透:双击箱线图跳转至原始数据子集
案例:
根据图中显示,WWR对应的显著性值为0,则认为WWR的效应值18.788是有效的,且可信度非常高。
四、多目标综合分析
4.1 整体学生图(Overall Student Chart)
主要功能:
多响应系统全局因子贡献度分析平台,通过环形占比可视化实现跨指标影响力对比,支持关键因子快速定位与噪声过滤。
核心特点:
•多层级饼图矩阵
►环形结构:
♦外层环:响应变量(按业务优先级排序)
♦内层扇区:输入变量(面积∝贡献度%)
♦颜色映射:自定义因子色谱(支持跨环一致性编码)
►动态过滤系统:
♦阈值滑块:实时过滤贡献度<设定值的因子(归入"Other")
♦逆向选择:点击"Other"区块反选被过滤变量
•双维度统计面板
•三维交互体系
►剖面钻取:双击扇区穿透至该因子-响应的详细箱线图
►空间操控:
♦鼠标拖拽:旋转饼图视角(X轴旋转角0-360°)
♦Shift+滚轮:调整环厚度(3D深度5-30%)
案例:
整体学生图,最大的作用就是利用圆饼图确定哪个因素的重要性最高,从小编来看就是换了一种视图方式来探查因素重要性程度。
4.2 3D整体学生图
(3D Overall Student Chart)
主要功能:
多目标优化三维决策支持系统,通过立体空间映射实现复杂工程问题中全局敏感因子的快速识别与交互验证。
核心特点:
•三维空间映射体系
►坐标系统:
♦X轴:输入因子(按贡献度排序)
♦Y轴:响应变量组(目标/约束/表达式)
♦Z轴:归一化效应量(标准化至[0,1]区间)
•多模态可视化:
►D柱状图:柱高∝效应量,色温∝显著性(红=高,蓝=低)
►2D热图模式:支持平面投影快速比对
案例:
3D整体学生图中,可以看到对于每一种结果变量,对应的三个因变量的效应值大小,比如图中的四个结果变量中,WWR的效应值都是最大的,且显著性都是0,即都是可靠准确的。
五、最佳实践指南
5.1 分析流程设计
初筛阶段:相关矩阵+散点矩阵,识别强关联变量对。
细化分析:主/交互效应图定位关键因子及协同效应。
显著性验证:半正态图+学生图过滤统计噪声。
多目标综合:整体学生图平衡多方需求。
5.2 常见误区规避
过拟合陷阱:高相关系数≠因果关系,需结合物理机制验证。
正态性假设:非正态数据优先选用Spearman/PRCC方法。
阈值依赖:动态调整过滤阈值,避免遗漏弱相关重要因子。
六、结语
modeFRONTIER的统计后处理工具链,实现了从数据描述到因果推断的全流程覆盖。通过本文介绍的多维可视化与统计验证方法,工程师可高效提炼仿真数据中的隐含知识,驱动智能优化决策。在实际应用中,建议结合具体问题特性灵活选择工具组合,并持续验证模型的可解释性。