Professional Documents
Culture Documents
小组成员:黄熙彤,何颖诗,肖童
2023.05.08
02 文献汇报
CONTENTS
03 思考
追踪研究 追踪研究模型 模型拟合指标
横断研究
在同一个时间点对不同年龄个体进行观察、测量或实验,以揭示个体心理发展特点或规律的一种研究设计。
存在问题
变量相互关系的不确定性:横断研究会导致不准确的参数检验和显著性检验,且只反映了短时间内的
变量之间的关系,如果选择不同的时间框架,可能会得到完全不同的研究结果;
共同方法变异导致的偏差:大多数横截面研究是由研究对象在单个时间点完成的,导致研究的有效性
比多时间点研究的有效性低很多。
3
( 胥彦 , 李超平 , 2019)
追踪研究 追踪研究模型 模型拟合指标
追踪研究也叫纵向研究,是在比较长的时间内,对一个个体或一些个体的心理发展进行有系统的定期的研究。
特征
重复测量所有相关变量; 强调变量的动态变化;
测量次数不少于 3 次; 有助确定变量先后顺序。
关注问题
均值差异比较; 总体发展趋势及差异;
多变量相互影响; 动态变化过程。
4
( 胥彦 , 李超平 , 2019; 刘源等 , 2022)
追踪研究 追踪研究模型 模型拟合指标
潜增长曲线模型
构建个体的回归方程
𝑦 𝑖𝑡 =𝛼𝑖 𝑡 + 𝛽 𝑖 𝑡 𝜆𝑖 𝑡 + 𝜀 𝑖𝑡
图 1 个体成长轨迹
5
( 王孟成 , 毕向阳 , 2020)
追踪研究 追踪研究模型 模型拟合指标
μβ
μα
构建个体的回归方程
α β ζβi
𝑦 𝑖𝑡 =𝛼𝑖 𝑡 + 𝛽 𝑖 𝑡 𝜆𝑖 𝑡 + 𝜀 𝑖𝑡 ζαi
6
( 王孟成 , 毕向阳 , 2020)
追踪研究 追踪研究模型 模型拟合指标
非线性潜增长模型
二次增长模型
𝛼 𝑖=𝜇 𝛼 + 𝜉 𝛼 𝑖
2
𝑦 𝑖𝑡 =𝛼𝑖 + 𝛽1 𝜆𝑡 + 𝛽 2 𝜆 + 𝜀 𝑖𝑡
i i
𝑡
多阶段增长模型
以两阶段增长模型为例 𝛼 𝑖=𝜇 𝛼 + 𝜉 𝛼 𝑖
𝑦 𝑖𝑡 =𝛼𝑖 𝑡 + 𝛽 1 𝑖 𝑡 𝜆1 𝑖𝑡 + 𝛽 2 𝑖 𝑡 𝜆 2𝑖 𝑡 + 𝜀𝑖𝑡
• 和 表示个体 i 在第一阶段和第二阶段成长轨迹的斜率
7
( 刘源等 , 2013)
追踪研究 追踪研究模型 模型拟合指标
潜增长曲线模型局限
传统的增长曲线模型假设群体同质,即群体内所有个体享有相同的平均增长轨迹,而有些情况下,
个体间差异较大,不能满足样本都来自同一群体的假设。
增长混合模型
构建个体的回归方程
k
𝑦 𝑖𝑡 =∑ 𝑝 ( 𝑐𝑖 =𝑘 ) [¿ 𝛼𝑖𝑡𝑘 +𝜆𝑡 𝛽𝑖 𝑡𝑘+𝜀 𝑦 𝑖𝑡 𝑘 ]¿
𝑘=1 图 3 中国健康与营养调查部分样本
8
( 王孟成 , 毕向阳 , 2020)
追踪研究 追踪研究模型 模型拟合指标
𝛼 𝑘𝑖 =𝜇 𝛼 𝑘 +𝜉 𝛼 𝑖𝑘
𝛽 𝑘 𝑖=𝜇 𝛽 𝑘+ 𝜉 𝛽𝑖𝑘
• 和 为固定系数,表示在类别 k 总体平均的初始值和变化率
• 和 为随机系数,表示在类别 k 个体的初始值和变化率与总体的差异
9
( 王孟成 , 毕向阳 , 2020)
追踪研究 追踪研究模型 模型拟合指标
增长混合模型局限
传统的增长混合模型假设各类别潜在增长轨迹类型相同,但是在有些情况下,各类别潜在增长轨迹类型不同。
替代模型(允许各类别潜在轨迹类型不同)
图 4 儿童适应在不同时间点的增长轨迹图
10
追踪研究 追踪研究模型 模型拟合指标
增长混合模型分布函数
• 为有 k 个类别的增长混合模型的分布函数
𝑘 • 为类别 k 的比例
𝑓 ( 𝑦|𝑐=𝑘 )=∑ 𝑝𝑘 𝑓 𝑘 (𝑦 ∨𝜇 k , ∑k ) • 为类别 k 的均值矩阵
𝑘=1 • 为类别 k 的方差 - 协方差矩阵
• 为类别 k 的时间载荷矩阵,描述增长轨迹随时间的变化
𝜇 k = Λ𝑘 𝜂 𝑘
• 为类别 k 的潜在增长因子,包括截距斜率
𝑇
∑ k = Λ 𝑘 Ψ 𝑘 Λ + Θ𝑘
𝑘 • 为类别 k 中个体间变异
• 为类别 k 中个体内变异即测量误差
替代模型(允许各类别潜在轨迹类型不同)
Unstructured Mixture Model, UMM :设置 和 跨类别自由估计;
11
追踪研究 追踪研究模型 模型拟合指标
模型总结
表 1 模型总结表
GMM 否 相同 时间载荷矩阵跨类别相等
12
追踪研究 追踪研究模型 模型拟合指标
模型拟合指标
模型评价指标
[ ]
2
n ^
𝑓 (𝑦 𝑗 ∨𝑧 𝑗 ; 𝜃)
值越小,模型拟合越好
^2 1
𝜔 = ∑ 𝑙𝑜𝑔
LMR LRT (Lo-Mendell-Rubin loglikelihood test)
2 𝑗=1 𝑔(𝑦 𝑗 ∨𝑧 𝑗 ; 𝛾^ )
比较竞争模型, p 值显著,则代表 k 分类模型显著优于 k-1 分类模型 f 和 g 为两个竞争模型的条件概率密度函数
|[ ( 𝜃^𝑖 −𝜃 𝑖)
]|
n
参数估计精度
𝐴𝑅𝐵= ∑ /𝑛
𝑖−1 𝜃𝑖
ARB (absolute relative parameter estimate bias)
值越小,准确性越高,低于 0.10-0.15 表示可以忽略不计 n 、 分别表示重复次数、实际值和估计值
13
01 基础知识
02 文献汇报
CONTENTS
03 思考
当不同潜在类别间增长轨迹类型不同时,三种增长混合模型的比较
小组成员:黄熙彤,何颖诗,肖童
2023.05.08
增长混合模型局限
传统的增长混合模型假设各类别潜在增长轨迹类型相同,即时间载荷矩阵跨类别相等,在各类别增长轨迹类型
不同的情况下,这种方法可能会导致错误的估计。
研究现状
很多研究方差 - 协方差矩阵的错误设定对模型分类准确性的影响,较少研究时间载荷的错误设定对
模型分类准确性的影响。
有研究发现,在不同的样本量和样本比例条件下,时间载荷错误指定的模型和正确模型没有差异。
(Liu & Hancock, 2014)
16
问题提出 研究设计与结果 结果讨论
研究设计
研究目的
17
问题提出 研究设计与结果 结果讨论
模型评价指标
BIC (Bayesian Information Criterion) 值越小,模型拟合越好
LMR LRT (Lo-Mendell-Rubin loglikelihood test) 比较竞争模型, p 值显著,则代表 k 分类模型显著优于 k-1 分类模
型
18
问题提出 研究设计与结果 结果讨论
一 . 生成模拟数据
生成数据模型
有 7 个时间点的两类别增长混合模型,一个类别的增长轨迹为二次增长,另一个类别的增长轨迹为分段增长。
研究工具: R 3.6.2
模拟条件
样本量: 300, 750, 1500
类别比例: 0.3/0.7, 0.5/0.5, 0.7/0.3
Degree of misfit ( 表示用假定模型估计实际模型参数的回归标准误 ) :高,低
组合数: 3*3*2 = 18 ,每个条件重复 500 次
19
问题提出 研究设计与结果 结果讨论
重复次数
样本量
类别比例
Degree of misfit
类别比例设定
20
问题提出 研究设计与结果 结果讨论
分段增长模型,二次增长模型
,潜增长因子,包括截距,斜率
,时间载荷矩阵,描述变量随时间点的变化
,个体间误差
𝑘
,个体内误差即测量误差 𝑓 ( 𝑦|𝑐=𝑘 )=∑ 𝑝𝑘 𝑓 𝑘 (𝑦 ∨ Λ 𝑘 𝜂 𝑘 , Λ 𝑘 Ψ 𝑘 Λ𝑇𝑘 +Θ𝑘 )
𝑘=1
21
问题提出 研究设计与结果 结果讨论
22
问题提出 研究设计与结果 结果讨论
二 . 模型分类准确性
表 1 高 misfit 条件下的分类准确性 检验标准: 80% 以上可接
受
结果
LBM 模型:在各模拟条件和拟合指标下的分类准确性都低于可接受的精度;
23
问题提出 研究设计与结果 结果讨论
二 . 模型分类准确性
表 2 低 misfit 条件下的分类准确性 检验标准: 80% 以上可接
受
结果
LBM 模型:只有两种条件的分类准确性可接受,其余模拟条件和拟合指标下的分类准确性都低于可接受的精度;
低 misfit
二 . 模型分类准确性
表 3 各拟合指标下不同模拟条件和模型的分类准确性的方差分析结果
三 . 参数估计偏差
表 4 GMM 、 UMM 和原模型类别比例和各类别均值向量的参数估计偏差
ARB ,越低准确性越高,低
在类别比例上, UMM 的估计偏差低于 GMM ,且与原模型的估计偏差更接近; 于 0.10-0.15 可接受
在 GMM 各类别均值向量上,类别 1 的估计偏差远大于类别 2 的估计偏差,且都大于原模型的估计
27
问题提出 研究设计与结果 结果讨论
UMM 各类别均值向量的参数估计偏差
研究结论
29
问题提出 研究设计与结果 结果讨论
研究讨论
UMM 的模型拟合准确性在高 misfit 比低 misfit 高
因为在高 misfit 下,两个潜在类别之间的增长轨迹差别更大。由于 UMM 是饱和模型,估计所有的类内
参数,类间增长轨迹的高度区分更有利于参数估计。
LBM 模型在各模拟条件和拟合指标下的分类准确性都低于可接受的精度
可能是因为该模型将前两个时间负荷固定为 0 和 1 ,导致拟合实际模型困难。
30
问题提出 研究设计与结果 结果讨论
研究局限和展望
1. 本研究只探讨二分类模型,未来可以考虑更多分类的模型;
2. 本研究的增长曲线模型只考虑了分段增长模型和二次增长模型,未来可以考虑三次增长模型、指
数增长模型等更多模型;
3. 本研究假设数据没有缺失,未来可以考虑数据缺失对模型的影响;
4. 本研究没有具体解释 LBM 模型表现差的原因,需要未来的进一步研究。
31
01 基础知识
02 文献汇报
CONTENTS
03 思考
思考
可能的研究方向
对于 LBM 模型表现差的原因,本研究给出的解释是其将时间载荷的前两个时间点固定为 0 和
1 ,
但是本研究没有探讨将 0 和 1 固定在其他时间点的情况以及 LBM 模型表现差的原因,需要
未来进一步探讨。
33
感谢倾听,请批评指正
汇报人:肖童
2023.05.08