Professional Documents
Culture Documents
非参数统计课程介绍 上海交通大学数学系
非参数统计课程介绍 上海交通大学数学系
王成
http://math.sjtu.edu.cn/faculty/chengwang/
上海交通大学数学系
2015-9-17
1 课程要求
• 作业用Latex和R完成,所有同学都要学会这两个软件,作业通过邮件提
交 chengwang@sjtu.edu.cn。
• 提交的作业拒绝抄袭,布置得多数作业都是开放式问题,没有统一答
案,提交的作业可能会进行交叉比对。
• 课堂积极参与讨论
• 最后成绩: 平时作业+课堂参与+最后考试或者大作业
2 什么是非参数统计
在一个统计问题中,假定总体分布的数学形式已知,仅包括(少数)有限个未知
参数,这个问题就是参数统计问题,否则就是非参数性质的。
统计不是数学,不用完全划清参数和非参数之间的界限。非参数方法当然也
可以用到参数问题中去,例如我们可以用非参数方法去检验正态分布的均值,
反过来非参数方法很多时候本质上又回到参数问题,例如经典的符号检验本质
还是把任意分布转化成了二项分布。
几个非参数统计相关的名词:Distribution-free, Nonparametric, Semi-
parametric等
假定两个变量(X, Y )之间有如下的回归关系:
Y = f (X) + ǫ,
1
• f (x) = a + bx, 那么对应的基为 {1, x}, 可以认为是2维的。估计f (x)也
就是在二维空间里面找一个数值。例如我们的最小二乘不就是在二维平
面上找一个点嘛?
• f (X) = a + bx + cx2 , 那么对应的基为 {1, x, x2 }, 可以认为是3维的,
• f (x) = acos(bx)???
由Taylor展开,对于一大类性质良好的函数,我们都可以有 f (X) = a0 + a1 x +
· · · + an xn + . . . , 估计f (x)也就是找一列 a0 , a1 , . . . 这个角度可以把非参数看
成无穷维的参数问题,这也是Larry Wasserman书中的观点。
3 课程内容
经典非参数内容:
1. 次序统计量
把一组样本X1 , . . . , Xn 按照大小排序后就得到次序统计量X(1) , . . . , X(n) .
这一部分主要介绍次序统计量的一些相关的分布,渐进分布以及一些统
计问题上的应用。
2. U统计量
U统计量是Hoeffding 1948年引入的一类统计量,在非参数的估计和检验
问题中有大量的应用。这一块会介绍这类统计量的定义,分布以及理论
渐进分布等。这一块内容最近几年在高维数据的统计分析,尤其是假设
检验里有大量的应用,我们会介绍一些相关的工作。
3. 秩统计量
各个样本在其大小排序中所占的位次,这其中也有绝对秩和符合秩之分
等等。这一部分要介绍在独立和不同分布结构情况下的秩统计量的分布
等,介绍秩统计量在各种统计问题,估计问题,独立性检验等等
4. 置换检验 稳健估计等
现代非参数部分:
3. Bootstrap 及其他
2
4 参考书目
1. 陈希儒 等. 非参数统计, 中国科学技术出版社, 2012.
4. Fan, Jianqing, and Qiwei Yao. Nonlinear time series: nonparametric and
parametric methods. Springer Science & Business Media, 2003.
所有课件会放在 http://math.sjtu.edu.cn/faculty/chengwang/teach.html