汉译英
Population 总体,样本总体 sample 样本,标本 parameter 限制因素
median 中位数 odd 奇数,单数 even 偶数
range 极差 variance 方差 standard deviation 标准差
Covariance 协方差 empty event 空事件 product event 积事件
conditional probability 条件概率 Random variable 随机变量 binominal distribution 二项式分布
uniform distribution 均匀分布 Poisson distribution 泊松分布 residual 残差
central limit theorem 中心极限定律
英译汉
descriptive statistics 描述统计学 mathematical statistics 数理统计学 inductive statistics 归纳统计学
Inferential statistics 推断统计学 dimension 维,维数 continuous variable 连续变量
ordinal variable 有序变量 nominal variable 名义变量 dichotomous 两分的;二歧的
discrete variable 离散变量 categorical variable 分类变量 location 定位,位置,场所
dispersion 分散 mean 均值 unimodal 单峰的
multimodal 多峰的 chaotic 无秩序的 grouped data 分组数据
frequency distribution频数分布 cumulative frequency 累加频数 tallying 计算
Uniformly distribution 均匀分布 histogram 直方图 frequency polygon 频率多边图
rectangle 矩形 Percentile 百分位数 quartile 四分位数
interquartile range 四分位数间距 simple event 简单事件
Compound event 复合事件 mutually exclusive 互斥的,互补相交的 complementary event 对立事件
Independent 独立的 joint probability function 联合概率函数 jacobian 雅克比行列式
Law of large numbers大数定律 point estimate 点估计 estimate 估计值
statistic 统计量 optimality 最优性 Unbiased estimate 无偏估计量 efficient estimate 有偏估计量
unbiasedness 无偏性 efficience 有效性 Consistent estimate 一致估计量
asymptotic properties 渐近性质 Confidence interval 置信区间 interval estimation 区间估计
null hypothesis 原假设 alternative hypothesis 备择假设 significance level 显著性水平
power function 幂函数 testing procedures 检验方法 test statistic 检验统计量
rejection region 拒绝区域 acceptance region 接受区域 critical region 临界区域
first-derivatives 一阶导数 second-derivatives 二阶导数 Likelihood ratio 似然比
dependent variable因变量 unexplanatory variable未解释变量 independent variable自变量
Error term 误差项 regression coefficients 回归系数 Sum of squared residuals 残差平方和
Marginal probability function 边际概率函数 joint probability density function 联合概率密度函数
Marginal probability density function边际概率密度函数 stochastically independent 随机独立
的
Mutually independently distribution 相互独立的分布 independently and identically distribution 独立同分布的
likelihood function 似然函数 maximum likelihood estimator 最大似然估计量
maximum likelihood estimate 最大似然估计值 log-likelihood function 对数似然函数
ordinary least squares estimation/estimate/estimator 普通最小二乘估计/估计值/估计量
linear unbiased estimator 线性无偏估计
第三章、概念与符号
[An index]把指数定义成是对一组相关变量之中变化进行测算的一个实数。从概念上讲,指数可以用来比较随时间或者空间或随两者同时变化的量。指数用来测算随时间变化的价格与数量,也可以用来衡量不同厂商、行业、地区或国家的水平差异。价格指数可以指消费者物价投入与产出、价格进出口价格等等,而数量指数可以测算一个厂商或行业随时间变化或者不同厂商在产出商品以及所用投入上的数量变化。
[Index number have]指数在经济学上有着悠久的且与众不同的历史,一些最重要的贡献归功于早在十九世纪晚期的Laspeyres和Paasche的研究。Laspeyres和Paasche公式仍旧被全世界一些国家的统计局所广泛应用。但是,正是Irving Fisher的工作以及他的著作——在1992年出版的《编制指数》——认识到
rnquist指数To使用许多统计公式生成适当的指数的可能性。(1936)在生产率测量中起到重要作用。。Diewert
和Nakamura(1993)书中的第二章提供了极好的阐明指数构建的历史背景。
符号
[We use the following]在一这章中我们自始至终地使用下述符号。设
pmj和
qmj 分别表示第m种
(m=1,2,...,M)商品在第j(j=s,t)个时期中的价格与数量。为了不失一般性,s与t除了可以表示时期之外,还可以指两家厂商,而数量可以是投入量,也可以是产出量。
[Conceptually,all]从概念上讲,所有指数测算了来自于一个参考时期的一组变量水平的变化。参考时期由“基期”表示,用于计算指数的时期称为“现期”。设Ist表示以s为基期以t的现期t的综合指数。类似地,设Vst,Pst和Qst分别表示价值指数、价格指数以及数量指数。
综合指数问题
[The value change from]从时期s到时期t的价值变化是在时期s与t的商品价值之比值,价值有各自的价格衡量。因而
Vstpitqiti1Npi1Nisisq
指数Vst测算了从时期s到t的M种商品集合数量价值的变化。显然,Vst是两种成分即价格变化与数量变化的结果。尽管Vst容易测算时,但是要剔除价格变化与数量变化的影响就非常难。我们想要踢除这种影响,因此,比如说,使数量成分可以用于测算数量的变化。
[if we are operating]如果我们在单一商品的世界里处理问题,那么这种分解就很容易做到我们有
Vstptqtpsqsptpsqtqs
其中比值ptps与qtqs测算了相关的价格变化与数量变化,从而不存在指数问题。
[In gennerally]通常当商品数M≥2时,我们就有了综合问题。相对价格pmt/pms测算了第m种商品价格水平的变化。相对数量qmt/qms测算了第m种商品数量水平的变化。
[Now the]现在的问题是,如何将这m种不同价格(数量)变化的测算合成一个简单实数,称之为价格(数量)指数。这个问题有点类似于选择一种合适的中心趋势来测量,在下面两节中我们简要地阐明测算价格指数与数量指数变化的一些最常用的公式。
第四章、非模型处理缺失数据
[if no models]倘若没有模型可以利用,则人们直接分析可用数据,或者分析经过基于非模型估算之后的数据。
只利用可用数据
[Listwise deletion]成列删除或完整个案分析意指,删除数据中有缺失值的一个或多个变量的那种观测值。在MCAR假设下,经过成列删除之后,所保留的样本仍是源自最初总体的一个随机样本;因此,基于该样本的估计是一致的。不过,其标准误差将会扩大,因为所用信息甚少,若回归元个数很多,则成列删除的总效果导致总观测值会剧烈减少。这激发人们脱离那种对拥有高比例缺失观测值的变量进行分析,可是,由该种方法所产生的结果却潜在的使人误导。
[if MCAR]如果MCAR得不到满足且缺失数据仅仅是MAR,那么估计将是有偏的。因而,成列删除对违背MCAR而言是不稳健的。不过,成列删除对回归分析中各个自变量违背MAR而言是稳健的。也就是,当任何回归元出现缺失数据的概率并不依赖于因变量之值。简约地讲,成列删除是可接受的,如果归因于缺失数据的不完全情况构成了各种各样种情况的比例很小,比如说5%或更少。更重要的是,成列删除之后的样本是说研究总体的代表。
[Pairwise deletion]成对删除或可用案例分析,时常被认为是比成列删除更好的一种方法。其思想是估计(x1.x2)的联合样本矩时,运用观测值(x1i,x2i)的全部可能对,并且估计边缘矩时运用个体变量的全部观测值。因而,在线性回归中,在成对删除下我们运用回归元的所可能对估计(X'X)与(X'y),而在成列删除下,要在删除任何拥有缺失观测值的全部情况后才能估计 (X'X)与(X'y)。很明显,在成对删除下,
我们损失较少信息。这里建议要运用最大信息量去估计个体概括统计量,诸如均值与协方差,然后使用这些概括统计量去计算回归估计。
[There are two]成对删除有两个重要局限性:(1)一般的讲,估计标准误差与检验统计量都是有偏的;2所得到的回归元协方差矩阵(X'X)可能不是正定的。
不用模型的估算
[There are a number of]统计软件经常执行一系列专门或勉强证明合理的方法。
[Mean imputation]均值估算或均值替补意指,运用可利用值的平均值代替缺失观测值。该方法是均值保持不变的,但将对数据的边缘布产生影响。很明显边缘分布中心概率质量表现出增大,该方法也影响到协方差以及与其他变量的相关性。
[Simple hot deck]简单替补估算意指,用来自从那种具有观测值的变量中随机抽取到的值代替缺失值,有点像自助法。该方法维持了那个变量的边缘分布,但却扭曲了变量之间的协方差与相关性。
[In a regression]在回归背景下,这两个著名方法虽然具有简单性,但却没有一个引人注目。
2.1.1
[We consider an experiment]我们认为一个实验的结果是未知的,而一个事件出现的概率已知,有时也称作随机实验。一个实验的样本空间是所有可能的结果的集合。每一个样本空间的元素被称为样本空间的一个元素或样本点,表示每一个结果都从该实验中获得。一个事件是包括在样本空间中的结果的任意集合,或者说和样本空间的子集是相同的。一个简单事件是由一个确切的元素和一个由多个元素组成时混合事件组合而成。样本空间被定义为,样本点为。
[Suppose]假如,A事件是样本的一个子集,令为事件A的一个样本点,然后,我们说一个样本点
是属于A样本空间,定义为A。
[A set]一个样本点不属于事件A的集合被叫做A的互补事件,被表示为A.一个事件没有任何样本点被
C叫做空事件,定义为。相反地,一个事件包括了所有可能的样本点,被叫做全事件,表示为Ω。
[Next]接下来考虑,A和B 事件,一个由所有属于A或B事件的样本点的集合被叫做和事件,被定义为
AB,一个由所有同时书A和B的样本点组成的集合叫做积事件,被定义为AB,当AB为时,我们说事
件A和B是互斥的。
2.7.1
[Suppose that the functional]假如在总体上潜在的分布的函数组成是已知的,但分布中的参数是未知的。总体的分布函数fx;已给出,令x1,x2,...xn是来自总体分布的n个观测数据,考虑用几个观测数据来估计参数。令
x1,x2,...,xn是观测数据x1,x2,...,xn的一个函数。假设
x1,x2,...,xn是由估计参数的目标组
成的。
x1,x2,...,xn取一个由n个观测数据给出的确定值,那么,
x1,x2,...,xn被叫作的点估计,或者说的
简单估计。
2.7.5
[The properties of]在2.7.4部分中,x和s估计量的性质已经讨论过了。可知x是的一个在正态假定下的无偏的,有效的和一致的估计量,s是的一个无偏估计量。注意,s是无偏的但不是一致的。
2222,[The population parameter]总体参数依赖于一个由总体分布fx;的函数组成,符合于服从的
2正态分布和服从参数的指数分布的情况。现在,更一般的情况,我们想要考虑怎么去估计,极大似然估计给了我们一个答案。
[Let]令x1,x2,...,xn为相互独立同分布的随机样本,xi有概率密度函数fx;,在这些假定下,x1,x2,...,xn的联合概率密度函数被给出为
fx1,x2,...xn;fxi;i1n,表示未知参数。
[Give]给出真实的观测数据x1,x2,...,xn,联合密度fx,...,x;被视为的一个函数。
1n2.8.1
[The testing procedures is]
假设检验的过程如下:
1、基于参数构建一个原假设
2、考虑适当的统计量,我们称它为检验统计量,得到一个检验统计量的分布函数,当H0时真的
3、从可观测的数据计算,检验统计量的观测量
4、比较分布和检验统计量的观测值,当统计量的观测值是在分布函数的两边的时候,我们认为原假设是不可能发生的,所以我们拒绝原假设。
H0不可能发生的区域我们称它为H0的拒绝域,定义为R,相对的H0可能发生的区域我们称它为接受域,
定义为A。
因篇幅问题不能全部显示,请点此查看更多更全内容