登陆注册
6274100000053

第53章 调查数据的描述和推断

8.2.1 统计数据特征的描述

对调研数据或结果的描述可以采用描述性统计方法。描述性统计(discriptivestatistics)的目的就是更有效地概括大量调查统计数据的特征。调研人员应当从一组调查数据中计算出最能反映这组数据特征的一个或几个数量指标。这些指标主要的就是:反映集中趋势的一些指标、反映离散趋势的一些指标,以及频数分布和百分比分布。

1.集中化趋势的描述

反映集中化趋势的指标主要包括均值(mean)、中位数(median)和众数(mode)三种。其中,均值属于数值平均数,而中位数与众数属于位置平均数。当分析的目的是确定一个变量的典型数值或一组调查数据的最一般特征时,这些指标是非常有用的。

(1)数值平均数。均值,或算术平均数,只适用于采用比例或等距尺度度量得到的数据。用均值来反映一组数据的平均趋势时,所遇到的最大问题是容易受到一些极端值的影响,从而不能准确地反映一组变量的集中化趋势。

(2)位置平均数。中位数适用于除了用类别尺度度量所得到数据以外的各种数据。中位数是一种位置平均数,其特点是有一半的调查数据小于它,另一半调查数据大于它。用中位数来反映一组数据的平均趋势具有稳定性,不会受个别极端值的影响。因此,用中位数来反映收入差异比较大的情形下的收入变量的平均趋势就比均值要合理得多。众数就是出现次数最多的数值,适用于采用各种尺度度量得到的数据。

2.分散化趋势的描述

集中化趋势所研究的实际上是一组数据的共同特征,但有时市场调研还需要研究所得到的数据之间的分散程度,即差异大小。用来衡量一组数据分散化趋势的指标首先是极差R。极差表示一组数据中最大值与最小值之差。由于极差所反映的是一种极端的情形,因此,应用并不广泛。

实际上应用得最广泛的是方差S2或标准差S。根据一组调查数据,利用下列公式就可以计算出标准差S:

∑(xS=i-珋x)2槡n-1

标准差越小,调查数据落在均值附近的概率就越大,数据之间的差异也就越小,均值反映数据集中化趋势的效果也越好。另一方面,如果标准差越大,就说明调查数据越分散,数据之间的差异也越大,用均值反映数据集中化趋势的效果也受到影响。

3.频数分布和百分比分布

集中化趋势和分散化趋势的度量指标都仅仅反映了总体的大致信息,并没有提供关于总体内部分布情况的足够详细的信息。市场调研中经常需要分析变量取值或数据的分布情况。反映数据分布情况的最简单方法就是计算各个分组的频数分布和百分比分布。

8.2.2 对总体参数的推断

市场调研的最终目的是了解总体的情形,因此,计算出样本统计量或数字特征以后,还需要据此来推算总体的参数。依据一组调查数据来推断总体参数的方法称做统计推断(inferentialstatistics),或统计估计。市场调研中最经常遇到的问题是根据样本数据来估计总体的均值和比例。统计推断或估计根据所采用的方法不同又分为两种方法:点估计和区间估计。

1.点估计

点估计的基本思路是直接用样本均值来估计总体均值。对于简单随机抽样,不会产生偏差的不分层非随机抽样,或者是按比例的分层抽样来说,样本的均值就是总体均值的无偏估计。但是,在按比例的分层抽样情形,如果样本回收情况不理想,原来的按比例分层抽样变成了不按比例的分层抽样,那么,再用样本均值来估计总体均值就会产生较大的偏差。这就意味着,在计算用于估计总体均值的样本均值时,要注意防止产生偏差。

上述想法如果从纯粹的数据分析角度看,就是对于一组未经分组的调查数据来说,根据众所周知的计算样本均值珚X的公式,只要样本数足够大就可以得到总体均值的无偏估计。但是对于分组数据而言,在计算均值时,特别要注意对于不同组别所加的权数要合适。事实上,很多调研人员在计算分组数据的均值时,由于采用的权数不合理,由此所产生的误差可能是很严重的。

下面的实例就说明在分层抽样调查的情况下,经常可能发生的误差。

[例8-2]为了调查某100万人口的城市中人均消费某种果酒的情况,调研设计决定选取2000人的样本进行抽样调查。根据对这种果酒消费情况的初步分析,总体可以分为三个层次或者是小市场面。第一层是18岁以上的男性居民。第二层是18岁以上的女性居民。第三层是18岁以下的男女青少年。根据二手资料的调查,该城市中第一层、第二层和第三层的人口比例分别为38.5%、38.5%和23%。

因此,在各层中按比例选取样本,分别选取770、770和460人作为样本,并实施了问卷调查。

但调查结果,各层中回收的问卷数分别为540、444和216,合计1200人,总的回收率仅为60%。调查得到这1200个样本共消费所调查的果酒3524.4千克。

于是,有人根据上述数据计算得到总体的人均年消费量为:

3524.4÷1200=2.937(千克)

但实际上,按上面的计算方法所得到的结果包含了很大的误差。如果我们先计算每一个不同层样本的人均消费量,再对三个层的结果进行综合,情况就会大不相同。假如计算得到,第一层人均年消费量为5.5千克,第二层为1.2千克,第三层为0.1千克,则1200人共消费果酒恰好就是:

5.5×540+1.2×444+0.1×216=3524.4(千克)按上述算法计算得到的结果就意味着:

(5.5×540+1.2×444+0.1×216)÷1200=5.5×540÷1200+1.2×444÷1200+0.1×216÷1200=5.5×0.45+1.2×0.37+0.1×0.18=2.937(千克)由此可见,上述算法实际上是按回收样本的比例进行了加权,这个估计值显然是有偏差的。正确的结果应当是,按照总体中原来各层的结构比例,或者是按各层计划样本的比例来加权:

5.5×0.385+1.2×0.385+0.1×0.23=2.6025(千克)由此,我们看到对于人均消费量的估计,两种估计的误差达到0.3345千克(2.937-2.6025)。而对全市100万居民而言,果酒总消费量估计的误差将达到334.5吨。

上述例子说明的是对总体均值作估计的情形。在对总体的比例作估计时,也会发生同样的情况。下面的例8-3就是这方面的例子。

[例8-3]如果在例8-2所介绍的问题背景中,调研人员还需要增加对总体中饮用这种果酒的消费者人数比例做出估计,于是也同样分三个层进行分层抽样调查。简单的做法是在上述调查问卷中增加一个问题:“您是否饮用××果酒?”假设回收的三个层样本问卷中,第一层中有饮用者173人,第二层有饮用者53人,第三层有饮用者7人。各层样本中饮用者的比例数分别为32%、12%和3%。

对于总体中饮用这种果酒的消费者比例数的估计,常见的错误估计结果是:

(173+53+7)/1200=0.194这种做法就意味着:

(0.32×540+0.12×444+0.03×216)/1200=0.194但是,由于上面同样的原因,这种计算方法实际上也是按回收样本的比例进行加权的,所以,这个估计显然是有偏差的。正确的结果应当是,按照总体中原来各层的结构比例,或者是各层计划样本的比例来加权:

0.32×0.385+0.12×0.385+0.03×0.23=0.176两种估计的误差几乎达到2个百分点。

2.区间估计

无论是调研项目的委托方,还是调研人员,对于调研的结果仅仅用样本的描述性统计量,或者点估计的结果来说明往往是不满足的,因为抽样调查过程包含一定程度的误差。既然所得到的样本总会有某种抽样误差,于是用某一个范围来估计总体的参数将显得更加合理。影响所估计的区间大小的一个重要因素是调研人员期望的置信程度。因此,在作区间估计前,调研人员首先需要确定他们想要的置信度。市场调研人员想要的对置信度的典型期望值通常是90%、95%和99%等几种。

确定总体均值或比例的置信区间的步骤如下:

(1)确定区间估计中所用的样本统计量。在估计总体均值时是样本均值珚X,在估计总体比例时则是样本比例p。

(2)计算样本的标准差。在总体均值的估计问题中是样本标准差S,在总体比例估计问题中也要用到样本比例p。

(3)确定样本容量。

(4)决定期望的置信度(1-α),由此决定相应的Zα/2的值。当市场调研人员291/市场营销调研想要的置信度分别是90%、95%和99%时,相对应的Zα/2的值分别为1.64、1.96和2.58.

(5)按公式计算得到所需要的置信区间。

[例8-4]某市场调研公司受客户委托,需要确定A市居民家庭每年在旅游上的花费是多少。由于受到调研费用和时间等方面的限制,公司只能进行简单抽样调查。调研人员调查了400个有代表性的家庭,发现这些样本家庭每年在旅游方面的平均花费是2.5万元,标准差为1.2万元。在要求达到90%置信度的条件下,计算A市居民家庭平均每年在旅游方面的花费会落在什么范围内?

这是一个典型的统计推断问题,要求根据对样本家庭的调查数据推算总体均值的置信区间。根据问题的资料,我们得到样本均值珋x=2.5,样本标准差S=1.2.

同时,置信度1-α=0.90,α/2=0.05,Zα/2=1.64.于是,我们直接就可以得到该市90%居民家庭每年在旅游方面的花费会落在下列区间内:

[珚X-Z,珚X+Z]α/2·σα/2·σ槡n槡n直接把有关数据代入上述公式,就得到该市90%的居民家庭每年在旅游方面的花费会落在[24016,25984]内,即不会少于24016元,也不会多于25984元。

上述区间估计所研究的是,总体中位于中间的某一部分个体的数量特征。但是,有时我们需要估计的是位于总体某一端的个体的数量特征。

[例8-5]某市决定对全市家庭人均收入最低的5%的家庭实施最低收入家庭补助。从统计部门获悉,当地居民家庭人均收入服从均值为2000元,标准差为800元的正态分布,则应当把能享受最低收入家庭补助的家庭人均收入标准定为多少,才能恰好保证该市收入最低的5%家庭享受到该项补助?

此时,要估计的是处于家庭人均收入最低端的5%居民的最高收入,我们利用总体的正态分布特性,同时,注意到要估计的是位于总体某一端部分个体的数量特征,要补助的家庭收入应落在:

(-∝,珚X-Z·ασ)根据上述公式,我们就可以计算得到:

2000-1.64×800=688(元)由此,我们得到应对家庭人均收入等于和低于688元的家庭实施补助,恰好能保证该市家庭人均收入最低的5%的家庭享受到该项补助。

同类推荐
  • 业务连续性计划和管理

    业务连续性计划和管理

    内容有业务连续性管理——360度全面灾难防御;制定符合业务需求的连续性管理方针;以业务价值为导向,实现企业持续经营;日本地震若发生在台湾,您的企业承受的了吗?防患于未然,然亦有备——提升银行业务连续性管理;风险分析在业务连续性管理中的作用;建立企业风险意识,积极管理危机事件;基于KMV模型的商业银行信用风险管理研究;对公允价值的思考和审计风险防范;等等。可为包括上市公司、民营企业等各类企业的业务连续性管理提供理论基础和最佳实践。
  • 投资学名著全知道

    投资学名著全知道

    在投资领域中,许多名家的著作已经被证明在理论上具有权威性、在实践中具有可操作性,这些名著对于广大的投资者来说是一笔宝贵的财富。《投资学名著全知道》从实际应用角度入手,选取了投资大师或当代证券市场传奇人物所撰写的投资学名著,从中提取精华,汲取宝贵的投资智慧。这些经典之作,将一些新的投资思想介绍给我们,提醒我们应该避开一些投资陷阱,让我们从别人的错误中汲取经验,并最终成为投资领域中的赢家。
  • 每天学点实用投资学(Mbook随身读)

    每天学点实用投资学(Mbook随身读)

    富人越来越富有,而穷人越来越贫穷,原因在于他们的观念不同。富人将钱拿去投资,继而生出更多的钱米,而穷人只会把钱拿去存人银行。其实,只要掌握必要的经济知识和常规的投资理财规则,进行谨慎而明智的投资理财,你会发现普通人也有资可投,有财可理。本书通过通俗有趣的故事,帮助你改变旧有的投资观念,让你轻松获取最全面的投资知识,最实用的创富技巧,带你走上一条崭新的创富之路。本书由聂小晴编著。
  • 做最好的班组长

    做最好的班组长

    《做最好的班组长》针对班组长工作的特,详尽地向你介绍成为好的班组长应该具备的素质和技能,以及如何展班组工作等内容,具有很强的指导性、实用性和可操作性。希望对广大班组长不断提升自己的素质和能力,提高领导和管理水平有所帮助。
  • 做老板的条件

    做老板的条件

    《做老板的条件:创业成功者的12条天规》只作为创业者的基本素质考察,也就是说,它可用来确定一个人是否具备创业成功的潜质。但它不是万金油,也不是红宝书。拥有本书所界定基本素质的读者,千万不要沾沾自喜。创业成功是一个系统的过程,天赋和潜质,必须加上理性的思考和规划,方能最终达成正果。
热门推荐
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 我老婆要做女帝

    我老婆要做女帝

    来到一个被穿越者改造过的世界是一种什么样的体验?陈亮亮表示,其实我想回去来着。……被逼为奴又如何?一样是出人头地,是金子无论在哪都会闪光。拳打魑魅魍魉,脚踢各路虎狼。无论荣华美色,初心不失不忘。蛮族买办撒克逊?哼哼,我就问一句,还有谁?还有谁?……那我是离家越来越近、还是越来越远了?……嗳嗳嗳,借月光宝盒一用,可好?……那我叫你一声老婆,你敢应吗?……我去,你还真敢玩!(啥都求啊。)
  • 贤良相公娇宠妻

    贤良相公娇宠妻

    自小娘亲就教育她,长大了要出嫁从夫,三从四德,恪守妇道,便是为人妻的基本准则。在自己的夫君面前不能显得过于霸道,刁蛮跋扈,要温柔体贴,善解人意。正所谓如人饮水冷暖自知,秉承着娘亲的谆谆教诲,那日火红的嫁衣加身,伴随着亲人们的祝福热热闹闹的拜完了天地。可自打她成亲以来,那些个三从四德,出嫁从夫根本无法施展。相公会洗衣做饭,挣钱养家带孩子。相公知书达礼,温柔体贴。相公博学多才,满腹经纶。……上得厅堂,下得厨房,家有如此贤惠夫君,怎可外扬?邻里待嫁姑娘频频张望,快藏快藏。某家相公语:吾坑蒙拐骗使劲浑身解数才得此娇妻,自然要娶妻从妻,娶妻宠妻。
  • 火影修仙

    火影修仙

    来来来!你打到我就算我输!什么?比忍术?不好意思我随便来一下都是仙术!又要比小弟?我大暗部队长怕过谁来?兄弟们扁他!(本书,以火影的世界为蓝本,可以理解为火影的平行世界,虽然书名冠以火影2字,其实联系不大。望各位看官不要纠结...就当个全新的故事来看吧!)
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 我在梦里修文物

    我在梦里修文物

    梦境和现实的重叠、古老而神秘的村庄、家族刻意隐藏的秘密、时常闪现的记忆碎片,当诡异的经历接踵而至,平静生活也被打破。但当这些怪异的事情在眼前徐徐展开之时,仿佛一个充满神秘的美人儿在不断发出邀请,诱惑着人们来一探究竟,任谁也无法做到心如止水,作壁上观,但寻找谜底又该从何处入手呢?
  • 悯儿修真

    悯儿修真

    前方路途有多远,相依相陪伴解心宽。桃花飘落寒轩谷,再寻爱徒上千年云梦山中有一条草蛇名叫悯儿,聪明凌利机智果断还有上界真仙点化。悯儿在人间修炼多年,竟可以幻化成美貌少女。而法术初成,武功高强的悯儿。机缘巧合,做了燕国的掌国公主。面对着国家的内忧外患,外敌入侵,悯儿挺身而出,力挽狂澜,血战沙场,成为百战百胜的无敌战神。风光一时的悯儿。却因爱徒的死心灰意冷,看破红尘,斩断情丝,出家入玄门修道。在清冷孤寂的道观,伴随着幽幽的颂经礼拜之声,了却残生…………然而,苦命的悯儿却身染重病,痛苦不堪,在病痛的折磨中尝尽了人生之苦。悄然离世。上界真仙看在眼里,痛在心里。出手助悯儿飞升仙界而刚刚升入仙界的悯儿,出出茅庐,不知人心之险恶,世道之昏暗——而被奸人陷害,命悬一线,幸遇,蓬瀛派掌门人紫姗,出手相救,而收为关门弟子。师徒感情深厚,有几生几世的缘份。终有一日,悯儿为救被魔界残害的,无辜生命,和自己苦苦寻觅,一往情深的情郎,身入险境,被魔界魔女惨忍杀害,紫姗得知后肝肠寸断,五内俱焚,为徒儿报仇杀入魔界,身受重伤,紫姗对天发誓,寻便三界六道,不论千年万年,也要找到我那苦命的徒儿……
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 我的游戏异变了

    我的游戏异变了

    罗峰下载了一个不正常的游戏,在万界收了无数天才弟子,而这些弟子都会反馈给罗峰各种好处。到了某一天,罗峰发现万界回归了,而昔日的小弟子也都成为了一方巨擘.........总之,这是一个灵气复苏中毒舌,逗比男主的有趣故事。 欢迎加群催更聊天,群聊号码:974208685