登陆注册
8774300000034

第34章 学会资料的分组与编码

一、资料的分组

市场调查资料的分组,就是根据市场调查的需要,按照一定的标志,将调查总体划分为若干个组成部分的资料整理方法。通过分组,使得同一组内的各单位在分组标志上具有同质性,不同组之间的单位具有差异性。因此,通过分组可以区分市场现象的类型;反映市场现象总体的内部结构;分析市场现象之间的依存关系。

(一)分组标志的选择

对市场调查资料分组的关键在于正确地选择分组标志。分组标志就是进行分组的标准或依据。分组标志选择是否正确,是资料分组能否发挥其作用的基本前提。分组标志一旦确定,在整理中就会突出单位在该标志下的差异,而掩盖了单位在其他方面的不同。因此,同一调查总体由于选择的分组标志不同,得出的认识结论也会有所不同,甚至是相反的结论。为此,在进行分组时应遵循以下原则选择分组标志:

1.依照调查目的选择分组标志

对同一调查对象的总体,由于调查目的不同,需要采用不同的分组标志。例如,在调查某地区的消费品零售市场时,如果调查的目的在于分析某种商品的市场供应结构,分组时应当采用该种消费品的生产厂商或品牌作为分组标志;如果调查目的在于分析该种商品的消费结构,分组标志应当选择居民的户型或收入水平等。根据不同的调查目的,选择合适的分组标志,才能使分组资料更好地满足调查的需要。

2.依据反映现象本质特征选择分组标志

反映事物差异的标志很多,分组时应当抓住反映其最具本质区别的关键性标志作为分组标志。例如,在调查投资规模效益时,对简单劳动密集型企业的规模分组标志应当选用职工人数;对资金密集型企业的规模分组标志应当选用固定资产原值等。

要调查某城镇的家庭收入状况,需要选择分组标志,现提供两种不同的分组标志。

第一种分组标志是按每户月收入划分的,第二种分组标志是按每户平均每人的月收入划分的。两种分组标志的选择方法不同,可能出现不同的结果,哪种更能反映家庭收入水平的本质特征呢?

第一种分组标志的选择方法,只能看出每户的收入,但每户的家庭成员数量是不同的,也许800元以下这组有的家庭人口数只有1人,而1600元以上这组有的家庭人口数有6人,那么平均到每人的收入只有267元,故这种方法不能反映事物的本质特征,而第二种按每户平均每人收入的分组方法就合理多了。

3.结合现象所处的历史条件和经济状况选择分组标志

事物都处于不断的发展和变化之中,在不同阶段调查对象所表现出的性质和特征都会有所不同。因此,在进行分组时,必须用动态的观点选择分组标志。这一点在研究历史资料、进行时间序列分析和预测中需要特别注意。例如,原来调查工业企业规模时,一般以职工人数为分组标志,把企业规模分为大、中、小型三类。随着机械化、自动化水平的提高,这种分类方法已经不科学,因为有些机械化、自动化水平较高的企业,虽然规模很大,但职工人数却较少。因此,一般使用生产能力和固定资产作为分组标志。而调查乡镇企业的生产规模时,由于多是劳动密集型企业,生产的产品不固定,生产能力很难计算,因此,以职工人数作为企业规模的分组标志简便易行。此外,在将调查资料与历史资料进行对比时,应注意可比性问题。尤其在改变分组标志时,必须注意选择与历史资料可比的分组标志。

(二)资料分组的方法

根据资料分组标志的不同,对资料的分组可以是品质标志分组和数量标志分组。

1.品质标志分组

如果资料的度量尺度是定类尺度或定序尺度,这些资料反映的是调查对象的性质或品质,在对各单位分组时采用按品质标志分组,例如,按照企业进行产品宣传的媒体标志分组,划分为招贴、报纸杂志、广播、电视、互联网等;居民按文化程度标志分组,划分为大学及大学以上、高中、初中、小学、文盲和半文盲等。

2.数量标志分组

如果资料的度量尺度是定距尺度或定比尺度,这些资料反映的是调查对象的数量特征,它们在不同的单位的取值具有可变性,通常称为变量。在对这些资料分组时采用数量标志分组,也称变量分组。例如,研究居民的生活水平,按照居民家庭的恩格尔系数这一标志,把恩格尔系数在60%以上的居民家庭归为贫困家庭;在50%~60%的家庭归为温饱家庭;在40%~50%的家庭归为小康家庭;在40%以下的家庭归为富裕家庭。又如,儿童按年龄分组分为:不满1岁、1~2岁、3~4岁、5~9岁、10~14岁。

(三)资料分组的形式

资料分组按照所用的分组标志的多少及组合形式的不同,可以分为简单分组、复合分组和分组体系。

1.简单分组

如果调查目的只是为了反映总体在某一方面的情况,可采用简单分组。简单分组中所使用的分组标志只有一个。例如,家庭按人均居住面积分组分为:4平方米以下、4~14平方米、14平方米以上,这样的分组就是简单分组。

2.复合分组

如果要反映总体的多个方面的情况,又需要知道这些方面相互交错形成的复杂情况,就需要采用复合分组。复合分组是将总体按照两个或两个以上分组标志相结合进行的资料分组,即首先按照一个标志分组,然后在已划分的各组内按照另一个分组标志或几个分组标志再进行细分组。

现对某地区居民家庭居住面积进行调查,对居民家庭首先按照居住地的性质分为城市家庭和农村家庭2组,再把城市家庭和农村家庭分别按照人均居住面积分为4平方米以下、4~14平方米、14平方米以上3组,形成2个粗分组和6个细分组,共8个组。分组结果如下所示:

城市家庭

人均居住4平方米以下

人均居住4~14平方米

人均居住14平方米以上

农村家庭

人均居住4平方米以下

人均居住4~14平方米

人均居住14平方米以上

用复合分组时,分组单位一般不超过两个,否则分组的结果将显得杂乱不清。

3.分组体系

如果采用资料分组的方法,目的在于从不同角度、不同方面对同一调查对象进行分项说明,使人们对事物的认识有一个全面的总体印象,可采用分组体系。分组体系采用一系列相互联系、相互补充的并列分组标志对总体进行分类。分组体系的分组方式采用罗列式分组,因而各个分组之间不存在交叉层叠,随着分组标志数量增加分组的表现效果会更好。

二、资料的编码

编码是对调查所得资料进行计算机录入的前提,又是使用计算机对资料进行整理的手段。编码一词,既可以理解为名词,也可以理解为动词。作为名词的编码,表面上指的是一套数码符号,实质上应理解为对资料进行确认、记录和分组的一套规则。作为动词的编码,则是指设计这样一套规则,并且按照规则把以文字形式记录的资料转化成数码符号形式的资料的全部过程。编码与分组有密切的关系。只有选择和确定了分组标志和相应的标志表现,才可以为每一种标志表现指定数值符号。而当完成了编码的数码转换工作,并将这些数码输入到计算机存储器内形成资料文件后,计算机的资料整理软件即可对所输入的数据进行分组和汇总工作。

A公司调查某部门20名职工的性别、年龄、月收入以及年终业务考核成绩的数据。如果想用计算机处理这套资料,就必须把表中所载资料转换成数码符号形式的数据。为此,可以规定这样一套规则:

职工编号――按原数码形式;

性别――“男”以“1”表示,“女”以“2”表示;

年龄――按原数码形式;

月收入――原数码形式去掉小数点;

考核成绩――“优”以“1”表示,“良”以“2”表示,“中”以“3”表示,“及格”以“4”表示,“不及格”以“5”表示。

再按这套规则将表载资料转换成数码符号,列入之中。

(一)预编码

一般来说,调查问卷中的多数问题都是封闭性的,预先已经设计出可供选择的答案。有时,为了方便计算机处理,在设计问卷时就预先给这些答案设计了编码,这种编码方式称为预编码。对于大型问卷调查来说,由于调查的范围、对象、所调查的内容、问题形式等都比较复杂,为了便于统一处理,一般会对某些问题答案进行预编码。预编码印在问卷每页的右侧,用竖线将其与问题及答案隔开。例如,一份人力资源基本信息调查的问卷中问题与相应的编码安排。

此外还有另一种预编码方式,即在问卷之外另行制作登录卡。登录卡是一个空白的数码矩阵,编码员根据编码说明书的编码方案将问卷所载的答案转化成数码填入适当的矩阵单元内,经过审核后,计算机就可以直接读取数码了。

(二)后编码

后编码是整理开放式问题答案并对其进行编码的有效方法。开放式问题的提出,是补充封闭式问题的不足,为深入追问被调查者对待特定问题的一些深层次看法而设计的。因为,调查设计者事先对问题不可能预见到所有可能的答案,无法在问卷中给出数目不太多,又能互斥、穷举的一组供选择答案。对这类问题所给的答案进行编码时,首先要阅读部分(最好是全部)答案,记录和分析出包括多少类别,这些类别应该是相互独立的和穷尽所有可能的,然后对这些类别编码。

对开放式问题的答案进行整理和编码,不是机械性的作业。它所依据的不应该仅是答案的文字,更重要的是这些文字所能反映出来的被调查者的思想、认识和心理。如何将从各种角度、依据不同标准给出的叙述性和评论性文字答案,整理出按同一尺度计量的单一系列答案编码是对开放式问题的答案进行整理和编码工作的难点。正因为这种编码只能是在对答案进行整理归纳之后进行,所以叫做后编码。

后编码可以按下列步骤进行:

(1)挑选少量具有代表性的问卷,对答案进行全面的阅读和初步分类,以便初步判断答案的分布状况。通常会抽取全部问卷数的20%来实施这一步工作。

(2)将所有有效的答案列成频数分布表。

(3)拟定适宜的分组数。要从调查的目的出发,考虑分组的标准是否能确实符合调查的目的;同时也要考虑计算机的处理能力和数据处理软件的处理要求。

(4)根据拟定的分组数,对列在答案频数分布表中的答案进行选择和归并。在不影响调查目的的前提下,保留频数多的答案,然后把频数分布较少的答案尽可能归并成意义相近的几组。对那些含义相距甚远,或者虽然含义相近但合起来频数仍然不够多的,一律并入“其他”一组。

(5)为所确定的分组选择正式的组别标志。

(6)根据分组结果为数据制订编码规则。

(7)对全部回收问卷(开放式问题答案)进行编码。

(三)编码说明书

编码说明书是一份说明问卷中各个问题(即变量)及其答案与数据文件中的编码值之间一一对应关系的文件。在制订编码说明书时,要注意以下几个问题:

(1)所有的资料都必须转换成数值,不允许使用字母或其他字符。

(2)使编码的内容保持一致性,通常的操作技巧是,用固定的数字顺序表示回答项的次序。例如,对所有测量等级、程序内容的项目答案,都以从小到大的原则分派编码。例如,“1”表示最不喜欢;“2”表示不太喜欢;“3”表示喜欢等。

(3)每一个数值码占据一列。要为每个变量留出足够的码位。

(4)对无信息的答案赋予标准代码。例如,可以用“0”表示“不知道”;“9”表示“无回答”;“0”表示“不适合”。

(5)尽可能用真实的数字作为编码,例如,对于年龄、分数、收入等在调查时获得的数据,在编码时,就以原数据作为编码。如“59”岁,编码就为“59”;“98”分,编码就为“98”;“2000”元,编码就为“2000”。这样可以保持数据库的原始资料性质。

总之,制订编码方案是组建数据库关键的一步,其质量决定着今后计算机处理的效率和速度。要依据编码方案,编制出编码说明书,以准确的语言和清晰的格式说明每一个问题、每一种回答的编码是什么,含义是什么。

同类推荐
  • 学校行为文化的建设管理(上)

    学校行为文化的建设管理(上)

    文化的内涵非常丰富,其本义则是“以文教化”,表示对人的性情的陶冶,品德的教养,属于精神领域的范畴。所以,我们学习文化知识,就是为了不断提高个人的文化素质修养。
  • 青少年挖掘大脑智商潜能训练集—心理游戏大测试

    青少年挖掘大脑智商潜能训练集—心理游戏大测试

    潜能是人类原本存在但尚未被开发与利用的能力,是潜在的能量。根据能量守恒定律,能量既不会消灭,也不会创生,它只会从一种形式转化为其他形式,或者从一个物体转移到另一个物体,而转化和转移过程中,能的总量保持不变。
  • 语文新课标课外必读·第五辑:诺贝尔传

    语文新课标课外必读·第五辑:诺贝尔传

    国家教育部颁布了最新《语文课程标准》,统称新课标,对中、小学语文教学指定了阅读书目,对阅读的数量、内容、质量以及速度都提出了明确的要求,这对于提高学生的阅读能力,培养语文素养,陶冶情操,促进学生终身学习和终身可持续发展,对于提高广大人民的文学素养具有极大的意义。
  • 繁花:十年高考满分作文精选

    繁花:十年高考满分作文精选

    高考满分作文十大要点:标题引人入胜——独树一帜;语风清新明义——言简意赅;文体形式多样——不拘一格;视角独特深入——见微知著;内容充实新颖——镜意求新;材料意象丰富——托物引类;立意务求深刻——高瞻远瞩;行文展现才情——拍案惊奇;真情自然流露——去伪存真;彰显个性魅力——锋芒毕露。
  • 快乐校园精品读物丛书:与名人一起品味小品

    快乐校园精品读物丛书:与名人一起品味小品

    《快乐校园精品读物丛书:与名人一起品味小品》从浩如烟海的中外文海中精心挑选了一些经典美文。文章或以情动人,或以理服人,或纯粹唯美,或质朴平实,或慷慨激昂,或侃侃而谈,不仅文字优美,文笔流畅,而且思想精湛,见识深邃,闪烁着智慧的灵光。
热门推荐
  • 当众讲话是门技术活

    当众讲话是门技术活

    从自信、表现、经验、知识、思维及词汇六个方面入手,深入浅出地介绍了当众讲话应该具备的能力。作者结合多少年培训经验首创当众讲话“钻石法则”、“莲花六技”、“问题链思维”、“口才导图”等操作性极强的讲话技术,这些方法能够使读者在短时间内提高当众讲话的技术,成为讲话达人。
  • 美妙爱情:还好没错过你

    美妙爱情:还好没错过你

    他们是青梅竹马,他从小就爱她,但是她不知道,也错过了很多。但是好还还来得及,我没有错过你。“你为什么要等我?”“因为我知道你还没有忘记我,”“你为什么这么的肯定。”她拿出了一条项链,“这就是最好的证明”
  • 剩女的梦幻庄园

    剩女的梦幻庄园

    跨过三十岁的大关,孟真童鞋成为一枚金光闪闪的剩女爱情的不顺,事业的一事无成让她对生活近乎麻木一次偶然的机会,她在城市的边缘得到一栋农家小院母亲留给她的玉镯也给她打开了一个神奇的世界剩女的生活也可以丰富多彩,咱也去种地,咱也去养狗,让平淡的日子变得有滋有味……女猪比较宅,胸无大志。
  • 网游之化神传说

    网游之化神传说

    孤儿的丁丁以超级特别的方式应聘成了华天集团的游戏测试玩家,当公测开始之际,也迎来了他人生的辉煌。仙器神器手到擒来,小爷一锹在手,天下我有!
  • 从士兵突击开始的影视剧特种兵

    从士兵突击开始的影视剧特种兵

    轮到郑英奇讲他的经历了,他慢吞吞的靠在了箱子上,惘望着天空,慢慢说道:我啊,在《士兵突击》里面受过训,也在《我是特种兵》的世界里面虐过菜鸟,后来啊,我也曾在《亮剑》里面打过仗,也在《兄弟连》里面服过役。这时候有人插话:“就这些吗?”郑英奇摇摇头,缓缓说道:除了这些,还有,有《兵临城下》、《黑鹰坠落》、还有……群号:626685740,问题答案:666。
  • 听风诉说他是王俊凯

    听风诉说他是王俊凯

    他是她的青梅竹马,她因为一件事离开了他到了韩国,也因此变得不爱说话了,当他们再次相见时还认识对方吗?他们之间的约定能兑现吗?
  • 罪恙

    罪恙

    简言来说,应该是一段不长不短的故事,听者,谢;感者,歉。
  • 贪恋红尘三千尺

    贪恋红尘三千尺

    本是青灯不归客,却因浊酒恋红尘。人有生老三千疾,唯有相思不可医。佛曰:缘来缘去,皆是天意;缘深缘浅,皆是宿命。她本是出家女,一心只想着远离凡尘逍遥自在。不曾想有朝一日唯一的一次下山随手救下一人竟是改变自己的一生。而她与他的相识,不过是为了印证,相识只是孽缘一场。
  • 魔法亡灵时代

    魔法亡灵时代

    为了争夺种族的生存空间,地面生命与地下生命的“终极决战!”以地面生命惨胜结束!在哪场毁天灭地的末日大战中,双方都投入了所有的顶尖力量!哪是终极魔法的大比拼!是超级禁咒的大毁灭!无数强者在这场大决战中陨落!无数文明在这场大决战中消逝!魔法巅峰时代就此结束!终极决战使得魔法大陆遍地淹埋着无数强者的骸骨!这是亡灵法师的天堂!是魔法亡灵时代的开始……
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!