您好、欢迎来到现金彩票网!
当前位置:中国福利彩票玩法规则 > 分组数据 >

? 开口式分组——第一组缺下限、最末组缺上限 ? 闭口组——各组

发布时间:2018-08-08 18:01 来源:未知 编辑:admin

  第三章 数据的拾掇和展现 统计查询拜访 统计拾掇 统计阐发 统计工作的三个核心阶段 ? 第一节 统计数据的拾掇 一、数据拾掇的概念和感化 ? 统计拾掇是指按照统计研究的目标,将 统计查询拜访所得的原始材料(也称初级材料) 进行科学的分类和汇总;或对曾经加工的综 合材料(也称次级材料)进行再加工,为统 计阐发预备系统化的、层次化的分析材料的 工作过程。统计学分组数据定义 ? 统计拾掇是统计查询拜访的继续、统计阐发 的前提。 ? 二、统计拾掇的步调 ? (一)设想和编制统计材料的拾掇方案。 ? (二)对原始材料进行审核。 ? (三)用必然的组织形式和方式,对原始材料进 行排序、分组、汇总和计较。 (四 )对拾掇好的材料再一次进行审核,更正在 汇总过程中发生的各类差错。 (五)编制统计图表。 (六)统计数据的堆集和保管。 ? 三、统计拾掇的组织体例 ? 1、逐级拾掇 2、集中拾掇 3、逐级拾掇与集中拾掇相连系 四、统计拾掇的方式 次要方式 分组 汇总 统计表 统计图 ? 汇总 1. 手工汇总 2. 计较机汇总 第二节、统计分组 ? ? 一、统计分组的概念 统计分组是按照统计研究的目标和研究对象的特点,将 统计总体各个单元按照必然的标记划分为若干性质分歧的部 分或组。 ? 统计分组的两方面涵义: ? 对总体而言,是“分”,即将总体中的各个个别按照它 们的差同性区分为若干部门; 对个别(总体单元)而言,是“合”,即将性质不异的 个别组合起来。 ? 即对总体实行异质分化,对总体单元实行同质组 合。即组内同质性,组间差同性 分组 25% 33% 42% 分组前 分组后 二、感化: (1)划分社会经济现象的类型 例:按所有制性质划分,我国现有8种经济类型: 国有经济;集体经济;私营经济;个别经济联营 经济;股份制经济;外商投资经济;港澳台投资 经济 (2)揭示社会经济现象的内部布局和比例关系 例:上海市按GDP计较的三次财产布局(%) 1980年 1990年 1996年 1997年 GDP 100 100 100 100 第一财产 3.2 4.3 2.5 2.3 第二财产 75.7 63.8 54.5 52.2 第三财产 21.1 31.9 43.0 45.5 (3)研究现象之间的依存关系 例:某地农人家庭按收入分组的恩格尔系数 按收入分组(元) 200 300 400 500 600 800 1000 恩格尔系数(%) 64.9 60.2 56.7 54.4 50.5 49.9 43.6 三、统计分组的准绳和方式 1、统计分组的准绳 ? (1) 科学性准绳 ? (2) 完整性准绳(穷尽准绳)——即应使总 体中的每一单元都应有组可归,或者说各分组 的空间足以容纳总体所有的单元。 ? (3) 互斥准绳(不相容性)——即总体中任 一单元只能归入某一组。 2、统计分组的方式 ? 统计分组的环节在于准确选择分组标记。 (1)分组标记的选择——准绳是: 1)从研究目标出发选择分组标记; 2)选择最能反映现象素质特征的分组标记; 3)按照事物所处的具体汗青前提和经济前提 选择分组标记。 ? (2)分组方式(统计分组的品种) ? 1)、按分组标记的性质分歧,分为质量分组(或称 属性分组)和数量分组(或称变量分组)。 ? 质量分组——按质量标记进行的分组。 ? 数量分组——按数量标记进行的分组。 ? 、按分组的感化和使命分歧,分为类型分组、布局分 组和阐发分组。 ? 类型分组——将复杂现象分为若干性质分歧部门 的分组。 ? 布局分组——表白总体布局的分组。 ? 阐发分组——阐发现象间依存关系的分组。 ? 2)、按采用分组标记几多分歧的分组方式 ? 简单分组——对总体各单元只采用一个标记进 行分组。 ? 平行分组系统——对总体各单元同时采用两个 或两个以上的标记进行并列分组。 (表3-4) ? 复合分组——对总体各单元同时采用两个或两 个以上的标记进行层叠分组。(表3-5) 四、统计分类尺度化和国民经济中常用的统计分组 第三节 次数分布 一、次数分布数列的概念和品种 1、次数分布数列的概念? 在统计分组的根本上,将总体中的所有单 位按组归类拾掇,构成总体中各个单元数在各 组间的分布,叫做频(次)数分布,将各组组 别与次数顺次编排而构成的数列叫做次数分布 数列,简称为分布数列。 次数分布(分布数列) 是一种主要的分组材料,反映总体单元在各组的 分布形态。 根基形式: 分组 … 合计 单元数(频数) … 频次 … 100 次数分布 频次分布 一、次数分布数列的概念和品种 2、次数分布数列的品种 按分组标记特征的分歧,分布数列能够分为两种: 质量分布数列与变量分布数列。 (1)质量分布数列 某厂职工人数统计表 按性别分组 男 职 工 女 职 工 合 计 人数(人) (频数) 比率(%) (频次) 253 115 368 68.75 31.25 100.00 (2)按数量标记分组 变量分布数列的分类见P56图示 ? 则应按照研究目标及研究对象的特点确定响应的组 数,划分响应的组限。 ? 按数量标记分组即变量分组,有两种: 单项式分组 组距式分组 ? 单项式分组—— 单项式分组即将某一变量的 每一个变量值作为一组。组数及组限是明白的。 * 某厂职工家庭生齿分组统计 按家庭生齿分组 1 2 3 4 5 6 合 计 职工户数 (频数) 7 38 105 54 31 20 255 比率(%) (频次) 2.9 15.2 41.3 20.5 12.1 8.0 100 * ? 组距式分组——在持续变量或变量值较 多的环境下,可采用组距分组。它将全数变量 值顺次分为若干个区间,并将这个区间的变量 值作为一组。 ? ①持续型变量——相邻两组的上、下限采用 同限,且遵照“下闭上开”(即上限不在内) 的准绳。“上限在不内”准绳:在持续组距式分组中,以同 一个数值作为相邻两组配合的边界,统计上划定,凡是总体某 一个单元的变量值是相邻两组的边界值,这一个单元归入作为 下限值的那一组内。 ? ②离散型变量——相邻两组的上、下限间断, 且采用差数为“1”的形式。 ——相邻两组的上、下限堆叠。 ? 下限,上限:组距式分组的每一组变量值中,其 最小值为下限,最大值为上限。 ? 组限:相邻两组的边界。 ? 间断组距式分组:组限不相连的组距式分组。 ? 持续组距式分组:组限相连(或称相堆叠的), 即以统一数值作为相邻两组的配合边界的组距式 分组。 ? 离散型变量,可间断组距式分组,也可持续组距 式分组。持续型变量,只能采用持续组距式分组。 ? 启齿式分组——第一组缺下限、最末组缺上限 ? 杜口组——各组上下限齐备 ? 组距:上下限之间的距离。 ? 持续式分组的组距计较公式: 组距=本组上限–本组下限 ? 间断式分组的组距计较公式: 组距=本组上限–本组下限+1 等距分组:标记值在各组连结相等的组距,即各组的标 志值变更都限于不异的范畴。一般用于标记值变更比 较平均的场所。 异距分组:各组的组距不相等。 启齿组的组距:以相邻组的组距为本组的组距。 组中值:上下限之间的中点数值称为组中值,组中值的 计较公式: 杜口组组中值=(上限+下限)÷2 计较平均目标或进行其它统计阐发时,常以组中值来 代表各组标记值的平均程度。 缺下限启齿组组中值=该组上限-1/2邻组组距, 缺上限启齿组组中值=该组下限+1/2邻组组距。 ? 组数 组数=全距/组距 组数——依经验确定,一般分为3~7组。 ? 二、变量数列的编制 ? ? 1、单项变量数列的编制 ? 合用于变量值个数不多的离散型变量 ? ? ? ? 第一步:将查询拜访获得的原始材料按数值大小顺次陈列 第二步:确定各组的标记值和组数。 第三步:计较各组的次数和频次。 第四步:按变量值大小挨次编制单项变量数列。 ? 二、变量数列的编制 ? ? 2、组距变量数列的编制 合用于标记值比力多的离散型变量和持续性变量 ? 第一步:将查询拜访获得的原始材料按数值大小顺次陈列 起来,并确定最大值、最小值和全距。 ? R(全距)=最大值-最小值。 ? 第二步:确定组数和组距。 ? 第三步:确定组限和组限的暗示方式。 ? 第四步:计较各组次数和频次,编制成组距数列。 【例】某出产车间50名工人日加工零件数 如下(单元:个): ? ? ? ? ? 117 108 110 112 137 122 131 118 134 114 124 125 123 127 120 129 117 126 123 128 139 122 133 119 124 107 133 134 113 115 117 126 127 120 139 130 122 123 123 128 122 118 118 127 124 125 108 112 135 121 ? 107 108 108 110 112 112 113 114 115 117 ? ? 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 ? ? 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139 采用单变量值分组构成的频数分布表 零件数 107 108 110 112 113 114 115 116 117 118 频数 1 2 1 2 1 1 1 3 3 零件数 119 120 121 122 123 124 125 126 127 频数 1 2 1 4 4 3 2 2 3 零件数 128 129 130 131 133 134 135 137 139 频数 2 1 1 1 2 2 1 1 2 采用组距式分组构成的频数分布表 某车间50名工人日加工零件数分组 按零件数分组 105—109 110—114 115—119 120—124 125—129 130—134 135--139 合计 频数(人) 3 5 8 14 10 6 4 50 频次(%) 6 10 16 28 20 12 8 100 三、次数分布的特征 对称分布 右偏分布 左偏分布 正J型分布 反J型分布 U型分布 图3-1.2.3 几种常见的次数分布 某县人均年收入 人均年收入(元) 人数(千人) 2500以下 32.00 2500—3000 88.00 3000—3400 160.00 3400—4000 272.00 4000—5000 152.00 5000以上 44.00 合计 748.00 * 某地企业规模分组表 ? 按职工人数分组 ? 200人以下 ? 200—299 ? 300—399 ? 400—499 ? 500—599 ? 600—699 ? 700—799 ? 800人以上 ? 合 计 企业个数 1 3 5 16 20 9 4 2 60 频次(%) 1.7 5.0 8.3 26.7 33.3 15.0 6.7 3.3 100.0 * P70习题、累计频数与累计频次 ? 累计频数(或频次)能够是向上累计频数(或频次),也能够 是向下累计频数(或频次)。 ? 向上累计频数(或频次)分布,其方式是先列出各组的上限, 然后由标记值低的组向标记值高的组顺次累计频数(或频次)。 某组向上累计频数表白该组上限以下的各组单元数之和是多 少,某组向上累计频次表白该组上限以下的各组单元数之和 占总体单元数的比重。 ? 向下累计频数(或频次)分布,其方式是先列出各组的下限, 然后由标记值高的组向标记值低的组顺次累计频数(或频次)。 某组向下累计频数表白该组下限以上的各组单元数之和是多 少,某组向下累计频次表白该组下限以上的各组单元数之和 占总体单元数的比重。 ? 累计频数(或频次)分布曲线,可用以研究财富、土 地和工资收入的分派能否公允。这种累计分布曲线最早 由美国洛伦茨博士提出的,故又称洛伦茨曲线图。其绘 制方式如下: ? 1.将分派的对象和接管分派者的数量均化成布局相 对数并进行向上累计 ? 2.纵轴和横轴均为百分比标准,纵轴自下而上,用以 测定分派的对象(如一国的财富、地盘或收入等),横轴 由左向右用以测定接管分派者(如一国的生齿)。 ? 3.按照计较所得的分派对象和接管分派者的累计百 分数,在图中标出响应的绘示点,毗连各点并使之滑润 化,所得曲线即所要求的洛伦茨曲线。 第四节:统计数据的图表展现 ? 从统计图表获打消息 ? 用统计图表表达消息 统计图表进入寻常苍生家 ? 对《青年报》2007年2月15日的查询拜访 – 带有统计数字的文字到处可见,如 ? 3天近百个征询电线余热心人将牵手 空巢白叟 ? 零点公司最新查询拜访显示,独生后代夫妻流 行分家过年 ? 截至2006岁尾,全国657个城市中,曾经 有512个城市成立了廉租住房轨制,占城 市总数的77.9% 对《青年报》的查询拜访(续) ? 统计图表次要在财经&证券版 ? 一、统计表 ? 1、统计表的概念和感化 ? 统计查询拜访所取得的原始材料,颠末拾掇,获得 申明社会现象及其成长过程的数据,把这些数据按 必然的挨次陈列在表格上,就构成了统计表。 ? 广义的统计表包罗统计工作各个阶段中所用的 一切表格:查询拜访表,汇总拾掇表,计较阐发表。狭 义的统计表专指阐发表和容纳各类统计材料的表格, 也就是凡是所说的统计表。 2、统计表的布局 能够从表式和内容两个方面来认识。 ? 1.从表式上看,统计表是由纵横交叉的线条 构成的一种表格,表格包罗总题目、横行题目、纵 栏题目和目标数值四个部门。 ? 2.从内容上看,统计表由主词栏和宾词栏两 个部门构成。主词栏是统计表所要申明的总体及其 构成部门;宾词栏是统计表用来申明总体数量持征 的各个统计目标。 统计表的布局 项目 一、查询拜访户数 二、平均每户家庭生齿数 三、平均每户就业生齿数 四、平均每人全数收入 五、平均每人现实收入 #消费性收入 非消费性收入 六、平均每人栖身面积 总题目 表2-5 1997~1998年城镇居民家庭抽样查询拜访材料 单元 户 人 人 元 元 元 元 平方米 1997年 37890 3.19 1.83 5188.54 4945.87 4185.64 755.94 11.90 1998年 39080 3.16 1.80 5458.34 5322.95 4331.61 987.17 12.40 列 标 题 数 字 资 料 行 标 题 材料来历:《中国统计摘要1999》,中国统计出书社,1999,第79页。 注:1.本表为城市和县城的城镇居民家庭抽样查询拜访材料。 2.消费性收入项目包罗:食物、穿着、家庭设备用品及办事、医疗 保健、交通和通信、文娱教育文化办事、栖身、杂项商品和办事。 附 加 统计表的制造要求(1) (1) 统计表的各类题目,出格是总题目的表达该当十分简明、 切当,归纳综合地反映出表的根基内容,总题目还该当标明资 料所属的地址和时间。 (2) 统计表的内容要简要而不错乱,无论主词(即统计表所要 申明的总体及其分组)仍是宾词(即用来申明主词的各类 统计目标)分组条理不宜过多,统计学分组数据定义为使统计表长宽适中,必 要时,可将主词与宾词交换位置。 (3) 表中数字应填写划一,瞄准位数。表中的数据一般是右对 齐,有小数点时应以小数点对齐,并且小数点的位数应统 一.当数字为0或因数小可略而不计时,要写上0;当缺乏某 项材料时,用符号“…”暗示;无数字的空格,用符号“―” 暗示。 统计表的制造要求(2) (4) 统计表中必需说明数字材料的计量单元。当全表只要一种 计量单元时,能够把它写在表的右上方;当表中需要别离注 明分歧单元时,横行的计量单元,可专设“计量单元”一栏, 纵栏的计量单元,要与纵栏标目写在一路,用小字标写。 (5) 统计表的表式,一般是“启齿”式的,即表的摆布两头不 划纵线;表的上下端基线凡是要划粗线,其余用细线) 需要时,统计表应加注申明或注释。例如某些目标有特殊 的计较口径,某些材料只包罗一部门地域,某些数字是由估 算来插补的等等,都要加以申明。此外还要说明统计材料的 来历,以便覆按。申明或注释一般写在表的下端,申明或注 解不宜太多。 二、统计图 ? 统计图是用几何学的点、线、面或具体事物的形 象所形成的用来描述统计材料的图形。 80 60 40 20 0 第一季度 一 100 80 60 40 20 0 东部 100 度 度 度 季 第 四 季 季 二 第三季度 第 第 100 第一季度 第二季度 第三季度 第四时度 80 60 40 20 0 0 2 4 6 东部 第 三 季 度 1、直方图(Histogram): 用矩形的宽度和高度来暗示频数分布的图形。高度暗示每 一组的次数,宽度暗示各组的组距。 【例】某出产车间50名工人日加工零件数如下(单元:个): ? ? ? ? ? 117 108 110 112 137 122 131 118 134 114 124 125 123 127 120 129 117 126 123 128 139 122 133 119 124 107 133 134 113 115 117 126 127 120 139 130 122 123 123 128 122 118 118 127 124 125 108 112 135 121 等距分组表 表2-6 105 110 115 120 125 130 135 — — — — — — — 某车间50名工人日加工零件数分组表 频数(人) 频次(%) 按零件数分组 110 115 120 125 130 135 140 合计 3 5 8 14 10 6 4 50 6 10 16 28 20 12 8 100 我一眼就看出来了 ,大大都人的日加 工 零 件 数 在 120 ~ 125之间! 图2-1 某车间工人日加工零件数的 直方图 频 数 15 12 9 6 (人 ) 3 105 110 115 120 125 130 135 140 日加工零件数(个) 2、折线 日加工零件 数 (个 ) 图2-4 某车间工人日加工零件数的折线、曲线图:在作直方图时,若是数据不 断增加,组距不竭缩小,直方图中的矩形 将逐步变窄,顶端将慢慢珠连使折线接近 于一条滑腻曲线,这条曲线称为次数分布 曲线,或称为次数密度曲线,近似于概率 密度曲线。 次数分布曲线的三品种型:钟型分布曲线 ,U型分布曲线和J型分布曲线。 次数分布曲线的三品种型 对称分布 右偏分布 左偏分布 正J型分布 反J型分布 U型分布 图2-9 几种常见的频数分布 4、条形图(Bar chart) 用宽度不异的条形的高度或长短来暗示数 据变更的图形。 图2.1 某城市居民关心分歧类型告白的人数分布 120 100 80 60 40 20 9 0 商品告白 金融告白 16 10 招生、聘请告白 112 A 51 2 5、饼图也叫圆形图(Pie chart): 用圆形及 圆内扇形面积来暗示数值的大小。次要用于表 示总体中各构成部门所占的比例。 表3-8 某城市居民关心告白类型的频数分布 告白类型 人数(人) 比例 频次(%) 商品告白 112 0.560 56.0 办事告白 51 0.255 25.5 金融告白 9 0.045 4.5 房地产告白 16 0.080 8.0 招生聘请告白 10 0.050 5.0 其他告白 2 0.010 1.0 合计 200 1 100 图2.2 某城市居民关心分歧类型告白的人数 形成 8% 5% 1% 5% 26% 55% 商品告白 房地产告白 办事告白 招生聘请告白 金融告白 其他告白 (6)雷达图 (7)气泡图 8、散 点 图 摄氏度 30 20 10 0 -10 -20 -30 -40 -50 -60 -15 17 12 18 13 0 23 12 9 25 14 10 24 11 9 20 13 2 15 14 19 8 22 3 23 23 21 7 17 12 1 2 -15 -32 -47 -49 -44 -15 -37 月份 A城市 B城市 C城市 9、枝(茎)叶图 ?直方图可大体上看出一组数据的分布情况,但没 有给出具体的数值,所能供给的消息量不大,比 较粗拙。 ?茎叶图现实上是由数据形成的图形,图中给出了 每一个数据的原始数值,不只能看出数列次数的 分布情况,还能显示数据能否对称,反映数据的 离散程度和集中趋向,表白某些数值能否远离其 他数、某些数值能否有空白等。 ?合用于不多的数据 【例】某出产车间 50 名工人日加工零件数如下 (单元:个): ? ? ? ? ? 117 108 110 112 137 122 131 118 134 114 124 125 123 127 120 129 117 126 123 128 139 122 133 119 124 107 133 134 113 115 117 126 127 120 139 130 122 123 123 128 122 118 118 127 124 125 108 112 135 121 茎叶图的制造 树茎 树叶 788 89 566777889 0133445799 茎叶图雷同横置 的直方图 数据 个数 10 11 12 13 3 13 24 10 图2-5 某车间工人日加工零件数的茎叶图 表达消息 Excel的利用 历届奥运会须眉100米冠军成就: 12.0 10.8 11.0 10.8 10.8 10.8 10.6 10.8 10.3 10.3 10.3 10.4 10.5 10.2 10.0 9.9 10.14 10.06 10.25 9.99 9.92 9.96 9.84 9.87 历届现代奥运会男100米冠军成就图 40 35 30 25 20 15 10 5 0 1880 1900 1920 1940 1960 1980 2000 年 有一个别育记 者在写一篇评 论,他但愿在 文章旁配一个 抽象的图给读 者留下奥运会 须眉100米冠军 成就提高得很 快的印象,请 你帮他设想这 张图。 一般地,若是我 们要给读者留 下变化很快的 印象,我们可 以如何设想图? 冠军成就(秒) 历届现代奥运会男100米冠军成就图 冠军成就(秒) 12.0 11.8 11.6 11.4 11.2 11.0 10.8 10.6 10.4 10.2 10.0 9.8 1896 1916 1936 1956 1976 1996 年

  统计学 3数据的拾掇和展现_数学_天然科学_专业材料。统计学 3数据的拾掇和展现

锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有