1.简述直方图与茎叶图的区别。
答:直方图与茎叶图的区别主要表现为:
(1)直方图是用于展示分组数据分布的一种图形,它是用矩形的宽度和高度(即面积)来表示频数分布的。茎叶图是反映原始数据分布的图形,它由茎和叶两部分构成,其图形是由数字组成的。
(2)茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息;而直方图虽然能很好地显示数据的分布,但不能保留原始的数值。在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。
2.统计中用以描述品质型数据频数分布的图形主要有哪些?各自有何特点?
答:品质型数据包括分类数据和顺序数据。描述分类数据频数分布的图形主要有条形图、帕累托图、饼图、环形图等;描述顺序数据频数分布的图形除了以上几种,还有累计频数分布图。
- 条形图是用宽度相同的条形的高度或长短来表示数据多少的图形。条形图可以横置或纵置,纵置时也称为柱形图。此外,条形图有简单条形图、对比条形图等形式。
- 帕累托图是按各类别数据出现的频数多少排序后绘制的柱形图。通过对柱形图的排序,容易看出哪类数据出现得多,哪类数据出现得少。帕累托图在质量控制研究中有广泛应用。对于不同类型的缺陷、失效方式和其他感兴趣的类,可以用帕累托图观察各个类的影响顺序。
- 饼图是用圆形及圆内扇形的角度来表示数值大小的图形。它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。
- 环形图相当于多个饼图的叠加,图中每个样本用一个环来表示,样本中的每一部分数据用环中的一段表示。因此环形图可显示多个样本各部分所占的相应比例,从而有利于对多个样本(或总体)构成的比较研究。
- 对于顺序数据,还可以计算累积频数和累积频率(百分比)。根据累积频数或累积频率,可以绘制累积频数分布或累积频率分布图。
3.欲调查广州市初中学生的身高情况,随机抽取100名广州市初中学生,测量了身高。
(1)用此例说明这几个统计概念,总体(population),样本(sample),参数(parameter),统计量(statistics)。
(2)请说明如何对这100例身高数据进行描述性统计分析。 答:(1)
- 总体(population)是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。本例中的总体是广州市所有初中学生。
- 样本(sample)是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。本例中的样本是随机抽取的100名广州市初中学生。
- 参数(parameter)是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。本例中广州市所有初中学生的平均身高即是一个参数。
- 统计量(statistic)是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。 (2)数据的描述性统计方法通常包括三种:统计图、统计表以及数值方法。因为此例中的数据为数值型数据,故可以用直方图、茎叶图、箱线图、频数分布表等对这100例身高数据进行描述性统计分析,还可以计算出该组数据的平均值、中位数和方差、全距等来分别反映其集中趋势和离散程度。
4.说明条形图和直方图的区别和联系。
答:(1)区别
① 条形图是用条形的高度表示各类别频数的多少,其宽度是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
② 由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
③ 条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
(2)联系
二者都用来展示数据的分布情况;在平面直角坐标系中,二者的横轴都表示分组,纵轴都可表示频数或频率的大小。