在这一篇中你将了解数据中字段、记录和数据类型等概念,以及制作数据表的六点要求,个人觉得对初接触数据的菜鸟我来说比较重要。
扎实的数据分析基本功不单是指挥使用数据分析工具,更重要的是对数据有深入认识和解读,对数据的理解是数据分析的一个重要前提。 以一张学生们最熟悉不过的成绩表为例,介绍下数据都长什么模样。
1. 字段与记录
这样的成绩表从数据分析的角度来看,就是一个典型的数据库。成绩表最上面的“学号”“姓名”“性别”“总分”等被称为字段,而每位同学的基本情况和成绩就构成了一条条的数据记录。
字段是事物或现象的某种特征,在统计学中称为变量。 记录是事物或现象某种特征的具体表现,记录也称为数据或变量值。
2. 数据类型
常见的数据类型主要有数字、文字、日期三类,其他的还有货币、时间等其他数据类型。
如果你想知道到底有多少种数据类型,最简单的方法就是在Excel中任意选择一个单元格,单击鼠标右键-设置单元格格式中可以查看所有数据类型,如图所示:
这么多的数据类型,最终可以归为两大类:字符型数据和数值型数据。两种类型顾名思义,区分的重要依据为后者可以直接用算术方法进行汇总和分析。
3. 数据表