如何对Python数据表进行检查

在python中处理的数据量通常会比较大,例如千万级数据,而且我们不能一目了然地了解整个数据表,而且必须通过某种方法获得关于数据表的关键信息。DataTableCheck的另一个用途是了解数据的总体情况,如整个数据表的大小、占用的空间、数据格式、是否有空值、重复项和具体的数据内容。准备好进行后续清洁和预处理。

1、数据维度(行列)

Excel中可以通过CTRL+向下的光标键,和CTRL+向右的光标键来查看行号和列号。Python中使用shape函数来查看数据表的维度,也就是行数和列数,

2、数据表信息

使用info函数在这里可以看到数据表的总体信息,其中包含更多的信息,包括数据维度、列名、数据格式和占用的空间。

3、查看数据格式

Excel中通过选中单元格并查看开始菜单中的数值类型来判断数据的格式。Python中使用dtypes函数来返回数据格式。

Dtypes是一个查看数据格式的函数,可以一次性查看数据表中所有数据的格式,也可以指定一列来单独查看。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。