数据帧

日期2012-09-28(最后修改),2006-09-13(创建)

注意:此条目已过时。您可能需要使用 pandas 代替。

由 Andrew Straw 在 scipy-user 邮件列表上发布的 DataFrame.py原始链接,是使用字母数字表格数据的极有用工具,如数据库中常见的。一些可能被摄入数据帧的数据可能是: || ID || LOCATION || VAL_1 || VAL_2 || || 01 || Somewhere || 0.1 || 0.6 || || 02 || Somewhere Else || 0.2 || 0.5 || || 03 || Elsewhere || 0.3 || 0.4 ||

DataFrame.py 类可以从 CSV 文件(逗号分隔值)中的数据填充。在当前实现中,这些文件使用 Python 自身的 CSV 模块读取,这允许进行大量的自定义。

示例用法

来自 Access2000 的示例 CSV 文件位于 CSVSample.csv 中。我们首先导入模块

In [ ]
import DataFrame

并使用我们想要的 CVS 方言读取文件

In [ ]
df = DataFrame.read_csv("CSVSample.csv",dialect=DataFrame.access2000)

(注意,方言实际上是在 DataFrame 类中定义的)。根据某些标准过滤数据通常很有用。

与 Python 2.6 及更高版本兼容

从 Python 2.6 开始,sets 模块已弃用,为了消除警告,请替换

In [ ]
imports sets

In [ ]
try:
    set
except NameError:
    from sets import Set as set

章节作者:Unknown[8],Unknown[43],Unknown[44],Unknown[45]

附件