dbase

日期2007-01-19(最后修改),2007-01-07(创建)

注意:您可能希望使用 pandas 而不是这个。

The dbase.py 类,可用于读取/写入/汇总/绘制时间序列数据。

总结功能

  1. 数据和变量名存储在字典中 - 可以使用变量名访问
  2. 从 csv/pickle 格式加载/保存,包括日期信息(将添加 shelve 格式)
  3. 绘图和描述性统计,如果提供日期则包括日期
  4. 添加/删除变量,包括趋势/(季节性)虚拟变量
  5. 根据日期或其他变量值选择观察值(例如,> 1/1/2003)
  6. 复制实例数据

还附带了 dbase_pydoc.txt 类信息。

示例用法

要查看该类的实际操作,请下载该文件并运行它(python dbase.py)。这将创建一个示例数据文件(./dbase_test_files/data.csv),该文件将由该类处理。

要导入模块

在 [1] 中
import sys
sys.path.append('attachments/dbase')
import dbase

运行类后,您可以使用以下命令加载示例数据

在 [2] 中
data = dbase.dbase("../_static/items/attachments/dbase/data.csv", date = 0)

在上面的命令中,“0”是包含日期的列的索引。

您可以使用以下命令绘制文件中“b”和“c”系列

在 [3] 中
data.dataplot('b','c')

您可以使用以下命令获取“a”、“b”和“c”系列的描述性统计信息

在 [4] 中
data.info('a','b','c')
==============================================================================
============================ Database information ============================
==============================================================================

file:                                /mnt/data/pauli/prj/scipy/SciPy-CookBook/ipython/../_static/items/attachments/dbase/data.csv
# obs:                               100
# variables:         3
Start date:                  08 Jan 2001
End date:                    02 Dec 2002

var                          min                     max                     mean            std.dev         miss    levels
==============================================================================
a                            -2.56            3.35           -0.08            1.08            0
b                            -2.00            2.16           -0.02            0.98            0
c                            -1.91            2.54            0.18            0.93            0

章节作者:VincentNijs

附件