「数据分析」用Python验证指数基金定投策略

python

提出问题

本文主要针对以下两个问题进行探讨:

  1. 如果投资者“不幸”从最高点开始定投指数基金,那么是否还能盈利?
  2. 周定投和月定投哪个更好?

获取数据

注意:本文为了简单起见,直接用指数代替了指数基金。

Step1 打开网址JoinQuant聚宽,登录帐号

Step2 进入研究环境

进入研究环境之后,会发现是一个类似于Jupyter Notebook的开发界面。

python3的notebook">Step3 新建一个Python3的Notebook

后面所有操作和Jupyter Notebook一样。

Step4 在新建的Notebook中写入代码

获取指数数据函数

导入所需要用到的库

import pandas as pd

import matplotlib.pyplot as plt

定义获取指数数据的函数

# 获取股票数据函数

def get_stock_data(code, start_date, end_date):

"""

:param code: 需要获取数据的指数代码,注意使用的是上交所的指数代码

:param start_date: 开始获取数据的日期

:param end_date: 结束获取数据的日期

:return: 返回从开始到结束日期每天的指数数据

"""

df = get_price(code+\'.XSHG\', start_date=start_date, end_date=end_date, frequency=\'daily\')

df = df.dropna() # 删除缺失值

df.to_csv(code+\'.csv\') # 保存为csv格式

return df

获取指数数据示例

# 获取沪深300指数,从2005年4月8日开始到2019年4月20日结束的日级交易数据

df300 = get_stock_data(code=\'000300\', start_date=\'2005-04-08\', end_date=\'2019-04-20\')

df300

运行结果:

运行代码之后返回到Jupyter Notebook的主页,就能看到保存的000300.csv文件,可以下载到本地进行操作,也可以直接在聚宽的研究环境中进行操作。

数据探索

先对我们获取到的沪深300指数数据进行一番了解,方便后续分析。

查看沪深300指数的总体信息:

df300.info()

查看沪深300指数收盘价的大体情况:

df300[\'close\'].describe()

查看沪深300指数的历史走势图:

# 设置参数,将图形格式设置为‘svg’,能够输出更加清晰的图

%config InlineBackend.figure_format = \'svg\'

# 建立画布

fig = plt.figure(figsize = (12,6))

# 用收盘价绘制折线图

plt.plot(df300.index, df300[\'close\'])

找出收盘价极大值点的函数:

# 筛选出指数价格的极大值点

def find_max(stock_data, start_date, end_date):

"""

:param stock_data: 需要筛选出极大值点的指数数据

:param start_date: 筛选范围的开始日期

:param end_date: 筛选范围的结束日期

:return:返回极大值点对应当天数据

"""

max_price = stock_data[start_date:end_date][\'close\'].max() # 极大值点的收盘价

return stock_data[stock_data[\'close\'] == max_price] # 极大值点对应当天数据

找出沪深300指数收盘价极大值点的示例:

从上面的沪深300的历史价格走势图可以看出,在2008年左右有一个价格的顶峰,接下来找出具体那一天的数据。

# 筛选出沪深300指数2007-2009年的极大值点对应当天的数据

find_max(df300, \'2007/1/1\', \'2009/1/1\')

数据分析

高点定投,能否盈利?

按月自动定投函数

# 按月定投函数

def auto_invest_monthly(stock_data, start_date, end_date):

"""

:param stock_data: 需要定投的指数数据

:param start_date: 开始定投的日期

:param end_date: 结束定投的日期

:return: 返回从开始定投到结束每天的资金数据

"""

# 截取股票数据

stock_data = stock_data[start_date:end_date]

# 修改stock_data的index的数据类型,这样才能和temp进行合并

stock_data.index = stock_data.index.astype(\'period[D]\')

# 每月第一个交易日定投

buy_month = stock_data.resample(\'M\', kind=\'period\').first()

# 定投购买指数基金

trade_log = pd.DataFrame(index=buy_month.index)

trade_log[\'基金净值\'] = buy_month[\'close\'] / 1000 # 将收盘价除以1000作为基金净值

trade_log[\'定投资金\'] = 1000 # 每月投入1000元申购该指数基金

trade_log[\'基金份额\'] = trade_log[\'定投资金\'] / trade_log[\'基金净值\'] # 买入份额等于买入金额除以基金净值

trade_log[\'持有份额\'] = trade_log[\'基金份额\'].cumsum() # 累计申购份额

trade_log[\'累计投入\'] = trade_log[\'定投资金\'].cumsum() # 累计投入金额

temp = trade_log.resample(\'D\').ffill() # 将交易记录填充为日级数据

# 计算每个交易日的资产(等于当天的基金份额乘以单位基金净值)

daily_data = pd.merge(stock_data, temp, left_index=True, right_index=True, how=\'left\')

daily_data = daily_data[[\'close\', \'定投资金\', \'基金份额\', \'持有份额\', \'累计投入\']]

daily_data[\'基金净值\'] = daily_data[\'close\'] / 1000

daily_data[\'持有基金价值\'] = daily_data[\'基金净值\'] * daily_data[\'持有份额\']

# 将daily_data的index修改为datetime类型,否则无法使用matplotlib绘图

daily_data.index = daily_data.index.astype(\'datetime64\')

return daily_data

按月自动定投示例

假设投资者运气非常糟糕,从2007年10月16的沪深300指数历史最高点5877开始定投,一直定投到2009年7月末,此时沪深300指数跌至3734点,几乎腰斩。

# 每月定投沪深300指数

df300m = auto_invest_monthly(df300, \'2007/10/16\', \'2009/7/31\')

df300m

按月定投沪深300指数数据可视化

# 建立画布

fig = plt.figure(figsize = (12,6))

# 绘制主坐标轴图表

plt.plot(dfm.index, dfm[\'close\'], linestyle=\'dotted\', label="沪深300指数")

plt.legend(loc=\'upper left\') # 设置主坐标轴图表的图例

# 调用twinx方法

plt.twinx()

# 使用次坐标轴

plt.plot(dfm.index, dfm[\'累计投入\'], label="累计投入资金")

plt.plot(dfm.index, dfm[\'持有基金价值\'])

plt.legend(loc=\'upper right\') # 设置次坐标轴图表的图例

从上面的图片可以看出,即使是在如此极端的情况下,投资者也能在大概2009年的五六月份开始获得收益。

周定投PK月定投?

周定投

按周自动定投函数

# 按周定投函数

def auto_invest_weekly(stock_data, start_date, end_date):

"""

:param stock_data: 需要定投的指数数据

:param start_date: 开始定投的日期

:param end_date: 结束定投的日期

:return: 返回从开始定投到结束每天的资金数据

"""

# 截取股票数据

stock_data = stock_data[start_date:end_date]

# 修改stock_data的index的数据类型,这样才能和temp进行合并

stock_data.index = stock_data.index.astype(\'period[D]\')

# 每周第一个交易日定投,如果整周都是休息日,则跳过本周

buy_week = df.resample(\'w\', kind=\'period\').first().dropna()

# 定投购买指数基金

trade_log = pd.DataFrame(index=buy_week.index)

trade_log[\'基金净值\'] = buy_week[\'close\'] / 1000 # 将收盘价除以1000作为基金净值

trade_log[\'定投资金\'] = 250 # 每周投入250元申购该指数基金

trade_log[\'基金份额\'] = trade_log[\'定投资金\'] / trade_log[\'基金净值\'] # 买入份额等于买入金额除以基金净值

trade_log[\'持有份额\'] = trade_log[\'基金份额\'].cumsum() # 累计申购份额

trade_log[\'累计投入\'] = trade_log[\'定投资金\'].cumsum() # 累计投入金额

temp = trade_log.resample(\'D\').ffill() # 将交易记录填充为日级数据

# 计算每个交易日的资产(等于当天的基金份额乘以单位基金净值)

daily_data = pd.merge(stock_data, temp, left_index=True, right_index=True, how=\'left\')

daily_data = daily_data[[\'close\', \'定投资金\', \'基金份额\', \'持有份额\', \'累计投入\']]

daily_data[\'基金净值\'] = daily_data[\'close\'] / 1000

daily_data[\'持有基金价值\'] = daily_data[\'基金净值\'] * daily_data[\'持有份额\']

# 将daily_data的index修改为datetime类型,否则无法使用matplotlib绘图

daily_data.index = daily_data.index.astype(\'datetime64\')

return daily_data

按周自动定投示例

# 每周定投沪深300指数

df300w = auto_invest_weekly(df300, \'2007/10/16\', \'2009/7/31\')

df300w

周定投PK月定投函数

# 按周定投vs按月定投

def weekly_pk_monthly(dfw, dfm):

"""

:param dfw: 周定投函数返回的数据

:param dfm: 月定投函数返回的数据

:return: 返回周定投和月定投的收益率

"""

temp = pd.merge(dfw[[\'累计投入\', \'持有基金价值\']], dfm[[\'累计投入\', \'持有基金价值\']], left_index=True, right_index=True)

dfvs = pd.DataFrame(index=temp.index)

dfvs[\'周定投累计投入\'] = temp[\'累计投入_x\']

dfvs[\'周定投基金价值\'] = temp[\'持有基金价值_x\']

dfvs[\'周定投收益率\'] = (dfvs[\'周定投基金价值\']-dfvs[\'周定投累计投入\']) / dfvs[\'周定投累计投入\']

dfvs[\'月定投累计投入\'] = temp[\'累计投入_y\']

dfvs[\'月定投基金价值\'] = temp[\'持有基金价值_y\']

dfvs[\'月定投收益率\'] = (dfvs[\'月定投基金价值\']-dfvs[\'月定投累计投入\']) / dfvs[\'月定投累计投入\']

return dfvs

周定投PK月定投示例

dfvs = weekly_pk_monthly(df300w, df300m)

dfvs.head()

将周定投和月定投的收益率绘制成曲线:

从图中可以明显的看出,虽然周定投的收益率和月定投的收益率差距不大,但是在大多数情况下,周定投的收益率还是明显优于月定投到的收益率的。

得出结果

从上面的数据分析过程,我们已经可以回答文章开头提出的两个问题:

  1. 即使投资者是从最高点开始定投,只要有足够的耐心,最终依然能够获得盈利。
  2. 周定投大概率比月定投能获得更好的收益,但两者区别不大,特别是当投资时间拉长时,两者的差距会越来越小。

后续如果能够获得指数的基本面数据,比如PE,那么将能进行更为深入的分析。

注意:本文并不构成任何投资建议,投资有风险,入市需谨慎。

以上是 「数据分析」用Python验证指数基金定投策略 的全部内容, 来源链接: utcz.com/z/387243.html

回到顶部