Python数据分析:股价相关性 您所在的位置:网站首页 两只股票的相关系数说明什么 Python数据分析:股价相关性

Python数据分析:股价相关性

2024-07-16 00:06| 来源: 网络整理| 查看: 265

感觉全聚德和光明乳业都很好吃的样子,我们就选它们了吧!= ̄ω ̄=

1、导入数据包

简单介绍一下要用到的数据包

matplotlib.pyplot:绘图库,其中pyplot子包提供一个类MATLAB的绘图框架

numpy:科学计算库,支持高级大量的维度数组与矩阵运算

pandas:纳入了大量库和一些标准的数据模型,提供高效地操作大型数据集所需的工具

tushare:财经数据接口包

import matplotlib.pyplot as plt import numpy as np import pandas as pd import tushare as ts

2、根据全聚德和光明乳业的股票代码获取数据,这里获取的是2016年一整年的收盘价,获取完后合并,因为停牌的存在,用前一天的价格去填写缺失数据,最终以CSV格式保存数据

s_qjd = '002186' #全聚德 s_gm = '600597' #光明乳业 sdate = '2016-01-01'#起止日期 edate = '2016-12-31' df_qjd = ts.get_h_data(s_qjd, start = sdate, end = edate).sort_index(axis = 0,ascending=True)#获取历史数据 df_gm = ts.get_h_data(s_gm, start = sdate, end = edate).sort_index(axis = 0,ascending=True) df = pd.concat([df_qjd.close,df_gm.close], axis = 1, keys=['qjd_close', 'gm_close'])#合并 df.ffill(axis=0, inplace=True)#填充缺失数据 df.to_csv('qjd_gm.csv')

3、用pearson相关系数计算相关度(Pearson相关系数是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系。),再打印出来看一眼

corr = df.corr(method = 'pearson', min_periods = 1)#pearson方法计算相关性 print(corr)

算出来有0.81,超过0.8,按值域等级来说属于极强相关,不过话说一个卖烤鸭的为什么会和卖牛奶的相关度那么高。。。。难道大家吃烤鸭的时候都喜欢喝牛奶吗。。。

4、绘制图像出来喵一眼,看看趋势上来说什么时候可以有机会做配对交易

df.plot(figsize = (20,12)) plt.savefig('qjd_gm.jpg') plt.close()

5、按分析日期的第一天的股价为基准做归一化处理,打印图像

df['qjd_one'] = df.qjd_close / float(df.qjd_close[0])*100 df['gm_one'] = df.gm_close / float(df.gm_close[0])*100 df.qjd_one.plot(figsize = (20,12)) df.gm_one.plot(figsize = (20,12)) plt.savefig('qjd_gm_one.jpg')



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有