股票形态相似度研究
1.东财数据+供应链数据
2.对东财数据降噪处理,计算簇内
3.在某一个时间节点,我们回看过去已知的概念数据or供应链数据
机器学习做出来的效果不好,所以尝试对数据进行降噪处理
11.27
具体操作
将概念算出来之后,得到每一天每个概念内股票的关系强度(比如等权的pearson系数),和宽基指数内的关系强度进行对比。
可以尝试将concept内关系最弱的股票剔除,看概念内股票的关系有没有明显增强。
先上手计算欧氏距离
欧氏距离为常见的计算时间序列相似度的方法,该方法可以直接衡量两个时间序列之间的距离,其计算公式为:
\[
D=\sqrt{\sum_{i=1}^N\left(X_i-Y_i\right)^2}
\]
其中 \(\mathrm{N}\) 为序列 \(\mathrm{X}\) 和序列 \(\mathrm{Y}\) 的长度。 由上述公式可以看出,
若要计算两个序列之间的欧氏距离, 有两个局限性: 1、两个序列的长度需要相同,
但在实际研究工作中, 找到满足上述条件的序列并非易事。
2、该方法也无法进行异步相似度计算,因此会对实际上较为相似的两个时 ...
实习思考
实习思考
前言
本文用来记录我在第一段量化实习中的思考,以及由此产生的关于学习方向的灵感。
update:2024-1-16
00:10:57,最近和带教老师还有机器学习组的同事交流了一下,感觉量化的底层就是将多个不同频率信号的合成为一个超因子,在这个过程之后再基于金融、经济学的先验知识,对这个因子做风格、行业、换手率等方面的约束,信号合成才是关键。
一、对于整体
“量化投资始终坚持以基本面为核心,同时结合价量信息的方式,立足从投资的本源看问题,以长期有效的逻辑出发构建基础框架,再与交易逻辑相融合。无论是基本面还是价量,对每一类信息都会深挖背后的逻辑与含义,在此基础上,采用传统数学建模与领先的人工智能和机器学习技术结合的方式,不断随着市场结构与交易行为进行优化迭代。”
1.是如何将基本面因子与量价因子结合的,使用有效前沿吗?
2.交易逻辑+基础框架,是指因子组合之后划分为某个风格框架吗?
3.因子表现较好的作为多因子框架的因子,表现较差的作为机器学习模型的因子吗?这两者是如何结合的呢,也是划分为某个风格的吗?如何判断市场结构和交易行为,这是涉及到根据微观 ...
实习中的idea
1.如何根据市场交易规则(最小交易单位)来执行计算出的交易信号。
(考虑交易手数的话,需要解一个以最小化持仓误差为目标函数的、以总资金为硬约束的整数线性规划问题)
2.利用alpha值生成持仓信号
在利用经过行业市值中性化、过滤掉涨跌停的final alpha
values计算对应的持仓比例、多空持仓情况时,可以考虑使用power rank。
def cal_cs_rank(x, maxvalue=None,minvalue=None):
'''
部分经过删除处理
'''
res = np_nan_array(shape = (x.shape[0],), dtype="float64")
res = (res - np.nanmin(res)) / (np.nanmax(res) - np.nanmin(res)) * (maxvalue - minvalue) + minvalue
return res
具体是把因子先利用rank函数展成(-1,1)的均匀分布形式,再根据对于头部权重的考虑,对展开后的值取3次方、5次方。 ...
搭建个人blog的资源&遇到的问题及其解决方法
用来记录自己学习搭建个人blog的资料&遇到的问题及其解决方法
学习资料
Hexo+阿里云&GitHub
搭建个人博客 | 海拥 (haiyong.site)
https://www.fomal.cc/posts/e593433d.html 主题:Butterfly Butterfly
安裝文檔(三) 主題配置-1 | Butterfly
目前遇到的问题
图挂了
image-20230917220037303
解决方法:要使用相对路径“./搭建个人blog的资源-遇到的问题及其解决方法/image-20230917220037303.png”
目录是乱的
解决方法:直接删除手动加上的数字,“# ##”会自动排序
在多台电脑之间使用Git进行数据同步时因为proxy问题报错
出现
fatal: unable to access 'XXX': Recv failure: Connection was reset
解决办法:
依次将如下两条语句复制到git中后,点击回车
git config --globa ...