《零起點,python大數(shù)據(jù)與量化交易》,這應該是國內(nèi)第一部,關(guān)于python量化交易的書籍。
有出版社約稿,寫本量化交易與大數(shù)據(jù)的書籍,因為好幾年沒寫書了,再加上近期“前海智庫·zw大數(shù)據(jù)”項目,剛剛啟動。
因為時間緊,只花了半天時間,整理框架和目錄。
說是v0.1版,但核心框架已經(jīng)ok;從項目角度而言,完成度,已經(jīng)超過70%,剩下的只是體力活。
完成全本書,需要半年以上連續(xù)時間,本人沒空,大家不要再問:“什么時間可以完成?!?div style="height:15px;">
配合zwPython,這個已經(jīng)是套完整的:大數(shù)據(jù)分析、量化交易學習教材;質(zhì)素方面,相信比市面上90%的同類作品強。
有興趣的網(wǎng)友,可以自己百度,編寫腳本,另外可以加入Q群:124134140(zwPython大數(shù)據(jù)量化交易).
進群后,請大家多多發(fā)言,有時間,我也會和大家互動。
zw量化實盤·魔鬼訓練營 金融行業(yè)的:生存訓練,Winor Home(要么全贏,要么滾蛋)
http://blog.sina.com.cn/s/blog_7100d4220102w0q5.htmlps,10.21,剛才百度 沒想到zwPython成了關(guān)鍵詞: python 量化交易的第一品牌,完全沒做任何seo優(yōu)化
關(guān)于關(guān)于大數(shù)據(jù)、高頻交易和AI人工智能,字王的觀點一向是:
凡是無法通過“足彩數(shù)據(jù)”實盤測試的大數(shù)據(jù)方案、算法,都是在耍流氓
http://blog.sina.com.cn/s/blog_7100d4220102vkwb.html關(guān)于足彩的幾個誤區(qū)
足彩雖然容易與賭球混淆,但卻是最好的大數(shù)據(jù)研究對象,沒有之一
微軟、百度、谷歌,目前都有專業(yè)團隊,在做足彩大數(shù)據(jù),并定期發(fā)布
說白了,足彩相當于十倍配資的股票
國內(nèi)足彩的確很黑,比歐平低10%左右,
彩票的發(fā)明人和股票,據(jù)說都是同一個英國爵士
必勝足彩交易所,成立當年,獲得了英國MBA商業(yè)創(chuàng)新大獎
高盛n年前,就開始足彩套利業(yè)務,維基百科有介紹
黑天鵝(紅牛吧)足彩,是首家公開進行、實盤測試的足彩大數(shù)據(jù)模型
黑天鵝,是業(yè)內(nèi)率先以:盈利率,而不是:勝率(百度目前還是),測試足彩大數(shù)據(jù)算法模型
黑天鵝算法盈利率90-95%,是目前業(yè)內(nèi)最高的,比百度高約20-30%
--------
黑天鵝(紅牛吧)足彩·實盤測試·近期數(shù)據(jù)統(tǒng)計(2015.8-10)
8月,單選,勝率:59.41%(101/170),盈利率,121%,二串一(2x1),勝率:46.34%(19/41),盈利率,143.02%,
9月,單選,勝率:48.75%(39/80),盈利率,101%,二串一(2x1),勝率:35.%(7/20),盈利率,94.74%
10月,單選,勝率:64.71%(11/17),盈利率,135%,二串一(2x1),勝率:33.33%(1/3),盈利率,130%
目前已經(jīng)比較穩(wěn)定,盈利率應該是行業(yè)最高的,比百度強,再測試一段就OK了。
(python大數(shù)據(jù)·思維導圖)
大數(shù)據(jù),量化交易,屬于目前比較前沿的IT技術(shù),相關(guān)用戶,絕大部分是非IT行業(yè)的市場管理人員和金融工作者,沒有任何編程基礎。
同時,更多的普通民眾,在日常工作、生活、投資時,例如,購買股票、基金、足彩,也迫切需要一些專業(yè)的數(shù)據(jù)分析知識和軟件,作為更加專業(yè)的投資工具。
目前,量化投資、高頻交易領域,一線操盤手自己編程,將投資策略直接程序化,已經(jīng)成為國際大投行的標配。
在數(shù)據(jù)處理領域,特別在量化交易方面,python已成為“統(tǒng)治級”編程語言。
伴隨中國政府金融領域的擴張戰(zhàn)略,以及與國際金融接軌,大量海龜派金融人員回歸,有專家稱,“未來五年(2020),專業(yè)投資人,不懂python編程,就像不懂英語,不會電腦操作,面臨下崗的可能。”
因此,便有了這本:《零起點,python大數(shù)據(jù)與量化交易》
零起點
IT零起點,無需任何電腦編程基礎,會打字、會word,就能看懂本書,利用本書配套的Python軟件包,輕松學會如何利用python,對股票、足彩數(shù)據(jù),進行專業(yè)分析,量化投資分析
投資零起點,無需購買任何專業(yè)軟件,本書配套的zwPython軟件包,采用開源模式,提供100%全功能、全免費的工業(yè)級數(shù)據(jù)分析平臺。
配置零起點,所有軟件、數(shù)據(jù),全部采用蘋果“開箱即用”模式,綠色版本,無需安裝,解壓即可,直接運行系統(tǒng)。
理財零起點,無需任何專業(yè)金融背景,采用通俗易懂的語言,配合大量專業(yè)圖表,實盤操作案例,輕松掌握各種量化投資策略。
數(shù)學零起點,全書沒有任何復雜數(shù)學公式,只有最基本的加減乘除,初中以上文化,即可看懂
根據(jù)作者多年一線實踐經(jīng)驗,本書在大數(shù)據(jù)分析領域,首次提出了許多原創(chuàng)的、緣自一線實戰(zhàn)的觀點和理論,例如:暗數(shù)據(jù)、“小數(shù)據(jù)”理論,黑天鵝算法,大部分還附有python源碼,方便讀者直接使用。
此外,本書還介紹了,采用黑天鵝算法實現(xiàn)的,國內(nèi)首個通過足彩實盤測試的大數(shù)據(jù)方案:zw足彩數(shù)據(jù)分析平臺。
【補充說明】
本書內(nèi)容偏重于數(shù)據(jù)分析,特別是量化交易方面的數(shù)據(jù)分析,是因為
實踐工作中,除了移動、百度、阿里等超大型,數(shù)據(jù)密集型企業(yè)外,99%以上的企業(yè),包括上市公司,并不具備,也不需要真正的TB級大數(shù)據(jù)分析軟件、硬件環(huán)境,計算集群和cuda都很少
金融領域,國內(nèi)A股市場,數(shù)千股票,歷年裸數(shù)據(jù)合集,不超數(shù)據(jù)10G,千萬級規(guī)模
目前大數(shù)據(jù)領域,尚處于萌芽階段,算法、模型每年變化都很大,因此這方面的內(nèi)容,以定性為主
大數(shù)據(jù)分析的核心,是數(shù)據(jù)分析算法,書中介紹的都是經(jīng)典算法,通用性很強
字王 回復 :目前忙“黑天鵝”算法的實盤測試,暫時沒時間寫書。
急的話 自己下個zwPython 帶pandas數(shù)據(jù)分析、demo演示代碼,有中文教材,綠色版,解壓即可,
配合目錄作為大綱,自己邊看邊學,碼碼python腳本,效果更好
blog首頁“置頂”有百度網(wǎng)盤的下載地址(6月8日 15:36)
《零起點,python大數(shù)據(jù)與量化交易》目錄
第1章、大數(shù)據(jù)簡介
大數(shù)據(jù)思維導圖
數(shù)據(jù)挖掘
計算統(tǒng)計學
語義分析
人工智能
并行運算框架
GPU超算平臺
發(fā)展簡史
大數(shù)據(jù)史前模式
從3V到4V
云計算時代
大數(shù)據(jù)主要應用領域
大數(shù)據(jù)技術(shù)流派
Hadoop生態(tài)圈
MapReduce
NoSQL數(shù)據(jù)庫
Storm流處理分布式計算框架
SPark內(nèi)存計算與通用并行計算框架
IBM數(shù)據(jù)流Stream體系
Oracle
Python與大數(shù)據(jù)
Python,統(tǒng)治級數(shù)據(jù)編程語言
Pandas數(shù)據(jù)分析
Nltk文本語義分析
Scikit人工智能和機器學習
Numpy/scipy矢量數(shù)據(jù)和科學計算
sympy符號計算
Gpu并行超速運算
Opencv圖像視頻處理
TVTK/mayavi可視化計算
第2章、量化交易簡介
套利交易
金融工程學
計量金融學
技術(shù)分析
高頻交易
足彩,被誤解的投資模式
年收益269%的神奇投資術(shù)
第3章、小數(shù)據(jù)更酷
失敗的經(jīng)典:啤酒與尿布
小數(shù)劇理論
龍格現(xiàn)象
孤子分布
哥白尼原則
零膨脹
極值理論
任何程序化交易系統(tǒng)都有“半衰期”
0與1:計算的本質(zhì)
陰陽八卦易經(jīng)
暗數(shù)據(jù)與全數(shù)據(jù)
二八定理
帕累托分析法
齊夫定律
分析模型比數(shù)據(jù)規(guī)模更重要
實戰(zhàn)案例:百萬社區(qū)數(shù)據(jù)庫
實戰(zhàn)案例:神奇的魔鬼英語:500單詞看懂原著
大數(shù)原則
平庸原理
實戰(zhàn)案例:史上最強網(wǎng)絡推廣案例:惠普筆記本數(shù)碼混搭
每次只解決一個問題
量化投資第一季:單一指數(shù)模型
第4章、神一般的黑天鵝算法
黑天鵝是新常態(tài)
主要特點
運算速度快一個數(shù)量級
數(shù)據(jù)規(guī)模小一個數(shù)量級
全數(shù)據(jù)建模小數(shù)據(jù)匹配
黑天鵝算法PK現(xiàn)代與傳統(tǒng)
與傳統(tǒng)抽樣數(shù)據(jù)庫算法比較
與其他大數(shù)據(jù)方案算法比較
黑天鵝算法基本流程
從4V到1V
數(shù)據(jù)預處理
衍生數(shù)據(jù)擴充
指數(shù)壓縮
數(shù)據(jù)歸一化
標準分數(shù)
T-統(tǒng)計量
學生化殘差
標準化矩
變異系數(shù)
離差指數(shù)
建立參數(shù)v知識庫
建立黑天鵝判別模型庫
尋找黑天鵝
第5章、Python,“統(tǒng)治級”數(shù)據(jù)處理語言
Hello,zw
基礎語句
Basic模式
Python一卡通
Python常用模塊
numPy數(shù)據(jù)分析
Matplotlib可視化計算
Pandas數(shù)據(jù)分析平臺
內(nèi)置數(shù)據(jù)分析函數(shù)
數(shù)據(jù)存讀
數(shù)據(jù)聚合
時間序列分析
股票數(shù)據(jù)分析
足彩數(shù)據(jù)分析
大數(shù)據(jù)與Python十倍速性能優(yōu)化
軟加速:矢量優(yōu)先
軟加速:cpython
SSD加速大法
KBD全內(nèi)存數(shù)據(jù)庫
Gpu終極加速方案
第6章、大數(shù)據(jù)十大經(jīng)典算法Python版
AdaBoost機器學習迭代分析算法
Apriori關(guān)聯(lián)分析算法
C4.5分類決策樹算法
CART分類回歸樹算法
decision tree決策樹數(shù)據(jù)分類算法
EM最大期望關(guān)聯(lián)分析算法
kNN 機器學習最近鄰分類算法
k-means聚類分析算法
Na?veBayes樸素貝葉斯數(shù)據(jù)分類算法
PageRank引用分析算法
SVM向量機數(shù)據(jù)分類算法
其他經(jīng)典算法
Apriori框架的圖挖掘算法
AGM圖論節(jié)點圖數(shù)據(jù)挖掘算法
FSG圖論邊框數(shù)據(jù)挖掘算法
Pattern-growth框架圖挖掘算法
gSpan右路徑擴展算法
閉合子圖挖掘算法
CLOSEGRAPH圖挖掘算法
閉合完全連通子圖挖掘算法
CLAN圖挖掘算法
Cocain圖挖掘算法
FP-Growth模式樹分類算法
logistic回歸算法
Affinitypropagation聚類算法
LDA模型
HMM隱性馬可夫模型
SOA模型
第7章、數(shù)據(jù)源與在線數(shù)據(jù)采集
案例:搜索引擎鏈接數(shù)
案例:百度TOP100指數(shù)
案例:行業(yè)關(guān)鍵詞與衍生關(guān)鍵詞
案例:企業(yè)競爭情報搜集
常用在線數(shù)據(jù)API接口
第8章、從故事開始學統(tǒng)計
趣味統(tǒng)計學
爾斯伯格悖論
生日問題
蒙特卡羅方法
德國坦克問題
無限猴子定理
墨菲定律
常用統(tǒng)計數(shù)值編程
極值:極大值,極小值,極差/全距
均值:算術(shù)平均數(shù),幾何平均數(shù),調(diào)和平均數(shù),希羅平均數(shù),加權(quán)平均數(shù),冪平均/赫爾德平均,畢達哥拉斯平均,平均數(shù)不等式
方差等:均方差,平均差,偏度,峰度
其他統(tǒng)計值:累積和、總數(shù),眾數(shù),中位數(shù),四分位數(shù)
常用統(tǒng)計圖表
四種基本圖表:直方圖Histogram,長條圖Bar Chart,圓餅圖/比例圖Pie Chart,折線圖/趨勢圖Line chart
金融類圖表:K線圖Candlestick chart,均線圖Moving Average chart,布林帶圖Bollinger Bands,BBands
統(tǒng)計類圖表:箱形圖,雙標圖,標準九分圖,概率圖,半對數(shù)線圖,散點圖,莖葉統(tǒng)計圖,統(tǒng)計地圖
其他圖表:時間軸圖表,流程圖,山形圖Area_chart,瀑布圖Waterfall chart,量化波形圖Streamgraph,落差圖GapChart,泡泡圖Bubble chart,極區(qū)圖,雷達圖Radar_chart,示意地圖Cartogram
第9章、從故事開始學量化交易
趣味理財學
一月效應
DCA懶人理財術(shù)
興登堡兇兆
死貓反彈
布拉普預測
祖魯法則
Gordon高登模型
奧卡姆剃刀與KISS法則
神奇公式
MM定理
混沌理論
三種基礎模型:資產(chǎn)配置模型,行業(yè)模型,股票模型。
四大特點:紀律性,系統(tǒng)性,套利思想,概率取勝
量化投資策略
量化選股:估值法,趨勢法,資金法
量化擇時
股指期貨套利:現(xiàn)貨構(gòu)建,套利定價,保證金管理,沖擊成本,成分股調(diào)整
商品期貨套利
統(tǒng)計套利:
β中性策略
協(xié)整策略
期權(quán)套利:水平套利,垂直套利,轉(zhuǎn)換套利,反向轉(zhuǎn)換套利,跨式套利,蝶式套利,飛鷹式套利
算法交易:被動型算法交易,主動型算法交易,綜合型算法交易
組合投資與資產(chǎn)配置
其他策略
股票價差套利
博彩套利
ETF套利
衍生品套利
公司并購套利
市政債券套利
寬客兵器譜
KDB內(nèi)存數(shù)據(jù)庫
Quant交易數(shù)據(jù)分析平臺
Q語言
Matlab
Python
HFT高頻交易常用策略和技術(shù)
造市交易
收報機交易
事件套利
統(tǒng)計套利
新聞交易
低延遲策略
訂單屬性策略
奪取優(yōu)先權(quán)
算法監(jiān)聽
監(jiān)聽大買賣盤
黑池交易平臺
信號觸發(fā)
觸發(fā)補償
第10章、統(tǒng)計學與數(shù)據(jù)分析基礎
概率分布
離散分布:均勻分布,二項分布,正態(tài)分布,幾何分布,超幾何分布,超幾何分布和二項分布的關(guān)系,泊松分布,泊松分布近似,泊松試驗,復合泊松分布
連續(xù)分布:均勻分布,指數(shù)分布,對數(shù)分布,伽馬分布,高斯/正態(tài)分布,肥尾分布,重尾分布,正態(tài)分布和二項分布,帕斯卡分布,韋伯分布,伯努利分布
其他統(tǒng)計分布模式:Gamma伽瑪分布,卡方分布,F(xiàn)分布,Β分布,β-二項式分布,穩(wěn)定分布,三角形分布,聯(lián)合分布,條件概率分布,柯西分布,
統(tǒng)計檢驗
皮爾森卡方檢定,學生t檢驗
假設檢驗
交叉驗證
零假設檢驗
F檢驗
Jarque-Bera檢驗
柯爾莫諾夫-斯米爾諾夫檢驗
迪基-福勒檢驗,擴張的Dickey-Fuller檢定
核密度估計
鄒檢驗
其他統(tǒng)計分析方法
抽樣
置信區(qū)間
貝葉斯概率
最大似然估計
赤池信息量準則
回歸分析
線性回歸:簡單線性回歸,最小二乘法,復回歸分析,對數(shù)線性回歸
非線性回歸:邏輯回歸,偏回歸,自回歸,ARMA自回歸滑動平均模型,ARIMA差分自回歸滑動平均模型,格蘭杰因果關(guān)系,向量自回歸模型,曲線擬合分析,分量回歸,泊松回歸
零膨脹
過擬合
方差分析
方差:協(xié)方差,自協(xié)方差,互協(xié)方差,均方差,異方差,偏差,SD標準差,CV標準離差率,最小方差無偏估計,最小均方差估計
方差和:SST總平方和,SSM模型平方和
R2回歸系數(shù)
變異量(數(shù))
期望值
時間序列分析
RATS模型
ARCH模型
數(shù)據(jù)關(guān)聯(lián)分析
常用關(guān)聯(lián)參數(shù):耦合,顯著性差異,凈相關(guān),Gamma相關(guān)系數(shù),Spearman等級相關(guān)系數(shù),Kappa一致性系數(shù),Kendall等級相關(guān)系數(shù),Kendall和諧系數(shù),Pearson相關(guān)系數(shù),Phi相關(guān)系數(shù),列聯(lián)相關(guān)系數(shù),四分相關(guān)系數(shù),點二系列相關(guān)系數(shù),二系列相關(guān)系數(shù),皮爾遜積差系數(shù),斯皮爾曼等級相關(guān)系數(shù)
關(guān)聯(lián)分析模型:杜賓-瓦特森統(tǒng)計量,鄰里成分分析,樸素貝葉斯分類器,PCC皮爾遜積矩相關(guān)系數(shù),自相關(guān)函數(shù),關(guān)聯(lián)式規(guī)則,ROC曲線
數(shù)據(jù)關(guān)聯(lián)度分析
三大主流方法:最小平方誤差,MLE極大似然,貝葉斯相關(guān)
其他方法:MME矩關(guān)聯(lián)度,Cramér-Rao不等式,MMSE最小均方差,MAP最大后驗概率,MVUE最小方差非偏關(guān)聯(lián)度,BLUE最佳線性非偏關(guān)聯(lián)度,非偏關(guān)聯(lián)度,Particle filter,MCMC,卡爾曼濾波,維納濾波
聚類分析
核心關(guān)聯(lián)度函數(shù):歐式距離,曼哈頓距離,infinity norm,馬氏距離,余弦相似性,漢明距離
QT聚類算法
圖論聚類算法
線性判別分析
PCA主成分分析
常用統(tǒng)計分析模型
維納過程
布萊克-舒爾斯模型
赫爾懷特模型
馬爾可夫過程
陳琳模型
第11章、現(xiàn)代投資組合理論
第12章、趨勢為王
趨勢判斷型量化投資策略
波動率判斷型量化投資策略
第13章、三大基本建模策略
順勢系統(tǒng)
逆勢系統(tǒng)
形態(tài)操作
第14章、三大量化投資模型
單元交易模型
雙元交易模型:長短線模型
三元及多元模型
第15章、組合交易策略
價值策略組合
動量策略組合
融合策略組合
混合策略組合
第16章、無風險套利交易策略
ETF套利交易策略
股指期貨期現(xiàn)套利交易策略
國債期貨套利交易策略
第17章、風險套利交易策略
阿爾法套利
統(tǒng)計套利
第18章、交易模型主要考核指標
利潤率V
勝率/盈虧比率k
最大單次盈利
最大單次虧損
最大連續(xù)盈利次數(shù)
最大連續(xù)虧損次數(shù)
第19章、足彩數(shù)據(jù)分析
凱利指數(shù)
同注分彩法
第20章、量化投資常用實盤操作策略
第21章、日內(nèi)交易
GFTD日內(nèi)程序化交易策略
第22章、常用量化投資策略
阿爾法回報策略
Beta貝塔系數(shù)策略
smart beta策略
CAPM資產(chǎn)定價模型
crb指數(shù)模型
Dynamic Breakout 策略
EMH效率市場模型
EPS每股盈余模型
IFATS交易策略
GARCH交易模型
TWAP時間加權(quán)平均策略
Pivot Points策略
R-Breaker交易策略
VWAP成交量加權(quán)平均策略
第23章、分析圖表類
K線圖交易策略
美國線交易策略
開盤區(qū)間突破策略
一目均衡表交易策略
趨勢線交易策略
CMI趨勢性交易策略
趨勢追蹤選股模型
MA移動平均線策略
支撐線和壓力線交易策略
n日突破交易策略
移動止贏交易策略
移動止損交易策略
牛熊線擇時模型
BBands布林帶交易策略
夾板交易模型
點線圖交易策略
艾略特波浪理論
型態(tài)學交易策略
道氏理論
軸點分析策略
0軸交易策略
中點交易策略
半衰交易策略
夏普比率策略
第24章、投資指數(shù)類
BIAS乖離率交易策略
EP盈利收益率策略
Kdj交易策略
rsi 交易策略
波動率交易策略
Kurtosis峰值交易策略
Skewing偏度交易策略
Macd交易策略
PBR市凈率
PER市盈率
PEG收益率
WACC加權(quán)平均資本成本
ROA資產(chǎn)收益率
ROE股本回報率
NPV凈現(xiàn)值
真實波動幅度均值
累積/分布指數(shù)
第25章、其他交易策略
蝶式套利策略
三角套利策略
機會點策略
海龜交易法則
多因子選股模型
盈利預期模型
戴爾指數(shù)
基尼系數(shù)
勞倫茨曲線
黃金分割點
斐波那契回調(diào)
赫斯特指數(shù)
費雪方程式
三因子模型
詹森指數(shù)
凱斯-席勒指數(shù)
拋物線指標
商品通道指數(shù)
金錢流
OBV平衡成交量/能量潮
OMAV交易策略
Trix指標
威廉指標
振蕩指標
價值型策略
收益型策略
m2行業(yè)輪動策略
市場情緒輪動策略
資金流選股策略
動量選股策略和反轉(zhuǎn)選股策略
一致預期模型
籌碼選股模型
情緒指標擇時策略
有效資金擇時模型
svm擇時模型
swarch模型
第26章、人工智能量化交易算法
模式識別短線擇時算法
rbf神經(jīng)網(wǎng)絡股價預測
基于遺傳算法的新股預測
金融時序數(shù)據(jù)預測
趨勢拐點預測
灰色馬爾可夫鏈股市預測
第27章、、黑天鵝算法2.0實戰(zhàn)
數(shù)據(jù)預處理
衍生數(shù)據(jù)擴充
指數(shù)壓縮
數(shù)據(jù)歸一化
標準分數(shù)
T-統(tǒng)計量
學生化殘差
標準化矩
變異系數(shù)
離差指數(shù)
建立參數(shù)v知識庫
建立黑天鵝判別模型庫
尋找黑天鵝
數(shù)據(jù)回溯與驗證
附錄,zwPython用戶手冊