python股票涨势_stock
stock
###思路
1 統(tǒng)計(jì)雪球討論熱門(mén)的股票
1.1.在主頁(yè)獲取雪球活躍用戶(hù)
1.2.在活躍用戶(hù)的發(fā)帖中統(tǒng)計(jì)股票被提及的次數(shù)
1.3.畫(huà)出與個(gè)股討論度與價(jià)格走勢(shì)圖
2 對(duì)評(píng)論情感分析
2.1.使用jieba分詞
[https://github.com/fxsjy/jieba.git](https://github.com/fxsjy/jieba.git)
2.2.股票領(lǐng)域語(yǔ)料庫(kù)的構(gòu)建
統(tǒng)計(jì)評(píng)論中的詞語(yǔ)提及次數(shù),把頻率較高的當(dāng)做股票領(lǐng)域詞語(yǔ)
2.3.提取特征值
根據(jù)語(yǔ)料庫(kù),提取特征值
2.4.使用nltk NaiveBayesClassifier簡(jiǎn)單分類(lèi)評(píng)論的正面和負(fù)面情緒
[http://streamhacker.com/2010/05/10/text-classification-sentiment-analysis-naive-bayes-classifier/](http://streamhacker.com/2010/05/10/text-classification-sentiment-analysis-naive-bayes-classifier/)
2.5.結(jié)論
利用上邊的語(yǔ)料庫(kù)提取特征值,很難判斷評(píng)論的正反情感,準(zhǔn)確率只有一半。
詞典不夠代表性
2.6.第二種方法
論壇里對(duì)股票的評(píng)論一般都是正面的
把前幾天的個(gè)股討論度上升下降與第二天的股價(jià)上升下降進(jìn)行機(jī)器學(xué)習(xí),即統(tǒng)計(jì)概率
輸入前幾天的個(gè)股討論度,輸出第二天最有可能的股價(jià)走勢(shì)。
目前是統(tǒng)計(jì)前兩天的討論度和兩天的股價(jià)與第二天的股價(jià)走勢(shì)的關(guān)系,
0表示比昨天上升1表示下降2表示平,
例如前兩天的評(píng)論與股價(jià)走勢(shì)'1010'與第二天股價(jià)上升、下降、平的概率 0.0444444444444 0.955555555556 0.0
2.6.1.結(jié)論
結(jié)果準(zhǔn)確率只有一半
2.7.第三種方法
討論度與第二天股價(jià)關(guān)系
todo:
統(tǒng)計(jì)被提及股票的版塊熱度圖,判斷版塊熱度加速度是否是熱點(diǎn)轉(zhuǎn)換的依據(jù)
個(gè)股與行業(yè)討論度與股價(jià)走勢(shì)的關(guān)系,利用機(jī)器學(xué)習(xí)預(yù)測(cè)走勢(shì)
分析用戶(hù)(或者大神)對(duì)個(gè)股的情緒與股價(jià)走勢(shì)的關(guān)系
分詞 不開(kāi)心 會(huì)分成 不 開(kāi)心 對(duì)情緒分析有點(diǎn)影響
分析哪幾個(gè)大V的觀點(diǎn)與大盤(pán)的走勢(shì)相符(合力對(duì)市場(chǎng)的影響)
###運(yùn)行說(shuō)明
python stockCode.py
用于抓取網(wǎng)易的股票信息,并保存在stock.xls中
python xueqiuPawer.py 3 2
抓取雪球從3天前開(kāi)始2天內(nèi)的數(shù)據(jù)
###需要安裝的python模塊
beautifulsoup
xlwt
xlrd
selenium
xlutils
nltk
####其他
chromedriver
###特殊說(shuō)明
linux環(huán)境必須桌面版才能運(yùn)行,因?yàn)樾枰蜷_(kāi)瀏覽器
與50位技術(shù)專(zhuān)家面對(duì)面20年技術(shù)見(jiàn)證,附贈(zèng)技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的python股票涨势_stock的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: pep8 python 编码规范_「原创
- 下一篇: scanf调试_STM32调试利器之IT