garch预测 python_数据科学方面的Python库,实用!
Python是一種很棒的編程語言。事實(shí)上,它還是世界上發(fā)展最快的編程語言之一。它一次又一次證明了它在數(shù)據(jù)科學(xué)職位中的實(shí)用性。整個(gè)Python及其庫的生態(tài)系統(tǒng)使其成為全世界用戶(初學(xué)者和高級)的合適選擇。
在本文中,我們將介紹一些用于數(shù)據(jù)科學(xué)方面的Python庫,它們并不像pandas、scikit-learn 和 matplotlib那么知名,但一樣非常實(shí)用的庫。
1、Wget
提取數(shù)據(jù),尤其是從網(wǎng)絡(luò)上提取數(shù)據(jù),是數(shù)據(jù)科學(xué)家的主要任務(wù)之一。Wget是一個(gè)免費(fèi)的實(shí)用程序,用于從Web上進(jìn)行非交互式文件下載。它支持HTTP,HTTPS和FTP協(xié)議,以及通過HTTP代理進(jìn)行檢索。由于它是非交互式的,即使用戶沒有登錄也可以在后臺運(yùn)行。因此,如果你需要下載一個(gè)網(wǎng)站或頁面中的所有圖片時(shí),wget 就可以幫到你
安裝:
$?pip?install?wget示例:
import?wgeturl?=?'http://www.futurecrew.com/skaven/song_files/mp3/razorback.mp3'
filename?=?wget.download(url)
100%?[................................................]?3841532?/?3841532
filename
'razorback.mp3'
2、Pendulum
如果你還在苦惱Python中時(shí)間日期的處理,那么你需要Pendulum。它是一個(gè)Python包,用于簡化datetime操作。它是Python原生類的一個(gè)臨時(shí)替代。
安裝:
$?pip?install?pendulum例子:
import?pendulumdt_toronto?=?pendulum.datetime(2012,?1,?1,?tz='America/Toronto')
dt_vancouver?=?pendulum.datetime(2012,?1,?1,?tz='America/Vancouver')print(dt_vancouver.diff(dt_toronto).in_hours())3
3、Imbalanced-learn
大多數(shù)分類算法在每個(gè)類的樣本數(shù)量幾乎都是一樣的情況下是最有效的,但實(shí)際工作中大多數(shù)是不平衡的數(shù)據(jù)集,這些數(shù)據(jù)集對機(jī)器學(xué)習(xí)算法的學(xué)習(xí)階段和后續(xù)預(yù)測都可能有影響。幸運(yùn)的是,創(chuàng)imbalance -learn庫可以解決這個(gè)問題。它與scikit-learn兼容,是scikit- learning -contrib項(xiàng)目的一部分。下次遇到不平衡的數(shù)據(jù)集的情況,請別忘了它。
安裝:
pip?install?-U?imbalanced-learn#?orconda?install?-c?conda-forge?imbalanced-learn
4、FlashText
在自然語言處理(NLP)任務(wù)中清理文本數(shù)據(jù)通常需要替換關(guān)鍵字或從句子中提取關(guān)鍵字。通常,這樣的操作可以用正則表達(dá)式來完成,但是如果要搜索的詞匯量達(dá)到數(shù)千,那么這些操作就會變得很繁瑣。
Python的FlashText模塊基于FlashText算法,為這種情況提供了合適的替代方案。FlashText最棒的地方是,它的運(yùn)行與你的搜索量無關(guān)。
安裝:
$?pip?install?flashtext例子:
1)提取關(guān)鍵詞
from?flashtext?import?KeywordProcessorkeyword_processor?=?KeywordProcessor()#?keyword_processor.add_keyword(,?)
keyword_processor.add_keyword('Big?Apple',?'New?York')
keyword_processor.add_keyword('Bay?Area')
keywords_found?=?keyword_processor.extract_keywords('I?love?Big?Apple?and?Bay?Area.')
keywords_found
['New?York',?'Bay?Area']
2)替代關(guān)鍵詞
keyword_processor.add_keyword('New?Delhi',?'NCR?region')new_sentence?=?keyword_processor.replace_keywords('I?love?Big?Apple?and?new?delhi.')
new_sentence'I?love?New?York?and?NCR?region.'
5、FuzzyWuzzy
這個(gè)名稱聽起來很奇怪,但是在字符串匹配方面,FuzzyWuzzy是一個(gè)非常有用的庫。它可以方便地實(shí)現(xiàn)字符串匹配率等操作。它還可以方便地匹配保存在不同數(shù)據(jù)庫中的記錄。
安裝:
$?pip?install?fuzzywuzzy例子:
from?fuzzywuzzy?import?fuzzfrom?fuzzywuzzy?import?process#?Simple?Ratiofuzz.ratio("this?is?a?test",?"this?is?a?test!")97#?Partial?Ratio
fuzz.partial_ratio("this?is?a?test",?"this?is?a?test!")100
6、PyFlux
時(shí)間序列分析是機(jī)器學(xué)習(xí)中最常見的問題之一。PyFlux是Python中的一個(gè)開源庫,它是為處理時(shí)間序列問題而構(gòu)建的。該庫擁有一系列很優(yōu)秀的現(xiàn)代時(shí)間序列模型,諸如ARIMA、GARCH和VAR模型等。簡而言之,PyFlux提供了一種時(shí)間序列建模的概率方法。
安裝:
pip?install?pyflux7、IPyvolume
數(shù)據(jù)科學(xué)很重要的一部分就是交流結(jié)果,可視化結(jié)果顯示可以給你提供一個(gè)巨大的優(yōu)勢。IPyvolume是一個(gè)Python庫,用于可視化Jupyter筆記本中的3D容量和符號(例如3D散點(diǎn)圖),只需少量的配置。
安裝 :
Using?pip$?pip?install?ipyvolume
Conda/Anaconda
$?conda?install?-c?conda-forge?ipyvolume
例子:
繪制
8、Dash
Dash是一個(gè)用于構(gòu)建web應(yīng)用程序的高效Python框架。它基于FlaskPlotty.js 和 Response.js 之上。將下拉菜單和圖形等UI元素與Python分析代碼捆綁在一起,而不需要使用JavaScript。Dash非常適合構(gòu)建可以在web瀏覽器中呈現(xiàn)的數(shù)據(jù)可視化應(yīng)用程序。
安裝:
pip?install?dash==0.29.0??#?The?core?dash?backendpip?install?dash-html-components==0.13.2??#?HTML?components
pip?install?dash-core-components==0.36.0??#?Supercharged?components
pip?install?dash-table==3.1.3??#?Interactive?DataTable?component?(new!)
例子:
下面的示例顯示了具有下拉功能的高度交互式圖。當(dāng)用戶在下拉菜單中選擇一個(gè)值時(shí),應(yīng)用程序代碼將動態(tài)地將數(shù)據(jù)從Google Finance 導(dǎo)出到panda DataFrame。
9、Gym
Gym是開發(fā)和對比強(qiáng)化學(xué)習(xí)算法的工具,它兼容任何數(shù)據(jù)科學(xué)庫,如TensorFlow或Theano。是一個(gè)測試問題的集合,也叫環(huán)境,你可以用它來計(jì)算強(qiáng)化學(xué)習(xí)算法。這些環(huán)境有一個(gè)共享接口,允許用戶編寫通用算法。
安裝:
pip?install?gym總結(jié)
以上是生活随笔為你收集整理的garch预测 python_数据科学方面的Python库,实用!的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 技术面试问项目难题如何解决的_技术创新
- 下一篇: python自动拨号_Python自动连