随机数种子42
隨機數種子42
近期在研究決策樹時遇到很多疑惑,今天說一下隨機數種子42
簡述決策樹練習
通過sklearn庫實現決策樹的實戰訓練。
1、選擇了sklearn庫自帶的乳腺癌數據集;
2、使用train_test_split()劃分數據集,劃分為訓練集和測試集;
3、對測試集的標簽進行格式化處理;
4、對數據進行標準化處理;
5、構建決策樹;
6、將訓練好的決策樹模型應用到測試集,對比結果。
random_state=42
在劃分數據集時,train_test_split()函數里有一個參數是random_state。
random_state(隨機狀態):隨機數種子——其實就是該組隨機數的編號,在需要重復試驗的時候,保證得到一組一樣的隨機數。比如每次都為1,其他參數一樣的情況下你得到的隨機數組是一樣的。當為None時,產生的隨機數組也會是隨機的。
很多人在使用random_state時習慣于把其設置為42,這是為什么呢?
random_state=42 讓人感到疑惑,有什么別的含義嗎?
The answer to universe and everything–“42”
查閱隨機樹種子的資料,得知“42”并不是想象的那么簡單,它還充滿了傳奇色彩?!?2”不僅僅是局限在程序里,42居然和宇宙萬物的答案還有聯系。
42是道格拉斯·亞當斯所作的小說《銀河系漫游指南》中“生命、宇宙以及任何事情的終極答案”的答案。在故事中,一個具有高度智慧的跨維度生物種族為了找出一個能夠回答終極問題的簡單答案,特別造了一臺超級電腦——“深思”(Deep Thought)來進行計算?!吧钏肌被?50萬年來計算和驗證,最后得出了“42”這個答案。當被要求提供所謂的終極問題時,“深思”說它沒辦法,但是它可以設計出另外一臺更強大的電腦(也就是地球這個生體電腦)來做這工作。于是當初問這些問題的種族就開始了漫長無盡的等待,讓這個超級生體電腦去運行程式來找出終極問題。經過了800萬年,就在結果要出來的五分鐘前,地球卻因為擋在預定興建的星際間高速公路的路線,被渥罡人給毀滅,電腦沒有給出最后的結果。
42因此成為一個“?!痹诳茖W家、程序員以及極客之間流傳了開來。
總結
- 上一篇: 借助Sci-Hub免费下载外文文献
- 下一篇: 有效解决0x0000011b共享打印机无