用线性单元(LinearUnit)实现工资预测的Python3代码
生活随笔
收集整理的這篇文章主要介紹了
用线性单元(LinearUnit)实现工资预测的Python3代码
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
?
功能:通過樣本進行訓練,讓線性單元自己找到(這就是所謂機器學習)工資計算的規律,然后用兩組數據進行測試機器是否真的get到了其中的規律。
原文鏈接在文尾,文章中的代碼為了演示起見,僅根據工作年限來預測工資,參數是一維的,最后繪制的圖也是平面圖。本著學習的態度,我將代碼改為能根據兩個參數來預測工資,兩個參數分別是工作年限和級別,并且用3D圖繪制出擬合的效果。原作者的代碼是適用于Python2.7的,我的代碼適用于Python3,謹供參考。
注意:繪圖代碼需要安裝matplotlib。
?
代碼:
1 #!/usr/bin/env python 2 # -*- coding: UTF-8 -*- 3 4 from Perceptron import Perceptron 5 6 7 #定義激活函數f 8 f = lambda x: x 9 10 class LinearUnit(Perceptron): 11 def __init__(self, input_num): 12 '''初始化線性單元,設置輸入參數的個數''' 13 Perceptron.__init__(self, input_num, f) 14 15 16 def get_training_dataset(): 17 ''' 18 捏造5個人的收入數據 19 ''' 20 # 構建訓練數據 21 # 輸入向量列表,每一項的第一個是工作年限,第二個是級別 22 # 構造這些數據所用的公式是:工資=1000*年限 + 500*級別,看機器是否能猜出來 23 input_vecs = [[5,1], [3, 7], [8,2], [1.5,5], [10,6]] 24 # 期望的輸出列表,月薪,注意要與輸入一一對應。【注意! 我故意讓結果不太準確,這也會導致預測的結果有偏差】 25 labels = [5200, 6700, 9300, 3500, 15500] 26 return input_vecs, labels 27 28 29 def train_linear_unit(): 30 ''' 31 使用數據訓練線性單元 32 ''' 33 # 創建感知器,輸入參數的特征數為2(工作年限,級別) 34 lu = LinearUnit(2) 35 # 訓練,迭代10輪, 學習速率為0.005 36 input_vecs, labels = get_training_dataset() 37 lu.train(input_vecs, labels, 10, 0.005) 38 #返回訓練好的線性單元 39 return lu 40 41 42 def plot(linear_unit): 43 import numpy as np 44 from mpl_toolkits.mplot3d import Axes3D 45 import matplotlib.pyplot as plt 46 input_vecs, labels = get_training_dataset() 47 fig = plt.figure() 48 ax = Axes3D(fig) 49 ax.scatter(list(map(lambda x: x[0], input_vecs)), 50 list(map(lambda x: x[1], input_vecs)), 51 labels) 52 53 weights = linear_unit.weights 54 bias = linear_unit.bias 55 x = range(0,12,1) # work age 56 y = range(0,12,1) # level 57 x, y = np.meshgrid(x, y) 58 z = weights[0] * x + weights[1] * y + bias 59 ax.plot_surface(x, y, z, cmap=plt.cm.winter) 60 61 plt.show() 62 63 64 if __name__ == '__main__': 65 '''訓練線性單元''' 66 linear_unit = train_linear_unit() 67 # 打印訓練獲得的權重 68 #print (linear_unit) 69 # 測試 70 print ('預測:') 71 print ('Work 3.4 years, level 2, monthly salary = %.2f' % linear_unit.predict([3.4,2])) 72 print ('Work 15 years, level 6, monthly salary = %.2f' % linear_unit.predict([15,6])) 73 plot(linear_unit)?
為了代碼的正常運行,你可能還需要下面這個感知機的類文件,另存為Perceptron.py(注意大小寫),和上面的代碼放在同一個目錄下即可。
1 #coding=utf-8 2 3 from functools import reduce # for py3 4 5 class Perceptron(object): 6 def __init__(self, input_num, activator): 7 ''' 8 初始化感知器,設置輸入參數的個數,以及激活函數。 9 激活函數的類型為double -> double 10 ''' 11 self.activator = activator 12 # 權重向量初始化為0 13 self.weights = [0.0 for _ in range(input_num)] 14 # 偏置項初始化為0 15 self.bias = 0.0 16 def __str__(self): 17 ''' 18 打印學習到的權重、偏置項 19 ''' 20 return 'weights\t:%s\nbias\t:%f\n' % (self.weights, self.bias) 21 22 23 def predict(self, input_vec): 24 ''' 25 輸入向量,輸出感知器的計算結果 26 ''' 27 # 把input_vec[x1,x2,x3...]和weights[w1,w2,w3,...]打包在一起 28 # 變成[(x1,w1),(x2,w2),(x3,w3),...] 29 # 然后利用map函數計算[x1*w1, x2*w2, x3*w3] 30 # 最后利用reduce求和 31 32 #list1 = list(self.weights) 33 #print ("predict self.weights:", list1) 34 35 36 return self.activator( 37 reduce(lambda a, b: a + b, 38 list(map(lambda tp: tp[0] * tp[1], 39 zip(input_vec, self.weights))) 40 , 0.0) + self.bias) 41 def train(self, input_vecs, labels, iteration, rate): 42 ''' 43 輸入訓練數據:一組向量、與每個向量對應的label;以及訓練輪數、學習率 44 ''' 45 for i in range(iteration): 46 self._one_iteration(input_vecs, labels, rate) 47 48 def _one_iteration(self, input_vecs, labels, rate): 49 ''' 50 一次迭代,把所有的訓練數據過一遍 51 ''' 52 # 把輸入和輸出打包在一起,成為樣本的列表[(input_vec, label), ...] 53 # 而每個訓練樣本是(input_vec, label) 54 samples = zip(input_vecs, labels) 55 # 對每個樣本,按照感知器規則更新權重 56 for (input_vec, label) in samples: 57 # 計算感知器在當前權重下的輸出 58 output = self.predict(input_vec) 59 # 更新權重 60 self._update_weights(input_vec, output, label, rate) 61 62 def _update_weights(self, input_vec, output, label, rate): 63 ''' 64 按照感知器規則更新權重 65 ''' 66 # 把input_vec[x1,x2,x3,...]和weights[w1,w2,w3,...]打包在一起 67 # 變成[(x1,w1),(x2,w2),(x3,w3),...] 68 # 然后利用感知器規則更新權重 69 delta = label - output 70 self.weights = list(map( lambda tp: tp[1] + rate * delta * tp[0], zip(input_vec, self.weights)) ) 71 72 # 更新bias 73 self.bias += rate * delta 74 75 print("_update_weights() -------------") 76 print("label - output = delta:" ,label, output, delta) 77 print("weights ", self.weights) 78 print("bias", self.bias) 79 80 81 82 83 84 def f(x): 85 ''' 86 定義激活函數f 87 ''' 88 return 1 if x > 0 else 0 89 90 def get_training_dataset(): 91 ''' 92 基于and真值表構建訓練數據 93 ''' 94 # 構建訓練數據 95 # 輸入向量列表 96 input_vecs = [[1,1], [0,0], [1,0], [0,1]] 97 # 期望的輸出列表,注意要與輸入一一對應 98 # [1,1] -> 1, [0,0] -> 0, [1,0] -> 0, [0,1] -> 0 99 labels = [1, 0, 0, 0] 100 return input_vecs, labels 101 102 def train_and_perceptron(): 103 ''' 104 使用and真值表訓練感知器 105 ''' 106 # 創建感知器,輸入參數個數為2(因為and是二元函數),激活函數為f 107 p = Perceptron(2, f) 108 # 訓練,迭代10輪, 學習速率為0.1 109 input_vecs, labels = get_training_dataset() 110 p.train(input_vecs, labels, 10, 0.1) 111 #返回訓練好的感知器 112 return p 113 114 if __name__ == '__main__': 115 # 訓練and感知器 116 and_perception = train_and_perceptron() 117 # 打印訓練獲得的權重 118 119 # 測試 120 print (and_perception) 121 print ('1 and 1 = %d' % and_perception.predict([1, 1])) 122 print ('0 and 0 = %d' % and_perception.predict([0, 0])) 123 print ('1 and 0 = %d' % and_perception.predict([1, 0])) 124 print ('0 and 1 = %d' % and_perception.predict([0, 1]))?
正常運行的話,輸出的預測結果是這樣的:
預測: Work 3.4 years, level 2, monthly salary = 5125.02 Work 15 years, level 6, monthly salary = 20815.01?
?
由上可見,本例中兩個輸入一個輸出的線性單元擬合出來的是一個平面(因為預設的工資公式是線性的)。在旋轉一個角度后看的更清楚:
?
原文鏈接:
https://www.zybuluo.com/hanbingtao/note/448086
文章寫的很好,代碼也漂亮,墻裂推薦大家看看原文。
轉載于:https://www.cnblogs.com/hatemath/p/8472570.html
總結
以上是生活随笔為你收集整理的用线性单元(LinearUnit)实现工资预测的Python3代码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用Logstash filter gr
- 下一篇: Windows CE(C#)嵌入式应用开