python 识别数字字母 训练集_Python 实现训练集、测试集随机划分
隨機(jī)從列表中取出元素:
import random
dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]]
trainDataSet = random.sample(dataSet, 3)
以下函數(shù),使用于我最近的一個機(jī)器學(xué)習(xí)的項目,將數(shù)據(jù)集數(shù)據(jù)按照比例隨機(jī)劃分成訓(xùn)練集數(shù)據(jù)和測試集數(shù)據(jù):
import csv
import random
def getDataSet(proportion):
"""
:exception
獲取訓(xùn)練集和測試集(將數(shù)據(jù)按比例隨機(jī)劃分)
:parameter
proportion - 測試集/數(shù)據(jù)集
:return
trainDataSet - 訓(xùn)練集
testDataSet - 測試集
author
肖政宇
modify
2019年5月10日
"""
dataSet = open('數(shù)據(jù)集.csv')
dataSetReader = csv.reader(dataSet)
"""
:exception
將數(shù)據(jù)保存到數(shù)組
"""
dataSet = []
next(dataSetReader, 'none') # 跳過表頭
data = next(dataSetReader, 'none')
while (data != 'none'):
dataSet.append(data)
data = next(dataSetReader, 'none')
"""
:exception
按照比例隨機(jī)劃分出訓(xùn)練集和測試集
"""
dataNumber = dataSet.__len__() # 數(shù)據(jù)集數(shù)據(jù)條數(shù)
testNumber = int(dataNumber * proportion) # 測試集數(shù)據(jù)條數(shù)
testDataSet = [] # 測試數(shù)據(jù)集
trainDataSet = [] # 訓(xùn)練數(shù)據(jù)集
testDataSet = random.sample(dataSet, testNumber) # 測試集
for testData in testDataSet: # 將已經(jīng)選定的測試集數(shù)據(jù)從數(shù)據(jù)集中刪除
dataSet.remove(testData)
trainDataSet = dataSet # 訓(xùn)練集
return trainDataSet, testDataSet
以上這篇Python 實現(xiàn)訓(xùn)練集、測試集隨機(jī)劃分就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持python博客。
總結(jié)
以上是生活随笔為你收集整理的python 识别数字字母 训练集_Python 实现训练集、测试集随机划分的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mongodb添加创建修改时间_mong
- 下一篇: 安川g7接线端子图_ABB、KUKA、F