【Python】pip工具使用知识,模型保存pickle,PDF与docx相互转换处理
2022年第01周。
這一周的Python語言學習,記錄如下。
01
pip工具使用知識
1 pip是什么?
pip是一個用Python寫的用于安裝和管理包的包管理系統。它連接一個叫做Python Package Index的在線公共包存儲庫。它通過配置,也可以連接其它包庫。
2 pip使用知識
2.1 安裝包
常用命令
pip?install?some-package-name若需要指定特定的版本安裝
pip?install?some-package-name==1.2.2?--force-reinstallforce-reinstall用于指示重新安裝指定版本的包。
也可以指定版本的范圍安裝
pip?install?some-package-name>=1.3.0,<1.4.0?--force-reinstall2.2 卸載包
卸載包很容易,執行如下操作
pip?uninstall?some-package-name2.3 從Python工作環境的requirement.txt的文件安裝包
例如,我們有一個Python工作環境的requirement.txt文件。
pandas==1.2.5 numpy==1.21.1安裝這些包
pip?install?-r?requirement.txt2.4 如何生成requirement.txt文件
我們進入自己的Python工作環境,使用如下命令,獲取工作環境的配置包文件
pip?freeze?>?requirement.txt2.5 獲取已經安裝包的信息
我們想知道已經安裝了那些Python包
pip?list進一步,結合grep命令,搜索到你感興趣包的是否安裝。
pip?list?|?grep?pandas2.6 了解包更詳細信息
我們想了解包更詳細的信息
pip?show?some-package-name2.7 檢查包之間兼容問題
我們想了解包之間兼容的信息
pip?check02
模型保存為pickle
1 pickle是什么?
pickle是Python中序列化對象的標準方式。
我們可以使用pickle操作來序列化機器學習模型,并將序列化的格式保存到一個文件中。以后,我們可以加載這個文件來反序列化模型,用它來做新的預測。
2 代碼演示
我們基于一份公開的糖尿病發病數據集,構建邏輯回歸模型,并保存模型,后來加載模型,用于新樣本的預測。
import?os import?pandas?as?pdfrom?sklearn.model_selection?import?train_test_split from?sklearn.linear_model?import?LogisticRegression from?sklearn.metrics?import?accuracy_scoreimport?pickle import?warnings warnings.filterwarnings('ignore')url?=?"https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names?=?['preg',?'plas',?'pres',?'skin',?'test',?'mass',?'pedi',?'age',?'class'] dataframe?=?pd.read_csv(url,?names=names) array?=?dataframe.values X?=?array[:,0:8] y?=?array[:,8]test_size?=?0.33 seed?=?7 #?數據計劃分 X_train,?X_test,?y_train,?y_test?=?train_test_split(X,?y,?test_size=test_size,?random_state=seed)#?擬合模型 model?=?LogisticRegression() model.fit(X_train,?Y_train)#?模型保存 model_folder?=?'./model/' if?not?os.path.exists(model_folder):os.makedirs(model_folder)filename?=?model_folder?+?'LR_2022_week1_finalized_model.sav' pickle.dump(model,?open(filename,?'wb'))#?加載模型 loaded_model?=?pickle.load(open(filename,?'rb'))#?模型的效果分析 pred_result?=?loaded_model.predict(X_test)model_result?=?accuracy_score(y_test,?pred_result)print(round(model_result,?2))運行結果
0.7903
pdf與docx互相轉換操作
1 簡介
pdf和docx是兩種常用的格式文件,如何用Python實現彼此的轉換?我們可以使用pdf2docx和docx2pdf兩個包來做這個有趣的事情。
2 安裝庫
執行如下命令
pip?install?pdf2docx pip?install?docx2pdf若是已經安裝,請忽略
3 pdf轉換為docx示范
pdf文件全部頁面轉換為docx
方法一:
#?方法1 from?pdf2docx?import?Converterpdf_file?=?'./file/sample.pdf' docx_file?=?'./file/sample.docx'cv?=?Converter(pdf_file) cv.convert(docx_file) cv.close()方法二:
#?方法2 from?pdf2docx?import?parsepdf_file?=?'./file/sample.pdf' docx_file?=?'./file/sample2.docx'parse(pdf_file,?docx_file)pdf文件部分頁面轉換為docx
#?指定單獨PDF頁面轉化為docx from?pdf2docx?import?Converterpdf_file?=?'./file/sample.pdf' docx_file?=?'./file/sample2.docx'pages_list?=?[0]cv?=?Converter(pdf_file) cv.convert(docx_file,?pages=pages_list) cv.close()4 docx轉換為pdf示范
docx文件轉換為pdf
from?docx2pdf?import?convertdocx_file?=?'./file/input.docx' pdf_file?=?'./file/output.pdf'convert(docx_file,?pdf_file)關于pdf和docx相互轉換操作,你有什么問題,請掃描文末二維碼,添加我微信,一起討論。
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載黃海廣老師《機器學習課程》視頻課黃海廣老師《機器學習課程》711頁完整版課件
本站qq群955171419,加入微信群請掃碼:
總結
以上是生活随笔為你收集整理的【Python】pip工具使用知识,模型保存pickle,PDF与docx相互转换处理的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android平台Camera2数据如何
- 下一篇: win7打不开qq文件怎么办