Python编程及高级数据分析
一、介紹(11月22日)
小問題找函數 大問題找包
python數據分析常用的包
數據庫實現的功能的在panda包里面找
其中M\S\P是數據可視化工具
深度學習使用的包是pytorch(facebook支持)
中文的nlp:Jieba、pynlpir
英文的nlp:NLTK
學python前的準備工作
Pycharm: 是按照程序員的使用習慣設計的軟件
機器語言翻譯成人的語言可以分為:
1、編譯:一次性翻譯
2、解釋:順序翻譯,依次進行翻譯
Python是解釋性語言 C面向軟件開發 Java先編譯后解釋 先轉換成class。
Pip和conda是兩個服務器:pip是python專用的 pip來源于pip.org
Conda包含多種通用包
兩個都會使用 pip位于國外 安裝會很慢 通常需要鏡像
Anaconda 的兄弟是miniconda(占用內存較小)
門戶:Anaconda Navigator(將上面四個功能同一在一起) 在數據分析領域最受歡迎的平臺
Jupyter注意事項:cs結構 browser-server (和Tomcat很像)
1、 包含browser端和server端(一臺電腦既是服務器又是瀏覽器)
2、 所有標點符號都是英文
3、 英文大小寫要注意好
4、 縮進要正確
常用快捷鍵
常用的編譯的快捷鍵
高質量python代碼
1、優雅 高效 明確
2、Zen:禪
3、PEP8:PYTHON ENHANCE PRESENTATION8
4、基于Guido’s python Style Guide
數據類型
記憶方式:
括號前有單詞就是函數 沒有單詞就是元組
查看數據類型:Type()
容器:
1、中括號(多個整數 列表)
2、小括號(元組)
3、大括號(集合(只有數字)、字典(帶有索引的;既有key 又有value; 包括很多眼睛))
Int float bool string list tuple set dict 說明:單雙引號作用相同
說明:
1 int
‘1’ \“1” string
[1] list
(1) tuple
{1} set
{‘a’:1} dict
判斷數據類型
Isinstance(a,b) 對a進行判斷 是否是符合b類型的變量
bool是整型的子類 繼承了整型的 true=1 false=0
數據類型轉換
int(1.6) 目標數據類型(目標數據)
特殊數據類型
None 缺失值
NotImplemented:函數沒有實現
Ellipsis:
函數:print() 可以對函數進行參數的調整
help(函數名)=?函數名:查看函數使用說明
內置函數 python的解釋器 kernel里面內嵌的函數
當函數有問題的時候 可以通過help調參進行修改(tips:Arguments:參數)
例子
x=1
y=2
Print(x, end=”……”) # end默認“\n“
Print(y)
output x…y
4.5序列類型
[2,1] 和 [1,2] 是不同的列表
切片 a[1:4:2] 2是步長 [] 前面有單詞是切片 沒單詞是列表
7 賦值語句
鏈式賦值語句:I=J=2
復合賦值語句: I*=8
序列的拆包式賦值: a ,b ,c=1,2,3
兩個變量值的調換
a=1
b=2
a , b=b, a
a, b
(c語言需要中間變量)
And 與和or(短路運算) 只要有一個是假的就都是假的(and) 真的就都是真的
函數
9.2內置函數
(BIF函數 built-in function 在解釋器中自帶的函數 常用c語言寫的 少部分用java寫的)
Pow(2,10) 2的十次方
Round(2.999,2)對2.999保留兩位小數
9.3 math(數學函數)
Import math
負數的運算找cmath
9.4優先級與結合方向
223 由右向左 256
(2**2)**3 64 有括號先括號
1+2 and 3+4
從右向左 到7就短路了 返回7(原因是非零是true 零是false)
10. if語句
10.1基本語法
順序、選擇
elif=else if
if 與三元運算
例子
X=0
Results=”Y” if x>0 or y>0
Import calendar
calendar.isleap(2021) #判斷是否為閏年
sum=0
for i in (1,2,3): #123循環執行
sum=sum+1
print(i,sum)
(待解決問題:惰性運算的問題)
List(range(1,10)) (list用于惰性運算)
循環問題
Break 往下跳,跳出循環 今天上午完事 你就玩完啦
Continue 往上跳,跳到循環體外面 今天上午過完 下午不做了 明天接著
二、數據加工和數據準備
三、統計學習
四、數據可視化
五、機器學習
六、圖像處理
七、nlp
八、Spark編程
九、NoSQL編程
十、數據分析方法與技能
總結
以上是生活随笔為你收集整理的Python编程及高级数据分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 没有bug队——加贝——Python 练
- 下一篇: python基础入门(9)之字典