excel根据一列内容查找排序另一列_利用泰坦尼克生存数据讲述Excel数据分析的基本操作...
一、使用Excel做數據處理方法(博主使用的是2007版本)
打開泰坦尼克生存數據文件,文件共有12列,891行。
每一列的含義是乘客ID,生存,船艙等級,名字,性別,年齡,兄弟姐妹,父母配偶,票號,票價,船艙,登艙口1.處理缺失數值
1.1下面先說說幾種方便的填充空值的方法
(1)快速填充
雙擊單元格右下角的黑色十字向下自動填充,然后點擊右下角自動填充選項,可以選擇填充方式。
船艙這一列有許多空值,如果想要使用這一列進行后續分析就要把空值處理,在這里只用它講一下快速填充如何使用,不使用這一列進行后續分析。如果想要使用C85向上填充,直杰按住單元格右下角的十字向上拖拽就可以。
填充前
填充后
(2)智能填充-快捷鍵Ctrl+Enter
利用Ctrl選中所有空的單元格或者使用菜單欄中的查找和選擇(開始-查找和選擇-定位條件-空格)選擇所有的空值單元格,在其中一個空的單元格輸入想要數值,然后使用Ctrl+Enter鍵就能把選中的空值都填上剛才輸入的值。
(3)規律填充
例如A1是1,A2是3,想讓單元格以等差數列的方式填充,只需選中A1、A2這兩個單元格,再雙擊A2單元格右下角的十字就可以以等差數列的規律填充了。
1.2接下來就是查重
(1)Countif函數
COUNTIF(L2:L892,L2)查找L2在L列中出現幾次
COUNTIF(L$2:L2,L2)查找L2是第幾次出現
$是絕對引用,L$2表示固定第二行,$L2表示固定L這一列,假如單元格中為L$2:L2,快速填充,下一個單元格是L$2:L3,即使使用快速填充的方式,$2從第二行開始也是不會變的。
(2)篩選
選中單元格,數據-排序和篩選-篩選(高級)-將篩選結果復制到其他位置-復制到另一列-選擇不重復
(3)突出顯示
開始-條件格式-突出顯示單元格規則-重復值
1.3最后講講刪除重復值的方法
(1)選擇區域-數據-數據工具-刪除重復項
(2)排序
利用上述查重的Countif函數,計算第幾次出現,開始-編輯-排序和篩選-降序-刪除大于1的值。
1.4處理泰坦尼克生存數據中缺失值
對數據進行查看,可見數據中有許多缺失值。年齡這一列決定用平均數填充,登艙口這一列決定用眾數填充。
首先,先對年齡這一列計算平均值,使用avg函數。公式:AVERAGE(F2:F892),結果:29.69912,就按照29.7填入年齡這一列的空值里,先選中F這一列,然后快捷鍵Ctrl+G定位這一列的空值,在定位條件上選空值就可以了,在其中一個單元格輸入29.7,然后快捷鍵Ctrl+Enter就可以把年齡這一列的空值全部輸入29.7了。
然后計算登艙口中每個數值出現過幾次來計算這一列的眾數。MODE這個函數是可以計算眾數的,但是登艙口這一列不是數值型,所以可以計算這一類的S、C、Q分別出現過幾次來計算,公式COUNTIF(L$2:L$892,"S")或者COUNTIF(L$2:L$892,L2),查找登艙口S在L列中出現幾次,因為方便就直接使用快速填充看每個值出現幾次,S出現次數最多,就使用S填充這一列的空值,還是跟年齡一樣的填充方法。
(3)對于船艙這一列缺失值太多的就刪除這一列了,因為實在是無法填充,對后續分析也沒有什么幫助。而票號這一列雖然沒有缺失,但是也對后續分析無用,刪除。
2.整理數據
2.1查找、截取函數
名字這一列很長,如果想要提取需要的信息就要使用截取函數。
(1)長度
公式:LEN(D2),顯示23,表示D2有23個字符
(2)查找
公式:FIND(",",D2,1),顯示7,表示D2中“,”在第七個字符,公式中1表示從第一位開始查找
公式:FIND(".",D2,1),顯示11,表示D2中“.”在第十一個字符,公式中1表示從第一位開始查找
(3)截取
公式:LEFT(D2,L2-1),顯示Braund,截取”,”前的字符,因為姓名中有空格,所以,要用加減1控制,或者可以使用trim函數刪除空格
公式:RIGHT(D2,K2-M2-1),顯示Owen Harris,截取”.”后的字符
公式:MID(D2,L2+2,M2-L2-2),顯示Mr,截取”,”和”.”中間的字符
2.2數據調整
(1)取整
公式:ROUND(K2,0),顯示7,表示對7.25取小數點后0位數,四舍五入
還有ROUNDUP向上取、ROUNDDOWN向下取、INT取整等函數
(2)四分位
四分位數:在統計學中把所有數值由小到大排列并分成四等份,處于三個分割點位置的數值
公式:QUARTILE(K:K,3),表示k列中第三分為數,下圖分別為第三、二、一分位數
(3)IF函數
公式:IF(M2>100,"高",IF(M2>50,"中上",IF(M2>31,"中",IF(M2>8,"中下","低"))))
大于100對應高
51-100對應中上
32-50對應中
9-31對應中下
小于9對應低
公式:IF(H2>60,"老年",IF(H2>40,"中年",IF(H2>18,"青年",IF(H2>6,"少年","幼年"))))
60歲以上對應老年
41-60歲對應中年
19-40歲對應青年
7-18歲對應少年
0-6歲對應幼年
二.數據透視表
1.創建數據透視表
全選數據,按住快捷鍵Ctrl+T可以將數據轉化為表格
全選表格后選擇插入數據透視表
之后選擇數據透視表放置位置,接下來就可以操作了
2.操作數據透視表
拖動Survived這個字段到數值區,點擊右邊的黑色三角形,選擇計算類型
對Survived求和,結果為342,表示這891個乘客中有342人存活
將Sex拖到行標簽,可以看出女性存活233人,男性存活109人
也可以將Sex拖到列標簽
將Sex拖到報表篩選則可以將男女性存活單獨顯示
三.數據可視化
利用數據透視表進行數據可視化將更方便。
行標簽顯示船艙等級,列標簽顯示性別,表格名稱可以修改,如果想要修改標簽,直接在數據透視表中修改即可
點擊網格線可以設置坐標軸格式和網格線格式
網格線設置為無色或透明
設置坐標軸格式可以修改坐標軸起始點數值、逆序顯示等等,這里無需修改
點擊條形柱,可以添加數據標簽、修改圖表類型
添加數據標簽顯示、將女性的柱狀圖修改為折線圖
設置數據系列格式將女性繪制在次坐標軸
圖例格式也是可以修改的
都修改完圖表看上去很清爽
在這里主要是講述圖表的修改方式,像是這種顯示不同船艙等級的存活數量還是直接使用柱狀圖就可以了
四.總結
Excel真的很強大,以上只是簡述了使用Excel做數據分析常用的功能,還有很多函數、功能沒有介紹有待發現,以后Excel使用多了自然會有所收獲。
總結
以上是生活随笔為你收集整理的excel根据一列内容查找排序另一列_利用泰坦尼克生存数据讲述Excel数据分析的基本操作...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python版本升级和系统更新下载安装_
- 下一篇: amd一键超频怎么用_头条信息流“一键起