《数据驱动安全:数据安全分析、可视化和仪表盘》一2.3 数据帧介绍
本節書摘來華章計算機《數據驅動安全:數據安全分析、可視化和儀表盤》一書中的第2章 ,第2.3節,[美]杰·雅克布(Jay Jacobs)鮑布·魯迪斯(Bob Rudis) 著 薛杰 王占一 張卓 胡開勇 蔣夢飏 趙爽 譯, 更多章節內容可以訪問云棲社區“華章計算機”公眾號查看。
2.3 數據幀介紹
如果了解其他編程語言,一定會對通用的數據類型有一些基本認識,例如字符串、整型以及數組。R和Python提供了標準的數據類型集合,它們有一個共同的數據類型:數據幀,它給予R和Python強大的功能。從表面上看,數據幀僅僅是表現表格數據(標準的Excel電子表格中展示的數據類型)的一種方法,并且看上去像是二維數組。然而,如果深入剖析,就會發現數據幀是數據庫表、矩陣、二維數組以及具有許多額外的省時特性的數據透視表的一體化組合。
像數據庫表,每列在數據幀中有一個列名并擁有相同類型的數據元素。你可以在全列、全行以及各列/行子集中執行操作。增加、合并、扁平、擴展、修改、刪除以及查找等針對數據的操作在R和Python中都只需要執行一行命令,就像從文件中讀出或寫入數據一樣。從本質上看,Python和R通過將這種理解力融合進數據結構和相應的函數以獲得了這項有表現力的功能。相反,其他編程語言缺少這種復雜的數據結構,這意味著你需要自己編寫代碼來建立自己的數據結構以獲得相似的功能。
下面的代碼(程序清單2-1和程序清單2-2)分別提供了關于R和Python中數據幀操作的概述,但是仍強烈建議在進入第3章之前閱讀上述內容的資源。正如在前言中所指出的,可以在本書相應的網站(www.wiley.com/go/datadrivensecurity)獲得代碼。
程序清單2-1
程序清單2-2
對于大多數分析項目,數據幀是R和Python的核心數據結構。它使開發者專注于用數據來做什么而不是如何做。這是特定領域編程語言和通用編程語言的主要區別之一。如果你曾經對轉向使用R或Python進行數據分析表示觀望,希望這個關于每種語言能力的簡單介紹能夠說服你。
總結
以上是生活随笔為你收集整理的《数据驱动安全:数据安全分析、可视化和仪表盘》一2.3 数据帧介绍的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Vijos P1103 校门外的树【线段
- 下一篇: 运维调试记录:Opendaylight铍