原始语料库
第一步:
判斷數(shù)據(jù)中是否存在重復(fù)數(shù)據(jù)
創(chuàng)建python文件–
代碼框架
''' author: kzb time: 2018-12-10 '''import pandas as pd import os,csvdataPath = os.path.join("音譯原始數(shù)據(jù).csv")def import_data(dataPath):'''導(dǎo)入文件中的數(shù)據(jù)return:dataFrame'''passdef find_En_Cn_excess(dataFrame):'''查出EnName、CnName列中存在多余數(shù)據(jù)的項(xiàng)例如:“Abaagu,”、“阿布(教名Abijah、Able、Abner、Absalom的昵稱)”param:dataFramereturn:dataFrame'''passdef write_to_file(dataFrame):'''將數(shù)據(jù)寫入文件中param:dataFrame'''passdef main():'''程序入口'''passif __name__ == '__main__':main()總結(jié)
- 上一篇: pandas库简单入门
- 下一篇: 我自定义的常用方法