中国知网 博硕士论文 PDF下载 及书签自动生成
生活随笔
收集整理的這篇文章主要介紹了
中国知网 博硕士论文 PDF下载 及书签自动生成
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
0. 用到的工具
覺得過程麻煩的可以看淘寶店鋪 文檔處理中心
1. 下載PDF格式的博碩士論文
我傾向于使用網(wǎng)站1,能直接獲取符合AutoBookMark Pro格式要求的目錄,而且能用Zotero添加參考文獻(xiàn)條目。
網(wǎng)站1:中國知網(wǎng)海外版2. 爬取目錄
Python爬蟲,程序如下。不會Python的可以評論留郵箱有exe可執(zhí)行文件;覺得用exe文件也麻煩的可以看淘寶店鋪 文檔處理中心
# Python 3.6.2 import requests from bs4 import BeautifulSoupimport os import win32api, win32con #獲取桌面位置def get_desktop(): # D:\桌面key = win32api.RegOpenKey(win32con.HKEY_CURRENT_USER,r'Software\Microsoft\Windows\CurrentVersion\Explorer\Shell Folders', 0, win32con.KEY_READ)return win32api.RegQueryValueEx(key,'Desktop')[0]def get_gb(url): #滿足格式的目錄內(nèi)容headers = {"Host":"gb.oversea.cnki.net","User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:65.0) Gecko/20100101 Firefox/65.0","Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8","Accept-Language":"zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2","Accept-Encoding":"gzip, deflate","DNT":"1","Connection":"keep-alive","Upgrade-Insecure-Requests":"1"}print('\n開始訪問網(wǎng)頁...')response = requests.get(url, headers=headers) # 發(fā)送get請求。使用headers以避免訪問受限 soup = BeautifulSoup(response.content, 'html.parser') #得到 soup對象 ,后面的參數(shù)是關(guān)于格式的### 得到目錄文字results1 = soup.find_all('a', attrs = {'class':'RollLink'} ) # 目錄所在標(biāo)簽catalog = [] #目錄for res1 in results1:strx = res1.get_text() #目錄文字(自帶縮進(jìn))#print(strx.replace('\r\n', ''))catalog.append(strx.replace('\r\n', '').replace('\xa0', ' ') )#print(catalog)### 得到頁碼results2 = soup.find_all('td', attrs = {'width':'100'} ) # 頁碼所在標(biāo)簽pages = [] #目錄for res2 in results2:page = res2.get_text() #頁碼文字("14-43")("起始頁-結(jié)束頁")#print(page)page_list = page.split("-") #['14', '43']pages.append(page_list[0].replace('\r\n', ''))#print(pages)print('已從網(wǎng)頁得到目錄和頁碼')return catalog, pagesdef save(catalog, pages):desk_path = get_desktop()file_path = os.path.join(desk_path, 'PDF目錄.txt')with open(file_path, 'w') as f: # 寫方式打開一個文本; 沒有指定'utf-8',默認(rèn)為'ANSI'for i in range(len(catalog)):each = catalog[i] + ',' + pages[i] + '\n'f.write(each)print('\n已生成目錄文件, 請查看 {}'.format(file_path))print('接下來可通過 “Acrobat-增效工具-BookMarks-Creat From Text Files” 實現(xiàn)自動創(chuàng)建PDF書簽。')if __name__ == '__main__':address = 'http://gb.oversea.cnki.net/kcms/download.aspx?filename=2dSRzKh10StlnNxkXVwUjW1QTVOlGV4cVVjlWcWNHcjRTYtRHdvNEclZlR3sySxc1U5wEcr5mSlVmZ=0TSuh2NOZVS4oVehVndilzURZFVj9iM48mRIZDdppmQyFUeK52a1ZTbthXajJjbDljRpt0dZ5kTPt&dflag=catalog&tablename=CDFD0911&cflag=pdf'address = input('右擊粘貼CNKI分章下載目錄頁的網(wǎng)址>>>')catalog, pages = get_gb(address)save(catalog, pages)3. 在PDF中創(chuàng)建書簽
下載的pdf格式論文中是沒有書簽的,不方便查看。
2. 增效工具-Bookmarks-Creat From Text File…,選擇第2步中得到的目錄文件“D:\桌面\PDF目錄.txt”,確定即可自動生成書簽,點擊可跳轉(zhuǎn)。
總結(jié)
以上是生活随笔為你收集整理的中国知网 博硕士论文 PDF下载 及书签自动生成的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 在Centos操作系统下安装mysql8
- 下一篇: 通过Centos7搭建PXE安装Wind