Python | 实现pdf文件分页
不知道大家有沒有遇到過這么一種情況,就比如一個pdf格式的電子書,我們經常瀏覽的是其中的一部分,而這電子書的頁數很大,每當需要瀏覽時,就需要翻到對應的頁碼,就有點兒繁瑣。
還有一些情況,比如,我們想分享pdf文件里的部分內容給別人,我們也需要用到pdf分頁,不僅可以分析指定內容,而且也可以減少發送文件的大小O(∩_∩)O哈哈~
總之,pdf的分頁,我們在現實生活中,是難免會遇到的事。當你遇到時,你是怎么解決的呢?
在Python中,實現pdf分頁,是及其簡單的,只需要運行幾行代碼,即可實現,不管你的pdf文件有多大,下面讓我們一起看看吧~
注:每部分代碼的作用,我都注釋在了代碼后面,注意查看喔~
其實最主要的代碼就下面的幾行:
pdf = PdfFileReader(path) # 讀取pdf pdf_writer = PdfFileWriter() # pdf寫入對象 for page in range(page_start, page_end): # 需要分割的pdf頁數區間pdf_writer.addPage(pdf.getPage(page)) # pdf頁數讀取,存于內存,并未開始寫入 with open(output_name, 'wb') as output_pdf:pdf_writer.write(output_pdf) # 開始寫入指定頁數區間的pdf我只是在其基礎上增加了一些異常錯誤捕獲并解決的代碼,并實現代碼的循環利用,而不是只針對于一個pdf文件。
代碼使用展示:
1.源文件
書的頁數還是挺大的
2.目標頁數區間
注意,雖然這里的頁碼是271,但并不代表就是271,因為讀取的pdf文件頁碼是整個文件的頁碼,就比如書的封面,目錄的頁數也得包含進去。
所以,我們可以簡單算一下,書的頁碼第一頁與到封面差了幾頁,我這里差的是13頁,所以就是271+13=284作為分割起始頁,需要截取的頁數對應書上的頁碼是276,276+13=289,所以終止頁就是289了
3.代碼運行
4.異常捕獲的代碼展示:
輸入的起始頁小于1:
pdf頁碼一共才600頁,然后輸入了終止頁為700:
5.其它
要求的是區間,但你可以輸入1 1,1:
代碼還可以繼續完善,感興趣的小伙伴可以開動開動一下自己聰明的腦袋瓜子haha
總結
以上是生活随笔為你收集整理的Python | 实现pdf文件分页的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: DataCleaner(4.5)第一章
- 下一篇: 康纳的表情包(思维)