當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

F2FS源码分析-2.3 [F2FS 读写部分] F2FS的一般文件读流程分析

發布時間：2023/12/8 编程问答 29 豆豆

生活随笔收集整理的這篇文章主要介紹了 F2FS源码分析-2.3 [F2FS 读写部分] F2FS的一般文件读流程分析小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

F2FS源碼分析系列文章

主目錄

一、文件系統布局以及元數據結構

二、文件數據的存儲以及讀寫

F2FS文件數據組織方式

一般文件寫流程

一般文件讀流程

目錄文件讀流程(未完成)

目錄文件寫流程(未完成)

三、文件與目錄的創建以及刪除(未完成)

四、垃圾回收機制

五、數據恢復機制

六、重要數據結構或者函數的分析

F2FS的讀流程

讀流程介紹

F2FS的讀流程包含了以下幾個子流程:

vfs_read函數

generic_file_read_iter函數: 根據訪問類型執行不同的處理

generic_file_buffered_read: 根據用戶傳入的文件偏移，讀取尺寸等信息，計算起始位置和頁數，然后遍歷每一個page，通過預讀或者單個讀取的方式從磁盤中讀取出來

f2fs_read_data_page&f2fs_read_data_pages函數: 從磁盤讀取1個page或者多個page

f2fs_mpage_readpages函數: f2fs讀取數據的主流程

第一步的vfs_read函數是VFS層面的流程，下面僅針對涉及F2FS的讀流程，且經過簡化的主要流程進行分析。

generic_file_read_iter函數

這個函數的作用是處理普通方式訪問以及direct方式訪問的讀行為，這里僅針對普通方式的讀訪問進行分析:

ssize_t generic_file_read_iter(struct kiocb *iocb, struct iov_iter *iter) {size_t count = iov_iter_count(iter); // 獲取需要讀取的字節數ssize_t retval = 0;if (!count)goto out;if (iocb->ki_flags & IOCB_DIRECT) { // 處理direct方式的訪問，這里不做介紹...}retval = generic_file_buffered_read(iocb, iter, retval); // 進行普通的讀訪問 out:return retval; }

generic_file_buffered_read函數

在介紹這兩個之前，需要先介紹一種VFS提高讀取速度的機制: 預讀(readahead)機制。它的核心原理是，當用戶訪問page 1，系統就會將page 1后續的page 2，page 3，page 4一起讀取到page cache(減少與磁盤這種速度慢設備的交互次數，提高讀性能)。之后用戶再連續讀取page 2，page 3，page 4時，由于已經讀取到內存中，因此可以快速地返回給用戶。

generic_file_buffered_read函數的主要作用是循環地從磁盤或者內存讀取用戶需要的page，同時也會在某些情況調用page_cache_sync_readahead函數進行預讀，由于函數比較復雜，且很多goto語句，簡化后的步驟如下:

情況1: 預讀(readahead)機制成功預讀到用戶需要接下來訪問的page

ind_get_page: 系統無法在cache中找到用戶需要的page

page_cache_sync_readahead: 系統執行該函數進行預讀，一次性讀取多個page

find_get_page: 再重新在cache獲取一次page，獲取成功后跳轉到page ok區域

page_ok: 復制page的數據去用戶傳入的buffer中，然后判讀是否為最后一個page，如果是則退出讀流程

情況2: 預讀(readahead)機制錯誤預讀到用戶需要接下來訪問的page

find_get_page: 系統無法在cache中找到用戶需要的page

page_cache_sync_readahead: 系統執行該函數進行預讀，一次性讀取多個page

find_get_page: 再重新在cache獲取一次page，獲取失敗，跳轉到no_cached_page區域

no_cached_page: 創建一個page cache結構，加入到LRU后，跳轉到readpage區域

readpage: 執行mapping->a_ops->readpage函數從磁盤讀取數據，成功后跳轉到page ok區域

page_ok: 復制page的數據去用戶傳入的buffer中，然后判讀是否為最后一個page，如果是則退出讀流程。

static ssize_t generic_file_buffered_read(struct kiocb *iocb,struct iov_iter *iter, ssize_t written) {index = *ppos >> PAGE_SHIFT; // 文件指針偏移*ppos除以page的大小就是頁偏移indexprev_index = ra->prev_pos >> PAGE_SHIFT;prev_offset = ra->prev_pos & (PAGE_SIZE-1);last_index = (*ppos + iter->count + PAGE_SIZE-1) >> PAGE_SHIFT;offset = *ppos & ~PAGE_MASK;for (;;) { find_page:page = find_get_page(mapping, index); // 根據頁偏移index從cache獲取pageif (!page) { // 獲取失敗進行一次預讀page_cache_sync_readahead(mapping, ra, filp,index, last_index - index);page = find_get_page(mapping, index); // 預讀后再從cache獲取pageif (unlikely(page == NULL)) // 如果仍然失敗則跳轉到no_cached_page，成功則直接去page ok區域goto no_cached_page;} page_ok: // page數據讀取成功后都進入這個區域，用于將數據復制到用戶傳入的buffer中isize = i_size_read(inode);end_index = (isize - 1) >> PAGE_SHIFT;nr = PAGE_SIZE;if (index == end_index) { // 如果到了最后一個index就退出循環nr = ((isize - 1) & ~PAGE_MASK) + 1;if (nr <= offset) {put_page(page);goto out;}}nr = nr - offset;ret = copy_page_to_iter(page, offset, nr, iter); // 復制用戶數據到buffer中offset += ret;index += offset >> PAGE_SHIFT;offset &= ~PAGE_MASK;prev_offset = offset;put_page(page);written += ret;if (!iov_iter_count(iter)) // 如果將所有數據讀取完畢后退出循環goto out;if (ret < nr) {error = -EFAULT;goto out;}continue; readpage:ClearPageError(page);error = mapping->a_ops->readpage(filp, page); // 去磁盤進行讀取goto page_ok; no_cached_page:page = page_cache_alloc(mapping); // 創建page cacheerror = add_to_page_cache_lru(page, mapping, index,mapping_gfp_constraint(mapping, GFP_KERNEL)); // 加入lrugoto readpage;} out:ra->prev_pos = prev_index;ra->prev_pos <<= PAGE_SHIFT;ra->prev_pos |= prev_offset;*ppos = ((loff_t)index << PAGE_SHIFT) + offset;file_accessed(filp);return written ? written : error; }

預讀函數page_cache_sync_readahead的分析由于篇幅有限無法全部展示，因此這里僅分析它的核心調用函數__do_page_cache_readahead:

unsigned int __do_page_cache_readahead(struct address_space *mapping,struct file *filp, pgoff_t offset, unsigned long nr_to_read,unsigned long lookahead_size) {end_index = ((isize - 1) >> PAGE_SHIFT); // 得到文件的最后一個頁的頁偏移indexfor (page_idx = 0; page_idx < nr_to_read; page_idx++) { // nr_to_read是需要預讀的page的數目pgoff_t page_offset = offset + page_idx; // offset表示從第幾個page開始預讀if (page_offset > end_index) // 預讀超過了文件大小就退出break;page = __page_cache_alloc(gfp_mask); // 創建page cachepage->index = page_offset; // 設置page indexlist_add(&page->lru, &page_pool); // 將所有預讀的page加入到一個list中nr_pages++;}if (nr_pages)read_pages(mapping, filp, &page_pool, nr_pages, gfp_mask); // 執行預讀BUG_ON(!list_empty(&page_pool)); out:return nr_pages; }static int read_pages(struct address_space *mapping, struct file *filp,struct list_head *pages, unsigned int nr_pages, gfp_t gfp) {struct blk_plug plug;unsigned page_idx;int ret;blk_start_plug(&plug);if (mapping->a_ops->readpages) {ret = mapping->a_ops->readpages(filp, mapping, pages, nr_pages); // 執行readpages函數進行預讀put_pages_list(pages);goto out;}ret = 0;out:blk_finish_plug(&plug);return ret; }

f2fs_read_data_page&f2fs_read_data_pages函數

從上一節可以知道，當預讀機制會調用mapping->a_ops->readpages函數一次性讀取多個page。而當預讀失敗時，也會調用mapping->a_ops->readpage讀取單個page。這兩個函數在f2fs中對應的就是f2fs_read_page和f2fs_read_pages，如下所示:

static int f2fs_read_data_page(struct file *file, struct page *page) {struct inode *inode = page->mapping->host;int ret = -EAGAIN;trace_f2fs_readpage(page, DATA);if (f2fs_has_inline_data(inode)) // inline文件使用特定的讀取方法，這里暫不分析ret = f2fs_read_inline_data(inode, page);ret = f2fs_mpage_readpages(page->mapping, NULL, page, 1); // 讀取1個pagereturn ret; }static int f2fs_read_data_pages(struct file *file,struct address_space *mapping,struct list_head *pages, unsigned nr_pages) {struct inode *inode = mapping->host;struct page *page = list_last_entry(pages, struct page, lru);trace_f2fs_readpages(inode, page, nr_pages);if (f2fs_has_inline_data(inode)) // inline文件是size小于1個page的文件，因此不需要進行預讀，直接return 0return 0;return f2fs_mpage_readpages(mapping, pages, NULL, nr_pages); // 讀取nr_pages個page }

f2fs_mpage_readpages函數

無論是f2fs_read_page函數還是f2fs_read_pages函數，都是調用f2fs_mpage_readpages函數進行讀取，區別僅在于傳入參數。f2fs_mpage_readpages的定義為:

static int f2fs_mpage_readpages(struct address_space *mapping,struct list_head *pages, struct page *page, unsigned nr_pages);

第二個參數表示一個鏈表頭，這個鏈表保存了多個page，因此需要寫入多個page的時候，就要傳入一個List。
第三個參數表示單個page，在寫入單個page的時候，通過這個函數寫入。
第四個參數表示需要寫入page的數目。

因此
在寫入多個page的時候，需要設定第二個參數，和第四個參數，然后設定第三個參數為NULL。
在寫入單個page的時候，需要設定第三個參數，和第四個參數，然后設定第二個參數為NULL。

然后分析這個函數的執行流程:

遍歷傳入的page，得到每一個page的index以及inode

將page的inode以及index傳入 f2fs_map_blocks 函數獲取到該page的物理地址

將物理地址通過 submit_bio 讀取該page在磁盤中的數據

static int f2fs_mpage_readpages(struct address_space *mapping,struct list_head *pages, struct page *page,unsigned nr_pages) {// 主流程第一步初始化map結構，這個步驟非常重要，用于獲取page在磁盤的物理地址struct f2fs_map_blocks map;map.m_pblk = 0;map.m_lblk = 0;map.m_len = 0;map.m_flags = 0;map.m_next_pgofs = NULL;// 主流程第二步開始進行遍歷，結束條件為 nr_pages 不為空for (page_idx = 0; nr_pages; page_idx++, nr_pages--) {// 循環第一步，如果是讀取多個page，則pages不為空，從list里面讀取每一次的page結構if (pages) {page = list_entry(pages->prev, struct page, lru);list_del(&page->lru);if (add_to_page_cache_lru(page, mapping,page->index, GFP_KERNEL))goto next_page;}/*** map.m_lblk是上一個block_in_file* map.m_lblk + map.m_len是需要讀取長度的最后一個blokaddr* 因此這里的意思是，如果是在這個 map.m_lblk < block_in_file < map.m_lblk + map.m_len * 這個范圍里面，不需要map，直接將上次的blkaddr+1就是需要的地址* */// 循環第二步，如果上一次找到了page，則跳到 got_it 通過bio獲取page的具體數據if ((map.m_flags & F2FS_MAP_MAPPED) && block_in_file > map.m_lblk &&block_in_file < (map.m_lblk + map.m_len))goto got_it;// 循環第三步，使用page offset和length，通過f2fs_map_blocks獲得物理地址map.m_flags = 0;if (block_in_file < last_block) {map.m_lblk = block_in_file; // 文件的第幾個blockmap.m_len = last_block - block_in_file; // 讀取的block的長度if (f2fs_map_blocks(inode, &map, 0,F2FS_GET_BLOCK_READ))goto set_error_page;}got_it:// 循環第四步，通過map的結果執行不一樣的處理方式if ((map.m_flags & F2FS_MAP_MAPPED)) { // 如果找到了地址，則計算block_nr得到磁盤的地址block_nr = map.m_pblk + block_in_file - map.m_lblk;SetPageMappedToDisk(page);if (!PageUptodate(page) && !cleancache_get_page(page)) {SetPageUptodate(page);goto confused;}} else { // 獲取失敗了，則跳過這個pagezero_user_segment(page, 0, PAGE_SIZE);SetPageUptodate(page);unlock_page(page);goto next_page;}/*** 這部分開始用于將物理地址通過submit_bio提交到磁盤讀取數據* 由于從磁盤讀取數據是一個相對耗時的操作，* 因此顯然每讀取一個頁就訪問一次磁盤一次的方式是低效的且影響讀性能的，* 所以F2FS會盡量一次性提交多個頁到磁盤讀取數據，以提高性能。* * 這部分開始就是具體實現:* 1. 創建一個bio(最大一次性提交256個頁)* 2. 將需要讀取的頁添加到這個bio中，* ------如果bio未滿則將page添加到bio中* ------如果bio滿了立即訪問磁盤讀取* ------如果循環結束以后，bio還是未滿，則通過本函數末尾的操作提交未滿的bio。* */// 循環第五步，判斷bio裝的page是否到了設定的最大數量，如果到了最大值則先發送到磁盤if (bio && (last_block_in_bio != block_nr - 1)) { submit_and_realloc:submit_bio(READ, bio);bio = NULL;}// 循環第六步，如果bio是空，則創建一個bio，然后指定的f2fs_read_end_io進行讀取if (bio == NULL) {struct fscrypt_ctx *ctx = NULL;if (f2fs_encrypted_inode(inode) &&S_ISREG(inode->i_mode)) {ctx = fscrypt_get_ctx(inode, GFP_NOFS);if (IS_ERR(ctx))goto set_error_page;/* wait the page to be moved by cleaning */f2fs_wait_on_encrypted_page_writeback(F2FS_I_SB(inode), block_nr);}bio = bio_alloc(GFP_KERNEL,min_t(int, nr_pages, BIO_MAX_PAGES)); // 創建bioif (!bio) {if (ctx)fscrypt_release_ctx(ctx);goto set_error_page;}bio->bi_bdev = bdev;bio->bi_iter.bi_sector = SECTOR_FROM_BLOCK(block_nr); // 設定bio的sector地址bio->bi_end_io = f2fs_read_end_io;bio->bi_private = ctx;}// 循環第七步，將page加入到bio中，等待第五步滿了之后發送到磁盤if (bio_add_page(bio, page, blocksize, 0) < blocksize)goto submit_and_realloc;set_error_page:SetPageError(page);zero_user_segment(page, 0, PAGE_SIZE);unlock_page(page);goto next_page; confused: // 特殊情況進行submit bioif (bio) {submit_bio(READ, bio);bio = NULL;}unlock_page(page); next_page:if (pages)put_page(page);}BUG_ON(pages && !list_empty(pages));// 如果還有bio沒有處理，例如讀取的頁遍歷完以后，還沒有達到第五步要求的bio的最大保存頁數，就會在這里提交bio到磁盤讀取if (bio)submit_bio(READ, bio);return 0; }

總結

以上是生活随笔為你收集整理的F2FS源码分析-2.3 [F2FS 读写部分] F2FS的一般文件读流程分析的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： F2FS源码分析-5.2 [数据恢复流程
下一篇：免费下载思科CCNP 642-354考试