PageCache
Rev.14を表示中。最新版はこちら。
1. 概要
LinuxのディスクキャッシュはPageCacheとして実装されている。PageCacheはストレージ上のファイルをキャッシュする(*1)。PageCacheはファイルの先頭から物理ページサイズ単位に区切ってページ単位にキャッシュする。このため、"Page"Cacheと呼ばれる。
ファイルのRead/WriteはPageCacheを経由する。
(*1) 同じようなディスクキャッシュとしてBufferがある。Bufferはファイルではなくディスクブロックをキャッシュする。こちらはi-nodeなどのディスク上のメタデータなどをブロックリードする時などに使用される。
2. PageCacheの管理方法
2.1 address_space構造体
PageCacheはstruct address_space (*1)を元に管理される。
図1にページキャッシュがどのように管理されるかを示す。
- address_spaceはi-node単位に存在し、i-nodeに対応するファイル/ディレクトリのページキャッシュを管理する。
- address_spaceはRadixTreeを持ちここにキャッシュしたページを登録して管理している。
- RadixTreeのキーはaddress space内でのオフセット(ページ数)(*2)。よって、オフセットから高速にキャッシュを検索できる。
- 1.〜3.より、ページキャッシュはinode(正確にはaddress space)とファイル先頭からのオフセット(ページ数)でユニークに識別される。
(*2) i-nodeがブロックデバイスの場合はaddress spaceはデバイス全体を指すのでデバイス先頭からのページ数になる。
図1 PageCacheの構造
以下は図1に関する補足。
- inodeのi_mappingは、このinodeに対応するaddress_spaceを指す。
- address_spaceのhostはinodeを指す。ブロックデバイスだった場合は、ブロックデバイスのinodeを指している。
- page_treeはPageCacheであるRadixTreeへのポインタ。
- RadiXTreeにはページオフセットをキーにpage構造体が登録されている。
- pageのmappingは属しているaddress_spaceを指す(つまりinodeのaddress_space)。
- indexはファイル先頭からのオフセットでファイルの何処をキャッシュしているかを示している。
- pageに該当する物理ページにindexが指しているファイルの内容がキャッシュされている。
2.2 LRUリスト
address_spaceに登録されたページはLRUリスト(Active/Inactiveリスト)にも登録される。最初はInactiveリストに登録される。
3. 関連関数
find_or_create_page()
PageCacheに新規ページを割り当てる。
割り当てたPageCacheはRadixTreeとLRUリストに登録される。LRUリストはInactiveリストの方につながれる。
find_or_create_page() -> add_to_page_cache_lru() -> lru_cache_add() -> __pagevec_lru_add() -> add_page_to_inactive_list() - Inactiveリストへ登録
find_or_create_page() -> add_to_page_cache_lru() -> lru_cache_add() -> __pagevec_lru_add() -> add_page_to_inactive_list() - Inactiveリストへ登録
find_get_page(mapping, offset)
PageCacheの検索ルーチン
mappingのoffsetページをキャッシュしているPageCacheを検索する。
mappingのoffsetページをキャッシュしているPageCacheを検索する。
mapping->page_treeのRadixTreeからoffset(ページ数)でPageCacheを検索
add_to_page_cache()
PageCacheにページを追加する。
RadixTreeへの追加のみで、LRUリストには追加されない。
RadixTreeへの追加のみで、LRUリストには追加されない。
pageにはPG_lockedがセットされる。
add_to_page_cache_lru()
add_to_page_cache()を呼んで、RadixTreeにページを登録してLRUリストにも登録する。
remove_from_page_cache()
mark_page_accessed(page)
ページにアクセスがあった場合に呼び出される。
pageがInactiveリストに入っていたら、Activeリストに移動する。Activeリストに入っていたらPG_referencedを立てておく。
pageがInactiveリストに入っていたら、Activeリストに移動する。Activeリストに入っていたらPG_referencedを立てておく。
[フラグ]
PG_uptodate
ページにデータが読みこまれてキャッシュが最新の状態になるとSetPageUptodate()で設定する。
mpage_end_io_read()参照。
mpage_end_io_read()参照。
[関連ページ]
物理ページ管理