資源描述:
《Linux內(nèi)存管理詳解.docx》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、13.?內(nèi)存管理13.1.?引言Linux對(duì)物理內(nèi)存的描述機(jī)制有兩種:UMA和NUMA。Linux把物理內(nèi)存劃分為三個(gè)層次來(lái)管理:存儲(chǔ)節(jié)點(diǎn)(Node)、管理區(qū)(Zone)和頁(yè)面(Page)。UMA對(duì)應(yīng)一致存儲(chǔ)結(jié)構(gòu),它只需要一個(gè)Node就可以描述當(dāng)前系統(tǒng)中的物理內(nèi)存,但是NUMA的出現(xiàn)打破了這種平靜,此時(shí)需要多個(gè)Node,它們被統(tǒng)一定義為一個(gè)名為discontig_node_data的數(shù)組。為了和UMA兼容,就將描述UMA存儲(chǔ)結(jié)構(gòu)的描述符contig_page_data放到該數(shù)組的第一個(gè)元素中。內(nèi)核配置選項(xiàng)CONFIG_NUMA決定了當(dāng)前系統(tǒng)
2、是否支持NUMA機(jī)制。此時(shí)無(wú)論UMA還是NUMA,它們都是對(duì)應(yīng)到一個(gè)類型為pg_data_t的數(shù)組中,便于統(tǒng)一管理。圖?71.?NodeZone和Page的關(guān)系上圖描述Linux管理物理內(nèi)存的三個(gè)層次之間的拓?fù)潢P(guān)系。從圖中可以看出一個(gè)存儲(chǔ)節(jié)點(diǎn)由pg_data_t描述,一個(gè)UMA系統(tǒng)中只有一個(gè)Node,而在NUMA中則可以存在多個(gè)Node。它由CONFIG_NODES_SHIFT配置選項(xiàng)決定,它是CONFIG_NUMA的子選項(xiàng),所以只有配置了CONFIG_NUMA,該選項(xiàng)才起作用。UMA情況下,NODES_SHIFT被定義為0,MAX_NUM
3、NODES也即為1。include/linux/numa.h#ifdefCONFIG_NODES_SHIFT#defineNODES_SHIFTCONFIG_NODES_SHIFT#else#defineNODES_SHIFT0#endif#defineMAX_NUMNODES(1<
4、[0]};EXPORT_SYMBOL(contig_page_data);structpglist_data即是pg_data_t的原型。了解pg_data_t中的結(jié)構(gòu)成員對(duì)于了解內(nèi)存管理是必經(jīng)之路:enumzone_type{ZONE_DMA,ZONE_NORMAL,ZONE_MOVABLE,......__MAX_NR_ZONES};typedefstructpglist_data{structzonenode_zones[MAX_NR_ZONES];structzonelistnode_zonelists[MAX_ZONELISTS]
5、;intnr_zones;#ifdefCONFIG_FLAT_NODE_MEM_MAP/*means!SPARSEMEM*/structpage*node_mem_map;#ifdefCONFIG_CGROUP_MEM_RES_CTLRstructpage_cgroup*node_page_cgroup;#endif#endifstructbootmem_data*bdata;....../*forCONFIG_MEMORY_HOTPLUG*/unsignedlongnode_start_pfn;unsignedlongnode_prese
6、nt_pages;/*totalnumberofphysicalpages*/unsignedlongnode_spanned_pages;/*totalsizeofphysicalpagerange,includingholes*/intnode_id;wait_queue_head_tkswapd_wait;structtask_struct*kswapd;intkswapd_max_order;}pg_data_t;·node_zones:當(dāng)前節(jié)點(diǎn)中包含的最大管理區(qū)數(shù)。MAX_NR_ZONES在include/linux/bounds
7、.h定義,該文件是在編譯過(guò)程中根據(jù)管理區(qū)類型定義中的__MAX_NR_ZONES變量自動(dòng)生成的?!ode_zonelists:內(nèi)存分配器所使用的管理區(qū)鏈表數(shù)組,MAX_ZONELISTS的值在配置CONFIG_NUMA時(shí)為2,否則為1。索引為0的鏈表表示后援(Fallback)鏈表,也即當(dāng)該鏈表中的第一個(gè)不滿足分配內(nèi)存時(shí),依次嘗試鏈表的其他管理區(qū)。索引為1,的鏈表則用來(lái)針對(duì)GFP_THISNODE的內(nèi)存申請(qǐng),此時(shí)只能申請(qǐng)指定的該鏈表中的管理區(qū)?!r_zones:指定當(dāng)前節(jié)點(diǎn)中的管理區(qū)數(shù),也即node_zones中實(shí)際用到的管理區(qū)數(shù)。它的
8、取值范圍為[1,MAX_NR_ZONES]。對(duì)于UMA來(lái)說(shuō),它的值為1?!ode_mem_map:節(jié)點(diǎn)中頁(yè)描述符數(shù)組首地址?!ode_page_cgroup:·bdata:系