概要について分かりやすく記載されていた
並列計算のチューニング - NUMA -
2ソケット以上の構成になると、それぞれのCPUがローカルのメモリを管理するようになる。
プログラムから見ると同じ「メモリ」なのだが、どのCPUが管理しているメモリなのかによって、メモリのアクセス速度は異なる。
スレッドが実行されているCPU自身が管理しているメモリへのアクセスは高速だが、
他のCPUが管理しているメモリへアクセスするにはそのCPUを経由しなければならないからだ。
このようにメモリアクセスが不均一になるアーキテクチャをNUMAという。
numactlコマンドで、NUMAに対する上記のようなメモリ割り当ての挙動を変更することが可能。
numactlの使い方について
numactl の使い方
MySQL5.5の場合
MySQL と NUMA アーキテクチャと Swap Insanity