ハッシュ参照・登録を関数に分離したら、そこだけで計算時間の5%ぐらい喰ってることが判明。
メモリ足りない && vps だからでしょうか。参った。
5%喰われても、トータルでは儲かってるからいいんだけど、なんとなく釈然としないものがある。
(__builtin_prefetchすると良くなったりするもんなのでしょうか…)
さくらvpsは同じ値段で1GBプランが出てるようだから載せ換えた方がいいのかもしれない。
追記:__attribute__( (packed) )のせいもあるかもしれない。uint64に押し込むと少しはよくなるかな?