EC2のvCPU数はハイパースレッディングを含む - @ledsun blog にて計測に使っているEC2インスタンスタイプが不適切であることがわかりました。 今度はm6i.4xlargeを使って計測します。 m6i.4xlargeは16vCPUあります。 コア数は8のはずです。
4並列より8並列の方が高速なことがわかります。 比較のためにローカルPCでの計測結果を載せます。
8並列は4並列より高速ではありません。 むしろ悪化しています。
4コアで2.3倍、8コアで3.1倍です。 もうちょっとほしいっちゃ欲しいですが、こんなもんでしょうか? 16コア使ったら4倍になるのでしょうか?