ちょっといくつか確認しなければならないことがあり、AArch64対応のGem5を試行してサイクル性能を測定している。 以下のようなループを作成して、FMLAのレイテンシがどのようになるのか観測したい。 for (int i = 0; i < N / 4; i++) { float32x4_t va, vb, …
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。