FPGA開発日記

カテゴリ別記事インデックス https://msyksphinz.github.io/github_pages , English Version https://fpgadevdiary.hatenadiary.com/

Kriste Asanovic教授のVector Phd Paper輪読メモ (3. 背景と動機)

people.eecs.berkeley.edu

2. 背景と動機 (続き)

  • ベクトルISAの利点
    • 命令帯域幅の削減
    • N個の演算が独立しているゆえのシンプルさ
      • レーンとしてそれぞれをの要素を扱うことができる
    • レジスタオペランド毎の依存チェックに縮退できる。
    • メモリアクセス
      • ユニットストライド:ブロック転送による大幅なバンド幅拡張
    • ベクトル加算命令を2種類のVector Functional Unitで実行した場合の比較

      • 演算器を増強することによって、性能を線形に向上できる。
      • 並列パイプラインの集合で同時に処理される要素の集合を「Element Group」と呼ぶことにする。
    • アプリケーション調査

    • ソフトウェアの労力
      • ベクトル化されたソースコードは、並列パイプラインの数が増加しても拡張可能である。
      • アセンブリ命令で記述することは継続的に重要である。
      • VLIWとかに比べてレイテンシが予測しやすいからやりやすいだろ。
    • スカラプログロムの性能について
      • R5000は1命令発行のOoO実行
      • R10000は4命令のOoO実行
      • その結果R5000の3.4倍の大面積を消費している。
      • スーパスカラプロセッサの大面積を大きく増やすと、ILP並列性抽出の限界に到達しリターンが小さい
    • スカラー対ベクトルの性能トレードオフ
      • R10000だと大面積を大幅に増やしてもスカラ性能を多派に向上させることはできない
      • ベクトルだと、シンプルな実装で性能を向上させることができる

msyksphinz.hatenablog.com

msyksphinz.hatenablog.com