FPGA開発日記

カテゴリ別記事インデックス https://msyksphinz.github.io/github_pages , English Version https://fpgadevdiary.hatenadiary.com/

Kriste Asanovic教授のVector Phd Paper輪読メモ

people.eecs.berkeley.edu

  • スパコン向けからマイクロプロセッサ向けのベクトル命令の研究
  • T0(Torrent-0)というマイクロプロセッサを実装した。1つのベクトル命令を発行しながら、サイクル毎に24を超える操作を実行できる。
  • 将来のベクトルマイクロプロセッサの設計に関する提案
    • レジスタポート
      • スーパーコンピュータ向け
        • ポート数の少ない多数のバンク
      • マイクロプロセッサ
        • ポート数の多い1つのバンク
      • 今後
        • 複数のポートを持つ複数のバンクが必要となる
    • プログラミングモデル
      • whileループの投機的ベクトル化を可能にするベクトル・フラグ処理モデル
    • 仮想プロセッサキャッシュ
      • StrideやIndexベクトルアクセスを、Unit Stride Burstに変換できるプライマリベクトルキャッシュ

イントロダクション

  • ベクトルマシンはかつて強力なコンピュータシステムと言われていたが、今はマイクロプロセッサの性能向上に押されて死滅しつつある。”Killer micros”と呼ばれるくらいにマイクロプロセッサが強力になっている。
  • 本論文では、ベクトル型マイクロプロセッサが、将来の多くのアプリケーションにとって優れたプロセッサになることを主張する
    • 豊富なデータ並列性
    • 並列性を最大限に利用するためには、ベクトルアーキテクチャが最適
  • ベクトル研究の発展に向けた一歩として、広範囲なアプリケーションをシングルチップCMOSベクトルマイクロプロセッサに適した設計を検討する
  • 第2章:ベクトル命令セットのレビューと表現力の研究
  • 第3章:T0の設計と実装を説明する
    • ベクトル命令のクロックサイクルでの持続時間:チャイム?(chime)
    • chimeが短いことが、これまでのベクトル型スーパーコンピュータとの違い
  • 第4章:ベクトル型マイクロプロセッサのパイプライン設計について
  • 第5章:ベクトルレジスタファイル
    • コンパクトなベクトルレジスタファイルの設計を紹介する
  • 第6章:ベクトルフラグ処理モデル
  • 第7章:IEEE浮動小数点やより狭いデータ型のサポート
  • 第8章:ベクトルメモリシステム
  • 第9章:仮想プロセッサキャッシュ
    • ベクトルメモリアクセスパタンを利用して、アドレスおよびデータバンド幅の要求を低減する
  • 第10章:メモリを介さずに要素間の通信を可能にするベクトル命令
  • 第11章:T0の性能評価
  • 第12章:アプリケーションレポートの解析
  • 第13章:まとめ