FPGA開発日記

カテゴリ別記事インデックス https://msyksphinz.github.io/github_pages , English Version https://fpgadevdiary.hatenadiary.com/

論文

HAIR: Halving the Area of the Integer Register File with Odd/Even Bankingを読む(2. パリティの構造)

レジスタ・ファイルのサイズを削減するための手法の論文「HAIR」を読んでいる。その内容を簡単にまとめようと思う。 もうちょっとパリティの構造について例を考えながら考察したいと思う。 例えば、以下のような命令のシーケンスを考える。 ld x10, 0(x11) a…

HAIR: Halving the Area of the Integer Register File with Odd/Even Bankingを読む(1. 概要)

レジスタ・ファイルのサイズを削減するための手法の論文「HAIR」を読んでいる。その内容を簡単にまとめようと思う。 HAIRのレジスタ・ファイルの構成について まず、この論文では汎用レジスタの構成について、読み込みポート・書き込みポートの多さが問題と…

Delaying Physical Register Allocation Through Virtual-Physical Registers (2. 性能評価)

ちょっとベクトルレジスタについて似たようなアイデアを考えたので探して読んでみた。 前回の続き。 msyksphinz.hatenablog.com Delaying physical register allocation through virtual-physical registers https://ieeexplore.ieee.org/document/809456 4.…

Gather/Scatterのような不連続なメモリアクセスについてどのようにプリフェッチを出すか (IMP) (4. 部分キャッシュ・ライン・アクセス)

IMP: Indirect Memory Prefetcherという論文があり、これはGather/Scatterに対してどのようにプリフェッチを出すかというものを提案した論文になっている。ちょっと読んでまとめてみようと思う。 msyksphinz.hatenablog.com msyksphinz.hatenablog.com msyks…

Delaying Physical Register Allocation Through Virtual-Physical Registers

ちょっとベクトルレジスタについて似たようなアイデアを考えたので探して読んでみた。 Delaying physical register allocation through virtual-physical registers https://ieeexplore.ieee.org/document/809456 MICRO-32 物理レジスタのLate Allocation(実…

Cache Refill/Access Decoupling for Vector Machinesの論文を読む (3. ベンチマークと性能測定)

面白そうな論文があったので読んでみることにした。続き Cache Refill/Access Decoupling for Vector Machines https://ieeexplore.ieee.org/document/1551005 msyksphinz.hatenablog.com msyksphinz.hatenablog.com 評価 DVM (Decoupled Vector Machine) : …

Cache Refill/Access Decoupling for Vector Machinesの論文を読む (2. マイクロ・アーキテクチャ)

面白そうな論文があったので読んでみることにした。続き Cache Refill/Access Decoupling for Vector Machines https://ieeexplore.ieee.org/document/1551005 msyksphinz.hatenablog.com 5.1 "SCALE" Decoupled Vector Processor VEUはクラスタ化 4バンク・4…

Cache Refill/Access Decoupling for Vector Machinesの論文を読む (1. 概要)

面白そうな論文があったので読んでみることにした。 Cache Refill/Access Decoupling for Vector Machines https://ieeexplore.ieee.org/document/1551005 Cache Refill/Access Decoupling for Vector Machines 諸元 37th International Symposium on Microarc…

Effects of MSHR and Prefetch Mechanisms on an On-Chip Cache of the Vector Architecture を読む (1. 概要)

面白そうな論文があったので読んでみることにした。 Effects of MSHR and Prefetch Mechanisms on an On-Chip Cache of the Vector Architecture https://ieeexplore.ieee.org/document/4725165 1. 概要 ベクトル・スーパーコンピュータのためのMSHRおよびプ…

Decoupled vector architectures を読む (2. 性能評価)

ちょっと古い論文だが、"Decoupled Vector Architectures"という論文を読んでいる。 https://ieeexplore.ieee.org/document/501193 msyksphinz.hatenablog.com 次に性能について。Decoupled Vector Architectureと、リファレンス・アーキテクチャの性能を比…

Gather/Scatterのような不連続なメモリアクセスについてどのようにプリフェッチを出すか (IMP) (3. プリフェッチの生成方法)

IMP: Indirect Memory Prefetcherという論文があり、これはGather/Scatterに対してどのようにプリフェッチを出すかというものを提案した論文になっている。ちょっと読んでまとめてみようと思う。 https://ieeexplore.ieee.org/document/7856597 前回はプリフ…

Decoupled vector architectures を読む (1. 概要)

ちょっと古い論文だが、"Decoupled Vector Architectures"という論文を読んでいる。 https://ieeexplore.ieee.org/document/501193 ベクトル命令というのは、メモリの壁を乗り越えるための手法として考案された命令セットである。メモリチップはCPUに対して1…

Gather/Scatterのような不連続なメモリアクセスについてどのようにプリフェッチを出すか (IMP) (2. ベースアドレスの検出方法)

IMP: Indirect Memory Prefetcherという論文があり、これはGather/Scatterに対してどのようにプリフェッチを出すかというものを提案した論文になっている。ちょっと読んでまとめてみようと思う。 https://ieeexplore.ieee.org/document/7856597 前回の続き、…

Gather/Scatterのような不連続なメモリアクセスについてどのようにプリフェッチを出すか (IMP)

IMP: Indirect Memory Prefetcherという論文があり、これはGather/Scatterに対してどのようにプリフェッチを出すかというものを提案した論文になっている。ちょっと読んでまとめてみようと思う。 https://ieeexplore.ieee.org/document/7856597 問題のモチベ…

メモリアクセスがアウトオブオーダにより入り乱れた際のプリフェッチ手法について

ちょっと気になっていたことではあるのだが、アウトオブオーダ実行ではメモリアクセスのリクエストもアウトオブオーダになり、ストライド検出器によって正しいストライド値を検出できないことがある。 LSUのパイプラインが3本あるような場合、メモリアクセス…

Decoupled vector architectures を読む (1. 概要)

ちょっと古い論文だが、"Decoupled Vector Architectures"という論文を読んでいる。 https://ieeexplore.ieee.org/document/501193 この論文は、ベクトルプロセッサにおけるデカップリング技術の使用が、ベクトルプログラムの性能を大幅に向上させることを示…

Merging Similar Patterns for Hardware Prefetching を読む (2. ハードウェアの構成)

https://ieeexplore.ieee.org/document/9923831 概要を大きくまとめる。 それでは、実際のPMP(Pattern Merge Prefetcher)の実装に移る。本プリフェッチメカニズムはトレーニングとプリフェッチのプロセスが2つ平行に動作する。 学習フェーズ: パタン・マー…

Merging Similar Patterns for Hardware Prefetching を読む (1. 概要)

https://ieeexplore.ieee.org/document/9923831 概要を大きくまとめる。 用語確認: リージョン:アドレス空間上の領域。この論文ではページ(4KB)と同じサイズに設定。 ジェネレーション:一定時間に、あるリージョンに対してアクセスされたラインの集合 メモ…

Complexity-Effective Superscalar Processors を読む

内容的に興味があったので、以下の論文をざっと読んでみた。 Complexity-effective superscalar processors ACM SIGARCH Computer Architecture News ,Volume 25, Issue 2, May 1997, pp 206–218 https://dl.acm.org/doi/10.1145/384286.264201 論文の概要:…