論文
レジスタ・ファイルのサイズを削減するための手法の論文「HAIR」を読んでいる。その内容を簡単にまとめようと思う。 もうちょっとパリティの構造について例を考えながら考察したいと思う。 例えば、以下のような命令のシーケンスを考える。 ld x10, 0(x11) a…
レジスタ・ファイルのサイズを削減するための手法の論文「HAIR」を読んでいる。その内容を簡単にまとめようと思う。 HAIRのレジスタ・ファイルの構成について まず、この論文では汎用レジスタの構成について、読み込みポート・書き込みポートの多さが問題と…
ちょっとベクトルレジスタについて似たようなアイデアを考えたので探して読んでみた。 前回の続き。 msyksphinz.hatenablog.com Delaying physical register allocation through virtual-physical registers https://ieeexplore.ieee.org/document/809456 4.…
IMP: Indirect Memory Prefetcherという論文があり、これはGather/Scatterに対してどのようにプリフェッチを出すかというものを提案した論文になっている。ちょっと読んでまとめてみようと思う。 msyksphinz.hatenablog.com msyksphinz.hatenablog.com msyks…
ちょっとベクトルレジスタについて似たようなアイデアを考えたので探して読んでみた。 Delaying physical register allocation through virtual-physical registers https://ieeexplore.ieee.org/document/809456 MICRO-32 物理レジスタのLate Allocation(実…
面白そうな論文があったので読んでみることにした。続き Cache Refill/Access Decoupling for Vector Machines https://ieeexplore.ieee.org/document/1551005 msyksphinz.hatenablog.com msyksphinz.hatenablog.com 評価 DVM (Decoupled Vector Machine) : …
面白そうな論文があったので読んでみることにした。続き Cache Refill/Access Decoupling for Vector Machines https://ieeexplore.ieee.org/document/1551005 msyksphinz.hatenablog.com 5.1 "SCALE" Decoupled Vector Processor VEUはクラスタ化 4バンク・4…
面白そうな論文があったので読んでみることにした。 Cache Refill/Access Decoupling for Vector Machines https://ieeexplore.ieee.org/document/1551005 Cache Refill/Access Decoupling for Vector Machines 諸元 37th International Symposium on Microarc…
面白そうな論文があったので読んでみることにした。 Effects of MSHR and Prefetch Mechanisms on an On-Chip Cache of the Vector Architecture https://ieeexplore.ieee.org/document/4725165 1. 概要 ベクトル・スーパーコンピュータのためのMSHRおよびプ…
ちょっと古い論文だが、"Decoupled Vector Architectures"という論文を読んでいる。 https://ieeexplore.ieee.org/document/501193 msyksphinz.hatenablog.com 次に性能について。Decoupled Vector Architectureと、リファレンス・アーキテクチャの性能を比…
IMP: Indirect Memory Prefetcherという論文があり、これはGather/Scatterに対してどのようにプリフェッチを出すかというものを提案した論文になっている。ちょっと読んでまとめてみようと思う。 https://ieeexplore.ieee.org/document/7856597 前回はプリフ…
ちょっと古い論文だが、"Decoupled Vector Architectures"という論文を読んでいる。 https://ieeexplore.ieee.org/document/501193 ベクトル命令というのは、メモリの壁を乗り越えるための手法として考案された命令セットである。メモリチップはCPUに対して1…
IMP: Indirect Memory Prefetcherという論文があり、これはGather/Scatterに対してどのようにプリフェッチを出すかというものを提案した論文になっている。ちょっと読んでまとめてみようと思う。 https://ieeexplore.ieee.org/document/7856597 前回の続き、…
IMP: Indirect Memory Prefetcherという論文があり、これはGather/Scatterに対してどのようにプリフェッチを出すかというものを提案した論文になっている。ちょっと読んでまとめてみようと思う。 https://ieeexplore.ieee.org/document/7856597 問題のモチベ…
ちょっと気になっていたことではあるのだが、アウトオブオーダ実行ではメモリアクセスのリクエストもアウトオブオーダになり、ストライド検出器によって正しいストライド値を検出できないことがある。 LSUのパイプラインが3本あるような場合、メモリアクセス…
ちょっと古い論文だが、"Decoupled Vector Architectures"という論文を読んでいる。 https://ieeexplore.ieee.org/document/501193 この論文は、ベクトルプロセッサにおけるデカップリング技術の使用が、ベクトルプログラムの性能を大幅に向上させることを示…
https://ieeexplore.ieee.org/document/9923831 概要を大きくまとめる。 それでは、実際のPMP(Pattern Merge Prefetcher)の実装に移る。本プリフェッチメカニズムはトレーニングとプリフェッチのプロセスが2つ平行に動作する。 学習フェーズ: パタン・マー…
https://ieeexplore.ieee.org/document/9923831 概要を大きくまとめる。 用語確認: リージョン:アドレス空間上の領域。この論文ではページ(4KB)と同じサイズに設定。 ジェネレーション:一定時間に、あるリージョンに対してアクセスされたラインの集合 メモ…
内容的に興味があったので、以下の論文をざっと読んでみた。 Complexity-effective superscalar processors ACM SIGARCH Computer Architecture News ,Volume 25, Issue 2, May 1997, pp 206–218 https://dl.acm.org/doi/10.1145/384286.264201 論文の概要:…