t3840 (@t3840) 's Twitter Profile
t3840

@t3840

時代は超弩級データフロー計算機←FPGA←時代はOpenACC←粒子法←CFDアプリを速くしたい←動的関数オフロードや!←博士課程ヽ(`Д´)ノウワァな学生←高位合成言語とFPGA使って画像処理やってます←専門の強化に勤しむ学生←頭でっかちを実感した、道半ばの技術者志望な学生

ID: 14953288

calendar_today30-05-2008 09:50:48

42,42K Tweet

522 Followers

291 Following

t3840 (@t3840) 's Twitter Profile Photo

分散SpMVの話しが載っているっぽい Deep Learning-Enabled Supercritical Flame Simulation at Detailed Chemistry and Real-Fluid Accuracy Towards Trillion-Cell Scale sc25.conference-program.com/presentation/

t3840 (@t3840) 's Twitter Profile Photo

WSE-3のPEのマイクロアーキは、7段パイプラインになってるっぽいな > On WSE-3, stage 3 is instruction decode, and stage 6 is instruction execution. On WSE-2, stage 2 is instruction decode, and stage 4 is instruction execution. sdk.cerebras.net/debug/debuggin…

Nagamura ∩|∵|∩ Naoka (@naganao) 's Twitter Profile Photo

ということで、月刊ポスドクに掲載した「熟睡!ラボ寝の最前線」と「絶品!ラボ飯の醍醐味」の2本をresearch map(リサーチ…?)のWorks(作品等)にアップしておきましたので、ご興味のある方はご参考にどうぞ(非推奨) researchmap.jp/naganao/works

t3840 (@t3840) 's Twitter Profile Photo

コンパイラの最適化で、ベンチマークのコードが消されてるっぽい挙動にすごい時間を取られた…

t3840 (@t3840) 's Twitter Profile Photo

単なるwhileループでSTEAMを実装してみたけど、死ぬほど遅い気がする 実機はまだだけど、シミュレータのログをみる限り、かなり厳しい値が出そうだ

t3840 (@t3840) 's Twitter Profile Photo

(大きめの)AIアクセラレータの会社はちゃんとHotChipsとかMicroとかに論文出して、アーキテクチャを解説してて助かる 出してない所は早くだしてほしいなぁ

t3840 (@t3840) 's Twitter Profile Photo

古いけど、網羅的にやっててすごい さすがCitadel [[1912.03413] Dissecting the Graphcore IPU Architecture via Microbenchmarking](arxiv.org/abs/1912.03413)