吉岡ひろき (@irohiroki) 's Twitter Profile
吉岡ひろき

@irohiroki

ソフトウェアエンジニア @ ドリコム👾🎮️ ベース初心者🎸MAN WITH A MISSION/THE BAWDIES/LiSA/King Gnu/Oasis/羊文学 旧ハンドルネームは「いろ」

ID: 5003071

linkhttp://irohiroki.github.io calendar_today17-04-2007 14:33:30

5,5K Tweet

644 Takipçi

325 Takip Edilen

吉岡ひろき (@irohiroki) 's Twitter Profile Photo

VLM agentを強化学習するとき単純に行動を評価すると破綻することがあり、それを防ぐためreasoningを評価する。興味深い👀 GTR: Guided Thought Reinforcement Prevents Thought Collapse in RL-based VLM Agent Training arxiv.org/abs/2503.08525

吉岡ひろき (@irohiroki) 's Twitter Profile Photo

このKV-cacheの圧縮方法すごい 8倍圧縮でも劣化は5%程度、2.4倍だったらほぼ劣化しない(0.1%, Qwen2.5-14B) xKV: Cross-Layer SVD for KV-Cache Compression arxiv.org/abs/2503.18893

吉岡ひろき (@irohiroki) 's Twitter Profile Photo

基盤モデルが更新されたらfine-tuningやりなおし?いいえ、前のバージョンのトレーニングを再利用できます😳 Efficient Model Development through Fine-tuning Transfer arxiv.org/abs/2503.20110

吉岡ひろき (@irohiroki) 's Twitter Profile Photo

AIエージェントにツール使わせるのはいいけど、無駄に使ってない?という論文 けっこう無駄に使ってた OTC: Optimal Tool Calls via Reinforcement Learning arxiv.org/abs/2504.14870

吉岡ひろき (@irohiroki) 's Twitter Profile Photo

AIエージェントにおけるMCPサーバって、RailsにおけるGemみたいだね。これからネタMCPサーバとか超有名MCPサーバとか現れて、その作者がコミュニティリーダーになったりするのかな

吉岡ひろき (@irohiroki) 's Twitter Profile Photo

sparse attentionってどうなの?を調べてくれたみたいで助かる The Sparse Frontier: Sparse Attention Trade-offs in Transformer LLMs arxiv.org/abs/2504.17768

吉岡ひろき (@irohiroki) 's Twitter Profile Photo

AIエージェントで作れるのは前提で、どのくらい計算コストを掛けずに実現できるかが重要 majority votingや self-refinementがそのコストを正当化できるのは稀 Cost-of-Pass: An Economic Framework for Evaluating Language Models arxiv.org/abs/2504.13359

吉岡ひろき (@irohiroki) 's Twitter Profile Photo

LLMを使いながらどうやって目標の応答時間/スループットを出すか?手法がまとめられてて便利 Taming the Titans: A Survey of Efficient LLM Inference Serving arxiv.org/abs/2504.19720

吉岡ひろき (@irohiroki) 's Twitter Profile Photo

これもLLMの最適化手法がまとまってて便利 A Survey on Inference Engines for Large Language Models: Perspectives on Optimization and Efficiency arxiv.org/abs/2505.01658

吉岡ひろき (@irohiroki) 's Twitter Profile Photo

どのモデルをどう使えば一番コスパいいのか?に答える方法 COSMOS: Predictable and Cost-Effective Adaptation of LLMs arxiv.org/abs/2505.01449

吉岡ひろき (@irohiroki) 's Twitter Profile Photo

MCPの仕様見たらJSON-RPCって書いてあるけど、JSON-RPCって文字列のエスケープが必要だよね…?なんで長大なデータ送るのにエスケープが必要な仕様を選んだの?何か高速化できる拡張とかあるの?

吉岡ひろき (@irohiroki) 's Twitter Profile Photo

「近しい」が「近い」という意味になったように、「ページング」が「ページネーション」という意味に近い将来

吉岡ひろき (@irohiroki) 's Twitter Profile Photo

最近「AIが書いた方が読みやすいな…」とか「AIがそう書くならそうなんだろう…」とか思うことがあってやばないか

吉岡ひろき (@irohiroki) 's Twitter Profile Photo

光速の60%で移動しながら燃やせば、燃え尽きたとき元の慣性系では1時間15分経ってる。よってそこから2本目が燃え尽きるまでの時間が45分

Wizardry Variants Daphne(ウィザードリィ ヴァリアンツ ダフネ)【公式】 (@wizardry_daphne) 's Twitter Profile Photo

アルナ役、マリアンヌ役、ミラナ役を演じる声優のファイルーズあい氏より、ウィズダフネ1周年のお祝いの言葉をいただきました。 皆様からの、これまでの冒険の思い出やメッセージの投稿も「 #ウィズダフネ周年 」にてお待ちしております。 #ウィズダフネ

アルナ役、マリアンヌ役、ミラナ役を演じる声優のファイルーズあい氏より、ウィズダフネ1周年のお祝いの言葉をいただきました。

皆様からの、これまでの冒険の思い出やメッセージの投稿も「 #ウィズダフネ周年 」にてお待ちしております。

#ウィズダフネ