さくらんぼ (@lambda_sakura) 's Twitter Profile
さくらんぼ

@lambda_sakura

さくらんぼ亭の代表やってるらしい。
Common Lisp, Haskell, C++など色々な言語が好きです。中日ドラゴンズ、Chelsea FC 好き。

ID: 15403341

linkhttp://light-of-moe.ddo.jp/~sakura/diary/ calendar_today12-07-2008 12:06:04

44,44K Tweet

2,2K Takipçi

3,3K Takip Edilen

さくらんぼ (@lambda_sakura) 's Twitter Profile Photo

最近のUbuntuはswapはディスク上に適当にファイルをデフォルトだと作るんだなぁ。swap用のパーティション不要。Windowsだとollamaが普通に実行できてる話をちょこちょこ見るのはWindowsは大きめswapfileをデフォルトで作ってるからではないか。

さくらんぼ (@lambda_sakura) 's Twitter Profile Photo

返答が大きくなる場合は返答がおそすぎる。数分掛かりそう。LM Studioだとここまで遅くないので何かオプションに違いがありそう

さくらんぼ (@lambda_sakura) 's Twitter Profile Photo

qwen/qwen3-30b-a3b + clineで大分快適に開発できる。コンテキスト長は32768。モデルのサポートしている最大長(LM Studio曰く)。モデル定義いじってコンテキスト増やしたりしたいところ。

さくらんぼ (@lambda_sakura) 's Twitter Profile Photo

うーん。なんかchromeとibus+mozcの挙動が変でblogの文書おかしいところがちらほらあったので修正した

さくらんぼ (@lambda_sakura) 's Twitter Profile Photo

ollamaがVRAMを確保しているにも関わらず実際の計算はCPUで行っているのかのような応答速度になる。clineから呼び出すとき限定かもしれない良くわからない。

さくらんぼ (@lambda_sakura) 's Twitter Profile Photo

cline側の問題かもしれないし、ollama側かもしれない。ollama restartしたりするとWaylandが落ちたりするのでollamaを疑っていますが

さくらんぼ (@lambda_sakura) 's Twitter Profile Photo

この件を調査しようとしてbtopでも眺めるかと思ってbtop起動したらセグメンテーションフォルトで落ちるので何かと思ったら、rocm関連の仕様変更によるバグという(最新版だと対応されている)のを引いてさらに厳しい気持ちになりました

さくらんぼ (@lambda_sakura) 's Twitter Profile Photo

うーん。NVMeをOcuLinkにすればeGPU追加できるだろうけど、そこまでしたくはないからゲームは別マシンでどうにかうまくやる方法を考えよう...。

さくらんぼ (@lambda_sakura) 's Twitter Profile Photo

同社のEVO-X1のUSB4が40Gbpsと謳っているからEVO-X2も同様だろうと期待する。lsusbだと動いてるものの速度しか見えないようなのでUSB4デバイスが手元にない我が家では確認できないのであった...。