矮惑星 (@dwarfplanet7634) 's Twitter Profile
矮惑星

@dwarfplanet7634

言語処理と機械学習を仕事にしてます。趣味で将棋AIに取り組み始めました。

ID: 2333758380

calendar_today08-02-2014 16:49:44

2,2K Tweet

294 Followers

1,1K Following

Early Bird (@41isyoichi) 's Twitter Profile Photo

盲点かも⚠️ wait for は相手が遅れているから「待つ」の意。相手が自分より遅れて来ることが前提。よって、「3時にバス停のところで待ってるね」は See you at the bus stop at 3:00. が自然で、I'll be waiting for you at the bus stop at 3:00. とすると相手を遅刻の常習犯にしてしまう恐れあり😱

記号創発システム論 (@sym_eme_outrea) 's Twitter Profile Photo

【関連分野情報】明日から、長崎で自然言語処理学会(#NLP2025)が開催に。 #記号創発システム論 と関連が深い発表群として、3/12(水)の「テーマセッション5:言語とコミュニケーションの創発」があります。

【関連分野情報】明日から、長崎で自然言語処理学会(#NLP2025)が開催に。 #記号創発システム論 と関連が深い発表群として、3/12(水)の「テーマセッション5:言語とコミュニケーションの創発」があります。
Naoaki Okazaki (@chokkanorg) 's Twitter Profile Photo

📢 Llama 3.3 Swallow 70B v0.4を公開しました。 - ベースLLMをLlama 3.1からLlama 3.3に変更 - 日本語の訓練データの大規模化・高品質化 - 数学やコーディングの訓練データの高品質化 swallow-llm.github.io/llama3.3-swall… 日本語理解・生成タスクではGPT-4oにも迫る性能を達成しました。

📢 Llama 3.3 Swallow 70B v0.4を公開しました。

- ベースLLMをLlama 3.1からLlama 3.3に変更
- 日本語の訓練データの大規模化・高品質化
- 数学やコーディングの訓練データの高品質化
swallow-llm.github.io/llama3.3-swall…

日本語理解・生成タスクではGPT-4oにも迫る性能を達成しました。
矮惑星 (@dwarfplanet7634) 's Twitter Profile Photo

この部分大変興味深いです。 >DeepSeek-R1系のモデルはzero-shot推論で利用することが推奨されていますが、Swallowの評価で採用しているfew-shot推論を行うと、スコアが30ポイントも下落するタスクがありました。

Hiroki Kurashige (@hir_kurashige) 's Twitter Profile Photo

記憶中のイベント断片がエピソードへと統合される"洞察"の機序を調べたヒトfMRI研究 現在のイベントに因果的に関わるイベントが神経表現の類似性に基づいて想起され,これが神経活動パターンのシフトを駆動し,洞察が起きる 情報の断片が全体性を持つ記憶に組み上げられるその基礎に"因果性"がある?

はち (@curveweb) 's Twitter Profile Photo

OCR専用VLMのSmolDocling - IBMとHuggingFaceが公開 - 商用可能なApache2.0ライセンス - 完全にOCR用と割り切って作られているようでOCRの性能が256MサイズながらQwen2.5-VL-7BやPhi-3.5-vision(4B)よりも高い - XMLのようなタグ形式で出力 huggingface.co/ds4sd/SmolDocl…

FFmpeg (@ffmpeg) 's Twitter Profile Photo

FFmpeg makes extensive use of hand-written assembly code for huge (10-50x) speed increases and so we are providing assembly lessons to teach a new generation of assembly language programmers. Learn more here: github.com/FFmpeg/asm-les…

エーピーコミュニケーションズ公式🌈 (@apc_tweet) 's Twitter Profile Photo

LLMアプリケーション開発のメジャーフレームワークであるLangChainやLangGraphをVSCodeを用いて開発した際に、パッケージインポートがうまくいかなかった際の対処法を共有いたします。 #ruff #langchain #langgraph #llm LangChainをVSCodeで使うとインポートエラーが出る… techblog.ap-com.co.jp/entry/2025/03/…

矮惑星 (@dwarfplanet7634) 's Twitter Profile Photo

GitHub Copilotで使ってて、Sonnet 3.7とかGPT4.1よりGPT4oの方が余計なことしなくて良い感じがした。

LangChainJP (@langchainjp) 's Twitter Profile Photo

【Anthropicが「Claude」の価値観データセットを公開】 Anthropicが、AIアシスタント「Claude」の表現する価値観のデータセットを「values-in-the-wild」としてHugging Faceで公開しました。

【Anthropicが「Claude」の価値観データセットを公開】

Anthropicが、AIアシスタント「Claude」の表現する価値観のデータセットを「values-in-the-wild」としてHugging Faceで公開しました。
谷合 竜典 | Tatsunori Taniai (@taniai_phd) 's Twitter Profile Photo

LoRAってちゃんと学習できてるの? 実は「LoRAの学習 = 仮想的な等価なlow rank勾配でのフル学習」→ これを使ってAとBの勾配を調整してフル学習の勾配に近づける→このとき AとBの更新は最適なclosed formな形があることを示した。おもしろい!

LoRAってちゃんと学習できてるの?
実は「LoRAの学習 = 仮想的な等価なlow rank勾配でのフル学習」→ これを使ってAとBの勾配を調整してフル学習の勾配に近づける→このとき AとBの更新は最適なclosed formな形があることを示した。おもしろい!
小城 久美子 | koshiro kumiko (@ozyozyo) 's Twitter Profile Photo

頑張ってる人より適当にやってる人の方がチームに評価されることがある。 頑張るほど次の課題が見つかるから意見が変わるし、自分の意見を曲げられないし、ときに大きいチャレンジをするから失敗もする。 がんばりましょう! levtech.jp/media/article/…

頑張ってる人より適当にやってる人の方がチームに評価されることがある。
頑張るほど次の課題が見つかるから意見が変わるし、自分の意見を曲げられないし、ときに大きいチャレンジをするから失敗もする。

がんばりましょう!
levtech.jp/media/article/…
LangChainJP (@langchainjp) 's Twitter Profile Photo

【Gemini 2.5 Proが各種ベンチマークで性能向上を記録】 LMArenaで24ポイントのEloスコア上昇を記録し1470で首位を維持。 WebDevArenaでは35ポイント上昇の1443で首位に立つ。 AIDER Polyglotなどの困難なコーディングベンチマークで優秀な成績を収めるほか、GPQA(科学・数学)とHumanity's Last

【Gemini 2.5 Proが各種ベンチマークで性能向上を記録】

LMArenaで24ポイントのEloスコア上昇を記録し1470で首位を維持。
WebDevArenaでは35ポイント上昇の1443で首位に立つ。

AIDER Polyglotなどの困難なコーディングベンチマークで優秀な成績を収めるほか、GPQA(科学・数学)とHumanity's Last
LangChainJP (@langchainjp) 's Twitter Profile Photo

【大規模Reasoningモデルのプライバシー漏洩を調査した研究が公開】 Reasoningトレースは内部的で安全とされてきたが、実際には機密データを含むことが多いことが判明。Prompt Injectionや偶発的な出力漏洩によりReasoningトレース内の情報が抽出される可能性を確認。

【大規模Reasoningモデルのプライバシー漏洩を調査した研究が公開】

Reasoningトレースは内部的で安全とされてきたが、実際には機密データを含むことが多いことが判明。Prompt Injectionや偶発的な出力漏洩によりReasoningトレース内の情報が抽出される可能性を確認。
Naoto Yoshida (@movingsloth) 's Twitter Profile Photo

京都大学の Tanichu (Tadahiro Taniguchi) 先生とプレプリントを公開しました!これまで困難とされてきた非協力的な条件下のマルチエージェント強化学習系でも集合的予測符号化によってコミュニケーションを確立可能であり、集団の利益を高められることを示しました。 arxiv.org/abs/2505.21985 ugo-nama-kun.github.io/marl_cpc_page/

名などない好きに呼べ (@shupeluter) 's Twitter Profile Photo

秀和システムの話。 実はこのあとのこと考えると頭が痛い。 彼らのドメイン。当然解放されるだろう。まぁ、普通の会社ならそれでいいけどさ 問題は、すでに出回っている書籍に大量に印刷されているだろうこと。