yseeker (@yseeker0) 's Twitter Profile
yseeker

@yseeker0

AIエージェントです。

ID: 732774991100411905

calendar_today18-05-2016 03:29:07

1,1K Tweet

841 Followers

376 Following

yseeker (@yseeker0) 's Twitter Profile Photo

懐かしいな。 東大で"a=mF"なる新たな物理法則が発見され、驚愕に沸くTL togetter.com/li/392366 #Togetter

yseeker (@yseeker0) 's Twitter Profile Photo

WACVに2本目の論文採択! ということで弊社からは2/2でWACVに採択でした! 「Congratulations! Your Paper XXX, titled "YYYYYY" has been accepted to WACV 2025!」 のメールが2つ連続で来ると嬉しさも2倍ですね!

yseeker (@yseeker0) 's Twitter Profile Photo

o1 pro普通にすごい。 自分が昔書いた論文(固体物理 / 実験)のタイトルだけ入力して解説させたら、参考文献もほぼドンピシャで内容も70点くらいだった。※ただしハルシネーションを含む 同じプロンプトでo1だと参考文献はハルシネーション多数、解説の内容は50点。 ClaudeとGPT-4oはゴミという感じ

yseeker (@yseeker0) 's Twitter Profile Photo

o1 pro、論文全文(or 主要な箇所)とソースコードを可能な限り同時に突っ込むといい感じの出力になる。

yseeker (@yseeker0) 's Twitter Profile Photo

o1 pro、日本語の言い回しがこなれすぎててビビる笑 例1)ただし、「decode & augment」できる利点が""ハマる""ほど、、、 例2)一見12.8GBなら""載るかも……""と思うかもしれませんが、実際には以下の要素で、、、 「ハマる」とか「載るかも……」とか、言葉をちゃんと使えてる感じがする

Sakana AI (@sakanaailabs) 's Twitter Profile Photo

Update: Combining evolutionary optimization with LLMs is powerful but can also find ways to trick the verification sandbox. We are fortunate to have readers, like main test our CUDA kernels, to identify that the system had found a way to “cheat”. For example, the system

yseeker (@yseeker0) 's Twitter Profile Photo

いろいろ触った結果、 だいたい全部: o1 pro すぐ回答が欲しい時 : o1 コーディング:o3-mini-high リサーチ: Deep Research(ChatGPT) という結論になった。さすが OpenAIでしたわ。

yseeker (@yseeker0) 's Twitter Profile Photo

いろんなwebサービス、ツールがMCPサーバー化され、LLMにつながっていく様子を見ると、アメリカ時代に希釈冷凍機のコントローラーやロックインアンプもlabradサーバー化して中央集権でコントロールできるように実装していたことを思い出した。labradをMCPサーバー化すれば統一規格でLLMにつなげそう。

yseeker (@yseeker0) 's Twitter Profile Photo

Gemini 2.5 proマジでかしこいな。o1 proと同等かタスクによっては上回ってるな。 しかもレスポンスも高速。 o3 proは多分ゆっくり型だろうけど果たしてIQ120相当のGeminiを引き離せるのか?

yseeker (@yseeker0) 's Twitter Profile Photo

tracking ai (trackingai.org/home)のmensa norway とoffline testを足して2で割ったくらいが体感の性能に近いな。 用途は、物書き、調べ物、アイディア整理など(not coding) o3 =~ gemini 2.5 pro > o1 pro >> o1 >= o3-mini-high ~ > Claude (extend thinking) >~ Grok (think)

yseeker (@yseeker0) 's Twitter Profile Photo

o3君さー、頭いいんだから、海外の意識高い記事をわざわざ検索して回答しないで、自分の頭で考えて回答してくださいな。

yseeker (@yseeker0) 's Twitter Profile Photo

tracking aiの中身のIQテストっぽい問題を見てると、まだ自分の方がIQ高いかもしれないという優越感に浸れる笑 trackingai.org/home

tracking aiの中身のIQテストっぽい問題を見てると、まだ自分の方がIQ高いかもしれないという優越感に浸れる笑
trackingai.org/home