nkmry(@nkmry_) 's Twitter Profileg
nkmry

@nkmry_

最新 AI 関連のツイート多め。最近は LLM agent を研究してる.
? ← AI スタートアップ CTO ← JTC で自然言語処理の新規事業開発 ← ML研究で博士
/ AI / ML / NLP / Psychology / Neuroscience / Rock / etc...

ID:1324604148

calendar_today03-04-2013 13:40:50

10,6K Tweets

1,9K Followers

1,5K Following

nkmry(@nkmry_) 's Twitter Profile Photo

複雑な問題を単純な問題に置き換えて、その答えを元の複雑な問題の答えだと思い込む
ということを人間は無意識的に行っていると認知科学では言われているので、如何にそれに抗えるかが大事と言うことですね。ネガティブ・ケイパビリティなどにも繋がる話

account_circle
nkmry(@nkmry_) 's Twitter Profile Photo

Llama 3 に対する LMSYS Chatbot Arena の人力評価の速報値
Gemini pro, Claude 3 Sonnet, ⌘R+, GPT-4 (23年版) などの商用モデルと並ぶレベルで、オープンなモデルとしては最強!

account_circle
AI at Meta(@AIatMeta) 's Twitter Profile Photo

In addition to Llama 3, today we’re also publishing a new paper: Imagine Flash: Accelerating Emu Diffusion Models with Backward Distillation ➡️ go.fb.me/g4r584

This work from GenAI researchers is enabling new image generation features in Meta AI on WhatsApp & web.

In addition to Llama 3, today we’re also publishing a new paper: Imagine Flash: Accelerating Emu Diffusion Models with Backward Distillation ➡️ go.fb.me/g4r584 This work from GenAI researchers is enabling new image generation features in Meta AI on @WhatsApp & web.
account_circle
Matt Shumer(@mattshumer_) 's Twitter Profile Photo

The craziest LLaMA 3 reveal:

The 400B+ version of the model is **on par with Claude 3 Opus**, and it's still training.

Soon, we'll have a better-than-Opus, fully open-source model.

The implications are huge.

The craziest LLaMA 3 reveal: The 400B+ version of the model is **on par with Claude 3 Opus**, and it's still training. Soon, we'll have a better-than-Opus, fully open-source model. The implications are huge.
account_circle
Masahiro Kaneko(@MasahiroKaneko_) 's Twitter Profile Photo

ベンチマークが学習データに漏洩しているか判断するには尤度を見ることが有効です。一方で、ChatGPTやGeminiのようなblack-box LLMsに対しては適用できません🙁そこで、この論文ではサンプリングされたLLMの出力テキストを用いて擬似的な尤度を計算することで漏洩を検出する手法を提案しました😼

account_circle
nkmry(@nkmry_) 's Twitter Profile Photo

24年4月の量子コンピュータ業界の動向がよくわからんというので書いてみました。 by Yuichiro Minato | blueqat blueqat.com/yuichiro_minat…

量子コンピュータはハードウェアも含めて開発せなあかんくて、ブレイクスルーがあると大変そう。
AI

account_circle
Devendra Chaplot(@dchaplot) 's Twitter Profile Photo

We just released Mixtral-8x22B-v0.1 and Mixtral-8x22B-Instruct-v0.1:
- Free to use under Apache 2.0 license
- Outperforms all open models
- Native function calling
- Masters English, French, Italian, German and Spanish.
- Seq_len = 64K

mistral.ai/news/mixtral-8…

We just released Mixtral-8x22B-v0.1 and Mixtral-8x22B-Instruct-v0.1: - Free to use under Apache 2.0 license - Outperforms all open models - Native function calling - Masters English, French, Italian, German and Spanish. - Seq_len = 64K mistral.ai/news/mixtral-8…
account_circle
Stability AI Japan(@StabilityAI_JP) 's Twitter Profile Photo

Stability AI Developer Platform API で Stable Diffusion 3 および Stable Diffusion 3 Turbo が利用可能になりました。
これらのモデルを提供するために、市場で最も高速かつ信頼性の高い API プラットフォームであるFireworks AIと提携しています。

オープンな生成 AI…

Stability AI Developer Platform API で Stable Diffusion 3 および Stable Diffusion 3 Turbo が利用可能になりました。 これらのモデルを提供するために、市場で最も高速かつ信頼性の高い API プラットフォームである@FireworksAI_HQと提携しています。 オープンな生成 AI…
account_circle
PyTorch(@PyTorch) 's Twitter Profile Photo

Announcing the alpha release of torchtune!

torchtune is a PyTorch-native library for fine-tuning LLMs. It combines hackable memory-efficient fine-tuning recipes with integrations into your favorite tools.

Get started fine-tuning today!

Details: hubs.la/Q02t214F0

account_circle
WizardLM(@WizardLM_AI) 's Twitter Profile Photo

🫡 We are sorry for that.

It’s been a while since we’ve released a model months ago😅, so we’re unfamiliar with the new release process now: We accidentally missed an item required in the model release process - toxicity testing.

We are currently completing this test quickly…

🫡 We are sorry for that. It’s been a while since we’ve released a model months ago😅, so we’re unfamiliar with the new release process now: We accidentally missed an item required in the model release process - toxicity testing. We are currently completing this test quickly…
account_circle
Reka(@RekaAILabs) 's Twitter Profile Photo

We evaluate Core on standard benchmarks for both text and multimodal, along with a blind third-party human evaluation.

We evaluate Core on standard benchmarks for both text and multimodal, along with a blind third-party human evaluation.
account_circle
cohere(@cohere) 's Twitter Profile Photo

Announcing the private beta of our newest foundation embedding model, Cohere Compass: designed specifically for multi-aspect data like emails, invoices, CVs, and support tickets to offer superior enterprise search capabilities.

Sign up to try it out!

txt.cohere.com/compass-beta

account_circle
nkmry(@nkmry_) 's Twitter Profile Photo

日本語 GPT-4 数か月以内にAPIでリリースされる予定

'前モデルと比較して、最大3倍高速に動作します。…トークン数が減り、効率化されたことでそのコストが47%削減されています。'

日本語モデルの開発でよく行われていたトークナイザーの最適化が行われているようですね

account_circle