shisa.ai (@shisa_ai) 's Twitter Profile
shisa.ai

@shisa_ai

ID: 1749611368091947008

calendar_today23-01-2024 01:55:17

3 Tweet

19 Takipçi

24 Takip Edilen

うみゆき@AI研究 (@umiyuki_ai) 's Twitter Profile Photo

何故か日本語特化LLMを作りまくってくれるでお馴染みのShisaAIから、Shisa-V2シリーズがリリース!LlamaやQwenをベースに微調整したモデルを7B~70Bまで各種取り揃え。最近は最初から日本語が堪能なベースモデルが多いけど、それでもやや性能向上。SFTとDPOに使用したデータセットは一部公開されてる。

何故か日本語特化LLMを作りまくってくれるでお馴染みのShisaAIから、Shisa-V2シリーズがリリース!LlamaやQwenをベースに微調整したモデルを7B~70Bまで各種取り揃え。最近は最初から日本語が堪能なベースモデルが多いけど、それでもやや性能向上。SFTとDPOに使用したデータセットは一部公開されてる。
shisa.ai (@shisa_ai) 's Twitter Profile Photo

🚀 【重大発表】次世代日英バイリンガルLLM「Shisa V2」無料公開! ✅業界標準ベンチマークにおいて複数のモデルクラスで1位を獲得 ✅ 7Bから70Bまでの全モデルサイズを公開 ✅ 今すぐチェック↓ #AI #LLM prtimes.jp/main/html/rd/p…

🚀 【重大発表】次世代日英バイリンガルLLM「Shisa V2」無料公開!
✅業界標準ベンチマークにおいて複数のモデルクラスで1位を獲得
✅ 7Bから70Bまでの全モデルサイズを公開
✅ 今すぐチェック↓ #AI #LLM 
prtimes.jp/main/html/rd/p…
shisa.ai (@shisa_ai) 's Twitter Profile Photo

Thanks to Chutes AI you can talk to Shisa V2 70B for free: chutes.ai/app/chute/5c47… or on OpenRouter: openrouter.ai/chat?models=sh… - it looks like they've served 200M+ tokens and counting already. Be sure to let us know how you like it!

Thanks to <a href="/BuildChutes/">Chutes AI</a> you can talk to Shisa V2 70B for free: chutes.ai/app/chute/5c47… or on OpenRouter: openrouter.ai/chat?models=sh… - it looks like they've served 200M+ tokens and counting already. Be sure to let us know how you like it!
shisa.ai (@shisa_ai) 's Twitter Profile Photo

【Shisa.AI速報】Llama3.1 405Bベース日本語LLMが8万H100時間のSFT/1万H100時間のDPOを完了! ・GPT-4/4 Turbo超え(日/英) ・Shisa V2 70B大幅更新 ・世界で5チームのみの405Bフルチューニング達成 経済産業省支援H100クラスタ(240/256基)で訓練。技術詳細は後日公開!#LLM #ShisaAI

【Shisa.AI速報】Llama3.1 405Bベース日本語LLMが8万H100時間のSFT/1万H100時間のDPOを完了!
・GPT-4/4 Turbo超え(日/英)
・Shisa V2 70B大幅更新
・世界で5チームのみの405Bフルチューニング達成
経済産業省支援H100クラスタ(240/256基)で訓練。技術詳細は後日公開!#LLM #ShisaAI
shisa.ai (@shisa_ai) 's Twitter Profile Photo

Our Llama 3.1 405B-based Japanese LLM has completed 80K H100-hours of SFT + 10K H100-hours DPO training! • Beats GPT-4/4 Turbo (JP/EN) • Major leap over Shisa V2 70B • Among only few teams worldwide to achieve full 405B fine-tuning Full tech details coming soon! #LLM #Shisa

Our Llama 3.1 405B-based Japanese LLM has completed 80K H100-hours of SFT + 10K H100-hours DPO training!
• Beats GPT-4/4 Turbo (JP/EN)
• Major leap over Shisa V2 70B
• Among only few  teams worldwide to achieve full 405B fine-tuning
 Full tech details coming soon! #LLM #Shisa
shisa.ai (@shisa_ai) 's Twitter Profile Photo

Qwen 3 has just released. Like with Llama 4, we've run it through some tests to see how it does in Japanese (spoiler: pretty great!) Read our writeup here: shisa.ai/posts/qwen3-ja…

Qwen 3 has just released. Like with Llama 4, we've run it through some tests to see how it does in Japanese (spoiler: pretty great!) Read our writeup here: shisa.ai/posts/qwen3-ja…
shisa.ai (@shisa_ai) 's Twitter Profile Photo

【速報】Shisa.AI が “Shisa V2.1” をリリース!🚀 日英バイリンガルLLMが大幅進化(1.2B〜70B) -14Bで70B超えの性能:劇的な軽量化・高速化と、最高峰の日本語能力を両立 -「言語混入」を徹底排除::独自技術により、ベースモデル比で47.8倍の安定性を実現 huggingface.co/shisa-ai

【速報】Shisa.AI が “Shisa V2.1” をリリース!🚀
日英バイリンガルLLMが大幅進化(1.2B〜70B) -14Bで70B超えの性能:劇的な軽量化・高速化と、最高峰の日本語能力を両立 -「言語混入」を徹底排除::独自技術により、ベースモデル比で47.8倍の安定性を実現  huggingface.co/shisa-ai
shisa.ai (@shisa_ai) 's Twitter Profile Photo

We released Shisa V2.1! Big evolution for our JP-EN bilingual LLMs (1.2B-70B) 14B > 70B Performance: Drastic lightweighting & speed meets top-tier Japanese capability Eliminated "Language Leakage": Proprietary tech achieves 47.8x stability vs base models huggingface.co/shisa-ai

We released Shisa V2.1! 
Big evolution for our JP-EN bilingual LLMs (1.2B-70B)
14B &gt; 70B Performance: Drastic lightweighting &amp; speed meets top-tier Japanese capability
Eliminated "Language Leakage": Proprietary tech achieves 47.8x stability vs base models
huggingface.co/shisa-ai
webbigdata (@webbigdata) 's Twitter Profile Photo

1分でわかる貴方のパソコンで最先端のAI(shisa-v2.1)を動かす方法! メモリ価格高騰の昨今でも大丈夫、10年前のCore i3 8GBのノートPC、GPUなしでもご覧の通り動きます AI Tuber っぽい対話に挑戦したり、データセットのチェックをしてもらったりアイディア次第で可能性無限大

shisa.ai (@shisa_ai) 's Twitter Profile Photo

AI × Web3 builders Shibuya is calling! Shisa.AI is partnering with Scoop AI Hackathon Tokyo Bowl on Jan 31 🚀Beginner or pro, come build IRL. ⭐ 1,000 USDT + Shisa.AI perks 🎟 Limited spots: luma.com/x55ppysz Let’s BUIDL 🔥 #AI #Web3 #TokyoTech

shisa.ai (@shisa_ai) 's Twitter Profile Photo

Next stop: Shibuya. 📍 Catch Shisa.AI Co-Founder Jian Shen at #CreativeTechShibuya (Feb 11-15). We’re bringing Silicon Valley experience to Tokyo’s AI scene. Let’s connect! 🚀 #ShisaAI #DIGSHIBUYA #TokyoTech #AI #Innovation

Next stop: Shibuya. 📍

Catch Shisa.AI Co-Founder Jian Shen at #CreativeTechShibuya (Feb 11-15). We’re bringing Silicon Valley experience to Tokyo’s AI scene. Let’s connect! 🚀

#ShisaAI #DIGSHIBUYA #TokyoTech #AI #Innovation
shisa.ai (@shisa_ai) 's Twitter Profile Photo

At AgentCon Tokyo, Shisa.AI will showcase how our localized models provide the core reasoning for the next generation of Japanese AI Agents. Join us to discuss the future of the Shisa ecosystem. 🔗globalai.community/chapters/tokyo… #ShisaAI #AIAgents #GenAI #Japan

At AgentCon Tokyo, Shisa.AI will showcase how our localized models provide the core reasoning for the next generation of Japanese AI Agents. Join us to discuss the future of the Shisa ecosystem.
🔗globalai.community/chapters/tokyo…
#ShisaAI #AIAgents #GenAI #Japan