Lyaka (@lyakaap) 's Twitter Profile
Lyaka

@lyakaap

Kaggleとかディープの事とかをつぶやきます

ID: 888275480033476610

linkhttps://www.kaggle.com/lyakaap calendar_today21-07-2017 05:52:32

498 Tweet

2,2K Followers

998 Following

dcai_community_jp (@dcai_jp) 's Twitter Profile Photo

第6回 Data-Centric AI勉強会を2/9 (金) に開催します!今回はLINEヤフー 横尾様 (Lyaka)、東工大 服部様 (Kakeru Hattori) からLLMやVLMに関する旬な内容でご発表いただきます。奮ってご参加ください!Xフォロー及びconnpassグループ参加もよろしくお願いします。dcai-jp.connpass.com/event/307402/ #dcai_jp

dcai_community_jp (@dcai_jp) 's Twitter Profile Photo

発表紹介1:LINEヤフー横尾様(Lyaka)「大規模画像テキストペアデータのフィルタリング手法の紹介」。基盤モデルのための事前学習データの質を高めることを競うコンペであるDataCompでの事例を中心に、最近の大規模画像テキストペアデータのためのフィルタリング手法について紹介いただきます

dcai_community_jp (@dcai_jp) 's Twitter Profile Photo

次の発表は横尾さん(Lyaka)による「大規模画像テキストデータのフィルタリング手法の紹介」です #dcai_jp speakerdeck.com/lyakaap/da-gui…

岡本大和 / Yamato.OKAMOTO / RoadRoller (@roadroller_desu) 's Twitter Profile Photo

Video Copy Detectionの研究を公開しました。たとえ高性能を達成していた従来手法でも、実は最近主流のショート動画を対象とした場合には効果が薄くて、このままでは違法動画を取り締まるのは難しいよと問題提起した論文です。LINE在籍時から着手していた研究です(やっと公開できた、、、

Ino.Ichi (@inoichan) 's Twitter Profile Photo

Vision Language Modelの日本語能力を測定するベンチマーク、Heron-Benchを公開しました!同時にLLaVA-1.5の指示チューニングデータで学習した新しいベースラインモデルも公開しています!データ、モデル、コードすべて公開しています!ぜひ使ってみてください🙌 arxiv: arxiv.org/abs/2404.07824

Vision Language Modelの日本語能力を測定するベンチマーク、Heron-Benchを公開しました!同時にLLaVA-1.5の指示チューニングデータで学習した新しいベースラインモデルも公開しています!データ、モデル、コードすべて公開しています!ぜひ使ってみてください🙌
arxiv: arxiv.org/abs/2404.07824
Lyaka (@lyakaap) 's Twitter Profile Photo

前期のチームでの取り組みがやっと公開になりました...! GPT-4oをはじめとして強いVLMは沢山出ていますが、軽量に画像・テキストをベクトル化できる日本語CLIPは実サービスにおいても色んな場面で使えると思います しかもApache 2.0ライセンス!

Tomoaki (@tapioca_pudd) 's Twitter Profile Photo

今週の #LayerX機械学習勉強会 では、MLOpsにおけるバージョン管理の基礎と実践、Detectron2によるDocument Layout Analysisの実験、日本語のマルチモーダル基盤モデル「clip-japanese-base」などが紹介されました! jobs.layerx.co.jp/aae666ef7d6047…

LINEヤフー Tech (@lycorptech_jp) 's Twitter Profile Photo

8月6日(月)から開催される #MIRU2024 にて、LINEヤフーとして計10件の研究発表を行います。登壇スケジュールは画像のとおりです。現地にお越しの方は、ぜひご参加ください。 私たちは、より良いサービスを提供するために、画像・マルチメディア領域の研究に取り組んでいます。

8月6日(月)から開催される #MIRU2024 にて、LINEヤフーとして計10件の研究発表を行います。登壇スケジュールは画像のとおりです。現地にお越しの方は、ぜひご参加ください。 私たちは、より良いサービスを提供するために、画像・マルチメディア領域の研究に取り組んでいます。
Sebastian Raschka (@rasbt) 's Twitter Profile Photo

If you are curious how Multimodal LLMs work, I wrote a new article to explain the two main approaches, decoder-only- and cross-attention-style: magazine.sebastianraschka.com/p/understandin… Plus, I reviewed and summarized the 10 latest research papers to see how it's done in practice. Happy reading!

Lyaka (@lyakaap) 's Twitter Profile Photo

#ViEW2024 の特別講演2のセッションにてVLMのお話をします。 VLM開発の話、ヤフオクでの事業応用事例の紹介、実応用における課題や解決策の話など、盛りだくさんの内容になっていると思います。 一時間という長尺ですがぜひ!

しゅんけー「📕Pythonで学ぶ画像生成」発売中! (@shunk031) 's Twitter Profile Photo

同じ部の基盤モデルチームがありえん強いCLIP拡張モデルを作ってプロダクト応用ガッツリ進めている話😤 自社開発のマルチモーダル基盤モデルを用いたYahoo!オークションの出品審査効率化 techblog.lycorp.co.jp/ja/20241204a

Mikihiro Tanaka (@mikittt417) 's Twitter Profile Photo

#NLP2025 3月11日(火) 13:00-14:30 Q3で、日本語のマルチモーダル大規模言語モデルの開発に関するポスター発表をします。 興味のある方はぜひ来てください!

Ikki Tanaka(kyazuki) (@ikki407) 's Twitter Profile Photo

ベールに包まれてたベイスターズを支えるAI活用いっぱい話すよ⚾️(16:00〜) ここから見れます! techcon2025.dena.dev

eisaku|LayerX (@eisaku9393) 's Twitter Profile Photo

3月7日はサウナの日です!ということでサウナ企画!実はサウナーの弊社代表福島良典 | LayerX松本 勇気 (Yuki Matsumoto) | LayerX CTO のおすすめサウナも紹介しています!是非見てみてください!🤟 -- LayerXメンバーが選ぶおすすめサウナ #日めくりLayerX|Shimomura Eisaku eisaku|LayerX #note note.com/jolly_koala293…

Mikihiro Tanaka (@mikittt417) 's Twitter Profile Photo

月曜日からNLP2025に参加します! 以下の論文を発表する予定で、内容は 1. 日本語MLLMで既存の公開モデルの精度を上回るものができたこと 2. 新しく作成したJIC-VQAベンチマーク についてになります。 JIC-VQA: huggingface.co/datasets/line-… 論文プロジェクページ: mikittt.github.io/posts/Japanese… #NLP2025

Lyaka (@lyakaap) 's Twitter Profile Photo

弊チームのサマーインターンの募集です! 大規模な社内の画像データを使ったVLMの研究開発ができて楽しいと思うのでぜひ! lycorp.co.jp/ja/recruit/new…

すずどら (@sz_dr) 's Twitter Profile Photo

最近やっていた仕事です Vespaを活用したYahoo!フリマのベクトル検索 —— 類似画像で広がる商品探索 techblog.lycorp.co.jp/ja/20250908c

Lyaka (@lyakaap) 's Twitter Profile Photo

DeepSeek-OCRの文書をそのままビジョントークンとして圧縮するという話は、長いコンテキストを扱うのが得意なGeminiでも似たようなことをやっているかもという推測 たしかに有り得そう

speed (@strayer_13) 's Twitter Profile Photo

大規模かつ高品質な日本語画像テキスト対データセットのWAONを公開しました!🇯🇵 新たに構築した日本文化画像分類ベンチマークWAON-BenchにおいてWAONはReLAIONより効率的にモデルの性能を向上させ、SoTAの性能を達成することを示しています。 ブログ記事もぜひご覧ください! speed1313.github.io/posts/WAON/