Lyaka (@lyakaap) Twitter Tweets • TwiCopy

dcai_community_jp

2 years ago

第6回 Data-Centric AI勉強会を2/9 (金) に開催します！今回はLINEヤフー横尾様 (Lyaka)、東工大服部様 (Kakeru Hattori) からLLMやVLMに関する旬な内容でご発表いただきます。奮ってご参加ください！Xフォロー及びconnpassグループ参加もよろしくお願いします。dcai-jp.connpass.com/event/307402/　#dcai_jp

thumb_up_off_alt41

chat_bubble_outline0

repeat14

shareShare

dcai_community_jp

@dcai_jp

2 years ago

発表紹介1：LINEヤフー横尾様(Lyaka)「大規模画像テキストペアデータのフィルタリング手法の紹介」。基盤モデルのための事前学習データの質を高めることを競うコンペであるDataCompでの事例を中心に、最近の大規模画像テキストペアデータのためのフィルタリング手法について紹介いただきます

thumb_up_off_alt11

chat_bubble_outline0

repeat2

shareShare

dcai_community_jp

@dcai_jp

2 years ago

次の発表は横尾さん（Lyaka）による「大規模画像テキストデータのフィルタリング手法の紹介」です #dcai_jp speakerdeck.com/lyakaap/da-gui…

thumb_up_off_alt72

chat_bubble_outline0

repeat13

shareShare

岡本大和 / Yamato.OKAMOTO / RoadRoller

@roadroller_desu

2 years ago

Video Copy Detectionの研究を公開しました。たとえ高性能を達成していた従来手法でも、実は最近主流のショート動画を対象とした場合には効果が薄くて、このままでは違法動画を取り締まるのは難しいよと問題提起した論文です。LINE在籍時から着手していた研究です（やっと公開できた、、、

thumb_up_off_alt19

chat_bubble_outline0

repeat3

shareShare

Ino.Ichi

@inoichan

2 years ago

Vision Language Modelの日本語能力を測定するベンチマーク、Heron-Benchを公開しました！同時にLLaVA-1.5の指示チューニングデータで学習した新しいベースラインモデルも公開しています！データ、モデル、コードすべて公開しています！ぜひ使ってみてください🙌 arxiv: arxiv.org/abs/2404.07824

thumb_up_off_alt204

chat_bubble_outline1

repeat44

shareShare

Lyaka

@lyakaap

2 years ago

前期のチームでの取り組みがやっと公開になりました...! GPT-4oをはじめとして強いVLMは沢山出ていますが、軽量に画像・テキストをベクトル化できる日本語CLIPは実サービスにおいても色んな場面で使えると思いますしかもApache 2.0ライセンス！

thumb_up_off_alt73

chat_bubble_outline1

repeat8

shareShare

Tomoaki

@tapioca_pudd

2 years ago

今週の #LayerX機械学習勉強会では、MLOpsにおけるバージョン管理の基礎と実践、Detectron2によるDocument Layout Analysisの実験、日本語のマルチモーダル基盤モデル「clip-japanese-base」などが紹介されました！ jobs.layerx.co.jp/aae666ef7d6047…

thumb_up_off_alt19

chat_bubble_outline2

repeat9

shareShare

LINEヤフー Tech

@lycorptech_jp

a year ago

8月6日(月)から開催される #MIRU2024 にて、LINEヤフーとして計10件の研究発表を行います。登壇スケジュールは画像のとおりです。現地にお越しの方は、ぜひご参加ください。私たちは、より良いサービスを提供するために、画像・マルチメディア領域の研究に取り組んでいます。

thumb_up_off_alt30

chat_bubble_outline0

repeat11

shareShare

Lyaka

@lyakaap

a year ago

#横浜優勝

thumb_up_off_alt11

chat_bubble_outline0

repeat0

shareShare

If you are curious how Multimodal LLMs work, I wrote a new article to explain the two main approaches, decoder-only- and cross-attention-style: magazine.sebastianraschka.com/p/understandin… Plus, I reviewed and summarized the 10 latest research papers to see how it's done in practice. Happy reading!

thumb_up_off_alt1,1K

chat_bubble_outline34

repeat315

shareShare

Lyaka

@lyakaap

a year ago

#ViEW2024 の特別講演2のセッションにてVLMのお話をします。 VLM開発の話、ヤフオクでの事業応用事例の紹介、実応用における課題や解決策の話など、盛りだくさんの内容になっていると思います。一時間という長尺ですがぜひ！

thumb_up_off_alt23

chat_bubble_outline0

repeat2

shareShare

しゅんけー「📕Pythonで学ぶ画像生成」発売中！

@shunk031

a year ago

同じ部の基盤モデルチームがありえん強いCLIP拡張モデルを作ってプロダクト応用ガッツリ進めている話😤 自社開発のマルチモーダル基盤モデルを用いたYahoo!オークションの出品審査効率化 techblog.lycorp.co.jp/ja/20241204a

thumb_up_off_alt114

chat_bubble_outline0

repeat9

shareShare

Mikihiro Tanaka

@mikittt417

10 months ago

#NLP2025 3月11日（火） 13:00-14:30 Q3で、日本語のマルチモーダル大規模言語モデルの開発に関するポスター発表をします。興味のある方はぜひ来てください！

thumb_up_off_alt20

chat_bubble_outline0

repeat1

shareShare

Ikki Tanaka(kyazuki)

@ikki407

10 months ago

ベールに包まれてたベイスターズを支えるAI活用いっぱい話すよ⚾️（16:00〜) ここから見れます！ techcon2025.dena.dev

thumb_up_off_alt19

chat_bubble_outline1

repeat2

shareShare

eisaku｜LayerX

@eisaku9393

9 months ago

3月7日はサウナの日です！ということでサウナ企画！実はサウナーの弊社代表福島良典 | LayerX や松本勇気 (Yuki Matsumoto) | LayerX CTO のおすすめサウナも紹介しています！是非見てみてください！🤟 -- LayerXメンバーが選ぶおすすめサウナ #日めくりLayerX｜Shimomura Eisaku eisaku｜LayerX #note note.com/jolly_koala293…

thumb_up_off_alt25

chat_bubble_outline0

repeat8

shareShare

Mikihiro Tanaka

@mikittt417

9 months ago

月曜日からNLP2025に参加します！以下の論文を発表する予定で、内容は 1. 日本語MLLMで既存の公開モデルの精度を上回るものができたこと 2. 新しく作成したJIC-VQAベンチマークについてになります。 JIC-VQA: huggingface.co/datasets/line-… 論文プロジェクページ: mikittt.github.io/posts/Japanese… #NLP2025

thumb_up_off_alt106

chat_bubble_outline2

repeat14

shareShare

Lyaka

@lyakaap

7 months ago

弊チームのサマーインターンの募集です！大規模な社内の画像データを使ったVLMの研究開発ができて楽しいと思うのでぜひ！ lycorp.co.jp/ja/recruit/new…

thumb_up_off_alt55

chat_bubble_outline0

repeat13

shareShare

すずどら

@sz_dr

3 months ago

最近やっていた仕事です Vespaを活用したYahoo!フリマのベクトル検索 —— 類似画像で広がる商品探索 techblog.lycorp.co.jp/ja/20250908c

thumb_up_off_alt72

chat_bubble_outline0

repeat15

shareShare

Lyaka

@lyakaap

a month ago

DeepSeek-OCRの文書をそのままビジョントークンとして圧縮するという話は、長いコンテキストを扱うのが得意なGeminiでも似たようなことをやっているかもという推測たしかに有り得そう

thumb_up_off_alt10

chat_bubble_outline0

repeat1

shareShare

speed

@strayer_13

a month ago

大規模かつ高品質な日本語画像テキスト対データセットのWAONを公開しました!🇯🇵 新たに構築した日本文化画像分類ベンチマークWAON-BenchにおいてWAONはReLAIONより効率的にモデルの性能を向上させ、SoTAの性能を達成することを示しています。ブログ記事もぜひご覧ください! speed1313.github.io/posts/WAON/

thumb_up_off_alt120

chat_bubble_outline1

repeat29

shareShare

Lyaka

dcai_community_jp

dcai_community_jp

dcai_community_jp

岡本大和 / Yamato.OKAMOTO / RoadRoller

Ino.Ichi

Lyaka

Tomoaki

LINEヤフー Tech

Lyaka

Sebastian Raschka

Lyaka

しゅんけー「📕Pythonで学ぶ画像生成」発売中！

Mikihiro Tanaka

Ikki Tanaka(kyazuki)

eisaku｜LayerX

Mikihiro Tanaka

Lyaka

すずどら

Lyaka

speed