Hiroyuki Deguchi (@de9uch1_) 's Twitter Profile
Hiroyuki Deguchi

@de9uch1_

Machine Translation, kNN Search, Decoding, Efficiency @ NAIST, NICT, NII/LLMC ← Ehime University

Gentoo / LISP / bebop jazz pianist

ID: 996831583096131589

linkhttps://sites.google.com/view/hdeguchi calendar_today16-05-2018 19:15:44

422 Tweet

310 Takipçi

275 Takip Edilen

Hiroyuki Deguchi (@de9uch1_) 's Twitter Profile Photo

We'll present "Centroid-Based Efficient Minimum Bayes Risk Decoding" at #ACL2024 #ACL2024NLP. We improved the speed of expectation calculation using centroid representations of sample texts. NAIST NLP 情報通信研究機構 Paper: arxiv.org/abs/2402.11197 Code: github.com/naist-nlp/mbrs

Prince Canuma (@prince_canuma) 's Twitter Profile Photo

Introducing MLX-Embeddings 🎉 Generate text and image embeddings locally on your Mac! 🍎 •Powered by Apple's MLX framework •Supports popular models like BERT & XLM-RoBERTa (Vision models and others coming soon) •Easy single-item & batch processing •Perfect for similarity

Introducing MLX-Embeddings 🎉

Generate text and image embeddings locally on your Mac! 🍎
•Powered by Apple's MLX framework
•Supports popular models like BERT & XLM-RoBERTa (Vision models and others coming soon) 
•Easy single-item & batch processing
•Perfect for similarity
Hiroyuki Deguchi (@de9uch1_) 's Twitter Profile Photo

先週2024/08/20にMiCS@東北大NLP Tohoku NLP Group にてMBRデコーディングについてのトークをさせていただきました。 MBRデコーディングの基本から最新の研究まで、数式と直感と実装を交えながら解説しました。 スライドも公開していますのでぜひご覧ください。 speakerdeck.com/de9uch1/202408…

先週2024/08/20にMiCS@東北大NLP <a href="/tohoku_nlp/">Tohoku NLP Group</a> にてMBRデコーディングについてのトークをさせていただきました。
MBRデコーディングの基本から最新の研究まで、数式と直感と実装を交えながら解説しました。

スライドも公開していますのでぜひご覧ください。
speakerdeck.com/de9uch1/202408…
Hiroyuki Deguchi (@de9uch1_) 's Twitter Profile Photo

We released mbrs v0.1.3 and the demo paper🎉 GitHub: github.com/naist-nlp/mbrs Paper: arxiv.org/abs/2408.04167 Docs: mbrs.readthedocs.io/en/latest/inde… Recent changes: - Reference aggregation (DeNero+, 2009; Vamvas+ Jannis Vamvas, 2024) - Diverse MBR (Jinnai+ Yuu Jinnai, 2024) - YAML-based config

Hiroyuki Deguchi (@de9uch1_) 's Twitter Profile Photo

#YANS2024 にて、柔らかいパターンマッチ(softgrep)のデモ発表をします。[S2-P02] 単語埋め込みによってパターンマッチを連続化した新しい検索法です。 類義語や表記揺れにも対処でき、柔らかくも厳密にマッチした事例を列挙できます。 コーパスから用例をパターン検索したい方などにおすすめです。

Hiroyuki Deguchi (@de9uch1_) 's Twitter Profile Photo

今回言語モデルは登場しませんし、ラップトップのCPUで動きます。 あくまでパターンマッチが根底にありまして、誤解を恐れずに言うと、semantic fuzzy pattern matchです。

Kohei Suenaga (@ksuenaga) 's Twitter Profile Photo

これは僕も少し噛んでいるのですが、「織田信長」を検索すると「豊臣秀吉」も引っかかるような検索手法で、面白いので、みんな聴きにきてねー。タコ部屋で頑張って最初の実装の数百倍速くなった。

sho_yokoi (@sho_yokoi) 's Twitter Profile Photo

出口さんを中心とした超強力な研究チームのコラボレーションによって、かなり面白いものができてしまいました。動くデモもあります softmatcha.github.io

出口さんを中心とした超強力な研究チームのコラボレーションによって、かなり面白いものができてしまいました。動くデモもあります softmatcha.github.io
chip (@chippwah) 's Twitter Profile Photo

やば、これ最高すぎる。多言語サポート欲しい。コーパス使う言語学者とかフィールドワーカーに絶対需要ある

chip (@chippwah) 's Twitter Profile Photo

Hiroyuki Deguchi @ EMNLP2024 素晴らしいです!公開されたらぜひ使ってみたいです。 リソースの量、有用性、言語的複雑さで言うとラテン語やギリシャ語でうまく行ったら面白そうです。形態論的に複雑で、性数格や時制の変化で数多の変化形を持つので、やわらかいgrepがこういう活用にも頑健だったらみんなが幸せになれます。

Hiroyuki Deguchi (@de9uch1_) 's Twitter Profile Photo

#YANS2024 にてデモ賞とリクルート賞(スポンサー賞)をW受賞しました。 発表に来ていただいた皆様、共著者&ご支援いただいた皆様(Go Kamoda Yusuke Matsushita Masaki Waga sho_yokoi Kohei Suenaga)、ありがとうございました。 ぜひデモで遊んで面白いパターンを探してみてください。 softmatcha.github.io

ぬこぬこ (@schroneko) 's Twitter Profile Photo

mt-auto-minhon-mlt.ucri.jgn-x.jp/content/tool/s… NICT の自動翻訳サイトがログインせずとも使えるように! arXiv と PubMedl の検索にも対応しており、検索が爆速で使い勝手がとても良いです!サーベイにめちゃ便利...ありがたや...

mt-auto-minhon-mlt.ucri.jgn-x.jp/content/tool/s…

NICT の自動翻訳サイトがログインせずとも使えるように!

arXiv と PubMedl の検索にも対応しており、検索が爆速で使い勝手がとても良いです!サーベイにめちゃ便利...ありがたや...
EAMT2024 (@eamt_2024) 's Twitter Profile Photo

#EAMT2024 proceedings are now available at the ACL anthology: aclanthology.org/events/eamt-20… #NLProc #MachineTranslation

Hiroyuki Deguchi (@de9uch1_) 's Twitter Profile Photo

We'll present our paper "mbrs: A Library for Minimum Bayes Risk Decoding" at #EMNLP2024 demo track. 🚀Various algorithms with efficient implementations 🧩Easy to extend 💻CLI and Python API Paper: arxiv.org/abs/2408.04167 Code: github.com/naist-nlp/mbrs Docs: mbrs.readthedocs.io/en/latest

We'll present our paper "mbrs: A Library for Minimum Bayes Risk Decoding" at #EMNLP2024 demo track.
🚀Various algorithms with efficient implementations
🧩Easy to extend
💻CLI and Python API
Paper: arxiv.org/abs/2408.04167
Code: github.com/naist-nlp/mbrs
Docs: mbrs.readthedocs.io/en/latest
PyTorch (@pytorch) 's Twitter Profile Photo

We are announcing that PyTorch will stop publishing Anaconda packages on PyTorch’s official anaconda channels. For more information, please refer to the following post on dev-discuss: dev-discuss.pytorch.org/t/pytorch-depr…