Hiroshi Saruwatari (@hsaruwatari727) 's Twitter Profile
Hiroshi Saruwatari

@hsaruwatari727

音メディア信号処理に関する研究と教育を生業にしております。

ID: 90437330

calendar_today16-11-2009 17:16:31

11,11K Tweet

2,2K Takipçi

43 Takip Edilen

Kentaro Seki / 関健太郎 (@trgkpc) 's Twitter Profile Photo

#yans2025 での下記発表につきまして、PKSHA Technologys様(PKSHA採用担当)よりスポンサー賞をいただきました。 [S1-P07] ステレオ信号に対する空間情報を伴う音響キャプショニング 本研究の実装上の意義を評価頂いたとのことで、大変光栄です!🥳 (arXiv版も是非ご覧ください!) #YANS2025

Yuki Okamoto (@yukiokamoto19) 's Twitter Profile Photo

D2関さん、M2金森さんがYANSシンポジウムでそれぞれスポンサー賞(株式会社PKSHA Technology賞、シェルパ・アンド・カンパニー株式会社賞)を受賞しました。おめでとうございます!👏 #YANS2025

Hiroshi Saruwatari (@hsaruwatari727) 's Twitter Profile Photo

We present papers in ASA-ASJ Joint Meeting: 1. Low-latency real-time BSS using asymmetric window 2. Switching distortionless BSS in underdetermined scenarios 3. Real-time hearing assistance system combining BSS and VC 4. TTS by perceptual rating parallel iterative decoding

Hiroshi Saruwatari (@hsaruwatari727) 's Twitter Profile Photo

Cont. 5. Continuous Function Approximation of Convolutional Kernels for Sampling Frequency Adaptation of Pre-trained Source Separation Networks 6. Analysis of a dataset for evaluating semantic relevance between text and audio

Hiroshi Saruwatari (@hsaruwatari727) 's Twitter Profile Photo

今日久しぶりに近所のハードオフ行ってきたけど、ギターコーナーは「ハードオフドリーム(そこそこ価値のある楽器がなぜか破格で売られている事)」がありそうだったけど、キーボードは全くそんなことないんですよね。ミニムーグとかプロフェット5とかが1万円なんてのは見たことがないですよねえ。

Hiroshi Saruwatari (@hsaruwatari727) 's Twitter Profile Photo

ミニムーグの価格高騰がすごい。都内のシンセ専門店では80万円を超えている。ヤフオクでも60万円超え。私が20年前に買ったときは30万円で買えた。1990年代の音楽雑誌の広告を見ると10万円台後半でも買えたらしい。基本、電子楽器は年とともに価格下落するけど、こういう銘器は別ですね。

k_imamura (@imamura_asp) 's Twitter Profile Photo

Journal presentationで発表しました! 論文の方も読んでいただけるととても嬉しいです🙇‍♂️ nowpublishers.com/article/Detail…

Journal presentationで発表しました!
論文の方も読んでいただけるととても嬉しいです🙇‍♂️
nowpublishers.com/article/Detail…
Hiroshi Saruwatari (@hsaruwatari727) 's Twitter Profile Photo

Our paper titled "TTSOps: A Closed-Loop Corpus Optimization Framework for Training Multi-Speaker TTS Models from Dark Data" has been ACCEPTED for publication in IEEE Trans. on Audio, Speech and Language Processing. Congratulations, Seki-kun!

Yuki Saito (@ysaito_human) 's Twitter Profile Photo

The following paper has been accepted for the Speech Communication journal: D. Yang et al., "Speaker-Conditioned Phrase Break Prediction for Text-to-Speech with Phoneme-Level Pre-trained Language Model" Congrats!!👏👏👏

Hiroshi Saruwatari (@hsaruwatari727) 's Twitter Profile Photo

Our paper titled "Stride Conversion Algorithms for Convolutional Layers and Its Application to Sampling-Frequency-Independent Deep Neural Networks Signal Processing" has been ACCEPTED for publication in Signal Processing (Elsevier). Congratulations, Imamura-kun!

Hiroshi Saruwatari (@hsaruwatari727) 's Twitter Profile Photo

弊研M1の錦織君が日本音響学会2025年秋季研究発表会における以下の発表に関して、学生優秀発表賞を受賞いたしました。おめでとうございます! 錦織広尚 他「空間正則化付きILRMAと雑音事前分布ありランク制約付き空間共分散行列推定法を用いたドローン搭載マイクロホンアレーによる音声抽出」

Kentaro Seki / 関健太郎 (@trgkpc) 's Twitter Profile Photo

Our paper titled "Toward Data-Efficient Speech Synthesis: Active Learning–Based Corpus Construction for Multi-Speaker Text-to-Speech Synthesis" has been ACCEPTED for publication in IEEE Access! Many thanks to great co-authors!

Hiroshi Saruwatari (@hsaruwatari727) 's Twitter Profile Photo

Our paper titled "Excitement-inducing commentary text-to-speech system for fighting game video scenes" has been ACCEPTED for publication in IEEE ACCESS. Conglaturation, Iura-san and Saito-sensei!

Kentaro Seki / 関健太郎 (@trgkpc) 's Twitter Profile Photo

Our paper Spatial-CLAP has been accepted to #ICASSP2026! Many thanks to my amazing co-authors. Also, our IEEE TASLP paper (TTSOps) has been accepted for Journal Presentation. See you in Barcelona! 🇪🇸

Hiroshi Saruwatari (@hsaruwatari727) 's Twitter Profile Photo

The following 4 papers are ACCEPTED in ICASSP2026. YANG: Layer-wise self-distillation for MOS prediction SEKI: Learning spatially-aware audio-text embeddings IMAMURA: Dissecting performance degradation in sampling-mismatch SS NAKATA: Fast & Robust Multilingual Speech Restoration

Hiroshi Saruwatari (@hsaruwatari727) 's Twitter Profile Photo

In addition, we have 3 journal-paper presentation. YANG: Speaker-conditioned phrase break prediction for TTS IMAMURA: Stride conversion for sampling-frequency-independent DNNs SEKI: TTSOPS: A Closed-loop corpus optimization for training multi-speaker TTS models from dark data