Hung-yi Lee

計算と言語テキスト生成における名前の混乱の解決

新しい方法であいまいな名前のコンピュータ生成テキストのファクトチェックが改善された。

2025-09-09T17:30:48+00:00 ― 1 分で読む

音声・音声処理 AV-SUPERBを紹介するよ：音声・映像モデルの新しいベンチマークだ！

AV-SUPERBは、より良いパフォーマンスのためにさまざまなタスクで音声と視覚のモデルを評価するよ。

2025-09-08T22:32:35+00:00 ― 1 分で読む

音声・音声処理リボーン：教師なしASRの新時代

Rebornは、ラベル付きデータなしで自動音声認識の革新的なソリューションを提供してるよ。

2025-08-25T19:16:10+00:00 ― 1 分で読む

計算と言語音声スタイルを通じて言語モデルを進化させる

新しいフレームワークが言語モデルを強化して、いろんな話し方に気づいて反応できるようになったんだ。

2025-08-23T00:03:45+00:00 ― 1 分で読む

音声・音声処理 Codec-SUPERB: サウンドコーデックのベンチマーク

さまざまなアプリケーションでオーディオコーデックのパフォーマンスを評価する新しいシステム。

2025-08-22T23:15:10+00:00 ― 1 分で読む

音声・音声処理 SUPERBでスピーチ処理モデルを評価する

音声タスクにおける基盤モデルを評価するための新しいフレームワーク。

2025-08-11T09:31:05+00:00 ― 1 分で読む

計算と言語 StreamBench: リアルタイムで言語モデルを評価する

フィードバックを通じて言語モデルの継続的な改善を評価する新しいツール。

2025-07-30T03:52:30+00:00 ― 1 分で読む

音声・音声処理動的TTAを使った自動音声認識の進展

新しい方法で、騒がしい環境でもスピーチ認識が良くなる適応技術が使われてるんだ。

2025-07-29T13:49:25+00:00 ― 1 分で読む

計算と言語音声対話システムの進歩

新しい方法で疑似ステレオデータを使って機械対話が改善される。

2025-07-25T08:36:30+00:00 ― 1 分で読む

計算と言語 DogeRMフレームワークで言語モデルを改善する

DogeRMは、一般的なモデルとドメイン特化型モデルを組み合わせて、言語モデルのパフォーマンスを効果的に向上させるんだ。

2025-07-21T17:22:18+00:00 ― 1 分で読む

音声・音声処理知識蒸留を使ったコードスイッチングASRの改善

新しいフレームワークが限られたデータとリソースでASRのパフォーマンスを向上させる。

2025-07-15T22:41:45+00:00 ― 1 分で読む

音声・音声処理スピーチコーデックと感情の保存

音声データの中でコーデックが感情のトーンをどう保持するかを調べてる。

2025-07-12T06:26:10+00:00 ― 1 分で読む

計算と言語 LLMを強化する：SQLクエリにおけるユーザーサポートの役割

この記事では、ユーザー支援が大規模言語モデルのSQLクエリ生成のパフォーマンスをどう改善できるかを考察します。

2025-07-09T18:04:30+00:00 ― 1 分で読む

計算と言語フォーマット制限がLLMのパフォーマンスに与える影響

この記事は、構造化生成が言語モデルの推論と理解にどのように影響するかを調べている。

2025-07-02T00:09:42+00:00 ― 1 分で読む

計算と言語スピーチランゲージモデルのバイアス評価

新しいデータセットが、性別や年齢に基づくスピーチモデルのバイアスを明らかにしてるよ。

2025-06-30T19:07:50+00:00 ― 1 分で読む

音声・音声処理スピーチモデルのニューロンについてのインサイト

研究によると、スピーチモデルのニューロンが音の重要な特徴をどう認識するかがわかったよ。

2025-06-17T11:17:25+00:00 ― 1 分で読む

音声・音声処理限られたリソースでの音声モデルの効率的なトレーニング

この記事では、自己教師あり学習を使った音声モデルの効率的なトレーニング方法について話してるよ。

2025-06-16T15:02:50+00:00 ― 1 分で読む

音声・音声処理リソースが少ない言語での感情認識の向上

この研究は、リソースが豊富なデータを使ってあまり一般的じゃない言語の感情認識システムを強化するもので。

2025-06-08T07:51:20+00:00 ― 1 分で読む

計算と言語 LLMのナarrative reasoningスキルを評価する

この研究は、LLMが映画の要約で物語のトロープをどれくらい理解しているかを評価しているよ。

2025-06-07T23:11:54+00:00 ― 1 分で読む

音声・音声処理ニューラルオーディオコーデックの評価：Codec-SUPERBチャレンジからの洞察

Codec-SUPERBチャレンジの結果とコーデックのパフォーマンス指標を見てみよう。

2025-06-05T06:58:50+00:00 ― 1 分で読む

音声・音声処理トレーニングデータが少なくても言語モデルの進化

新しいスピーチ言語モデルの方法は、大量のデータの必要性を減らす。

2025-05-29T17:50:26+00:00 ― 1 分で読む

計算と言語音声言語モデルの進化

Align-SLMがコンピュータ音声生成をどう変えてるか探ってみて。

2025-05-25T12:16:30+00:00 ― 1 分で読む

計算と言語台湾のマンダリン会話用チャットボットを作る

台湾の普通話で自然な会話ができるAIモデルを作ってる。

2025-05-20T03:51:26+00:00 ― 1 分で読む

サウンド新しい言語を学ぶためのシンプルなステップ

新しい言語を効果的に学ぶための実用的なヒントガイド。

2025-04-21T06:21:36+00:00 ― 1 分で読む

サウンド自動音声認識の進歩

新しい方法が機械の話し言葉の認識を改善してる。

2025-04-20T10:37:12+00:00 ― 1 分で読む

音声・音声処理見えない言語の自動音声認識の進展

新しい方法が、これまで遭遇したことのない言語のASRシステムを改善してるよ。

2025-02-05T19:53:24+00:00 ― 1 分で読む

計算と言語大きな言語モデルを安全で効果的に保つこと

新しい方法がモデルを統合して、安全性とパフォーマンスを向上させる。

2025-01-22T06:45:27+00:00 ― 1 分で読む