VoxtLM:VoxtLM:音声とテキストの出会いル。音声タスクを一つのシステムにまとめたモデ音声・音声処理VoxtLM:音声とテキストの統一アプローチVoxtLMは、音声認識、合成、テキスト生成、そして継続を1つのモデルにまとめているよ。2025-09-13T11:02:45+00:00 ― 1 分で読む
SynesLM:SynesLM:音声視覚モデル強化するモデル。音声と映像データを使って音声認識と翻訳を音声・音声処理SynesLM: 音声映像技術の進歩新しいモデルが音声と視覚データを統合して、音声認識と翻訳を行うんだ。2025-07-06T20:04:15+00:00 ― 1 分で読む