ボイス生成のよくある質問
はい、完全無料です。ブラウザだけで動作するためサーバー費用が発生せず、利用回数や生成時間の制限もありません。商用利用も可能です。
いいえ。リファレンス音声・入力テキスト・生成音声のすべてがブラウザ内で処理され、AudioBuff のサーバーや Resemble のサーバーには送信されません。
最低 10 秒、推奨は 15〜20 秒です。10 秒未満では声質の抽出が不安定になり、20 秒を超えると品質はほぼ頭打ちになります。録音時はノイズの少ない環境で、自然なテンポで読み上げてください。
現在は英語のみ対応(ベータ版)です。Resemble が 2025 年 12 月にリリースした Chatterbox Multilingual(23 言語対応)の Transformers.js 移植が完了次第、AudioBuff にも順次導入予定です。
はい、Resemble Perth と呼ばれるニューラル透かしが常時埋め込まれます。聴こえないものの、MP3 圧縮・リサンプリング後も検出可能で、後から AI 合成音声であることを技術的に確認できます。AudioBuff 側でオフにする方法はありません。
現在 iOS Safari / macOS Safari は非対応です(WebKit JSEP の既知バグでクラッシュ確率が高いため)。Chrome / Edge / Firefox の最新版でご利用ください。WebGPU 非対応の環境でも WebAssembly フォールバックで動作します。
約 1.5GB のモデルファイルを初回のみダウンロードし、ブラウザの IndexedDB に永続キャッシュします。2 回目以降はオフラインでも動作します。「キャッシュをクリア」ボタンでいつでも削除できます。
はい。生成完了後の「音声加工エディタで仕上げる」ボタンから、EQ・ラウドネス正規化・MP3 書き出しが行える音声加工ページへ直接ハンドオフできます。クローン → 仕上げ → 配信フォーマット化までブラウザを離れず完結します。
本人または明示的な許諾を得た声のみを使用してください。他人の声を無許諾でクローンして公開する行為は、米国 ELVIS Act など各国の法律で違法とされる可能性があり、責任は利用者本人が負います。EU 圏で配布する場合は AI 合成音声であることの開示も必要です。