『BookFab AudioBook作成』ソフトウェア解説 AIでテキストを自然なMP3音声データに変換【製品提供記事】 評価:3 hamachi 公開:2024年12月6日(3週間前) / 更新:2024年12月11日 コメント 0件 ソフトウェアレビューDVDFabオーディオブックソフトウェアツール製品提供記事 SNS X Facebook B! はてブ Pocket 当記事の内容および記事中のリンクには、広告目的や当サイトが収益を得るためのものが含まれており、これらの収益によってuzurea.netは運営されています。 当記事で紹介するのはAI技術を活用してテキストから自分だけのオーディオブックを作成できるソフト『BookFab AudioBook 作成』。テキスト文章からMP3/OPUS形式の音声へ変換し、オーディオブックとして楽しめる……というアプリケーションで、2024年10月にDVDfabやStreamFabといったソフトウェアをリリースするDVDFab Software Inc.が新たにリリースした製品です。 記事の索引1 高品質テキスト→音声変換ソフト 『BookFab AudioBook 作成』解説1.1 BookFab AudioBookの基本機能と特徴1.2 ソフトウェアライセンスと、単語変換クレジットについて1.3 インストールとライセンスの購入・登録について1.4 購入したライセンスののアクティベート方法1.5 テキスト→音声データへの変換の流れ2 まとめとレビュー2.1 BookFab AudioBook 総合評価3 関連リンク 高品質テキスト→音声変換ソフト 『BookFab AudioBook 作成』解説 『BookFab AudioBook 作成』製品イメージ DVDFabから2024年10月にリリースされたPC向けソフトウェア『BookFab AudioBook 作成(ブックファブ・オーディオブック作成/以下BookFabと短縮して表記)』は、AIを搭載し、テキストファイルから合成を使ってオーディオブックを生成するソフトウェア。当記事の掲載時点ではWindows版のみがリリースされています。 これまでテキストからの音声合成は、Text-to-SpeechやAquesTalk(ゆっくりボイス)といった棒読みタイプのものが主流で、ロボットのような発音が特徴的でした。しかし近年、ボイスロイドやChatGPTのようなAI技術を応用したサービスの登場により、自然な言語表現としての音声合成ができるようになってきました。 BookFab 当記事掲載時点での最新版 1.0.0.4 当記事で紹介するBookFab AudioBookに、そんなAI技術を用い、比較的簡単な操作で高品質な朗読音声を生成できるというソフトです。 BookFab AudioBook 作成公式サイト BookFab AudioBookの基本機能と特徴 繰り返しになりますがBookFab AudioBookはAI技術を駆使して、簡単に自然で流暢な音声データを作成するソフトです。おおまかな基本機能は下記のとおり。 テキストデータから音声へ変換 BookFab AudioBookのテキスト入力欄にテキストを入力またはペーストするか、『.txt』ファイルを読み込ませ、いくつかの設定を適用する事で簡単に音声データに変換する事ができます。 当記事掲載時点では日本語と英語の音声にのみ対応 多彩な音声タイプ 日本語・英語それぞれに、井上雄介、斎藤由美といった架空の名称の性別/年齢がの異なる20以上の音声タイプ(後述)を用意 音質の設定項目 シンプルで分かりやすい下記の設定項目が存在します 表現力(高・中・低) 静音=間のとり方(静音の開始、センテンス静音、段落静音、いずれも1ms毎に設定可能) プソロディー=特徴(スピード=ピッチ、ラウドネス=音量の設定項目のみ) 発音(単語毎にエイリアス=特殊な読み方と、プリセット読み上げルールを設定可能) 多様な出力形式:MP3やWAV、OPUS形式など、利用用途に応じた出力に対応しています。 ソフトウェアライセンスと、単語変換クレジットについて BookFab AudioBookには無料で設定項目などを確認できるだけの試用版の他に、いくつかのライセンス種別があります。またソフトウェアのライセンス以外に、テキストの変換にあたって単語毎にクレジットが消費されるような従量課金システムとなっています。 ライセンス 無料試用 1ヵ月ライセンス 1年ライセンス 無期限版 料金 無料 4,130円 8,270円 13,790円 変換単語クレジット(※) 変換不可 初回10万語分 初回50万語分 初回100万語分 音声の種類 限定的 20種類以上の音声選択(男性、女性、若い声、大人の声など) カスタマイズ機能 基本的な設定のみ スピード、感情の豊かさ、静音などの詳細なカスタマイズが可能 音声の品質 標準的な音声品質 高品質な音声ファイル(MP3、OPUS形式) 商用利用 制限あり 商用利用可能 その他 AIの幻覚(ハルシ―ション)防止強度設定あり ※単語クレジットが不足すると、ソフトウェアライセンスが有効でもテキスト→音声からの新規変換ができなくなります。この単語クレジットの追加費用はWebサイトに記載がないため、問い合わせ中です。 インストールとライセンスの購入・登録について ソフトウェアのインストールは数ステップで完了します。またライセンスの購入・登録についてもオンライン経由で行う事になります。大まかな流れとしては…… 公式サイトから試用版/インストーラーをダウンロード PCにインストール DVDFab公式サイトにサインイン/ログインし、ライセンスを購入 BookFab AudioBookを起動し、ライセンスを購入したアカウントでログイン となります。 BookFab AudioBook公式サイト 『試用版/インストーラー』ダウンロードページへ 公式サイトにアクセスし『無料ダウンロード』をクリックするとインストーラーをダウンロードできる BookFabを含め、DVDFab社がリリースしているDVDFab、StreamFab、MusicFabといったソフトウェアはDVDFabのアカウントと紐づけられますので、製品版を購入して利用するのであれば、DVDFabアカウントの作成は必須という事になります。 購入したライセンスののアクティベート方法 BookFab AudioBookを初回起動画面で画面右下の『認証』をクリックすればログイン画面が表示されます。ライセンスが購入済みであればここでDVDFabアカウントのメールアドレスとパスワードを入力すれば、自動的にアクティベートされます。 初回起動時の画面で『認証』をクリックすればDVDfabでログインできる アプリケーション起動後であれば、画面右上の『≡』のようなアイコン> 『認証』 と操作する事で同様にログインする事ができます。 アプリケーション起動後は右上のドロワーメニューからログインできる テキスト→音声データへの変換の流れ BookFab AudioBookでは、数ステップで朗読音声データを作成する事ができます。作業画面は下記のとおり3つのカラムに分かれています。 BookFab AudioBook ソフトウェアメイン画面 各カラムとその機能は…… 左カラム:画面切り替えメニュー 『テキストから音声』は音声制作画面 『タスクキュー』はこれまで制作したファイル一覧が表示されます 中央カラム:テキスト入力欄 テキストを『入力/貼り付け/.txtテキストファイルインポート』します 下部には再生ボタンがあり、生成された音声を確認することもできます 現時点では最大3000文字づつしか生成できません 右カラム:設定メニュー 生成する音声の設定を調整できる箇所 となっています。実際に音声データにする流れは下記の通り テキストの準備 音声化したいテキストを中央の入力欄に入力ます。 もちろんコピー&ペーストでテキストを貼り付けても良いですし、.txt形式のテキストファイルが手元にあれば、それをアップロードする形でもOKです。 テキスト入力欄にテキストを入力 生成音声の設定を行う 音声の各種設定を行います。 まずはテストしてみようという人は、一旦この工程をスキップしてもOKです。 右カラムの調整エリアと生成開始ボタン 各種設定項目について、簡単に解説しておきます。 言語欄 英語と日本語の切り替え ベースとなる音質を表す架空キャラクター(※)が用意されているので、好みで選択します。キャラクターにはそれぞれサンプルボイスが用意されています。 表現力 読み上げ時の抑揚の度合いを『高・中・低』の3段階で調整できます 静音 段落やセンテンス間に入れる無音の時間をms(ミリ・セコンド)で調整 プロソディー スピード=読み上げの速度 の調整 ラウドネス=基本音量 の調整 発音 通常と違う読み方をする単語に読みを定義づけする(下記例:「uaurea.net」を「うずらどっとねっと」と読ませる、など) 発音の定義づけは、SFやファンタジー作品を音声化する際には活躍しそうです 架空の各キャラクターには英語/日本風の個別の名前がついています。(日本語版のキャラクターには日本使わないような漢字が使われているあたりはスルーしましょう)。 折角なので各キャラクターの特徴について個人的な解釈でまとめてみました。中国語の漢字が割り当てられているものはそのままにしています。 キャラクター名 特徴(非公式のものです) 井上雄介 若い男性、中音域 佐木太郎 若い男性、やや高め、儚い声 佐木美子 若い女性、中音域 佐藤由美 若い女性、やや低め、ややハスキー 小林隆 成人男性、ややハスキー、中音域 小林静香 成人女性、やや高め、硬い声 山本奈奈 女性、中年~、落ち着いた声 山本清子 女性、落ち着いた声、モノローグ風 山本拓也 男性、やや低音域、硬い雰囲気、モノローグ風 山田次郎 男性、中・低音域、柔らかな声 山田純子 女性、中・高学生くらいの若い声 木村浩二 成人男性、やや低め、硬い声 木村绫子 成人女性、やや低め、柔らかな声 本田裕树 成人男性、低めの声、硬い声 樱井美雪 成人女性、やや低め、硬い声 渡边美奈 成人女性、中音域、柔らかなゆったりとした声 渡边雄太 成人男性、中年~、やや低め 田中佳代 若い女性、中音域、やや硬め 田中宏 男性、やや高め、真面目な雰囲気 铃木一郎 男性、中音域、機械的な声 铃木雅子 女性、やや高め、機械的な声 长谷川智也 男性、やや低め、柔らかい声、塩沢〇人 高桥惠子 女性、柔らかい 高桥正雄 男性、中年、やや低い 音声の生成 各種設定をしたら、画面右下の変換開始ボタンをクリック。テキストの変換がスタートします。 静止には結構時間がかかりますが、完了すると音声ファイルが生成され、中央カラム下部での再生やが出来ます。また、左カラム『タスクキュー』からデータが参照できるようになります。 タスクキュー 左カラム『タスクキュー』からデータが参照できるようになります。 各ファイルの右にあるアイコンは、左から再生・生成画面へ読み込み・格納フォルダを開く・ファイルの削除です。 タスクキュー画面 まとめとレビュー ざっと触ってみたところ、『BookFab AudioBook 作成』はかなり使いやすいソフトという印象です。初心者でも迷わず操作できるシンプルなインターフェースで、設定項目も少なく、専門知識がなくても手軽に音声合成を楽しむことができます。 生成される音声も、予想以上に自然なもので、基礎的な部分には満足できるクオリティです。イントネーションや抑揚についてはまだ『音声合成らしさ』が感じられますが、ボーカロイドなどで入念な調整をした事がある人であれば、このレベルのものが半自動で生成される事の凄さは分ると思います。 設定項目がシンプルというのは、逆に言うと設定項目が少ないとも言えます。センテンスごとに抑揚やスピードを調整できる設定があれば、より自然な音声にする事が出来るかもしれません。とはいえ、そういった細かい設定はすべてAIに任せて、データ収集によるAIの進化を待つ……というのがこのソフトの設計思想なのかもしれません。 また、テキスト入力欄が現時点では最大3000文字までというのも『オーディオブック』を作るには少なすぎると思います。短編小説位であれば足りるかもしれませんが、一般的な小説をオーディオブックにしたいという目的であれば、物足りないでしょう。 3000文字事に音声化していく……という手間が苦にならない方であれば別ですが、小説投稿サイトの作品や、青空文庫などの本格小説を音声化してながら聞き……みたいなことをしたいという方は、購入はもう少し待った方がよいかもしれません。 なお、私の環境では生成された音声ファイルの一部が途切れていたり、エイリアス部分が二重に読まれるなどの細かな不具合も見受けられました。 BookFab AudioBook 総合評価 機能 ★★★(3)カスタマイズ項目は複雑ではないにも関わらず設定の振れ幅が大きく、ここをいじっているだけでも楽しいです。 動作 ★★☆(2.5)動作自体はとても軽快ですが、生成に時間がかかる点、出力される音声にいくつかの不具合がある点は気になりました。 使いやすさ ★★★★(4)直感的なユーザーインターフェースにより、複雑な操作は必要ありません。初回利用からスムーズな操作が可能です。 価格 ★★★☆(3.5)買い切り13,790円はどの程度利用するかにもよって見え方が違ってくるが、単語単位での課金も含め、やや高く感る。ソフト名のとおりオーディオブックを作ろうとするとかなりの費用をかけなければならないのでは。 総合評価 ★★★(3)処理速度、操作性、カスタマイズ性など、今後のバージョンアップへの期待込みで★3とします。 『BookFab AudioBook 作成』のレビュー(最大星5つ/0.5刻み/9段階評価) BookFab AudioBook 作成公式サイト 関連リンク DVDFab、StreamFab、UniFab、MusicFabセール&クーポン情報まとめ DVDFab XI プレミアム(BD/DVDディスクコピー・作成・動画変換) ジャングル ¥12,718 (2024/12/26 08:35:09時点 Amazon調べ-詳細) Amazonでのレビューを見る Amazonで探す 楽天市場で探す Yahoo!ショッピングで探す メルカリで探す