このツールは、PDFファイルをAIに解説してもらうツールです。音声化にはVOICEVOXを使用しています。
以下のようなウェブUIを提供します。
- 新しめのdocker
- cpuアーキテクチャ: x86
- linux(他環境での動作確認無し。wslでもいけるかも。arm/macは怪しい。)
voicevox-engine を利用します。 以下が実行例です。
docker run --gpus all -d --rm \
-p 50021:50021 \
voicevox/voicevox_engine:nvidia-latest
docker run -d --rm \
-p 50021:50021 \
voicevox/voicevox_engine:cpu-latest
.env ファイルを .env.example からコピーして環境変数を設定します。
特に、OPENAI_API_KEYの設定が必要です。
$ bash ./scripts/launch.sh
起動したら http://localhost:8000 にアクセスしてください。
左上の入力ボックスに対象とするPDFファイルのURLを入力して「開始」をクリックしてください。しばらくすると再生が始まります。 「次ページ」で次のページに進みます。他のボタン等も試してみてください。
- モデルは gpt-4o 固定です。
- 音声は ずんだもん 固定です。
- PDFのURLは公開されているものに限ります。ローカルファイルをアップロードすることはできません。