Unprofessional Audio & Video Processing Suite
💡 硬體建議結論:
• 本系統內建模型龐大,強烈建議具備 NVIDIA 獨立顯示卡 (RTX 系列佳) 以獲得最完美的秒殺級處理速度。
• 若為 AMD 顯卡、Intel 內顯或 Mac 系統,程式將自動轉由 CPU (中央處理器)
進行運算,需耗費較長時間,敬請見諒。
本軟體內建許多先進的開源語音 AI 模型 (例如 Demucs, RVC,
GPT-SoVITS,
Whisper),這些模型都需要強大的運算能力。
目前全世界 90% 的主流開源 AI 專案底層都是仰賴一套叫做 PyTorch 的框架,並搭配 NVIDIA 專屬的運算語言
「CUDA」。因為其他品牌的顯卡 (如 AMD) 硬體內沒有 CUDA 核心,所以程式啟動時會判定「找不到合適的 AI 加速器」,進而自動將任務轉交給 CPU 處理
(也就是我們畫面上的紅字:使用 CPU mode)。
考量到完整的 AI 模型體積龐大,您所下載的軟體可能會有「完整版」與「中量版」的差異。這兩者的**核心功能機制完全相同**,唯一的差別在於是否搭載了龐大的 GPT-SoVITS (聲音複製) 資料夾:
GPT-SoVITS 完整訓練與推論環境。左側選單會顯示「聲音複製」功能,您可以直接使用所有工具。💡 提示:未來程式更新與手動減肥
1. 程式更新: 未來若主程式有更新,您只需要下載最新的 Studio0808.exe 主程式檔案,並覆蓋掉原本資料夾裡的舊檔即可,**完全不需要重新下載這些龐大的核心模組與模型資料夾**!
2. 手動減肥: 如果您下載的是完整版,但發現自己暫時用不到聲音複製功能,或是硬碟空間吃緊,您只需要**直接刪除程式根目錄下的 GPT-SoVITS 資料夾**,程式在下次啟動時就會自動變成「中量版」並釋放龐大的空間!
是的,本系統完全支援多工處理!
程式在設計時,已為每個耗時任務 (包含格式轉換、影音下載、人聲分離等) 開闢了獨立的背景執行緒或子程序。只要您的電腦硬體效能 (CPU、記憶體、顯卡 VRAM) 足夠,您絕對可以:
任務之間互不干擾,主畫面也不會卡死。唯一的瓶頸僅為您電腦的硬體極限 (如:同時開啟太多 AI 模型導致 VRAM 不足,或硬碟讀取達到上限)。
本軟體及內建之所有整合開源工具 (包含影音下載、語音模型、翻譯器等),僅供個人學習、研究與學術交流使用。
為了保持您的電腦乾淨,本軟體的輸出檔案與依賴模型都有統一的路徑規劃:
Outputs\ (所有作品輸出區)
Downloads\:影音下載的原始檔案位置Vocals\:人聲分離後的乾淨音軌及伴奏RVC\:RVC 變聲後的作品Cloned\:GPT-SoVITS 複製合成的語音models\ (各功能專屬 AI 模組)
.pth、.ckpt 或是 .index
等人物聲音檔案,請依據功能放進對應的資料夾中 (models\RVC 或 models\SoVITS)。如果您想將「即時變聲」的聲音傳到 Discord、Line 或遊戲語音 中被別人聽到,您必須另外在電腦上安裝免費的「虛擬音源線」軟體,例如 VB-Audio Cable。
這就像是拉了一條虛擬的電線,把我們程式發出的變聲軌,直接督進 Discord 的麥克風插孔裡。詳細設定方式請參考「即時變聲」介面上的【設置說明】按鈕。
本軟體整合了以下強大的開源引擎與技術底層,為確保最佳相容性,已針對最新硬體 (含 RTX 50 系列) 進行優化: