OpenAI 在最新(2024/12/18)的直播中,宣布推出了 ChatGPT 的電話和 WhatsApp 服務,讓使用者能夠透過電話或 WhatsApp 與 AI 進行互動,無論是語音通話還是文字對話,都能無縫地與 ChatGPT 溝通,進一步降低使用 AI 的門檻。美國用戶只要用電話撥打1-800-CHATGPT(1-800-242-8478),就可以跟ChatGPT進行通話。
OpenAI 為何要推出這項服務呢?我們從近期所公開的資料中,發現一些端倪,OpenAI目前語音數據的處理存在幾個關鍵性的不足之處。例如,在解碼器效能方面,雖然可以透過無監督方式來預訓練語音編碼器,但卻缺乏相對應效能的解碼器,這直接限制了將語音表示轉換為實用輸出的能力。
以及,現有系統在微調方面也面臨重大挑戰。模型往往需要針對特定場景進行微調,而這個過程不僅複雜,還需要專業人員的參與。更棘手的是,即使完成微調,模型可能也只適用於特定數據集,難以推廣到其他應用場景。
第三則是高品質標註數據的不足。現有的高品質語音識別數據集規模相當有限,雖然可以透過自動標註管道來擴充數據集,但其規模仍遠遠不及無監督訓練所使用的數據集。具體來說,目前監督式訓練的數據集僅有約5,140小時,相較於無監督訓練所用的約1,000,000小時數據量,差距相當顯著。
或許也是這個原因,讓OpenAI決定推出通話服務,可直接取得更多語音數據,強化它的技術優勢。此外,專家認為1-800-CHATGPT電話服務的推出,還可以獲得的商業優勢包括 :
- 降低使用門檻
- 不需要安裝app或註冊帳號,任何人只要有電話就能使用
- 適合年長者等不熟悉科技的族群
- 特別有利於開發新興市場或數位基礎建設較弱的地區
- 多場景應用價值
- 開車時可以用語音互動處理事務
- 視障人士可以更方便地使用AI服務
- 手部受限或不方便打字的情境下都能使用
- 商業模式創新
- 可以採用電信收費模式,按通話時間計費
- 能與電信商合作開發增值服務
- 企業可以整合進客服系統,提供24/7服務
總結來說,OpenAI 推出 ChatGPT 的電話和 WhatsApp 服務,主要目的是為了解決現有語音數據處理中的不足,如解碼器效能、微調挑戰和高品質標註數據的缺乏。通過這些新服務,OpenAI 除了可以收集更多的語音數據來提升技術,又可以降低使用者的門檻、適應不同使用者群體、多場景應用以及創新的商業模式,獲得多重商業上的優勢。您認為這是個好策略嗎?
參考資料:
- 1-800-CHAT-GPT—12 Days of OpenAI: Day 10 (2024/12/19, OpenAI, Youtube)
- OpenAI推新服務:撥電話和ChatGPT通話!背後藏什麼目的?
圖片來源: 由Grok AI工具生成