OpenAI推出ChatGPT電話服務:技術與商業戰略的雙重佈局

OpenAI 在最新(2024/12/18)的直播中,宣布推出了 ChatGPT 的電話和 WhatsApp 服務,讓使用者能夠透過電話或 WhatsApp 與 AI 進行互動,無論是語音通話還是文字對話,都能無縫地與 ChatGPT 溝通,進一步降低使用 AI 的門檻。美國用戶只要用電話撥打1-800-CHATGPT(1-800-242-8478),就可以跟ChatGPT進行通話。

圖片來源 : 1-800-CHAT-GPT—12 Days of OpenAI: Day 10 (2024/12/19, OpenAI, Youtube)

OpenAI 為何要推出這項服務呢?我們從近期所公開的資料中,發現一些端倪,OpenAI目前語音數據的處理存在幾個關鍵性的不足之處。例如,在解碼器效能方面,雖然可以透過無監督方式來預訓練語音編碼器,但卻缺乏相對應效能的解碼器,這直接限制了將語音表示轉換為實用輸出的能力。

以及,現有系統在微調方面也面臨重大挑戰。模型往往需要針對特定場景進行微調,而這個過程不僅複雜,還需要專業人員的參與。更棘手的是,即使完成微調,模型可能也只適用於特定數據集,難以推廣到其他應用場景。

第三則是高品質標註數據的不足。現有的高品質語音識別數據集規模相當有限,雖然可以透過自動標註管道來擴充數據集,但其規模仍遠遠不及無監督訓練所使用的數據集。具體來說,目前監督式訓練的數據集僅有約5,140小時,相較於無監督訓練所用的約1,000,000小時數據量,差距相當顯著。

圖片來源 : US20240354521A1
MULTI-TASK AUTOMATIC SPEECH RECOGNITION SYSTEM

或許也是這個原因,讓OpenAI決定推出通話服務,可直接取得更多語音數據,強化它的技術優勢。此外,專家認為1-800-CHATGPT電話服務的推出,還可以獲得的商業優勢包括 :

  1. 降低使用門檻
  • 不需要安裝app或註冊帳號,任何人只要有電話就能使用
  • 適合年長者等不熟悉科技的族群
  • 特別有利於開發新興市場或數位基礎建設較弱的地區
  1. 多場景應用價值
  • 開車時可以用語音互動處理事務
  • 視障人士可以更方便地使用AI服務
  • 手部受限或不方便打字的情境下都能使用
  1. 商業模式創新
  • 可以採用電信收費模式,按通話時間計費
  • 能與電信商合作開發增值服務
  • 企業可以整合進客服系統,提供24/7服務

總結來說,OpenAI 推出 ChatGPT 的電話和 WhatsApp 服務,主要目的是為了解決現有語音數據處理中的不足,如解碼器效能、微調挑戰和高品質標註數據的缺乏。通過這些新服務,OpenAI 除了可以收集更多的語音數據來提升技術,又可以降低使用者的門檻、適應不同使用者群體、多場景應用以及創新的商業模式,獲得多重商業上的優勢。您認為這是個好策略嗎?

參考資料:

圖片來源: 由Grok AI工具生成

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

*