MTN 集團已經承諾支持開發非洲語言的資料集,這回應了奈及利亞通信、創新和數位經濟部部長博森·蒂亞吉(Bosun Tijani)對於加強公私投資於人工智慧(AI)研究的呼籲。此項決策是在紐約的聯合國大會期間的 Y'ello Chair Vodcast 上作出的。

這一行動對於一個有超過 2000 種語言的非洲大陸來說意義重大,而這些語言在現有的 AI 系統中仍然表現不足。若缺乏結構化的資料集,非洲 15 億人口可能在教育、健康、商業和治理中的 AI 駕動服務下被排除在外。

建設非洲的語言模型

這項承諾是基於奈及利亞的《語言和 AI 擴展的奈及利亞地圖集》(N-ATLAS)。這個專案早在今年透過奈及利亞政府與 Awarri 科技的合作而啟動。N-ATLAS 是一個開源的多語言模型,旨在數位化和保存奈及利亞超過 500 種語言。其結構可以供其他非洲國家使用。

MTN 集團總裁兼執行長拉爾夫·穆皮塔(Ralph Mupita)表示,這項工作對確保非洲人在全球技術轉型中不被拋在後頭至關重要。「我們必須避免非洲人沦為數位下層階級的風險。我們希望達成的結果是,人們在數字上被包含,在經濟上被包含,並且擁有尊嚴,」他說。

除了文化保存之外,MTN 的支持還指向非洲數位經濟中的新機遇。透過支持語言資料集,該公司希望不僅僅被視為一家電信運營商,而是成為非洲 AI 領域的技術推動者。其他全球公司,如谷歌和 Meta,也曾嘗試使用非洲語言模型,雖然通常商業規模有限。

MTN 的舉措突顯了私有企業日益增長的興趣。然而,這並不是首個針對非洲 AI 語言差距的方案。Masakhane 是一個由機器學習專家組成的草根研究社群,自 2019 年以來一直在為非洲語言建立翻譯模型。Mozilla 的 Common Voice 計畫則在像 Kiswahili、Luganda 和 Wolof 這樣的語言中群眾募集語音資料集。南非的 Lelapa AI 正在開發針對資源不足的非洲語言的自然語言處理工具。

通過參與這一推動,MTN 將企業規模和資源帶入了一個長期由學術界和開源社群推動的努力。最終的結果將決定非洲企業能否開發基於本地現實情況的 AI 解決方案,或是繼續依賴忽視他們的全球系統。