李宏毅
Hung-yi Lee
NTU Speech Lab

李宏毅(1986年-),台灣計算機科學家,國立台灣大學電機工程學系教授,研究領域包括語意理解、語音辨識、機器學習、深度學習等。

早年生活

李宏毅在大學二年級時,因對電機系許多課程感到困惑,曾一度非常沮喪迷惘,甚至萌生了退學的念頭。他當時選了一門「數位通訊處理」課程,發現自己難以聽懂,但他並未放棄,不棄選不退修,最終豁然開朗,「原來用手機撥電話給別人時,中間發生的事就是這些信號處理。」找到學習的興趣後,李宏毅開始跟隨中央研究院李琳山院士做專題,隨後於2010年從國立台灣大學取得碩士學位,2012年取得博士學位。2012年9月至2013年8月間,李宏毅於中央研究院資訊科技創新研究中心擔任博士後研究員。2013年9月以客座科學家身份前往麻省理工學院電腦科學暨人工智慧實驗室。2014年返台,擔任台灣大學電機工程學系教師至今。

開設課程

2015年,李宏毅開始在台灣大學講授機器學習課程,選課人數通常爆滿,有400多人來修。於是,李宏毅將學生分在兩間教室,一間現場看老師上課,另一間同步看直播。由於直播上課的諸多限制,李宏毅養成了錄製課程影片的習慣。一開始李宏毅將影片上傳至個人主頁,後來由於螢幕側錄軟體的序號過期,無法導出MP4,但有導出至YouTube的選項,於是李宏毅開始將課程影片上傳至YouTube。此舉不僅幫助了台灣大學的學生,還意外嘉惠台灣大學以外的學生。在其影片下方,還有中國大陸的學生留言感謝,表示已經聽完全部課程,並留下筆記連結。截至2021年9月30日,李宏毅的YouTube頻道有超過20萬位訂閱者。

李宏毅擅長用淺顯易懂的語言,以學生喜愛的精靈寶可夢涼宮春日等動漫來講解複雜的機器學習技術,因此被親切地稱為「精靈寶可夢大師」。中華民國電腦學會稱李宏毅為「第一個公開有系統地完整深入講解深度學習技術的學者,使得華文的深度學習教學與英文世界並駕齊驅。」

這段影片的重點摘要如下:

生成式AI的現況與能力:

  • 生成式AI能做到許多令人驚嘆的事,例如生成逼真的人臉、語音,甚至可以自動製作投影片和講稿。
  • 影片展示了如何利用ChatGPT、Breezy Voice和Heygen等工具,快速生成一個AI分身來進行教學。
  • AI能夠產生出有創意的內容,例如笑話和勵志故事,但有時也會出現邏輯混亂或不合常理的結果。
  • 除了生成內容,AI也開始展現出「思考」的能力,例如在回答問題前先進行「腦內小劇場」的推演。
  • AI Agent的出現,使AI能夠執行更複雜的任務,例如上網搜尋、操作滑鼠鍵盤,甚至協助訓練機器學習模型。

生成式AI的運作機制:

  • 生成式AI的本質是「文字接龍」,即根據已有的token序列,預測下一個最有可能出現的token。
  • 「token」是組成複雜物件的基本單位,可以是文字、圖像、聲音等。
  • 類神經網路是生成式AI的核心,它通過多層次的運算,將複雜問題拆解成簡單的步驟。
  • 「Transformer」是一種常見的類神經網路架構,它能夠考慮輸入的全局資訊,但也有輸入長度的限制。
  • Mamba是可能可以解決Transformer輸入長度限制問題的另一種類神經網路架構。

生成式AI的發展與未來:

  • 生成式AI的發展歷程,從只能進行單一任務的「專才」,進化到能夠執行多種任務的「通才」。
  • 「Prompt(提示)」在通用模型中扮演關鍵角色,通過明確的指令,AI才能產生正確的行為。
  • 「終身學習」是AI發展的重要趨勢,通過不斷學習新的知識和技能,AI能夠適應不斷變化的環境。
  • 「微調(Fine-tune)」是賦予AI新能力的方法之一,但需要注意避免破壞原有的能力。
  • 「模型編輯(Model Editing)」和「模型合併(Model Merging)」是更進階的技術,能夠直接修改模型參數或結合不同模型的能力。

課程重點:

  • 課程將深入探討生成式AI的技術細節,包括類神經網路的運作、模型訓練和微調等。
  • 課程將介紹AI Agent的概念和應用,並讓學生實際操作,體驗AI如何執行複雜任務。
  • 課程將講解如何賦予AI新的能力,包括模型編輯和模型合併等。
  • 課程作業會讓學生們實際操作AI去完成機器學習模型的訓練。

總結來說,這段影片深入淺出地介紹了生成式AI的現況、運作機制、發展歷程和未來趨勢,並為後續的課程內容做了鋪墊。