Skip to content

白話人工智慧

白話人工智慧封面




旗標出版社 出版日期: 2025/12/8

  • 第一章 人工智慧是什麼?

    • 1.1 人工也能有智慧?
    • 1.2 機器也能參悟嗎?
    • 1.3 AI的大腦:神經網路不神經
    • 1.3.1 神經網路如何做決定
    • 1.3.2 如何訓練神經網路
    • 1.4 AI 的火眼金睛:卷積神經網路來幫忙
    • 1.5 深度學習
    • 1.6 從對抗中學習
    • 1.6.1 偽畫聖戰:生成與判別的生死博弈
    • 1.6.2 對抗式學習的原理
    • 1.6.3 生成對抗網路是怎樣工作的?
    • 1.7 強化學習:從逆境中成長
    • 1.7.1 強化學習的基本概念
    • 1.8 通用人工智慧:機器的悟道時刻
    • 1.9 撥開AI迷霧:重點整理懶人包
  • 第二章 英雄降臨:大語言模型的誕生之路

    • 2.1 文字接龍遊戲也很有學問嗎?
    • 2.2 RNN: 神經網路理解語言的初嘗試
    • 2.3 不患無詞,患詞不達意
    • 2.4 集中注意力! 變形金剛來了!
    • 2.5 當智慧突然湧現
    • 2.6 「幻覺」太多是個病! 必須治!
    • 2.7 開源模型生態
    • 2.8 王座之爭: 評測與排名
    • 2.9 大語言模型的安全性
    • 2.10 英雄之路回首:大語言模型原理總結
  • 第三章 大語言模型的神功是怎麼煉成的?

    • 3.1 AI 的知識寶庫:訓練資料從哪撈?
    • 3.2 AI 的練功心法:從紮馬步、練招式到人情世故
    • 3.3 AI 的斷捨離:蒸餾、剪枝、量化的精簡藝術
    • 3.4 站在巨人肩膀上:遷移學習與微調
    • 3.5 色聲香味觸法:AI 的多模態「六覺」初體驗
    • 3.6 專家混合:AI 的「超級英雄聯盟」
    • 3.7 溫度:AI 的創造力與準確性平衡
    • 3.8 練功也要神兵利器:GPU 與 CUDA 的硬體加持
    • 3.9 AI 界的「大」煉金術:規模法則的鈔能力!
    • 3.10 本章小結:從零到英雄的 AI 養成之路
  • 第四章 大語言模型的黑科技

    • 4.1 AI 的超級外掛圖書館:RAG 隨時Go!
    • 4.2 深度研究:不只是查資料,還能做分析
    • 4.4 大語言模型優化:讓AI幫你打廣告
    • 4.5 AI 代理 (Agent)
      • AI Agent 的實際應用場景
      • MCP:讓 AI 真正能「動手做事」
      • Agent 與 MCP 的完美搭配
    • 4.6 AI來寫程式
      • 今天,AI 已經可靠地做到什麼?
      • 明天,AI 很可能做到什麼?(未來 1—3 年)
      • 什麼還做不到?(先別把去接個專案以為AI可以完全搞定)
      • 不能不提Vibe Coding?
      • 工程師會被取代嗎?不——只是職稱要升級
      • 一頁帶走:今天 vs. 明天
  • 第五章 當機器開始做夢:揭開 AI 圖像魔法的祕密

    • 5.1 圖像 AI 模型功能速覽:誰擅長做什麼?
    • 5.2 讓舊照片重獲新生:老照片上色與修復
    • 5.3 從文字到世界:文字生成圖像
    • 5.4 風格轉換:當梵谷遇上自拍
    • 5.5 美顏濾鏡如何生成我的盛世容顏?
    • 5.6 蘿拉快跑:Hold住AI角色長相
    • 5.7 ComfyUI:積木式工作流的自由樂高
    • 5.8 世界模型的奇妙世界
    • 5.9 影片生成的突破:Sora 如何讓 AI 學會「拍電影」
    • 5.10 結語:選對模型才是王道
  • 第六章 從波形到樂章:AI的聽、說、唱

    • 6.1 聽懂:語音轉文字
      • 挑戰一:同音字歧義
      • 挑戰二:口音和語速變化
      • 挑戰三:減少延遲
      • 挑戰四:識別語句邊界
    • 6.2 說話:文字轉語音
      • 文字正規化與可念標記
      • 發音與韻律
      • 聲學模型:從說話計畫到頻譜
      • 聲碼器:把頻譜轉回聲音
      • 可控性、風格與多語
    • 6.3 應用:語音識別與文字轉語音的未來
      • 即時翻譯
      • Google NotebookLM:生成播客
      • 虛擬助理
      • 無障礙工具
      • 客服自動化
    • 6.4 做音樂:從提示到旋律、伴奏與混音
      • 符號派:從MIDI到音樂
      • 波形派:直接生成音頻
      • 提示工程與歌詞創作
    • 6.5 未來:聲音革命之後,多模態AI的時代來臨
  • 第七章 具身人工智慧:當 AI 有了身體

    • 7.1 AI 怎樣感知周遭世界?
    • 7.2 智慧決策與路徑規劃
    • 7.3 自主定位與環境建圖
    • 7.4 人機互動與適應性
    • 7.5 通用機器人的智慧挑戰
  • 第八章 AI的可能未來: 多模態、量子與類腦計算

    • 8.1 超越人類感官:多模態 AI 的現在與未來
    • 8.2 擴展 AI 的「記憶力」:更長上下文窗口
    • 8.3 新興技術交匯:量子AI、類腦計算
    • 8.4 AI for Science:加速科學發現的引擎
    • 8.5 透明與信任:可解釋 AI 的崛起
    • 8.6 守護未來:AI 安全與倫理
    • 8.7 未來展望:AI 與人類的共同進化
  • 第九章 人工智慧覺醒前夕的思考

    • 9.1 AI到底懂不懂人話?
    • 9.2 AI真的會創作嗎?
    • 9.3 技術奇點:當AI超越人類智慧的臨界點
    • 9.4 超對齊
    • 9.5 洛科詛咒:AI倫理學中的禁忌思想實驗
    • 9.6 人工智慧有沒有意識?
    • 9.7 模擬世界假說
    • 9.6 人工智慧有沒有意識?
    • 9.8 結語:從哲學回到現實
  • 第十章 結語:在未知中繼續熱愛世界

    • 10.1 功法回顧:那些年我們學過的AI絕學
    • 10.2 未來的AI會怎樣?我們真的不知道
    • 10.3 保持熱情,不要懷疑你自己
    • 10.4 總之,修養這回事,永遠是人的功課