Foundations Archive

AI 基礎概念歷史

回到 AI 基礎概念

2027年5月15日星期六

迴歸（第 19 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2027年5月14日星期五

分類（第 19 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2027年5月13日星期四

演算法（第 19 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2027年5月12日星期三

模型（第 19 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2027年5月11日星期二

資料（第 19 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2027年5月10日星期一

生成式 AI 限制（第 18 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2027年5月9日星期日

自動化（第 18 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2027年5月8日星期六

模型偏誤（第 18 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2027年5月7日星期五

資料漂移（第 18 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2027年5月6日星期四

雲端與邊緣（第 18 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2027年5月5日星期三

API（第 18 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2027年5月4日星期二

向量資料庫（第 18 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2027年5月3日星期一

大型語言模型（第 18 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2027年5月2日星期日

電腦視覺（第 18 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2027年4月30日星期五

自然語言處理（第 18 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2027年4月29日星期四

混淆矩陣（第 18 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2027年4月28日星期三

訓練集與測試集（第 18 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2027年4月27日星期二

特徵工程（第 18 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2027年4月26日星期一

分群（第 18 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2027年4月25日星期日

迴歸（第 18 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2027年4月24日星期六

分類（第 18 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2027年4月23日星期五

演算法（第 18 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2027年4月22日星期四

模型（第 18 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2027年4月21日星期三

資料（第 18 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2027年4月20日星期二

生成式 AI 限制（第 17 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2027年4月19日星期一

自動化（第 17 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2027年4月18日星期日

模型偏誤（第 17 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2027年4月17日星期六

資料漂移（第 17 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2027年4月16日星期五

雲端與邊緣（第 17 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2027年4月15日星期四

API（第 17 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2027年4月14日星期三

向量資料庫（第 17 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2027年4月13日星期二

大型語言模型（第 17 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2027年4月12日星期一

電腦視覺（第 17 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2027年4月10日星期六

自然語言處理（第 17 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2027年4月9日星期五

混淆矩陣（第 17 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2027年4月8日星期四

訓練集與測試集（第 17 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2027年4月7日星期三

特徵工程（第 17 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2027年4月6日星期二

分群（第 17 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2027年4月5日星期一

迴歸（第 17 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2027年4月4日星期日

分類（第 17 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2027年4月3日星期六

演算法（第 17 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2027年4月2日星期五

模型（第 17 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2027年4月1日星期四

資料（第 17 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2027年3月31日星期三

生成式 AI 限制（第 16 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2027年3月30日星期二

自動化（第 16 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2027年3月29日星期一

模型偏誤（第 16 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2027年3月28日星期日

資料漂移（第 16 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2027年3月27日星期六

雲端與邊緣（第 16 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2027年3月26日星期五

API（第 16 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2027年3月25日星期四

向量資料庫（第 16 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2027年3月24日星期三

大型語言模型（第 16 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2027年3月23日星期二

電腦視覺（第 16 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2027年3月21日星期日

自然語言處理（第 16 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2027年3月20日星期六

混淆矩陣（第 16 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2027年3月19日星期五

訓練集與測試集（第 16 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2027年3月18日星期四

特徵工程（第 16 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2027年3月17日星期三

分群（第 16 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2027年3月16日星期二

迴歸（第 16 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2027年3月15日星期一

分類（第 16 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2027年3月14日星期日

演算法（第 16 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2027年3月13日星期六

模型（第 16 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2027年3月12日星期五

資料（第 16 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2027年3月11日星期四

生成式 AI 限制（第 15 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2027年3月10日星期三

自動化（第 15 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2027年3月9日星期二

模型偏誤（第 15 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2027年3月8日星期一

資料漂移（第 15 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2027年3月7日星期日

雲端與邊緣（第 15 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2027年3月6日星期六

API（第 15 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2027年3月5日星期五

向量資料庫（第 15 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2027年3月4日星期四

大型語言模型（第 15 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2027年3月3日星期三

電腦視覺（第 15 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2027年3月1日星期一

自然語言處理（第 15 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2027年2月28日星期日

混淆矩陣（第 15 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2027年2月27日星期六

訓練集與測試集（第 15 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2027年2月26日星期五

特徵工程（第 15 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2027年2月25日星期四

分群（第 15 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2027年2月24日星期三

迴歸（第 15 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2027年2月23日星期二

分類（第 15 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2027年2月22日星期一

演算法（第 15 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2027年2月21日星期日

模型（第 15 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2027年2月20日星期六

資料（第 15 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2027年2月19日星期五

生成式 AI 限制（第 14 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2027年2月18日星期四

自動化（第 14 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2027年2月17日星期三

模型偏誤（第 14 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2027年2月16日星期二

資料漂移（第 14 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2027年2月15日星期一

雲端與邊緣（第 14 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2027年2月14日星期日

API（第 14 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2027年2月13日星期六

向量資料庫（第 14 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2027年2月12日星期五

大型語言模型（第 14 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2027年2月11日星期四

電腦視覺（第 14 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2027年2月9日星期二

自然語言處理（第 14 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2027年2月8日星期一

混淆矩陣（第 14 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2027年2月7日星期日

訓練集與測試集（第 14 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2027年2月6日星期六

特徵工程（第 14 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2027年2月5日星期五

分群（第 14 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2027年2月4日星期四

迴歸（第 14 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2027年2月3日星期三

分類（第 14 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2027年2月2日星期二

演算法（第 14 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2027年2月1日星期一

模型（第 14 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2027年1月31日星期日

資料（第 14 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2027年1月30日星期六

生成式 AI 限制（第 13 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2027年1月29日星期五

自動化（第 13 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2027年1月28日星期四

模型偏誤（第 13 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2027年1月27日星期三

資料漂移（第 13 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2027年1月26日星期二

雲端與邊緣（第 13 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2027年1月25日星期一

API（第 13 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2027年1月24日星期日

向量資料庫（第 13 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2027年1月23日星期六

大型語言模型（第 13 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2027年1月22日星期五

電腦視覺（第 13 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2027年1月20日星期三

自然語言處理（第 13 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2027年1月19日星期二

混淆矩陣（第 13 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2027年1月18日星期一

訓練集與測試集（第 13 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2027年1月17日星期日

特徵工程（第 13 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2027年1月16日星期六

分群（第 13 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2027年1月15日星期五

迴歸（第 13 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2027年1月14日星期四

分類（第 13 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2027年1月13日星期三

演算法（第 13 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2027年1月12日星期二

模型（第 13 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2027年1月11日星期一

資料（第 13 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2027年1月10日星期日

生成式 AI 限制（第 12 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2027年1月9日星期六

自動化（第 12 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2027年1月8日星期五

模型偏誤（第 12 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2027年1月7日星期四

資料漂移（第 12 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2027年1月6日星期三

雲端與邊緣（第 12 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2027年1月5日星期二

API（第 12 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2027年1月4日星期一

向量資料庫（第 12 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2027年1月3日星期日

大型語言模型（第 12 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2027年1月2日星期六

電腦視覺（第 12 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2026年12月31日星期四

自然語言處理（第 12 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2026年12月30日星期三

混淆矩陣（第 12 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2026年12月29日星期二

訓練集與測試集（第 12 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2026年12月28日星期一

特徵工程（第 12 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2026年12月27日星期日

分群（第 12 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2026年12月26日星期六

迴歸（第 12 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2026年12月25日星期五

分類（第 12 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2026年12月24日星期四

演算法（第 12 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2026年12月23日星期三

模型（第 12 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2026年12月22日星期二

資料（第 12 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2026年12月21日星期一

生成式 AI 限制（第 11 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2026年12月20日星期日

自動化（第 11 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2026年12月19日星期六

模型偏誤（第 11 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2026年12月18日星期五

資料漂移（第 11 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2026年12月17日星期四

雲端與邊緣（第 11 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2026年12月16日星期三

API（第 11 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2026年12月15日星期二

向量資料庫（第 11 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2026年12月14日星期一

大型語言模型（第 11 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2026年12月13日星期日

電腦視覺（第 11 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2026年12月11日星期五

自然語言處理（第 11 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2026年12月10日星期四

混淆矩陣（第 11 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2026年12月9日星期三

訓練集與測試集（第 11 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2026年12月8日星期二

特徵工程（第 11 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2026年12月7日星期一

分群（第 11 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2026年12月6日星期日

迴歸（第 11 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2026年12月5日星期六

分類（第 11 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2026年12月4日星期五

演算法（第 11 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2026年12月3日星期四

模型（第 11 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2026年12月2日星期三

資料（第 11 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2026年12月1日星期二

生成式 AI 限制（第 10 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2026年11月30日星期一

自動化（第 10 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2026年11月29日星期日

模型偏誤（第 10 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2026年11月28日星期六

資料漂移（第 10 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2026年11月27日星期五

雲端與邊緣（第 10 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2026年11月26日星期四

API（第 10 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2026年11月25日星期三

向量資料庫（第 10 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2026年11月24日星期二

大型語言模型（第 10 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2026年11月23日星期一

電腦視覺（第 10 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2026年11月21日星期六

自然語言處理（第 10 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2026年11月20日星期五

混淆矩陣（第 10 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2026年11月19日星期四

訓練集與測試集（第 10 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2026年11月18日星期三

特徵工程（第 10 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2026年11月17日星期二

分群（第 10 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2026年11月16日星期一

迴歸（第 10 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2026年11月15日星期日

分類（第 10 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2026年11月14日星期六

演算法（第 10 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2026年11月13日星期五

模型（第 10 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2026年11月12日星期四

資料（第 10 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2026年11月11日星期三

生成式 AI 限制（第 9 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2026年11月10日星期二

自動化（第 9 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2026年11月9日星期一

模型偏誤（第 9 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2026年11月8日星期日

資料漂移（第 9 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2026年11月7日星期六

雲端與邊緣（第 9 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2026年11月6日星期五

API（第 9 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2026年11月5日星期四

向量資料庫（第 9 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2026年11月4日星期三

大型語言模型（第 9 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2026年11月3日星期二

電腦視覺（第 9 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2026年11月1日星期日

自然語言處理（第 9 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2026年10月31日星期六

混淆矩陣（第 9 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2026年10月30日星期五

訓練集與測試集（第 9 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2026年10月29日星期四

特徵工程（第 9 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2026年10月28日星期三

分群（第 9 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2026年10月27日星期二

迴歸（第 9 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2026年10月26日星期一

分類（第 9 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2026年10月25日星期日

演算法（第 9 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2026年10月24日星期六

模型（第 9 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2026年10月23日星期五

資料（第 9 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2026年10月22日星期四

生成式 AI 限制（第 8 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2026年10月21日星期三

自動化（第 8 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2026年10月20日星期二

模型偏誤（第 8 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2026年10月19日星期一

資料漂移（第 8 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2026年10月18日星期日

雲端與邊緣（第 8 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2026年10月17日星期六

API（第 8 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2026年10月16日星期五

向量資料庫（第 8 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2026年10月15日星期四

大型語言模型（第 8 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2026年10月14日星期三

電腦視覺（第 8 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2026年10月12日星期一

自然語言處理（第 8 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2026年10月11日星期日

混淆矩陣（第 8 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2026年10月10日星期六

訓練集與測試集（第 8 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2026年10月9日星期五

特徵工程（第 8 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2026年10月8日星期四

分群（第 8 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2026年10月7日星期三

迴歸（第 8 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2026年10月6日星期二

分類（第 8 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2026年10月5日星期一

演算法（第 8 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2026年10月4日星期日

模型（第 8 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2026年10月3日星期六

資料（第 8 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2026年10月2日星期五

生成式 AI 限制（第 7 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2026年10月1日星期四

自動化（第 7 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2026年9月30日星期三

模型偏誤（第 7 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2026年9月29日星期二

資料漂移（第 7 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2026年9月28日星期一

雲端與邊緣（第 7 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2026年9月27日星期日

API（第 7 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2026年9月26日星期六

向量資料庫（第 7 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2026年9月25日星期五

大型語言模型（第 7 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2026年9月24日星期四

電腦視覺（第 7 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2026年9月22日星期二

自然語言處理（第 7 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2026年9月21日星期一

混淆矩陣（第 7 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2026年9月20日星期日

訓練集與測試集（第 7 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2026年9月19日星期六

特徵工程（第 7 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2026年9月18日星期五

分群（第 7 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2026年9月17日星期四

迴歸（第 7 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2026年9月16日星期三

分類（第 7 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2026年9月15日星期二

演算法（第 7 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2026年9月14日星期一

模型（第 7 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2026年9月13日星期日

資料（第 7 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2026年9月12日星期六

生成式 AI 限制（第 6 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2026年9月11日星期五

自動化（第 6 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2026年9月10日星期四

模型偏誤（第 6 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2026年9月9日星期三

資料漂移（第 6 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2026年9月8日星期二

雲端與邊緣（第 6 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2026年9月7日星期一

API（第 6 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2026年9月6日星期日

向量資料庫（第 6 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2026年9月5日星期六

大型語言模型（第 6 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2026年9月4日星期五

電腦視覺（第 6 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2026年9月2日星期三

自然語言處理（第 6 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2026年9月1日星期二

混淆矩陣（第 6 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2026年8月31日星期一

訓練集與測試集（第 6 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2026年8月30日星期日

特徵工程（第 6 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2026年8月29日星期六

分群（第 6 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2026年8月28日星期五

迴歸（第 6 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2026年8月27日星期四

分類（第 6 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2026年8月26日星期三

演算法（第 6 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2026年8月25日星期二

模型（第 6 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2026年8月24日星期一

資料（第 6 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2026年8月23日星期日

生成式 AI 限制（第 5 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2026年8月22日星期六

自動化（第 5 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2026年8月21日星期五

模型偏誤（第 5 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2026年8月20日星期四

資料漂移（第 5 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2026年8月19日星期三

雲端與邊緣（第 5 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2026年8月18日星期二

API（第 5 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2026年8月17日星期一

向量資料庫（第 5 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2026年8月16日星期日

大型語言模型（第 5 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2026年8月15日星期六

電腦視覺（第 5 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2026年8月13日星期四

自然語言處理（第 5 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2026年8月12日星期三

混淆矩陣（第 5 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2026年8月11日星期二

訓練集與測試集（第 5 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2026年8月10日星期一

特徵工程（第 5 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2026年8月9日星期日

分群（第 5 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2026年8月8日星期六

迴歸（第 5 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2026年8月7日星期五

分類（第 5 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2026年8月6日星期四

演算法（第 5 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2026年8月5日星期三

模型（第 5 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2026年8月4日星期二

資料（第 5 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2026年8月3日星期一

生成式 AI 限制（第 4 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2026年8月2日星期日

自動化（第 4 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2026年8月1日星期六

模型偏誤（第 4 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2026年7月31日星期五

資料漂移（第 4 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2026年7月30日星期四

雲端與邊緣（第 4 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2026年7月29日星期三

API（第 4 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2026年7月28日星期二

向量資料庫（第 4 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2026年7月27日星期一

大型語言模型（第 4 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2026年7月26日星期日

電腦視覺（第 4 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2026年7月24日星期五

自然語言處理（第 4 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2026年7月23日星期四

混淆矩陣（第 4 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2026年7月22日星期三

訓練集與測試集（第 4 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2026年7月21日星期二

特徵工程（第 4 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2026年7月20日星期一

分群（第 4 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2026年7月19日星期日

迴歸（第 4 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2026年7月18日星期六

分類（第 4 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2026年7月17日星期五

演算法（第 4 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2026年7月16日星期四

模型（第 4 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2026年7月15日星期三

資料（第 4 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2026年7月14日星期二

生成式 AI 限制（第 3 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2026年7月13日星期一

自動化（第 3 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2026年7月12日星期日

模型偏誤（第 3 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2026年7月11日星期六

資料漂移（第 3 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2026年7月10日星期五

雲端與邊緣（第 3 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2026年7月9日星期四

API（第 3 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2026年7月8日星期三

向量資料庫（第 3 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2026年7月7日星期二

大型語言模型（第 3 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2026年7月6日星期一

電腦視覺（第 3 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2026年7月4日星期六

自然語言處理（第 3 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2026年7月3日星期五

混淆矩陣（第 3 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2026年7月2日星期四

訓練集與測試集（第 3 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2026年7月1日星期三

特徵工程（第 3 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2026年6月30日星期二

分群（第 3 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2026年6月29日星期一

迴歸（第 3 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2026年6月28日星期日

分類（第 3 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2026年6月27日星期六

演算法（第 3 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2026年6月26日星期五

模型（第 3 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2026年6月25日星期四

資料（第 3 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2026年6月24日星期三

生成式 AI 限制（第 2 輪複習）

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2026年6月23日星期二

自動化（第 2 輪複習）

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2026年6月22日星期一

模型偏誤（第 2 輪複習）

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2026年6月21日星期日

資料漂移（第 2 輪複習）

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2026年6月20日星期六

雲端與邊緣（第 2 輪複習）

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2026年6月19日星期五

API（第 2 輪複習）

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2026年6月18日星期四

向量資料庫（第 2 輪複習）

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2026年6月17日星期三

大型語言模型（第 2 輪複習）

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2026年6月16日星期二

電腦視覺（第 2 輪複習）

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2026年6月14日星期日

自然語言處理（第 2 輪複習）

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2026年6月13日星期六

混淆矩陣（第 2 輪複習）

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2026年6月12日星期五

訓練集與測試集（第 2 輪複習）

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2026年6月11日星期四

特徵工程（第 2 輪複習）

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2026年6月10日星期三

分群（第 2 輪複習）

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2026年6月9日星期二

迴歸（第 2 輪複習）

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2026年6月8日星期一

分類（第 2 輪複習）

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2026年6月7日星期日

演算法（第 2 輪複習）

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2026年6月6日星期六

模型（第 2 輪複習）

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2026年6月5日星期五

資料（第 2 輪複習）

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

2026年6月4日星期四

生成式 AI 限制

生成式 AI 可能犯錯、編造來源、洩漏資料或受到提示詞攻擊。

核心觀念

使用時要設定資料權限、輸出檢查與禁止輸入敏感資料規範。

關鍵詞

幻覺: 錯誤生成; Prompt injection: 提示詞攻擊; 敏感資料: 不宜外洩資訊

2026年6月3日星期三

自動化

自動化是讓系統依規則或模型執行重複流程。

核心觀念

AI 可強化自動化，但高風險流程仍需人類覆核。

關鍵詞

Workflow: 工作流程; Rule-based: 規則式; AI-assisted: AI 輔助

2026年6月2日星期二

模型偏誤

模型偏誤可能來自資料代表性不足、標註不一致或設計不當。

核心觀念

偏誤不只影響準確率，也可能造成公平性問題。

關鍵詞

Bias: 偏誤; Fairness: 公平性; Representative data: 具代表性的資料

2026年6月1日星期一

資料漂移

資料漂移是上線後新資料分布和訓練資料不同。

核心觀念

資料漂移會讓模型效果下降，因此需要監控。

關鍵詞

Drift: 漂移; Monitoring: 監控; Retraining: 重新訓練

2026年5月31日星期日

雲端與邊緣

雲端適合集中運算，邊緣運算適合低延遲或資料不易外傳的場景。

核心觀念

選擇部署位置時要考慮成本、延遲、隱私與維運。

關鍵詞

Cloud: 雲端; Edge: 邊緣; Latency: 延遲; On-premise: 內部部署

2026年5月30日星期六

API

API 是系統之間交換資料或功能的介面。

核心觀念

AI 服務常透過 API 提供模型推論能力。

關鍵詞

Endpoint: API 位置; Request: 請求; Response: 回應; Rate limit: 呼叫限制

2026年5月29日星期五

向量資料庫

向量資料庫用來儲存與搜尋文字、圖片等資料的向量表示。

核心觀念

它常和 RAG 搭配做語意搜尋。

關鍵詞

向量: 資料的數值表示; 相似度搜尋: 找語意接近資料; Embedding: 轉成向量

2026年5月28日星期四

大型語言模型

大型語言模型能根據上下文預測與生成文字。

核心觀念

它擅長語言任務，但可能產生幻覺或過時資訊。

關鍵詞

LLM: 大型語言模型; 上下文: 提供給模型的資訊; Token 限制: 可處理文字長度限制

2026年5月27日星期三

電腦視覺

電腦視覺讓電腦處理與理解影像或影片。

核心觀念

常見任務有分類、物件偵測、影像分割與瑕疵檢測。

關鍵詞

物件偵測: 找位置與類別; 分割: 標出區域; OCR: 影像文字辨識

2026年5月25日星期一

自然語言處理

自然語言處理讓電腦理解、分析或生成文字與語音。

核心觀念

常見任務有分類、摘要、翻譯、問答與情緒分析。

關鍵詞

NLP: 自然語言處理; Token: 文字切分單位; Embedding: 文字向量表示

2026年5月24日星期日

混淆矩陣

混淆矩陣用 TP、FP、TN、FN 分析分類模型結果。

核心觀念

精確率與召回率都可由混淆矩陣計算。

關鍵詞

TP: 真正例; FP: 假正例; TN: 真負例; FN: 假負例

2026年5月23日星期六

訓練集與測試集

訓練集用來學習，測試集用來評估模型在新資料上的表現。

核心觀念

不能用測試集反覆調模型，否則評估會失真。

關鍵詞

資料切分: 分成訓練驗證測試; 驗證集: 調整模型; 測試集: 最終評估

2026年5月22日星期五

特徵工程

特徵工程是把原始資料轉換成模型更容易使用的欄位。

核心觀念

好的特徵可能比複雜模型更能提升表現。

關鍵詞

標準化: 調整尺度; 編碼: 將類別轉數字; 衍生欄位: 從既有欄位產生新資訊

2026年5月21日星期四

分群

分群是在沒有標籤時找出相似群組。

核心觀念

分群結果需要人再解讀其商業意義。

關鍵詞

K-means: 常見分群方法; 群中心: 群組代表點; 相似度: 資料接近程度

2026年5月20日星期三

迴歸

迴歸是預測連續數值。

核心觀念

輸出若是價格、銷量、溫度或分數，通常是迴歸。

關鍵詞

連續值: 可用數字大小表示; MAE: 平均絕對誤差; RMSE: 平方誤差相關指標

2026年5月19日星期二

分類

分類是把資料分到離散類別。

核心觀念

輸出若是貓/狗、正常/異常、通過/不通過，通常是分類。

關鍵詞

二元分類: 兩類; 多類分類: 多個類別; 混淆矩陣: 分析分類結果

2026年5月18日星期一

演算法

演算法是一套解決問題的步驟或方法。

核心觀念

機器學習演算法用來從資料中建立模型。

關鍵詞

決策樹: 樹狀判斷; KNN: 近鄰比較; 神經網路: 多層運算模型

2026年5月17日星期日

模型

模型是從資料中學到的規則或表示方式。

核心觀念

訓練完成後，模型可對新資料做預測或生成。

關鍵詞

訓練: 學習規律; 推論: 用模型產生結果; 參數: 模型內部數值

2026年5月16日星期六

資料

資料是 AI 系統學習與推論的基礎。

核心觀念

資料可以是表格、文字、圖片、聲音或感測器紀錄。

關鍵詞

結構化資料: 表格欄位; 非結構化資料: 文字圖片音訊; 特徵: 可用來判斷的資料欄位

AI 基礎概念歷史

迴歸（第 19 輪複習）

分類（第 19 輪複習）

演算法（第 19 輪複習）

模型（第 19 輪複習）

資料（第 19 輪複習）

生成式 AI 限制（第 18 輪複習）

自動化（第 18 輪複習）

模型偏誤（第 18 輪複習）

資料漂移（第 18 輪複習）

雲端與邊緣（第 18 輪複習）

API（第 18 輪複習）

向量資料庫（第 18 輪複習）

大型語言模型（第 18 輪複習）

推薦系統（第 18 輪複習）

電腦視覺（第 18 輪複習）

自然語言處理（第 18 輪複習）

混淆矩陣（第 18 輪複習）

訓練集與測試集（第 18 輪複習）

特徵工程（第 18 輪複習）

分群（第 18 輪複習）

迴歸（第 18 輪複習）

分類（第 18 輪複習）

演算法（第 18 輪複習）

模型（第 18 輪複習）

資料（第 18 輪複習）

生成式 AI 限制（第 17 輪複習）

自動化（第 17 輪複習）

模型偏誤（第 17 輪複習）

資料漂移（第 17 輪複習）

雲端與邊緣（第 17 輪複習）

API（第 17 輪複習）

向量資料庫（第 17 輪複習）

大型語言模型（第 17 輪複習）

推薦系統（第 17 輪複習）

電腦視覺（第 17 輪複習）

自然語言處理（第 17 輪複習）

混淆矩陣（第 17 輪複習）

訓練集與測試集（第 17 輪複習）

特徵工程（第 17 輪複習）

分群（第 17 輪複習）

迴歸（第 17 輪複習）

分類（第 17 輪複習）

演算法（第 17 輪複習）

模型（第 17 輪複習）

資料（第 17 輪複習）

生成式 AI 限制（第 16 輪複習）

自動化（第 16 輪複習）

模型偏誤（第 16 輪複習）

資料漂移（第 16 輪複習）

雲端與邊緣（第 16 輪複習）

API（第 16 輪複習）

向量資料庫（第 16 輪複習）

大型語言模型（第 16 輪複習）

推薦系統（第 16 輪複習）

電腦視覺（第 16 輪複習）

自然語言處理（第 16 輪複習）

混淆矩陣（第 16 輪複習）

訓練集與測試集（第 16 輪複習）

特徵工程（第 16 輪複習）

分群（第 16 輪複習）

迴歸（第 16 輪複習）

分類（第 16 輪複習）

演算法（第 16 輪複習）

模型（第 16 輪複習）

資料（第 16 輪複習）

生成式 AI 限制（第 15 輪複習）

自動化（第 15 輪複習）

模型偏誤（第 15 輪複習）

資料漂移（第 15 輪複習）

雲端與邊緣（第 15 輪複習）

API（第 15 輪複習）

向量資料庫（第 15 輪複習）

大型語言模型（第 15 輪複習）

推薦系統（第 15 輪複習）

電腦視覺（第 15 輪複習）

自然語言處理（第 15 輪複習）

混淆矩陣（第 15 輪複習）

訓練集與測試集（第 15 輪複習）

特徵工程（第 15 輪複習）