前往 Medium 閱讀好讀版

大型語言模型對數據與人工智慧產業的影響

人才發展視角

講者簡介

古秉松(Linkedin)在數據科學與人工智慧領域擁有20年經驗,涉足多個行業,專精於數據收集、管理、治理、洞察分析與機器學習模型實施。他同時是資深講師與顧問,為本地機構及海外學員提供培訓,並受邀於AIMX、SEMI、GITEX及多個政府單位演講。古秉松亦為企業與新創公司提供數據與AI顧問服務,並指導個人、專業人士與學生。

他共同創辦東南亞最大數據科學社群DataScience SG,曾任AI Professionals Association主席,推動AI專業化並參與建立Chartered AI Engineer (CAIE) 認證體系。他畢業於新加坡國立大學,主修經濟學、輔修金融學,並取得阿德雷德大學MBA學位。

版聚回顧及重點摘要

講者認為 AI 是全人類所擁有的工具,有許多發展潛能,因此在談論如 LLM(Large Language Models)時,不太需要區分西方或是東方的模式。許多公司都創立並訓練了自己的 LLM,因此可以預見的是,未來在 LLM 市場上可能會有價格戰

另外最近最火的詞是:AI Agent,有些人會稱呼為 AI 代理,但講者認為要做到「代理」應該還有一段距離,不過這些 AI Agent 的基礎大多是 LLM,因此要用哪個 LLM 來建 AI Agent 可以達到最佳效果?也是市場上大家拭目以待的題目。

LLM 現況應用

  1. 做研究(Research),舉例:搜集研究相關的資料
  2. 生活中的任務(Life Task),舉例:設計與安排旅遊行程
  3. 資料分析(Data Analysis),舉例:直接把圖表提供給 LLM 進行簡單數據分析
  4. 教育訓練(Eductation & Training),舉例:為會計相關的目標客群,設計「資料視覺化」的課綱
  5. 破框內容產生(Out-Of-Box Content Gemeration),舉例:給 LLM 一個特定的目標結果,請 LLM 生成多種可能解決方案。

Press enter or click to view image in full size

Photo by Diana Parkhouse on Unsplash

LLM 在數據工作流程各個階段的潛在影響與侷限性

  1. **Problem Framing & Research (問題設定與研究):**講者認為,這部分高度依賴邏輯思維和設計思維,而 LLM 作為機率模型,其輸出基於機率而非嚴謹的邏輯,因此難以完全取代人類在這方面的洞察力和環境知識,舉例來說 LLM 在「比較 9.9 與 9.11 哪個數字比較大?」這類複雜邏輯推理上,LLM 還是存在不足。
  2. Data Collection & Transformation (數據收集與清理): LLM 可以提供數據收集的建議,因為許多相關知識可能已存在於其訓練數據中,但仍會受限於其訓練數據。而數據清理會需要更多人類 Domain Knowledge 或是需要 Business Process Knowledge 才知道如何清理數據,這段也比較需要邏輯思維,是 LLM 無法協助的。
  3. **Model Training & Selection (模型訓練與選擇):**將使用 LLM 當作在聘請人才,理解 LLM 就是個讀很多書的人,理解 LLM 讀了哪些書,綜合以上兩個理解,就能選擇哪個 LLM(人才)能夠最有效解決手上的問題。而講者目前是會混用 ChatGPT 與 DeepSeek,會將同樣的 prompt 下給兩個模型,然後自行判斷要使用哪邊的結果。
  4. Coding & Programming (編碼與程式設計): LLM 可以輔助程式碼的撰寫,提高效率,然而,針對企業應用等級的程式碼,需要有靈活性、安全性、維護性以及在商業流程中具備效率,而這些考量往往需要人類的專業知識和經驗,若 LLM 無法存取並學習企業內部私有程式碼庫,就會限制 LLM 在企業級應用中的能力。
  5. Data Analysis (數據分析): 許多人可能認為 LLM 可以進行數據分析,但講者強調,LLM 在查看圖表時,僅僅是「讀取」數據,而真正的分析在於分解、解釋數據資訊、理解其組成部分、關聯性和潛在模式,講者以巧克力在二月和十一月銷售額飆升的例子說明,LLM 只能觀察到數字的變化,而人類分析師可以結合情人節、聖誕節、感恩節等節慶因素以及地域性來解釋背後的原因。
  6. Integrating Model Into Business Process (模型整合至業務流程): 數據模型整合到實際業務流程中,同樣需要高度的邏輯和設計思維,考慮數據流、模型輸出如何有效地幫助業務流程,在大型企業中這個過程尤其複雜,難以完全依賴 LLM。

Press enter or click to view image in full size

Photo by Alvaro Reyes on Unsplash

未來展望

講者認為未來數據產業將持續成長,因為許多產業仍在進行數位轉型,產生大量需要分析和應用的數據,有經驗的數據專業人員可以轉往人工智慧產業發展,前景廣闊。

儘管 LLM 會不斷進步,但其本質仍然是機率模型,無法完全取代人類的邏輯思維,因此,數據從業者需要不斷學習,提升自身能力,才能利用 LLM 輔助工作而不是被取代。

結語思考…

在分享的尾聲,講者提出了一系列引人深思的問題,歡迎讀者們也可以留言分享你的看法:

  1. 從未親自分析數據或從零編寫程式的人,能成為好的技術團隊領導嗎?
  2. 隨著大型語言模型(LLMs)承擔越來越多基本任務,科技從業者該如何晉升?
  3. 「晉升」與「管理」這些概念,是否已是工業時代經濟的產物,不再適合知識經濟時代?
  4. 那麼在科技領域中,「職涯成長」又是什麼?

Press enter or click to view image in full size

Photo by Christine on Unsplash

講者問題 QA

Q1:若使用 Tree of Thoughts 或 Logic Chain 等方式引導 LLM 思考,是否能提升其邏輯推理能力?(即使 LM 本質上仍是機率模型)

A1:就像你問「太陽是不是從東邊升起?」,LLM(大型語言模型)一定會回答你「是的,太陽從東邊升起」。

為什麼?因為它所讀取的所有資料和數據中,幾乎 100% 都在描述這個事,LLM自然會給出這樣的答案。

但本質上,我認為 LLM 仍然只是一個「機率模型」,並非真正具備邏輯推理能力

而是基於讀取到的資訊,在極高機率(比如99.98%)的情況下做出推斷。因為機率極高,表現出來就像有邏輯思維一樣,但實際上,它的推理基礎依然是統計機率,而非真正的理解或推論。

Q2:想了解講者應用 LLM 進行破框思考的 Prompt 是怎麼下的?

A2:我會先明確告訴模型:「我需要這些東西,請把你能想到的所有解決方案列出來。」但在這方面,我發現 ChatGPT 給的不是很多,大概會給到 10–15 個,但 DeepSeek 會給到 30–40 個。

另外我特別喜歡的一點是 DeepSeek 會同時說明它是如何思考的,對我而言,最有價值的並不是輸出結果,而是學習 LLM 展現出來的思考過程與邏輯推理 ,這個能幫助我做到破框思考。

Press enter or click to view image in full size

Photo by William Felipe Seccon on Unsplash

Q3:在您的投影片上提到 “Promotion” 和 “Management” 是工業時代的產物,為什麼?是因為工人需要管理嗎?再來是知識型經濟最重要的職涯成長能力是「影響力」和「跨部門合作能力」嗎?

A3:工業時代因製造業特性,生產線上的工作需要每個人在同一時間、同一地點協作,像是車輛製造流程中,產品必須從一組人交接到下一組人,只有大家同步作業,才能確保生產順利。因此,為了管理大量員工,同步生產流程,「Promotion(升遷)」和「Management(管理)」這些制度也就自然形成了。

然而,在知識型經濟時代,工作型態已經完全不同。我們可以將自己的任務拆分、分散處理,再整合成一個完整的專案,最終變成一個具體的產出或價值,不再需要大家同時、同地工作,因此,對個人而言,職涯成長的關鍵能力也跟過去不同了。

我認為,在今天的知識型經濟中,職涯成長的動力除了「影響力(Influence)」另外一個是獲得不同的「經驗(Experience)」。

像我在每天的工作中學習新東西,是一種 Experience 的追求,而我其他朋友邊在國外生活邊工作,這也是另一種 Experience 的追求,每個人的追求都有所不同。

Q4:請問講者對於數據就業市場的看法以及未來變化的準備?在 AI 和 LM 的時代,對於 Data Scientist、Data Analyst 等資料科學人才的就業是否會受到影響?您在新加坡的觀察,與亞洲和歐美是否有不同影響?

A4:老實說,目前很多產業仍未真正使用數據,主要還停留在數位轉型的初步階段,專注於系統升級與數位化更新。一旦這些產業完成數位轉型,便會開始累積大量數據。這些數據不可能只是被放著不用,企業勢必會尋求方法來應用這些資源。因此,我對數據產業的未來發展抱持相當大的信心,預期在未來五到十年內,這個領域仍有可觀的成長空間

更好的消息是,若你已在數據產業累積了一段時間的經驗,未來還能自然地轉向人工智慧產業,開拓更大的發展機會。近期我也觀察到,像農業與製造業這類領域,開始意識到自己收集了大量數據,並積極尋求專業人才來協助提升產業績效與效率,整體趨勢令人感到樂觀。

有人可能會擔心大型語言模型(LLM)的出現是否會打亂這個趨勢,但我反而更加樂觀。因為 LLM 的普及,讓更多人開始認識什麼是人工智慧、什麼是數據,進而提升整體市場的成熟度。

Press enter or click to view image in full size

Photo by Isaac Smith on Unsplash

至於不同地區的發展,美國在這方面的成長速度明顯較快,而東南亞地區則相對較慢。東南亞的經濟與科技應用尚未如美國般成熟,但近年也逐漸啟動成長 。在這個過程中,許多務實的企業主已經意識到數據的重要性,雖然在實際操作和人才招募上仍有些迷惘,且資源較為有限,但整體而言,市場正朝著正向發展邁進。

Q5:想請問未來資料分析產業中偏向資料分析師 (Data Analyst) 的工作,會不會變成優化已開發的 LLM 為主?原本分析 Marketing 或是 Consumer Behavior 等工作,會轉移到 User 端讓行銷自己做,業務部門自己做,那資料分析的部門可能就縮減?

A5:我認為,數據分析的工作量不會因為大型語言模型(LLM)的出現而縮減,反而會提升。未來,數據分析師所負責的,將是更高價值的分析工作 ,當你能夠進行更有深度、影響更大的分析時,自然能為公司創造更多收益。隨著企業對你的依賴加深,你也更有籌碼爭取更高的薪資待遇。

Press enter or click to view image in full size

Photo by krakenimages on Unsplash

舉例來說,一些從事銷售或其他非專業數據領域的人,雖然可以運用 LLM 來進行簡單的分析,但當需要更深入、更多資訊交叉驗證的時候,還是需要專業的數據分析師來介入。正如我之前提到的,真正有價值的分析需要理解數據之間的關聯性 ,這是一般人僅靠工具無法輕易做到的,因此,即使有 LLM 的輔助,真正高階的數據分析需求依然會回到專業人才手中。

Q6: 那之後資料分析師會不會取代一些基礎的營運或行銷人員的工作?因為有數據思維又有分析能力,然後如果他又有學一些 Domain Knowledge 的話,是否反而能取代原本 Function 的工作?

A6:我認為確實有這個可能性。不過如果你問我的話,我自己其實不太喜歡跑業務。以我們這種從事數據分析的人來說,老實講,我更喜歡跟電腦打交道,對於需要頻繁外出或社交的業務工作,興趣並不大。

當然,這還是要看個人的性格。有些工作確實需要比較外向、擅長與人溝通、能夠快速建立人際關係的人來擔任,如果你的性格適合這樣的角色,或者你願意嘗試,那也未嘗不可。最終還是要看自己想不想做,以及是否享受這樣的工作方式。

Press enter or click to view image in full size

Photo by Priscilla Du Preez 🇨🇦 on Unsplash

Q7:想請問 LLM 會怎麼改變數據分析師的工作流程?

A7:我認為,未來的數據分析流程不會有太大的改變。或許在某些步驟上,像是生成圖表這種工作,可以交由大型語言模型(LLM)來完成,因為 LLM 確實能進行一些基礎的分析,但最關鍵的部分仍需要由一位成熟的數據分析師親自把關。

真正有價值的地方在於:數據分析師需要花上一段時間(可能一小時左右)仔細檢視圖表,深入理解其中的資訊,並且將從數據中發現的洞察,具體連結到業務層面。

也就是說,能夠把報告的內容轉化成與商業策略或決策直接相關的洞見,這才是數據分析真正創造最大價值的地方 ,也是真正的「數據整合(Data Integration)」能力所在。

Q8:當我們無法知道 LLM 用了什麼資料做訓練,我們要如何更相信或是去驗證 LLM 的輸出?

A8:無論科技多麼進步,最終還是需要人類具備自己的邏輯思維和批判性判斷能力(Critical Thinking) ,這一點非常重要,即使大型語言模型(LLM)可以提供協助,最終的判斷和決策仍應由人來把關。

另外,我有一個建議:使用LLM時,不要完全相信它的輸出結果,你可以將一個模型給出的答案,再拿去詢問其他模型或是請教其他人,進行交叉驗證。

Press enter or click to view image in full size

Photo by Elimende Inagella on Unsplash

Q9:過去,要完成一個 AI 專案,通常需要領域知識專家(Domain Expert)、資料科學家(Data Scientist)以及數據分析師(Data Analyst)等多方合作。然而,隨著大型語言模型(LLM)和 AI Agent 等新技術的出現,現在有些專家搭配這些工具,已經可以獨立完成某些 AI 任務。在這樣的趨勢下,沒有特定領域背景的數據從業人員該如何思考自己的未來發展方向?是否應該考慮轉向 AI Engineer 的角色?

A9:老實說,這個問題並沒有一個標準答案,確實比較難回答。不過有一點可以確定的是

在數據領域工作,最終還是離不開一定程度的領域知識(Domain Knowledge)。

如果要思考未來的發展方向,我會建議,不要單純等待公司安排,而是主動進行自我複習、培訓與學習 。現在要找到可以練習的數據資源其實很容易,你可以從網路上找到各種公開數據,自己建立專案,自主練習。當你累積了一定數量的專案經驗後,就能將這些作品作為作品集,去申請數據相關的工作。

在這個過程中,你也可以觀察自己對數據分析的興趣程度。如果做著做著發現自己其實不太有興趣,也不用太擔心,可以再慢慢轉向其他領域,比如考慮朝 AI Engineer 發展。其實,除了 AI Engineer 之外,還有很多不同的職涯選項,例如 Data Scientist、AI Specialist 等,都可以根據自己的興趣與技能,做出最適合自己的選擇。

Press enter or click to view image in full size

Photo by Alexander Schimmeck on Unsplash

筆記手:盧姵吟 Lavina Lu
校稿:古秉松 Koo Ping Shung(Linkedin

👉 歡迎加入台灣資料科學社群,有豐富的新知分享以及最新活動資訊喔!
https://www.facebook.com/groups/datasciencemeetup