2024 領航計畫已開放報名,請點擊後查看報名資訊
前往 Medium 閱讀好讀版

講者:張為淳 Marcus Chang|Senior Data Scientist @ Houzz

在實作中了解自己,為下一個目標職位做準備

前言:

對於資料科學充滿憧憬,但範疇廣大難以下手;如何以實作的方式循序漸進找尋自己想要的目標並適度調整方向,釐清自己的思緒並穩定地前行。

Marcus 希望藉由自身過去三年來三份工作的轉換來分享,如何在每一份工作中累積經驗並為下一個目標做準備;拓展自己的工作範疇並提案 side-project 來累積不同領域額外的實務經驗以增加更多的職涯可能性。

Marcus 在大四那年,在 Netflix 來台時和朋友討論到推薦系統和數據導向決策如何幫助 Netflix 的線上串流成長,而對資料科學產生興趣,決定畢業後走上 Data 的道路,卻以行銷作為起點,開始了自己的資料科學生涯。

Marcus 在業務導向的部門中,試著以 Data-Driven Digital Marketing 來積累自己的經驗;跌跌撞撞後,目前在美國新創 Houzz 擔任Data Scientist,協助產品經理及開發團隊以 A/B Testing 及探索性分析來進行產品優化,並持續探索著下一步的可能性。

活動主辦單位: Taiwan Data Science Meetup 台灣資料科學社群

大綱:

一、講者介紹 (Introduction)

二、Experience to Title

三、Write things down

四、Adjustment for next step

五、Q&A

一、講者介紹 (Introduction)

張為淳 Marcus Chang

Marcus 的學、經歷背景

學歷 (Education)

Marcus 畢業於政治大學資訊管理學系,但到了大三、大四才接觸了 Python、R,當時資料科學還不是一個 Buzzword ,相關的技術也沒有接觸太多。

工作上所需的資料相關能力,大多是透過線上學習平台學習對應的資料相關技能。應徵第一份工作時,主要是透過 Udacity 的 BA、DA 專案經驗以及Kaggle上的經驗去展現自己的能力。

經歷 (Work Experience)

  • Internship
    - IT Intern / PM Intern
  • Amazon-Marketing Specialist-Analyst
    - 畢業應徵第一份工作時,Marcus 其實有應徵上許多的 DA、DS 職位,但都是 data team 的前幾名員工,屬於 data team 的草創期,基礎設施都尚未完善,Marcus 認為當時對於其職涯發展較不理想,還需要更多學習的經驗。
    - 因此,在 Amazon 找到一個偏分析的職位,認為 Amazon 在基礎設施(資料庫等)、商業分析報表都更為完善的情況下,較為適合職涯的起點。
    - 後因日常有許多文案、廣告設定等人工工作,工作有許多不相關於 data 的工作,希望可以專注在 data 的道路,後轉換到樂天當Data Scientist。
  • **Rakuten (樂天)-Data Scientist
    ** - Marcus 於樂天學習到 Data Scientist 也有許多不同的 function/部門,找到自己想要當的 Data Scientist 類型。
  • **Houzz-Senior Data Scientist
    ** - 擔任與產品相關更緊密的 Data Scientist,繼續職涯發展。

二、Experience to Title

Marcus 藉由 Movement Cycle 的方法在工作上不斷精進自己,
1. 機會 (Opportunity):找尋實作的機會,產生經驗。
2. 經驗 (Experience):從經驗中累積,得到反饋,設定下一步。
3. 下一步 (Next Step):設定目標,透過經驗的累積尋找新的機會,形成正向循環。

Movement Cycle by Marcus

下列介紹 Marcus 如何在不同公司都透過相同的 Movement Cycle 精進自己!

Amazon-Marketing Specialist-Analyst

How Amazon uses data

  • 從行銷的角色如何利用資料來增加工作的效率、可能性
    -從文案主題、廣告優化、用戶訪談開始找出改善部門轉化率的 機會。
    以文案主題為例
    :透過在社群媒體上的文章,可以觀察到不同類型的問案主題對於受眾是最有幫助的,在此建立對於資料如何幫助改善、加值工作有第一步的認識。
    又比如 關鍵字報告 ,也可以透過公司的行銷漏斗觀察數據,發現不同關鍵字的轉換率是可以改善的,進而透過分析去調整,達到廣告投遞的優化,這些經驗都可以替自己的履歷增色。
  • 透過個人獨有的技能可以做更多的事情
    -爬蟲軟體開發

    工作上遇到從電話市調公司取得的公司名稱、公司官網資料,但沒有對應的電話、聯絡人、窗口資訊,行銷部門還需要人工上網查詢,此時透過網路爬蟲的能力自動爬取 Excel 內的網址,自動補全相關聯絡人資訊,透過爬蟲程式改善過往人工搜尋的不便。
    也因此讓團隊發現,個人特有的程式技能可以做出不一樣的貢獻,也增加可以寫入履歷的經驗。
    -CRM 系統的自動轉換
    透過 pandas 將不同資料源的資料轉換成乾淨的 Excel 資料(CRM 接受的資料型態),上傳至 CRM 系統。
    慢慢透過上述的經驗,透過程式幫助日常工作的效率,在團隊中的貢獻、角色更加鮮明。
  • 公司內部商業分析團隊的工作
    -Reporting
    當時上海有一個商業分析團隊,有幸得到團隊內部的主管當 mentor,去學習上海的 data 團隊如何工作。
    公司有一個 ETL 系統,可以設定多久抓一次、寄信給誰,當時就寫了一個 SQL query,完成賣家業務報告的自動化,可以達到一個商業分析師的reporting 功能。
    -Dashboard & Deep Dive
    當時遇到一個狀況,美國秋、冬裝快要來臨,但不太清楚各類型的銷售狀況,如果透過人力研究很花時間,就可以透過資料視覺化呈現 dashboard ,幫助了解趨勢,讓後續的行銷、業務團隊可以做因應的措施。
    透過這些訓練,越來越接近上海 data 團隊在做的事情。
  • 了解就業市場概況並試著複製(如何轉換到工作內容更相關 data 的團隊)
    -Linkedin 履歷參考、分享會等等
    從 Linkedin 找尋相關職位的敘述,看看他們實際工作的內容,針對去補足目前不足的部分。
    -試圖模仿自己的一個end-to-end專案
    當時看到 Linkedin 上面的人都會完整描述 end-to-end 的專案經驗,發現這樣對於履歷是非常加分的。
    當時台灣團隊都會有一個賣家高峰會,一次招募許多賣家,讓業務團隊有新的賣家可以拓展業務,過往這樣的活動都是發想一個主題,但發現轉換率不佳、投資報酬率不理想。
    發現這樣的狀況後,就透過資料分析去了解台灣對比其他國家的優勢在哪,比如說 3C、嬰兒用品,把分析結果與行銷團隊討論,此次賣家高峰會是不是可以針對相關主題做行銷、活動,來提高轉換率。
    像這樣的 end-to-end 經驗在履歷上就有更完整的呈現。
    -設計履歷中的呈現
    每次做完專案都會先粗略的描述在 Linkedin 上,之後找工作的時候針對職位描述,挑選適合的專案去詳加描述,凸顯與職位的契合程度。
    -Amazon內部的ML競賽
    Amazon 內部都會定期辦 global 的競賽,拿真實遇到的問題給大家解題,像是預測 IT 問題是硬體還是軟體、黃標預測等等。
    透過這樣的競賽,可以觀察到世界各地 Amazon 的資料科學家是如何解決問題,進而完善下一步要前往 DS、DA 職位的能力。

Rakuten-Data Scientist

What kind of Data Scientist you want to be?

  • 團隊能給予你的經驗與學習
    -論文閱讀以及工作中的應用
    來到一個真正的 data 團隊,有許多碩、博畢業生,學習到大家如何將論文應用到商業情境上,不論是因果推論、ML 解釋性方法等。
    -同樣的案子每個人使用的方法
    每一個成員使用的方法可能都不同,比如說對於廣告成效的優化,相同的 KPI ,有的人是專注在 modeling,有的人是專注在資料科學在行銷的應用,有的人則是特別研究廣告、消費者行為分析的相關論文。
  • 自己額外去做的 side projects
    -Python Package API 開發
    樂天這樣的 data 團隊,有的人是特別開發專門的 Python 套件給內部使用。Marcus 根據 data team 新進人員可能會遇到的問題,比如說如何使用資料庫、哪種分散式系統以及相關設定等,導致新進人員 onboard 之後,可能要一、兩週到一個月才能專注在專案上。針對這個問題寫了一個 Python package 將可能需要幾百行的 code 轉化成透過 package 的引入只要簡單幾行就可以完成資料收集、分析、modeling等。
    -Streamlit Web App for Business Users
    行銷、業務團隊可能需要常常去看品類市場占比或者是關鍵字搜尋的趨勢分析,根據這部分的需求,建立一個 Web App 給不同部門使用。
    這些都是透過自己網路上學習以及在工作上把握機會,試著讓自己累積不同的經驗。
  • 工作中無法滿足我的部分
    -Data Science Full Cycle 環節
    1. 業務、行銷為對口的工作多佔價值鏈最末端
    較少可以接觸到 Cycle 的上方,而 Marcus 對自己的期望是希望工作5年、10年後可以自己打造產品或是加入新的 feature 到公司的產品中。樂天在此方面可能沒辦法滿足這部分的需求。
    2. 統計及系統性的方法 - > 個人成長
    團隊比較不會 coaching 如何做專案,大家都使用各自的方法去完成任務,希望可以學習在量化分析、應用統計、完成專案上更系統性的方法。
    3. 對個人長期目標幫助有限
    因此,決定從樂天轉向 Houzz 。
    但能夠做出這樣的選擇,是透過前面在 Amazon、樂天(opportunity -> experience -> next step) 的 Movement Cycle 累積而來。

三、Write things down

持續寫作、釐清思緒

  • Amazon Doc
    概述:以不包含形容詞、副詞,僅以實作、計畫及成果的方式描述工作成果及開會反思方式進行審核。
    Amazon Doc 實際執行是透過寫 Word替代 PPT,PPT 常常會從一個 Overview 的角度去描述,而 Word 全文字描述則會迫使鑽入細節。
    比如說業績成長,是哪一部分成長?為什麼會成長?如何複製到其他工作上?
  • Medium
    一個整理自我思緒並與他人分享獲得反饋。寫作中會重新反思,以一個更全面的方式,去省思自己真正想要的目標以及自己目前的方向和進度。

四、Adjustment for next step

From Google

從 Google 影片分享看到將資料科學分成 3 個部分:

  • Analytics & Tools (Dashboard / EDA / Software Development For inspiration)
  • Statistical Inference (Make Decision Better)
  • Machine Learning (Get Solution)

Analytics 部分是能夠大致上了解狀況、趨勢 (get inspiration),進一步還需要 Statistical Inference 去證實看到的是否為真,以及如何做決定(Make Decision Better),最後透過資料去建立 ML model 去 Get Solution。

目前 Marcus 在 Houzz 的工作內容是相關於產品,也就是 Analytics & Tools 與 Statistical Inference 的交集部分。比如說購物車按鈕的變化透過 A/B testing 去了解對轉換率、業績的影響。

在離開樂天之後比較沒有接觸到 ML,希望之後可以找到機會將 ML 也融入進,達到三者的交集之處,達到一個最理想的狀態。

對未來的規劃

從畢業到 Amazon 到樂天到 Houzz,雖然聽起來好像每一刻都知道方向,其實花了很多時間去寫文章、寫下自己的心境、跟朋友討論、去參加分享會、看別人的文章,也花了很多時間在思考。

市場上其實也有 Data Science Engineer,專門在開發資料科學的工具,像前面提過的 python package,或者是資料轉換的 pipeline,甚至是若沒辦法做modeling,也可以做 PM (產品經理、專案經理),對資料科學很熟悉,透過與 MLE、SWE 溝通去主導一個專案,其實都還在思考不同路線的可能性。

Marcus 希望與大家分享,如果你覺得迷惘或者說,沒有很清楚自己該怎麼做,都很正常,因為此次演講是把這3年融入在 slides 裡面,不是每一天每一天都清楚自己的方向,其實到現在都還很認真在思考說,到底該怎麼在工作中有更大的影響力,或者說在工作中有成長,把哪一部分摸得更熟悉。

應該專注在怎麼繼續做準備,繼續一步步地規劃與反思,偶爾犯錯,偶爾學習,盡量保持正向、保持輕鬆的態度,去面對職涯上的挑戰。

五、Q&A

Q1:請問有沒有推薦準備 A/B testing 面試的方法?

  • Udacity A/B testing,雖然課程內容有點長,但內容相當全面,是 Google 內部員工開設的課程。
  • Uber、Netflix 的 Medium tech blog也有相關的文章可以參考。

Q2:請問是否可以推薦幾間公司 真的是協助解決市場相關的Data science 職缺呢?因為台灣市場上都是以電腦視覺為主,其實真的面對解決商業問題的公司真的很少。 不然就是還處於非常初期的狀態。

  • 我可以提幾個,但我沒有在裡面工作過,可能不清楚裡面的狀況,我是以他們的員工以及他們有改善的部分,像是 kkday ,我知道 Irene Team 下面有招 BA、DS,他們有建立資料平台或者用戶有足夠的規模。
  • 旋轉拍賣也有徵 Operation 的職位,其中有描述說希望有資料分析、SQL能力,就我的了解,他們想要對內部以及用戶的流程優化。
  • 有一點 data team 規模會比較推薦,在工作上會得到的 support 比較多。
  • 街口電子支付股份有限公司
  • EZTABLE_三二三網路科技股份有限公司

Q3:請問如果有一些基礎的資料科學能力,但過去很少行銷相關的經驗,在找第一份工作時如果想找商業分析相關的,有什麼樣的建議嗎?謝謝!

  • 我覺得可以多方的面試、嘗試,因為我現在其實也發現,除了 Marketing team 需要資料分析的能力之外,我也看到許多 Finance、Operation、甚至廣告,在準備面試、面試途中,去釐清自己對於不同產業更感興趣,再來看根據自己的專長去摸索出方向。

Q4:謝謝講師的分享,想請問講師,我是資工所畢業生,過去沒有做過資料分析的經驗,只有做過電腦視覺的ML,想請問工程端的人該如何踏入analyst的領域,開始資料科學的專案?

  • 我覺得 CV 也算是分析的一部分,只是分析對象是圖片,透過處理圖片的手段、套件可能不同,可能要去了解的是如何處理不同資料、轉換資料的方式。
  • medium 上面許多文章,或者是 kaggle,都會有一些資料,可以透過這些資料去處理什麼樣的商業問題? 可以先從看、模仿,看別人怎麼做的,複製別人的 project,一定會有一些想法可以想到有什麼還可以做的,然後做完可以分享給別人,再從得到 feedback 學習。

Q5:請問一下,你提到的統計論證可以說得更細節一些嗎?我們公司通常模型上線後就看 A/B testing,因此想問下這個有什麼建議的研究方向嗎

  • 推薦可以看O’Reilly Practical Statistics for Data Scientists,其中有資料科學中的統計理論,以及實際的應用場景,另外也可以去看各公司評估 ML 效果的方法有哪些,或者 feature explanation,也許會發現 data leakage 的情況等等。另外,因果推論、SHAP value 或者其他指標對於模型結果的影響都是可以參考的方向。

Q6:就你的經驗,什麼樣的公司/公司環境/文化/產品會更相對看重Business Analyst 這類的職位?如果想從業務端跨到data analysis的領域,要怎麼開始比較好?我有考慮像是 CRM Analyst 類似的職位,因為本身非常熟悉Salesfoce,常常從裡面抓報告分析做dashboard等,請問有什麼建議嗎?

  • 我覺得公司在做決策時都會先討論需考量的方向,願意花時間讓團隊搜集數據再來進行討論的公司比較好。其實我覺得跟產業無關,比較關乎公司內部報表、數據導向的討論成熟度;當然,我們可以從產業搜集數據的方便性來討論。網路公司在工程師人力足夠的情況下,搜集數據肯定比很多線下零售業來得簡單,但不代表網路公司對 BA 相對比較看重。
  • CRM 的領域其實很大,除了顧客漏斗(Funnel)以外,同時也涉及LifeCycle、Scoring 等很多不同的顧客管理及提升營銷的方式。建議可以多看看不同公司怎麼去做,推薦 HubSpot。

Q7:想知道在樂天 DS 那時候績效考核的目標是什麼,因為提到做了很多小工具或是效率提升的方式,那跟 Rev 目標相關的任務是比較少嗎?

  • 主要還是在於業績的影響。但正是因為大多數的案子都跟業績脫不了勾,才會想要跳脫出來做一些事對工作效率影響的案子。

Q8:Marcus 你好,如果本身是商科的學生,想要跨入 Business Analyst 的領域,可以如何開始呢?是否也建議從 Marketing Specialist 職位開始,再從中找出自己的能力價值內呢?如果自學會推薦 Python 嗎?

  • 從什麼職位下手我覺得是依照個人的能力及興趣,我自己是對於廣告、網站介面等領域有先前的經驗及知識才從這邊切入,不代表這個領域對於每個人都適合。建議可以先找到自己有能力且有興趣的職能,在公司或是工作內容有列到資料應用的機會中開始。
  • 自己對身邊朋友的建議是從 SQL 開始再到 Python/R 等資料分析語言,甚至不一定要會寫程式,也有 Tableau 等其他視覺化探索工具可以使用,端看每個人的興趣及發展方向。

Q9:請問就您觀察目前資料分析的市場較看重的是經驗還是技術呢?經驗例如曾解決過哪些商業問題,技術例如擅長各種 NN 演算法之類的。

  • 如果是資料分析的話,還是以經驗吃重。整體台灣資料科學的市場,個人覺得十分兩極;IC 設計廠及許多新創都是以電腦視覺化的深度學習應用為主,自然就會要求要相關科系、論文及案子經驗的人才。而資料分析人才儘管吃重實際應用能力,但對產業的理解、經驗等成為一個領域新進的人來說卻變成一個障礙。

Q10:想詢問一下有分享到會試著去追蹤各種你協助的任務最後成果,不過會有遇到 PM 不願意配合的時候嗎(可能太忙不能多撈資料給你或是配合埋code),還是因為都是你在撈數據,所以不會有影響

  • 多少各個情況都會有。有些我可以自己去執行的,儘管PM的角色沒有餘裕可以去幫忙,我也可以視情況去自己執行。但遇到資源不足或是沒得到支持時,要看原因為何;如果是人力不足,就可以預期是要擴編還是自己額外騰出時間支援。但曾經遇過是因為不理解,不願意深入溝通而消極處理,導致了自己對於轉換團隊有了更多的動力。

Q11:請問除了行銷漏斗外,是否有一些統計或者分析方法可以幫助廣告優化?或者挑選投廣告的名單呢?

  • 有很多方法論。例如不同受眾、預算的 A/B Testing,或是依照平台可以提供的受眾數據去切割成 rule-based 的投資策略。推薦”行銷資料科學”這個粉專跟 Medium,之中提到許多不同的行銷分析理論,也在樂天看到不少 Data Scientist 用這些理論跟方法達到很好的效果。

Q12:請問你在轉職過程中花了多少時間準備和規劃?若轉換不同產業別,該怎麼準備方向,怎麼學習使用工具?

  • 規劃幾乎是隨時都在做,除了剛入職的三個月到半年不會做規劃。這邊的規劃不一定是轉職,可能是工作職能上轉換或是希望可以涵蓋到的工作內容等。轉職時幾乎都是半年前開始暖身、投遞履歷、面試,最後三個月會積極準備準備方向和學習工具只能多 Google,不斷去看 Medium 和各個平台大家分享的經驗談。

筆手: Aaron Yang
校稿: Marcus 張為淳、Audrey Liu
👉 歡迎加入台灣資料科學社群,有豐富的新知分享以及最新活動資訊喔!

資料科學協會

資料科學協會

社群分享筆記 更新紀錄

Copyright 2020-2024 資料科學協會 All Rights Reserved.

本網站由 資料科學協會 維護