前往 Medium 閱讀好讀版

2024美國DS求職歷程及美中台工作體驗分享

Bert Lee| Data Scientist | Warner Bros. Discovery

活動主辦單位:Taiwan Data Science Meetup 台灣資料科學社群

講者介紹

Bert Lee 目前在 Warner Bros (WB) 擔任 Data Scientist,大學於台大工科海洋系就讀,畢業後加入了新展銀行 DBS Bank 擔任資料分析師,接著在約莫一年後加入了 Disney Plus, based 在北京,接著在 Yale 念 MA,最後到了 Warner Bros。

今天主要分享的是兩個主題,「美國求職歷程與面試經驗」、以及「美中台三地的生活條件比較」。

Press enter or click to view image in full size

2024 美國 DS 求職歷程分享

Press enter or click to view image in full size

講者約莫從今年 (2024) 一月中開始海投,一路到四月,在三個月的時間內投了 308 份履歷,收到 HR Call 的有 18個,走的 Tech Interview 有 13 個,走到 final round 有 6 個,最後拿到 3 個 offer,從投遞到 HR Call 的轉換率約 6%。

那麼市面上的轉換率有沒有更低,有難點去探勘,不過講者在其他網路平台也有發布相似文章,其中留言最多讚的留言是「18 / 308 也叫做地獄模式? 是否是炫耀」,表示廣大網友認為說以當時的市場狀況,6% 轉換率「可能」算是高的。

Press enter or click to view image in full size

這是 Indeed 所做的一個調查,以 Software Engineer 的市場需求量來說,需求量在疫情時達到高峰 (2021~2022),下降趨勢可以從 2023 開始看到,近期 2024 則非常的冷淡,也就是當今大家所說的 Software Engineer 市場並不理想的狀況。

另外,講者自己的同學有投出破千封履歷,也有從 5 月畢業開始頭,到目前都還沒上岸的,所以大家可以了解到目前就業市場上的困難。

面試歷程

Press enter or click to view image in full size

將有進入 HR Call 的公司展開,職位多半是 Data Scientist,但也有一些比較特別的公司像是 AppLovin,希望講者去做 Machine Learning Intern,並且說明有高度機會轉正,最後 Expedia, Warner Bros 的 Data Scientist 更符合講者所想要的發展方向,並且當初投遞時, JD 上寫的是 Data Scientist III,有獲得面試機會是出乎意料的,不過最後面試完獲得的 Offer 也將職級調整回 Data Scientist II。

公司都問哪一些問題?

Press enter or click to view image in full size

Expedia

一面是 Hiring Manager (HM),原本是說考 SQL & 履歷 QA 為主,結果實際以 Machine Learning Theory + Leetcode 為主, Leetcode 題目難度約 easy ~ medium 之間。

二面是 Virtual Onsite — 4 輪的連續 45 分鐘技術考題,在同一天內接續進行:

  • ML Theory
  • Behavior Questions (BQ)
  • 如何處理與 Team mate 之間的 conflicts
  • 團隊來了新人,會怎麼帶他/她,有什麼技巧或是需要注意的地方?
  • SQL
  • Stats + ML Coding

整體面試內容算難, ML Theory 也都問到蠻深的。

Meta

一面 — 和 Expedia 蠻像的,一面是 SQL 題組 + Product Case (以下會提到一個 Case)。

二面 — 一樣是四輪的 Virtual Onsite,和 Expedia 不同的是,沒有考 ML Theory。

CVS

一面有 Coding Challenge,考了非常多的 pandas,講者這部分沒有打的很好,這部分就掛掉了,但已知的是後面也是非常多輪。

Press enter or click to view image in full size

Walmart

一面 — Pytorch 的 Pipeline building,是面試官特別準備的題目,用 Pytorch 寫過,再把這些題目挖空格,題目聚焦在推薦系統的建模上 (e.g. Matrix Factorization),當時很多語法細節,講者也不是說很清楚,就掛了,不過面試官非常 nice,一直給予鼓勵,也有耐心引導。

AppLoving

一面 — 比較特別的是 HR 先來 Interview,並且先定錨一些薪資、入職日期的問題,也問了一些技術問題,感覺對方是開了一個題庫然後丟問題過來。

二、三面 — 兩輪的 Tech,聚焦在履歷 QA, Leetcode, ML Design。

Shopify

除了一般的履歷QA外,二面是 Pair Programming,特別考了一些 OOP,以及 Test case 的撰寫,後續公司想把講者從 DS 轉為 MLE,但講者評估後覺得難度有點高,就沒有面下去。

Warner Bros.

算是蠻標準的過程,一面是 HM,履歷QA,二面是四輪的 VO。

Product Case 面試都考些什麼?

Press enter or click to view image in full size

主要是因為 Meta 的 Product Data Scientist (PDS) 特別準備的,且 Meta 的 PDS 不做 Modeling,這裡舉的一個例子是 Facebook 的通知功能:

Define Metrics — Quality of a notification — 你會如何定義「通知」的質量如何,這會決定通知該送還是不送,是有效的通知還是造成困擾的通知?

  • 重點會是從哪些面向切入,給出量化的定義,並瞭解該量化指標可以探索到哪些 user / company / vendor 得 success case / failed case。

Experiment Design — 哪些通知會是好的,哪些通知會是不好的?

  • How to define the groups, how to evaluate?

Experiment Evaluation

  • Short-term metrics increase, Long-term metrics decrease

Problem Investigation

  • CTR 降低了,為什麼?

Machine Learning 面試都考些什麼?

Press enter or click to view image in full size

ML Theory

以下都是常考的,雖然課程上上過,但還是會需要複習:

  • Overfitting / underfitting
  • Boosting / begging
  • Common loss functions
  • Imbalance data

ML Design

  • 面向 System Design,通常會配上該公司的場景,特別注意的是 Evaluation, Features, Model。

ML Implementation

  • 常見的簡單演算法有時候會遇到實作,例如 KMeans, Linear Regression, Logistic Regression。

DS Skills Buildup Roadmap

Press enter or click to view image in full size

左邊是 2021,右邊是 2024,左圖有火的,仍然是不變的重點。

  • Programming 方面 — Python, Pandas, SQL 仍然是考題大宗,必須相對熟悉,2024 有被考到 Pytorch & OOP。
  • Deep Learning 方面 — 2024 有被考到更多,感覺上是與趨勢方法有關,如果工作內容更偏向 ML ,就是必要準備。

How to Get Interviews?

Press enter or click to view image in full size

  • 內推拿面率是比海投高非常高 (24.2 vs 2.2),如果有內推機會,積極爭取的話拿面率很高。
  • Easy Apply 可以試試看,但成功機會不大,也可以多看 Job Board 後面的職缺,後面的比較多人漏掉,如果投了容易有比較高的機會。

Press enter or click to view image in full size

  • 老生常談是 STAR 法則 (Situation, Task, Action, Result),要保持精簡並且交代成效。
  • Keyword highlight & 排版要設計清楚,要假設 HR, HM 只會有 10 秒的觀看時間,並且履歷的第一塊最近工作經驗會是最被看重的,這一段要寫得最吸睛。
  • 講者有聽過朋友有針對公司做履歷的客製化,拿面率有蠻大的提升。

美中台 Data 工作體驗分享

Press enter or click to view image in full size

錢的話,不太好意思直接說數字,A 是在台北星展銀行的工作,B 是在北京 Disney Plus,C 是現職,大家可以看到薪資有點等比級數的成長,不過不同地區的消費水準也有差異。

Press enter or click to view image in full size

  • 在台灣的時候沒有房租的問題,到了北京租房,大約是 23k 台幣左右,在 NY 則是 76k,還比在北京的房間還要小,雖然薪水有成長,但房租也有蠻大的差異。

Press enter or click to view image in full size

  • 台北星展的工作量不多,工時正常。
  • 北京 Disney Plus — 當時在北京,整體來說 Disney Plus 雖然在對岸是外商,但下班時間還是偏晚,這是整體工作文化的關係。
  • 美國 Warner Bros — 在美國,WB 則是沒人管你有沒有來辦公室,大家差不多 1600–1700 就下班了, Loading 也比較低,更注重 WLB, Manager 會鼓勵你多享受陽光、假日,帶家人出去玩,其實不只是 WB,美國蠻多企業都是這種文化。

Press enter or click to view image in full size

  • Disney Plus, Warner Bros 都是以串流為主的模式,工作內容主要聚焦在 User Segmentation 以及 content insights,舉凡各類片型的收益羽投資報酬率,到 User 喜歡哪一類的影片。
  • DBS 則關心貸款、信用卡的成效如何,有一個蠻特別的 project 則是要配對 Relationship manager 以及 Customer,這個題目有點像推薦系統,要根據各自兩方的屬性來作配對。

Press enter or click to view image in full size

  • DBS — 學習 SAS, Power BI, Python,以及消費金融知識。
  • Disney Plus — 學習 PySpark,用於處理 TB 等級的資料,以及軟體工程師之間的協作技術,英文工作,以及敏捷團隊的工作方式。
  • Warner Bros — DataBricks (也是 spark),目前也剛進入,持續尋找成長的機會,有更多工作心得後再來分享。

精選Q&A

  1. 為何當時不選data engineer 選data science 作為職涯發展,也可以分享這兩者的發展嗎?
  • 比起 Data Engineer, Data Science 的工作內容更沒有標準答案,探索性的成分更高,而講者本身更享受這個探索的過程。

2. 請問最後選擇Warner Bros的offer而非另外兩個offer的考量?

  • $$ : Warner Bros 的 package 比較好。
  • 地點 : 比起西雅圖、更喜歡 NY。
  • AppLovin 的工作雖然有比較有更多機會接觸 SOTA Algorithm,但考慮到是 Intern, Warner Bros 是 full time offer,風險較低, Work Life Balance 也更好一點。

3. Leetcode有3000多題,可以分享如何準備嗎?

  • DS 的話 100,200題是差不多足夠。
  • MLE 則話有更高的要求,會和 Software Engineer 的標準相同,講者有認識的朋友 Meta MLE 刷 200 題也有上,經典題型的熟悉度會比題數更為重要。

4. 請問你有美國身分嗎?還是是F1 opt選需要sponsorship呢?

  • 沒有美國身份,書面上都先填不用 sponsorship,先以書面過,遇到 HR Call為主,遇到真人如果有被問到,則會說明自己的狀況,還是會誠實說明。

5. 講者可否幫忙大家 抓個 面試 Tech interview 準備的重點呢? 您是如何準備這些ML Theory topics ? 有那些特別重要? 在實質工作上與你遇到面試的題目的相關性 有多少呢? 感謝!

  • 大致上就跟 DS Skills Buildup Roadmap 來做準備,現在有 ChatGPT,不會的可以多討論,速度會快很多。
  • 面試題目與實際工作的相關性,還是以公司和工作團隊為主,也要觀察用人單位的規模,小團隊什麼都會做,但團隊就會相對專精。

6. 請問有觀察到美國data就業市場緊縮的原因嗎?是跟景氣循環或是整體產業趨勢有關嗎?會和生成式AI興起有關聯性嗎?謝謝!

  • 生成式 AI 卻是會有影響,講者認為產品面的 DS 會更多,因為較不容易被取代,而工程面會更被簡化,但真正的趨勢還是要靜觀其變。

7. Data science 這職位會有35歲,或者多少歲以後比較難應徵的狀況嗎?

  • 以美國來說的話是還好,例如說在大廠 Meta,在35歲之後還在做 DS 的人還是蠻多的,但不同國家可能有差異。

8. 講者提到目前很少Coding,可以分享平時工作內容主要是那些嗎?

  • 主要在做 User Segmentation,並根據不同的 User Segment 做不同的 Marketing Strategy 或是客制化的 Content Strategy。
  • 前 DS 的工作很少是 ChatGPT 寫的出來的,除非你是要想一個很大的系統。

9. 講者本身 在碩士之前 就有很多 ML model 的經驗嗎? MA degree 是錦上添花還是有實際幫助?

  • MA degree 更像是錦上添花,而 ML 理論 / Deep Learning 理論以及 Grap 相關得演算法,在面試時會蠻有幫助,但在實際工作上則還好。

10. machine learning 崗位比較少,data analyst 崗位比較多,美國也是這樣嗎?

  • 講者這邊沒有統計數字,不是很確定,但是兩個崗位都有,講者自己感覺是 machine learning 更多一些,在市場上的 feedback ,例如 Meta, Shopify 也是 machine learning 比多一點。

以上是本次的分享內容,其實講者本人的 Medium 有更詳細的內容,如果想要瞭解更多,講者本人也歡迎大家加他的 LinkedIn 或者寄信 email 更多細節。

Press enter or click to view image in full size

筆手 : Joe Tsai

校稿:Bert Lee, Andy Chang

👉 歡迎加入台灣資料科學社群,有豐富的新知分享以及最新活動資訊喔!

https://www.facebook.com/groups/datasciencemeetup