Member-only story

講者：鄭凱承 Kevin Cheng | 資深資料科學家＠FAANG

成為具備影響力的資料科學家

從個人學習到產生組織影響力的關鍵硬實力與軟實力，資深科學家和入門科學家的不同。

活動主辦單位： Taiwan Data Science Meetup 台灣資料科學社群

在不同階段的資料科學家，如何更有效率的從自己擴大影響力到組織，包含在電商(e-commerce)和產品導向產業(Product)的實務經驗，提供進入資料科學領域的參考培養技能。另外，職涯階段成長建議包含目標, 專業技能以及如了擴大影響力的建議。

大綱：

瞭解資料科學的工作內容
增進能產生影響力的技能

講者介紹：

Kevin目前在FAANG之中擔任資深資料科學家，專注於NLP應用開發和評估(Evaluation)。過去十年間曾任職於芝加哥高頻交易公司Jump Trading, 電商公司 Orbitz, Groupon 擁有豐富的職場經驗。先後擔任過 Senior Machine Learning Engineer 和資料科學技術Lead Data Scientist 的相關職位，有機會近距離觀察美國企業如何將機器學習和數據科學轉換為data-driven在不同領域的演變和應用。特別專注於自然語音處理,資料科學,大數據分析在市場營銷, 產品與用戶的應用。美國密西根大學University of Michigan EECS碩士主修AI跟數據庫, 清華大學物理系學士。

資料科學的工作領域

了解自己的強項是哪一種，可以找到適合自己的職稱，對於找工作很有幫助。

資料>

Analysis and Data Manipulation
Distributed Data Pipeline
Data Pipeline

科學>

優化 Optimization : 包含Dollar Value 優化收入, Customer Experience 優化體驗, Rank Optimization, Personalization, Recommendation System, Predictive Modeling
驗證 Evaluation: A/B Testing, Often Evaluation, Observational Study, Human Annotation,
進階分析Advanced Analysis: Metrics Development, Metrics Reporting , Data Analysis & Insights

呈現>

(模型呈現 → 分析報告)

Interactive UI App
Model Service
Data Product/ Table
Dashboard
Report/Paper

如何成為有影響力的資料科學家？

教科書上可能常見模型開發流程如下。

資料 → 模型訓練 → 線下評估 → 模型部署 → 線上評估 A/B Testing

實際工作則是一個循環，而且錯中複雜。評估後，有時要回到資料有時，又回到模型訓練。

重點是提升可靠, 快速, 精準的結果。

可靠＆精準>

** 穩定性Robustness**

適用於模型和分析和預測。

結果要計算Uncertainty 或是 Confidence Interval
分析：多次取樣資料（不同時段和不同樣本大小）重複同一個分析
模型：同一個模型架構，同樣訓練樣本，看Metrics大小和變化