前往 Medium 閱讀好讀版
Member-only story
講者:鄭凱承 Kevin Cheng | 資深資料科學家@FAANG
成為具備影響力的資料科學家
從個人學習到產生組織影響力的關鍵硬實力與軟實力,資深科學家和入門科學家的不同。
活動主辦單位: Taiwan Data Science Meetup 台灣資料科學社群
在不同階段的資料科學家,如何更有效率的從自己擴大影響力到組織,包含在電商(e-commerce)和產品導向產業(Product)的實務經驗,提供進入資料科學領域的參考培養技能。另外,職涯階段成長建議包含目標, 專業技能以及如了擴大影響力的建議。
大綱:
- 瞭解資料科學的工作內容
- 增進能產生影響力的技能
講者介紹:
Kevin目前在FAANG之中擔任資深資料科學家,專注於NLP應用開發和評估(Evaluation)。過去十年間曾任職於芝加哥高頻交易公司Jump Trading, 電商公司 Orbitz, Groupon 擁有豐富的職場經驗。先後擔任過 Senior Machine Learning Engineer 和 資料科學技術Lead Data Scientist 的相關職位,有機會近距離觀察美國企業如何將機器學習和數據科學轉換為data-driven在不同領域的演變和應用。特別專注於自然語音處理,資料科學,大數據分析在市場營銷, 產品與用戶的應用。美國密西根大學University of Michigan EECS碩士主修AI跟數據庫, 清華大學物理系學士。
資料科學的工作領域
了解自己的強項是哪一種,可以找到適合自己的職稱,對於找工作很有幫助。
** 資料>**
- Analysis and Data Manipulation
- Distributed Data Pipeline
- Data Pipeline
** 科學>**
- 優化 Optimization : 包含Dollar Value 優化收入, Customer Experience 優化體驗, Rank Optimization, Personalization, Recommendation System, Predictive Modeling
- 驗證 Evaluation: A/B Testing, Often Evaluation, Observational Study, Human Annotation,
- 進階分析Advanced Analysis: Metrics Development, Metrics Reporting , Data Analysis & Insights
** 呈現>**
(模型呈現 → 分析報告)
- Interactive UI App
- Model Service
- Data Product/ Table
- Dashboard
- Report/Paper
如何成為有影響力的資料科學家?
教科書上可能常見模型開發流程如下。
資料 → 模型訓練 → 線下評估 → 模型部署 → 線上評估 A/B Testing
實際工作則是一個循環,而且錯中複雜。評估後,有時要回到資料有時,又回到模型訓練。
重點是提升可靠, 快速, 精準的結果。
可靠&精準>
** 穩定性Robustness**
適用於模型和分析和預測。
- 結果要計算Uncertainty 或是 Confidence Interval
- 分析:多次取樣資料(不同時段和不同樣本大小)重複同一個分析
- 模型:同一個模型架構,同樣訓練樣本,看Metrics大小和變化