ตกลง Data Scientist คือใคร? ทำอะไรกันแน่??

https://www.dezyre.com/article/what-does-a-data-scientist-do/173

วันก่อนเพจ Data TH.com — Data Science ชิลชิล แชร์ Report ของ O’Reilly ชื่อ The Care and Feeding of Data Scientists ที่พูดถึงการสร้างทีม Data Science ในองค์กร เปิดมาแค่บทแรกก็น่าสนใจมากๆ เลยค่ะ

ในหนังสือบอกว่า คำว่า “Data Scientist” เป็นคำที่ Overload เกินไป คือถ้าเราไปถาม Data Scientist แต่ละคนว่าทำอะไรบ้าง เราอาจจะได้คำตอบที่ไม่เหมือนกันเลย หรือบางคนอาจจะคาดหวังว่าเป็น Data Scientist เนี่ย วันๆ คงนั่งทำแต่ทำโมเดลด้วย Deep Learning แน่ๆ

เพื่อให้คนเข้าใจบทบาทหน้าที่และงานของ Data Scientist มากขึ้น หนังสือเล่มนี้เลยแบ่ง Data Scientist ออกเป็น 4 ประเภทค่ะ

1. Operational Data Scientists

Data Scientist ประเภทนี้เป็นคนที่ใช้ข้อมูลสำหรับการตัดสินใจทางธุรกิจ เป็นเหมือนคนช่วยชี้ทางให้ธุรกิจตัดสินใจได้ดีขึ้น โดย Operational Data Scientist จะทำงานกับแผนกอื่นๆ ภายในองค์กร เช่น Marketing หรือ Sales เพื่อเข้าใจปัญหาและความต้องการของแผนกนั้นๆ แล้วใช้ข้อมูลช่วยแก้ปัญหาหรือแนะนำการทำงานให้แผนกนั้นๆ ทำงานได้มีประสิทธิภาพมากขึ้น

สกิลที่ขาดไม่ได้ของ Operational Data Scientist คือการสื่อสาร เพราะต้องอธิบาย concept ทางเลขหรือสถิติยากๆ ที่เหมือนภาษาต่างดาวให้กับผู้บริหารหรือเพื่อนร่วมงานเข้าใจได้ง่าย

ยังไงก็ตาม การทำงานของ Operational Data Scientist ก็ไม่เหมือน Data Analyst นะ เพราะ Data Scientist ต้องสามารถเขียนโปรแกรมและสร้างโมเดลที่มุ่งเน้นให้ธุรกิจนำไปใช้งานได้ ในขณะที่ Data Analyst ไม่จำเป็นต้องเขียนโปรแกรมหรือทำโมเดลได้

สำหรับเรา Operational Data Scientist จำเป็นมากที่สุดสำหรับองค์กรที่อยากจะเริ่มใช้ Data ที่มีอยู่ให้เกิดประโยชน์กับองค์กร และเป็นคนที่มี Business Impact มากๆ เพราะบางทีผลการวิเคราะห์ข้อมูลของ Operational Data Scientist ก็เป็นตัวกำหนดทิศทางขององค์กรเลยด้วย

2. Product-Focused Data Scientists

สำหรับ Data Scientist ประเภทนี้ชื่อก็บอกอยู่แล้วว่าต้องทำงานกับทีม Product แน่นอน โดย Data Scientist ประเภทนี้จะใช้ความรู้ทางด้าน Data Science หรือ Machine Learning มาทำเป็น Product หรือ Featureให้ลูกค้าใช้ เช่น Recommendation บนเว็บไซต์หรือแอปพลิเคชัน

นอกจากนั้น ยังต้องคอยตอบคำถามต่างๆนานาจากทีม Product ด้วย เช่น “ผมอยากรู้อะ feature นี้มีคนกดไหม” หรือ “ถ้าออก feature ใหม่จะรู้ได้ไงว่ามันเวิร์ค ใช้ข้อมูลอะไรวัดดีพี่” (นี่มันชีวิตจริงชัดๆ)

ดังนั้น Product-Focused Data Scientist ต้องมีความสนใจและเข้าใจในธุรกิจที่ทำเหมือน Operational Data Scientist และต้องมีความเป็น Customer Centric ด้วย เพราะผลงานของ Data Scientist ประเภทนี้ก็คือ Product หรือ Feature ที่ออกไปให้ลูกค้าใช้นั่นเอง

3. Engineering Data Scientists

หรือที่เรารู้จักกันในชื่อของ Data Engineer และ Machine Learning Engineer เป็นคนที่เรียกได้ว่ากำลังเป็นที่ต้องการอย่างมากในองค์กรที่อยากจะทำโปรเจค Big Data

Data Engineer เป็นคนสร้างและดูแลระบบการจัดเก็บและประมวลผลข้อมูล เป็นคนที่ออกแบบและ deploy โมเดลบน production นอกจากนี้ยังเป็นคนที่หา Solution ในการ Process และ Analyze ข้อมูลขนาดใหญ่ด้วย

Data Engineer อาจจะไม่ได้มีสกิลเลขหรือสถิติที่โดดเด่นมาก แต่ต้องรู้จักการใช้ Tools ต่างๆ ในการทำ Big Data เช่น Hadoop หรือ Service ต่างๆ ของ Cloud Service Provider (AWS, GCP, Azure)

เป็นอีกหนึ่งตำแหน่งที่โดนมองข้ามไปในตอนแรก แต่ตอนนี้ทุกคนเริ่มให้ความสำคัญกับ Data Engineer แล้ว เพราะถ้าไม่มีระบบการจัดเก็บหรือประมวลผลข้อมูลที่ดีตั้งแต่แรก Data Scientist กลุ่มอื่นก็จะทำงานได้ลำบากหรือไม่มีข้อมูลดีๆ ให้เอาไปใช้ก็ได้

4. Research Data Scientists

Data Scientist กลุ่มสุดท้ายนี้คือคนที่คอยพัฒนาเทคโนโลยีทางด้าน Deep Learning, Computer Vision หรือ Natural Language Processing (NLP) ที่กำลังเป็น buzz word หรือ trend อยู่ในตอนนี้ โดยผลงานของ Data Scientist กลุ่มนี้จะเป็นงานวิจัยและความก้าวหน้าทางเทคโนโลยี ซึ่งใช้ทุนและระยะเวลานานมากกว่างานของ Data Scientist กลุ่มอื่นๆ

เวลาพูดถึง Data Scientist หลายๆคนคงจะจินตนาการว่าจะได้ทำงานแบบใน Data Scientist ในกลุ่มนี้ แต่จริงๆ แล้ว เราจะเห็น Research Data Scientist แบบนี้ได้เฉพาะในบริษัทใหญ่ๆ ที่มีทีมทำวิจัยทางด้าน data อย่างจริงจัง เช่น Google, Microsoft, Facebook หรือไม่ก็เป็นนักศึกษาปริญญาบัณฑิตในมหาลัยเท่านั้น


หวังว่าหลายคนคงจะเห็นภาพการทำงานของ Data Scientist มากขึ้นนะคะ โดยส่วนใหญ่ องค์กรเล็กๆที่ทีม Data Science มีไม่กี่คน Data Scientist หนึ่งคนอาจจะได้ทำงานมากกว่า 1 ประเภท แต่ถ้าในองค์กรใหญ่ๆที่มีทีม Data Science หลายคนแล้ว ก็จะมีการจัดทีมและแบ่งหน้าที่ชัดเจนมากขึ้นค่ะ แต่ไม่ว่าจะเป็น Data Scientist แบบไหนก็ให้ Value องค์กรไม่ต่างกันค่ะ

Reference : The care and feeding of data scientists: Concrete tips for retaining your data science team


Comments

Leave a Reply

Your email address will not be published. Required fields are marked *