Botnoi Voice
3 ก.ย. 2566
Label
UX/UI
อาชีพ Data Scientist มีหน้าที่อะไร
Data Scientist มีหน้าที่เพิ่มคุณค่าให้กับธุรกิจโดยเฉพาะ การเพิ่มรายได้ ลดค่าใช้จ่าย สร้างโอกาส ลดความศูนย์เสีย ให้กับธุรกิจให้องค์กร ต่าง ๆ โดยใช้เครื่องมือ เทคโนโลยี ต่าง ๆ และข้อมูล data ทั้งข้อมูลในองค์กรหรือข้อมูลภายนอก ย้ำอีกครั้งว่าอาชีพ Data Scientist มีหน้าที่เพิ่มคุณค่า เพิ่ม value หลายครั้งที่ถามนักศึกษาว่าอาชีพนี้ทำอะไร ก็จะได้คำตอบว่า วิเคราะห์ข้อมูลโดยใช้ AI ซึ่งก็ถูกเพียงครึ่งเดียว หากจะให้ถูกทั้งหมดต้องบอกว่า
"อาชีพ Data Scientist มีหน้าที่วิเคราะห์ข้อมูล โดยใช้เครื่องมือหลาย ๆ อย่าง เช่น AI ML coding เป็นต้น หลังจากวิเคราะห์ข้อมูลแล้ว จะต้องอธิบายให้ฝ่ายที่เกี่ยวข้องเข้าใจ จนนำไปสู่การดำเนินการ execution และสร้างมูลค่า หรือ value ให้กับองค์กร"
![must-have-skills-graphic](https://framerusercontent.com/images/ZbOSEFdE02IAgQxgoGQno3JevE.png)
แต่อาชีพอื่น ๆ ก็เพิ่มคุณค่าให้กับธุรกิจ นี่
ใช่แล้วครับ อาชีพอื่น ๆ ก็ล้วนเพิ่มคุณค่าให้กับธุรกิจ โดยใช้ data เช่น data analyst จะบอกว่าหน้าที่เหมือนกัน เป้าหมายเหมือนกัน แต่ก็ไม่จำเป็นว่าต้องเป็นอาชีพเดียวกัน เพราะอาจจะต่างกันที่กระบวนการทำงาน หรือเครื่องมือที่ใช้
![data-analyst-and-data-scientist](https://framerusercontent.com/images/tthhZ9RpPKqrJovHB4pyjyNsuhQ.png)
เครื่องมือของ Data Scientist มีอะไรบ้าง
Data scientist จะมีเครื่องมือวิเศษ หลายตัว ทำให้เพิ่มมูลค่าได้มาก และมีประสิทธิภาพ เครื่องมือดังกล่าว ก็จะมี การเขียนโค้ด
สถิติ
Machine Learning
AI
พวก Visualization tools ต่าง ๆ
และในตอนนี้ ChatGPT และเทคโนโลยี LLM ก็กำลังจะกลายมาเป็นเครื่องมือที่สำคัญ
Data Scientist ก็ต้องเลือกเครื่องมือให้ถูกต้อง ให้เหมาะสมกับแต่ละงาน จำเป็นที่จะต้องรู้จักเครื่องมือวิเศษพวกนี้ ไว้เป็นอาวุธสำหรับการทำงาน ก็เหมือนนักรบที่มีอาวุธที่หลากหลาย ใช้อาวุธให้เหมาะสมกับแต่ละสถานการณ์
![info-graphic-tools](https://framerusercontent.com/images/8ZlvbbUXGDGwtFMYonpczBSgFE.png)
จำเป็นต้องใช้ AI กับ ML ทำงาน เสมอไปหรือไม่
แม้ว่า Data Scientist จะใช้ AI ใช้ ML ได้ แต่ก็ไม่จำเป็นว่าในทุก ๆ งานจะต้องใช้ AI ใช้ ML เป็นอาวุธก็ได้ ถ้างานไหนไม่ได้จำเป็นต้องใช้ บางงานสถิติง่าย ๆ ก็เพียงพอ ก็บางทีโจทย์มันง่าย คู่ต่อสู้ไม่เก่ง เราก็ใช้มือเปล่าก็สู้ได้แล้ว
ยกตัวอย่างการจัดกลุ่ม Segmentation ให้หน่อย
ถ้าสมมติผมมีโจทย์ให้แบ่งห้องนักเรียน เราอาจจะแบ่งโดย ให้สถิติ ค่า mean ค่า std ที่เท่า ๆ กันอยู่ห้องเดียวกัน จะได้สอนง่าย ๆ ซึ่งองค์กรต่าง ๆ ก็มักจะใช้สถิติง่าย ๆ ในการจัดกลุ่มลูกค้า แบ่งว่า นี่คือ บัตรแพลตินั่ม บัตรทอง บัตรเงิน ดูจากค่าเฉลี่ยการการเงิน และอายุการใช้งาน
แต่ ... ในกรณีที่เราอยากจะแบ่งกลุ่มลูกค้า โดยลูกค้ากลุ่มเดียวกันจะมีลักษณะนิสัย ลักษณะการบริโภคที่คล้ายคลึงกัน data scientist ก็สามารถใช้เครื่องมือวิเศษ นั่นก็คือ Machine Learning ในการจัดกลุ่มอัตโนมัติ ดูจากหลาย ๆ ปัจจัย
![example-section-grouping](https://framerusercontent.com/images/MWVwSIRuYWSJrje1TSPPQzpUwV4.png)
ทดลอง Segmentation โดยใช้ Machine Learning
วันนี้รวบข้อมูลจากนักศึกษา 40 คน จากนั้นก็ใช้ K-mean clustering จัดกลุ่ม 20 กลุ่ม ก็จะได้แต่ละกลุ่ม ๆ เป็นคู่ ๆ แล้วเราก็ได้คู่ที่เป็นเพื่อนสนิทกันออกมา อย่างกะหมอดู
หากเราอยากจะสร้างกลุ่มใหญ่ขึ้น เราก็ทำได้ง่าย ๆ เพิ่มค่า K ของ clustering ซึ่ง เราก็ไปเจอ ก๊วนหนุ่ม ๆ ตัวตึง 4 คน ที่อยู่แก๊งเดียวกัน ส่วนอีกแก๊งนึง ก็สาว ๆ เรียบร้อยใส่แว่นกันทุกคน 4 คน น่าทึ่งดี
![collect-student-data](https://framerusercontent.com/images/ZdGaCK7lQsdp30reQukRfDROh4.jpg)
หากนำไปใช้กับองค์กร จะมีประโยชน์มากแค่ไหน
ลองคิดดูสิครับ ว่าจะมีประโยชน์แค่ไหน สำหรับองค์กรที่มีคนเป็นหลายหมื่น แสน ล้านคน ให้เราจัดกลุ่มเองก็คงลำบาก แต่เราสามารถใช้ AI จัดกลุ่มคนที่คล้าย ๆ กัน อยู่กลุ่มเดียวกัน segment เดียวกัน เพื่อที่จะได้นำเสนอ สินค้า และโปรโมชั่น ได้ตามความต้องการ
สรุปการทำงานของ Data Scientist
การทำงานจริง ๆ ของ data scientist ต้องเข้าใจโจทย์ ตีโจทย์ เลือกเครื่องมือ สร้างและแก้ไข ค้นหาข้อมูล และที่สำคัญมากคือ การแสดงผล และเล่าเรื่องเพื่อให้ผู้บริหารองค์กร เข้าใจ นำไปสู่การช่วยตัดสินใจและเพิ่มมูลค่าให้องค์กร นอกจากการจัดกลุ่ม unsupervised learning clustering แล้ว โจทย์ใหญ่ ๆ ของอาชีพ data scientist ก็จะมี supervised learning prediction ต่าง ๆ เช่น ทำนายว่าลูกค้าจะหยุดใช้บริการมั้ย churn prediction หรือลูกค้าคนไหนที่เราน่าจะขายของได้เพิ่มขึ้น upsell model หรือว่าจะเป็น fraud detection ธุรกรรมแปลกปลอม ตลอดจนไปถึงพวกการทำนายแนวโน้ม trend forecasting เพื่อกะปริมาณการขาย และรายได้ เป็นต้น
คำแนะนำสำหรับคนที่อยากเก่ง Data Science
แนะนำให้ทำโจทย์เยอะ ๆ จะได้เชี่ยวชาญ ทั้งในการใช้เครื่องมือวิเศษต่าง ๆ รวมกระทั่งวิธี และกระบวนการคิด และการมองออกทางธุรกิจ อาจจะเริ่มต้นจากหาโจทย์ ทำโจทย์ ใน Kaggle ซึ่งเป็น platform online ที่รวบรวมโจทย์ทางด้าน data science เยอะแยะเลย
![advice-data-scientist](https://framerusercontent.com/images/4R5SiRacdrhvQYTX9vEweMa6a58.png)
และอยากแนะนำนักศึกษา หรือใครที่อยากทำงานในสายนี้ หาที่ฝึกงาน สหกิจ จะได้ทำโจทย์จริง ๆ ถ้ามาฝึกกับ BOTNOI ก็ดีนะครับ เรามีโจทย์ธุรกิจ สนุก ๆ มากมาย
Back