Admin BOTNOI GROUP
5 พ.ย. 2566
ยุคนี้ ใครๆ ก็พูดถึง Data Driven หรือการนำข้อมูลมาขับเคลื่อนองค์กร ธุรกิจ แม้กระทั่งใช้ตัดสินใจเรื่องต่างๆในชีวิตประจำวัน ซึ่งการจะก้าวไปสู่องค์กรที่มีวัฒนธรรมการทำงานแบบขับเคลื่อนด้วยข้อมูลนั้น มีสิ่งนึงที่ถือเป็นทรัพยากรอันล้ำค่าอย่างยิ่ง ที่องค์กรเราเท่านั้นจะมีได้นั่นคือ “ข้อมูลลูกค้า” ซึ่งหมายความถึงข้อมูลทั้งหมดที่องค์กรจะได้มาจากลูกค้า เช่น โปรไฟล์ของลูกค้า พฤติกรรมการใช้บริการของลูกค้าช่วงเวลาและความถี่ที่ใช้บริการ ความสนใจ ยอดซื้อ การกลับมาซื้อซ้ำ การบอกต่อ หรือแม้กระทั่งข้อมูลการเลิกใช้บริการ (Churn)
ข้อมูลลูกค้านี้เป็นสิ่งที่ทุกองค์กรจะต้องมีเป็นของตัวเอง และเป็นจุดเริ่มต้นสำคัญของการทำธุรกิจที่ยึดลูกค้าเป็นสำคัญ(Customer Focus)
ดังนั้นบทความนี้เป็นส่วนหนึ่งของคอร์ส Botnoi Data Science Essential รุ่นที่ 8 ที่เราจะมานำเสนอกรณีศึกษาในการค้นหา Insight จากการวิเคราะห์ข้อมูล (Dataset) ของลูกค้าที่ใช้บริการ Botnoi Voice โดยใช้ความรู้ด้าน Data Science ที่เรียนจากหลักสูตรนี้แหละ ร่วมกับการใช้ ChatGPT เป็นเครื่องมือในการทำ Data Analytics tool มาดูกันว่ามีอะไรที่น่าสนใจบ้างนะ …
ก่อนอื่นต้องของเกริ่นก่อนกว่า Botnoi Voice คืออะไร…
Botnoi Voice เว็บแอปพลิเคชันสำหรับสร้างเสียงจากข้อความด้วย AI (Text to Speech) สำหรับการทำ Presentation ตัดต่อวีดีโอ หนังสือ เสียง แคสเกม สปอตโฆษณา และอีกมากมาย
และนี้คือ การนำ Botnoi Voice ไปใช้ในด้านการศึกษา ซึ่งทำออกมาได้น่ารักมาก 😁
ดังนั้นก่อนอื่นเรามาเปรียบเทียบบริการ AI ประเภท Text to Speech เจ้าดัง กับธุรกิจ Botnoi Voice ด้วยเทคนิค Blue Ocean Strategy เพื่อค้นหาว่า Botnoi Voice ควรจะมีบริการอะไรที่ทำให้โดดเด่นจากคู่แข่ง เพื่อลอยลำเข้าสู่มหาสมุทรสีน้ำเงิน และบริการอะไรที่อาจจะไม่จำเป็นต้องพัฒนาหรือผลักดันต่อ โดยเราได้นำคุณสมบัติต่างๆ ของผู้ให้บริการสังเคราะห์เสียงมาเปรียบเทียบกัน และให้ ChatGPT เป็นผู้ประเมินคะแนน ซึ่งหากเจ้า ChatGPT มีข้อมูลที่ไม่ถูกต้อง เราก็ต้องค้นหาข้อมูลเพิ่มเติมและสั่งให้ประเมินใหม่ด้วยนะ
และแล้วเราก็พบว่า Botnoi Voice มีคะแนนเฉลี่ยการใช้งานอยู่ที่ระดับ 4 เลยทีเดียว โดยมีจุดที่โดดเด่นจากคู่แข่งในเรื่องของ Pronunciation Correction (สามารถแก้ไขการออกเสียงได้) และจุดที่ควรพัฒนาต่อได้แก่ Language Support (การเพิ่มจำนวนภาษา) และ Industry Focus (บริการสำหรับลูกค้าระดับอุตสาหกรรม)
ดังนั้น ทางทีม จึงต้องการทำตัวเป็นนักวิเคราะห์ข้อมูล เพื่อค้นหาว่า มีผู้ใช้งาน Botnoi Voice อยู่ในอุตสาหกรรมประเภทไหนมากที่สุด จากการวิเคราะห์คำศัพท์หมวดคำศัพท์ (feature) ต่างๆที่ใช้สังเคราะห์เสียง และยิ่งไปกว่านั้น คือ เราจะมาสรุปว่า ทำไมถึงต้องมาใช้ Botnoi Voice กันนะ…
โดยครั้งนี้…เราจะให้ ChatGPT มาช่วยวิเคราะห์ข้อมูล Botnoi Voice แบบไม่ต้องเขียน Code เลยแม้แต่บรรทัดเดียว …
สิ่งแรกที่จะต้องทำก่อนนำข้อมูลเข้า ChatGPT คือ …
ระบุถึงสิ่งที่อยากจะรู้ (Problem Statement)
ทำไมถึงต้องใช้ Botnoi เราอยากรู้ว่า Botnoi Voice มีอะไรที่คนให้ความสนใจเข้ามาใช้งานบ้าง และถ้าเราไม่ใช้ Botnoi Voice เราใช้ Product อื่นแทนได้ไหม
ฟีเจอร์ไหนที่เป็นจุดสนใจมากที่สุด
คุณสมบัติการใช้งาน เช่น มีจำกัดเวลาการใช้งานไหม ใช้ได้กี่คน สามารถนำไปใช้ในเชิงการตลาดได้ไหม เป็นต้น
เก็บข้อมูล (Data Collection)
เราใช้ข้อมูล Raw Data จาก Botnoi เพื่อนำมาวิเคราะห์หา Insight ด้วยวิธีนำข้อมูล import เข้า ChatGPT เพื่อทำการวิเคราะห์ ซึ่งข้อมูลนี้ประกอบด้วย
Unnamed:ข้อมูลที่ทีมเราสร้างเพิ่มเพื่อระบุ transactionID
user_id: รหัสลูกค้า (บัญชีผู้ใช้งาน)
channel: วิธีที่ลูกค้านำเสียงไปใช้ (Play-ทดลองเล่นเสียง ,Download-เสียพอยต์เพื่อดาวน์โหลด ,API-เชื่อมต่อบริการด้วยชุดคำสั่ง ,share-การแชร์เสียงต่อ
count: จำนวนคำที่ใช้สังเคราะห์เสียงในแต่ละครั้ง
speaker: ตัวเลือกประเภทเสียงที่เลือกใช้ในการพากย์ หรือนักพากย์AI
datetime: วัน เวลาที่ใช้บริการ
Columns 7 to 69: ชุดข้อมูลความสัมพันธ์ระหว่างคำที่ใช้สังเคราะห์เสียง กับ Feature ที่จำแนกเป็นด้านต่างๆ โดยระบุเป็นค่าตัวเลข (เลขยิ่งมาก แสดงว่าประโยคที่สังเคราะห์เสียงมีความสัมพันธ์กับคำนั้น ๆ มาก)
การทำความสะอาดข้อมูล (Data Cleansing)
จากข้อมูล จะมีจำนวน Feature อยู่ที่ 63 Features และมี transaction จำนวน 46,636 รายการ
Number of users: 13,605
Start date of data: 2021–09–23
End date of data: 2023–10–13
Channel: Play, Download, Share and API
การวิเคราะห์ข้อมูล (Data Analytics) จาก ChatGPT
จากการทำ cleaned dataset พบว่ามี insights ที่น่าสนใจจาก ChatGPT ดังนี้
1. Transaction Trends
Dataset ได้รวม Transaction จากวันที่ 22 กันยายน 2021 ถึงวันที่ 13 ตุลาคม 2023 โดยจะถูก Record ทุกวัน ซึ่งดูได้จากการแสดงข้อมูลการใช้งานของบริการ
2. User Engagement
มีจำนวน Transaction ที่ Active และเก็บมาได้ 1,974 transactions ดูจาก users ที่มี high engagement levels ซึ่งมี Potential ในการใช้งานกับระบบ
3. Channel Usage
play เป็น channel ที่มีคนใช้งานมากที่สุด จำนวน 39,980 transactions
download เป็น Channel ที่มีคนใช้งานมาเป็นอันดับ 2 รองจาก play channel
share และ api เป็นอีก 1 channel ที่คนให้ความสนใจ
แต่มีบาง Transaction พบว่า มีความผิดพลาดในการ labeled คือ ‘speaker_43’ ทำให้ ChatGPT ไม่สามารถวิเคราะห์ได้
4. Voice Preferences
พบว่า ‘Speaker_66’ Popular สุด มีจำนวน 17,749 transactions รองลงมาเป็น ‘Speaker_56’ และ ‘speaker_19’
มี Speaker ที่ถูกใช้งานมากเป็นพิเศษกว่า Speaker อื่นๆ (อาจเป็นเพราะการตั้งค่า default)
5. Text Length Analysis
ความยาวของข้อความโดยเฉลี่ยที่ได้จาก Transaction อยู่ที่ 144 คำ
ความยาวข้อความอยู่ระหว่าง 1 ถึง 14,206 คำ โดยมีค่ามัธยฐาน 53 คำ
มี transactions ที่มีความยาวข้อความยาวมาก ซึ่งอาจมีค่าผิดปกติหรือกรณีการใช้งานในบางกรณี
6. Keyword Relevance
การวิเคราะห์ค่าตัวเลขในคอลัมน์ 7 ถึง 69 ซึ่งดูเหมือนจะแสดงถึงคะแนนความเกี่ยวข้องหรือความคล้ายคลึงบางรูปแบบระหว่างข้อความของผู้ใช้และคำหลักบางคำ
การวิเคราะห์ความสัมพันธ์ระหว่างความยาวของข้อความ อาจจะต้องให้ ข้อมูลเชิงลึก เกี่ยวกับพฤติกรรมและการตั้งค่าของผู้ใช้ โดยยังมีข้อมูลที่ไม่เพียงพอในการวิเคราะห์เชิง Personalize ของ User
ทีนี้เรามาดูภาพรวมทั่วไปของข้อมูลกันบ้าง
Top 10 rank of transaction user
User interaction over time (date)
User interaction over time
Top rank 10: average value of columns
Top 10 Speakers
Percentage transactions of channel
แต่ละ Channel มีปริมาณใช้งานที่แตกต่างกันมาก จึงลองจำแนก Keyword ตามแต่ละ channel จะได้กราฟ ดังนี้
Feature ยอดฮิตตลอดกาล
เรามาดูข้อมูลวิเคราะห์เชิงสถิติกันดีกว่า… ในส่วนของการใช้งานข้อความ
Anomaly detection
จากผลการวิเคราะห์จุดที่น่าสนใจข้างต้น ทำให้เราพบความผิดปกติ 2 กรณี
user บางกลุ่มสังเคราะห์เสียงมากกว่า 1,000 คำ ในแต่ละครั้ง ดังนั้น จึงต้องมาโฟกัสว่ากลุ่ม user เหล่านี้มีจำนวนการใช้งานที่มากและจะ overload หรือไม่
การหาความสัมพันธ์ระหว่างการใช้งาน Transaction และจำนวนคำที่ user ใช้ในการสังเคราะห์เสียง
พบว่ามีจำนวน transaction 818 รายการจาก user 323 คน ดังนั้นในการพบข้อมูลผิดปกติครั้งนี้อาจนำไปสู่การวิเคราะห์ลูกค้ากลุ่มที่ใช้งานหนัก ซึ่งเป็นกลุ่มที่จะต้อง upsale ต่อไปเพราะเป็นกลุ่มที่มีกำลังจ่าย และจ่ายหนักได้
2. ความผิดปกติ ของจำนวน transaction ที่สูงผิดปกติเป็นบางวัน พบว่าวันที่ 12 พฤศจิกายน 2022 มีผู้ใช้สูงสุดมากกว่าวันอื่นๆ ซึ่งถือเป็น extreme outlier ที่จะต้องกำจัด ก่อนมาวิเคราะห์ค่าเฉลี่ยการใช้งานในแต่ละช่วงเวลา ทำให้สรุปผลได้ว่า
การหาความสัมพันธ์ระหว่างจำนวนการ Interaction โดยมองไปที่แต่ละชั่วโมง วัน และ สัปดาห์
Botnoi Voice before beds: ลูกค้ามักจะเข้ามาใช้บริการช่วงค่ำไปจนถึงก่อนเที่ยงคืน
Botnoi for everyday use: ยอดการใช้งานวันทำงาน (weekday) และวันหยุดประจำสัปดาห์ (weekend) ไม่แตกต่างกันเมื่อทดสอบค่าเฉลี่ยของทั้งสองกลุ่มด้วย student T-test ที่ระดับความเชื่อมั่น 95%
User Engagement
ต่อมาพยายามวิเคราะห์โอกาสที่จะกลับมาซื้อซ้ำ พบว่า
ลูกค้าส่วนใหญ่ใช้งานเฉลี่ยเพียง 1–5 session/คน เท่านั้น (session หมายถึง user ใช้งานแต่ละ transaction ห่างกันไม่เกิน 30 นาที)
การเข้าใช้งานแต่ละครั้ง (session) ลูกค้าจะใช้เวลาในการสร้างเสียงต่อเนื่อง เฉลี่ยครั้งละ 5.7 นาที โดยระยะเวลาที่นานที่สุดคือประมาณ 16 นาที
การหาความสัมพันธ์ระหว่างจำนวน user กับจำนวน Session
การหาความสัมพันธ์ระหว่างจำนวน Session กับช่วงเวลาการใช้งาน
เป็นเรื่องที่น่าสนใจว่า Botnoi Voice มี user engagement ในการสังเคราะห์เสียงน้อยเกินไป ทำให้สูญเสียรายได้ในส่วนของการซื้อซ้ำหรือไม่ ซึ่งอาจเพิ่มช่องทางของรายได้ จากการให้ user ที่พอยต์ทดลองใช้งานหมด ได้ขยายเวลาทดลองใช้ต่อไป เช่น การดูโฆษณา การ redeem โค้ดที่ได้จากซื้อบริการ partners หรือการทำภารกิจสะสมแต้มทดลองใช้งาน เป็นต้น
การวิเคราะห์ความสัมพันธ์ด้วย keywords กับตัว Speaker
การนำเสนอความสัมพันธ์ด้วย keywords กับตัว Speaker
การหา Correlation Matrix ด้วย keywords กับตัว keywords
บทสรุปที่ได้จาก Dataset ของการใช้งาน Botnoi Voice …
ผู้ที่เข้ามาใช้งาน Botnoi ส่วนใหญ่มีพฤติกรรมคล้ายคลึงกลุ่มวัยรุ่น ที่ใช้จ่ายน้อยและใช้เวลาช่วงดึก ซึ่งทางบอทน้อยอาจจะต้องหาวิธีการอื่นในการเพิ่มรายได้แทนการขาย point ตรงๆ
เวลาส่วนใหญ่ที่เข้ามาใช้งานจะอยู่ที่ช่วงเวลาค่ำๆ ประมาณ หลังหกโมงเย็น — เที่ยงคืน โดยช่วงเวลาที่ Peak สุด คือ 2–4 ทุ่ม แล้วจะเริ่มลดลง
Content ที่ Speaker ชอบนำมาทำบน Botnoi คือ ทั่วไป ซึ่งอาจจะต้องจัดกลุ่ม feature จากประโยคที่สังเคราะห์เสียงใหม่ให้ละเอียดมากขึ้น
ช่องทางที่ถูกใช้บริการมากที่สุดคือ Play
hard sale สำหรับคนที่อยากลองใช้ botnoi Voice ตอนนี้เรามี redeem code เพื่อรับส่วนลด 50% เพียงแค่ใส่โค้ด “DSE2” ในการใช้งานสังเคราะห์เสียง ที่โดดเด่นเชี่ยวชาญด้านภาษาไทย มีหลายสำเนียงและหลายสไตล์ ใกล้เคียงกับมนุษย์เป็นอย่างมาก
Back