which-LLM-ismost-useful-for-data-scientist-th
which-LLM-ismost-useful-for-data-scientist-th
which-LLM-ismost-useful-for-data-scientist-th

นักศึกษาฝึกงาน Data Science

17 มิ.ย. 2567

Data Science ยุคใหม่ ใช้ LLM อันไหนช่วยทำงานได้ดีที่สุด

Data Science ยุคใหม่ ใช้ LLM อันไหนช่วยทำงานได้ดีที่สุด

ในยุคที่เทคโนโลยีได้พัฒนาอย่างรวดเร็ว การเติบโตของเอไอที่เมื่อลองมองย้อนกลับไปไม่เกิน 5 ปี แล้วกลับมามองวันนี้ทำให้เห็นว่าการเข้าถึงเอไอเป็นเรื่องที่เข้าถึงได้ง่าย สามารถประยุกต์ใช้ได้ในทุกสายงาน แต่ถ้าลองมองย้อนกลับไป 2 ปี ในช่วงที่ AI ได้เปิดตัว LLM ครั้งแรกเปรียบเทียบกับวันนี้ก็พบว่า ยังมีการพัฒนาและเปิดเปิดตัวฟีเจอร์ใหม่ๆ อย่างต่อเนื่อง และการแข่งขันระหว่างผู้ให้บริการต่างดุเดือดเป็นอย่างมาก

ในบทความนี้ BOTNOI Group เลยจะมารวบรวม LLM ที่เป็นยอดนิยม เพื่อมาดูกันว่าสุดท้ายแล้ว ในมุมมองของ Data Scientist นั้น เครื่องมือตัวไหนที่สามารถช่วยงานและตอบโจทย์ด้านการวิเคราะห์และการช่วยเหลือต่างๆ ได้ดี ทำให้ชีวิตเราง่ายขึ้น

Chat-GPT-4o-for-data-scientist

ChatGPT-4o 

โมเดลนี้ได้ถูกเปิดตัวในวันที่ 13 พฤษภาคม 2567 จาก Open AI ที่ผ่านมา เป็นโมเดล LLM ที่ได้รับการพัฒนาจาก Open AI โดยเลข "4" นั้นหมายถึงเวอร์ชันของโมเดลนี้ ส่วนตัวอักษร “o” หมายถึง “omni” เป็นโมเดล omni model ที่หมายถึงความสามารถที่จะประมวลผลการป้อนและตอบกลับ เป็นข้อความ เสียง หรือวิดีโอ โดยที่การตอบกลับสามารถตอบสนองต่อการรับข้อมูลเสียงได้ในเวลาเพียง 232 มิลลิวินาที โดยเฉลี่ย 320 มิลลิวินาที ซึ่งใกล้เคียงกับจังหวะการสนทนาของมนุษย์มากที่สุด

ฟีเจอร์ของ Chat GPT-4o มีอะไรน่าสนใจบ้าง?

  1. อัปเกรด Voice Mode กับ ChatGPT
    ให้มีการเปลี่ยนอารมณ์ในน้ำเสียง เเละมีการพูดตอบโต้กับผู้ใช้ได้รวดเร็วขึ้น ทั้งยังสามารถถามคำถามเเทรกระหว่าง ChatGPT กำลังพูดตอบคำถามอยู่ได้ ซึ่งสามารถจำแนกความแตกต่างของน้ำเสียงผู้พูดได้อีกด้วย

  2. เพิ่ม Feature Real-Time Transalation
    ให้รองรับกับ Voice Mode เพื่อทำหน้าที่เป็นล่ามแปลภาษาให้แบบ Real-Time สามารถ Generate น้ำเสียง และอารมณ์ในการพูดได้หลากหลาย และเปลี่ยนน้ำเสียงได้ตามคำสั่ง รวมถึงสั่งให้ร้องเพลงได้ด้วย

  3. อัปเกรดให้สามารถอ่านรูปภาพได้แบบ Real-Time
    ผ่านกล้องบนมือถือ หรืออ่านหน้าจอ Desktop ของผู้ใช้งานได้ พร้อมตอบคำถามที่เราสงสัยได้ทันที

  4. ปรับปรุงให้สามารถใช้งานได้ดีขึ้นใน 50 ภาษา รวมถึงมีการปรับระบบ Tokenization บีบอัดจำนวน Token ให้น้อยลงใน 20 ภาษา เมื่อพิมพ์ Prompt แล้วประหยัด Token ได้ถึง 1.1 – 4.4 เท่า (ขึ้นอยู่กับภาษาที่ใช้งาน)

  5. มีการประมวลผลของภาษาธรรมชาติ (NLP) ที่ดีขึ้น
    ช่วยในการวิเคราะห์ข้อมูลที่เป็นข้อความ เช่น Sentiment Analysis เเละสามารถสรุปหรือสร้างรายงานจากข้อมูลที่มีขนาดใหญ่ได้อย่างมีความรวดเร็วเเละเเม่นยำถูกต้อง

  6. การสร้างเเละปรับปรุงโมเดลของ Machine Learning
    ช่วยในการเลือกโมเดลที่เหมาะสมสำหรับงานที่ต้องการ เเละการปรับ Hyperparameters ของโมเดล ทั้งมีการอธิบายเเละสามารถตีความจากผลลัพธ์จากตัวโมเดลได้

เมื่อลองใช้ Chat GPT กับงาน Data Science

จากการที่ Chat GPT-4o ได้มีการอัปเกรดเเละปรับปรุงมาใหม่นั้นทำให้การใช้งานต่างๆ สะดวกสบายมากขึ้น ไม่ว่าจะเป็นการใช้งานในชีวิตประจำวันหรือในการทำงาน ก็ถือได้ว่าเป็นเครื่องมือที่มีประโยชน์มากๆ เครื่องมือหนึ่งเลย 

และสำหรับคนที่ทำงานในสายงาน Data แล้ว การที่เราสามารถ gain insight, modify data, remove outliers, ทำ K mean clustering และอื่นๆ ได้อีกมากมาย โดยที่เราแค่ให้ข้อมูล และ prompt ก็จะได้ผลลัพธ์ออกมา ด้วยสิ่งเหล่านี้ นี่จึงเป็นผู้ช่วยที่ทำให้การทำงานต่างๆ ของเรา สะดวกและรวดเร็วขึ้นเป็นอย่างมาก ถึงแม้ว่าข้อมูลที่ได้มายังจำเป็นที่จะต้องตรวจสอบอยู่ก็ตาม

Gemini-for-data-scientist

Gemini 1.5 Pro 

LLM ที่ถูกพัฒนามาจาก Google AI เปิดตัวในวันที่ 14 พฤษภาคม 2567 ของเวลาสหรัฐอเมริกา หรือ 15 พฤษภาคม 2567 ในเวลาช่วงเช้าของประเทศไทย เป็น LLM ที่ถูกพัฒนาขึ้นโดย Google  โดยโมเดลนี้ได้รับการฝึกฝนบนชุดข้อมูลที่เป็นทั้งข้อความเเละโค้ด จึงทำให้โมเดลนี้แสดงประสิทธิภาพการใช้งานต่างๆ เช่นการสร้างข้อความ การแปลภาษา การตอบคำถาม เเละอื่นๆ เเต่นอกจากนั้นยังมีข้อจำกัดบางอย่างเเละตัวโมเดลนี้ยังอยู่ระหว่างการพัฒนา อาจทำให้มีแนวโน้มที่จะเปลี่ยนแปลงคำตอบเเละมีการให้ข้อมูลที่ผิดพลาดได้

ฟีเจอร์ของ Gemini 1.5 Pro มีอะไรน่าสนใจบ้าง?

  • มี Context Window ที่ใหญ่ที่สุดในบรรดา LLM ที่เปิดให้บริการแก่ผู้ใช้ทั่วไป โดยรองรับการประมวลผลข้อมูลได้มากถึง 1 ล้านโทเค็น ซึ่งเทียบเท่ากับเอกสารที่มีความยาวประมาณ 1,500 หน้า

  • สามารถอัปโหลดไฟล์ต่างๆ เช่น ไฟล์จาก Google Drive หรือจากอุปกรณ์ ขึ้นไปใน Gemini Advanced เพื่อให้ Gemini ช่วยวิเคราะห์ข้อมูลต่าง ๆ ในไฟล์นั้นๆ ได้

  • มี Gem ที่สามารถสร้าง Gemini เวอร์ชันที่เรากำหนดเองได้ เช่น การสร้าง Gem เพื่อช่วยให้เราวางแผนการออกกำลังกายหรือไม่ว่าจะเป็นการวางแผนการเดินทางก็ได้เช่นกัน

  • Gemini Advanced ที่สามารถเข้าถึง Gmail และ Google Calendar ของผู้ใช้งานได้ เป็นฟีเจอร์ที่จะช่วยวางแผนการเดินทางได้อย่างสะดวกและตรงกับความต้องการของเราได้ โดยไม่ต้องเสียเวลาในการหาข้อมูลด้วยตัวเอง

  • สามารถเข้าใจรูปต่างๆ ได้ง่ายขึ้น เช่น การถ่ายรูปโจทย์คณิตศาสตร์เพื่อให้ช่วยแก้โจทย์ให้

  • Gemini Live ช่วยให้ผู้ใช้สามารถโต้ตอบกับ Gemini ผ่านเสียงได้อย่างอิสระ และเมื่อผู้ใช้มีการเปิดกล้อง Gemini Live สามารถตอบสนองต่อสิ่งรอบๆ ตัวของผู้ใช้ได้แบบ real-time

เมื่อลองใช้ Gemini กับงาน Data Science

หลังจากที่ ChatGPT-4o ได้มีการเปิดตัวไม่นาน ทาง Gemini1.5 Pro ก็ได้มีการเปิดตัวตามมาเช่นกัน ซึ่งส่วนของ Gemini1.5 Pro มาพร้อมกับการทำงานที่สามารถเก็บข้อมูลได้จำนวนมาก สามารถช่วยให้งานต่างๆ ในด้าน Data Science ง่ายและเร็วขึ้น ทำให้ระยะเวลาการทำงานสั้นลงเเละแม่นยำมากขึ้น

Copilot-for-data-scientist

Copilot+

  สำหรับ LLM ตัวนี้ถูกพัฒนาโดย Microsoft ได้เปิดตัวเมื่อวันที่ 21 พฤษภาคม 2567 ซึ่งในตัวโมเดลนั้นจะมีการฝึกฝนกับชุดข้อมูลโค้ดของในโปรเเกรมต่างๆ จึงทำให้เหมาะใช้งานการให้คำเเนะนำโค้ด, เเก้ไขข้อผิดพลาดและการทำให้โค้ดนั้นมีความสมบูรณ์ โดยรวมๆ แล้วเป็นโมเดลที่เหมาะกับงานด้านการเขียนโปรเเกรมเป็นส่วนใหญ่ และแน่นอนว่าเป็นโมเดลที่ทำงานแบบ locally บนอุปกรณ์ของคุณเท่านั้น

ฟีเจอร์ Copilot+ มีอะไรน่าสนใจบ้าง?

  • สามารถทำทุกอย่างที่ Copilot ธรรมดาทำได้และมี Recall ที่เป็นฟีเจอร์แบบ on device คือ ไม่ส่งข้อมูลไปที่อื่น(Microsoft บอกอ่ะนะ) จะเก็บภาพ บันทึกหน้าจอ ทุกอย่างที่คุณได้ทำ และใช้ Generative AI ในการประมวลผลข้อมูลและทำให้ข้อมูลนั้นสามารถค้นหาได้ สิ่งนี้จะทำให้เอไอรู้ทุกอย่างที่คุณทำ

  • แก้ไขรูปภาพ โดยแค่คลิกขวาแล้ว prompt ก็ทำได้เลย เช่นสามารถลบพื้นหลังออกจาก วิดิโอได้ เป็นต้น

  • ถ้ามีการแจ้งเตือนอีเมลขึ้นมา ตัวโมเดลนี้ก็มีคำตอบที่แนะนำมาให้เลย ถ้าโอเคก็สามารถกดคลิกเดียวเพื่อตอบกลับเมลนั้นได้อย่างรวดเร็ว

  • ฟีเจอร์ใหม่ล่าสุดอย่าง Cocreator ระบบ Generative AI ที่ช่วยสร้างสรรค์งานศิลปะของคุณผ่านคำสั่งที่ prompt ได้ หรือจะผ่านการร่างแบบในโปรแกรม paint หรือ photoshop ก็ได้เช่นกัน

  • รองรับการทำงานร่วมกันกับแอปพลิเคชันอีกหลายตัว

  • รองรับสามารถแปลภาษาระหว่างการโทรแบบวิดิโอเป็นภาษาอังกฤษได้อย่างรวดเร็วมาก  ในตอนนี้ตัวโมเดลสามารถรองรับได้มากถึง 44 ภาษา

เมื่อลองใช้ Copilot+ กับงาน Data Science

จากการที่ตัวโมเดลนี้สามารถดูจอไปพร้อมกับเราได้ หลายคนคงบอกว่า นี่เป็นหนึ่งในเครื่องมือที่ดีที่สุดสำหรับ Data Scientist แน่ๆ เพราะว่าการที่ไม่ต้องดาวน์โหลดไฟล์ Excel หรือไฟล์ต่างๆ ก่อนที่จะอัพโหลดเข้าโมเดลเพื่อทำการวิเคราะห์อย่าง Chat GPT ฟีเจอร์นี้ถือได้ว่าเป็นตัวเปลี่ยนเกมพอสมควร แต่ถ้าถามว่าปัญหาคืออะไร คงจะเป็นเรื่องที่ต้องซื้อคอมมาใช้ซะมากกว่า

AWS 

สำหรับบริษัทที่เปิดบริการประมวลผลบนคลาวด์ ก็มีโมเดล LLM ที่รู้จักกันในชื่อของ “Amazon Bedrock” เเละ “Amazon Titan”
Amazon Bedrock เป็นแพลตฟอร์มบริการที่จะช่วยให้ลูกค้าสามารถเข้าถึงเเละใช้งานโมเดลพื้นฐานได้ ส่วน Amazon Titan เป็น LLM ที่ถูกพัฒนาโดยมีวัตถุประสงค์เพื่อรองรับการใช้งานในหลายประเภทที่เกี่ยวข้องกับการประมวลผลภาษาธรรมชาติ (NLP) โดยฟีเจอร์ที่น่าสนใจของ AWS มีดังนี้

ฟีเจอร์ AWS มีอะไรน่าสนใจบ้าง?

  1. Amazon SageMaker เป็นบริการที่ครบวงจรตั้งแต่ การ Build คือการเตรียมข้อมูล Train สร้างโมเดลไปจนถึงกระบวนการ Deploy โมเดลเพื่อนำไปใช้งานจริง AWS Sage Maker แยกออกเป็น 4 ฟีเจอร์ย่อย

    • SageMaker Studio เป็น Workspace ใช้ในงาน Data science โดยมีไฟล์ Notebook ให้เขียนโค้ดวิเคราะห์ข้อมูลได้และเชื่อมไปยังgithub

    • SageMaker pipelines เครื่องมือใช้สำหรับทำ CI/CD ในงาน ML สามารถใช้ Clean Data สร้าง และ อัพเดท Model 

    • SageMaker trainning ใช้ในการ trainning model ทั้งการประเมิน อัลกอริทึมต่างๆ ที่มีประสิทธิภาพ

    • SageMaker Endpoints เครื่องมือ Deploy โมเดล ทำให้สามารถใช้งานแบบ Real time ได้รวมถึงทำ Auto scale

  2. Amazon Rekognition เป็นบริการในส่วนของ computer vision

    • Face Liveness ตรวจจับผู้ใช้จริงและป้องกันผู้ไม่หวังดีที่ใช้การปลอมแปลงในเวลาไม่กี่วินาทีระหว่างการตรวจสอบใบหน้า

    • Custom Labels ตรวจจับอ็อบเจ็กต์แบบกำหนดเอง เช่น โลโกแบรนด์โดยใช้ Automated  Machine learning (AutoML) เพื่อฝึกอบรมโมเดลของคุณด้วยภาพ

  1. Amazon Lex เป็นบริการที่เอามาสร้างแชทบอทแบบข้อความหรือเสียงได้ซึ่งหลังบ้านใช้เทคโนโลยีเดียวกับ Alexa มีtool และframwork ที่เป็น Open Source ด้าน AI และ Deep Learning ให้ใช้งานเยอะมาก เช่น Amazon SageMaker, TensorFlow, Apache MXNet และ PyTorch

    • Developing Chatbot สร้าง Chatbot ที่เข้าใจบริบทในการสนทนา และทำงานในหลากหลายภาษา

    • Customize Bot capabilities ออกแบบและปรับใช้ AI แบบหลายช่องทางได้สะดวกภายในคลิกเดียว                

  1. Amazon Comprehend เป็นบริการที่ดึง insight ของข้อมูลออกมาใช้ประโยชน์ได้ผ่านโมเดล Machine Learning ที่มี Natrual Language Processing (NLP) ในการทำความเข้าใจภาษามนุษย์

    • Topic Modeling วิเคราะห์และระบุหัวข้อหลักในเอกสารหรือข้อความจำนวนมากโดยใช้เทคนิคการทำโมเดลหัวข้อ

    • Entity Recognition ระบุและจัดประเภทหน่วยคำที่สำคัญในข้อความ เช่น ชื่อบุคคล สถานที่ องค์กร วันที่ เพื่อทำให้เกิดความแตกต่างเชิงธุรกิจ

  1. Amazon Forecast เป็นบริการการทำนายผลลัพธ์ทางธุรกิจได้อย่างง่ายดายและแม่นยำ เรียกได้ว่าเป็นหมอดูที่มาในลักษณะเครื่อง โดยใช้ Machine Learning คาดการณ์ และวิเคราะห์ตัววัดทางธุรกิจ

    • Predictive accuracy สร้างการพยากรณ์ตามข้อมูลเชิงเวลาเพื่อประเมินแนวโน้มในอนาคต โดยใช้เทคนิคการเรียนรู้ของเครื่องขั้นสูง

    • Custom Models ปรับแต่งโมเดลเพื่อตอบสนองความต้องการของธุรกิจ

    • Scalable Forecast จัดการชุดข้อมูลขนาดใหญ่และข้อมูลเชิงเวลาในหลายๆ ชุดข้อมูล

  1. Amazon Personalize เป็นบริการการสร้างแอปพลิเคชั่นแนะนำที่ใช้ Machine Learning เข้ามาช่วยในการสร้าง Recommended System แบบเดียวกับที่ใช้ในเว็บ Amazon.com สามารถแนะนำผลิตภัณฑ์ จัดลำดับผลิตภัณฑ์ใหม่ให้เหมาะกับแต่ละบุคคล

    • Real-times Recommendation ให้คำแนะนำคุณภาพสูงแบบ real time ไปตามการเปลี่ยนแปลงของพฤติกรรมลูกค้า

    • User Personalisation จัดเตรียมคำแนะนำที่ปรับให้เหมาะกับแต่ละบุคคลได้ง่ายโดยใช้เวลาสั้นๆ

  2. Amazon Polly เป็นบริการในการเปลี่ยนข้อความให้เป็นเสียงได้หลายภาษา ทำให้สามารถสร้างแอปพลิเคชันที่พูดได้

    • Support Numerous Languageมีบริการหลายภาษาผ่านเทคโนโลยีอย่าง TTS และ NTTS ช่วยแปลงข้อความได้ไหลลื่น

    • Generate Human Pattern ปรับแต่งและควบคุมเสียงพูดให้ใกล้เคียง พฤติกรรมนุษย์

  3. Amazon Textract เป็นบริการดึงข้อมูลจาก เอกสารที่สแกน ข้อความที่เขียนด้วยลายมือ รูปภาพ หรือ PDF โดยอัติโนมัติผ่านการใช้ Machine Learning 

    • Optical Character recognition มีความสามารถในการเรียนรู้ได้ดีกว่าอักขระแบบแสง

    • Document Classification มีความสามารถในการแบ่งหมวดหมู่เอกสาร จัดรูปแบบเอกสาร

เมื่อลองใช้ AWS กับงาน Data Science

จากรายละเอียดเกี่ยวกับโมเดลที่หามาได้นั้นแสดงให้เห็นว่าตัว AI ของ AWS นั้นสามารถทำงานได้หลากหลายงานตั้งแต่งานทางด้าน Data Science ,การออกแบบ Data Pipelines ของข้อมูล หรือการนำข้อมูลที่ได้ไปสร้างเป็นโมเดลและนำไปวิเคราะห์ นอกจากนี้ข้อมูลที่รับเข้ามาอาจจะเป็นภาพหรือข้อความก็ได้ ที่สำคัญข้อมูลที่ใช้งานใน AWS ก็จะได้รับความปลอดภัยและความเป็นส่วนตัวระดับองค์กรเลย

วัดผลความสามารถของ LLM อันไหนเวิร์ค?

ความสามารถในการทำงานและตอบสนองต่อคำถามหรือคำขอของผู้ใช้ โดยมักจะประเมินจากหลายปัจจัย แต่ในที่นี้ เราจะใช้เกณฑ์การทดสอบของการวัดประสิทธิภาพทั้งสิ้น 6 รายการ ได้แก่

  • Massive Multitask Language Understanding (MMLU)
    เกณฑ์มาตรฐานสำหรับวัดความเข้าใจและความสามารถด้านต่างๆ ของโมเดลภาษา ไม่ว่าจะเป็นการทดสอบในหัวข้อคณิตศาสตร์ ประวัติศาสตร์ วิทยาการคอมพิวเตอร์ กฎหมาย และอื่นๆ โดยโมเดลนี้ต้องมีความรู้กว้างขวางเกี่ยวกับความรู้ต่างๆ บนโลกและความสามารถในการแก้ปัญหามากพอ

  • Graduate-Level Google-Proof Q&A (GPQA)
    เป็นคำถามที่มีความซับซ้อนในคำถาม เป็นคำถามเชิงวิชาการที่ต้องมีการคิดวิเคราะห์และเข้าใจในหัวข้อนั้นอย่างลึกซึ้ง มักเป็นคำถามที่เขียนโดยผู้เชี่ยวชาญในสาขาชีววิทยา ฟิสิกส์ และเคมี ด้วยความที่คำถามนี้มีความยากมาก หรือกล่าวได้ว่า ยากในขนาดที่ผู้เชี่ยวชาญหรือผู้ที่กำลังศึกษาปริญญาเอกในสาขาที่เกี่ยวข้องสามารถตอบคำถามได้ประมาณ 74% เท่านั้น

  • MATH เป็นปัญหาคณิตศาสตร์ระดับมัธยมต้นเเละมัธยมปลาย

  • HumanEval การทดสอบความถูกต้องและความสมบูรณ์ของข้อมูล ความคล้ายคลึงกับมนุษย์ว่ามีความเป็นธรรมชาติหรือไม่ รวมถึงการตรวจสอบไวยากรณ์ด้วยเช่นกัน

  • Multilingual Grade School Math (MSGM)
    เป็นปัญหาวิชาคณิตศาสตร์ระดับโรงเรียนที่ถูกเป็นหลายภาษารวมไปถึงภาษาที่ไม่ได้มีความสำคัญ เพื่อวัดผลถึงความสามารถในการทำงานข้ามภาษาและความสามารถในการประยุต์ของโมเดล

  • Discrete Reasoning Over Paragraphs (DROP)
    เป็นการวัดผลผ่านคำถามที่ต้องใช้ความเข้าใจในการประมวลผลย่อหน้าทั้งหมด หรือข้อความที่ยาวๆ เป็นย่อหน้า เพื่อตรวจสอบว่าระบบ AI นั้นสามารถใช้ข้อมูลในย่อหน้าหรือบทความนั้นๆ มาตอบเป็นคำตอบได้อย่างถูกต้อง

ประสิทธิภาพของ GPT-4o, GPT-4 Turbo, Gemini Pro 1.5 และ Claude 3 Opus เทียบกับเกณฑ์มาตรฐาน LLM ทั้ง 6 รายการ ได้คะแนนสำหรับเกณฑ์มาตรฐานแต่ละช่วงตั้งแต่ 0 ถึง 100 ซึ่งสร้างขึ้นใหม่จากข้อมูลที่จัดทำโดย OpenAI ไม่มีการให้ข้อมูลสำหรับ Gemini Pro 1.5 สำหรับเกณฑ์มาตรฐาน GPQA

  • GPT-4o ได้คะแนนสูงสุดในทุกเกณฑ์มาตรฐานอย่างเห็นได้ชัด แสดงให้เห็นถึงความหลากหลายและความสามารถที่เหนือกว่าในการจัดการกับงานที่หลากหลาย

  • GPT-4 Turbo และ Claude 3 Opus นั้นก็ตามมาติดๆ ด้วยประสิทธิภาพที่ดีในเกณฑ์มาตรฐานส่วนใหญ่

  • และถึงแม้ว่า Gemini Pro 1.5 จะตามหลังเล็กน้อยในบางด้าน แต่ก็ยังแสดงให้เห็นถึงประสิทธิภาพที่ดีดยเฉพาะในด้านคณิตศาสตร์ (MATH) และการประเมินโดยมนุษย์ (HumanEval) แม้ว่าจะไม่มีข้อมูลในเกณฑ์ GPQA ก็ตาม

ตารางเปรียบเทียบการทำงานที่จำเป็นของ Data Scientist กับการใช้งานได้ใน LLM แต่ละโมเดล


หลังจากที่ได้ข้อมูลของ AI ทั้ง 4 ตัว ได้ข้อสรุปว่าควรใช้ Chat Gpt-4o มาช่วยทำงานในด้าน Data Science เนื่องจากในด้านประสิทธิภาพในการประมวลผลทางคณิตศาสตร์และด้านวิชาการอื่นๆ ซึ่ง Chat Gpt-4o ทำได้ดีกว่าในทุกๆ ด้านเนื่องจากความหลากหลายของชุดข้อมูล 
ส่วนในด้านการตรวจจับแพทเทิร์นของข้อมูลหรือ Needle in Haystack testing Chat GPT-4o มีความแม่นยำถึง 100% เทียบเท่าหรือมากกว่า AI ตัวอื่นๆ ซึ่ง Chat Gpt-4o มีจุดเด่นที่เพิ่มเข้ามาใหม่ คือ การทำ NLP processing ที่ดีขึ้น แถมมีการเลือกใช้ ML model ให้เหมาะสมกับชุดข้อมูล


บทความนี้ได้ศึกษาและเรียบเรียง โดย

  • นาย พิชญะ เรืองศักดิ์ภักดี (โฟกัส)

  • นาย วิชญ์​ ชำนาญเสือ (เเดเนียล)

  • นาย กฤติพงษ์ เจริญพงษ์ (น้ำ)

  • นาย อาธร ดำเนินอุดมการณ์ (เจน)

  • นาย ธีรภัทร แสงกระจ่าง (ธี)

  • นาย สรวิชญ์ สิงห์ประไพ (ฟิวเจอร์)

  • นาย ภูวนัช เพิ่มผล (อาร์ม)

  • นางสาว จิรชยา หนองบัวล่าง (เอิง)

  • นาย วสวัตติ์ ลิ้มนันทศิลป์ (เเกรม)

  • นาย วิชญ์พล เกษตรตระการ (เกมส์)

Back

ร่วมกันพัฒนาและสร้างสรรค์

อนาคตใหม่ ไปพร้อมกับเรา

ร่วมกันพัฒนาและสร้างสรรค์

อนาคตใหม่ ไปพร้อมกับเรา