What-is-text-to-speech-thai-image-banner
What-is-text-to-speech-thai-image-banner
What-is-text-to-speech-thai-image-banner

Botnoi Voice

14 ก.พ. 2567

Label

UX/UI

Text-To-Speech (TTS) คืออะไร?

Text-To-Speech (TTS) คืออะไร?

Text to Speech คือ เทคโนโลยีช่วยเหลือประเภทหนึ่งที่ใช้ในการอ่านออกเสียงข้อความที่ผู้ใช้ป้อนเข้าไปให้มีความเสมือนเสียงมนุษย์มากที่สุด เขียนย่อๆได้ว่า TTS

เราสามารถนำเสียงสังเคราะห์ไปใช้ในชีวิตประจำวันได้อย่างไรบ้าง?

บอทน้อยกรุ๊ปต้องขอบอกว่าเทคโนโลยีนี้มีมานานแล้ว และเริ่มเป็นที่นิยมเป็นที่ใช้งานในชีวิตประจำวันเรามากขึ้นเรื่อยๆ โดยที่หลายๆคนอาจจะไม่สังเกตหรือไม่รู้ตัวว่านี่คือเทคโนโลยีแปลงข้อความเป็นเสียง หากยกตัวอย่างการใช้งานที่สามารถพบได้ในชีวิตประจำวันหลายๆคนก็คงพอจะเข้าใจและนึกภาพออกทันที

text-to-speech-in-daily-life-th-image

Google Maps

เทคโนโลยีนำทางด้วยเสียงอย่าง GPS ของ Google ที่ถ้าหากเรากดรูปลำโพงเวลาเปิดการนำทาง จะมีเสียงคนที่ชอบพูดว่าอีก 200 เมตรเลี้ยวซ้าย, มุ่งหน้าไปทางตะวันออก… พวกนี้คือเทคโนโลยีที่เรียกว่า text to speech เพราะว่าถ้า google ต้องมาบันทึกเสียงคนเองสำหรับเส้นทางรอบโลกนั้นคงไม่ใช่เรื่องง่ายเลย

  • Siri

หรือถ้าจะให้มองเห็นชัดเจนขึ้นอีกสักตัวอย่างเลยก็คือ Siri ผู้ช่วยเสมือนที่พัฒนาโดย Apple ตัว SIri ก็ใช้ระบบนี้ในการประมวลผลข้อความตอบกลับให้ผู้ใช้งาน IOS ออกมาเป็นเสียงด้วยเช่นกัน

  • Google translate

นอกจาก Google maps แล้วก็มี ตัว translate ที่เป็นที่นิยมและคาดว่าหลายๆคนน่าจะเคยใช้ แล้วทีนี้ส่วนไหนของ Google Translate ที่เป็นเทคโนโลยีแปลงเสียงเป็นข้อความกันแน่? คำตอบก็คือส่วนที่ฟังข้อความที่เราต้องการแปล หรือข้อความที่แปลออกมา นอกจากทำให้เรารู้แล้วว่ามันออกเสียงยังไง ยังเป็นผู้ช่วยสำคัญเมื่อต้องเดินทางอีกด้วย!

เราแปลงเสียงเป็นข้อความอย่างไร?

เทคโนโลยี Text To speech(TTS) จะรับข้อความที่เป็นตัวอักษรจากผู้ใช้มา แล้ววิเคราะห์ว่าประโยคที่ป้อนเข้ามาควรจะอ่านอย่างไร และสร้างเสียงสังเคราะห์ขึ้นมาอ่านประโยคนั้น ปัจจุบันเทคโนโลยี TTS ถูกนำมาใช้กันอย่างกว้างขวางและสามารถนำไปใช้ได้ในหลายรูปแบบ เช่น การนำไปใช้ออกเสียงในโปรแกรมแปลภาษา, การนำไปใช้ในการอ่านข่าวหรืออ่านหนังสือ, การนำไปสร้างสื่อการสอน, การนำไปทำระบบเสียงเพื่อช่วยเหลือผู้พิการทางสายตา เป็นต้น

how-text-to-speech-work-image
  1. ทำการวิเคราะห์ข้อความ

ระบบจะทำการวิเคราะห์ข้อความที่เขียนเข้ามาออกเป็นองค์ประกอบพื้นฐาน โดยจะแบ่งประโยคของเราออกมาเป็นคำ วลี ออกมาเป็นส่วนเล็กๆ เพื่อที่จะได้นำไปใช้งานในส่วนต่อๆไปของการประมวลผลสร้างเสียงเอไอได้ง่ายมากยิ่งขึ้น

  1. นำข้อความนั้นมาประมวลผล

หลังจากการวิเคราะห์แล้ว ต่อมาในขั้นตอนการประมวลผล ระบบจะนำข้อความที่ได้แบ่งออกมาแล้วแปลงมันอีกที โดยจะแปลงมันเป็นหน่วยเสียงขนาดเล็กที่เรียกว่า "phonemes" ซึ่งมันก็คือหน่วยเสียงที่เล็กที่สุดของเสียงในภาษาพูด

  1. ขั้นตอนสังเคราะห์เสียง

จากนั้นก็จะนำ phonemes ที่ได้มาสร้างเสียงจากข้อความโดยใช้เทคโนโลยี Text to speech ปรับแต่งให้เสียงนั้นมีความเหมือนมนุษย์อย่างเป็นธรรมชาติมากที่สุด (natural sounding voices) ทั้งการเน้นเสียง น้ำเสียง ระยะเวลา เช่นความหน่วง

  1. แสดงผลในรูปแบบเสียงเอไอ

และสุดท้าย ขั้นตอนนี้เป็นขั้นตอนที่เรา คนที่ป้อนข้อความนั้นสามารถได้ยินเสียงของข้อความ (Sound of Text) ที่เราได้ทำการประมวลผลไปออกมาเป็นเสียงตามที่เราเลือก


เสียง AI สามารถเอาไปใช้ทำอะไรได้บ้าง?

วันนี้บอทน้อยขอนำเสนอไอเดียการสร้างเสียงสังเคราะห์ หรือการสร้างเสียง AI ไม่ว่าจะเป็นการแปลงเสียงเป็นผู้หญิงหรือการแปลงเสียงเป็นผู้ชาย บอทน้อยรวบรวมตัวอย่างมาให้แล้วถึง 5 ตัวอย่างด้วยกัน

  1. สายคุณครู นำไปทำสื่อการสอน

คุณครูคนไหนที่ไม่ค่อยมีเวลา ใช้เสียงไปกับการสอนนักเรียนทั้งวันแต่ต้องทำสื่อการสอนต่อหลังเลิอกงานเพื่อเตรียมพร้อมสอนในวันต่อไป  Botnoi vocie จะขอเป็นทางเลือกที่สนับสนุนครูทุกคน ทำสื่อการสอนที่มีคุณภาพ ไอเดียทำสื่อการสอนนั้นก็มีมากมาย เช่น การทำวิดิโอสอนภาษาไม่ว่าจะเป็น อังกฤษ หรือจีน ที่นี่เราก็มีรองรับให้เลือกมากกว่า 8 ภาษา และ 80+ เสียงพร้อมให้ครู้ใช้งานได้ไม่อั้น

โปรโมชั่นพิเศษเฉพาะครูอาจารย์ รับสิทธิ์ได้ที่ : BotnoiVoiceXTeachers

  1. สายนักเต้น นำไปเป็นเสียง remix

Tiktok

ใครที่เป็นเจ้าแม่ TikTok อยากได้เสียงบอทน้อยไปใส่ทำคอนเท้นต์ก็ได้เหมือนกัน โดยที่ก่อนหน้านี้ก็มีน้องๆหนูสร้างเสียง AI ไปทำเป็นคนเท้นต์ #ไม่รำได้ไง หนทางสู่การเป็นดาวได้เริ่มขึ้นแล้ว! 

  1. สายนักพากย์ ทั้งเล่าทั้งเม้าท์ได้ไม่เจ็บคอ

Youtube

หรือว่าใครไม่ใช่สายเต้น เป็นสายนักดู ยอดรีวิวเบอร์หนึ่ง อยากเป็นนักพากย์แต่ไม่ค่อยมั่นใจในเสียงตัวเองสักเท่าไหร่ วันนี้เทคโนโลยีแปลงเสียงเป็นข้อความจะช่วยแก้ไขปัญหาเหล่านั้นเอง สามารถสร้างเสียงจากข้อความไปเล่าเรื่องผี เล่านิยายเสียง สร้างรายได้ได้ง่ายๆ ใช้เวลาไม่นาน ต้นทุนต่ำ

  1. สายนักเขียน กับนิยายเสียงเพิ่มอรรถรส

เพิ่มประสบการฟินๆให้กับนิยายของเราด้วยการทำเป็นนิยายเสียงดูสิ เล่าเรื่องราวที่เราได้ร้อยเรียงออกเป็นเสียงผ่านตัวหนังสือ สะดวกแก่แฟนคลับที่ชอบอ่านและชอบฟัง ขยายตลาดเพิ่มรายได้กันเลย!

  1. สายอนิเมชั่น กับพากย์เสียงการ์ตูน

เสียงที่ได้จาก Botnoi voice นั้นสามารถนำไปใช้เป็นเสียงพากย์การ์ตูนได้เช่นกันนะ เพราะเว็บไซต์สร้างเสียง Botnoi voice นั้นมีให้เลือกหลากหลาย ไม่ว่าจะเป็นเสียงผู้หญิง เด็กหญิง ภาษาถิ่นของแต่ละภาค หากใครสนใจเสียงภาษาเพื่อนบ้าน เราก็มีให้เลือกมากกว่า 8 ภาษาพร้อมใช้งานแล้ววันนี้


เว็บแอปพลิเคชั่นสำหรับสร้างเสียงสังเคราะห์จากข้อความด้วย AI ของคนไทย สามารถนำไปใช้งานได้หลากหลายตามความต้องการ ไม่ว่าจะสำหรับการทำสื่อต่างๆเช่นโฆษณา แคสเกม ทีสื่อนำเสนอโพยไม่ต้องอัดเสียงตัวเอง เปิดให้ใช้งานได้ทุกเพศทุกวัยแล้ววันนี้ สมาชิกใหม่รับฟรีไปเลย 500 พ้อยท์

แพลตฟอร์มสำหรับสร้างเสียงสังเคราะห์: voice.botnoi.ai
ติดตามข่าวสาร Botnoi Voice : Botnoi Voice - Text To Speech
บอทน้อยสามารถใช้งานใน canva ได้แล้วนะ อ่านเพิ่มเติมได้ ที่นี่ รีบลองใช้เลย : BotnoixCanva

Back

ร่วมกันพัฒนาและสร้างสรรค์

อนาคตใหม่ ไปพร้อมกับเรา

ร่วมกันพัฒนาและสร้างสรรค์

อนาคตใหม่ ไปพร้อมกับเรา