ทดสอบใช้งาน Azure Content Moderator กับภาษาไทย

เรื่องที่เกี่ยวข้อง - AI, Azure AI, Azure Cognitive service, Azure Content Moderator

ระบบ AI ปัจจุบัน มีความก้าวหน้ามากกว่าหลายปีก่อนมาก แต่คำถามสำคัญสำหรับคนไทยอย่างพวกเราก็คือ มันทำงานกับข้อมูลภาษาไทยได้มากน้อยแค่ไหนกัน?

อย่าง Content Moderator ของ Azure Cognitive Service ที่เราลองทดสอบใช้งานกันไปวันก่อน ในปัจจุบันสามารถตรวจจับคำเฉพาะส่วน Profanity ที่เป็นภาษาไทยได้แล้ว!

ดังนั้นวันนี้เราจะมาลองกันครับ ใครที่จะลองภาษาไทยต้องผ่านการ setup ตัว Resource บน Azure และลองใช้ Content Moderator Console แบบภาษาอังกฤษมาแล้วนะ

วิธีตรวจจับกลุ่มคำ Profanity ภาษาไทย ด้วย Azure Content Moderator

เอาล่ะ เรามี Azure Resource แล้ว ก็เข้ามาที่ Content Moderator Console กันเลย
การกำหนดค่าทั่วไป ให้ทำแบบตัวอย่างหลัก
ส่วนที่แตกต่างคือ เราจะใส่ค่าในส่วน Query parameter เรากำหนดค่า language เป็น tha เพื่อให้มันค้นหาชุดคำ Profanity โดยใช้ชุดคำภาษาไทย (อ้างอิงจากมาตรฐาน ISO 639)

ในตอนที่พลเล่าอยู่นี้ Azure Content Moderator เริ่มรองรับภาษาไทยในส่วนของ Profanity Term เท่านั้น สำหรับ Classification และ PII จะตามมาอีกที

4. ในส่วนของ Request Body ลองใส่ข้อความลงไปดู อาจจะมีคำหยาบนิดหนึงด้านล่างใช้ในการทดลองเท่านั้น

จะได้ JSON ที่ตอบข้อความกลับมาแบบด้านล่าง จะสังเกตว่า สามารถตรวจจับบางคำได้ และยังไม่มีค่า Classification หรือ PII (ในตอนที่โค้ชพลเผยแพร่เรื่องนี้)

Transfer-Encoding: chunked
api-supported-versions: 1.0
csp-billing-usage: CognitiveServices.ContentModerator.Transaction=1
x-envoy-upstream-service-time: 257
apim-request-id: 6d6f3a02-70d4-47ba-84c0-1a0fd9ef8e11
Strict-Transport-Security: max-age=31536000; includeSubDomains; preload
x-content-type-options: nosniff
Date: Fri, 18 Dec 2020 13:18:45 GMT
Content-Type: application/json; charset=utf-8

{
  "OriginalText": "เหี้ย มองอะไร สนใจเริ่มต้น AI ในองค์กรติดต่อ 083-071-3373 ไปอบรมให้ถึงที่",
  "NormalizedText": "เหี้ย มองอะไร สนใจเริ่มต้น AI ในองค์กรติดต่อ 083-071-3373 ไปอบรมให้ถึงที่",
  "Misrepresentation": null,
  "Language": "tha",
  "Terms": [{
    "Index": 0,
    "OriginalIndex": 0,
    "ListId": 0,
    "Term": "เหี้ย"
  }],
  "Status": {
    "Code": 3000,
    "Description": "OK",
    "Exception": null
  },
  "TrackingId": "6d6f3a02-70d4-47ba-84c0-1a0fd9ef8e11"
}

ซึ่งจริงๆ ส่วน Profanity ภาษาไทยนี้ สามารถเพิ่มเติมได้ด้วยการกำหนด List ของกลุ่มคำที่เราต้องการเพิ่มเติมได้ เดี๋ยวมาจะสาธิตในตัวอย่างต่อๆ ไปครับ

ติดตามเรื่องการใช้งาน AI จริงในองค์กร เรื่องใหม่ๆ ได้ตามช่องทางด้านล่าง

ติดตามจากแฟนเพจ Nextflow
กดติดตามคลิปใหม่ๆ Subscribe YouTube Channel ของพลได้เลย
โทรติดต่อบริการจัดอบรม 083-071-3373 คลิกโทรผ่านมือถือได้เลย
สอบถามผ่านทาง LINE คลิก
สอบถามผ่านทาง Facebook คลิก

อ้างอิง – Use the API Console, Language support in Content Moderator API

เริ่มต้นยุค AI ด้วยคอร์สฟรี และพรีเมี่ยม กับพล

หากชอบสิ่งที่พลเล่า เรื่องที่พลสอน สามารถสนับสนุนพลโดยการเข้าเรียนคอร์สออนไลน์ของพลนะคร้าบ

เข้าใจง่าย ใช้ได้จริง ออกแบบการสอนอย่างเข้าใจโดยโค้ชพล
มีคอร์สสำหรับคนใช้งานทั่วไป จนถึงเรียนรู้เพื่อใช้งานในสายอาชีพขั้นสูง
ทุกคอร์สมีใบประกาศณียบัตรรับรองหลังเรียนจบ

ดูคอร์ส

Nextflow.in.th

ทดสอบใช้งาน Azure Content Moderator กับภาษาไทย

วิธีตรวจจับกลุ่มคำ Profanity ภาษาไทย ด้วย Azure Content Moderator

ติดตามเรื่องการใช้งาน AI จริงในองค์กร เรื่องใหม่ๆ ได้ตามช่องทางด้านล่าง

เริ่มต้นยุค AI ด้วยคอร์สฟรี และพรีเมี่ยม กับพล

Youtube

Facebook

แผนผังเว็บไซต์

ติดต่อ

ทดสอบใช้งาน Azure Content Moderator กับภาษาไทย

วิธีตรวจจับกลุ่มคำ Profanity ภาษาไทย ด้วย Azure Content Moderator

ติดตามเรื่องการใช้งาน AI จริงในองค์กร เรื่องใหม่ๆ ได้ตามช่องทางด้านล่าง

Share:

เริ่มต้นยุค AI ด้วยคอร์สฟรี และพรีเมี่ยม กับพล

Youtube

Facebook

แผนผังเว็บไซต์