AI

ทดสอบใช้งาน Azure Content Moderator กับภาษาไทย

เรื่องที่เกี่ยวข้อง - AI, Azure AI, Azure Cognitive service, Azure Content Moderator

ระบบ AI ปัจจุบัน มีความก้าวหน้ามากกว่าหลายปีก่อนมาก แต่คำถามสำคัญสำหรับคนไทยอย่างพวกเราก็คือ มันทำงานกับข้อมูลภาษาไทยได้มากน้อยแค่ไหนกัน?

อย่าง Content Moderator ของ Azure Cognitive Service ที่เราลองทดสอบใช้งานกันไปวันก่อน ในปัจจุบันสามารถตรวจจับคำเฉพาะส่วน Profanity ที่เป็นภาษาไทยได้แล้ว!

ดังนั้นวันนี้เราจะมาลองกันครับ ใครที่จะลองภาษาไทยต้องผ่านการ setup ตัว Resource บน Azure และลองใช้ Content Moderator Console แบบภาษาอังกฤษมาแล้วนะ

วิธีตรวจจับกลุ่มคำ Profanity ภาษาไทย ด้วย Azure Content Moderator

  1. เอาล่ะ เรามี Azure Resource แล้ว ก็เข้ามาที่ Content Moderator Console กันเลย
  2. การกำหนดค่าทั่วไป ให้ทำแบบตัวอย่างหลัก
  3. ส่วนที่แตกต่างคือ เราจะใส่ค่าในส่วน Query parameter เรากำหนดค่า language เป็น tha เพื่อให้มันค้นหาชุดคำ Profanity โดยใช้ชุดคำภาษาไทย (อ้างอิงจากมาตรฐาน ISO 639)

ในตอนที่พลเล่าอยู่นี้ Azure Content Moderator เริ่มรองรับภาษาไทยในส่วนของ Profanity Term เท่านั้น สำหรับ Classification และ PII จะตามมาอีกที

4. ในส่วนของ Request Body ลองใส่ข้อความลงไปดู อาจจะมีคำหยาบนิดหนึงด้านล่างใช้ในการทดลองเท่านั้น

จะได้ JSON ที่ตอบข้อความกลับมาแบบด้านล่าง จะสังเกตว่า สามารถตรวจจับบางคำได้ และยังไม่มีค่า Classification หรือ PII (ในตอนที่โค้ชพลเผยแพร่เรื่องนี้)

Transfer-Encoding: chunked
api-supported-versions: 1.0
csp-billing-usage: CognitiveServices.ContentModerator.Transaction=1
x-envoy-upstream-service-time: 257
apim-request-id: 6d6f3a02-70d4-47ba-84c0-1a0fd9ef8e11
Strict-Transport-Security: max-age=31536000; includeSubDomains; preload
x-content-type-options: nosniff
Date: Fri, 18 Dec 2020 13:18:45 GMT
Content-Type: application/json; charset=utf-8

{
  "OriginalText": "เหี้ย มองอะไร สนใจเริ่มต้น AI ในองค์กรติดต่อ 083-071-3373 ไปอบรมให้ถึงที่",
  "NormalizedText": "เหี้ย มองอะไร สนใจเริ่มต้น AI ในองค์กรติดต่อ 083-071-3373 ไปอบรมให้ถึงที่",
  "Misrepresentation": null,
  "Language": "tha",
  "Terms": [{
    "Index": 0,
    "OriginalIndex": 0,
    "ListId": 0,
    "Term": "เหี้ย"
  }],
  "Status": {
    "Code": 3000,
    "Description": "OK",
    "Exception": null
  },
  "TrackingId": "6d6f3a02-70d4-47ba-84c0-1a0fd9ef8e11"
}

ซึ่งจริงๆ ส่วน Profanity ภาษาไทยนี้ สามารถเพิ่มเติมได้ด้วยการกำหนด List ของกลุ่มคำที่เราต้องการเพิ่มเติมได้ เดี๋ยวมาจะสาธิตในตัวอย่างต่อๆ ไปครับ

ติดตามเรื่องการใช้งาน AI จริงในองค์กร เรื่องใหม่ๆ ได้ตามช่องทางด้านล่าง

อ้างอิง – Use the API Console, Language support in Content Moderator API

เริ่มต้นยุค AI ด้วยคอร์สฟรี และพรีเมี่ยม กับพล

หากชอบสิ่งที่พลเล่า เรื่องที่พลสอน สามารถสนับสนุนพลโดยการเข้าเรียนคอร์สออนไลน์ของพลนะคร้าบ

  • เข้าใจง่าย ใช้ได้จริง ออกแบบการสอนอย่างเข้าใจโดยโค้ชพล
  • มีคอร์สสำหรับคนใช้งานทั่วไป จนถึงเรียนรู้เพื่อใช้งานในสายอาชีพขั้นสูง
  • ทุกคอร์สมีใบประกาศณียบัตรรับรองหลังเรียนจบ

เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า

Privacy Preferences

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

Allow All
Manage Consent Preferences
  • Always Active

Save