AI

ทดสอบใช้งาน Azure Content Moderator กับภาษาไทย

เรื่องที่เกี่ยวข้อง - , , ,

ระบบ AI ปัจจุบัน มีความก้าวหน้ามากกว่าหลายปีก่อนมาก แต่คำถามสำคัญสำหรับคนไทยอย่างพวกเราก็คือ มันทำงานกับข้อมูลภาษาไทยได้มากน้อยแค่ไหนกัน?

อย่าง Content Moderator ของ Azure Cognitive Service ที่เราลองทดสอบใช้งานกันไปวันก่อน ในปัจจุบันสามารถตรวจจับคำเฉพาะส่วน Profanity ที่เป็นภาษาไทยได้แล้ว!

ดังนั้นวันนี้เราจะมาลองกันครับ ใครที่จะลองภาษาไทยต้องผ่านการ setup ตัว Resource บน Azure และลองใช้ Content Moderator Console แบบภาษาอังกฤษมาแล้วนะ

วิธีตรวจจับกลุ่มคำ Profanity ภาษาไทย ด้วย Azure Content Moderator

  1. เอาล่ะ เรามี Azure Resource แล้ว ก็เข้ามาที่ Content Moderator Console กันเลย
  2. การกำหนดค่าทั่วไป ให้ทำแบบตัวอย่างหลัก
  3. ส่วนที่แตกต่างคือ เราจะใส่ค่าในส่วน Query parameter เรากำหนดค่า language เป็น tha เพื่อให้มันค้นหาชุดคำ Profanity โดยใช้ชุดคำภาษาไทย (อ้างอิงจากมาตรฐาน ISO 639)

ในตอนที่พลเล่าอยู่นี้ Azure Content Moderator เริ่มรองรับภาษาไทยในส่วนของ Profanity Term เท่านั้น สำหรับ Classification และ PII จะตามมาอีกที

4. ในส่วนของ Request Body ลองใส่ข้อความลงไปดู อาจจะมีคำหยาบนิดหนึงด้านล่างใช้ในการทดลองเท่านั้น

จะได้ JSON ที่ตอบข้อความกลับมาแบบด้านล่าง จะสังเกตว่า สามารถตรวจจับบางคำได้ และยังไม่มีค่า Classification หรือ PII (ในตอนที่โค้ชพลเผยแพร่เรื่องนี้)

Transfer-Encoding: chunked
api-supported-versions: 1.0
csp-billing-usage: CognitiveServices.ContentModerator.Transaction=1
x-envoy-upstream-service-time: 257
apim-request-id: 6d6f3a02-70d4-47ba-84c0-1a0fd9ef8e11
Strict-Transport-Security: max-age=31536000; includeSubDomains; preload
x-content-type-options: nosniff
Date: Fri, 18 Dec 2020 13:18:45 GMT
Content-Type: application/json; charset=utf-8

{
  "OriginalText": "เหี้ย มองอะไร สนใจเริ่มต้น AI ในองค์กรติดต่อ 083-071-3373 ไปอบรมให้ถึงที่",
  "NormalizedText": "เหี้ย มองอะไร สนใจเริ่มต้น AI ในองค์กรติดต่อ 083-071-3373 ไปอบรมให้ถึงที่",
  "Misrepresentation": null,
  "Language": "tha",
  "Terms": [{
    "Index": 0,
    "OriginalIndex": 0,
    "ListId": 0,
    "Term": "เหี้ย"
  }],
  "Status": {
    "Code": 3000,
    "Description": "OK",
    "Exception": null
  },
  "TrackingId": "6d6f3a02-70d4-47ba-84c0-1a0fd9ef8e11"
}

ซึ่งจริงๆ ส่วน Profanity ภาษาไทยนี้ สามารถเพิ่มเติมได้ด้วยการกำหนด List ของกลุ่มคำที่เราต้องการเพิ่มเติมได้ เดี๋ยวมาจะสาธิตในตัวอย่างต่อๆ ไปครับ

ติดตามเรื่องการใช้งาน AI จริงในองค์กร เรื่องใหม่ๆ ได้ตามช่องทางด้านล่าง

อ้างอิง – Use the API Console, Language support in Content Moderator API

Loading Facebook Comments ...
Menu