AI

AI: รู้จักกับ Personally identifiable information และวิธีตรวจจับของ Microsoft Azure

เรื่องที่เกี่ยวข้อง - AI, Azure AI, Azure Text Moderation
“Machine Learning & Artificial Intelligence” by mikemacmarketing is licensed under CC BY 2.0

ในโลกที่ปัจจุบันทุกคนสามารถเข้าถึง และเติมเต็มแหล่งข้อมูลให้กันและกันได้ มันก็มีข้อมูลอยู่จำพวกหนึ่ง ที่การมีอยู่ของมันอาจจะมีผลทำให้เกิดปัญหาตามมา

นั่นคือข้อมูลที่สามารถใช้ระบุตัวตนจริงๆ ได้นั่นเอง (Personally Identifiable information)

พวกนี้ได้แก่

  • ที่อยู่ email
  • ที่อยู่ไปรษณีย์
  • IP address
  • เบอร์โทรศัพท์
  • พวกเลขบัตรประชาชน หรือเลขประกันสังคม

อาจจะสงสัยว่า ข้อมูลพวกนี้มันไม่ดียังไง? เพราะคุยกันบางทีอีกฝ่ายก็ต้องการข้อมูลไปต่อ เช่นขอให้ส่งไฟล์งานเข้า email หรือเพื่อให้ฝ่าย IT เข้ามาแก้ปัญหาอะไรงี้

การเชื่อมโยงกันของข้อมูลส่วนตัว

ในโลกที่เรามีการนำข้อมูลที่เกี่ยวข้องกับตัวเราไม่ทางใดก็ทางหนึ่ง ไปไว้ในอินเตอร์เน็ต หรือในทางเทคนิคคือ “เครื่องคอมพิวเตอร์ของคนอื่น” จึงมีความเป็นไปได้ที่คนที่เข้าถึงข้อมูลของเรา จะสามารถปะติดปะต่อเพื่อใช้ประโยชน์ในทางใดทางหนึ่ง

เช่นเรื่องของสตอลเกอร์ที่สืบหาที่อยู่จริงของพวกดารา แล้วตามคุกคามก็มีมาแล้ว

หรือการสวมรอยเป็นตัวเรา ไปเข้าถึงข้อมูลสำคัญอย่างบัญชีธนาคารก็มีมาแล้ว

เรื่องนี้จะเกี่ยวข้องกับสิทธิมนุษยชนขั้นพื้นฐาน อีกทีหนึ่ง มีโอกาสก็จะเล่าให้ฟังใน Youtube Channel ครับ

Azure Text Moderation API ตรวจจับข้อมูล PII ในรูปแบบไหน?

โดยใน Microsoft Azure จะมีส่วน Text Moderation API ที่นอกจากจะตรวจจับคำสุ่มเสี่ยง (Profanity) หรือประเมินข้อความผ่านการใช้คะแนนจัดกลุ่ม (Classification) แล้ว ก็จะมีส่วนที่ตรวจจับ PII ด้วย

โดยจะมีการแสดงข้อมูลที่พบกลับมาในรูปแบบของ JSON คล้ายกับตัวอย่างด้านล่าง

"PII": {
    "Email": [{
        "Detected": "[email protected]",
        "SubType": "Regular",
        "Text": "[email protected]",
        "Index": 32
        }],
    "IPA": [{
        "SubType": "IPV4",
        "Text": "255.255.255.255",
        "Index": 72
        }],
    "Phone": [{
        "CountryCode": "US",
        "Text": "5557789887",
        "Index": 56
        }, {
        "CountryCode": "UK",
        "Text": "+44 123 456 7890",
        "Index": 208
        }],
    "Address": [{
        "Text": "1 Microsoft Way, Redmond, WA 98052",
        "Index": 89
        }],
    "SSN": [{
        "Text": "999-99-9999",
        "Index": 267
        }]
    }

ดังนั้นจะเห็นว่า การทำงานของ Text Moderation API ของ Microsoft Azure สามารถสังเกตข้อมูลที่สามารถนำไประบุตัวตนต่อได้ ซึ่งอาจจะเป็นข้อมูลล่อแหลมที่ผู้ดูแลระบบอยากควบคุมการแสดงผลข้อมูลพวกนี้ได้ครับ

ติดตามเรื่อง AI ดีๆ แบบนี้ต่อได้ เพียงกดติดตามโค้ชพลผ่านช่องทางต่อไปนี้

อ้างอิง – Microsoft Docs: Text Moderation

เริ่มต้นยุค AI ด้วยคอร์สฟรี และพรีเมี่ยม กับพล

หากชอบสิ่งที่พลเล่า เรื่องที่พลสอน สามารถสนับสนุนพลโดยการเข้าเรียนคอร์สออนไลน์ของพลนะคร้าบ

  • เข้าใจง่าย ใช้ได้จริง ออกแบบการสอนอย่างเข้าใจโดยโค้ชพล
  • มีคอร์สสำหรับคนใช้งานทั่วไป จนถึงเรียนรู้เพื่อใช้งานในสายอาชีพขั้นสูง
  • ทุกคอร์สมีใบประกาศณียบัตรรับรองหลังเรียนจบ

เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า

Privacy Preferences

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

Allow All
Manage Consent Preferences
  • Always Active

Save