Microsoft ปฏิเสธการสนับสนุนสาธารณะสำหรับคุณลักษณะบางอย่างที่ใช้ AI รวมถึงการจดจำใบหน้า และรับทราบปัญหาการเลือกปฏิบัติและความถูกต้องที่ข้อเสนอเหล่านี้สร้างขึ้น แต่บริษัทมีเวลาหลายปีในการแก้ไขปัญหาและไม่สามารถทำได้ มันเหมือนกับผู้ผลิตรถยนต์ที่เรียกคืนรถแทนที่จะซ่อมมัน
แม้จะกลัวว่าเทคโนโลยีการจดจำใบหน้าอาจเป็นการเลือกปฏิบัติ แต่ปัญหาที่แท้จริงคือผลลัพธ์ที่ได้นั้นไม่แม่นยำ (อย่างไรก็ตาม อาร์กิวเมนต์การเลือกปฏิบัติมีบทบาทเนื่องจากสมมติฐานที่นักพัฒนาของ Microsoft ตั้งขึ้นเมื่อสร้างแอปเหล่านี้)
เริ่มจากสิ่งที่ Microsoft ได้ทำและพูดกัน Sarah Bird ผู้จัดการผลิตภัณฑ์อาวุโสของกลุ่ม Azure AI ของ Microsoft สรุปผลตอบรับเมื่อเดือนที่แล้วในบล็อกโพสต์ของ Microsoft
“ตั้งแต่วันนี้ (21 มิถุนายน) ลูกค้าใหม่ต้องร้องขอการเข้าถึงเพื่อใช้การดำเนินการจดจำใบหน้าใน Azure Face API, Computer Vision และ Video Indexer ลูกค้าปัจจุบันมีเวลาหนึ่งปีในการขอและได้รับการอนุมัติสำหรับการเข้าถึงบริการจดจำใบหน้าอย่างต่อเนื่องตามกรณีการใช้งานที่มีให้ ด้วยการแนะนำการเข้าถึงแบบจำกัด เรากำลังเพิ่มระดับการควบคุมเพิ่มเติมให้กับการใช้และการใช้งานการจดจำใบหน้าเพื่อให้แน่ใจว่าการใช้บริการเหล่านี้สอดคล้องกับมาตรฐาน AI ที่รับผิดชอบของ Microsoft และก่อให้เกิดประโยชน์ที่มีมูลค่าสูงต่อผู้ใช้ ปลายและสังคม ซึ่งรวมถึงการแนะนำข้อกำหนดการใช้งานและสิทธิ์ของลูกค้าในการเข้าถึงบริการเหล่านี้
"ความสามารถในการตรวจจับใบหน้า รวมถึงการเบลอใบหน้า การเปิดรับแสง แว่นตา ตำแหน่งศีรษะ จุดสังเกต เสียง การบดเคี้ยว และการตรวจจับขอบกล่อง จะยังคงใช้งานได้โดยทั่วไปและไม่จำเป็นต้องใช้แอป"
ดูประโยคที่สองนี้ ซึ่ง Bird เน้นย้ำถึงห่วงเพิ่มเติมนี้เพื่อให้ผู้ใช้กระโดด "เพื่อให้แน่ใจว่าการใช้บริการเหล่านี้สอดคล้องกับมาตรฐาน AI ที่รับผิดชอบของ Microsoft และช่วยให้ผู้ใช้ปลายทางได้รับผลประโยชน์ที่มีมูลค่าสูงและทางสังคม" .
ฟังดูดี แต่นั่นคือสิ่งที่การเปลี่ยนแปลงนี้ทำจริงหรือ หรือ Microsoft จะไว้ใจมันเพื่อป้องกันไม่ให้ผู้คนใช้แอพที่มีความไม่ถูกต้องมากที่สุด?
สถานการณ์หนึ่งที่ Microsoft ได้พูดคุยกันนั้นเกี่ยวข้องกับการรู้จำเสียงพูด ซึ่งพบว่า "เทคโนโลยีการแปลงคำพูดเป็นข้อความในอุตสาหกรรมเทคโนโลยีสร้างอัตราข้อผิดพลาดสำหรับสมาชิกของชุมชนชาวอเมริกันเชื้อสายแอฟริกันและผิวดำบางแห่งซึ่งสูงกว่าผู้ใช้เกือบสองเท่า" คนผิวขาว” นาตาชา แครมป์ตัน กล่าว , ผู้อำนวยการรับผิดชอบด้าน AI ที่ไมโครซอฟต์ "เราถอยหลังหนึ่งก้าว ทบทวนผลการศึกษา และพบว่าการทดสอบก่อนตีพิมพ์ของเราไม่ได้รวบรวมคำพูดที่หลากหลายระหว่างผู้คนที่มีภูมิหลังต่างกันและจากภูมิภาคต่างๆ อย่างน่าพอใจ"
ปัญหาอีกประการหนึ่งที่ Microsoft ระบุคือผู้คนจากทุกสาขาอาชีพมักจะพูดต่างกันในการตั้งค่าที่เป็นทางการและไม่เป็นทางการ โอวตกลง? นักพัฒนาไม่ทราบเรื่องนี้มาก่อนหรือไม่? ฉันพนันได้เลยว่าพวกเขาทำ แต่พวกเขาไม่ได้คิดถึงความหมายของการไม่ทำอะไรเลย
วิธีหนึ่งในการแก้ไขปัญหานี้คือการตรวจสอบกระบวนการรวบรวมข้อมูลอีกครั้ง โดยธรรมชาติแล้ว คนที่บันทึกไว้สำหรับการวิเคราะห์เสียงจะค่อนข้างประหม่าและมีแนวโน้มที่จะพูดในลักษณะที่เข้มงวดและเข้มงวด วิธีหนึ่งคือทำเซสชันการบันทึกให้นานขึ้นในสภาพแวดล้อมที่ผ่อนคลายมากที่สุด หลังจากผ่านไปสองสามชั่วโมง บางคนอาจลืมว่ากำลังถูกบันทึกและตกอยู่ในรูปแบบการสนทนาแบบเป็นกันเอง
ฉันเคยเห็นมันเล่นกับวิธีที่ผู้คนโต้ตอบกับการรู้จำคำพูด ตอนแรกพวกเขาพูดช้าและมักจะออกเสียงมากเกินไป เมื่อเวลาผ่านไป พวกเขาจะค่อยๆ เข้าสู่โหมดที่ฉันเรียกว่า "Star Trek" และพูดเหมือนกับที่พูดกับบุคคลอื่น
ปัญหาที่คล้ายกันถูกค้นพบด้วยความพยายามในการตรวจจับอารมณ์
Bird's Plus: «เป็นการเปลี่ยนแปลงอย่างแท้จริง เราได้ถอนความสามารถของการวิเคราะห์ใบหน้าที่อ้างว่าสามารถกำจัดสภาวะทางอารมณ์และคุณลักษณะของอัตลักษณ์ เช่น เพศ อายุ ความเป็นกรด poils du visage, les cheveux และการแต่งหน้า เราร่วมมือกับนักวิจัยทั้งภายในและภายนอกเพื่อทำความเข้าใจข้อจำกัดและประโยชน์ที่เป็นไปได้ของเทคโนโลยีนี้ และนำทางไปสู่การประนีประนอม ในกรณีของการแบ่งประเภทอารมณ์โดยเฉพาะ ความพยายามเหล่านี้ทำให้เกิดคำถามที่สำคัญเกี่ยวกับการรักษาความลับ การขาดฉันทามติเกี่ยวกับคำจำกัดความของอารมณ์ และการไม่สามารถสรุปความเชื่อมโยงระหว่างการแสดงออกทางสีหน้าและสถานะทางอารมณ์ในกรณีการใช้งาน ภูมิภาคและข้อมูลประชากร . การเข้าถึง API ความสามารถที่คาดการณ์คุณลักษณะที่ละเอียดอ่อนยังเปิดกว้างในหลากหลายวิธีที่อาจถูกนำไปใช้ในทางที่ผิด ซึ่งรวมถึงการทำให้ผู้คนตกต่ำ การเลือกปฏิบัติ หรือการปฏิเสธบริการอย่างไม่เป็นธรรม เพื่อลดความเสี่ยงเหล่านี้ เราได้เลือกที่จะไม่สนับสนุนระบบเอนกประสงค์ใน Face API ที่พยายามอนุมานสภาวะทางอารมณ์ เพศ อายุ รอยยิ้ม ขนบนใบหน้า ผม และการแต่งหน้า การตรวจหาแอตทริบิวต์เหล่านี้จะไม่สามารถใช้ได้กับลูกค้าใหม่อีกต่อไปตั้งแต่วันที่ 21 มิถุนายน 2022 และลูกค้าปัจจุบันมีเวลาจนถึงวันที่ 30 มิถุนายน 2023 เพื่อหยุดใช้แอตทริบิวต์เหล่านี้ก่อนที่จะเลิกใช้
เมื่อพูดถึงการตรวจจับอารมณ์ การวิเคราะห์ใบหน้าในอดีตแสดงให้เห็นว่ามีความแม่นยำน้อยกว่าการวิเคราะห์ด้วยเสียงธรรมดามาก การรู้จำอารมณ์ด้วยเสียงได้รับการพิสูจน์แล้วว่ามีประสิทธิภาพมากในแอปพลิเคชันคอลเซ็นเตอร์ ซึ่งลูกค้าที่ดูโกรธจัดสามารถโอนไปยังหัวหน้างานระดับสูงได้ทันที
ในระดับหนึ่ง วิธีนี้ช่วยให้ Microsoft เข้าใจว่าต้องใช้ข้อมูลอย่างไรจึงจำเป็นต้องจำกัด ในสถานการณ์สมมติของศูนย์บริการ หากซอฟต์แวร์ผิดพลาดและลูกค้าไม่ได้โกรธจริงๆ ก็ไม่เกิดอันตรายขึ้น หัวหน้างานก็วางสายตามปกติ หมายเหตุ: การตรวจจับอารมณ์ด้วยเสียงทั่วไปเพียงอย่างเดียวที่ฉันได้เห็นคือเมื่อลูกค้าโกรธที่เครือข่ายโทรศัพท์และไม่สามารถเข้าใจประโยคง่ายๆ ได้ ซอฟต์แวร์คิดว่าลูกค้าโกรธบริษัท ความผิดพลาดที่สมเหตุสมผล
แต่อีกครั้งหากซอฟต์แวร์ไม่ดีก็ไม่เกิดอันตราย
Bird ตั้งข้อสังเกตว่ากรณีการใช้งานบางอย่างยังคงพึ่งพาคุณลักษณะ AI เหล่านี้อย่างมีความรับผิดชอบ "ลูกค้า Azure Cognitive Services สามารถใช้ประโยชน์จากแพคเกจ Fairlearn โอเพ่นซอร์สของ Microsoft และ Fairness Dashboard เพื่อวัดความเป็นธรรมของอัลกอริธึมการตรวจสอบใบหน้าของ Microsoft ด้วยข้อมูลของตนเอง ทำให้สามารถระบุและแก้ไขปัญหาความเป็นธรรมที่อาจเกิดขึ้นได้" ซึ่งอาจส่งผลกระทบต่อกลุ่มประชากรต่างๆ ก่อนหน้านี้ ใช้เทคโนโลยีของตน
เบิร์ดยังกล่าวอีกว่าปัญหาทางเทคนิคมีบทบาทในความไม่ถูกต้องบางอย่าง “ในขณะที่ทำงานกับลูกค้าที่ใช้บริการ Face ของเรา เรายังพบว่าข้อผิดพลาดบางอย่างในขั้นต้นเกิดจากปัญหาด้านความเป็นธรรมนั้นเกิดจากคุณภาพของภาพที่ไม่ดี หากภาพที่มีผู้ส่งมืดหรือเบลอเกินไป แบบจำลองอาจไม่สามารถจับคู่ได้อย่างถูกต้อง เราทราบดีว่าคุณภาพของภาพที่ไม่ดีนี้อาจมีความเข้มข้นอย่างไม่เป็นธรรมในกลุ่มประชากร
ระหว่างกลุ่มประชากร? นั่นไม่ใช่ทุกคน เนื่องจากทุกคนอยู่ในกลุ่มประชากรกลุ่มใดกลุ่มหนึ่ง ฟังดูเหมือนพูดไม่สุภาพว่าคนผิวขาวอาจมีฟังก์ชันการจับคู่ที่ไม่ดี นี่คือสาเหตุที่การใช้เครื่องมือเหล่านี้โดยหน่วยงานบังคับใช้กฎหมายจึงมีปัญหา คำถามสำคัญสำหรับไอที: ผลที่ตามมาหากซอฟต์แวร์ผิดพลาดคืออะไร? ซอฟต์แวร์เป็นหนึ่งใน 50 เครื่องมือที่ใช้หรืออิงจากซอฟต์แวร์เพียงอย่างเดียวหรือไม่?
Microsoft กล่าวว่ากำลังทำงานเพื่อแก้ไขปัญหานี้ด้วยเครื่องมือใหม่ "นั่นเป็นเหตุผลที่ Microsoft เสนอ API คุณภาพการจดจำแบบใหม่ให้กับลูกค้า ซึ่งระบุปัญหาแสง การเบลอ การบดบัง หรือมุมของศีรษะในภาพที่ส่งมาเพื่อการตรวจสอบใบหน้า" Bird กล่าว "Microsoft ยังมีแอพอ้างอิงที่ให้คำแนะนำแบบเรียลไทม์เพื่อช่วยให้ผู้ใช้จับภาพคุณภาพสูงขึ้นซึ่งมีแนวโน้มที่จะให้ผลลัพธ์ที่แม่นยำยิ่งขึ้น"
ในการให้สัมภาษณ์กับ The New York Times แครมป์ตันตั้งข้อสังเกตว่าปัญหาอีกประการหนึ่งคือ "ตัวจำแนกเพศของระบบที่เรียกว่าเป็นเลขฐานสอง 'และไม่สอดคล้องกับค่านิยมของเรา'"
กล่าวโดยย่อ เขากล่าวว่า แม้ว่าระบบจะไม่ได้คิดเพียงในแง่ของผู้ชายและผู้หญิงเท่านั้น แต่ก็ไม่สามารถระบุบุคคลที่ระบุตัวตนด้วยวิธีอื่นได้ง่ายๆ ในกรณีนี้ Microsoft เลือกที่จะหยุดพยายามเดาเพศ ซึ่งอาจเป็นทางเลือกที่เหมาะสม
ลิขสิทธิ์ © 2022 IDG Communications, Inc.