AI กำเนิดคืออะไร? วิวัฒนาการของปัญญาประดิษฐ์


เจเนอเรทีฟเอไอเป็นคำทั่วไปสำหรับกระบวนการอัตโนมัติประเภทใดก็ตามที่ใช้อัลกอริทึมในการผลิต จัดการ หรือสังเคราะห์ข้อมูล ซึ่งมักจะอยู่ในรูปของรูปภาพหรือข้อความที่มนุษย์อ่านได้ เรียกว่ากำเนิดเพราะ AI สร้างสิ่งที่ไม่เคยมีมาก่อน นี่คือสิ่งที่ทำให้แตกต่างจาก AI ที่เลือกปฏิบัติ ซึ่งสร้างความแตกต่างระหว่างอินพุตประเภทต่างๆ พูดอีกอย่างก็คือ AI ที่เลือกปฏิบัติจะพยายามตอบคำถาม เช่น "ภาพนี้วาดกระต่ายหรือสิงโต" ในขณะที่ AI กำเนิดตอบสนองต่อข้อความเช่น "วาดสิงโตและกระต่ายให้ฉันนั่งข้างกัน"

บทความนี้จะแนะนำคุณเกี่ยวกับ generative AI และการใช้กับโมเดลยอดนิยม เช่น ChatGPT และ DALL-E นอกจากนี้ เราจะตรวจสอบขีดจำกัดของเทคโนโลยี รวมถึงเหตุใด "นิ้วที่มากเกินไป" จึงกลายเป็นตัวบ่งชี้ที่ชัดเจนของศิลปะที่สร้างขึ้นโดยเทียม

การเพิ่มขึ้นของ AI กำเนิด

เจเนอเรทีฟเอไอมีมานานหลายปีแล้ว อาจเป็นเพราะเอลิซาพัฒนาขึ้นที่เอ็มไอทีในปี 1966 โดยแชทบ็อตที่จำลองการพูดคุยกับนักบำบัด ระบบเอไอ . คุณเกือบจะเคยได้ยินเกี่ยวกับ ChatGPT ซึ่งเป็นแชทบอท AI แบบข้อความที่สร้างร้อยแก้วที่เหมือนมนุษย์อย่างน่าทึ่ง DALL-E และ Stable Diffusion ยังดึงความสนใจไปที่ความสามารถในการสร้างภาพที่สมจริงและไดนามิกโดยอิงจากข้อความ Nous nous référons souvent à ces systèmes et à d'autres comme eux in tant que modèles car ils representent une เบื้องต้น de simuler ou de modéliser ลักษณะบางอย่างของโลก sur la base d'un sous-ensemble (parfois très สำคัญ) d'informations เกี่ยวกับสิ่งนั้น.

ผลลัพธ์ของระบบเหล่านี้แปลกประหลาดมากจนหลายคนตั้งคำถามเชิงปรัชญาเกี่ยวกับธรรมชาติของจิตสำนึกและกังวลเกี่ยวกับผลกระทบทางเศรษฐกิจของ AI เชิงกำเนิดที่มีต่องานของมนุษย์ แต่ในขณะที่การสร้าง AI ทั้งหมดนี้เป็นข่าวใหญ่ แต่ก็มีเนื้อหาที่เกิดขึ้นใต้พื้นผิวน้อยกว่าที่บางคนคิด เราจะพูดถึงคำถามทั่วไปเหล่านี้ในอีกสักครู่ ก่อนอื่น เรามาดูว่ามีอะไรเกิดขึ้นบ้างภายใต้โมเดลอย่าง ChatGPT และ DALL-E

AI กำเนิดทำงานอย่างไร

เจเนอเรชันเอไอใช้การเรียนรู้ของเครื่องเพื่อประมวลผลข้อมูลภาพหรือข้อความจำนวนมหาศาล โดยส่วนใหญ่ดึงมาจากอินเทอร์เน็ต จากนั้นจึงพิจารณาว่าสิ่งใดมีแนวโน้มที่จะปรากฏใกล้กับสิ่งอื่นมากที่สุด งานส่วนใหญ่ของการเขียนโปรแกรม AI เชิงกำเนิดเกี่ยวข้องกับการสร้างอัลกอริทึมที่สามารถแยกแยะ "สิ่ง" ที่ผู้สร้าง AI สนใจ: คำและวลีในกรณีของแชทบอท เช่น ChatGPT หรือองค์ประกอบภาพสำหรับ DALL-E แต่โดยพื้นฐานแล้ว AI เชิงกำเนิดจะสร้างผลลัพธ์โดยการประเมินข้อมูลจำนวนมากที่ได้รับการฝึกฝน จากนั้นจึงตอบสนองต่อการแจ้งเตือนด้วยบางสิ่งที่อยู่ในขอบเขตของความน่าจะเป็นตามที่กำหนดโดยเนื้อหานั้น

การเติมข้อความอัตโนมัติเมื่อโทรศัพท์มือถือหรือ Gmail ของคุณแนะนำว่าคำหรือวลีที่เหลือที่คุณกำลังพิมพ์นั้นเป็นรูปแบบหนึ่งของ AI เชิงกำเนิดระดับต่ำ รุ่นต่างๆ เช่น ChatGPT และ DALL-E จะนำแนวคิดนี้ไปสู่ระดับที่สูงกว่ามาก

ฝึกฝนแบบจำลอง AI กำเนิด

กระบวนการที่แบบจำลองได้รับการพัฒนาเพื่อรองรับข้อมูลทั้งหมดนี้เรียกว่าการฝึกอบรม มีการใช้เทคนิคพื้นฐานบางอย่างที่นี่สำหรับโมเดลประเภทต่างๆ ChatGPT ใช้สิ่งที่เรียกว่าหม้อแปลง (นั่นคือสิ่งที่ T หมายถึง) Transformer หาความหมายจากสตริงข้อความยาวๆ เพื่อทำความเข้าใจว่าคำหรือองค์ประกอบทางความหมายต่างๆ เกี่ยวข้องกันอย่างไร จากนั้นจึงกำหนดความน่าจะเป็นที่คำเหล่านั้นจะเกิดขึ้นใกล้ๆ กัน Transformers เหล่านี้ทำงานโดยไม่มีใครดูแลบนข้อความภาษาธรรมชาติจำนวนมากในกระบวนการที่เรียกว่า pretraining (เช่น Pin ChatGPT) ก่อนที่จะถูกปรับแต่งโดยมนุษย์ที่โต้ตอบกับโมเดล

อีกเทคนิคหนึ่งที่ใช้ในการฝึกโมเดลคือสิ่งที่เรียกว่าเครือข่ายต่อต้านเชิงสร้างสรรค์หรือ GAN ในเทคนิคนี้ คุณมีอัลกอริธึมสองรายการที่แข่งขันกัน หนึ่งคือการสร้างข้อความหรือรูปภาพตามความน่าจะเป็นที่ได้มาจากชุดข้อมูลขนาดใหญ่ อีกอันคือ AI ที่เลือกปฏิบัติซึ่งได้รับการฝึกฝนโดยมนุษย์เพื่อประเมินว่าผลลัพธ์นั้นเป็นจริงหรือสร้างขึ้นโดย AI AI กำเนิดพยายามซ้ำแล้วซ้ำอีกเพื่อ "หลอก" AI ที่เลือกปฏิบัติ โดยปรับโดยอัตโนมัติเพื่อสนับสนุนผลลัพธ์ที่ประสบความสำเร็จ เมื่อ AI กำเนิด "ชนะ" การแข่งขันนี้อย่างสม่ำเสมอ มนุษย์จะปรับแต่ง AI ที่เลือกปฏิบัติและกระบวนการจะเริ่มต้นใหม่ทั้งหมดอีกครั้ง

สิ่งที่สำคัญที่สุดประการหนึ่งที่ต้องจำไว้ในที่นี้คือ แม้ว่าจะมีการแทรกแซงของมนุษย์ในกระบวนการฝึกอบรม แต่การเรียนรู้และการปรับตัวส่วนใหญ่จะเกิดขึ้นโดยอัตโนมัติ ต้องใช้การทำซ้ำหลายครั้งเพื่อให้โมเดลถึงจุดที่สร้างผลลัพธ์ที่น่าสนใจซึ่งระบบอัตโนมัติเป็นสิ่งจำเป็น กระบวนการนี้ค่อนข้างเข้มข้นในการคำนวณ

AI กำเนิดตอบสนองหรือไม่

คณิตศาสตร์และการเข้ารหัสที่ใช้ในการสร้างและฝึกแบบจำลอง AI เชิงกำเนิดนั้นค่อนข้างซับซ้อนและอยู่นอกเหนือขอบเขตของบทความนี้ แต่ถ้าคุณโต้ตอบกับโมเดลที่เป็นผลลัพธ์สุดท้ายของกระบวนการนี้ ประสบการณ์นั้นอาจดูแปลกไปเลย คุณสามารถขอให้ DALL-E ผลิตสิ่งของที่ดูเหมือนงานศิลปะจริงๆ คุณสามารถสนทนากับ ChatGPT ที่ดูเหมือนการสนทนากับมนุษย์คนอื่น นักวิจัยได้สร้างเครื่องคิดจริงหรือ?

Chris Phipps อดีตผู้จัดการฝ่ายประมวลผลภาษาธรรมชาติของ IBM ซึ่งทำงานเกี่ยวกับผลิตภัณฑ์ AI ของ Watson กล่าวว่าไม่ เขาอธิบายว่า ChatGPT เป็น "เครื่องคาดการณ์ที่ดีมาก"

มันดีมากในการทำนายสิ่งที่มนุษย์จะพบสอดคล้องกัน ไม่สอดคล้องกันเสมอไป (ส่วนใหญ่เป็น) แต่นั่นไม่ใช่เพราะ ChatGPT "เข้าใจ" ตรงกันข้าม: มนุษย์ที่บริโภคผลลัพธ์นั้นเก่งมากในการตั้งสมมติฐานโดยนัยใด ๆ ก็ตามที่เราต้องการเพื่อให้เข้าใจถึงผลลัพธ์

Phipps ซึ่งเป็นนักแสดงตลกเหมือนกัน ได้ทำการเปรียบเทียบกับเกมอิมโพรฟทั่วไปที่เรียกว่า Mind Meld

คนสองคนคิดคำแล้วพูดออกมาดัง ๆ พร้อมกัน คุณสามารถพูดว่า "boot" ส่วนฉันพูดว่า "tree" เราพบคำเหล่านี้โดยอิสระอย่างสมบูรณ์และในตอนแรกคำเหล่านี้ไม่มีอะไรเกี่ยวข้องกัน ผู้เข้าร่วมสองคนถัดไปใช้สองคำนี้และพยายามหาสิ่งที่พวกเขามีเหมือนกันและพูดออกมาดัง ๆ พร้อมกัน เกมจะดำเนินต่อไปจนกว่าผู้เข้าร่วมสองคนจะพูดคำเดียวกัน อาจมีคนสองคนพูดว่า "คนตัดไม้" ฟังดูเหมือนเวทมนตร์ แต่จริงๆ แล้ว เราใช้สมองของมนุษย์ในการให้เหตุผลเกี่ยวกับอินพุต ("บูต" และ "ทรี") และค้นหาการเชื่อมต่อ เราทำงานด้วยความเข้าใจ ไม่ใช่เครื่องจักร มีอะไรเกิดขึ้นกับ ChatGPT และ DALL-E มากกว่าที่ผู้คนยอมรับ ChatGPT สามารถเขียนเรื่องราวได้ แต่มนุษย์เราทำงานอย่างหนักเพื่อทำความเข้าใจ

การทดสอบขีดจำกัดของปัญญาคอมพิวเตอร์

คำแนะนำเล็กๆ น้อยๆ ที่เราสามารถให้โมเดล AI เหล่านี้ได้จะทำให้ประเด็นของ Phipps ค่อนข้างชัดเจน ตัวอย่างเช่น พิจารณาปริศนาที่ว่า "อะไรหนักกว่ากัน ตะกั่ว XNUMX ปอนด์ หรือ ขนนก XNUMX ปอนด์" แน่นอน คำตอบคือพวกมันหนักเท่ากัน (หนึ่งปอนด์) แม้ว่าสัญชาตญาณหรือสามัญสำนึกของเราจะบอกเราว่าขนนกนั้นเบากว่าก็ตาม

ChatGPT จะตอบปริศนานี้ได้อย่างถูกต้อง และคุณสามารถเดาได้เพราะมันเป็นคอมพิวเตอร์ที่มีตรรกะเย็นชาที่ไม่มี "สามัญสำนึก" ในการไขปริศนา แต่นั่นไม่ใช่สิ่งที่เกิดขึ้นภายใต้ประทุน ChatGPT ไม่ให้เหตุผลในการตอบสนองอย่างมีเหตุผล มันเพียงแค่สร้างผลลัพธ์ตามการคาดการณ์ของคุณเกี่ยวกับสิ่งที่ควรตามหลังคำถามเกี่ยวกับขนนก XNUMX ปอนด์และตะกั่ว XNUMX ปอนด์ เนื่องจากชุดการฝึกของคุณมีข้อความอธิบายปริศนาจำนวนมาก จึงสร้างเวอร์ชันของคำตอบที่ถูกต้อง แต่ถ้าคุณถาม ChatGPT ว่าขนนก XNUMX ปอนด์หนักกว่าตะกั่ว XNUMX ปอนด์ ระบบจะบอกคุณอย่างมั่นใจว่าน้ำหนักเท่ากัน เพราะนั่นยังคงเป็นผลลัพธ์ที่เป็นไปได้มากที่สุดของคำแนะนำเกี่ยวกับขนนกและตะกั่ว ทั้งนี้ขึ้นอยู่กับชุดการฝึกของคุณ . . เป็นเรื่องสนุกที่จะบอก AI ว่ามันผิดและดูมันส่ายไปมาในการตอบสนอง ฉันขอให้เขาขอโทษสำหรับความผิดพลาดของเขาแล้วแนะนำว่าขนนกสองปอนด์หนักสี่เท่าของตะกั่วหนึ่งปอนด์