OpenAI ซึ่งเป็นการเริ่มต้นการวิจัย AI ได้ประกาศ (เปิดในแท็บใหม่) DALL E 2 การอัปเดตตัวสร้างข้อความเป็นรูปภาพที่ดูเหมือนเป็นก้าวที่ยิ่งใหญ่
โดยพื้นฐานแล้ว DALL·E 2 สามารถสร้างงานศิลปะจากการป้อนข้อมูลด้วยภาษาธรรมชาติ เช่น: "ภาพวาดสุนัขจิ้งจอกนั่งอยู่ในทุ่งยามรุ่งสางในสไตล์ของ Claude Monet" OpenAI กล่าวว่าเป้าหมายคือการสร้าง "ภาพและงานศิลปะต้นฉบับที่เหมือนจริง" ที่สามารถ "ผสมผสานแนวคิด คุณลักษณะ และสไตล์"
นั่นเป็นผลงานที่น่าประทับใจอย่างแท้จริงสำหรับบริษัทที่ริเริ่มโครงการ AI หลายอย่าง รวมถึง GPT-3 (เปิดในแท็บใหม่) ซึ่งสามารถสร้างงานวรรณกรรมที่น่าทึ่งได้
(เครดิตรูปภาพ: OpenAI)เอกสารการวิจัยของ OpenAI ที่ให้มานั้นมีรายละเอียดมากขึ้นเกี่ยวกับวิธีการทำงานของ DALL E 2 DALL E 2 ใช้แบบจำลอง CLIP ที่ตัดกันในสองขั้นตอน: ขั้นตอนแรกสร้างรูปภาพ CLIP แบบฝังพร้อมคำอธิบายข้อความ และขั้นตอนที่สองสร้างรูปภาพตาม มัน.
ผลลัพธ์นั้นน่าประทับใจมากและอาจมีการแตกสาขาอย่างใหญ่หลวงสำหรับอุตสาหกรรมศิลปะและการออกแบบกราฟิก โดยเฉพาะสตูดิโอวิดีโอเกม ซึ่งปัจจุบันจ้างนักออกแบบเพื่อสร้างโลกและแนวคิดอย่างอุตสาหะ
DALL·E 2 ต่อยอดจากงานของ OpenAI กับ DALL·E 1 ซึ่งได้รับการประกาศ (เปิดในแท็บใหม่) ในเดือนมกราคม 2021 ชื่อนี้เป็นการผสมผสานระหว่าง Salvador Dalí และ WALL·E
โลกใหม่ที่กล้าหาญ
OpenAI เป็นหนึ่งในสตาร์ทอัพที่น่าตื่นเต้นที่สุดที่ทำงานเกี่ยวกับ AI ในขณะนี้
ก่อตั้งขึ้นในปี 2015 โดย Elon Musk, Sam Altman, Ilya Sutskever และคนอื่นๆ โดยมีเป้าหมายเพื่อผลิต "AI ที่เป็นมิตร" ซึ่งเป็นประโยชน์ต่อมนุษยชาติโดยรวม การเริ่มต้นที่ไม่แสวงหาผลกำไรแข่งขันกับ DeepMind ของ Alphabet
DALL·E 2 เป็นตัวอย่างที่ดีมากของงานนี้ในทางปฏิบัติ ซึ่งผลักดันขีดจำกัดของสิ่งที่เป็นไปได้ในการสร้างภาพโดยใช้ AI บริการยังสามารถแก้ไขภาพที่มีอยู่ตามข้อกำหนดของผู้ใช้
แน่นอนว่าหนทางยังอีกยาวไกล นักวิจัยตั้งข้อสังเกตว่าฐาน CLIP ของพวกเขาสามารถถูกหลอกให้ติดฉลากองค์ประกอบหนึ่งเป็นอีกองค์ประกอบหนึ่งได้อย่างง่ายดาย แต่เมื่อเวลาผ่านไป ข้อบกพร่องเหล่านี้จะได้รับการแก้ไขและปรับปรุง
OpenAI วางแผนที่จะเปิดตัว DALL·E 2 ในไม่ช้าเพื่อเลือกนักวิจัย