โมเดล DALL.E ใหม่ของ OpenAI เปลี่ยนคำพูดของคุณให้เป็นงานศิลปะ

OpenAI ซึ่งเป็นการเริ่มต้นการวิจัย AI ได้ประกาศ (เปิดในแท็บใหม่) DALL E 2 การอัปเดตตัวสร้างข้อความเป็นรูปภาพที่ดูเหมือนเป็นก้าวที่ยิ่งใหญ่

โดยพื้นฐานแล้ว DALL·E 2 สามารถสร้างงานศิลปะจากการป้อนข้อมูลด้วยภาษาธรรมชาติ เช่น: "ภาพวาดสุนัขจิ้งจอกนั่งอยู่ในทุ่งยามรุ่งสางในสไตล์ของ Claude Monet" OpenAI กล่าวว่าเป้าหมายคือการสร้าง "ภาพและงานศิลปะต้นฉบับที่เหมือนจริง" ที่สามารถ "ผสมผสานแนวคิด คุณลักษณะ และสไตล์"

นั่นเป็นผลงานที่น่าประทับใจอย่างแท้จริงสำหรับบริษัทที่ริเริ่มโครงการ AI หลายอย่าง รวมถึง GPT-3 (เปิดในแท็บใหม่) ซึ่งสามารถสร้างงานวรรณกรรมที่น่าทึ่งได้

เปิด AI

(เครดิตรูปภาพ: OpenAI)

เอกสารการวิจัยของ OpenAI ที่ให้มานั้นมีรายละเอียดมากขึ้นเกี่ยวกับวิธีการทำงานของ DALL E 2 DALL E 2 ใช้แบบจำลอง CLIP ที่ตัดกันในสองขั้นตอน: ขั้นตอนแรกสร้างรูปภาพ CLIP แบบฝังพร้อมคำอธิบายข้อความ และขั้นตอนที่สองสร้างรูปภาพตาม มัน.

ผลลัพธ์นั้นน่าประทับใจมากและอาจมีการแตกสาขาอย่างใหญ่หลวงสำหรับอุตสาหกรรมศิลปะและการออกแบบกราฟิก โดยเฉพาะสตูดิโอวิดีโอเกม ซึ่งปัจจุบันจ้างนักออกแบบเพื่อสร้างโลกและแนวคิดอย่างอุตสาหะ

DALL·E 2 ต่อยอดจากงานของ OpenAI กับ DALL·E 1 ซึ่งได้รับการประกาศ (เปิดในแท็บใหม่) ในเดือนมกราคม 2021 ชื่อนี้เป็นการผสมผสานระหว่าง Salvador Dalí และ WALL·E

โลกใหม่ที่กล้าหาญ

OpenAI เป็นหนึ่งในสตาร์ทอัพที่น่าตื่นเต้นที่สุดที่ทำงานเกี่ยวกับ AI ในขณะนี้

ก่อตั้งขึ้นในปี 2015 โดย Elon Musk, Sam Altman, Ilya Sutskever และคนอื่นๆ โดยมีเป้าหมายเพื่อผลิต "AI ที่เป็นมิตร" ซึ่งเป็นประโยชน์ต่อมนุษยชาติโดยรวม การเริ่มต้นที่ไม่แสวงหาผลกำไรแข่งขันกับ DeepMind ของ Alphabet

DALL·E 2 เป็นตัวอย่างที่ดีมากของงานนี้ในทางปฏิบัติ ซึ่งผลักดันขีดจำกัดของสิ่งที่เป็นไปได้ในการสร้างภาพโดยใช้ AI บริการยังสามารถแก้ไขภาพที่มีอยู่ตามข้อกำหนดของผู้ใช้

แน่นอนว่าหนทางยังอีกยาวไกล นักวิจัยตั้งข้อสังเกตว่าฐาน CLIP ของพวกเขาสามารถถูกหลอกให้ติดฉลากองค์ประกอบหนึ่งเป็นอีกองค์ประกอบหนึ่งได้อย่างง่ายดาย แต่เมื่อเวลาผ่านไป ข้อบกพร่องเหล่านี้จะได้รับการแก้ไขและปรับปรุง

OpenAI วางแผนที่จะเปิดตัว DALL·E 2 ในไม่ช้าเพื่อเลือกนักวิจัย