การเปรียบเทียบที่ครอบคลุมที่สุด: AI กำเนิดใดที่ดีที่สุด คอลเลกชันขนาดใหญ่ของข้อดีและข้อเสียของเครื่องมือสร้างภาพสามอันดับแรก คุณจะเข้าใจหลังจากอ่าน

ข้อความ: Tri Editor: VickyXiao

แหล่งที่มาของรูปภาพ: สร้างโดยเครื่องมือ Unbounded AI

คำหลักที่ร้อนแรงที่สุดในปี 2023 น่าจะเป็น AI

ตั้งแต่ ChatGPT ซึ่งถือกำเนิดขึ้นอย่างไม่คาดฝัน ไปจนถึง Midjourney ซึ่งเป็นที่นิยมทั่วอินเทอร์เน็ต และจากนั้นไปจนถึงการต่อสู้ระยะประชิดขนาดใหญ่ของ AI ทั่วโลก ในเวลาไม่ถึงหนึ่งปี AIGC ยังคงระเบิดอย่างต่อเนื่อง สร้างความปั่นป่วนไปทั่วโลก

ไม่ว่าในประเทศหรือต่างประเทศ ดูเหมือนว่าทุกคนจะค้นพบตั๋วสู่ "โลกใหม่" ไม่ว่าจะเป็นในการวิจัยและพัฒนา AI หรือในธุรกิจ + AI อาจกล่าวได้ว่า AI ได้กลายเป็นสิ่งที่แน่นอนที่สุดในปัจจุบัน ซึ่งนำสาธารณชนไปสู่ยุค AIGC ถัดไปและตระหนักถึงการก้าวกระโดดด้านการผลิตแบบใหม่ มีเครื่องมือที่เกี่ยวข้องกับ AI มากมายทั้งในและต่างประเทศ แต่ทั้งหมดนั้นต่อยอดมาจากอัลกอริทึมกระแสหลักทั้งสาม ได้แก่ Midjourney (MJ), Stable Diffusion (SD) และ DALL-E DALL-E ได้รับการอัปเกรดเป็น DALL-E2

วันนี้เราจะมาดูกันว่า ข้อดี ข้อเสีย และความแตกต่างของอัลกอริทึมกระแสหลักทั้งสามนี้มีอะไรบ้าง

แนะนำเบื้องหลังของ "สตรีมยอดนิยม" สามรายการ

Midjourney เป็นซอฟต์แวร์ที่ติดตั้งบนแพลตฟอร์ม Discord ในปัจจุบัน ได้รับการพัฒนาโดยสตูดิโอในสหรัฐอเมริกาและเปิดตัวในเดือนมีนาคม 2022 ในเวลาเพียงหนึ่งปี MJ ได้อัปเดตและทำซ้ำเป็นเวอร์ชัน V5 และกลายเป็นที่นิยมอย่างรวดเร็วในด้านศิลปะ แผนที่ที่สร้างขึ้นของการระเบิดเหล่านี้บนโซเชียลเน็ตเวิร์กล้วนสร้างโดย MJ ด้วยคุณภาพการเรนเดอร์ที่น่าทึ่งและรูปแบบการค้าที่สมบูรณ์แบบ จึงประสบความสำเร็จในการดึงดูดผู้ใช้ที่จ่ายเงินเป็นจำนวนมากและมีรายได้ต่อปีถึง 100 ล้านดอลลาร์สหรัฐ

Stable Diffusion ได้รับการพัฒนาโดยบริษัทสตาร์ทอัพสัญชาติอังกฤษ Stability AI โดยความร่วมมือกับนักวิจัยทางวิชาการและองค์กรไม่แสวงหาผลกำไรหลายแห่ง ใช้งานได้ฟรี ซอร์สโค้ดและโมเดล SD ปัจจุบันเป็นแบบโอเพ่นซอร์สและสามารถใช้ได้ในเครื่องบน Mac, PC หรือแม้แต่อุปกรณ์พกพา การปรับใช้ (ต้องมีการกำหนดค่าอุปกรณ์ที่ค่อนข้างสูง) คุณสามารถทำโมเดล DIY เครื่องมือซอฟต์แวร์มากมายทั้งในและต่างประเทศซึ่งส่วนใหญ่ได้รับการพัฒนาโดยใช้ SD เป็นตรรกะพื้นฐานและความสามารถในการควบคุมและการแสดงผลก็แข็งแกร่งเช่นกัน และตอนนี้นักออกแบบหลายคนใช้มันเพื่อทำงานเสริมบางอย่าง

DALL-E 2 ได้รับการพัฒนาและเปิดตัวโดยทีมงาน OpenAI ซึ่งแตกต่างจาก Midjourney ตรงที่ภาพที่สร้างขึ้นภายใต้คำแนะนำง่ายๆ โดยทั่วไป มักจะมีความสมจริง DALL-E 2 เป็นภาพที่ดีที่สุดจากสามภาพในแง่ของภาพที่สมจริงและข้อความแจ้งที่กระชับ

ความสามารถในการแสดงออก

มาดูความสามารถในการแสดงออกของพวกเขาด้วยกัน ภายใต้คำอธิบาย คีย์เวิร์ดเดียวกัน ฟีดแบ็กเกี่ยวกับรูปภาพของพวกเขาเป็นอย่างไร?

DALL·E 2 (ซ้าย), Midjourney (กลาง) และ Stable Diffusion (ขวา)

DALL·E 2 (ซ้าย), Midjourney (กลาง) และ Stable Diffusion (ขวา)

DALL·E 2 (ซ้าย), Midjourney (กลาง) และ Stable Diffusion (ขวา)

จากการเปรียบเทียบในรูปด้านบน เราจะเห็นว่า DALL-E 2 สามารถจัดการกับภาพธรรมชาติและผู้คนได้เป็นอย่างดี ในปัจจุบัน การใช้ API ของ DALL-E 2 สามารถรับรู้วิธีการโต้ตอบกับภาพได้สามวิธี: ไปที่ข้อความแจ้ง สร้างรูปภาพตั้งแต่เริ่มต้น สร้างการแก้ไขรูปภาพที่มีอยู่ตามข้อความแจ้งใหม่ สร้างรูปแบบต่างๆ ของรูปภาพที่มีอยู่

Midjourney มีสีสันที่หลากหลายและกราฟิกที่สมจริงในความพยายามทั้งหมด สามารถสร้างภาพตามคำแนะนำของผู้ใช้ Midjourney นั้นเก่งในการปรับสไตล์ศิลปะที่แท้จริงเพื่อสร้างภาพที่มีเอฟเฟกต์ต่างๆ ที่ผู้ใช้ต้องการ มันเก่งเรื่องเอฟเฟกต์สิ่งแวดล้อม โดยเฉพาะฉากแฟนตาซีและไซไฟที่ดูเหมือนศิลปะในเกม

และ Stable Diffusion เป็นโมเดลโอเพ่นซอร์สที่ทุกคนสามารถใช้ได้ มีความเข้าใจเกี่ยวกับภาพศิลปะร่วมสมัยค่อนข้างดี และสามารถสร้างงานศิลปะที่เต็มไปด้วยรายละเอียด มันเป็นเรื่องยากสำหรับผู้ใช้ทั่วไปที่จะใช้ ในปัจจุบัน การสนทนาที่เป็นที่นิยมมากที่สุดในหมู่ทุกคนคือ SD หรือ MJ ใครดีกว่ากัน ดังนั้นเราจึงทดสอบภาพบางภาพ

Midjourney (ซ้าย) และ Stable Diffusion (ขวา)

Midjourney (ซ้าย) และ Stable Diffusion (ขวา)

จากรายละเอียดของการสร้างภาพตัวการ์ตูน SD ดีกว่า การสร้างคีย์เวิร์ดเดียวกันทำให้ลักษณะใบหน้าที่สร้างโดย SD ดูมีมิติและสวยงามมากขึ้น และ Midjourney จะดูเป็นศิลปะมากขึ้น

Midjourney (ซ้าย) และ Stable Diffusion (ขวา)

เมื่อสร้างภาพสไตล์ภาพประกอบที่เหมือนจริง ทั้งสองอย่างจะมีประสิทธิภาพเท่าๆ กัน ข้อได้เปรียบที่ใหญ่ที่สุดของ SD คือผู้ใช้สามารถรีมิกซ์ผ่านการฝังโมเดล LoRA หรือเครือข่าย ซึ่งสามารถสร้างเอฟเฟกต์ที่ไม่คาดคิดได้

Midjourney (ซ้าย) และ Stable Diffusion (ขวา)

ปัจจุบัน Stable Diffusion มีโมเดลกว่าพันแบบให้ดาวน์โหลด แต่ละโมเดลสามารถแก้ไขเพิ่มเติมได้โดยใช้โมเดล LoRA, โมเดลการฝัง และไฮเปอร์เน็ตเวิร์ก Midjourney นั้นถูกจำกัดในแง่ของโมเดล มีเฉพาะรุ่น v1 ถึง v5 เท่านั้น และรุ่นพิเศษบางรุ่น เช่น niji, test, testp และ HD มีพารามิเตอร์เพิ่มเติมสำหรับ "สไตล์" ของรูปภาพ แต่โดยรวมก็ยังอ่อนเมื่อเทียบกับ Stable Diffusion

คำแนะนำสำหรับผู้ใช้

อันที่จริง เครื่องกำเนิดภาพ AI เหล่านี้มีข้อดีในตัวเอง จากประสบการณ์ของอัลกอริทึมทั้งสามนี้ เราได้สรุปประเด็นสำคัญและความแตกต่างบางประการ คุณสามารถกำหนดตัวเลือกเฉพาะได้ตามความต้องการของคุณเอง

1、DALL-E2

อินเทอร์เฟซของโมเดลนี้เรียบง่ายและเข้าใจง่าย และคุณสามารถสร้างรูปภาพได้อย่างง่ายดายโดยไม่ต้องลงทะเบียนแพลตฟอร์มของบุคคลที่สาม คุณเพียงแค่ไปที่เว็บไซต์และป้อนข้อความคำหลักของคุณลงในช่องสร้างเพื่อสร้างรูปภาพ

ข้อได้เปรียบ:

ล. ใช้งานง่าย

l ความคิดสร้างสรรค์ที่มีความยืดหยุ่น

l ไม่จำเป็นต้องใช้แพลตฟอร์มของบุคคลที่สาม

ข้อบกพร่อง:

l ภาพที่เรียบง่าย

l ความแม่นยำไม่สูง

l สามารถสร้างภาพสี่เหลี่ยมจัตุรัสเท่านั้น

2、กลางทาง

คุณต้องสร้างบัญชี Discord ก่อน ซึ่งแตกต่างจาก DALL-E 2 และคุณต้องป้อนคำสั่ง เช่น ข้อความหรือรูปภาพเพื่อสร้างรูปภาพ

ข้อได้เปรียบ:

l ภาพคุณภาพสูง

l ผู้ใช้สามารถปรับแต่งอัตราส่วนขนาดภาพได้

l การควบคุมพารามิเตอร์ภาพที่ยืดหยุ่น

ข้อบกพร่อง:

l มีความซับซ้อนมากขึ้นในการใช้

l กำหนดให้ผู้ใช้ลงทะเบียนใน Discord

l หลังจากหมดเวลาอย่างรวดเร็ว เวลาในการสร้างภาพจะเพิ่มขึ้นอย่างมาก

3、การแพร่กระจายที่เสถียร

ทั้ง Stable Diffusion และ DALL·E-2 ขึ้นอยู่กับแบบจำลองการแพร่กระจาย ซึ่งสามารถวาดภาพตามคำอธิบายข้อความอินพุต () ในการผลิตภาพที่ยอดเยี่ยมบน Stable Diffusion ให้เสร็จสมบูรณ์นั้นต้องการโมเดลที่ถูกต้อง + คำพูดที่ถูกต้อง + การปรับพารามิเตอร์ + เทคโนโลยีหลังการประมวลผล

ข้อได้เปรียบ:

l การทำงานของเว็บและการติดตั้งโมเดลโอเพ่นซอร์สไปยังแพลตฟอร์มอื่น

l อิสระในการสร้างสรรค์มากขึ้น

l การควบคุมจำนวนมากสำหรับปรับแต่งพารามิเตอร์รูปภาพ

ข้อบกพร่อง:

l ต้องใช้อุปกรณ์ฮาร์ดแวร์ระดับมืออาชีพและมีประสิทธิภาพ

l คุณภาพของภาพไม่เสถียรมาก ขึ้นอยู่กับเวอร์ชันที่คุณใช้

l ความยากในการเรียนรู้สูงยากสำหรับผู้ใช้ทั่วไปในการควบคุม

กล่าวโดยสรุป หากคุณมีผลลัพธ์เป้าหมายที่ชัดเจน เช่น คุณเป็นนักออกแบบสถาปัตยกรรม Stable Diffusion จะตอบสนองความต้องการในการสร้างสรรค์ของคุณได้ดีกว่า เนื่องจากสามารถควบคุมได้มากกว่า และหากคุณไม่มีเป้าหมายในการควบคุมความคิดสร้างสรรค์ที่ชัดเจนและต้องการทำงานสร้างสรรค์บางอย่างด้วยการคิดที่แตกต่าง ความสะดวกสบายและเกณฑ์ขั้นต่ำของ Midjourney และ DALL-E 2 จะเป็นตัวเลือกที่ดีที่สุดของคุณ

เครื่องมือ AI ใดที่คุณต้องการใช้ นำไปใช้ในชีวิตการทำงานอย่างไร? ยินดีที่จะแบ่งปันกับเราในความคิดเห็น!

ดูต้นฉบับ
เนื้อหานี้มีสำหรับการอ้างอิงเท่านั้น ไม่ใช่การชักชวนหรือข้อเสนอ ไม่มีคำแนะนำด้านการลงทุน ภาษี หรือกฎหมาย ดูข้อจำกัดความรับผิดชอบสำหรับการเปิดเผยความเสี่ยงเพิ่มเติม
  • รางวัล
  • แสดงความคิดเห็น
  • แชร์
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น
  • ปักหมุด