สามวิธีในการสร้างงานศิลปะ AI โดยใช้ Intel® Arc™ GPU

โดย Intel Gaming |

AI เจนเนอเรชั่นทำงานอยู่ภายใน GIMP ทางด้านซ้าย1ภายใน A1111 webui ที่อยู่ตรงกลาง2และ SD.Next webui ทางด้านขวา3.

ศิลปะ Generative AI กำลังได้รับความนิยม โดยเฉพาะอย่างยิ่งเมื่อเครื่องมือต่างๆ ช่วยให้สามารถควบคุม การวนซ้ำ และชุดข้อมูลที่กำหนดเองได้มากขึ้น ศิลปินและนักสร้างสรรค์ต่างแสวงหาการควบคุมในท้องถิ่น โดยที่พวกเขาสามารถปรับแต่งงานของตนได้อย่างละเอียด และใช้ประโยชน์จากฮาร์ดแวร์ในพื้นที่ของตนเอง สิ่งนี้ทำให้หลายคนสงสัยว่าระบบของฉันทำงานได้หรือยัง: เมื่อพูดถึงฮาร์ดแวร์ Intel รุ่นล่าสุด คำตอบที่แน่นอนคือใช่ (ดูบทความเรื่อง ปรับการกระจายให้เสถียรสำหรับ Intel Silicon โดยทอมส์ฮาร์ดแวร์)

ด้านล่างนี้คือโซลูชันใหม่สามประการสำหรับการสร้างงานศิลปะ AI แบบกระจายการแพร่กระจายที่เสถียรโดยใช้ Intel Arc GPU บนแล็ปท็อป Windows หรือพีซี แม้ว่าสิ่งเหล่านี้จะไม่ใช่วิธีแก้ปัญหาเพียงอย่างเดียว แต่สิ่งเหล่านี้สามารถเข้าถึงได้และมีฟีเจอร์มากมาย โดยสามารถรองรับความสนใจตั้งแต่ผู้สนใจศิลปะด้าน AI ไปจนถึงนักรบรหัส AI ตามลิงก์ด้านล่างเพื่อเรียนรู้เพิ่มเติมและรับคำแนะนำในการติดตั้ง

โปรดทราบว่าใครก็ตามที่ดำดิ่งลงสู่พื้นที่ศิลปะ AI เจนเนอเรชั่นใหม่เป็นครั้งแรกควรชัดเจนว่าเป็นการทดลองระดับสูง และดำเนินการอย่างรวดเร็วด้วยเครื่องมือและวิธีการใหม่ๆ ที่พัฒนาอย่างต่อเนื่อง พื้นที่นี้อยู่ห่างไกลจากซอฟต์แวร์ที่มักกำหนดให้ผู้ใช้ติดตั้ง Python และ GIT ซึ่งการติดตั้งและอัปเดตซอฟต์แวร์อาจทำได้จากอินเทอร์เฟซบรรทัดคำสั่ง

ภายในโปรแกรมแก้ไขรูปภาพ

GIMP Image Editor พร้อมปลั๊กอิน OpenVINO 4

ปลั๊กอินทดลอง Intel OpenVINO GIMP:

หลายๆ คนอาจเคยเห็นวิดีโอที่ยอดเยี่ยมของ AI ที่ใช้ในการแก้ไขรูปภาพ ช่วยให้นักออกแบบสามารถร้อยเชือกส่วนหนึ่งของรูปภาพ อธิบายสิ่งที่ควรเติมเต็มในพื้นที่นั้น และได้ผลลัพธ์กลับมาแทบจะในทันที ความสามารถนี้ยังมีให้ใช้งานได้ผ่านโปรแกรมแก้ไขรูปภาพ GIMP ฟรี และสามารถทำงานบน Intel CPU, กราฟิกในตัว หรือ GPU แยก Intel Arc ผ่านทางปลั๊กอินทดลองที่พัฒนาโดยทีมงาน OpenVINO ที่ Intel

เมื่อติดตั้งแล้วผู้ใช้สามารถเลือกตัวเลือก OpenVINO จากเมนู Layer เพื่อให้สามารถเข้าถึงเครื่องมือ AI ที่สร้างได้หลากหลาย ด้วยการเพิ่มความสามารถ AI โดยตรงภายในโปรแกรมแก้ไขภาพ ศิลปินจะสามารถเข้าถึงการสร้าง AI ควบคู่ไปกับเครื่องมือที่คุ้นเคยและเทคนิคการแก้ไขภาพ

คุณสมบัติ:

  • การแพร่กระจายที่เสถียร 1.4 และ 1.5 ข้อความต่อรูปภาพ และการสร้างรูปภาพต่อรูปภาพ
  • รองรับพร้อมท์เชิงบวกและเชิงลบ
  • 512 สี่เหลี่ยมจัตุรัส, แนวตั้ง 512×768, รูปแบบแนวนอน 768×512
  • การแพร่กระจายในภาพวาดที่เสถียร (บ่วงพื้นที่ ใช้ข้อความเพื่ออธิบายวิธีการเติมพื้นที่นั้น)
  • สาขาทดลอง: การสนับสนุนในอนาคตสำหรับ ControlNet OpenPose

ประโยชน์:

  • ทำงานบนแล็ปท็อปหรือเดสก์ท็อป Windows
  • ทำงานควบคู่ไปกับชุดเครื่องมือและเวิร์กโฟลว์ที่คุ้นเคย เหมาะสำหรับนักออกแบบและศิลปิน
  • รองรับ CPU Intel, กราฟิกในตัว และ GPU รวมถึง Intel Arc GPU
  • ติดตั้งง่าย — แพ็คเกจและโมเดลทั้งหมดรวมอยู่ในตัวติดตั้งเดียว
  • ขับเคลื่อนโดย OpenVINO ดังนั้นโค้ดจึงได้รับการปรับให้เหมาะสมเพื่อมอบประสิทธิภาพที่ยอดเยี่ยมบนฮาร์ดแวร์เป้าหมาย
  • ทำงานในพื้นที่ ไม่จำเป็นต้องใช้เครือข่ายคลาวด์หรือบริการ
  • ทำงานภายในซอฟต์แวร์ฟรี ไม่จำเป็นต้องสมัครสมาชิก

คำแนะนำ: https://github.com/intel/openvino-ai-plugins-gimp

GIF แบบเคลื่อนไหวที่สาธิตคุณสมบัติในการวาดภาพจาก OpenVINOตม GIMP Experimental Plug-in ช่วยให้สามารถเติมส่วนของรูปภาพโดยใช้ข้อความแจ้ง ดูการอ้างอิงในตอนท้ายของบทความเพื่อดูลำดับที่รวดเร็ว

แอนิเมชันของแต่ละขั้นตอนของการวาดภาพภายในแอปพลิเคชัน GIMP5- ที่มา: Bob Duffy พนักงานของ Intel

การใช้ A1111 WebUI ใน Windows:

A1111 webui รันสคริปต์ 'เร่งความเร็วด้วย OpenVINO' ตั้งค่าให้ใช้ GPU แยกของระบบ และใช้โมเดล Virtual Vision 5.1 แบบกำหนดเอง สร้างอิมเมจของนักเล่นแร่แปรธาตุทางด้านขวา 6 ที่มา: Bob Duffy พนักงาน Intel

ดูตัวอย่าง OpenVINO WebUI

A1111 WebUI อาจเป็นเครื่องมือที่ได้รับความนิยมและได้รับการยกย่องอย่างกว้างขวางที่สุดสำหรับการรัน Stable Diffusion ทีม OpenVINO ได้จัดเตรียมเครื่องมือยอดนิยมนี้ โดยรองรับการใช้เฟรมเวิร์ก OpenVINO ซึ่งเป็นแพลตฟอร์มแบบเปิดสำหรับเพิ่มประสิทธิภาพการอนุมาน AI ให้ทำงานบนฮาร์ดแวร์ที่หลากหลาย รวมถึง CPU, GPU และ NPU ทางแยกนี้ช่วยให้เครื่องมือและระบบนิเวศที่ได้รับความนิยมอย่างกว้างขวางนี้สามารถทำงานบน Intel Arc GPU พร้อมคุณสมบัติและความสามารถทั้งหมดที่คุณคาดหวังจาก A1111 WebUI

เมื่อติดตั้งแล้ว สามารถเลือกสคริปต์ OpenVINO ได้ใน WebUI ซึ่งผู้ใช้สามารถเลือก CPU หรือ GPU ในระบบเพื่อสร้างภาพได้ การดำเนินการที่สร้างขึ้นครั้งแรกจะใช้เวลานานกว่าปกติ แต่เมื่อทำซ้ำครั้งต่อๆ ไป รวมถึงการรวมภาพหลายภาพเข้าด้วยกันจะทำงานตามที่คาดไว้ โซลูชันนี้เหมาะอย่างยิ่งสำหรับผู้ใช้ที่ต้องการการควบคุมและตัวเลือกที่มากขึ้น จึงไม่ต้องปรับการตั้งค่าต่างๆ ดาวน์โหลดรุ่นเฉพาะ และปรับการกำหนดค่าเพื่อให้ได้ผลลัพธ์ที่ต้องการ ในขณะเดียวกันก็ต้องการความสะดวกสบายในการคงระบบปฏิบัติการ Windows เอาไว้ ระบบ.

คุณสมบัติ:

  • ทำงานใน A1111 ซึ่งเป็น webui ที่ได้รับความนิยมอย่างมากสำหรับ Stable Diffusion
  • รองรับการสร้างภาพ AI โดยใช้ CPU, iGPU, dGPU หรือ NPU ของคุณ
  • โมเดล Diffusion 1.5 และ 2.1 ที่เสถียรสำหรับการสร้างข้อความต่อรูปภาพและรูปภาพต่อรูปภาพ
  • รองรับโมเดลแบบกำหนดเองยอดนิยม เช่น จุดตรวจจาก Civitai
  • การแพร่กระจายในภาพวาดที่เสถียร (ใช้ข้อความเพื่ออธิบายวิธีการเติมพื้นที่ของภาพ)
  • แท็บพิเศษสำหรับการขยายขนาดภาพ
  • รองรับการแจ้งเตือนเชิงบวกและเชิงลบพร้อมการถ่วงน้ำหนัก
  • รองรับการตั้งค่าความกว้างและความสูงที่หลากหลาย
    (หมายเหตุปัญหาด้านประสิทธิภาพที่พบในภาพที่มีความละเอียดสูงกว่าบางภาพ)
  • รองรับการสร้างภาพ SDXL High Res
  • รองรับคอนโทรลเน็ต
  • รองรับ LoRA และ VAE แบบกำหนดเอง

ประโยชน์:

  • ทำงานบนแล็ปท็อปหรือเดสก์ท็อป Windows
  • รองรับ Intel Arc GPU, Intel CPU และกราฟิกในตัว
  • ขับเคลื่อนโดย OpenVINO ดังนั้นโค้ดจึงได้รับการปรับให้เหมาะสมเพื่อมอบประสิทธิภาพที่ยอดเยี่ยมบนฮาร์ดแวร์เป้าหมาย
  • ทำงานในพื้นที่ ไม่จำเป็นต้องใช้เครือข่ายคลาวด์หรือบริการ
  • ทำงานภายในเบราว์เซอร์ ไม่จำเป็นต้องสมัครสมาชิกบริการ
  • ใช้ประโยชน์จากระบบนิเวศที่ใหญ่ขึ้นของโมเดลแบบกำหนดเองเพื่อกำหนดเป้าหมายผลลัพธ์ที่ต้องการได้ดียิ่งขึ้น

คำแนะนำ: https://github.com/openvinotoolkit/stable-diffusion-webui/wiki/Installation-on-Intel-Silicon

การเรนเดอร์ภาพลายเส้นของห้องครัวที่ออกแบบใน Revit* ใช้เพื่อสร้างการเรนเดอร์ AI Art เชิงสร้างสรรค์โดยใช้ฟีเจอร์ ControlNet Canny และ Line Art ใน A1111 เพื่อเป็นแนวทางในเอาท์พุต 7- ที่มา: Bob Duffy พนักงานของ Intel

การใช้ SDNEXT WebUI พร้อมรองรับ SDXL:

SD.Next WebUI ทำงานใน Linux ผ่าน Intel Extensions สำหรับ PyTorch (IPEX) แหล่งที่มาของรูปภาพ @Disty ผู้สนับสนุนชุมชนจาก Intel Insiders Discord8

PyTorch บน Windows หรือ Linux

SDNEXT เป็นเวอร์ชันของ A1111 สำหรับเวอร์ชันขั้นสูงของ Stable Diffusion พร้อมการรองรับ SDXL ส่วนนี้จะอธิบายเวอร์ชันที่มี Intel Extensions สำหรับ PyTorch (IPEX) ที่คุณใช้บน Windows หรือ Linux
โซลูชันนี้เหมาะสำหรับผู้ใช้ที่ต้องการฟีเจอร์ล่าสุดและดีที่สุดโดยไม่ต้องเสียเวลาคอมไพล์เพิ่มเติมเมื่อสลับระหว่างรุ่นต่างๆ

คุณสมบัติ:

  • รองรับ SDXL Diffusion ที่เสถียรสำหรับข้อความต่อรูปภาพและรูปภาพต่อการสร้างรูปภาพ
  • การสนับสนุนทันทีสำหรับโมเดลที่กำหนดเอง, LoRA และส่วนขยาย เช่น ControlNet
  • รองรับการแจ้งเตือนเชิงบวกและเชิงลบพร้อมการถ่วงน้ำหนัก
  • การตั้งค่าความกว้างและความสูงที่เปลี่ยนแปลงได้เกินกว่า 1024 x 1024
  • การลดขนาดภาพ
  • การแพร่กระจายในภาพวาดที่เสถียร (บ่วงพื้นที่ ใช้ข้อความเพื่ออธิบายวิธีการเติมพื้นที่นั้น)
  • รองรับรุ่น Fast LCM
  • รองรับ Windows และ Linux

ประโยชน์:

  • ใช้งาน Stable Diffusion เวอร์ชันที่ทันสมัยที่สุด
  • ทำงานในพื้นที่ ไม่จำเป็นต้องใช้เครือข่ายคลาวด์หรือบริการ
  • ทำงานภายในเบราว์เซอร์ ไม่จำเป็นต้องสมัครสมาชิกบริการ
  • เรียกใช้ตัวปรับแต่ง SDXL เพื่อเพิ่มคุณภาพของเอาต์พุตด้วยรูปภาพความละเอียดสูง
  • ใช้ประโยชน์จากระบบนิเวศที่ใหญ่ขึ้นของโมเดลแบบกำหนดเอง, คุณสมบัติ LoRA และ ControlNet เพื่อกำหนดเป้าหมายเอาต์พุตรูปภาพของคุณได้ดียิ่งขึ้น

คำแนะนำ: https://www.technopat.net/sosyal/konu/using-stable-diffusion-webui-with-intel-arc-gpus.2593077/

กระทู้ไม่ลงรอยกัน: https://discord.com/channels/554824368740630529/1127742927347666964/1127742927347666964

มากขึ้นที่จะมา

พื้นที่ศิลปะเจเนเรทีฟ AI กำลังดำเนินไปอย่างรวดเร็วอย่างแน่นอน ช่วยให้ผู้สร้างและศิลปินด้านเทคนิคสามารถตระหนักถึงขั้นตอนการทำงานใหม่สำหรับการแก้ไขและสร้างภาพ ทั้งสามวิธีนี้เป็นเพียงการทดลองเบื้องต้นของสิ่งที่เป็นไปได้บนฮาร์ดแวร์ไคลเอนต์ของ Intel เราคาดหวังว่าจะมีโซลูชันที่น่าตื่นเต้นกว่านี้รออยู่ข้างหน้า เนื่องจาก Intel กำลังจัดลำดับความสำคัญของเวิร์กโหลด AI ทั่วทั้งไคลเอนต์ Edge และคลาวด์ คอยติดตามข้อมูลเพิ่มเติมที่เกิดขึ้น และอย่าลังเลที่จะเชื่อมต่อกับชุมชนผู้ใช้ที่เชี่ยวชาญของเรา ความขัดแย้งภายใน หรือผ่านทางโซเชียลบน @IntelGraphics

ประกาศและข้อจำกัดความรับผิดชอบ

คุณสมบัติ AI อาจต้องมีการซื้อซอฟต์แวร์ การสมัครสมาชิก หรือการเปิดใช้งานโดยผู้ให้บริการซอฟต์แวร์หรือแพลตฟอร์ม หรืออาจมีข้อกำหนดการกำหนดค่าหรือความเข้ากันได้เฉพาะ รายละเอียดได้ที่ www.intel.com/PerformanceIndex- ผลลัพธ์อาจแตกต่างกันไป

การอ้างอิงรูปภาพ

  1. ปลั๊กอิน OpenVINO AI สำหรับ GIMP (2023, 8, 11). Pos Prompt: “ชายไซเบอร์พังก์อายุ 35 ปี ขี่มอเตอร์ไซค์ มีผมทรงทันสมัย มีหนวดเคราบางส่วน เมืองในพื้นหลังด้วยไฟนีออน Fujifilm, ภาพถ่ายสมจริง, ใบหน้าที่มีรายละเอียด, แสงที่น่าทึ่ง เลนส์ 50 มม.“, Neg Prompt: “การ์ตูน, ภาพประกอบ, การเรนเดอร์, ครอบตัด, สีเดียว, nsfw“ อินเทล https://github.com/intel/openvino-ai-plugins-gimp
  2. A1111 WebUI สำหรับการแพร่กระจายที่เสถียร (2023, 7, 11). Pos Prompt: “ชายไซเบอร์พังก์อายุ 35 ปี ขี่มอเตอร์ไซค์ มีผมทรงทันสมัย มีหนวดเคราบางส่วน เมืองในพื้นหลังด้วยไฟนีออน Fujifilm, ภาพถ่ายสมจริง, ใบหน้าที่มีรายละเอียด, แสงที่น่าทึ่ง เลนส์ 50 มม.”, Neg Prompt: “ การ์ตูน, ภาพประกอบ, การเรนเดอร์, ครอบตัด, สีเดียว, nsfw“ อินเทล https://github.com/openvinotoolkit/stable-diffusion-webui/wiki/Installation-on-Intel-Silicon
  3. WebUI ถัดไปสำหรับการแพร่กระจายที่เสถียร (2023, 8, 17). ตำแหน่งที่พร้อมท์: “ ชายไซเบอร์พังค์อายุ 35 ปี ขี่มอเตอร์ไซค์ มีผมทรงทันสมัย มีหนวดเคราบางส่วน เมืองในพื้นหลังด้วยไฟนีออน Fujifilm, ภาพถ่ายสมจริง, ใบหน้าที่มีรายละเอียด, แสงที่น่าทึ่ง เลนส์ 50 มม. “, Neg Prompt: “ การ์ตูน, ภาพประกอบ, การเรนเดอร์, ครอบตัด, สีเดียว, nsfw “ vladmatic: https://github.com/vladmandic/automatic
  4. ปลั๊กอิน OpenVINO AI สำหรับ GIMP (2023, 6, 8 ). Pos Prompt: “คอนเซ็ปต์อาร์ตของนักเล่นแร่แปรธาตุหญิง ในชุดคลุมสีม่วง ผมสลวย แฟนตาซี ลูกแก้วเวทมนตร์ สภาพแวดล้อมที่มีมนต์ขลัง DND มีรายละเอียดสูง” Neg Prompt: “การ์ตูน อนิเมะ เสียโฉม บิดเบี้ยว ภาพถ่าย” อินเทล https://github.com/intel/openvino-ai-plugins-gimp
  5. ปลั๊กอิน OpenVINO AI สำหรับ GIMP (2023, 6, 8 ). ข้อความแจ้ง: “ภาพถ่ายระยะใกล้ของชายมีเคราและทรงผมทันสมัย ภาพถ่ายสมจริง ผิวที่มีรายละเอียด Fujifilm 50 มม.” ในภาพวาด: 1 “เส้นขอบฟ้าของเมือง” 2 “ชุดซูเปอร์ฮีโร่” 3 “โกนเกลี้ยงเกลา” 4 “ตึกระฟ้า ”, 5 “ตึกระฟ้า”, 6 “ผมซูเปอร์ฮีโร่” Neg Prompt: “การ์ตูน อนิเมะ เสียโฉม บิดเบี้ยว” อินเทล https://github.com/intel/openvino-ai-plugins-gimp
  6. A1111 WebUI สำหรับการแพร่กระจายที่เสถียร (2023, 6,). Pos Prompt: “รูปถ่ายของหญิงสาวเวทมนตร์ที่สวยงาม ผมสีม่วงสลวย แต่งตัวเป็นนักเล่นแร่แปรธาตุ สวมเสื้อคลุมตกแต่ง รายละเอียดสูง เวทมนตร์ กลางคืน หมอก ลูกแก้วแห่งแสง ผิวละเอียด” Neg Prompt: “การ์ตูน ภาพประกอบ จิตรกรรม, nsfw, ไวน์“ . อินเทล https://github.com/openvinotoolkit/stable-diffusion-webui/wiki/Installation-on-Intel-Silicon
  7. A1111 WebUI สำหรับการแพร่กระจายที่เสถียร (2023, 6,). Pos Prompt: “ภาพถ่ายที่ได้รับรางวัลของห้องครัวทันสมัยหรูหรา รายละเอียดสูง ภาพสมจริง Fujifilm 50 มม.“ Neg Prompt: “ การ์ตูน ภาพประกอบ ภาพวาด “ ด้วย ControlNet – LineArt, Batch=4  https://github.com/openvinotoolkit/stable-diffusion-webui/wiki/Installation-on-Intel-Silicon
  8. WebUI ถัดไปสำหรับการแพร่กระจายที่เสถียร (2023, 6,). Pos Prompt: “รูปถ่ายของหญิงสาวเวทมนตร์ที่สวยงาม ผมสีม่วงสลวย แต่งตัวเป็นนักเล่นแร่แปรธาตุ สวมเสื้อคลุมตกแต่ง รายละเอียดสูง เวทมนตร์ กลางคืน หมอก ลูกแก้วแห่งแสง ผิวละเอียด” Neg Prompt: “NSFW (แย่ที่สุด คุณภาพ), คุณภาพต่ำ: 1;4, lowres, พร่ามัว),(ซอมบี้, การ์ตูน, ภาพร่าง), (นิ้วประสานกัน, คอยาว, เด็กผู้หญิง 2 คน)“ vladmatic: https://github.com/vladmandic/automatic