AI امیج جنریٹرز ہاتھوں سے کیوں جدوجہد کرتے ہیں۔

AI امیج جنریٹرز ہاتھوں سے کیوں جدوجہد کرتے ہیں۔
آپ جیسے قارئین MUO کو سپورٹ کرنے میں مدد کرتے ہیں۔ جب آپ ہماری سائٹ پر لنکس کا استعمال کرتے ہوئے خریداری کرتے ہیں، تو ہم ملحق کمیشن حاصل کر سکتے ہیں۔ مزید پڑھ.

AI جنریٹر ہماری آنکھوں کے سامنے خوفناک رفتار سے تیار ہوتے ہیں، لیکن ان میں اب بھی خامیاں ہیں۔ AI امیجز میں عجیب و غریب تفصیلات کا پتہ لگانا دراصل کافی مضحکہ خیز ہے۔ یہی وجہ ہے کہ مڈجرنی ہینڈز ایک گرما گرم موضوع بن گئے، یہ مسئلہ بہت سے انجنوں میں عام ہے۔





آئیے اس بات کو توڑتے ہیں کہ ہاتھ AI امیج جنریٹرز کو اتنا چیلنج کیوں کرتے ہیں۔ ان کے پروگرامرز پہلے ہی اس میم کے قابل مسئلہ کو ٹھیک کر رہے ہیں، لیکن یہ سوچنا دلچسپ ہے کہ مصنوعی ذہانت کیسے سیکھتی ہے، اس بات کا ذکر نہیں کرنا کہ اس کے راستے میں کیا آتا ہے۔





دن کی ویڈیو کا میک یوز مواد کے ساتھ جاری رکھنے کے لیے اسکرول کریں۔

AI سے تیار کردہ ہاتھوں نے کیوں ہلچل مچا دی۔

تصاویر بنانے کے لیے AI انجنوں کا استعمال کرنے والے کسی بھی شخص نے محسوس کیا ہوگا کہ ہاتھ شاذ و نادر ہی صحیح طریقے سے باہر نکلتے ہیں، لیکن یہ مسئلہ اس وقت بدل گیا جب ٹوئٹر پر 'تصاویر' کا ایک گروپ نمودار ہوا۔





سمارٹ آئینہ بنانے کا طریقہ

قریب سے معائنہ کرنے پر، لوگوں کے عجیب و غریب ہاتھوں نے انہیں AI سے تیار کردہ تصاویر کے طور پر دے دیا۔ حقیقت یہ ہے کہ یہ مڈجرنی کی کوشش تھی اس نے صورتحال کو مزید دلچسپ بنا دیا۔

آس پاس کے بہترین AI انجنوں میں سے ایک انسانی ہاتھوں کی پیچیدگی سے نمٹ نہیں سکا، اس لیے مڈجرنی اور اس کے حریفوں کی صلاحیتوں کا امتحان لیا گیا۔ کافی حد تک سچ ہے، یہاں تک کہ DALL-E بھی غیر حقیقی انگلیوں اور ناخنوں کا شکار ہے۔



  DALL-E پر ہاتھ ملاتے ہوئے لوگوں کا

hype تناسب سے باہر تھا، اس بات پر غور کرتے ہوئے کہ AI سے تیار کردہ ہاتھ ہمیشہ ایک مسئلہ رہے ہیں، لیکن اضافی توجہ نے اس کی رہائی کا اشارہ کیا v4 پر بہتر کرنے کے لیے مڈجرنی v5 .

نئے ورژن نے ہاتھ کے ڈیزائن کو بڑھانے کا ایک نقطہ بنایا، یہ واضح اشارہ ہے کہ AI انجینئرز نے مزاحیہ ہلچل پر توجہ دی اور سافٹ ویئر کی صلاحیتوں کو اپ گریڈ کرنے کا فیصلہ کیا۔





دوسرے انجن مڈجرنی کی مثال پر عمل کرنے میں سست ہیں، اس لیے فوٹوشاپ کے ساتھ AI آرٹ کو ٹھیک کرنا ایک انمول مہارت رہتا ہے. پروگرامرز کے لیے بنیادی رکاوٹ یہ ہے کہ قائل کرنے والے ہاتھ کھینچنے کے لیے مصنوعی ذہانت کو تربیت دینا کتنا پیچیدہ ہے۔

اے آئی امیج جنریٹرز ہاتھوں سے کیوں جدوجہد کرتے ہیں؟

AI انجن تصاویر بنانے کے لیے جنریٹو ایڈورسریل نیٹ ورکس (GANs) یا اسٹیبل ڈفیوژن کا استعمال کرتے ہیں۔ دونوں ٹکنالوجیوں کو انتہائی بنیادی آرٹ ورکس بنانے کے لیے وسیع ماخذ مواد، تربیت، اور پروسیسنگ پاور کی ضرورت ہوتی ہے۔





چونکہ پہلے سے موجود تصاویر AI کی تربیت میں مرکزی حیثیت رکھتی ہیں، اس لیے پروگرامرز کو اپنے سافٹ ویئر کو ہزاروں، اگر لاکھوں نہیں، تو اشارے کے ساتھ تصویریں فیڈ کرنی پڑتی ہیں- اس عمل کو بار بار دہرانا جب تک کہ انجن سمجھ نہ جائے کہ کوئی خاص لفظ کیا مراد ہے اور اس کی نمائندگی کیسے کی جائے۔ وہ اعتراض.

میک پر ڈبل سائیڈ پرنٹ کرنے کا طریقہ

لیکن AI جن ماخذ کی تصاویر سے سیکھتا ہے وہ بنیادی طور پر 2D ہیں، جہاں ہاتھوں کو مختلف پوزیشنوں میں دکھایا گیا ہے۔ خواہ سیدھا ہو یا گھماؤ، پانچ انگلیاں دکھا رہا ہو یا تین۔

دن کے اختتام پر، ایک مشین درحقیقت ہاتھوں کے تصور کو نہیں سمجھتی، اور جو تصویریں اس سے سیکھتی ہیں وہ ہمیشہ واضح طور پر یا مستقل طور پر کافی نہیں ہوتیں۔ اسی لیے مڈجرنی کے ہاتھ اتنے بدصورت ہو سکتے ہیں: AI کنفیوژن۔

جیسا کہ جائز ہے۔ AI کی ترقی کے بارے میں ایلون مسک کے خدشات ہو سکتا ہے، ٹیکنالوجی کے کچھ حصوں میں ابھی بہت کچھ سیکھنا باقی ہے۔ اور ان کی رکاوٹیں ہاتھ کی ناکافی مثالوں سے آگے نکل جاتی ہیں۔

دیگر وجوہات کیوں کہ AI امیج جنریٹرز بہتر ہونے میں سست ہیں۔

  عورت کمپیوٹر پر کوڈنگ کر رہی ہے۔

کی طرف دیکھ مڈ جرنی کے ماڈل , v5 متن کے اشارے اور تیار کردہ تصاویر کے ساتھ ساتھ اعلی ریزولیوشن اور اضافی ٹولز کے درمیان جدید ہم آہنگی پیش کرتا ہے۔ لیکن ایسی کامیابیاں سستی نہیں آتیں۔

ہاتھوں سے بہتر کام کرنے کے لیے AI کو تربیت دینے کے لیے اسے بہتر تصاویر کھلانے کی ضرورت ہوتی ہے، خاص طور پر 3D میں۔ اس کا مطلب ہے کہ ماخذ مواد کے حصول سے لے کر کوڈنگ کو بہتر بنانے اور AI کے درست ہونے تک تربیت کو دہرانے تک بہت زیادہ وقت اور افرادی قوت خرچ ہوتی ہے۔

جو بہتر لیبر آفس یا اوپن آفس ہے۔

تب بھی، سافٹ ویئر آرٹ کے بصورت دیگر شاندار کاموں میں غلطیاں کر سکتا ہے۔ ایک بہت بڑا اور پیچیدہ کام ہونے کے علاوہ، یہ مہنگا ہے۔ تو، توقع نہ کرو مفت AI ٹیکسٹ ٹو امیج جنریٹرز ابھی ابھی مڈجرنی کیلیبر تک قدم بڑھانا۔

سیدھے الفاظ میں، AI انجنوں کا مسئلہ صرف ان کمپیوٹر پروگراموں کی مکمل طور پر یہ سمجھنے میں ناکامی کا نہیں ہے کہ انسانی خصوصیات جیسے ہاتھ اور پاؤں کیسے نظر آتے ہیں یا کام کرتے ہیں۔ یہ اس کی قیمت پر بھی آتا ہے، اور ٹیکنالوجی کی 3D امیجری اور مشین لرننگ تکنیکوں تک رسائی جو جنریٹرز کو اپنے ارد گرد کی دنیا کے بارے میں زیادہ حقیقت پسندانہ گرفت حاصل کرنے میں مدد کر سکتی ہے۔

AI امیج جنریٹرز ہمیشہ کے لیے جدوجہد نہیں کریں گے۔

ہاتھ مصنوعی ذہانت کے لیے اپنے بائنری سر کو چاروں طرف لپیٹنے کے لیے ایک مشکل تصور ہے، لیکن اس مسئلے کے حل پہلے ہی کام کر رہے ہیں۔ Midjourney، DALL-E 2، اور دیگر پلیٹ فارمز آخر کار نرالی انگلیوں کو کم سے کم رکھنے کے قابل ہو جائیں گے، اگر انہیں مکمل طور پر ختم نہ کیا جائے۔

دیگر AI شعبوں میں پیشرفت اس بات کو یقینی بناتی ہے کہ ٹیکنالوجی مسلسل ترقی کر رہی ہے، اور اس کے ڈویلپر ہمیشہ اسے لاگو کرنے اور بہتر بنانے کے نئے طریقے سیکھتے رہتے ہیں۔