کیا گوگل کا میوزک ایل ایم ہائپ کے مطابق ہے؟

کیا گوگل کا میوزک ایل ایم ہائپ کے مطابق ہے؟
آپ جیسے قارئین MUO کو سپورٹ کرنے میں مدد کرتے ہیں۔ جب آپ ہماری سائٹ پر لنکس کا استعمال کرتے ہوئے خریداری کرتے ہیں، تو ہم ملحق کمیشن حاصل کر سکتے ہیں۔ مزید پڑھ.

جنوری 2023 میں، گوگل نے MusicLM کا اعلان کیا، ایک تجرباتی AI ٹول جو ٹیکسٹ ڈسکرپشن کی بنیاد پر موسیقی تیار کر سکتا ہے۔ خبروں کے ساتھ ساتھ، گوگل نے MusicLM کے لیے ایک شاندار تحقیقی مقالہ جاری کیا جس نے بہت سے لوگوں کو پتلی ہوا سے موسیقی کو جوڑنے کی صلاحیت پر حیران کردیا۔





دن کی ویڈیو کا میک یوز مواد کے ساتھ جاری رکھنے کے لیے اسکرول کریں۔

ٹیکسٹ پرامپٹ کو دیکھتے ہوئے، ماڈل نے اعلیٰ مخلصانہ موسیقی تیار کرنے کا وعدہ کیا جو مشہور آرٹ ورکس کو بیان کرنے والے انواع سے لے کر آلے تک تمام قسم کی وضاحتوں پر پیش کرتا ہے۔ اب جب کہ MusicLM عوام کے لیے کھلا ہے، ہم نے اسے آزمانے کا فیصلہ کیا۔





گوگل کی AI میوزک جنریٹر بنانے کی کوشش

  گوگل کے لیے ویب ایپلیکیشن's MusicLM AI music generator

'آرام کرنے والے جاز' جیسے ٹیکسٹ پرامپٹ کو ایک ریڈی ٹو پلے ٹریک میں تبدیل کرنا AI میوزک میں تجربات کی مقدس گریل ہے۔ Dall-E یا Midjourney جیسے مشہور AI امیج جنریٹرز کی طرح، آپ کو موسیقی کے ذخیرے کی معلومات کی ضرورت نہیں ہے کہ ایک ایسا ٹریک کیسے تیار کیا جائے جس میں میلوڈی اور بیٹ ہو۔





مئی 2023 میں، وہ لوگ جنہوں نے گوگل کے اے آئی ٹیسٹ کچن میں سائن اپ کیا وہ پہلی بار ڈیمو آزما سکتے ہیں۔ صارف دوست ویب صفحہ اور چند رہنما اصولوں کے ذریعے خوش آمدید — الیکٹرانک اور کلاسیکی آلات بہترین کام کرتے ہیں، اور 'وائب' کی وضاحت کرنا نہ بھولیں — موسیقی کا ایک ٹکڑا تیار کرنا ناقابل تصور حد تک آسان ہے۔

رفتار ان چند چیزوں میں سے ایک ہے جو MusicLM نسبتاً زیادہ مخلصی کے نمونوں کے ساتھ، حقیقی معنوں میں فراہم کرتی ہے۔ تاہم، حقیقی امتحان کو اکیلے اسٹاپ واچ سے ناپا جانا نہیں تھا۔ کیا MusicLM چند الفاظ پر مبنی حقیقی، سننے کے قابل موسیقی تیار کر سکتا ہے؟ بالکل نہیں (ہم جلد ہی اس پر پہنچ جائیں گے)۔



ایکسل میں ایکس کو کیسے حل کریں۔

گوگل کے اے آئی ٹیسٹ کچن میں میوزک ایل ایم کا استعمال کیسے کریں۔

MusicLM استعمال کرنا آسان ہے، آپ انتظار کی فہرست میں سائن اپ کر سکتے ہیں۔ گوگل کا اے آئی ٹیسٹ کچن اگر آپ اسے جانا چاہتے ہیں۔

ویب ایپ پر، آپ کو ایک ٹیکسٹ باکس نظر آئے گا جہاں آپ چند الفاظ سے لے کر چند جملوں تک ایک پرامپٹ تحریر کر سکتے ہیں جس میں آپ جس قسم کی موسیقی سننا چاہتے ہیں اس کی وضاحت کر سکتے ہیں۔ بہترین نتائج کے لیے، گوگل آپ کو 'بہت وضاحتی' ہونے کا مشورہ دیتا ہے، یہ کہتے ہوئے کہ آپ کو موسیقی کے مزاج اور جذبات کو شامل کرنے کی کوشش کرنی چاہیے۔





جب آپ تیار ہوں، تو کارروائی شروع کرنے کے لیے انٹر دبائیں۔ تقریباً 30 سیکنڈ کے اندر، آپ کے لیے آڈیشن کے لیے دو آڈیو اسنیپٹس دستیاب ہوں گے۔ ان دونوں میں سے، آپ کے پاس بہترین نمونے کو ٹرافی دینے کا اختیار ہے جو آپ کے پرامپٹ سے میل کھاتا ہے، جس کے نتیجے میں Google کو ماڈل کو تربیت دینے اور اس کے آؤٹ پٹ کو بہتر بنانے میں مدد ملتی ہے۔

میوزک ایل ایم کیسا لگتا ہے۔

انسان کم از کم 40,000 سال پہلے سے موسیقی بنا رہے ہیں جس کا کوئی حتمی خیال نہیں ہے کہ موسیقی زبان کی ترقی سے پہلے، بعد میں، یا اسی وقت آئی۔ لہذا کچھ طریقوں سے، یہ حیرت کی بات نہیں ہے کہ MusicLM نے اس قدیم عالمگیر آرٹ پر کوڈ کو کافی حد تک کریک نہیں کیا ہے۔





گوگل کا میوزک ایل ایم ریسرچ پیپر تجویز کیا کہ MusicLM مشہور آرٹ ورکس سے تعلق رکھنے والے کیپشنز سے موسیقی تیار کر سکتا ہے، اور مختلف اشارے کی ترتیب کے بعد ہموار انداز میں صنف یا موڈ کو تبدیل کرنے جیسی ہدایات پر عمل کر سکتا ہے۔

اس طرح کے لمبے آرڈرز تک پہنچنے سے پہلے، تاہم، ہم نے پایا کہ MusicLM کو پہلے پر قابو پانے کے لیے کئی بنیادی مسائل تھے۔

ٹیمپو سے چپکنے میں دشواری

کسی بھی موسیقار کا سب سے بنیادی کام صرف وقت پر بجانا ہے۔ دوسرے لفظوں میں، ٹیمپو پر قائم رہیں۔ حیرت کی بات یہ ہے کہ یہ وہ چیز نہیں ہے جو MusicLM 100% وقت کر سکتی ہے۔

درحقیقت، ایک ہی پرامپٹ کو 10 بار استعمال کرتے ہوئے، جو 20 میوزک ٹریک تیار کرتا ہے، صرف تین وقت میں تھے۔ باقی 17 نمونے مخصوص ٹیمپو سے تیز یا سست تھے جو 'بیٹس فی منٹ' میں لکھا گیا تھا، جو موسیقی کی وضاحت کے لیے ایک وسیع پیمانے پر استعمال ہونے والی اصطلاح ہے۔

اس مثال میں، ہم نے 'سولو کلاسیکی پیانو کو 80 دھڑکن فی منٹ پر بجایا، پرامن اور مراقبہ' کا استعمال کیا۔ قریب سے سننے پر، موسیقی اکثر سیمپل کی چھوٹی لمبائی میں تیز یا سست ہوجاتی ہے۔

موسیقی میں بھی زوردار تھاپ کی کمی تھی اور ایسا لگ رہا تھا جیسے کسی نے بیچ میں پلے مارا ہو۔ چاہے یہ جان بوجھ کر تھا یا نہیں، اس سے یہ فیصلہ کرنا مشکل ہو جاتا ہے کہ آیا MusicLM دھڑکن پر قائم رہنے کے ساتھ ساتھ موسیقی کے کسی ٹکڑے کا صحیح آغاز یا اختتام بھی کر سکتا ہے۔

بے ترتیب آلے کا انتخاب

شاید MusicLM نے ابھی تک سخت ٹائمنگ میں کھیلنا نہیں سیکھا تھا، اس لیے ہم ایک اور عام میوزک پیرامیٹر پر چلے گئے۔ ہم یہ دیکھنا چاہتے تھے کہ آیا یہ کچھ آلات کے لیے ہماری درخواست کو منظور کرے گا۔

ہم نے کئی مختلف اشارے لکھے جن میں 'سولو سنتھیسائزر' اور 'سولو باس گٹار' جیسی وضاحتیں شامل تھیں۔ دوسرے بڑے جوڑ تھے جیسے 'سٹرنگ کوارٹیٹ' یا 'جاز بینڈ'۔ مجموعی طور پر، ایسا لگتا تھا کہ 50:50 موقع آپ کو وہی ملے گا جو آپ نے مانگا تھا۔

ایک نظریہ یہ ہے کہ ماڈل کچھ آلات کو موسیقی کی مقبول انواع کے ساتھ جوڑتا ہے۔ مثال کے طور پر، پرامپٹ 'سولو سنتھیسائزر، راگ کی ترقی۔ جاندار اور پرجوش' کو لیں۔ اپنے طور پر سنتھیسائزر کی آواز حاصل کرنے کے بجائے، MusicLM نے ڈرم اور باس کے ساتھ مکمل الیکٹرانک ٹریک تیار کیا۔

یہ ممکن ہے کہ ماڈل کے پاس کسی آلے کی مخصوص درخواست کو سمجھنے کے لیے کافی ڈیٹا اور کافی تربیت نہ ہو۔

آوازیں مساوات سے باہر ہیں۔

اس وقت کی پابندیوں کے مطابق، ماڈل آواز پر مشتمل موسیقی تیار نہیں کرے گا۔ MusicLM کے کانٹے دار کاپی رائٹ کے مسائل اور چھوٹی چھوٹی آوازیں۔ یہ ایک ممکنہ عنصر ہے کہ گوگل نے اس حد کو ترتیب دے کر اسے محفوظ طریقے سے چلانے کا انتخاب کیوں کیا۔

لیکن کچھ عرصے تک MusicLM کے ساتھ تجربہ کرنے کے بعد، ہم نے محسوس کیا کہ ماڈل کے آؤٹ پٹ پر گوگل کا کنٹرول قطعی طور پر فولادی نہیں تھا۔ عجیب بات یہ ہے کہ 'صوتی گٹار' جیسا پرامپٹ ایک ٹریک تیار کرے گا جس میں پس منظر میں بھوت جیسی آوازیں ہوں گی جو دب کر اور دور سے لگ رہی ہیں۔

اگرچہ یہ کوئی عام واقعہ نہیں ہے، لیکن یہ آپ کو MusicLM کی پہلی جگہ قائل کرنے والی آوازیں تخلیق کرنے کی صلاحیت کے بارے میں حیران کر دیتا ہے۔

VOCALOID اور Synthesizer V جیسے سافٹ ویئر کے ساتھ جو آگے بڑھ رہے ہیں۔ AI کی مدد سے آواز کی ترکیب کی ٹیکنالوجی , موجودہ ماڈل سے آوازوں کو چھوڑنا ہمیں یہ سوچنے پر مجبور کر دیتا ہے کہ کیا یہ ابھی تک موجودہ ٹیکنالوجی کا مقابلہ کرنے کے لیے کافی نہیں ہے۔ میوزک ایل ایم کو اس سے پہلے کہ موسیقاروں کو اس کی تعریفیں گانا شروع کرنے سے پہلے بہت طویل سفر طے کرنا ہوگا۔

اے آئی میوزک جنریٹرز کا مستقبل

  MusicLM پر مختلف فوری تجاویز's web application

جب کہ MusicLM نے تخلیقی AI میوزک ٹیکنالوجی کو آگے بڑھایا ہے، اسے موسیقی کی صنعت میں عملی کام کرنے سے پہلے اسے اسکول واپس جانے اور کچھ اور چیزیں سیکھنے کی ضرورت ہے۔

اب سے پہلے، تخلیقی AI موسیقی کی بہترین کوشش OpenAI کی طرف سے JukeboxAI نامی ماڈل تھی۔ یہ بالکل استعمال کے لیے تیار حالت میں نہیں تھا، اور اسے صرف ایک منٹ کی موسیقی پیش کرنے میں نو گھنٹے لگے۔

آپ کی کوششوں کے لیے، آپ کو آڈیو مسخ اور نمونے سے چھلنی ایک حقیقی اجنبی آواز والا ٹریک واپس ملنے کا امکان تھا۔ الٹا، آپ بور نہیں ہونے والے تھے۔ عجیب و غریب تخلیقات کو سننا جن کو جوک باکس جادو کرتا ہے۔ .

اس کی روشنی میں، MusicLM نے صارف دوست AI میوزک جنریٹر کی جانب کچھ اہم پیش رفت کی ہے۔ جب آپ یہ سوچنا چھوڑ دیتے ہیں کہ خام آڈیو فارم میں موسیقی تیار کرنا کتنا پیچیدہ ہے تو ہم ماڈل کو اس کے بے ترتیب آؤٹ پٹس کے لیے تقریباً معاف کر سکتے ہیں۔

ماڈل کو کام کرنے کے بعد، تاہم، گوگل نے اپنے ابتدائی تحقیقی مقالے میں جو شائع کیا ہے اس کے مقابلے میں میوزک ایل ایم آدھا سینکا ہوا محسوس کرتا ہے۔ شاذ و نادر ہی ایک AI امیج جنریٹر کو ایپل کی تصویر غلط ملتی ہے، اسی طرح ایک AI میوزک جنریٹر کو بھی کچھ بنیادی باتیں درست ملنی چاہئیں جیسے ٹیمپو اور آلات۔

گوگل کا میوزک ایل ایم توقعات سے کم ہے۔

ٹیک کمپنیوں کے AI محاذ پر ایک دوسرے سے مقابلہ کرنے کی دوڑ کے ساتھ، MusicLM کو ایسا محسوس ہوتا ہے جیسے اس نے تیار ہونے سے پہلے ہی عوامی آزمائشوں میں حصہ لیا ہو۔ بنیادی باتوں کو درست کرنے کے بدلے میں، ایسا لگتا ہے کہ ماڈل موسیقی کی تیاری کے لیے کہیں زیادہ مبہم اور ساپیکش نقطہ نظر اختیار کرتا ہے۔

گوگل آپ کو آپ کے پرامپٹ کے ساتھ مخصوص ہونے کی ترغیب دے سکتا ہے، لیکن یہ ٹیمپو کو اچھی طرح سے ہینڈل نہیں کر سکتا، اور آپ کو اس بات کی ضمانت نہیں ہے کہ آپ نے ہر بار جو آلات مانگے ہیں وہ حاصل کر لیں گے۔ MusicLM دلچسپ ہو سکتا ہے، اور طاقتور AI پیشرفت کا ایک اچھا مظاہرہ، لیکن اگر موسیقی آخری مقصد ہے تو اسے ابھی بہت طویل سفر طے کرنا ہے۔

ضرورت مند خاندانوں کے لیے کرسمس کی مدد 2016