کیٹ اسپیچ ٹرانسلیشن ایپس کیسے کام کرتی ہیں؟

کیٹ اسپیچ ٹرانسلیشن ایپس کیسے کام کرتی ہیں؟

آپ نے شاید ایسی ایپس دیکھی ہوں گی جو ترجمہ کرنے کا دعویٰ کرتی ہیں کہ آپ کی بلی کیا کہہ رہی ہے۔ لیکن کیا وہ واقعی آپ کی بلی کے میانو کا انگریزی میں ترجمہ کر سکتے ہیں؟ اس کا مختصر جواب ہاں میں ہے۔ یہ مشکل ہے کیونکہ ہر بلی کی 'زبان' کتنی منفرد ہے ، لیکن وہ جدید ٹیکنالوجی کے ساتھ بہت قریب آسکتی ہے۔





میو ٹالک جیسی کیٹ ٹرانسلیشن ایپس تقریر کی پہچان کی ایک شکل استعمال کرتی ہیں جو مشین لرننگ پر زور دیتی ہے۔ آئیے قریب سے دیکھیں۔





تقریر کی پہچان اور مشین لرننگ۔

مریم تھریسا میک لین/ Pixabay





تقریر کی شناخت تقریر کو ریکارڈ کرکے اور آڈیو کو ڈیجیٹل ڈیٹا فائل میں تبدیل کرکے کام کرتی ہے۔ یہ اعداد و شمار جیسے پچ اور حجم کو ڈیٹا پوائنٹس کے طور پر انکوڈ کرتا ہے جسے ایپ تجزیہ کر سکتی ہے اور معنی کے ساتھ مل سکتی ہے۔ ڈی پی اے مائیکروفون۔ وضاحت کرتا ہے کہ یہ ڈیٹا پوائنٹس پس منظر کی آوازوں اور کس طرح ایک لفظ بولا جاتا ہے اس کے لحاظ سے بہت مختلف نظر آ سکتے ہیں۔

ہم بعض اوقات آواز کی پہچان کو قدر کی نگاہ سے دیکھتے ہیں ، لیکن یہ ٹیکنالوجی کا ایک ناقابل یقین کارنامہ ہے۔ خاص طور پر غور کرنا کہ انسانی تقریر کتنی پیچیدہ ہے۔ جیسا کہ سائنسدان وضاحت کرتا ہے ، ہر لفظ میں آوازوں کی ایک وسیع رینج یا 'فونمز' ایک دوسرے میں گھل مل جاتے ہیں۔ تقریر کو سمجھنے کے لیے کمپیوٹر حاصل کرنا بہت مشکل ہے۔ بلی کی آوازوں کی نئی سرحد اور بھی مشکل ہوگی۔



ایسی ایپس جو تقریر کی پہچان کو استعمال کرتی ہیں ان کو الفاظ کی 'الفاظ' کے ساتھ پروگرام کیا جاتا ہے جسے ڈیٹاسیٹ کہتے ہیں۔ اس کے بعد ایپ آپ کی تقریر کو اس کے اعداد و شمار کے قریب ترین آپشن سے ملاتی ہے۔

جب یہ غلطی کرتا ہے ، آپ اسے درست کرتے ہیں ، اور یہ اس ڈیٹا کو اگلی بار محفوظ کرتا ہے۔ یہ مشین لرننگ کا حصہ ہے۔ اس طرح ایک پروگرام تقریر کو پہچاننا سیکھتا ہے یہاں تک کہ جب وہ ڈیٹاسیٹ سے مماثل نہ ہو جس سے اس نے آغاز کیا تھا۔





متعلقہ: مشین لرننگ الگورتھم کیا ہیں؟ یہ کیسے کام کرتے ہیں

آواز کی پہچان میں اب بھی مسائل ہیں ، خاص طور پر تقریر کی رکاوٹوں اور لہجے کے ساتھ۔ کچھ کمپنیاں ان مسائل پر قابو پانے کے لیے مشین لرننگ کو بہتر بنا رہی ہیں۔ وقت گزرنے کے ساتھ ، مشین لرننگ تقریر کی شناخت کو ایک طاقتور ٹول میں بدل سکتی ہے۔





یو ایس بی کے ذریعے پی سی پر اینڈرائیڈ سکرین۔

اس طرح تقریر کی شناخت انسانوں کے لیے کام کرتی ہے۔ لیکن کیا یہ بلیوں کے لیے کام کرتا ہے؟

تقریر کی شناخت بمقابلہ میانو کی پہچان۔

اریانا سواریز / Unsplash

سب سے پہلے ، ہمیں یہ سمجھنے کی ضرورت ہے کہ ایک خاص قسم کی میانو کو 'مجھے بھوک لگی ہے' کے طور پر ترجمہ کرنا انسانی تقریر کے تجزیے سے مختلف کیوں ہے۔ مسئلہ زیادہ تر یہ ہے کہ بلی کی بات چیت غیر زبانی اشاروں جیسے کرنسی پر زیادہ انحصار کرتی ہے۔ ایک اور مسئلہ عالمگیر 'بلی زبان' کی عدم موجودگی ہے۔

کے مطابق اے ایس پی سی اے۔ ، بالغ جنگلی بلیوں نے کبھی ایک دوسرے کو نہیں دیکھا ، صرف لوگوں کو۔ دیگر تحقیق از انسانی سوسائٹی مزید کہتے ہیں کہ یہ آوازیں خلا میں نہیں ہوتی ہیں۔ ہمیں ان کی تشریح جسمانی زبان اور دیگر سیاق و سباق کے ساتھ کرنی چاہیے۔ بہت سے معاملات میں ، یہ خاموش سگنل صرف میانو کے درمیان فرق ہیں جس کا مطلب ہے 'مجھے بھوک لگی ہے' اور اس کا مطلب ہے 'میں کھیلنا چاہتا ہوں۔'

اس مسئلے میں اضافہ کرتے ہوئے ، کوئی دو بلیوں کی زبان ایک جیسی نہیں ہے۔ بلیاں اپنے مالکان کے لیے ذاتی زبانیں تیار کرتی ہیں۔ یہ جزوی طور پر مالک کی آواز کی تقلید پر اور جزوی طور پر بلی کی شخصیت پر مبنی ہیں۔ کوئی دو بلیوں کی آواز ایک جیسی نہیں ہوتی ، یہاں تک کہ جب ایک جیسی خواہش یا ضرورت پہنچاتی ہو۔ تو ایک ایپ کی تقریر الفاظ ان سب کے لیے کیسے ترجمہ کر سکتی ہے؟

بلیوں کے لیے لچکدار مشین لرننگ۔

آوازیں استعمال کرنے کے لیے مفت/ Unsplash

اگرچہ کچھ ورچوئل اسسٹنٹ پسند کرتے ہیں۔ آٹو۔ لہجے اور جذبات کو سمجھنے کی کوشش ، تقریر کی شناخت اب بھی غیر زبانی اشاروں پر خوفناک ہے۔ لیکن اس کا مطلب یہ نہیں کہ ان کی تشریح کرنا ناممکن ہے۔

فون سے پی سی میں فائلیں منتقل کریں

میو ٹاک ان مسائل پر قابو پانے میں مدد کے لیے زیادہ لچکدار قسم کی مشین لرننگ کا استعمال کرتا ہے۔

ڈاؤن لوڈ کریں: میو ٹاک کے لیے۔ انڈروئد | ios (مفت)

میو ٹاک کو جیویر سانچیز نے بنایا تھا ، جس نے الیکسا ٹیم میں بھی کام کیا تھا۔ اس نے ایپ کو سمارٹ کالرز کی طرف ایک قدم تصور کیا۔ یہ کالر بلیوں کی آوازوں کو انسانی تقریر میں ترجمہ کرتے ہیں ، مشین سیکھنے کی پیچیدہ حکمت عملی تیار کرتے ہیں تاکہ انسانوں کو اپنی بلیوں کو بہتر طور پر سمجھنے اور ان کی دیکھ بھال کرنے میں مدد ملے۔

میو ٹاک ٹیم نے ہر بلی کے لیے زیادہ مخصوص پروفائلز بنا کر انفرادیت کے مسائل کی تلافی کی۔ ایپ میں ، آپ ہر بلی کو الگ سے رجسٹر کرتے ہیں۔ سائنس ناروے۔ رپورٹ میں بتایا گیا ہے کہ بلی کے بچے بالغ بلیوں کے مقابلے میں مختلف ہوتے ہیں ، لہذا ایپ بلی کی سالگرہ بھی مانگتی ہے۔ ہر پروفائل بلی کے لیے ایک منفرد ڈیٹا نیٹ ورک تیار کرتا ہے ، جس میں مشین لرننگ میں تھوڑا سا گہرا سیکھنا شامل ہوتا ہے۔

متعلقہ: ڈیپ لرننگ بمقابلہ مشین لرننگ بمقابلہ AI: وہ ایک ساتھ کیسے چلتے ہیں؟

الفاظ کے لیے ، میو ٹاک اپنے ڈیٹاسیٹ میں 10 ساؤنڈ پروفائلز سے شروع ہوتا ہے۔ ہر ایک کے مختلف معنی ہوتے ہیں ، جیسے 'خوش' یا 'شکار'۔ جب ایپ آواز سنتی ہے اور اسے غلط سمجھتی ہے تو آپ اسے درست کر سکتے ہیں یا نئی تشریح کر سکتے ہیں۔

CATSOUNDS ڈیٹا جن سے جمع کیا گیا ہے۔ اکیلون۔

تصحیح کرنا ایپ کو کہتا ہے کہ بنیادی الفاظ کو نئی آواز سے تبدیل کریں۔

ونڈوز 10 میں کتنی جگہ ہے؟

مثال کے طور پر ، آپ ایپ کو کہہ سکتے ہیں کہ 'شکار' کو لمبی یلو کے بجائے مختصر چپس سے ملائیں۔ اس طرح کی اصلاح ایک سے زیادہ آوازوں کو شامل کرنے سے زیادہ مفید ہے جس کا مطلب ایک طرح سے تقریر کی پہچان ہے ، جو کہ ایپ کو بتانے کے مترادف ہے کہ لمبی یول اور چھوٹی چہچہاہٹ دونوں مطلب 'ماں کال'

اسپیچ ریکگنیشن ایپس میں مشین لرننگ عام طور پر اس قسم کی اوور رائٹنگ کی مزاحمت کرتی ہے۔ یہ سری کو سکھانے کی کوشش کرنے کے مترادف ہوگا کہ جب آپ 'ٹیکنالوجی بلاگ' کہتے ہیں تو آپ کا مطلب واقعی 'ناشپاتی' ہوتا ہے۔ لیکن مشین لرننگ کی زیادہ لچکدار شکل جسے میو ٹاک استعمال کرتا ہے اس اصلاح کو زیادہ آسانی سے سنبھال سکتا ہے۔

ایک نئی تشریح تخلیق کرنے سے ایک معنی شامل ہوتا ہے جو پہلے انکوڈ نہیں ہوا تھا۔ مثال کے طور پر ، اگر آپ کی بلی کو ایک مخصوص کال آتی ہے جب وہ اپنا پسندیدہ کھلونا چاہتی ہے ، آپ ایک اختیار کے طور پر 'مجھے اپنا ماؤس چاہیے' شامل کر سکتے ہیں۔ یہ آپ کی خود درست لغت میں ایک لفظ شامل کرنے کے مترادف ہے۔

متعلقہ: اینڈرائیڈ پر اپنے خود درست الفاظ کی وضاحت کیسے کریں

وقت گزرنے کے ساتھ ، آپ اپنی بلی کے لیے ایک انتہائی ذاتی تقریر پروفائل تیار کر سکتے ہیں۔ آخر کار ، یہ پالتو جانوروں کے بیٹھنے والوں کے لیے کارآمد ہونے یا رویے کے مسائل کو حل کرنے کے لیے کافی نفیس بھی ہوسکتا ہے۔ اگر کچھ اور نہیں تو ، یہ بلی کے مالکان کو اپنے پالتو جانوروں پر زیادہ توجہ دینے میں مدد کرتا ہے۔

فیصلہ: کیا کیٹ ٹرانسلیشن ایپس کام کرتی ہیں؟

آخر میں ، 'بلی کا ترجمہ' اب بھی صارف کو ایپ سکھانے پر بہت زیادہ انحصار کرتا ہے کہ ان کی بلی کیسے بات کرتی ہے۔ یہ ہمیشہ ایسا ہی ہوگا کیونکہ ہر بلی کی بات چیت کتنی منفرد ہے۔

لیکن حقیقت یہ ہے کہ مشین لرننگ اتنی دور آچکی ہے کہ ڈویلپرز اس میں جزوی طور پر کامیاب بھی ہوسکتے ہیں۔ مشین لرننگ اور اے آئی تیز رفتار سے آگے بڑھ رہے ہیں ، اور ہم یہ دیکھنے کے لیے انتظار نہیں کر سکتے کہ وہ آگے کہاں جاتے ہیں۔

بانٹیں بانٹیں ٹویٹ ای میل۔ متعلقہ موضوعات۔
  • ٹیکنالوجی کی وضاحت
  • زبان سیکھنا
  • مشین لرننگ۔
مصنف کے بارے میں نٹالی اسٹیورٹ۔(47 مضامین شائع ہوئے)

نٹالی سٹیورٹ MakeUseOf کی مصنف ہیں۔ اس نے سب سے پہلے کالج میں ٹیکنالوجی میں دلچسپی لی اور یونیورسٹی میں میڈیا لکھنے کا شوق پیدا کیا۔ نتالی کی توجہ اس ٹیکنالوجی پر ہے جو قابل رسائی اور استعمال میں آسان ہے ، اور وہ ایسے ایپس اور ڈیوائسز سے محبت کرتی ہے جو روزمرہ کے لوگوں کی زندگی کو آسان بناتی ہیں۔

نتالی اسٹیورٹ سے مزید۔

ہماری نیوز لیٹر کو سبسکرائب کریں

ٹیک ٹپس ، جائزے ، مفت ای بکس ، اور خصوصی سودوں کے لیے ہمارے نیوز لیٹر میں شامل ہوں!

سبسکرائب کرنے کے لیے یہاں کلک کریں۔