ASCII اور یونیکوڈ ٹیکسٹ میں کیا فرق ہے؟

ASCII اور یونیکوڈ ٹیکسٹ میں کیا فرق ہے؟

ASCII اور یونیکوڈ دونوں معیار ہیں جو متن کی ڈیجیٹل نمائندگی کا حوالہ دیتے ہیں ، خاص طور پر حروف جو متن بناتے ہیں۔ تاہم ، دونوں معیارات نمایاں طور پر مختلف ہیں ، بہت سی خصوصیات ان کے متعلقہ ترتیب کے عکاسی کرتی ہیں۔





امریکہ بمقابلہ کائنات۔

امریکن سٹینڈرڈ کوڈ فار انفارمیشن انٹر چینج (ASCII) ، حیرت انگیز طور پر ، ایک امریکی سامعین کو پورا کرتا ہے ، انگریزی حروف تہجی میں لکھتا ہے۔ یہ غیر سنجیدہ حروف سے متعلق ہے ، جیسے A-Z اور a-Z ، نیز چھوٹی تعداد میں رموز نشان اور کنٹرول حروف۔





خاص طور پر ، دوسری زبانوں سے اختیار کردہ قرض کے الفاظ کی نمائندگی کا کوئی طریقہ نہیں ہے ، جیسے۔ کافی ASCII میں ، لہجے والے حروف کی جگہ لے کر انہیں انگلی بنائے بغیر (مثال کے طور پر ، کیفے ). مقامی ASCII توسیعات مختلف زبانوں کی ضروریات کو پورا کرنے کے لیے تیار کی گئیں ، لیکن ان کوششوں نے باہمی تعاون کو عجیب بنا دیا اور واضح طور پر ASCII کی صلاحیتوں کو بڑھا رہے تھے۔





اس کے برعکس ، یونیورسل کوڈڈ کریکٹر سیٹ (یونیکوڈ) امیجن اسکیل کے مخالف سرے پر واقع ہے۔ یونیکوڈ دنیا کے زیادہ سے زیادہ تحریری نظاموں کو ممکنہ حد تک پورا کرنے کی کوشش کرتا ہے ، اس حد تک کہ یہ قدیم زبانوں اور ہر ایک کے پسندیدہ مجموعے ، ایموجی کا احاطہ کرتا ہے۔

کریکٹر سیٹ یا کریکٹر انکوڈنگ؟

سادہ الفاظ میں ، ایک کریکٹر سیٹ حروف کا انتخاب ہوتا ہے (جیسے A-Z) جب کہ ایک کریکٹر انکوڈنگ ایک کریکٹر سیٹ اور ایک ویلیو کے درمیان میپنگ ہوتی ہے جسے ڈیجیٹل طور پر پیش کیا جاسکتا ہے (جیسے A = 1 ، B = 2)۔



ASCII معیار مؤثر طور پر دونوں ہے: یہ حروف کے سیٹ کی وضاحت کرتا ہے جس کی وہ نمائندگی کرتا ہے اور ہر کردار کو عددی قدر کے ساتھ نقشہ بنانے کا طریقہ۔

اس کے برعکس ، یونیکوڈ کا لفظ مختلف چیزوں کے معنی کے لیے کئی مختلف سیاق و سباق میں استعمال ہوتا ہے۔ آپ اس کے بارے میں سوچ سکتے ہیں کہ ASCII کی طرح ، ایک کیریکٹر سیٹ اور متعدد انکوڈنگز کا حوالہ دیں۔ لیکن ، چونکہ کئی انکوڈنگز ہیں ، یونیکوڈ کی اصطلاح اکثر حروف کے مجموعی سیٹ کے حوالہ کرنے کے لیے استعمال کی جاتی ہے ، بجائے اس کے کہ ان کی نقشہ بندی کی جائے۔





سائز

اس کے دائرہ کار کی وجہ سے ، یونیکوڈ ASCII سے کہیں زیادہ حروف کی نمائندگی کرتا ہے۔ سٹینڈرڈ ASCII 128 مخصوص کو انکوڈ کرنے کے لیے 7 بٹ رینج استعمال کرتا ہے۔ کردار . دوسری طرف یونیکوڈ اتنا بڑا ہے کہ ہمیں اس کے بارے میں بات کرنے کے لیے مختلف اصطلاحات استعمال کرنے کی ضرورت ہے۔

یونیکوڈ 1،111،998 ایڈریس ایبل کو پورا کرتا ہے۔ کوڈ پوائنٹس ایک کوڈ پوائنٹ کسی کردار کے لیے مخصوص جگہ سے تقریبا anal مشابہت رکھتا ہے ، لیکن جب آپ تفصیلات پر غور کرنا شروع کرتے ہیں تو صورتحال اس سے کہیں زیادہ پیچیدہ ہوتی ہے!





ایک زیادہ مفید موازنہ یہ ہے کہ فی الحال کتنے سکرپٹ (یا لکھنے کے نظام) معاون ہیں۔ یقینا ، ASCII صرف انگریزی حروف تہجی کو سنبھالتا ہے ، بنیادی طور پر لاطینی یا رومن رسم الخط۔ یونیکوڈ کا ورژن 2020 میں تیار کیا گیا ہے: اس میں کل 154 سکرپٹ کی حمایت شامل ہے۔

ذخیرہ۔

ASCII کی 7 بٹ رینج کا مطلب ہے کہ ہر کردار ایک 8 بٹ بائٹ میں محفوظ ہے۔ اسپیئر بٹ معیاری ASCII میں غیر استعمال شدہ ہے۔ اس سے سائز کا حساب چھوٹا ہوتا ہے: متن کی لمبائی ، حروف میں ، فائل کا سائز بائٹس میں ہوتا ہے۔

آپ bash کمانڈز کے درج ذیل تسلسل سے اس کی تصدیق کر سکتے ہیں۔ سب سے پہلے ، ہم ایک فائل بناتے ہیں جس میں 12 حرف متن ہوتے ہیں۔

کیا آپ PS3 گیمز کو PS4 میں ڈال سکتے ہیں؟
$ echo -n 'Hello, world' > foo

یہ چیک کرنے کے لیے کہ متن ASCII انکوڈنگ میں ہے ، ہم استعمال کر سکتے ہیں فائل کمانڈ:

$ file foo
foo: ASCII text, with no line terminators

آخر میں ، فائل پر قابض بائٹس کی صحیح تعداد حاصل کرنے کے لیے ، ہم حالت کمانڈ:

$ stat -f%z foo
12

چونکہ یونیکوڈ سٹینڈرڈ حروف کی بہت زیادہ رینج سے متعلق ہے ، یونیکوڈ فائل قدرتی طور پر ذخیرہ کرنے کی زیادہ جگہ لیتی ہے۔ بالکل انکوڈنگ پر کتنا انحصار کرتا ہے۔

پہلے سے کمانڈ کے اسی سیٹ کو دہراتے ہوئے ، ایک ایسے کردار کا استعمال کرتے ہوئے جسے ASCII میں نہیں دکھایا جا سکتا ، مندرجہ ذیل دیتا ہے:

$ echo -n '€' > foo
$ file foo
foo: UTF-8 Unicode text, with no line terminators
$ stat -f%z foo
3

وہ واحد کردار یونیکوڈ فائل میں 3 بائٹس پر مشتمل ہے۔ نوٹ کریں کہ bash نے خود بخود ایک UTF-8 فائل بنائی کیونکہ ASCII فائل منتخب کردہ کردار (€) کو محفوظ نہیں کر سکتی۔ UTF-8 یونیکوڈ کے لیے اب تک کا سب سے عام کریکٹر انکوڈنگ ہے۔ UTF-16 اور UTF-32 دو متبادل انکوڈنگ ہیں ، لیکن وہ بہت کم استعمال ہوتے ہیں۔

UTF-8 ایک متغیر چوڑائی انکوڈنگ ہے ، جس کا مطلب ہے کہ یہ مختلف کوڈ پوائنٹس کے لیے مختلف مقدار میں اسٹوریج استعمال کرتا ہے۔ ہر کوڈ پوائنٹ ایک اور چار بائٹس کے درمیان قبضہ کرے گا ، اس ارادے کے ساتھ کہ زیادہ عام کرداروں کو کم جگہ درکار ہوتی ہے ، ایک قسم کا بلٹ ان کمپریشن فراہم کرتا ہے۔ نقصان یہ ہے کہ متن کے دیئے گئے حصے کی لمبائی یا سائز کی ضروریات کا تعین بہت زیادہ پیچیدہ ہو جاتا ہے۔

ASCII یونیکوڈ ہے ، لیکن یونیکوڈ ASCII نہیں ہے۔

پسماندہ مطابقت کے لیے ، پہلے 128 یونیکوڈ کوڈ پوائنٹس برابر ASCII حروف کی نمائندگی کرتے ہیں۔ چونکہ UTF-8 ان میں سے ہر ایک حرف کو ایک بائٹ کے ساتھ انکوڈ کرتا ہے ، کوئی بھی ASCII متن بھی UTF-8 متن ہے۔ یونیکوڈ ASCII کا ایک سپر سیٹ ہے۔

تاہم ، جیسا کہ اوپر دکھایا گیا ہے ، کئی یونیکوڈ فائلوں کو ASCII سیاق و سباق میں استعمال نہیں کیا جا سکتا۔ کوئی بھی کردار جو حد سے باہر ہے غیر متوقع انداز میں دکھایا جائے گا ، اکثر ایسے کرداروں کے ساتھ جو مکمل طور پر مختلف ہوتے ہیں۔

جدید استعمال۔

زیادہ تر مقاصد کے لیے ، ASCII بڑی حد تک میراثی معیار سمجھا جاتا ہے۔ یہاں تک کہ ان حالات میں جو صرف لاطینی رسم الخط کی حمایت کرتے ہیں-جہاں یونیکوڈ کی پیچیدگیوں کے لیے مکمل تعاون غیر ضروری ہے ، مثال کے طور پر-عام طور پر UTF-8 استعمال کرنا اور اس کی ASCII مطابقت سے فائدہ اٹھانا زیادہ آسان ہے۔

آپ کو پرنٹر کا آئی پی ایڈریس کیسے ملتا ہے؟

خاص طور پر ، UTF-8 کا استعمال کرتے ہوئے ویب صفحات کو محفوظ اور منتقل کیا جانا چاہیے ، جو HTML5 کے لیے پہلے سے طے شدہ ہے۔ یہ پہلے والے ویب کے برعکس ہے ، جو ASCII میں ڈیفالٹ سے پہلے نمٹا گیا تھا اس سے پہلے لاطینی 1 نے اس کی جگہ لے لی تھی۔

ایک معیار جو بدل رہا ہے۔

ASCII کی آخری نظرثانی 1986 میں ہوئی۔

اس کے برعکس ، یونیکوڈ سالانہ اپ ڈیٹ ہوتا رہتا ہے۔ نئے سکرپٹ ، حروف اور خاص طور پر نئے ایموجی باقاعدگی سے شامل کیے جاتے ہیں۔ ان میں سے صرف ایک چھوٹا سا حصہ مختص کیا گیا ہے ، مستقبل کے لیے مکمل کردار سیٹ بڑھنے اور بڑھنے کا امکان ہے۔

متعلقہ: 100 سب سے زیادہ مقبول ایموجیز کی وضاحت

ASCII بمقابلہ یونیکوڈ۔

ASCII نے کئی دہائیوں تک اپنے مقصد کو پورا کیا ، لیکن یونیکوڈ نے اب اسے لیگی سسٹم کے علاوہ تمام عملی مقاصد کے لیے مؤثر طریقے سے تبدیل کر دیا ہے۔ یونیکوڈ بڑا ہے اور اس لیے زیادہ اظہار خیال ہے۔ یہ ایک دنیا بھر میں ، باہمی تعاون کی کوششوں کی نمائندگی کرتا ہے اور کچھ پیچیدگیوں کی قیمت پر بہت زیادہ لچک پیش کرتا ہے۔

بانٹیں بانٹیں ٹویٹ ای میل۔ ASCII متن کیا ہے اور اسے کیسے استعمال کیا جاتا ہے؟

ASCII متن خفیہ دکھائی دیتا ہے ، لیکن انٹرنیٹ پر اس کے بہت سے استعمال ہیں۔

اگلا پڑھیں۔
متعلقہ موضوعات۔
  • ٹیکنالوجی کی وضاحت
  • ایموجیز۔
  • الفاظ
  • ویب کلچر۔
  • یونیکوڈ
مصنف کے بارے میں بوبی جیک۔(58 مضامین شائع ہوئے)

بوبی ایک ٹکنالوجی کا شوقین ہے جس نے دو دہائیوں تک سافٹ ویئر ڈویلپر کی حیثیت سے کام کیا۔ وہ گیمنگ کے بارے میں پرجوش ہے ، سوئچ پلیئر میگزین میں بطور ریویو ایڈیٹر کام کرتا ہے ، اور آن لائن پبلشنگ اور ویب ڈویلپمنٹ کے تمام پہلوؤں میں ڈوبا ہوا ہے۔

بوبی جیک سے مزید

ہماری نیوز لیٹر کو سبسکرائب کریں

ٹیک ٹپس ، جائزے ، مفت ای بکس ، اور خصوصی سودوں کے لیے ہمارے نیوز لیٹر میں شامل ہوں!

سبسکرائب کرنے کے لیے یہاں کلک کریں۔