یونیک کے ساتھ لینکس ٹیکسٹ فائل میں ڈپلیکیٹ ڈیٹا کیسے تلاش کریں۔

یونیک کے ساتھ لینکس ٹیکسٹ فائل میں ڈپلیکیٹ ڈیٹا کیسے تلاش کریں۔

کیا آپ نے کبھی ٹیکسٹ فائلوں کو بار بار لائنوں اور ڈپلیکیٹ الفاظ کے ساتھ دیکھا ہے؟ ہوسکتا ہے کہ آپ باقاعدگی سے کمانڈ آؤٹ پٹ کے ساتھ کام کریں اور ان کو الگ الگ ڈور کے لیے فلٹر کرنا چاہیں۔ جب ٹیکسٹ فائلوں اور لینکس میں بے کار ڈیٹا کو ہٹانے کی بات آتی ہے تو ، یونیک کمانڈ آپ کی بہترین شرط ہے۔





اس آرٹیکل میں ، ہم یونیک کمانڈ پر گہرائی سے بات کریں گے ، اس کے ساتھ ساتھ ایک تفصیلی گائیڈ کے ساتھ کہ کس طرح ٹیکسٹ فائل سے ڈپلیکیٹ لائنز کو ہٹانے کے لیے کمانڈ استعمال کریں۔





یونیک کمانڈ کیا ہے؟

لینکس میں یونیک کمانڈ ٹیکسٹ فائل میں یکساں لائنوں کو ظاہر کرنے کے لیے استعمال ہوتی ہے۔ اگر آپ ٹیکسٹ فائل سے ڈپلیکیٹ الفاظ یا ڈور کو ہٹانا چاہتے ہیں تو یہ کمانڈ مددگار ثابت ہوسکتی ہے۔ چونکہ یونیک کمانڈ فالتو کاپیاں ڈھونڈنے کے لیے ملحقہ لائنوں سے میل کھاتا ہے ، یہ صرف ترتیب شدہ ٹیکسٹ فائلوں کے ساتھ کام کرتا ہے۔





خوش قسمتی سے ، آپ پائپ لگا سکتے ہیں۔ ترتیب دیں کمانڈ کے ساتھ مطابقت پذیر ٹیکسٹ فائل کو یونیک کے ساتھ کمانڈ کریں۔ بار بار لکیریں دکھانے کے علاوہ ، یونیک کمانڈ ٹیکسٹ فائل میں ڈپلیکیٹ لائنوں کی موجودگی کو بھی شمار کر سکتی ہے۔

یونیک کمانڈ کا استعمال کیسے کریں

مختلف اختیارات اور جھنڈے ہیں جو آپ یونیک کے ساتھ استعمال کرسکتے ہیں۔ ان میں سے کچھ بنیادی ہیں اور سادہ آپریشن کرتے ہیں جیسے بار بار لائنیں چھاپنا ، جبکہ دیگر ایسے جدید صارفین کے لیے ہیں جو اکثر لینکس پر ٹیکسٹ فائلوں کے ساتھ کام کرتے ہیں۔



بنیادی نحو۔

یونیک کمانڈ کا بنیادی نحو یہ ہے:

uniq option input output

...کہاں اختیار یہ جھنڈا ہے جو کمانڈ کے مخصوص طریقوں کے لیے استعمال کیا جاتا ہے ، ان پٹ پروسیسنگ کے لیے ٹیکسٹ فائل ہے ، اور پیداوار فائل کا راستہ ہے جو آؤٹ پٹ کو محفوظ کرے گا۔





کی پیداوار دلیل اختیاری ہے اور چھوڑی جا سکتی ہے۔ اگر کوئی صارف ان پٹ فائل کی وضاحت نہیں کرتا ہے تو ، یونیک معیاری آؤٹ پٹ سے ڈیٹا کو بطور ان پٹ لیتا ہے۔ یہ صارف کو یونیک کے ساتھ پائپ کرنے کی اجازت دیتا ہے۔ دیگر لینکس کمانڈ .

مثال ٹیکسٹ فائل۔

ہم ٹیکسٹ فائل استعمال کریں گے۔ duplicate.txt بطور کمانڈ ان پٹ۔





127.0.0.1 TCP
127.0.0.1 UDP
Do catch this
DO CATCH THIS
Don't match this
Don't catch this
This is a text file.
This is a text file.
THIS IS A TEXT FILE.
Unique lines are really rare.

نوٹ کریں کہ ہم نے پہلے ہی اس ٹیکسٹ فائل کو استعمال کرتے ہوئے ترتیب دیا ہے۔ ترتیب دیں کمانڈ. اگر آپ کسی دوسری ٹیکسٹ فائل کے ساتھ کام کر رہے ہیں تو آپ اسے درج ذیل کمانڈ کے ذریعے ترتیب دے سکتے ہیں۔

sort filename.txt > sorted.txt

ڈپلیکیٹ لائنز کو ہٹا دیں۔

یونیک کا سب سے بنیادی استعمال ان پٹ سے بار بار تار کو ہٹانا اور منفرد آؤٹ پٹ پرنٹ کرنا ہے۔

uniq duplicate.txt

آؤٹ پٹ:

نوٹس کریں کہ نظام لائن کی دوسری موجودگی کو ظاہر نہیں کرتا ہے۔ یہ ایک ٹیکسٹ فائل ہے۔ . نیز ، مذکورہ بالا کمانڈ صرف فائل میں انوکھی لائنیں چھاپتی ہے اور اصل ٹیکسٹ فائل کے مواد کو متاثر نہیں کرتی ہے۔

بار بار لکیریں گنیں۔

ٹیکسٹ فائل میں بار بار لکیروں کی تعداد نکالنے کے لیے ، -سی ڈیفالٹ کمانڈ کے ساتھ جھنڈا لگائیں۔

uniq -c duplicate.txt

آؤٹ پٹ:

سسٹم ٹیکسٹ فائل میں موجود ہر لائن کی گنتی دکھاتا ہے۔ آپ اس لائن کو دیکھ سکتے ہیں۔ یہ ایک ٹیکسٹ فائل ہے۔ فائل میں دو بار ہوتا ہے۔ بطور ڈیفالٹ ، یونیک کمانڈ کیس حساس ہے۔

ٹیکسٹ فائل سے صرف ڈپلیکیٹ لائنز پرنٹ کرنے کے لیے ، -ڈی جھنڈا کی -ڈی سے مراد ڈپلیکیٹ .

uniq -D duplicate.txt

نظام مندرجہ ذیل کے طور پر آؤٹ پٹ دکھائے گا۔

This is a text file.
This is a text file.

ڈپلیکیٹس کو چیک کرتے وقت فیلڈز چھوڑیں۔

اگر آپ ڈور کے ملاپ کے دوران فیلڈز کی ایک خاص تعداد کو چھوڑنا چاہتے ہیں تو آپ استعمال کر سکتے ہیں کمانڈ کے ساتھ جھنڈا کی سے مراد میدان .

درج ذیل ٹیکسٹ فائل پر غور کریں۔ شعبوں. txt .

192.168.0.1 TCP
127.0.0.1 TCP
354.231.1.1 TCP
Linux FS
Windows FS
macOS FS

پہلا فیلڈ چھوڑنے کے لیے:

uniq -f 1 fields.txt

آؤٹ پٹ:

192.168.0.1 TCP
Linux FS

مذکورہ کمانڈ نے پہلے فیلڈ کو چھوڑ دیا (IP پتے اور OS کے نام) اور دوسرے لفظ (TCP اور FS) سے مماثل۔ پھر ، اس نے آؤٹ پٹ کے طور پر ہر میچ کا پہلا واقعہ ظاہر کیا۔

موازنہ کرتے وقت حروف کو نظر انداز کریں۔

کھیتوں کو چھوڑنے کی طرح ، آپ حروف کو بھی چھوڑ سکتے ہیں۔ کی پرچم آپ کو ڈپلیکیٹ لائنوں کے ملاپ کے دوران چھوڑنے کے لیے حروف کی تعداد بتانے کی اجازت دیتا ہے۔ یہ خصوصیت اس وقت مدد کرتی ہے جب آپ جس ڈیٹا کے ساتھ کام کر رہے ہیں وہ فہرست کی شکل میں درج ذیل ہے:

ایک سمارٹ ٹی وی کیا کرتا ہے
1. First
2. Second
3. Second
4. Second
5. Third
6. Third
7. Fourth
8. Fifth

فائل میں پہلے دو حروف (فہرست کی تعداد) کو نظر انداز کرنا۔ list.txt :

uniq -s 2 list.txt

آؤٹ پٹ:

مندرجہ بالا آؤٹ پٹ میں ، پہلے دو حروف کو نظر انداز کیا گیا تھا اور ان میں سے باقی کو منفرد لائنوں کے لیے ملایا گیا تھا۔

ڈپلیکیٹس کے لیے پہلے حروف کی تعداد چیک کریں۔

کی -میں پرچم آپ کو نقول کے لیے حروف کی صرف ایک مقررہ تعداد چیک کرنے کی اجازت دیتا ہے۔ مثال کے طور پر:

uniq -w 2 duplicate.txt

مذکورہ کمانڈ صرف پہلے دو حروف سے مماثل ہوگی اور اگر کوئی ہو تو منفرد لائنیں چھاپے گی۔

آؤٹ پٹ:

کیس کی حساسیت کو ہٹا دیں۔

جیسا کہ اوپر ذکر کیا گیا ہے ، uniq ایک فائل میں لائنوں کے ملاپ کے دوران کیس حساس ہے۔ کیریکٹر کیس کو نظر انداز کرنے کے لیے ، -میں کمانڈ کے ساتھ آپشن۔

uniq -i duplicate.txt

آپ مندرجہ ذیل آؤٹ پٹ دیکھیں گے۔

مندرجہ بالا آؤٹ پٹ میں نوٹس ، یونیک نے لائنیں ظاہر نہیں کیں۔ اسے پکڑو۔ اور یہ ایک ٹیکسٹ فائل ہے۔ .

ایک فائل میں آؤٹ پٹ بھیجیں۔

uniq کمانڈ کی آؤٹ پٹ کو کسی فائل میں بھیجنے کے لیے ، آپ آؤٹ پٹ ری ڈائریکشن۔ ( > کردار مندرجہ ذیل ہے:

uniq -i duplicate.txt > otherfile.txt

ٹیکسٹ فائل میں آؤٹ پٹ بھیجتے وقت ، سسٹم کمانڈ کی آؤٹ پٹ نہیں دکھاتا۔ آپ نئی فائل کے مواد کو چیک کرکے دیکھ سکتے ہیں کیٹ کمانڈ.

cat otherfile.txt

آپ دوسرے طریقے بھی استعمال کر سکتے ہیں۔ لینکس میں کسی فائل کو کمانڈ لائن آؤٹ پٹ بھیجیں۔ .

یونیک کے ساتھ ڈپلیکیٹ ڈیٹا کا تجزیہ۔

زیادہ تر وقت لینکس سرورز کا انتظام کرتے ہوئے ، آپ یا تو ٹرمینل پر کام کر رہے ہوں گے یا ٹیکسٹ فائلوں میں ترمیم کریں گے۔ لہذا ، ٹیکسٹ فائل میں لائنوں کی بے کار کاپیوں کو کیسے ہٹایا جائے یہ جاننا آپ کے لینکس مہارت کے سیٹ کا ایک بہت بڑا اثاثہ ہوسکتا ہے۔

ٹیکسٹ فائلوں کے ساتھ کام کرنا مایوس کن ہوسکتا ہے اگر آپ نہیں جانتے کہ کسی فائل میں ٹیکسٹ کو کیسے فلٹر اور ترتیب دیا جائے۔ آپ کے کام کو آسان بنانے کے لیے ، لینکس میں کئی ٹیکسٹ ایڈیٹنگ کمانڈز ہیں جیسے۔ sed اور عجیب جو آپ کو ٹیکسٹ فائلوں اور کمانڈ لائن آؤٹ پٹ کے ساتھ موثر طریقے سے کام کرنے کی اجازت دیتا ہے۔

بانٹیں بانٹیں ٹویٹ ای میل۔ یہ 10 سیڈ مثالیں آپ کو لینکس پاور صارف بنائیں گی۔

لینکس پاور صارف بننا چاہتے ہیں؟ sed کے ساتھ گرفت کرنے میں مدد ملے گی۔ ان 10 sed مثالوں سے سیکھیں۔

اگلا پڑھیں۔
متعلقہ موضوعات۔
  • لینکس
  • لینکس
مصنف کے بارے میں دیپش شرما(79 مضامین شائع ہوئے)

دیپیش ایم یو او میں لینکس کے جونیئر ایڈیٹر ہیں۔ وہ لینکس پر معلوماتی گائیڈ لکھتا ہے ، جس کا مقصد تمام نئے آنے والوں کو خوشگوار تجربہ فراہم کرنا ہے۔ فلموں کے بارے میں یقین نہیں ہے ، لیکن اگر آپ ٹیکنالوجی کے بارے میں بات کرنا چاہتے ہیں تو وہ آپ کا آدمی ہے۔ اس کے فارغ وقت میں ، آپ اسے کتابیں پڑھتے ، موسیقی کی مختلف انواع سنتے ، یا اس کا گٹار بجاتے ہوئے پا سکتے ہیں۔

دیپیش شرما سے مزید

ہماری نیوز لیٹر کو سبسکرائب کریں

ٹیک ٹپس ، جائزے ، مفت ای بکس ، اور خصوصی سودوں کے لیے ہمارے نیوز لیٹر میں شامل ہوں!

سبسکرائب کرنے کے لیے یہاں کلک کریں۔