Python میں ڈیٹا فریم کو ضم کرنے کا طریقہ سیکھیں۔

Python میں ڈیٹا فریم کو ضم کرنے کا طریقہ سیکھیں۔

اگر آپ Python استعمال کرتے ہیں، یہاں تک کہ آسان ترین کاموں کے لیے بھی، آپ شاید اس کی تھرڈ پارٹی لائبریریوں کی اہمیت سے واقف ہوں گے۔ پانڈاس لائبریری، ڈیٹا فریمز کے لیے بہترین تعاون کے ساتھ، ایسی ہی ایک لائبریری ہے۔





آپ Python DataFrames میں متعدد قسم کی فائل درآمد کر سکتے ہیں اور مختلف ڈیٹا سیٹس کو ذخیرہ کرنے کے لیے مختلف ورژن بنا سکتے ہیں۔ ایک بار جب آپ ڈیٹا فریمز کا استعمال کرتے ہوئے اپنا ڈیٹا درآمد کر لیتے ہیں، تو آپ تفصیلی تجزیہ کرنے کے لیے انہیں ضم کر سکتے ہیں۔





بنیادی باتوں سے نمٹنا

اس سے پہلے کہ آپ ضم کرنا شروع کریں، آپ کے پاس ضم کرنے کے لیے ڈیٹا فریمز کی ضرورت ہے۔ ترقیاتی مقاصد کے لیے، آپ تجربہ کرنے کے لیے کچھ ڈمی ڈیٹا بنا سکتے ہیں۔





ازگر میں ڈیٹا فریم بنائیں

پہلے قدم کے طور پر، پانڈاس لائبریری کو اپنی Python فائل میں درآمد کریں۔ پانڈاس ایک تیسری پارٹی کی لائبریری ہے جو Python میں DataFrames کو ہینڈل کرتی ہے۔ آپ استعمال کر سکتے ہیں۔ درآمد لائبریری کو استعمال کرنے کا بیان، جیسا کہ:

import pandas as pd

آپ اپنے کوڈ حوالہ جات کو مختصر کرنے کے لیے لائبریری کے نام کو ایک عرف تفویض کر سکتے ہیں۔



آپ کو لغات بنانے کی ضرورت ہے، جسے آپ ڈیٹا فریمز میں تبدیل کر سکتے ہیں۔ بہترین نتائج کے لیے، دو لغت متغیر بنائیں۔ dict1 اور dict2- معلومات کے مخصوص ٹکڑوں کو ذخیرہ کرنے کے لیے:

dict1 = {"user_id": ["001", "002", "003", "004", "005"], 
"FName": ["John", "Brad", "Ron", "Roald", "Chris"],
"LName": ["Harley", "Cohen", "Dahl", "Harrington", "Kerr-Hislop"]}

dict2 = {"user_id": ["001", "002", "003", "004"], "Age": [15, 28, 34, 24]}

یاد رکھیں، آپ کو دونوں لغت کی اقدار میں ایک مشترکہ عنصر کی ضرورت ہے، تاکہ بعد میں اپنے ڈیٹا فریمز کو یکجا کرنے کے لیے بنیادی کلید کے طور پر کام کریں۔





اپنی ڈکشنریوں کو ڈیٹا فریم میں تبدیل کریں۔

اپنی لغت کی اقدار کو ڈیٹا فریمز میں تبدیل کرنے کے لیے، آپ درج ذیل طریقہ استعمال کر سکتے ہیں:

df1 = pd.DataFrame(dict1) 
df2 = pd.DataFrame(dict2)

کچھ IDEs آپ کو ڈیٹا فریم فنکشن کا حوالہ دے کر اور دبانے سے ڈیٹا فریم کے اندر موجود اقدار کو چیک کرنے دیتے ہیں۔ چلائیں/عمل کریں۔ . بہت ہیں ازگر کے موافق IDEs ، تاکہ آپ اس کو منتخب اور منتخب کر سکیں جو آپ کے لیے سیکھنے میں سب سے آسان ہو۔





  Jupyter نوٹ بک کوڈ کا ٹکڑا

ایک بار جب آپ اپنے ڈیٹا فریمز کے مواد سے مطمئن ہو جائیں تو، آپ انضمام کے مرحلے پر جا سکتے ہیں۔

ضم فنکشن کے ساتھ فریموں کو جوڑنا

مرج فنکشن پہلا Python فنکشن ہے جسے آپ دو ڈیٹا فریمز کو یکجا کرنے کے لیے استعمال کر سکتے ہیں۔ یہ فنکشن درج ذیل ڈیفالٹ دلائل لیتا ہے:

pd.merge(DataFrame1, DataFrame2, how= type of merge)

کہاں:

  • pd پانڈاس لائبریری کے لیے ایک عرف ہے۔
  • ضم وہ فنکشن ہے جو ڈیٹا فریمز کو ضم کرتا ہے۔
  • ڈیٹا فریم 1 اور ڈیٹا فریم 2 ضم کرنے کے لئے دو ڈیٹا فریم ہیں۔
  • کیسے انضمام کی قسم کی وضاحت کرتا ہے۔

کچھ اضافی اختیاری دلائل دستیاب ہیں، جنہیں آپ اس وقت استعمال کر سکتے ہیں جب آپ کے پاس ڈیٹا کا پیچیدہ ڈھانچہ ہو۔

آپ مختلف اقدار کا استعمال کر سکتے ہیں کہ پیرامیٹر کس طرح انضمام کی قسم کی وضاحت کرتا ہے۔ انضمام کی یہ قسمیں واقف ہوں گی اگر آپ ہیں۔ ڈیٹا بیس ٹیبلز میں شامل ہونے کے لیے SQL کا استعمال کیا۔ .

بائیں ضم

بائیں انضمام کی قسم پہلے ڈیٹا فریم کی اقدار کو برقرار رکھتی ہے اور دوسرے ڈیٹا فریم سے مماثل اقدار کو کھینچتی ہے۔

  Jupyter نوٹ بک کوڈ کا ٹکڑا

دائیں انضمام

صحیح انضمام کی قسم دوسرے ڈیٹا فریم کی اقدار کو برقرار رکھتی ہے اور پہلے ڈیٹا فریم سے مماثل اقدار کو کھینچتی ہے۔

  Jupyter نوٹ بک کوڈ کا ٹکڑا

اندرونی ضم

اندرونی انضمام کی قسم دونوں ڈیٹا فریمز سے مماثل اقدار کو برقرار رکھتی ہے اور غیر مماثل اقدار کو ہٹاتی ہے۔

  Jupyter نوٹ بک کوڈ کا ٹکڑا

بیرونی انضمام

بیرونی انضمام کی قسم تمام مماثل اور غیر مماثل اقدار کو برقرار رکھتی ہے اور ڈیٹا فریمز کو ایک ساتھ مضبوط کرتی ہے۔

  Jupyter نوٹ بک کوڈ کا ٹکڑا

Concat فنکشن کا استعمال کیسے کریں۔

دی concat فنکشن Python کے دیگر ضم ہونے والے فنکشنز کے مقابلے میں ایک لچکدار آپشن ہے۔ concat فنکشن کے ساتھ، آپ DataFrames کو عمودی اور افقی طور پر جوڑ سکتے ہیں۔

تاہم، اس فنکشن کو استعمال کرنے کی خرابی یہ ہے کہ یہ کسی بھی غیر مماثل اقدار کو بطور ڈیفالٹ رد کر دیتا ہے۔ کچھ دیگر متعلقہ فنکشنز کی طرح، اس فنکشن میں بھی چند دلائل ہیں، جن میں سے صرف چند ایک کامیاب کنکٹنیشن کے لیے ضروری ہیں۔

concat(dataframes, axis=0, join='outer'/inner)

کہاں:

  • concat وہ فنکشن ہے جو ڈیٹا فریمز میں شامل ہوتا ہے۔
  • ڈیٹا فریم جوڑنے کے لیے ڈیٹا فریمز کا ایک سلسلہ ہے۔
  • محور جوڑ کی سمت کی نمائندگی کرتا ہے، 0 افقی، 1 عمودی ہونا۔
  • شامل ہونا بیرونی یا اندرونی شمولیت کی وضاحت کرتا ہے۔

مندرجہ بالا دو ڈیٹا فریمز کا استعمال کرتے ہوئے، آپ concat فنکشن کو اس طرح آزما سکتے ہیں:

# define the dataframes in a list format 
df_merged_concat = pd.concat([df1, df2])

# print the results of the Concat function
print(df_merged_concat)

مذکورہ کوڈ میں محور اور شمولیت کے دلائل کی عدم موجودگی دونوں ڈیٹاسیٹس کو یکجا کرتی ہے۔ نتیجے کے آؤٹ پٹ میں میچ کی حیثیت سے قطع نظر تمام اندراجات ہیں۔

ونڈوز 10 کو بوٹ ایبل یو ایس بی بنانے کا طریقہ

اسی طرح، آپ concat فنکشن کی سمت اور آؤٹ پٹ کو کنٹرول کرنے کے لیے اضافی دلائل استعمال کر سکتے ہیں۔

تمام مماثل اندراجات کے ساتھ آؤٹ پٹ کو کنٹرول کرنے کے لیے:

# Concatenating all matching values between the two dataframes based on their columns 
df_merged_concat = pd.concat([df1, df2], axis=1, join = 'inner')

print(df_merged_concat)

نتیجہ صرف دو ڈیٹا فریمز کے درمیان تمام مماثل اقدار پر مشتمل ہے۔

  Jupyter نوٹ بک کوڈ کا ٹکڑا

Python کے ساتھ ڈیٹا فریمز کو ضم کرنا

ڈیٹا فریمز Python کا ایک لازمی حصہ ہیں، ان کی لچک اور فعالیت کو مدنظر رکھتے ہوئے۔ ان کے کثیر جہتی استعمال کو دیکھتے ہوئے، آپ ان کا استعمال بہت آسانی کے ساتھ مختلف کاموں کو انجام دینے کے لیے کر سکتے ہیں۔

اگر آپ ابھی بھی Python DataFrames کے بارے میں سیکھ رہے ہیں، تو کچھ Excel فائلوں کو درآمد کرنے کی کوشش کریں، پھر انہیں مختلف طریقوں سے جوڑیں۔