NLP کیلئے word2vec اور gensim Python پیکجوں میں کیا فرق ہے؟


جواب 1:
  1. Gensim خود ایک تکنیک نہیں ہے۔ گینسیم ایک NLP پیکیج ہے جس میں tf-idf ، لیٹنٹ دیرچلیٹ مختص ، لیٹنٹ سیمنٹک تجزیہ جیسے ٹاپک ماڈلنگ کے کاموں کے لئے بہت سے مشہور فنکشنلٹی کے موثر نفاذ پر مشتمل ہے۔ دوسری طرف ورڈ 2 ویک اسکپ گرام ماڈل پر عمل درآمد ہے جس میں "لفظ" ویکٹر کی نمائندگی کرنے کے لئے ایک بہت بڑا کارپس لیا جاتا ہے اور ہر منفرد "لفظ" کے لئے اصل نمبروں کے ویکٹر تیار کیا جاتا ہے جس کے بعد بہت سے این ایل پی ایپلی کیشنز کے لئے بھی استعمال کیا جاسکتا ہے۔ اس کے اندر ورڈ پورٹ کیا گیا ہے جس میں اضافی فعالیت کا صفحہ پیج پر redimrehurek.com پر ہے