اہم ترین

اے آئی چیٹ بوٹس پر اندھا بھروسا خطرناک: ہر 3 میں سے ایک جواب غلط

اگر آپ اے آئی چیٹ بوٹس سے ملنے والے جوابات کو سو فیصد درست سمجھتے ہیں تو یہ خبر آپ کے لیے وارننگ ہے۔ گوگل کی جانب سے جاری کی گئی ایک نئی اسیسمنٹ رپورٹ میں انکشاف ہوا ہے کہ جدید ترین اے آئی چیٹ بوٹس بھی مکمل طور پر درست معلومات فراہم کرنے میں ناکام ہیں۔

گوگل نے اپنے حال ہی میں لانچ کیے گئے فیکٹس بینچ مارچ سوئٹ کے ذریعے مختلف بڑے اے آئی ماڈلز کی جانچ کی، جس میں یہ بات سامنے آئی کہ سب سے طاقتور اے آئی ماڈلز کی فیکچول ایکیوریسی بھی 70 فیصد سے زیادہ نہیں ہو پاتی۔ سادہ الفاظ میں کہا جائے تو اے آئی چیٹ بوٹس تقریباً ہر تین میں سے ایک جواب غلط دیتے ہیں۔

جیمنائی 3 پرو رہا سب سے زیادہ درست

گوگل کے اس بینچ مارک ٹیسٹ میں کمپنی کے اپنے ماڈل جیمنائی 3 پرو نے 69 فیصد درستگی کے ساتھ سب سے بہتر کارکردگی دکھائی۔

جبکہ جیمنائی 2.5 پرو اور چیٹ جی پی ٹی 5 نے 62 ، کلاؤڈ 4.5 اوپش نے 51 فیصد اور گروک 4 نے تقریباً 54 فیصد درستگی دکھائی۔

اوپن اے آئی، اینتھروپک اور ایلون مسک کی کمپنی ایکس اے آئی کے دیگر ماڈلز بھی اعلیٰ سطح کی درستگی حاصل کرنے میں ناکام رہے۔ خاص طور پر ملٹی موڈل ٹاسکس (چارٹس، ڈایاگرام اور تصاویر) میں زیادہ تر ماڈلز کی درستگی 50 فیصد سے بھی کم ریکارڈ کی گئی۔

گوگل کا فیکٹس بینچ مارک کیسے کام کرتا ہے؟

یہ بینچ مارک عام اے آئی ٹیسٹس سے مختلف ہے۔ جہاں عام طور پر ماڈلز سے خلاصہ لکھوانا یا کوڈ تیار کروایا جاتا ہے، وہیں فیکٹس بینچ مارک اس بات کی جانچ کرتا ہے کہ ماڈل کی دی گئی معلومات کتنی سچ ہیں۔

ماہرین کے مطابق اے آئی چیٹ بوٹس معلومات حاصل کرنے کا ایک مؤثر ذریعہ ضرور ہیں، لیکن حتمی سچ سمجھ کر ان پر مکمل انحصار کرنا خطرناک ثابت ہو سکتا ہے۔

پاکستان