نماذج اللغة مثل "تشات جي بي تي" و جيميناي قادرة على توليد نصوص مختلفة حول جميع القضايا، لكن توليد النصوص عملية آلية تعتمد على السياق الذي يُعطى لها وليس بالضرورة أن يكون ما تولده صحيح و قد يعاكس الحقائق.
تعرف هذه الظاهرة التي تختلق فيها نماذج اللغة معلومات غير صحيحة باسم الهلوسة، مثلاً في عام ٢٠٢٣ قام محامي باستخراج قضايا مشابهة لقضيته باستخدام "تشات جي بي تي" لكن تبين للقاضي أنها مزيفة و لا وجود لها.
بايدو تحاول الحد من هذه الظاهرة بجعل نماذج اللغة تتضمن آلية للاستدلال لتقوم بعملية تحقق ذاتي من صحة المعلومات التي تولدها بالاعتماد على قاعدة معارف خارجية. وتتضمن عملية التحقق أو الاستدلال الذاتي هذه ثلاث خطوات:
١. إيجاد المصادر: ويتم فيها إيجاد الوثائق المناسبة للإجابة عن السؤال في قاعدة المعارف الخارجية.
٢. اختيار الدليل: ويتم فيها اختيار المستندات مع تحديد الجمل التي تحتوي معلومات مباشرة عن الإجابة و تحدد هذه المستندات كمراجع للجواب مع الجمل المختارة.
٣. تحليل المسارات: ويتم فيها الطلب من نموذج اللغة إنشاء ملخص من كل الجمل المختارة في المرحلة السابقة ثم يقوم بالاعتماد عليه لتوليد الإجابة النهائية.
تسمح هذه الآلية ذات الخطوات الثلاث للذكاء الاصطناعي بأن يُقيّم أجوبته ويتحقق من أن لها أساس في البيانات المزود بها، مما يجعل أجوبته أكثر موثوقية ودقة ويمنحها نوع من الشفافية بالإشارة للمصادر التي تم الاعتماد عليها.
حققت هذه الآلية تحسن ملحوظ في أداء نماذج اللغة باستخدام ٢٠٠٠ مثال فقط للتدريب، وحسنت ليس فقط فعالية أداء النموذج بل فعالية التدريب، إذ أنها لم تحتج لكميات كبيرة من البيانات ولا إلى هدر الكثير من الموارد. لذا فإنها تجعل تطوير وتحسين نماذج الذكاء الاصطناعي متاحة للفرق البحثية الصغيرة في الشركات ومراكز الأبحاث ولم يعد ذلك محصورا بأيدي الشركات الكبرى.
تبرز أهمية هذا الاستدلال الذاتي أكثر في التطبيقات التي تحتاج دقة في الأجوبة أكثر من غيرها، كما هو الحال في المجال الصحي والمالي، فالخطأ قد يتسبب بكوارث كبيرة. لكن تبقى هذه الآلية غير قادرة على القضاء تماماً على ظاهرة الهلوسة والخطأ مازال وارد، وبالتالي التدقيق البشري مازال ضرورياً لكنه أصبح أسهل، فالمعلومات التي تعتمد عليها أصبحت متاحة ويمكن للمدقق العودة بسرعة والتأكد من توافقها وصحتها.