فيديو

جدول المحتويات:

Anonim

تعد القدرة على صياغة الأسئلة عنصرا أساسيا في عملية الإدراك البشري. يعتمد حجر الزاوية في حوارات الإنسان على قدرتنا على التعبير عن الأسئلة بعدة طرق من أجل الحصول على إجابة محددة. إعادة صياغة الأسئلة تساعد البشر على التغلب على عدم اليقين من خلال توضيح نقطة محددة. في السنوات الأخيرة ، حققت مساحة الذكاء الاصطناعي (AI) تقدماً مذهلاً في أنظمة معالجة اللغة الطبيعية (NLP) التي تركز على الإجابة على الأسئلة (QA). على الرغم من التقدم المحرز ، فإن معظم إجابة أسئلة البرمجة اللغوية العصبية من عدم القدرة على التعامل مع عدم اليقين مثل البشر ، من خلال إعادة صياغة الأسئلة ، وإصدار عمليات بحث متعددة ، وتقييم وتجميع الردود. في الآونة الأخيرة ، نشر باحثون من منظمة العفو الدولية من Google ورقة بحثية وحزمة TensorFlow مفتوحة المصدر تقترح تقنية تعلم التعزيز لتدريب الوكلاء على الإجابة الفعالة عن الأسئلة.

الفكرة الكامنة وراء وكلاء الإجابة النشطة عن الأسئلة من Google بسيطة نسبياً. عند طرح سؤال محدد ، سيقوم وكيل إدارة الجودة بإعادة صياغة السؤال عدة مرات من أجل تأكيد الإجابة الصحيحة. على سبيل المثال ، ضع في اعتبارك السؤال " متى ولدت تسلا؟ ". يعيد الوكيل صياغة السؤال بطريقتين مختلفتين: " عندما يكون عيد ميلاد تسلا "و" وهو العام الذي ولد تسلا "، استرجاع الإجابات على كلا السؤالين من نظام ضمان الجودة. باستخدام كل هذه المعلومات ، تقرر إعادة " 10 يوليو 1856 ”.

داخل آغا

يعتمد وكيل الإجابة النشطة عن الأسئلة (AQA) من Google على ثلاثة مكونات أساسية: البيئة ، ونماذج إعادة الصياغة واختيار النماذج. يتفاعل طراز AQA مع بيئة الصندوق الأسود. يستعلم AQA ذلك مع العديد من إصدارات السؤال ، وأخيراً يعرض أفضل الإجابات التي تم العثور عليها.

بيئة الإجابة على الأسئلة

تعتمد بيئة AQA على نماذج تدفق الانتباه BiDirectional (BiDAF). BiDAF هي نماذج الإجابة على الأسئلة العصبية التنافسية القادرة على إنتاج تمثيل سياق دراسي للاستعلام دون تلخيص مبكر. في حالة AQA ، فإن BiDAF قادر على تحديد الإجابات من مسافات متجاورة من وثيقة معينة. عند طرح سؤال ما ، تُرجع البيئة إجابة ثم ، أثناء التدريب ، مكافأة.

إعادة صياغة نموذج

يستخدم AQA من Google نموذجًا تسلسليًا تسلسليًا تسلسليًا لآلية إعادة الصياغة. أصبحت تقنيات التسلسل إلى التسلسل شائعة في العديد من مجالات البرمجة اللغوية العصبية بما في ذلك الترجمة الآلية. إلى حد ما ، الترجمة هي إعادة صياغة بلغة مختلفة 😉. في حالة AQA ، يتلقى نظام إعادة الصياغة سؤالًا ويعيد إعادة صياغته بنفس اللغة الأصلية.

يتمثل أحد الانحرافات الرئيسية عن الطريقة التقليدية للتسلسل إلى التسلسل في أن AQA من Google يستخدم أساليب التعزيز التدريسي وسياسات التدرج. بالنسبة لسؤال معين q0 ، نريد أن نرجع أفضل إجابة ممكنة * ، وتعظيم المكافأة a * = argmaxa R (ajq0). يتم حساب المكافأة فيما يتعلق بالسؤال الأصلي q0 بينما يتم توفير الإجابة لـ q.

اختيار نموذج الإجابة

يتمثل دور نموذج تحديد الإجابات في تحديد أفضل الإجابات من مجموعة من الإجابات التي تم إنشاؤها {a1، a2… .an}. أثناء التدريب ، تتمتع AQA بحق الوصول إلى مكافأة الإجابة التي تم إرجاعها لكل إعادة صياغة qi. ومع ذلك ، في وقت الاختبار يجب أن نتوقع أفضل إجابة *. تم تأطير مشكلة اختيار الأسئلة على أنها مهمة تصنيف ثنائية ، حيث يتم التمييز بين الأداء فوق وتحت متوسط ​​الأداء. في التدريب ، تحسب AQA درجة F1 الخاصة بالإجابة لكل حالة. إذا أعطت إعادة الكتابة إجابة بنتيجة F1 أكبر من متوسط ​​درجة إعادة كتابة أخرى ، يتم تعيين تسمية إيجابية.

قام فريق Google بتقييم خيارات مختلفة مثل FFNNs أو LSTM أو CNNs من أجل تطبيق نموذج تحديد الإجابات. في حين أن جميع الخيارات أسفرت عن نتائج قابلة للمقارنة ، فقد قدمت CNNs بعض المزايا من حيث الكفاءة الحسابية. في نهاية المطاف ، تم تطبيق نموذج اختيار الإجابات لـ AQA باستخدام حفلات الزفاف المدروسة مسبقًا لرموز الاستعلام وإعادة الكتابة والإجابة. لكل تضمين ، تضيف AQA شبكة CNN أحادية البعد متبوعة بتجميع أقصى. يتم بعد ذلك توصيل المتجهات الثلاثة الناتجة وتمريرها عبر شبكة التغذية الأمامية التي تنتج المخرجات.

آغا في العمل

قام فريق Google بتقييم نموذج الإجابة النشطة على الأسئلة (AQA) باستخدام تجارب مختلفة. بشكل خاص ، استخدموا مجموعة بيانات SearchQA التي تستند إلى مجموعة من أدلة Jeopardy. القرائن هي استعلامات مبهمة مثل هذا "والد بلادنا" لم يقطع شجرة الكرز فعلاً. يرتبط كل دليل بالإجابة الصحيحة ، على سبيل المثال جورج واشنطن ، وقائمة المقتطفات من أفضل نتائج بحث Google. يحتوي SearchQA على أكثر من 140 ألف زوج من الأسئلة / الإجابات و قصاصات 6.9M. تم تدريب AQA على مجموعة بيانات SearchQA وتمكن من التفوق على أساليب الإجابة على الأسئلة الأخرى مثل Base-NMT أو MI-SubQuery كما هو موضح في القسم التالي.

إعادة صياغة السؤال هي جزء من جوهر الحوارات البشرية. بينما لا يزال أمام وكلاء الذكاء الاصطناعى طريق طويل للعمل في بيئات لغوية شبيهة بالإنسان ، فإن تقنيات مثل AQA من Google توفر طريقة أكثر فاعلية للتخفيف من عدم اليقين من خلال طرح الأسئلة الصحيحة.

موصى به اختيار المحرر