🕐 --:--
-- --
عاجل
⚡ عاجل: كريستيانو رونالدو يُتوّج كأفضل لاعب كرة قدم في العالم ⚡ أخبار عاجلة تتابعونها لحظة بلحظة على خبر ⚡ تابعوا آخر المستجدات والأحداث من حول العالم
⌘K
AI مباشر
381033 مقال 245 مصدر نشط 66 قناة مباشرة 4890 خبر اليوم
آخر تحديث: منذ 0 ثانية

Evolved Policy Gradients

تكنولوجيا
OpenAI Blog
2018/04/18 - 07:00 501 مشاهدة
We’re releasing an experimental metalearning approach called Evolved Policy Gradients, a method that evolves the loss function of learning agents, which can enable fast training on novel tasks. Agents trained with EPG can succeed at basic tasks at test time that were outside their training regime, like learning to navigate to an object on a different side of the room from where it was placed during training.
مشاركة:

مقالات ذات صلة

AI
يا هلا! اسألني أي شي 🎤