🕐 --:--
-- --
عاجل
⚡ عاجل: كريستيانو رونالدو يُتوّج كأفضل لاعب كرة قدم في العالم ⚡ أخبار عاجلة تتابعونها لحظة بلحظة على خبر ⚡ تابعوا آخر المستجدات والأحداث من حول العالم
⌘K
AI مباشر
398499 مقال 248 مصدر نشط 79 قناة مباشرة 3877 خبر اليوم
آخر تحديث: منذ 0 ثانية

OpenAI Baselines: ACKTR & A2C

تكنولوجيا
OpenAI Blog
2017/08/18 - 07:00 503 مشاهدة
We’re releasing two new OpenAI Baselines implementations: ACKTR and A2C. A2C is a synchronous, deterministic variant of Asynchronous Advantage Actor Critic (A3C) which we’ve found gives equal performance. ACKTR is a more sample-efficient reinforcement learning algorithm than TRPO and A2C, and requires only slightly more computation than A2C per update.
مشاركة:

مقالات ذات صلة

AI
يا هلا! اسألني أي شي 🎤