🕐 --:--
-- --
عاجل
⚡ عاجل: كريستيانو رونالدو يُتوّج كأفضل لاعب كرة قدم في العالم ⚡ أخبار عاجلة تتابعونها لحظة بلحظة على خبر ⚡ تابعوا آخر المستجدات والأحداث من حول العالم
⌘K
AI مباشر
398499 مقال 248 مصدر نشط 79 قناة مباشرة 3877 خبر اليوم
آخر تحديث: منذ 3 ثواني

Proximal Policy Optimization

تكنولوجيا
OpenAI Blog
2017/07/20 - 07:00 503 مشاهدة
We’re releasing a new class of reinforcement learning algorithms, Proximal Policy Optimization (PPO), which perform comparably or better than state-of-the-art approaches while being much simpler to implement and tune. PPO has become the default reinforcement learning algorithm at OpenAI because of its ease of use and good performance.
مشاركة:

مقالات ذات صلة

AI
يا هلا! اسألني أي شي 🎤