🕐 --:--
-- --
عاجل
⚡ عاجل: كريستيانو رونالدو يُتوّج كأفضل لاعب كرة قدم في العالم ⚡ أخبار عاجلة تتابعونها لحظة بلحظة على خبر ⚡ تابعوا آخر المستجدات والأحداث من حول العالم
⌘K
AI مباشر
398499 مقال 248 مصدر نشط 79 قناة مباشرة 3877 خبر اليوم
آخر تحديث: منذ 0 ثانية

Gathering human feedback

تكنولوجيا
OpenAI Blog
2017/08/03 - 07:00 503 مشاهدة
RL-Teacher is an open-source implementation of our interface to train AIs via occasional human feedback rather than hand-crafted reward functions. The underlying technique was developed as a step towards safe AI systems, but also applies to reinforcement learning problems with rewards that are hard to specify.
مشاركة:

مقالات ذات صلة

AI
يا هلا! اسألني أي شي 🎤