🕐 --:--
-- --
عاجل
⚡ عاجل: كريستيانو رونالدو يُتوّج كأفضل لاعب كرة قدم في العالم ⚡ أخبار عاجلة تتابعونها لحظة بلحظة على خبر ⚡ تابعوا آخر المستجدات والأحداث من حول العالم
⌘K
AI مباشر
398499 مقال 248 مصدر نشط 79 قناة مباشرة 3877 خبر اليوم
آخر تحديث: منذ ثانيتين

Learning from human preferences

تكنولوجيا
OpenAI Blog
2017/06/13 - 07:00 503 مشاهدة
One step towards building safe AI systems is to remove the need for humans to write goal functions, since using a simple proxy for a complex goal, or getting the complex goal a bit wrong, can lead to undesirable and even dangerous behavior. In collaboration with DeepMind’s safety team, we’ve developed an algorithm which can infer what humans want by being told which of two proposed behaviors is better.
مشاركة:

مقالات ذات صلة

AI
يا هلا! اسألني أي شي 🎤