Reinforcement learning with prediction-based rewards

علوم

OpenAI Blog

2018/10/31 - 07:00 516 مشاهدة

تحليل ذكي | AI Editorial Analysis

•We’ve developed Random Network Distillation (RND), a prediction-based method for encouraging reinforcement learning agents to explore their environments through curiosity, which for the first time exc...

هذا الخبر من OpenAI Blog. خبر يقدم أدوات ذكاء اصطناعي للتلخيص والترجمة والاستماع.

We’ve developed Random Network Distillation (RND), a prediction-based method for encouraging reinforcement learning agents to explore their environments through curiosity, which for the first time exceeds average human performance on Montezuma’s Revenge.

المصدر: OpenAI Blog | Source: OpenAI Blog

ملاحظة تحريرية | Editorial Note: نُشر هذا المقال في الأصل بواسطة OpenAI Blog. خبر (Khabr) هي منصة إعلامية أردنية مرخّصة تعمل بالذكاء الاصطناعي. نضيف قيمة تحريرية من خلال: تحليل ذكي للأخبار، ملخصات تلقائية، رواية صوتية بالذكاء الاصطناعي، ترجمة متعددة اللغات، وتدقيق الحقائق. هدفنا جعل الأخبار أكثر وضوحاً وسهولةً للقارئ العربي.

This article was originally published by OpenAI Blog. Khabr is a licensed Jordanian AI-powered news platform (Registration #82086). We add editorial value through: AI-powered news analysis, automated summaries, AI audio narration, multi-language translation (Arabic, English, French, Turkish), and AI fact-checking. Our mission is to make news more accessible and understandable for Arabic-speaking audiences worldwide.

قراءة المقال الأصلي

المزيد عن علوم | More on Science

هذا الخبر ضمن تغطية خبر لقسم علوم. نقدّم لك تحليلات ذكية وملخصات يومية لأهم الأخبار من مصادر موثوقة متعددة. المصدر: OpenAI Blog. يوجد 6 مقالات مرتبطة بهذا الموضوع.

This article is part of Khabr's coverage of Science. We provide AI-powered analysis, summaries, and multi-source aggregation to keep you informed. Source: OpenAI Blog. Tags: energy-based models, implicit generation, generalization.

Reinforcement learning with prediction-based rewards

المزيد عن علوم | More on Science

مقالات ذات صلة

تأثير الهواتف الذكية على صحتنا: كيف تحمل فقراتك 27 كجم وتؤدي لخسائر صحية تقدر بـ 12 مليار دولار في الإمارات

Guerre en Ukraine : Ce que l’on sait du « bouclier » antimissiles lancé par neuf pays européens, dont la France

Oxford scientists debunk claims '2,700 people died in heatwaves' - 'Where are these heat deaths?'

الصين تصدر إنذارين لمواجهة الفيضانات المفاجئة

Scientists Uncover Natural Sugar in Cosmic Dust Near Milky Way's Core

شحاتة السيد يكتب : ماذا بعد اكتشاف 1ملم 3 من دماغ الإنسان؟