استفاده از هوش مصنوعی chatgpt4 برای تبدیل شدن به یک بازیکن حرفه ای در ماینکرافت
محققان هوش مصنوعی یک ربات ماینکرافت ساختهاند که میتواند قابلیتهای خود را در دنیای باز بازی کاوش کرده و گسترش دهد – اما برخلاف سایر رباتها، این ربات اساساً کد خود را از طریق آزمون و خطا و تعداد زیادی جستارهای GPT-4 نوشت.
به گزارش پایگاه خبری رسا نشر – این سیستم آزمایشی که وویجر نامیده میشود، نمونهای از یک «عامل تجسمشده» است، یک هوش مصنوعی که میتواند آزادانه و هدفمند در یک محیط شبیهسازی شده یا واقعی حرکت کند و عمل کند. هوش مصنوعی و چت باتهای نوع دستیار شخصی مجبور نیستند واقعاً کارها را انجام دهند، چه رسد به اینکه برای انجام آن کارها در دنیای پیچیده حرکت کنند. اما این دقیقاً همان کاری است که از یک ربات خانگی انتظار می رود در آینده انجام دهد، بنابراین تحقیقات زیادی در مورد چگونگی انجام این کار وجود دارد.
Minecraft مکان خوبی برای آزمایش چنین چیزهایی است زیرا یک نمایش بسیار (بسیار) تقریبی از دنیای واقعی، با قوانین و فیزیک ساده و سرراست است، اما همچنین به اندازه کافی پیچیده و باز است که کارهای زیادی برای انجام دادن یا امتحان کردن وجود دارد. شبیه سازهای هدفمند نیز عالی هستند، اما محدودیت های خاص خود را دارند.
MineDojo یک چارچوب شبیهسازی است که حول Minecraft ساخته شده است، زیرا شما نمیتوانید فقط یک هوش مصنوعی تصادفی را در آنجا قرار دهید و انتظار داشته باشید که بفهمد همه این بلوکها و خوکها چه میکنند. سازندگان آن (همپوشانی های زیادی با تیم Voyager) ویدیوهای یوتیوب درباره بازی، رونوشت ها، مقالات ویکی، و تعداد زیادی پست رد ایت از minecraft، در میان داده های دیگر را گرد هم می آورند، بنابراین کاربران می توانند یک هوش مصنوعی ایجاد یا تنظیم کنند. از آنها الگوبرداری کنید همچنین این امکان را فراهم میکند که این مدلها با دیدن اینکه چقدر خوب کارهایی مانند ساختن حصار دور یک لاما یا پیدا کردن و استخراج الماس را انجام میدهند، کم و بیش عینی ارزیابی شوند.
وویجر در این وظایف عالی عمل می کند و عملکرد بسیار بهتری نسبت به تنها مدل نزدیک به آن یعنی Auto-GPT دارد. اما آنها رویکرد مشابهی دارند: استفاده از GPT-4 برای نوشتن کد خود در حین حرکت.
معمولاً شما فقط یک مدل را با تمام دادههای خوب Minecraft آموزش میدهید و امیدوار هستید که بفهمد چگونه هنگام غروب خورشید با اسکلتها مبارزه کند. با این حال، Voyager نسبتاً ساده شروع میکند و همانطور که در بازی با چیزهایی روبرو میشود، گفتگوی داخلی کمی با GPT-4 در مورد اینکه چه کاری باید انجام دهد و چگونه انجام میدهد، دارد.
به عنوان مثال، شب می شود و آن اسکلت ها بیرون می آیند. نماینده یک ایده کلی از این موضوع دارد، اما از خود می پرسد، یک بازیکن خوب این بازی وقتی هیولاهایی در این نزدیکی وجود دارد، چه کار می کند؟ خوب، GPT-4 میگوید، اگر میخواهید با خیال راحت دنیا را کاوش کنید، میخواهید یک شمشیر بسازید و مجهز کنید، سپس اسکلت را با آن بکوبید و در عین حال از ضربه خوردن اجتناب کنید. و این حس کلی از اینکه چه باید کرد به اهداف ملموس تبدیل می شود: جمع آوری سنگ و چوب، ساختن شمشیر روی میز کاردستی، تجهیز آن و مبارزه با اسکلت.
پس از انجام این کارها، آنها وارد یک کتابخانه مهارت های عمومی می شوند تا بعداً، زمانی که کار این است که «به اعماق غار بروید تا سنگ آهن پیدا کنید»، نیازی به یادگیری جنگیدن دوباره از ابتدا نباشد. هنوز هم از GPT استفاده میکند، اما از GPT-3.5 ارزانتر و سریعتر استفاده میکند، که به آن مهارتهای مرتبط با یک موقعیت خاص را میگوید – بنابراین سعی نمیکند اسکلت را استخراج کند و با سنگ معدن مبارزه کند.
این شبیه به عاملی مانند Auto-GPT است که وقتی با رابطی مواجه میشود که هنوز نمیشناسد، باید به خود یاد دهد که در آن حرکت کند تا بتواند به هدفش برسد. اما Minecraft یک محیط بسیار عمیق تر از آن است که برای حل آن استفاده می شود، بنابراین یک عامل تخصصی مانند Voyager بسیار بهتر عمل می کند. این ربات ها چیزهای بیشتری پیدا می کند، مهارت های بیشتری را می آموزد و منطقه بسیار بیشتری را نسبت به سایر ربات ها کاوش می کند.
جالب است، اما شاید تعجب آور نباشد، GPT-4 هنگام تولید کد مفید، زمین را با GPT-3.5 (یعنی ChatGPT) پاک می کند. آزمایشی که جایگزین اولی با دومی شد، باعث شد که عامل در اوایل، شاید حتی به معنای واقعی کلمه، به دیوار برخورد کند و بهبود نیابد. ممکن است از صحبت کردن با این دو مدل مشخص نباشد که یکی بسیار باهوشتر است، اما حقیقت این است که برای انجام یک مکالمه ظاهراً هوشمند، لازم نیست بهویژه باهوش باشید (از من بپرسید از کجا میدانم). کدنویسی بسیار دشوارتر است و GPT-4 یک به روز رسانی بزرگ در آنجا بود.
هدف این تحقیق منسوخ شدن بازیکنان Minecraft نیست، بلکه یافتن روشهایی است که مدلهای هوش مصنوعی نسبتاً ساده میتوانند بر اساس «تجارب» خود، به دلیل نداشتن کلمه بهتر، خود را بهبود بخشند. اگر میخواهیم رباتهایی داشته باشیم که در خانهها، بیمارستانها و دفاتر ما به ما کمک کنند، آنها باید این درسها را یاد بگیرند و در اقدامات بعدی به کار ببرند.
نظرات بسته شده است.