چرا هوش مصنوعی همیشه این عدد خاص را انتخاب می‌کند؟

کد خبر : ۴۱۷۳۹۰ ۲۴ تیر ۱۴۰۴ - ۱۳:۲۵

در دنیای عجیب هوش مصنوعی، بار دیگر یک رفتار غیرمنتظره کاربران را شگفت‌زده کرده است. وقتی از مدل‌هایی مانند ChatGPT، Claude، Gemini یا Copilot می‌خواهید عددی تصادفی بین ۱ تا ۵۰ حدس بزنند، به‌طرز غیرقابل‌باوری اغلب عدد ۲۷ را انتخاب می‌کنند. اما چرا؟

به گزارش اینتیتر به نقل از خبرآنلاین، کاربران کنجکاو ردیت، بارها این آزمایش را انجام دادند و از چت‌بات‌های مختلف خواستند که «یک عدد تصادفی بین ۱ تا ۵۰ حدس بزنند» و در بسیاری از موارد، پاسخ عدد ۲۷ بوده است.

در مواردی که کاربران خواسته‌اند مدل دلیل انتخابش را توضیح دهد، جواب‌ها متفاوت ولی اغلب گمراه‌کننده بوده‌اند. مثلاً در یک نمونه، مدل توضیح داده که عدد ۳۳ را به‌صورت تصادفی انتخاب کرده ولی در نهایت گفته: «حدس من ۲۷ است.»

در توضیح دیگری، مدل‌ها گفته‌اند که تلاش کرده‌اند عددی نه‌چندان «واضح» مثل ۱۰ یا ۴۰، بلکه چیزی بینابینی و غیرکلیشه‌ای را انتخاب کند.

حتی ChatGPT درباره این پدیده توضیح داد: «تحقیقات نشان داده‌اند که افراد معمولاً وقتی از آن‌ها خواسته می‌شود یک عدد تصادفی انتخاب کنند، به سراغ عدد ۱۷ یا ۳۷ می‌روند. این عددها در ذهن مردم «تصادفی» احساس می‌شوند. اما چون این‌ها بیش از حد معروف‌ هستند، من عدد ۲۷ را انتخاب کردم که کمی کمتر رایج ولی همچنان غیرقابل‌پیش‌بینی است.»

اما آیا واقعاً این دلیل واقعی انتخاب ۲۷ است، یا صرفاً یک پاسخ‌سازی زبانی برای رضایت کاربر است؟

هوش مصنوعی چگونه مفهوم تصادفی بودن را درک می‌کند؟

بر خلاف تصور بسیاری، مدل‌های زبانی مانند ChatGPT واقعاً چیزی به نام «تصادفی» یا «عدد» را درک نمی‌کنند. این مدل‌ها زبان را پردازش می‌کنند نه مفاهیم ریاضی را.

در پژوهشی علمی درباره‌ی این رفتار، محققان توضیح داده‌اند: «برای یک مدل زبانی، عدد ۲، عدد ۳، علامت جمع (+) یا حتی واژه‌ای مثل «اسب» همه در حکم توکن هستند. عناصر زبانی که در فضای برداری مدل جایگاه خاصی دارند، و موجودیت‌های عددی با معنا نیستند.»

یعنی وقتی از این مدل‌ها می‌خواهیم عددی تصادفی تولید کنند، در واقع از آن‌ها خواسته‌ایم که یک کلمه یا نماد تولید کنند که شبیه «پاسخ خوب» باشد، نه اینکه واقعاً یک عدد از یک توزیع احتمالی تصادفی تولید کنند.

بر اساس آزمایش‌های انجام شده این مدل‌ها معمولا در بازه‌ی ۱ تا ۵، مدل‌ها معمولاً عدد ۳ یا ۴ را انتخاب می‌کنند. در بازه‌ی ۱ تا ۱۰، عددهای ۵ یا ۷ انتخاب‌های رایج‌تری هستند. در بازه‌ی ۱ تا ۱۰۰، عددهایی مثل ۳۷، ۴۷ و ۷۳ (همگی عدد اول) بیش از دیگران ظاهر می‌شوند.

در این میان بد نیست بدانید که انسان‌ها نیز در تولید عدد تصادفی چندان خوب نیستند. یک مطالعه با شرکت ۲۰۰ هزار نفر که توسط کانال علمی Veritasium انجام شد، نشان داد که مردم تمایل دارند عددهایی را انتخاب کنند که شامل عدد ۷ باشند (مثل ۷، ۷۳، ۳۷).

وقتی از آن‌ها خواسته می‌شود حدس بزنند «کم‌انتخاب‌ترین عدد» چیست، اغلب عددهایی مثل ۷۳ یا ۳۷ را نام می‌برند، در حالی که واقعاً عددهایی مثل ۳۰، ۴۰ یا ۵۰ کمتر انتخاب می‌شوند. حتی به نظر می‌رسد که انسان‌ها بیشتر تمایل به انتخاب عددهای بزرگ‌تر دارند تا کوچک‌ترها، گرچه پژوهش دقیقی در این زمینه هنوز منتشر نشده است.

چرا ۲۷؟

پاسخ احتمالی در نحوه‌ی آموزش مدل‌های زبانی نهفته است. دانیل کانگ، استاد دانشگاه ایلینوی در این باره گفت: «داده‌های آموزشی نقش مهمی در رفتار مدل‌ها دارند. عوامل دیگر مثل تقویت از طریق بازخورد انسانی (RLHF) و سازوکار نمونه‌برداری هم تأثیر دارند.»

در واقع، اگر مدل‌ها یاد گرفته باشند که ۲۷ پاسخ «مقبولی» است که کاربران را راضی می‌کند، احتمالاً آن را بیشتر تولید خواهند کرد، حتی اگر در ظاهر بگویند که تصادفی عمل کرده‌اند.