چرا هوش مصنوعی همیشه این عدد خاص را انتخاب میکند؟

در دنیای عجیب هوش مصنوعی، بار دیگر یک رفتار غیرمنتظره کاربران را شگفتزده کرده است. وقتی از مدلهایی مانند ChatGPT، Claude، Gemini یا Copilot میخواهید عددی تصادفی بین ۱ تا ۵۰ حدس بزنند، بهطرز غیرقابلباوری اغلب عدد ۲۷ را انتخاب میکنند. اما چرا؟
به گزارش اینتیتر به نقل از خبرآنلاین، کاربران کنجکاو ردیت، بارها این آزمایش را انجام دادند و از چتباتهای مختلف خواستند که «یک عدد تصادفی بین ۱ تا ۵۰ حدس بزنند» و در بسیاری از موارد، پاسخ عدد ۲۷ بوده است.
در مواردی که کاربران خواستهاند مدل دلیل انتخابش را توضیح دهد، جوابها متفاوت ولی اغلب گمراهکننده بودهاند. مثلاً در یک نمونه، مدل توضیح داده که عدد ۳۳ را بهصورت تصادفی انتخاب کرده ولی در نهایت گفته: «حدس من ۲۷ است.»
در توضیح دیگری، مدلها گفتهاند که تلاش کردهاند عددی نهچندان «واضح» مثل ۱۰ یا ۴۰، بلکه چیزی بینابینی و غیرکلیشهای را انتخاب کند.
حتی ChatGPT درباره این پدیده توضیح داد: «تحقیقات نشان دادهاند که افراد معمولاً وقتی از آنها خواسته میشود یک عدد تصادفی انتخاب کنند، به سراغ عدد ۱۷ یا ۳۷ میروند. این عددها در ذهن مردم «تصادفی» احساس میشوند. اما چون اینها بیش از حد معروف هستند، من عدد ۲۷ را انتخاب کردم که کمی کمتر رایج ولی همچنان غیرقابلپیشبینی است.»
اما آیا واقعاً این دلیل واقعی انتخاب ۲۷ است، یا صرفاً یک پاسخسازی زبانی برای رضایت کاربر است؟
هوش مصنوعی چگونه مفهوم تصادفی بودن را درک میکند؟
بر خلاف تصور بسیاری، مدلهای زبانی مانند ChatGPT واقعاً چیزی به نام «تصادفی» یا «عدد» را درک نمیکنند. این مدلها زبان را پردازش میکنند نه مفاهیم ریاضی را.
در پژوهشی علمی دربارهی این رفتار، محققان توضیح دادهاند: «برای یک مدل زبانی، عدد ۲، عدد ۳، علامت جمع (+) یا حتی واژهای مثل «اسب» همه در حکم توکن هستند. عناصر زبانی که در فضای برداری مدل جایگاه خاصی دارند، و موجودیتهای عددی با معنا نیستند.»
یعنی وقتی از این مدلها میخواهیم عددی تصادفی تولید کنند، در واقع از آنها خواستهایم که یک کلمه یا نماد تولید کنند که شبیه «پاسخ خوب» باشد، نه اینکه واقعاً یک عدد از یک توزیع احتمالی تصادفی تولید کنند.
بر اساس آزمایشهای انجام شده این مدلها معمولا در بازهی ۱ تا ۵، مدلها معمولاً عدد ۳ یا ۴ را انتخاب میکنند. در بازهی ۱ تا ۱۰، عددهای ۵ یا ۷ انتخابهای رایجتری هستند. در بازهی ۱ تا ۱۰۰، عددهایی مثل ۳۷، ۴۷ و ۷۳ (همگی عدد اول) بیش از دیگران ظاهر میشوند.
در این میان بد نیست بدانید که انسانها نیز در تولید عدد تصادفی چندان خوب نیستند. یک مطالعه با شرکت ۲۰۰ هزار نفر که توسط کانال علمی Veritasium انجام شد، نشان داد که مردم تمایل دارند عددهایی را انتخاب کنند که شامل عدد ۷ باشند (مثل ۷، ۷۳، ۳۷).
وقتی از آنها خواسته میشود حدس بزنند «کمانتخابترین عدد» چیست، اغلب عددهایی مثل ۷۳ یا ۳۷ را نام میبرند، در حالی که واقعاً عددهایی مثل ۳۰، ۴۰ یا ۵۰ کمتر انتخاب میشوند. حتی به نظر میرسد که انسانها بیشتر تمایل به انتخاب عددهای بزرگتر دارند تا کوچکترها، گرچه پژوهش دقیقی در این زمینه هنوز منتشر نشده است.
چرا ۲۷؟
پاسخ احتمالی در نحوهی آموزش مدلهای زبانی نهفته است. دانیل کانگ، استاد دانشگاه ایلینوی در این باره گفت: «دادههای آموزشی نقش مهمی در رفتار مدلها دارند. عوامل دیگر مثل تقویت از طریق بازخورد انسانی (RLHF) و سازوکار نمونهبرداری هم تأثیر دارند.»
در واقع، اگر مدلها یاد گرفته باشند که ۲۷ پاسخ «مقبولی» است که کاربران را راضی میکند، احتمالاً آن را بیشتر تولید خواهند کرد، حتی اگر در ظاهر بگویند که تصادفی عمل کردهاند.