سیل پژوهش‌های کم‌کیفیت در هوش مصنوعی؛ دانشگاهیان هشدار می‌دهند: اوضاع به‌هم‌ریخته است

کد خبر : ۴۳۹۰۲۴
سیل پژوهش‌های کم‌کیفیت در هوش مصنوعی؛ دانشگاهیان هشدار می‌دهند: اوضاع به‌هم‌ریخته است

پژوهش هوش مصنوعی با مشکل بزرگی به نام «اسلپ» (محتوای بی‌کیفیت و انبوه) روبه‌رو شده است؛ این را استادان دانشگاه می‌گویند: «وضعیت یک آشوب کامل است».

به گزارش اینتیتر، پژوهش هوش مصنوعی با مشکل بزرگی به نام «اسلپ» (محتوای بی‌کیفیت و انبوه) روبه‌رو شده است؛ این را استادان دانشگاه می‌گویند: «وضعیت یک آشوب کامل است».

به گزارش گاردین، یک نفر به تنهایی ادعا کرده که امسال ۱۱۳ مقاله در حوزه هوش مصنوعی نوشته که ۸۹ تای آن‌ها قرار است همین هفته در یکی از معتبرترین کنفرانس‌های جهان در زمینه هوش مصنوعی و یادگیری ماشین (NeurIPS) ارائه شود. این موضوع موجی از تردید و بحث را میان دانشمندان کامپیوتر برانگیخته است.

این فرد، کوین ژو (Kevin Zhu) نام دارد؛ کسی که به‌تازگی مدرک کارشناسی کامپیوتر خود را از دانشگاه برکلی کالیفرنیا گرفته و اکنون شرکت «الگوورس» (Algoverse) را اداره می‌کند؛ شرکتی که به دانش‌آموزان دبیرستانی و دانشجویان کارشناسی پژوهش و منتورینگ هوش مصنوعی می‌دهد و بسیاری از همین دانش‌آموزان دبیرستانی هم‌بسته (co-author) مقالات او هستند. خود ژو سال ۲۰۱۸ از دبیرستان فارغ‌التحصیل شده بود.

مقالاتی که او در دو سال گذشته منتشر کرده موضوعاتی بسیار متنوع و عجیب دارند؛ از «استفاده از هوش مصنوعی برای پیدا کردن دامداران کوچ‌رو در مناطق زیر صحرای آفریقا» تا «تشخیص ضایعات پوستی» و «ترجمه گویش‌های اندونزیایی». او در صفحه لینکدین خود با افتخار نوشته که «بیش از ۱۰۰ مقاله در کنفرانس‌های برتر در یک سال گذشته» منتشر کرده و این مقالات «توسط اوپن‌ای‌آی، مایکروسافت، گوگل، استنفورد، ام‌آی‌تی، آکسفورد و دیگران استناد شده‌اند».

هانی فرید، استاد علوم کامپیوتر دانشگاه برکلی، در مصاحبه‌ای این مقالات را «فاجعه» توصیف کرد و گفت: «من تقریباً مطمئنم که کل این داستان از ابتدا تا انتها فقط «وایب‌کدینگ» (vibe coding) است»؛ یعنی استفاده از هوش مصنوعی برای تولید کد و حتی متن مقاله به صورت سطحی و بدون عمق واقعی.

فرید با پستی در لینکدین به این موضوع اشاره کرد و بلافاصله بحث‌های گسترده‌ای میان پژوهشگران هوش مصنوعی به راه افتاد. بسیاری از آن‌ها گفتند که رشته پرطرفدارشان در حال غرق شدن در سیل مقالات بی‌کیفیت است؛ سیل ناشی از فشارهای آکادمیک و در مواردی استفاده گسترده از ابزارهای هوش مصنوعی برای نوشتن مقاله.

ژو در پاسخ به سؤالات روزنامه گاردین گفت که او فقط «نظارت» (supervision) بر ۱۳۱ مقاله داشته و این‌ها «کارهای تیمی» بوده که در شرکتش انجام شده است. شرکت الگوورس برای یک دوره ۱۲ هفته‌ای آنلاین و انتخابی، ۳۳۲۵ دلار از دانش‌آموزان دبیرستانی و دانشجویان کارشناسی هزینه دریافت می‌کند و به آن‌ها کمک می‌کند مقاله‌هایشان را به کنفرانس‌ها بفرستند.

او گفت: «حداقل من روش‌شناسی و طراحی آزمایش‌ها را بررسی می‌کنم و پیش‌نویس کامل مقالات را قبل از ارسال می‌خوانم و نظر می‌دهم». همچنین ادعا کرد در پروژه‌هایی که به زبان‌شناسی، بهداشت یا آموزش مربوط می‌شد، از «محققان اصلی یا منتورهایی با تخصص مرتبط» استفاده کرده است. در مورد استفاده از هوش مصنوعی هم گفت که فقط از «ابزارهای استاندارد بهره‌وری مثل مدیریت منابع، غلط‌یاب املایی و گاهی مدل‌های زبانی برای ویرایش متن و افزایش وضوح» استفاده کرده‌اند.

آشوب در جامعه بررسی‌کنندگان مقالات

استاندارد بررسی مقالات در هوش مصنوعی با بیشتر رشته‌های علمی دیگر متفاوت است. برخلاف شیمی یا زیست‌شناسی که داوری همتا (peer-review) بسیار سخت‌گیرانه و طولانی است، در هوش مصنوعی و یادگیری ماشین بیشتر مقالات در کنفرانس‌های بزرگ مثل NeurIPS به صورت نسبتاً غیررسمی ارائه می‌شوند.

به گفته هانی فرید، مورد کوین ژو فقط نوک کوه یخ است. کنفرانس NeurIPS امسال با ۲۱٬۵۷۵ مقاله مواجه شده؛ بیش از دو برابر سال ۲۰۲۰. کنفرانس ICLR هم برای سال ۲۰۲۶ نزدیک به ۲۰٬۰۰۰ مقاله دریافت کرده (۷۰٪ افزایش نسبت به سال قبل). وبلاگ چینی 36Kr در آبان‌ماه نوشت: «داوران از کیفیت پایین مقالات شاکی‌اند و حتی مشکوک شده‌اند که برخی کاملاً با هوش مصنوعی نوشته شده‌اند. چرا این ضیافت علمی دیگر مزه سابق را نمی‌دهد؟»

در عین حال، دانشجویان و استادان تحت فشار شدیدی برای افزایش تعداد مقالات خود هستند. به گفته استادان، انتشار حتی ۱۰–۲۰ مقاله باکیفیت در سال برای یک پژوهشگر حرفه‌ای هم کار بسیار سختی است، چه برسد به ۱۰۰–۱۳۰ مقاله.

فرید می‌گوید گاهی دانشجویانش برای بالا بردن تعداد انتشاراتشان «وایب‌کدینگ» می‌کنند. او می‌افزاید: «الان تب و تاب عجیبی برای ورود به هوش مصنوعی وجود دارد».

جفری والینگ، استادیار دانشگاه ویرجینیاتک، هم می‌گوید امسال NeurIPS از تعداد زیادی دانشجوی دکتری برای داوری استفاده کرده و این کار کیفیت داوری را پایین آورده است. «داوران گاهی باید در مدت کوتاه ده‌ها مقاله را بخوانند و معمولاً امکان بازبینی و اصلاح وجود ندارد».

سیل «اسلپ»

با این حال، هنوز هم کارهای بسیار باارزشی از دل همین سیستم بیرون آمده؛ مثلاً مقاله معروف گوگل درباره ترنسفورمرها («Attention Is All You Need») که پایه نظری چت‌جی‌پی‌تی و انقلاب فعلی هوش مصنوعی است، سال ۲۰۱۷ در NeurIPS ارائه شد.

سخنگوی NeurIPS به گاردین گفته که رشد انفجاری این حوزه باعث افزایش چشمگیر تعداد مقالات و فشار زیاد بر سیستم داوری شده است. او تأکید کرد که بیشتر مقالات ژو به کارگاه‌های جانبی (workshops) NeurIPS فرستاده شده که فرآیند انتخاب متفاوتی دارند و معمولاً محل ارائه کارهای پژوهشگران جوان است. اما فرید این توضیح را قانع‌کننده نمی‌داند: «این توجیهی نیست برای اینکه نامت را روی ۱۰۰ مقاله‌ای بگذاری که به هیچ وجه نتوانسته‌ای مشارکت معنادار داشته باشی».

مشکل فراتر از NeurIPS است. کنفرانس ICLR حتی از هوش مصنوعی برای داوری حجم عظیم مقالات استفاده کرد که نتیجه‌اش نظرات پر از استنادهای خیالی و بسیار طولانی با فهرست‌های گلوله‌ای بود (طبق مقاله‌ای در مجله Nature).

احساس افول کیفیت آن‌قدر گسترده شده که حتی «راه‌حل این بحران» خودش موضوع مقالات علمی شده است. در سال ۲۰۲۵ یک مقاله موضعی (position paper) از سه پژوهشگر کره‌ای که به این چالش‌ها پرداخته بود، جایزه بهترین مقاله را در کنفرانس ICML را برد.

هانی فرید می‌گوید شرکت‌های بزرگ و حتی سازمان‌های کوچک ایمنی هوش مصنوعی هم حالا همه چیز را روی arXiv می‌ریزند؛ سایتی که قبلاً فقط برای پیش‌چاپ‌های کم‌خواننده ریاضی و فیزیک بود. نتیجه این کار اینترنت را با حجم عظیمی از آثاری پر کرده که به عنوان «علم» ارائه می‌شوند ولی استانداردهای داوری علمی را طی نکرده‌اند.

هزینه این وضعیت چیست؟ فرید می‌گوید: «دیگر هیچ‌کس – نه روزنامه‌نگار، نه عموم مردم و حتی متخصصان – نمی‌توانند بفهمند در ادبیات علمی هوش مصنوعی واقعاً چه خبر است. نسبت سیگنال به نویز تقریباً صفر شده است. من خودم که به این کنفرانس‌ها می‌روم به‌سختی می‌فهمم چه اتفاقی دارد می‌افتد».

او به دانشجویانش توصیه می‌کند حالا دیگر وارد پژوهش هوش مصنوعی نشوند: «اگر هدف فقط بهینه کردن تعداد مقاله است، کار سختی نیست؛ فقط کار بی‌کیفیت و سطحی تولید کن و کنفرانس‌ها را بمباران کن. اما اگر می‌خواهی کار عمیق و دقیق انجام بدهی، عملاً خلع سلاح شده‌ای و در رقابت عقب می‌مانی».

و خلاصه کلام: «همه چیز یک آشوب کامل است».

نظرات بینندگان