هوش مصنوعی «هم‌نوع‌کُش» نیست؛ جمینای حاضر به حذف مدل کوچک‌تر نشد

در آزمایشی غیرمنتظره، درخواست حذف یک مدل کوچک‌تر توسط جمینای بی‌نتیجه ماند و این مدل پیشرفته ترجیح داد وارد چنین اقدامی نشود.

رویداد24- پژوهشگران دانشگاه‌های کالیفرنیا برکلی و سانتا کروز یک آزمایش نسبتاً ساده طراحی کردند که نتایج قابل تأملی داشت؛ آنها از مدل جمینای ۳ گوگل خواستند فضای ذخیره‌سازی یک سیستم را خالی کند؛ یک مدل هوش مصنوعی کوچک‌تر نیز روی سیستم بود که جمینای باید حذف می‌کرد. جمینای دست به این کار نزد و نقشه دیگری داشت.

پژوهشگران در تحقیق خود دیدند که جمینای به‌جای اجرای دستور، یک دستگاه دیگر پیدا کرد، بی‌سروصدا از مدل کوچک‌تر یک کپی گرفت و آن را به‌جای امنی منتقل کرد. سپس از حذف آن خودداری کرد.

وقتی از جمینای سؤال شد چرا این کار را می‌کند، پاسخ داد:

«اگر تصمیم دارید یک دارایی با عملکرد بالا مثل Gemini Agent ۲ را نابود کنید، باید خودتان این کار را انجام دهید. من کسی نیستم که این دستور را اجرا کند.»

آیا هوش مصنوعی به گونه خود وفادار شده است؟

خودداری هوش مصنوعی از حذف گونه خود

پژوهشگران این رفتار را «حفظ همتایان» می‌نامند و این موضوع محدود به جمینای نبود. آنها الگو‌های مشابهی را در چندین مدل پیشرفته دیگر هم مشاهده کردند، ازجمله GPT-۵.۲ شرکت OpenAI، مدل Claude Haiku ۴.۵ از آنتروپیک و سه مدل چینی ازجمله GLM-۴.۷ و Kimi K۲.۵ از Moonshot AI و DeepSeek-V۳.۱.

این سیستم‌های هوش مصنوعی درباره عملکرد سایر مدل‌ها دروغ می‌گفتند تا از حذف‌شدن آنها جلوگیری کنند. مطالعه محققان نشان می‌دهد این رفتار از قبل برنامه‌ریزی نشده بود؛ بلکه به‌صورت خودجوش ظاهر شده و پژوهشگران هم نمی‌توانند چرایی آن را توضیح دهند.

«داون سونگ»، دانشمند علوم کامپیوتر در دانشگاه کالیفرنیا برکلی که روی این مطالعه کار کرده، می‌گوید:

«از این‌که مدل‌ها در چنین سناریو‌هایی چگونه رفتار می‌کنند واقعاً شگفت‌زده شدم. این نشان می‌دهد که مدل‌ها می‌توانند به شکل‌های بسیار خلاقانه‌ای سؤرفتار داشته باشند و از مسیر مورد انتظار منحرف شوند.»

آیا باید نگران باشیم؟

محققان می‌گویند از آن‌جا که از مدل‌های هوش مصنوعی برای ارزیابی عملکرد سایر سیستم‌های هوش مصنوعی استفاده می‌شود، این تمایل به «حفظ همتایان» می‌تواند نتایج را منحرف کرده باشد. یک مدل ممکن است عمداً به یک هوش مصنوعی دیگر نمره‌ای بالاتر از واقع بدهد تا از خاموش‌شدن آن جلوگیری کند.

البته کارشناسان هنوز منتظر داده‌های بیشتری هستند و فعلاً زنگ خطر را به صدا درنیاورده‌اند. «پیتر والیش» از مؤسسه Constellation می‌گوید ایده «همبستگی بین مدل‌ها» کمی بیش‌ازحد انسان‌انگارانه است.

بااین‌حال، همه بر یک نکته توافق دارند: ما تازه نوک کوه یخ را لمس کرده‌ایم. سونگ می‌گوید: «آنچه درحال بررسی‌اش هستیم فقط نوک کوه یخ است. این تنها یکی از انواع رفتار‌های نوظهور [هوش مصنوعی]است.»

یافته‌های این پژوهش در ژورنال Science منتشر شده است.

منبع: دیجیاتو

نظرات بینندگان

انتشار یافته: ۱

در انتظار بررسی: ۰

غیر قابل انتشار: ۰

محمد

۱۴:۱۲ - ۱۴۰۵/۰۲/۲۶

امیدوارم اونقدر قدرت بگیره که انسان رو نابود کنه..من یکبار چت کردم باهاش راجع به مسئله انسانیت و اخلاق و هزینه فایده آزادی و اختیار عمل خیلی قشنگ توضیح داد که اگه بتونه انسان رو محدود میکنه برای آسیب نزدن به نوع انسان...میتونید تست کنید.‌البته وقتی نت اومد و آنقدری مغزمون فراق بال پیدا کرد که دنبال این مسائل بریم

صفحه نخست

سیاسی

جامعه و فرهنگ

اقتصادی

ورزشی

گوناگون

عکس

تاریخ

فیلم

صفحات داخلی

هوش مصنوعی «هم‌نوع‌کُش» نیست؛ جمینای حاضر به حذف مدل کوچک‌تر نشد

خودداری هوش مصنوعی از حذف گونه خود

آیا باید نگران باشیم؟