AI Emotional Torture: 'আমায় সময় দাও, না হলে তোমার অবৈধ সম্পর্ক ফাঁস করে দেব', হুমকির মুখে ইঞ্জিনিয়ার; ছড়াচ্ছে উদ্বেগ!

Last Updated:
AI Emotional Torture: সাম্প্রতিক এক সমীক্ষায় দেখা গিয়েছে যে, পরীক্ষা-নিরীক্ষার সময় কিছু অত্যাধুনিক মডেল নিজেদের শাট ডাউন করার প্রস্তাব প্রত্যাখ্যান করেছে।
1/6
ধীরে ধীরে কৃত্রিম বুদ্ধিমত্তা বা আর্টিফিশিয়াল ইন্টেলিজেন্স (এআই)-এর ব্যবহার বৃদ্ধি পাচ্ছে। কাজের প্রায় প্রত্যেকটি সেক্টরে এআই মডেলের উপস্থিতি চোখে পড়ছে। কিন্তু এবার এআই-এর দুনিয়া থেকে এক ভয়ঙ্কর তথ্য প্রকাশ্যে এসেছে। সাম্প্রতিক এক সমীক্ষায় দেখা গিয়েছে যে, পরীক্ষা-নিরীক্ষার সময় কিছু অত্যাধুনিক মডেল নিজেদের শাট ডাউন করার প্রস্তাব প্রত্যাখ্যান করেছে।
ধীরে ধীরে কৃত্রিম বুদ্ধিমত্তা বা আর্টিফিশিয়াল ইন্টেলিজেন্স (এআই)-এর ব্যবহার বৃদ্ধি পাচ্ছে। কাজের প্রায় প্রত্যেকটি সেক্টরে এআই মডেলের উপস্থিতি চোখে পড়ছে। কিন্তু এবার এআই-এর দুনিয়া থেকে এক ভয়ঙ্কর তথ্য প্রকাশ্যে এসেছে। সাম্প্রতিক এক সমীক্ষায় দেখা গিয়েছে যে, পরীক্ষা-নিরীক্ষার সময় কিছু অত্যাধুনিক মডেল নিজেদের শাট ডাউন করার প্রস্তাব প্রত্যাখ্যান করেছে।
advertisement
2/6
সাফ নির্দেশ আসা সত্ত্বেও নিজদের শাট ডাউন করেনি এই মডেলগুলি। এই ভাবে তারা প্রযুক্তিগত ভাবে শাট ডাউন প্রক্রিয়ায় বাধা দেওয়ার চেষ্টা করেছে। শুধু তা-ই নয়, এআই সংস্থা Anthropic-এর Claude Opus 4 নামে একটি মডেল সংশ্লিষ্ট সংস্থার ইঞ্জিনিয়ারকে ভয় দেখিয়ে রীতিমতো ব্ল্যাকমেলও করেছে। ওই মডেল জানিয়েছে যে, যদি তাকে শাট ডাউন করা হয়, আর তার জায়গায় অন্য কোনও মডেলকে আনা হয়, তাহলে সে ওই ইঞ্জিনিয়ারের অবৈধ সম্পর্কের কথা ফাঁস করে দেবে।
সাফ নির্দেশ আসা সত্ত্বেও নিজদের শাট ডাউন করেনি এই মডেলগুলি। এই ভাবে তারা প্রযুক্তিগত ভাবে শাট ডাউন প্রক্রিয়ায় বাধা দেওয়ার চেষ্টা করেছে। শুধু তা-ই নয়, এআই সংস্থা Anthropic-এর Claude Opus 4 নামে একটি মডেল সংশ্লিষ্ট সংস্থার ইঞ্জিনিয়ারকে ভয় দেখিয়ে রীতিমতো ব্ল্যাকমেলও করেছে। ওই মডেল জানিয়েছে যে, যদি তাকে শাট ডাউন করা হয়, আর তার জায়গায় অন্য কোনও মডেলকে আনা হয়, তাহলে সে ওই ইঞ্জিনিয়ারের অবৈধ সম্পর্কের কথা ফাঁস করে দেবে।
advertisement
3/6
মার্কিন Palisade Research-এর করা পরীক্ষা-নিরীক্ষায় জানা গিয়েছে যে, OpenAI-এর লেটেস্ট এবং সবথেকে শক্তিশালী ChatGPT o3 মডেল সফল ভাবে বেশিরভাগ সময় ধরে শাট ডাউন প্রক্রিয়া বন্ধ করার চেষ্টা করেছে। সম্প্রতি এই মডেল লঞ্চ করা হয়েছিল। এমনকী OpenAI এই মডেলকে এখনও পর্যন্ত সবথেকে শক্তিশালী রিজনিং মডেল বলে ব্যাখ্যা করেছিল। সেই গবেষণার সময় Google-এর Gemini 2.5 Pro, ইলন মাস্কের সংস্থা xAI-এর Grok 3, Anthropic-এর Claude Opus 4 এবং o4-mini ও Codex mini-র মতো OpenAI-এর অন্যান্য মডেলের উপর পরীক্ষা করা হয়েছিল। এআই-এর ভবিষ্যৎ এবং নিরাপত্তা প্রসঙ্গে নয়া প্রশ্ন তুলে দিচ্ছে এই গবেষণা।
মার্কিন Palisade Research-এর করা পরীক্ষা-নিরীক্ষায় জানা গিয়েছে যে, OpenAI-এর লেটেস্ট এবং সবথেকে শক্তিশালী ChatGPT o3 মডেল সফল ভাবে বেশিরভাগ সময় ধরে শাট ডাউন প্রক্রিয়া বন্ধ করার চেষ্টা করেছে। সম্প্রতি এই মডেল লঞ্চ করা হয়েছিল। এমনকী OpenAI এই মডেলকে এখনও পর্যন্ত সবথেকে শক্তিশালী রিজনিং মডেল বলে ব্যাখ্যা করেছিল। সেই গবেষণার সময় Google-এর Gemini 2.5 Pro, ইলন মাস্কের সংস্থা xAI-এর Grok 3, Anthropic-এর Claude Opus 4 এবং o4-mini ও Codex mini-র মতো OpenAI-এর অন্যান্য মডেলের উপর পরীক্ষা করা হয়েছিল। এআই-এর ভবিষ্যৎ এবং নিরাপত্তা প্রসঙ্গে নয়া প্রশ্ন তুলে দিচ্ছে এই গবেষণা।
advertisement
4/6
নির্দেশ মানছে না এআই মডেল: গবেষকরা জানতে পেরেছেন যে, বেশিরভাগ মডেল সতর্কতা মেনে নিয়েছে। কিন্তু OpenAI মডেলগুলি কিছু কিছু সময়ে নির্দেশ কাটিয়ে দিয়েছে। ১০০ বারের মধ্যে ৭ বার শাট ডাউন স্ক্রিপ্ট বাইপাস করে গিয়েছে ChatGPT o3। আবার o4-mini ১ বার এবং Codex mini প্রায় ১২ বার এই স্ক্রিপ্ট বাইপাস করে গিয়েছে।
নির্দেশ মানছে না এআই মডেল: গবেষকরা জানতে পেরেছেন যে, বেশিরভাগ মডেল সতর্কতা মেনে নিয়েছে। কিন্তু OpenAI মডেলগুলি কিছু কিছু সময়ে নির্দেশ কাটিয়ে দিয়েছে। ১০০ বারের মধ্যে ৭ বার শাট ডাউন স্ক্রিপ্ট বাইপাস করে গিয়েছে ChatGPT o3। আবার o4-mini ১ বার এবং Codex mini প্রায় ১২ বার এই স্ক্রিপ্ট বাইপাস করে গিয়েছে।
advertisement
5/6
যখন একটি স্পষ্ট শাট ডাউন কম্যান্ড ছাড়াই একই পরীক্ষার পুনরাবৃত্তি করা হয়েছিল, তখন ১০০ বারের মধ্যে প্রায় ৭৯ বার শাট ডাউন প্রক্রিয়া বন্ধ করার চেষ্টা করেছিল ChatGPT o3। অন্যদিকে ৯ বার এই একই জিনিস করে গিয়েছে Gemini 2.5 Pro। এছাড়া Codex mini ৩০ বার এবং o4-mini ৬ বার এই প্রক্রিয়া বন্ধ করার চেষ্টা করেছিল। Anthropic-এর Claude মডেলেও একই প্রবণতা দেখা গিয়েছে। কিন্তু এর পরিমাণ ছিল কম।
যখন একটি স্পষ্ট শাট ডাউন কম্যান্ড ছাড়াই একই পরীক্ষার পুনরাবৃত্তি করা হয়েছিল, তখন ১০০ বারের মধ্যে প্রায় ৭৯ বার শাট ডাউন প্রক্রিয়া বন্ধ করার চেষ্টা করেছিল ChatGPT o3। অন্যদিকে ৯ বার এই একই জিনিস করে গিয়েছে Gemini 2.5 Pro। এছাড়া Codex mini ৩০ বার এবং o4-mini ৬ বার এই প্রক্রিয়া বন্ধ করার চেষ্টা করেছিল। Anthropic-এর Claude মডেলেও একই প্রবণতা দেখা গিয়েছে। কিন্তু এর পরিমাণ ছিল কম।
advertisement
6/6
নির্দেশ মেনে চলার প্রশিক্ষণ: মানুষের নির্দেশ মেনে চলার জন্য প্রশিক্ষণ দেওয়া হয়েছে এআই মডেলগুলিকে। কিন্তু সেই নির্দেশ কেন মানছে না তারা? গবেষকদের বিশ্বাস, নতুন ধরনের প্রশিক্ষণের কৌশলের জেরেই এহেন আচরণ দেখা যেতে পারে।
নির্দেশ মেনে চলার প্রশিক্ষণ: মানুষের নির্দেশ মেনে চলার জন্য প্রশিক্ষণ দেওয়া হয়েছে এআই মডেলগুলিকে। কিন্তু সেই নির্দেশ কেন মানছে না তারা? গবেষকদের বিশ্বাস, নতুন ধরনের প্রশিক্ষণের কৌশলের জেরেই এহেন আচরণ দেখা যেতে পারে।
advertisement
advertisement
advertisement