General Knowledge: ChatGPT-তে GPT বলতে কী বোঝায়? সারাদিন AI নিয়ে ঘাঁটাঘাঁটি করলেও অনেকেই জানেন না
- Published by:Ananya Chakraborty
- Reported by:Trending Desk
Last Updated:
GK Story: ChatGPT-তে GPT বলতে কী বোঝায়? এই তিনটি শব্দের অর্থ কী এবং কেন এই এআই মডেল এত জনপ্রিয়, তার বিস্তারিত ব্যাখ্যা
কৃত্রিম বুদ্ধিমত্তা বা আর্টিফিসিয়াল ইন্টেলিজেন্স, সংক্ষেপে AI আধুনিক প্রযুক্তির মেরুদণ্ড হয়ে উঠেছে। চ্যাটবট হোক বা উন্নত ডেটা অ্যানালিটিক্স, AI সর্বত্র তার শক্তি প্রদর্শন করছে। ChatGPT নামটি এখন প্রায় সবার মুখে মুখে ঘোরে। এর বেশ কয়েকটি মডেল রয়েছে, যা GPT-৩, GPT-৪ এবং GPT-৫ নামে পরিচিত। কিন্তু কেউ কি কখনও ভেবে দেখেছেন GPT বলতে কী বোঝায়? এটি কেবল একটি নাম নয়। এই তিনটি অক্ষরের স্বতন্ত্র অর্থ রয়েছে, যা প্রযুক্তির সম্পূর্ণ চিত্র তুলে ধরেরে। অনেকেই তা জানেন না।
advertisement
advertisement
১) জেনারেটিভ: জেনারেটিভ মানে নতুন বিষয়বস্তু তৈরি করা। পূর্ববর্তী AI সিস্টেমগুলি কেবল চিনতে বা অনুমান করতে সক্ষম ছিল, কিন্তু GPT এর চেয়ে অনেক বেশি এগিয়ে। এটি প্রবন্ধ লিখতে, কোড করতে, কবিতা রচনা করতে এবং এমনকি মানুষের মতো কথোপকথনেও সক্ষম। এই ক্ষমতা আসে বৃহৎ ডেটা সেট এবং বোঝার ধরন থেকে শেখার মাধ্যমে, যার ফলে এটি সম্পূর্ণ নতুন বাক্য তৈরি করতে পারে।
advertisement
২) প্রাক-প্রশিক্ষণ: কোনও নির্দিষ্ট কাজের জন্য GPT ব্যবহার করার আগে এটি হাজার হাজার বই, নিবন্ধ, ওয়েবসাইট এবং অন্যান্য টেক্সটের উপরে ভিত্তি করে গঠিত হয়। এই প্রক্রিয়াটিকে প্রাক-প্রশিক্ষণ বলা হয়। এটি মডেলকে ভাষা, ব্যাকরণ, তথ্য এবং সাংস্কৃতিক প্রেক্ষাপটের গভীরতা বুঝতে সাহায্য করে। এই কারণেই GPT কোনও অতিরিক্ত প্রশিক্ষণ ছাড়াই ট্রিভিয়া প্রশ্নের উত্তর দেওয়া থেকে শুরু করে ই-মেলের খসড়া তৈরি করা পর্যন্ত সব কিছু করতে পারে।
advertisement
৩) ট্রান্সফরমার: ট্রান্সফরমার মূলত GPT-এর মস্তিষ্ক, যা এটিকে শক্তিশালী করে তোলে। এটি ২০১৭ সালে Google-এর বিজ্ঞানীরা চালু করেছিলেন। এই প্রযুক্তিটি একটি মনোযোগ ব্যবস্থার উপর ভিত্তি করে তৈরি, যার অর্থ মডেলটি একটি বাক্যের গুরুত্বপূর্ণ শব্দগুলিতে তাদের অবস্থান নির্বিশেষে ফোকাস করতে পারে। RNN বা LSTM-এর মতো পুরনো মডেলগুলি দীর্ঘ বাক্য বুঝতে দুর্বল ছিল, কিন্তু ট্রান্সফরমার এই ত্রুটির সমাধান করেছে।
advertisement
advertisement
জিপিটি পুরনো এআই মডেল থেকে আলাদা: আরএনএন এবং এলএসটিএম-এর মতো পূর্ববর্তী মডেলগুলি শব্দে শব্দে টেক্সট প্রসেস করত, যা তাদের ধীর এবং কম কার্যকর করে তোলে। জিপিটির ট্রান্সফরমার আর্কিটেকচার একই সঙ্গে পুরো টেক্সট বোঝে এবং গুরুত্বপূর্ণ অংশগুলিতে ফোকাস করে। এটি জিপিটিকে দীর্ঘ, সংযুক্ত অনুচ্ছেদ তৈরি করতে দেয়।
advertisement
