বিএমএস, বাস, শিল্প, উপকরণ কেবলের জন্য।

এলন কস্তুরী এবং জাই টিম একটি লাইভস্ট্রিমের সময় গ্রোক 3 এর সর্বশেষতম সংস্করণটি আনুষ্ঠানিকভাবে চালু করেছিল। এই ইভেন্টের আগে, কস্তুরের 24/7 প্রচারমূলক হাইপ সহ উল্লেখযোগ্য পরিমাণে সম্পর্কিত তথ্য, grok3 এর জন্য অভূতপূর্ব স্তরে বিশ্বব্যাপী প্রত্যাশা বাড়িয়েছে। মাত্র এক সপ্তাহ আগে, ডিপসেক আর 1 -তে মন্তব্য করার সময় একটি লাইভস্ট্রিমের সময় কস্তুরী আত্মবিশ্বাসের সাথে বলেছিলেন, "জাই আরও ভাল এআই মডেল চালু করতে চলেছে।" লাইভ উপস্থাপিত ডেটা থেকে, গ্রোক 3 গণিত, বিজ্ঞান এবং প্রোগ্রামিংয়ের জন্য মানদণ্ডে সমস্ত বর্তমান মূলধারার মডেলকে ছাড়িয়ে গেছে বলে জানা গেছে, কস্তুরী এমনকি দাবি করেছেন যে গ্রোক 3 স্পেসএক্সের মার্স মিশনের সাথে সম্পর্কিত গণনামূলক কাজগুলির জন্য ব্যবহৃত হবে, "তিন বছরের মধ্যে নোবেল পুরষ্কার স্তরে ব্রেকথ্রুগুলি ভবিষ্যদ্বাণী করে।" যাইহোক, এগুলি বর্তমানে কেবল কস্তুরীর বক্তব্য। লঞ্চের পরে, আমি গ্রোক 3 এর সর্বশেষ বিটা সংস্করণটি পরীক্ষা করেছি এবং বড় মডেলগুলির জন্য ক্লাসিক ট্রিক প্রশ্নটি তৈরি করেছি: "কোনটি বড়, 9.11 বা 9.9?" আফসোস, কোনও বাছাইপর্ব বা চিহ্ন ছাড়াই, তথাকথিত স্মার্টেস্ট গ্রোক 3 এখনও এই প্রশ্নের সঠিকভাবে উত্তর দিতে পারেনি। গ্রোক 3 প্রশ্নের অর্থটি সঠিকভাবে সনাক্ত করতে ব্যর্থ হয়েছিল।
এই পরীক্ষাটি দ্রুত অনেক বন্ধুর কাছ থেকে যথেষ্ট মনোযোগ আকর্ষণ করেছিল এবং কাকতালীয়ভাবে, বিদেশে বিভিন্ন অনুরূপ পরীক্ষাগুলি গ্রোক 3 এর মতো বেসিক পদার্থবিজ্ঞান/গণিতের প্রশ্নগুলির সাথে লড়াই করে দেখিয়েছে যে "কোন বলটি পিআইএসএর ঝোঁক টাওয়ার থেকে প্রথমে পড়ে?" সুতরাং, এটি হাস্যকরভাবে "সাধারণ প্রশ্নের উত্তর দিতে অনিচ্ছুক একজন প্রতিভা" হিসাবে লেবেলযুক্ত হয়েছে।

গ্রোক 3 ভাল, তবে এটি আর 1 বা ও 1-প্রো এর চেয়ে ভাল নয়।
গ্রোক 3 অনুশীলনে অনেকগুলি সাধারণ জ্ঞান পরীক্ষায় "ব্যর্থতা" অনুভব করেছে। এক্সআইএআই লঞ্চ ইভেন্টের সময়, কস্তুরী প্রবাস 2 এর গেমের পথ থেকে চরিত্রের ক্লাস এবং প্রভাবগুলি বিশ্লেষণ করতে grok3 ব্যবহার করে প্রদর্শন করেছিলেন, যা তিনি প্রায়শই খেলবেন বলে দাবি করেছিলেন, তবে grok3 দ্বারা সরবরাহিত বেশিরভাগ উত্তর ভুল ছিল। লাইভস্ট্রিম চলাকালীন কস্তুরী এই সুস্পষ্ট বিষয়টি লক্ষ্য করেনি।
এই ভুলটি কেবল বিদেশী নেটিজেনদের গেমিংয়ে "বিকল্প সন্ধানের" জন্য কস্তুরী উপহাস করার জন্য আরও প্রমাণ সরবরাহ করে না তবে ব্যবহারিক প্রয়োগগুলিতে GROK3 এর নির্ভরযোগ্যতা সম্পর্কে উল্লেখযোগ্য উদ্বেগও উত্থাপন করেছিল। এই জাতীয় "প্রতিভা" এর প্রকৃত ক্ষমতা নির্বিশেষে, মঙ্গল গ্রহের অনুসন্ধানের কাজগুলির মতো অত্যন্ত জটিল প্রয়োগের পরিস্থিতিতে এর নির্ভরযোগ্যতা সন্দেহের মধ্যে থেকে যায়।
বর্তমানে, অনেক পরীক্ষক যারা গ্রোক 3 সপ্তাহ আগে অ্যাক্সেস পেয়েছিলেন এবং যারা গতকাল কয়েক ঘন্টা মডেল ক্ষমতা পরীক্ষা করেছিলেন, তারা সকলেই একটি সাধারণ উপসংহারের দিকে ইঙ্গিত করে: "গ্রোক 3 ভাল, তবে এটি আর 1 বা ও 1-প্রো এর চেয়ে ভাল নয়।"

"এনভিডিয়া ব্যাহত" সম্পর্কে একটি সমালোচনামূলক দৃষ্টিভঙ্গি
প্রকাশের সময় আনুষ্ঠানিকভাবে উপস্থাপিত পিপিটি-তে, grok3 চ্যাটবোট অঙ্গনে "অনেক এগিয়ে" দেখানো হয়েছিল, তবে এই চতুরতার সাথে ব্যবহৃত গ্রাফিক কৌশলগুলি: লিডারবোর্ডের উল্লম্ব অক্ষটি কেবল 1400-1300 স্কোর পরিসরে তালিকাভুক্ত ফলাফলগুলি, পরীক্ষার ফলাফলের মূল 1% পার্থক্য এই উপস্থাপনায় ব্যতিক্রমীভাবে উল্লেখযোগ্য বলে মনে করে।

প্রকৃত মডেল স্কোরিংয়ের ফলাফলগুলিতে, গ্রোক 3 ডিপসেক আর 1 এবং জিপিটি -4.0 এর চেয়ে মাত্র 1-2% এগিয়ে, যা ব্যবহারিক পরীক্ষায় অনেক ব্যবহারকারীর অভিজ্ঞতার সাথে মিলে যায় যা "কোনও লক্ষণীয় পার্থক্য" পাওয়া যায় না। GROK3 কেবল তার উত্তরসূরীদের 1%-2%ছাড়িয়েছে।

যদিও গ্রোক 3 বর্তমানে সর্বজনীনভাবে পরীক্ষিত সমস্ত মডেলের চেয়ে বেশি স্কোর করেছে, অনেকে এটিকে গুরুত্ব সহকারে নেন না: সর্বোপরি, জাই এর আগে গ্রোক 2 যুগে "স্কোর ম্যানিপুলেশন" এর জন্য সমালোচিত হয়েছিল। লিডারবোর্ড উত্তর দৈর্ঘ্যের শৈলীর শাস্তি হিসাবে, স্কোরগুলি ব্যাপকভাবে হ্রাস পেয়েছে, শিল্পের অভ্যন্তরীণরা প্রায়শই "উচ্চ স্কোরিং তবে কম ক্ষমতা" এর ঘটনার সমালোচনা করতে পারে।
লিডারবোর্ড "ম্যানিপুলেশন" এর মাধ্যমে বা চিত্রগুলিতে ডিজাইনের কৌশলগুলির মাধ্যমে, তারা জাই এবং কস্তুরীর আবেশকে মডেল সক্ষমতায় "প্যাকটি নেতৃত্ব দেওয়ার" ধারণার সাথে প্রকাশ করে। কস্তুরী এই মার্জিনগুলির জন্য একটি খাড়া দাম প্রদান করেছিল: লঞ্চের সময়, তিনি 200,000 এইচ 100 জিপিইউ (লাইভস্ট্রিমের সময় "100,000 এরও বেশি" দাবি করে) এবং 200 মিলিয়ন ঘন্টা মোট প্রশিক্ষণের সময় অর্জনের জন্য গর্বিত করেছিলেন। এর ফলে কেউ কেউ বিশ্বাস করতে পরিচালিত করে যে এটি জিপিইউ শিল্পের জন্য আরও একটি উল্লেখযোগ্য উত্সাহের প্রতিনিধিত্ব করে এবং খাতটির উপর ডিপসিকের প্রভাবকে "বোকা" হিসাবে বিবেচনা করে। উল্লেখযোগ্যভাবে, কেউ কেউ বিশ্বাস করেন যে নিখুঁত গণ্য শক্তি মডেল প্রশিক্ষণের ভবিষ্যত হবে।
যাইহোক, কিছু নেটিজেন ডিপসেক ভি 3 উত্পাদন করতে দুই মাসের মধ্যে 2000 এইচ 800 জিপিইউগুলির ব্যবহারের তুলনা করে, গণনা করে যে গ্রোক 3 এর প্রকৃত প্রশিক্ষণ বিদ্যুতের খরচ ভি 3 এর চেয়ে 263 গুণ। ডিপসেক ভি 3 এর মধ্যে ব্যবধান, যা 1402 পয়েন্ট অর্জন করেছে এবং গ্রোক 3 মাত্র 100 পয়েন্টের নিচে। এই ডেটা প্রকাশের পরে, অনেকে দ্রুত বুঝতে পেরেছিলেন যে "ওয়ার্ল্ডস সবচেয়ে শক্তিশালী" হিসাবে গ্রোক 3 এর শিরোনামের পিছনে একটি পরিষ্কার প্রান্তিক ইউটিলিটি প্রভাব রয়েছে - আরও শক্তিশালী পারফরম্যান্স উত্পন্ন বৃহত্তর মডেলগুলির যুক্তি হ্রাসকারী রিটার্ন দেখাতে শুরু করেছে।

এমনকি "উচ্চ স্কোরিং তবে কম ক্ষমতা" থাকা সত্ত্বেও, গ্রোক 2 এর ব্যবহারকে সমর্থন করার জন্য এক্স (টুইটার) প্ল্যাটফর্ম থেকে প্রচুর পরিমাণে উচ্চমানের প্রথম পক্ষের ডেটা ছিল। তবে, গ্রোক 3 এর প্রশিক্ষণে, জাই স্বাভাবিকভাবেই "সিলিং" এর মুখোমুখি হয়েছিল যা বর্তমানে ওপেনএইর মুখোমুখি - প্রিমিয়াম প্রশিক্ষণের ডেটার অভাব দ্রুতগতিতে মডেলের সক্ষমতাগুলির প্রান্তিক ইউটিলিটি প্রকাশ করে।
গ্রোক 3 এবং কস্তুরীর বিকাশকারীরা সম্ভবত এই তথ্যগুলি গভীরভাবে বুঝতে এবং সনাক্ত করতে পারে, এ কারণেই কস্তুরী ক্রমাগত সোশ্যাল মিডিয়ায় উল্লেখ করেছেন যে সংস্করণ ব্যবহারকারীরা এখন যে সংস্করণটি অনুভব করছেন তা "এখনও কেবল বিটা" এবং "পুরো সংস্করণটি আগামী মাসগুলিতে প্রকাশিত হবে।" কস্তুরী গ্রোক 3 এর প্রোডাক্ট ম্যানেজারের ভূমিকা নিয়েছে, ব্যবহারকারীরা মন্তব্য বিভাগে যে বিভিন্ন সমস্যাগুলির মুখোমুখি হয়েছিল সে সম্পর্কে প্রতিক্রিয়া জানান।
তবুও, এক দিনের মধ্যে, গ্রোক 3 এর পারফরম্যান্স নিঃসন্দেহে "বৃহত্তর গণনামূলক পেশী" এর উপর নির্ভরশীলদের জন্য আরও শক্তিশালী বড় মডেলগুলি প্রশিক্ষণের জন্য অ্যালার্ম উত্থাপন করেছে: সর্বজনীনভাবে উপলভ্য মাইক্রোসফ্ট তথ্যের উপর ভিত্তি করে ওপেনএআইএর জিপিটি -4 এর প্যারামিটার আকার রয়েছে 1.8 ট্রিলিয়ন প্যারামিটার, জিপিটি -3 এর দশবারের চেয়ে বেশি। গুজবগুলি পরামর্শ দেয় যে জিপিটি -4.5 এর প্যারামিটারের আকার আরও বড় হতে পারে।
মডেল প্যারামিটারের আকার বাড়ার সাথে সাথে প্রশিক্ষণের ব্যয়গুলিও আকাশচুম্বী। গ্রোক 3 এর উপস্থিতি সহ, জিপিটি -4.5 এর মতো প্রতিযোগী এবং অন্যান্যরা যারা প্যারামিটারের আকারের মাধ্যমে আরও ভাল মডেল পারফরম্যান্স অর্জনের জন্য "অর্থ জ্বলন্ত" চালিয়ে যেতে চান তাদের অবশ্যই সিলিংটি বিবেচনা করতে হবে যা এখন স্পষ্টভাবে দৃষ্টিতে রয়েছে এবং কীভাবে এটি কাটিয়ে উঠতে হবে তা নিয়ে চিন্তাভাবনা করতে হবে। এই মুহুর্তে, ওপেনাইয়ের প্রাক্তন প্রধান বিজ্ঞানী ইলিয়া সুতস্কেভার গত ডিসেম্বরে এর আগে বলেছিলেন, "আমরা যে প্রাক-প্রশিক্ষণ নিয়ে পরিচিত তা শেষের দিকে আসবে," যা আলোচনায় পুনরুত্থিত হয়েছে, বড় মডেলদের প্রশিক্ষণের জন্য সত্য পথ খুঁজে পাওয়ার প্রচেষ্টা প্ররোচিত করে।

ইলিয়ার দৃষ্টিভঙ্গি শিল্পে অ্যালার্মটি শোনিয়েছে। তিনি অ্যাক্সেসযোগ্য নতুন ডেটার আসন্ন ক্লান্তির সঠিকভাবে পূর্বাভাস দিয়েছিলেন, এমন একটি পরিস্থিতির দিকে পরিচালিত করে যেখানে ডেটা অধিগ্রহণের মাধ্যমে কর্মক্ষমতা বাড়ানো যায় না, জীবাশ্ম জ্বালানীর ক্লান্তির সাথে এটি তুলনা করে। তিনি ইঙ্গিত দিয়েছিলেন যে "তেলের মতো, ইন্টারনেটে মানব-উত্পাদিত সামগ্রী একটি সীমিত সংস্থান।" সুটস্কেভারের ভবিষ্যদ্বাণীগুলিতে, পরবর্তী প্রজন্মের মডেলগুলি, প্রাক-প্রশিক্ষণ-পরবর্তী প্রশিক্ষণ, "সত্য স্বায়ত্তশাসন" এবং যুক্তিযুক্ত ক্ষমতা "মানব মস্তিষ্কের অনুরূপ" থাকবে।
আজকের প্রাক-প্রশিক্ষিত মডেলগুলির বিপরীতে যা প্রাথমিকভাবে বিষয়বস্তু ম্যাচের উপর নির্ভর করে (পূর্বে শিক্ষিত মডেল সামগ্রীর উপর ভিত্তি করে), ভবিষ্যতের এআই সিস্টেমগুলি মানব মস্তিষ্কের "চিন্তাভাবনা" এর মতো পদ্ধতিতে সমস্যাগুলি সমাধান করার জন্য পদ্ধতিগুলি শিখতে এবং প্রতিষ্ঠা করতে সক্ষম হবে। একজন মানুষ কেবল বেসিক পেশাদার সাহিত্যের সাথে একটি বিষয়ে মৌলিক দক্ষতা অর্জন করতে পারে, যখন একটি এআই বড় মডেলের জন্য কেবলমাত্র প্রাথমিক প্রবেশ-স্তরের কার্যকারিতা অর্জনের জন্য কয়েক মিলিয়ন ডেটা পয়েন্ট প্রয়োজন। এমনকি যখন শব্দটি কিছুটা পরিবর্তন করা হয়, তখনও এই মৌলিক প্রশ্নগুলি সঠিকভাবে বোঝা যায় না, এটি চিত্রিত করে যে মডেলটি বুদ্ধিমত্তায় সত্যই উন্নত হয়নি: নিবন্ধের শুরুতে উল্লিখিত মৌলিক এখনও অবিশ্বাস্য প্রশ্নগুলি এই ঘটনার একটি স্পষ্ট উদাহরণ উপস্থাপন করে।

উপসংহার
যাইহোক, ব্রুট ফোর্সের বাইরে, যদি গ্রোক 3 প্রকৃতপক্ষে শিল্পকে প্রকাশ করতে সফল হয় যে "প্রাক-প্রশিক্ষিত মডেলগুলি তাদের শেষের দিকে এগিয়ে চলেছে," এটি ক্ষেত্রের জন্য উল্লেখযোগ্য প্রভাব ফেলবে।
সম্ভবত গ্রোক 3 এর আশেপাশের উন্মত্ততা ধীরে ধীরে হ্রাস পাওয়ার পরে, আমরা ফি-ফেই লি'র মতো আরও কেসগুলি প্রত্যক্ষ করব "কেবলমাত্র 50 ডলারে একটি নির্দিষ্ট ডেটাসেটে উচ্চ-পারফরম্যান্স মডেলগুলি সুর করার" উদাহরণটি শেষ পর্যন্ত এজিআইয়ের সত্য পথটি আবিষ্কার করে।
নিয়ন্ত্রণ কেবল
কাঠামোগত ক্যাবলিং সিস্টেম
নেটওয়ার্ক এবং ডেটা, ফাইবার-অপটিক কেবল, প্যাচ কর্ড, মডিউল, ফেসপ্লেট
এপ্রি .16 তম -18 তম, 2024 দুবাইতে মধ্য-পূর্ব-শক্তি
এপ্রিল .16 তম -18, 2024 মস্কোতে সিকুরিকা
মে .9 তম, 2024 সাংহাইতে নতুন পণ্য ও টেকনোলজিস লঞ্চ ইভেন্ট
অক্টোবর .22 তম 25, 2024 বেইজিংয়ে সুরক্ষা চীন
নভেম্বর .19-20, 2024 সংযুক্ত ওয়ার্ল্ড কেএসএ
পোস্ট সময়: ফেব্রুয়ারী -19-2025