ডিপসিক: দ্য ডিসরাপ্টিভ ওয়ান, এআই ল্যান্ডস্কেপে বিপ্লব ঘটাচ্ছে

আইপিইউ ওয়াটন গ্রুপ

ভূমিকা

প্রতিযোগী বৃহৎ মডেল, বাজারের অংশীদারিত্বের জন্য প্রতিযোগিতাকারী ক্লাউড সরবরাহকারী এবং কঠোর পরিশ্রমী চিপ প্রস্তুতকারকদের মধ্যে চলমান উদ্বেগ - ডিপসিক প্রভাব অব্যাহত রয়েছে।

বসন্ত উৎসব শেষ হওয়ার সাথে সাথে, ডিপসিককে ঘিরে উত্তেজনা তীব্র থাকে। সাম্প্রতিক ছুটির দিনটি প্রযুক্তি শিল্পের মধ্যে প্রতিযোগিতার একটি উল্লেখযোগ্য অনুভূতি তুলে ধরেছে, অনেকেই এই "ক্যাটফিশ" নিয়ে আলোচনা এবং বিশ্লেষণ করছেন। সিলিকন ভ্যালি এক অভূতপূর্ব সংকটের মধ্য দিয়ে যাচ্ছে: ওপেন-সোর্সের সমর্থকরা আবার তাদের মতামত প্রকাশ করছেন, এমনকি ওপেনএআইও পুনর্মূল্যায়ন করছে যে এর ক্লোজড-সোর্স কৌশলটি সেরা পছন্দ কিনা। কম গণনামূলক খরচের নতুন দৃষ্টান্ত এনভিডিয়ার মতো চিপ জায়ান্টদের মধ্যে একটি চেইন প্রতিক্রিয়া সৃষ্টি করেছে, যার ফলে মার্কিন স্টক মার্কেট ইতিহাসে একদিনের বাজার মূল্যের রেকর্ড ক্ষতি হয়েছে, যখন সরকারী সংস্থাগুলি ডিপসিক দ্বারা ব্যবহৃত চিপগুলির সম্মতি তদন্ত করছে। বিদেশে ডিপসিকের মিশ্র পর্যালোচনার মধ্যে, অভ্যন্তরীণভাবে, এটি অসাধারণ বৃদ্ধি অনুভব করছে। R1 মডেল চালু হওয়ার পর, সংশ্লিষ্ট অ্যাপটি ট্র্যাফিকের বৃদ্ধি দেখেছে, যা ইঙ্গিত দেয় যে অ্যাপ্লিকেশন সেক্টরে বৃদ্ধি সামগ্রিক এআই ইকোসিস্টেমকে এগিয়ে নিয়ে যাবে। ইতিবাচক দিক হল যে ডিপসিক অ্যাপ্লিকেশন সম্ভাবনাগুলিকে প্রসারিত করবে, যা পরামর্শ দেয় যে চ্যাটজিপিটির উপর নির্ভর করা ভবিষ্যতে এত ব্যয়বহুল হবে না। এই পরিবর্তনটি OpenAI-এর সাম্প্রতিক কার্যকলাপে প্রতিফলিত হয়েছে, যার মধ্যে রয়েছে DeepSeek R1-এর প্রতিক্রিয়ায় বিনামূল্যে ব্যবহারকারীদের জন্য o3-mini নামক একটি যুক্তি মডেলের ব্যবস্থা করা, সেইসাথে পরবর্তী আপগ্রেড যা o3-mini-এর চিন্তাধারাকে জনসাধারণের কাছে প্রকাশ করেছে। অনেক বিদেশী ব্যবহারকারী এই উন্নয়নের জন্য DeepSeek-এর প্রতি কৃতজ্ঞতা প্রকাশ করেছেন, যদিও এই চিন্তাধারা একটি সারসংক্ষেপ হিসেবে কাজ করে।

আশাবাদীভাবে, এটা স্পষ্ট যে ডিপসিক দেশীয় খেলোয়াড়দের একত্রিত করছে। প্রশিক্ষণ খরচ কমানোর উপর জোর দিয়ে, বিভিন্ন আপস্ট্রিম চিপ নির্মাতারা, মধ্যবর্তী ক্লাউড সরবরাহকারী এবং অসংখ্য স্টার্টআপ সক্রিয়ভাবে ইকোসিস্টেমে যোগ দিচ্ছে, ডিপসিক মডেল ব্যবহারের জন্য খরচ দক্ষতা বৃদ্ধি করছে। ডিপসিকের গবেষণাপত্র অনুসারে, V3 মডেলের সম্পূর্ণ প্রশিক্ষণের জন্য মাত্র 2.788 মিলিয়ন H800 GPU ঘন্টা প্রয়োজন এবং প্রশিক্ষণ প্রক্রিয়া অত্যন্ত স্থিতিশীল। 405 বিলিয়ন প্যারামিটার সহ লামা 3 এর তুলনায় প্রাক-প্রশিক্ষণ খরচ দশ গুণ কমানোর জন্য MoE (বিশেষজ্ঞদের মিশ্রণ) স্থাপত্য অত্যন্ত গুরুত্বপূর্ণ। বর্তমানে, V3 হল প্রথম সর্বজনীনভাবে স্বীকৃত মডেল যা MoE-তে এত উচ্চ স্পার্সিটি প্রদর্শন করে। উপরন্তু, MLA (মাল্টি লেয়ার অ্যাটেনশন) synergistically কাজ করে, বিশেষ করে যুক্তির দিকগুলিতে। "MoE যত বেশি স্পার্স হবে, গণনার শক্তি সম্পূর্ণরূপে ব্যবহার করার জন্য যুক্তির সময় ব্যাচের আকার তত বেশি প্রয়োজন, KVCache-এর আকার মূল সীমাবদ্ধকারী ফ্যাক্টর; MLA উল্লেখযোগ্যভাবে KVCache-এর আকার হ্রাস করে," AI প্রযুক্তি পর্যালোচনার জন্য একটি বিশ্লেষণে উল্লেখ করেছেন চুয়ানজিং টেকনোলজির একজন গবেষক। সামগ্রিকভাবে, ডিপসিকের সাফল্য কেবল একটি প্রযুক্তির সমন্বয়ে নয়, বরং বিভিন্ন প্রযুক্তির সমন্বয়ে নিহিত। শিল্পের অভ্যন্তরীণ ব্যক্তিরা ডিপসিক দলের ইঞ্জিনিয়ারিং দক্ষতার প্রশংসা করেন, সমান্তরাল প্রশিক্ষণ এবং অপারেটর অপ্টিমাইজেশনে তাদের উৎকর্ষতা উল্লেখ করে, প্রতিটি বিবরণ পরিমার্জন করে যুগান্তকারী ফলাফল অর্জন করে। ডিপসিকের ওপেন-সোর্স পদ্ধতি বৃহৎ মডেলগুলির সামগ্রিক বিকাশকে আরও উৎসাহিত করে এবং এটি প্রত্যাশিত যে যদি একই ধরণের মডেলগুলি ছবি, ভিডিও এবং আরও অনেক কিছুতে প্রসারিত হয়, তবে এটি শিল্প জুড়ে চাহিদাকে উল্লেখযোগ্যভাবে উদ্দীপিত করবে।

তৃতীয় পক্ষের যুক্তি পরিষেবার সুযোগ

তথ্য থেকে জানা যায় যে, মুক্তির পর থেকে, ডিপসিক মাত্র ২১ দিনের মধ্যে ২২.১৫ মিলিয়ন দৈনিক সক্রিয় ব্যবহারকারী (DAU) অর্জন করেছে, যা ChatGPT-এর ব্যবহারকারী বেসের ৪১.৬% অর্জন করেছে এবং Doubao-এর ১৬.৯৫ মিলিয়ন দৈনিক সক্রিয় ব্যবহারকারীকে ছাড়িয়ে গেছে, এইভাবে বিশ্বব্যাপী দ্রুততম বর্ধনশীল অ্যাপ্লিকেশন হয়ে উঠেছে, ১৫৭টি দেশ/অঞ্চলে অ্যাপল অ্যাপ স্টোরের শীর্ষে রয়েছে। যাইহোক, ব্যবহারকারীদের ভিড় যখন বাড়ছে, তখন সাইবার হ্যাকাররা নিরলসভাবে ডিপসিক অ্যাপে আক্রমণ করছে, যার ফলে এর সার্ভারগুলিতে উল্লেখযোগ্য চাপ তৈরি হচ্ছে। শিল্প বিশ্লেষকরা বিশ্বাস করেন যে এটি আংশিকভাবে ডিপসিক প্রশিক্ষণের জন্য কার্ড স্থাপন করছে এবং যুক্তির জন্য পর্যাপ্ত গণনা ক্ষমতার অভাব রয়েছে। একজন শিল্প অভ্যন্তরীণ ব্যক্তি এআই টেকনোলজি রিভিউকে জানিয়েছেন, "ঘন ঘন সার্ভার সমস্যাগুলি ফি চার্জ করে বা আরও মেশিন কেনার জন্য অর্থায়ন করে সহজেই সমাধান করা যেতে পারে; শেষ পর্যন্ত, এটি ডিপসিকের সিদ্ধান্তের উপর নির্ভর করে।" এটি প্রযুক্তি বনাম উৎপাদনের উপর মনোযোগ কেন্দ্রীভূত করার ক্ষেত্রে একটি বিনিময় উপস্থাপন করে। ডিপসিক মূলত স্ব-জীবিকার জন্য কোয়ান্টাম কোয়ান্টাইজেশনের উপর নির্ভর করেছে, সামান্য বাহ্যিক তহবিল পেয়েছে, যার ফলে তুলনামূলকভাবে কম নগদ প্রবাহের চাপ এবং একটি বিশুদ্ধ প্রযুক্তিগত পরিবেশ তৈরি হয়েছে। বর্তমানে, উপরে উল্লিখিত সমস্যাগুলির আলোকে, কিছু ব্যবহারকারী সোশ্যাল মিডিয়ায় ডিপসিককে ব্যবহারের সীমা বাড়ানোর জন্য বা ব্যবহারকারীর স্বাচ্ছন্দ্য বাড়ানোর জন্য অর্থপ্রদানের বৈশিষ্ট্যগুলি চালু করার জন্য অনুরোধ করছেন। উপরন্তু, ডেভেলপাররা অপ্টিমাইজেশনের জন্য অফিসিয়াল এপিআই বা তৃতীয় পক্ষের এপিআই ব্যবহার শুরু করেছেন। তবে, ডিপসিকের ওপেন প্ল্যাটফর্ম সম্প্রতি ঘোষণা করেছে, "বর্তমান সার্ভার রিসোর্সগুলি দুষ্প্রাপ্য, এবং এপিআই পরিষেবা রিচার্জ স্থগিত করা হয়েছে।"

 

এটি নিঃসন্দেহে AI অবকাঠামো খাতে তৃতীয় পক্ষের বিক্রেতাদের জন্য আরও সুযোগ উন্মুক্ত করে। সম্প্রতি, অসংখ্য দেশীয় এবং আন্তর্জাতিক ক্লাউড জায়ান্ট DeepSeek-এর মডেল API চালু করেছে - বিদেশী জায়ান্ট Microsoft এবং Amazon জানুয়ারির শেষে প্রথম যোগদানকারীদের মধ্যে ছিল। দেশীয় নেতা, Huawei Cloud, প্রথম পদক্ষেপ নিয়েছিল, 1 ফেব্রুয়ারী সিলিকন-ভিত্তিক Flow-এর সহযোগিতায় DeepSeek R1 এবং V3 যুক্তি পরিষেবা প্রকাশ করেছিল। AI প্রযুক্তি পর্যালোচনার প্রতিবেদনগুলি ইঙ্গিত দেয় যে সিলিকন-ভিত্তিক Flow-এর পরিষেবাগুলিতে ব্যবহারকারীদের আগমন দেখা গেছে, যা কার্যকরভাবে প্ল্যাটফর্মটিকে "ক্র্যাশ" করেছে। বড় তিনটি প্রযুক্তি কোম্পানি - BAT (Baidu, Alibaba, Tencent) এবং ByteDance - 3 ফেব্রুয়ারী থেকে শুরু করে কম খরচে, সীমিত সময়ের অফারও জারি করেছে, যা গত বছরের DeepSeek-এর V2 মডেল লঞ্চের মাধ্যমে ক্লাউড বিক্রেতাদের মূল্য যুদ্ধের কথা মনে করিয়ে দেয়, যেখানে DeepSeek-কে "মূল্য কসাই" বলা শুরু হয়েছিল। ক্লাউড বিক্রেতাদের উন্মত্ত পদক্ষেপগুলি মাইক্রোসফ্ট অ্যাজুরে এবং ওপেনএআই-এর মধ্যে পূর্বের দৃঢ় সম্পর্কের প্রতিধ্বনি করে, যেখানে ২০১৯ সালে, মাইক্রোসফ্ট ওপেনএআই-তে উল্লেখযোগ্য পরিমাণে ১ বিলিয়ন ডলার বিনিয়োগ করেছিল এবং ২০২৩ সালে চ্যাটজিপিটি চালু হওয়ার পর সুবিধা অর্জন করেছিল। তবে, মেটা ওপেন-সোর্সড লামার পরে এই ঘনিষ্ঠ সম্পর্কটি ভেঙে পড়তে শুরু করে, যার ফলে মাইক্রোসফ্ট অ্যাজুরে ইকোসিস্টেমের বাইরের অন্যান্য বিক্রেতারা তাদের বৃহৎ মডেলগুলির সাথে প্রতিযোগিতা করতে সক্ষম হয়। এই ক্ষেত্রে, ডিপসিক কেবল পণ্যের উত্তাপের ক্ষেত্রে চ্যাটজিপিটিকে ছাড়িয়ে যায়নি বরং o1 প্রকাশের পরে ওপেন-সোর্স মডেলগুলিও চালু করেছে, যা লামার জিপিটি-৩ পুনরুজ্জীবনকে ঘিরে উত্তেজনার মতো।

 

বাস্তবে, ক্লাউড সরবরাহকারীরা নিজেদেরকে AI অ্যাপ্লিকেশনের জন্য ট্র্যাফিক গেটওয়ে হিসেবেও স্থাপন করছে, যার অর্থ হল ডেভেলপারদের সাথে সম্পর্ক গভীর করা অগ্রিম সুবিধার দিকে পরিচালিত করে। প্রতিবেদনগুলি ইঙ্গিত দেয় যে Baidu স্মার্ট ক্লাউডের 15,000 জনেরও বেশি গ্রাহক Qianfan প্ল্যাটফর্মের মাধ্যমে DeepSeek মডেলটি ব্যবহার করেছিলেন। এছাড়াও, বেশ কয়েকটি ছোট সংস্থা সমাধান প্রদান করছে, যার মধ্যে রয়েছে সিলিকন-ভিত্তিক ফ্লো, লুচেন টেকনোলজি, চুয়ানজিং টেকনোলজি এবং বিভিন্ন AI ইনফ্রা প্রদানকারী যারা DeepSeek মডেলগুলির জন্য সমর্থন চালু করেছে। AI প্রযুক্তি পর্যালোচনা জেনেছে যে DeepSeek-এর স্থানীয় স্থাপনার জন্য বর্তমান অপ্টিমাইজেশনের সুযোগগুলি মূলত দুটি ক্ষেত্রে বিদ্যমান: একটি হল MoE মডেলের স্পারসিটি বৈশিষ্ট্যগুলির জন্য অপ্টিমাইজেশন, 671 বিলিয়ন প্যারামিটার MoE মডেল স্থানীয়ভাবে স্থাপন করার জন্য একটি মিশ্র যুক্তিযুক্ত পদ্ধতি ব্যবহার করে এবং হাইব্রিড GPU/CPU অনুমান ব্যবহার করে। অতিরিক্তভাবে, MLA-এর অপ্টিমাইজেশন গুরুত্বপূর্ণ। তবে, DeepSeek-এর দুটি মডেল এখনও স্থাপনার অপ্টিমাইজেশনে কিছু চ্যালেঞ্জের মুখোমুখি। "মডেলের আকার এবং অসংখ্য প্যারামিটারের কারণে, অপ্টিমাইজেশন সত্যিই জটিল, বিশেষ করে স্থানীয় স্থাপনার জন্য যেখানে কর্মক্ষমতা এবং খরচের মধ্যে সর্বোত্তম ভারসাম্য অর্জন করা চ্যালেঞ্জিং হবে," চুয়ানজিং টেকনোলজির একজন গবেষক বলেছেন। সবচেয়ে গুরুত্বপূর্ণ বাধা হল মেমরি ক্ষমতার সীমা অতিক্রম করা। "আমরা CPU এবং অন্যান্য কম্পিউটেশনাল রিসোর্সগুলিকে সম্পূর্ণরূপে ব্যবহার করার জন্য একটি ভিন্নধর্মী সহযোগিতা পদ্ধতি গ্রহণ করি, উচ্চ-কার্যক্ষমতাসম্পন্ন CPU অপারেটর ব্যবহার করে প্রক্রিয়াকরণের জন্য CPU/DRAM-এ স্পার্স MoE ম্যাট্রিক্সের অ-শেয়ার করা অংশগুলিকে রেখেছি, যখন ঘন অংশগুলি GPU-তে থাকে," তিনি আরও ব্যাখ্যা করেন। প্রতিবেদনগুলি ইঙ্গিত দেয় যে চুয়ানজিংয়ের ওপেন-সোর্স ফ্রেমওয়ার্ক KTransformers প্রাথমিকভাবে একটি টেমপ্লেটের মাধ্যমে মূল ট্রান্সফরমার বাস্তবায়নে বিভিন্ন কৌশল এবং অপারেটরগুলিকে ইনজেক্ট করে, CUDAGraph-এর মতো পদ্ধতি ব্যবহার করে অনুমানের গতি উল্লেখযোগ্যভাবে বৃদ্ধি করে। DeepSeek এই স্টার্টআপগুলির জন্য সুযোগ তৈরি করেছে, কারণ বৃদ্ধির সুবিধাগুলি স্পষ্ট হয়ে উঠছে; DeepSeek API চালু করার পরে অনেক সংস্থা লক্ষণীয় গ্রাহক বৃদ্ধির কথা জানিয়েছে, অপ্টিমাইজেশন খুঁজছেন এমন পূর্ববর্তী ক্লায়েন্টদের কাছ থেকে অনুসন্ধান পেয়েছে। শিল্পের অভ্যন্তরীণ ব্যক্তিরা উল্লেখ করেছেন, "অতীতে, কিছুটা প্রতিষ্ঠিত ক্লায়েন্ট গোষ্ঠীগুলি প্রায়শই বৃহত্তর কোম্পানিগুলির মানসম্মত পরিষেবাগুলিতে আবদ্ধ থাকত, স্কেলের কারণে তাদের খরচ সুবিধার দ্বারা শক্তভাবে আবদ্ধ থাকত। যাইহোক, বসন্ত উৎসবের আগে DeepSeek-R1/V3 স্থাপন সম্পন্ন করার পর, আমরা হঠাৎ করে বেশ কয়েকজন সুপরিচিত ক্লায়েন্টের কাছ থেকে সহযোগিতার অনুরোধ পেয়েছি, এবং এমনকি পূর্বে সুপ্ত ক্লায়েন্টরাও আমাদের DeepSeek পরিষেবাগুলি চালু করার জন্য যোগাযোগ শুরু করেছিলেন।" বর্তমানে, মনে হচ্ছে যে DeepSeek মডেল ইনফারেন্স পারফরম্যান্সকে ক্রমশ গুরুত্বপূর্ণ করে তুলছে, এবং বৃহৎ মডেলগুলির ব্যাপক গ্রহণের সাথে, এটি AI ইনফ্রা শিল্পের উন্নয়নে উল্লেখযোগ্যভাবে প্রভাব ফেলতে থাকবে। যদি একটি DeepSeek-স্তরের মডেল স্থানীয়ভাবে কম খরচে স্থাপন করা যায়, তবে এটি সরকার এবং এন্টারপ্রাইজ ডিজিটাল রূপান্তর প্রচেষ্টাকে ব্যাপকভাবে সহায়তা করবে। যাইহোক, চ্যালেঞ্জগুলি রয়ে গেছে, কারণ কিছু ক্লায়েন্ট বৃহৎ মডেল ক্ষমতা সম্পর্কে উচ্চ প্রত্যাশা রাখতে পারে, যা আরও স্পষ্ট করে তোলে যে ব্যবহারিক স্থাপনার ক্ষেত্রে কর্মক্ষমতা এবং খরচের ভারসাম্য বজায় রাখা গুরুত্বপূর্ণ। 

ডিপসিক চ্যাটজিপিটির চেয়ে ভালো কিনা তা মূল্যায়ন করার জন্য, তাদের মূল পার্থক্য, শক্তি এবং ব্যবহারের ক্ষেত্রে বোঝা অপরিহার্য। এখানে একটি বিস্তৃত তুলনা দেওয়া হল:

বৈশিষ্ট্য/দৃষ্টিভঙ্গি ডিপসিক চ্যাটজিপিটি
মালিকানা একটি চীনা কোম্পানি দ্বারা তৈরি OpenAI দ্বারা তৈরি
উৎস মডেল ওপেন সোর্স মালিকানাধীন
খরচ বিনামূল্যে ব্যবহার করা যাবে; সস্তা API অ্যাক্সেস বিকল্প সাবস্ক্রিপশন বা ব্যবহারের জন্য মূল্য নির্ধারণ
কাস্টমাইজেশন অত্যন্ত কাস্টমাইজযোগ্য, ব্যবহারকারীদের এটির উপর ভিত্তি করে পরিবর্তন এবং নির্মাণের সুযোগ করে দেয় সীমিত কাস্টমাইজেশন উপলব্ধ
নির্দিষ্ট কাজে পারফরম্যান্স ডেটা অ্যানালিটিক্স এবং তথ্য পুনরুদ্ধারের মতো নির্দিষ্ট কিছু ক্ষেত্রে দক্ষতা অর্জন করে। সৃজনশীল লেখালেখি এবং কথোপকথনের কাজে শক্তিশালী পারফরম্যান্স সহ বহুমুখী।
ভাষা সহায়তা চীনা ভাষা এবং সংস্কৃতির উপর দৃঢ় মনোযোগ বিস্তৃত ভাষা সমর্থন কিন্তু মার্কিন-কেন্দ্রিক
প্রশিক্ষণ খরচ দক্ষতার জন্য অপ্টিমাইজ করা, প্রশিক্ষণের খরচ কম উচ্চ প্রশিক্ষণ খরচ, যথেষ্ট গণনামূলক সম্পদের প্রয়োজন
প্রতিক্রিয়ার তারতম্য বিভিন্ন প্রতিক্রিয়া দিতে পারে, সম্ভবত ভূ-রাজনৈতিক প্রেক্ষাপটের দ্বারা প্রভাবিত হতে পারে প্রশিক্ষণ তথ্যের উপর ভিত্তি করে ধারাবাহিক উত্তর
লক্ষ্য শ্রোতা নমনীয়তা চাওয়া ডেভেলপার এবং গবেষকদের লক্ষ্য করে কথোপকথনের ক্ষমতা খুঁজছেন এমন সাধারণ ব্যবহারকারীদের লক্ষ্য করে
ব্যবহারের ক্ষেত্রে কোড তৈরি এবং দ্রুত কাজের জন্য আরও দক্ষ টেক্সট তৈরি, প্রশ্নের উত্তর দেওয়া এবং সংলাপে অংশগ্রহণের জন্য আদর্শ।

"এনভিডিয়া ব্যাহত করা" সম্পর্কে একটি সমালোচনামূলক দৃষ্টিভঙ্গি

বর্তমানে, Huawei ছাড়াও, Moore Threads, Muxi, Biran Technology এবং Tianxu Zhixin এর মতো বেশ কয়েকটি দেশীয় চিপ নির্মাতারাও DeepSeek এর দুটি মডেলের সাথে খাপ খাইয়ে নিচ্ছে। একজন চিপ প্রস্তুতকারক AI Technology Review কে বলেছেন, "DeepSeek এর কাঠামো উদ্ভাবন প্রদর্শন করে, তবুও এটি LLM রয়ে গেছে। DeepSeek এর সাথে আমাদের অভিযোজন মূলত যুক্তিসঙ্গত অ্যাপ্লিকেশনের উপর দৃষ্টি নিবদ্ধ করে, যা প্রযুক্তিগত বাস্তবায়নকে মোটামুটি সহজ এবং দ্রুত করে তোলে।" যাইহোক, MoE পদ্ধতির জন্য স্টোরেজ এবং বিতরণের ক্ষেত্রে উচ্চ চাহিদা প্রয়োজন, দেশীয় চিপগুলির সাথে স্থাপনের সময় সামঞ্জস্য নিশ্চিত করার সাথে সাথে, অভিযোজনের সময় সমাধানের প্রয়োজন এমন অসংখ্য ইঞ্জিনিয়ারিং চ্যালেঞ্জ উপস্থাপন করে। "বর্তমানে, দেশীয় কম্পিউটেশনাল শক্তি ব্যবহারযোগ্যতা এবং স্থিতিশীলতার ক্ষেত্রে Nvidia এর সাথে মেলে না, সফ্টওয়্যার পরিবেশ সেটআপ, সমস্যা সমাধান এবং ভিত্তিগত কর্মক্ষমতা অপ্টিমাইজেশনের জন্য মূল কারখানার অংশগ্রহণ প্রয়োজন," একজন শিল্প বিশেষজ্ঞ ব্যবহারিক অভিজ্ঞতার ভিত্তিতে বলেছেন। একই সাথে, "DeepSeek R1 এর বৃহৎ প্যারামিটার স্কেলের কারণে, দেশীয় কম্পিউটেশনাল শক্তি সমান্তরালকরণের জন্য আরও নোডের প্রয়োজন। অতিরিক্তভাবে, দেশীয় হার্ডওয়্যার স্পেসিফিকেশন এখনও কিছুটা পিছিয়ে রয়েছে; উদাহরণস্বরূপ, Huawei 910B বর্তমানে DeepSeek দ্বারা প্রবর্তিত FP8 অনুমানকে সমর্থন করতে পারে না।" DeepSeek V3 মডেলের অন্যতম আকর্ষণ হলো FP8 মিশ্র নির্ভুলতা প্রশিক্ষণ কাঠামো প্রবর্তন করা, যা অত্যন্ত বৃহৎ মডেলের উপর কার্যকরভাবে যাচাই করা হয়েছে, যা একটি উল্লেখযোগ্য অর্জন। পূর্বে, মাইক্রোসফ্ট এবং এনভিডিয়ার মতো প্রধান খেলোয়াড়রা সম্পর্কিত কাজের পরামর্শ দিয়েছিলেন, কিন্তু সম্ভাব্যতা নিয়ে শিল্পের মধ্যে সন্দেহ রয়ে গেছে। এটা বোঝা যায় যে INT8 এর তুলনায়, FP8 এর প্রাথমিক সুবিধা হল প্রশিক্ষণ-পরবর্তী কোয়ান্টাইজেশন প্রায় ক্ষতিহীন নির্ভুলতা অর্জন করতে পারে এবং উল্লেখযোগ্যভাবে অনুমানের গতি বৃদ্ধি করতে পারে। FP16 এর সাথে তুলনা করলে, FP8 Nvidia এর H20 এ দ্বিগুণ এবং H100 এ 1.5 গুণেরও বেশি ত্বরণ অর্জন করতে পারে। উল্লেখযোগ্যভাবে, দেশীয় কম্পিউটেশনাল পাওয়ার প্লাস গার্হস্থ্য মডেলের প্রবণতা ঘিরে আলোচনা যতই গতি পাচ্ছে, Nvidia ব্যাহত হতে পারে কিনা এবং CUDA পরিখাকে বাইপাস করা যেতে পারে কিনা তা নিয়ে জল্পনা ক্রমশ প্রচলিত হচ্ছে। একটি অনস্বীকার্য সত্য হল যে DeepSeek প্রকৃতপক্ষে Nvidia এর বাজার মূল্যে উল্লেখযোগ্য হ্রাস ঘটিয়েছে, কিন্তু এই পরিবর্তন Nvidia এর উচ্চ-স্তরের কম্পিউটেশনাল পাওয়ার অখণ্ডতা সম্পর্কে প্রশ্ন উত্থাপন করে। মূলধন-চালিত গণনামূলক সঞ্চয় সম্পর্কে পূর্বে গৃহীত বর্ণনাগুলি চ্যালেঞ্জের সম্মুখীন হচ্ছে, তবুও প্রশিক্ষণ পরিস্থিতিতে Nvidia-এর সম্পূর্ণরূপে প্রতিস্থাপন করা এখনও কঠিন। DeepSeek-এর CUDA-এর গভীর ব্যবহারের বিশ্লেষণ দেখায় যে নমনীয়তা - যেমন যোগাযোগের জন্য SM ব্যবহার করা বা সরাসরি নেটওয়ার্ক কার্ডগুলি ব্যবহার করা - নিয়মিত GPU-গুলির জন্য উপযুক্ত নয়। শিল্পের দৃষ্টিভঙ্গি জোর দেয় যে Nvidia-এর পরিখা কেবল CUDA-এর পরিবর্তে সমগ্র CUDA ইকোসিস্টেমকে অন্তর্ভুক্ত করে এবং DeepSeek যে PTX (সমান্তরাল থ্রেড এক্সিকিউশন) নির্দেশাবলী ব্যবহার করে তা এখনও CUDA ইকোসিস্টেমের অংশ। "স্বল্পমেয়াদে, Nvidia-এর গণনামূলক শক্তিকে এড়িয়ে যাওয়া যাবে না - প্রশিক্ষণে এটি বিশেষভাবে স্পষ্ট; তবে, যুক্তির জন্য দেশীয় কার্ড স্থাপন করা তুলনামূলকভাবে সহজ হবে, তাই অগ্রগতি সম্ভবত দ্রুত হবে। দেশীয় কার্ডগুলির অভিযোজন মূলত অনুমানের উপর দৃষ্টি নিবদ্ধ করে; কেউ এখনও স্কেলে দেশীয় কার্ডগুলিতে DeepSeek-এর কর্মক্ষমতার একটি মডেল প্রশিক্ষণ দিতে সক্ষম হয়নি," একজন শিল্প বিশ্লেষক AI প্রযুক্তি পর্যালোচনাকে মন্তব্য করেছেন। সামগ্রিকভাবে, অনুমানের দৃষ্টিকোণ থেকে, দেশীয় বৃহৎ মডেল চিপগুলির জন্য পরিস্থিতি উৎসাহব্যঞ্জক। প্রশিক্ষণের অত্যধিক উচ্চ প্রয়োজনীয়তার কারণে অনুমানের ক্ষেত্রে দেশীয় চিপ নির্মাতাদের জন্য সুযোগগুলি আরও স্পষ্ট, যা প্রবেশে বাধা দেয়। বিশ্লেষকরা যুক্তি দেন যে কেবল দেশীয় অনুমান কার্ড ব্যবহার করা যথেষ্ট; প্রয়োজনে, একটি অতিরিক্ত মেশিন অর্জন করা সম্ভব, যেখানে প্রশিক্ষণ মডেলগুলি অনন্য চ্যালেঞ্জ তৈরি করে - বর্ধিত সংখ্যক মেশিন পরিচালনা করা বোঝা হয়ে উঠতে পারে এবং উচ্চতর ত্রুটির হার প্রশিক্ষণের ফলাফলকে নেতিবাচকভাবে প্রভাবিত করতে পারে। প্রশিক্ষণের জন্য নির্দিষ্ট ক্লাস্টার স্কেল প্রয়োজনীয়তাও রয়েছে, যদিও অনুমানের জন্য ক্লাস্টারের চাহিদা ততটা কঠোর নয়, ফলে GPU প্রয়োজনীয়তাগুলি সহজ করা হয়েছে। বর্তমানে, Nvidia-এর একক H20 কার্ডের কর্মক্ষমতা Huawei বা Cambrian-এর চেয়ে বেশি নয়; এর শক্তি ক্লাস্টারিং-এ নিহিত। কম্পিউটেশনাল পাওয়ার মার্কেটের উপর সামগ্রিক প্রভাবের উপর ভিত্তি করে, লুচেন টেকনোলজির প্রতিষ্ঠাতা, ইউ ইয়াং, AI টেকনোলজি রিভিউ-এর সাথে একটি সাক্ষাৎকারে উল্লেখ করেছেন, "DeepSeek অতি-বৃহৎ প্রশিক্ষণ কম্পিউটেশনাল ক্লাস্টার স্থাপন এবং ভাড়াকে সাময়িকভাবে দুর্বল করে দিতে পারে। দীর্ঘমেয়াদে, বৃহৎ মডেল প্রশিক্ষণ, যুক্তি এবং অ্যাপ্লিকেশনের সাথে সম্পর্কিত খরচ উল্লেখযোগ্যভাবে হ্রাস করে, বাজারের চাহিদা বৃদ্ধি পাওয়ার সম্ভাবনা রয়েছে। এর উপর ভিত্তি করে AI-এর পরবর্তী পুনরাবৃত্তিগুলি কম্পিউটেশনাল পাওয়ার মার্কেটে ক্রমাগত টেকসই চাহিদা বাড়াবে।" উপরন্তু, "ডিপসিকের যুক্তি এবং সূক্ষ্ম-সুরকরণ পরিষেবার জন্য বর্ধিত চাহিদা দেশীয় কম্পিউটেশনাল ল্যান্ডস্কেপের সাথে আরও সামঞ্জস্যপূর্ণ, যেখানে স্থানীয় ক্ষমতা তুলনামূলকভাবে দুর্বল, ক্লাস্টার প্রতিষ্ঠার পরে অলস সম্পদের অপচয় কমাতে সাহায্য করে; এটি দেশীয় কম্পিউটেশনাল ইকোসিস্টেমের বিভিন্ন স্তরের নির্মাতাদের জন্য কার্যকর সুযোগ তৈরি করে।" লুচেন টেকনোলজি হুয়াওয়ে ক্লাউডের সাথে সহযোগিতা করে দেশীয় কম্পিউটেশনাল শক্তির উপর ভিত্তি করে ডিপসিক R1 সিরিজের যুক্তি API এবং ক্লাউড ইমেজিং পরিষেবা চালু করেছে। ইউ ইয়াং ভবিষ্যতের বিষয়ে আশাবাদ ব্যক্ত করেছেন: "ডিপসিক দেশীয়ভাবে উৎপাদিত সমাধানগুলিতে আস্থা জাগিয়ে তোলে, ভবিষ্যতে দেশীয় কম্পিউটেশনাল ক্ষমতায় আরও বেশি উৎসাহ এবং বিনিয়োগকে উৎসাহিত করে।"

微信图片_20240614024031.jpg1

উপসংহার

DeepSeek ChatGPT এর চেয়ে "ভালো" কিনা তা ব্যবহারকারীর নির্দিষ্ট চাহিদা এবং উদ্দেশ্যের উপর নির্ভর করে। নমনীয়তা, কম খরচ এবং কাস্টমাইজেশনের প্রয়োজন এমন কাজের জন্য, DeepSeek উন্নত হতে পারে। সৃজনশীল লেখা, সাধারণ অনুসন্ধান এবং ব্যবহারকারী-বান্ধব কথোপকথন ইন্টারফেসের জন্য, ChatGPT নেতৃত্ব দিতে পারে। প্রতিটি টুল বিভিন্ন উদ্দেশ্যে কাজ করে, তাই পছন্দটি মূলত কোন প্রেক্ষাপটে ব্যবহার করা হচ্ছে তার উপর নির্ভর করবে।

ELV কেবল সমাধান খুঁজুন

নিয়ন্ত্রণ তারগুলি

বিএমএস, বাস, ইন্ডাস্ট্রিয়াল, ইন্সট্রুমেন্টেশন কেবলের জন্য।

স্ট্রাকচার্ড ক্যাবলিং সিস্টেম

নেটওয়ার্ক ও ডেটা, ফাইবার-অপটিক কেবল, প্যাচ কর্ড, মডিউল, ফেসপ্লেট

২০২৪ প্রদর্শনী ও ইভেন্ট পর্যালোচনা

১৬-১৮ এপ্রিল, ২০২৪ দুবাইতে মধ্যপ্রাচ্য-শক্তি

১৬-১৮ এপ্রিল, ২০২৪ মস্কোতে সেকিউরিকা

৯ মে, ২০২৪ সাংহাইতে নতুন পণ্য ও প্রযুক্তির উদ্বোধনী অনুষ্ঠান

২২-২৫ অক্টোবর, ২০২৪ বেইজিংয়ে সিকিউরিটি চীন

১৯-২০ নভেম্বর, ২০২৪ সংযুক্ত বিশ্ব সৌদি আরব


পোস্টের সময়: ফেব্রুয়ারী-১০-২০২৫