Deepseek: The Disruptive One الذي أحدث ثورة في المناظر الطبيعية لمنظمة العفو الدولية

مجموعة Aipu Waton

مقدمة

القلق المستمر بين النماذج الكبيرة المتنافسة ، ومقدمي الخدمات السحابية الذين يتنافسون على حصة السوق ، ومصنعي رقائق الرقائق المجتهدين - يستمر تأثير Deepseek.

مع اقتراب مهرجان الربيع ، لا يزال الإثارة المحيطة بـ Deepseek قوية. أبرزت العطلة الأخيرة إحساسًا كبيرًا بالمنافسة في صناعة التكنولوجيا ، حيث يناقش الكثيرون وتحليل هذا "سمك السلور". يشهد وادي السيليكون إحساسًا غير مسبوق بالأزمة: يعبر دعاة المصدر المفتوح عن آرائهم مرة أخرى ، وحتى Openai يعيد تقييم ما إذا كانت استراتيجية المصدر المغلقة هي الخيار الأفضل. أدى النموذج الجديد للتكاليف الحسابية المنخفضة إلى تفاعل سلسلة بين عمالقة الرقائق مثل NVIDIA ، مما أدى إلى تسجيل خسائر في القيمة السوقية ليوم واحد في تاريخ سوق الأوراق المالية في الولايات المتحدة ، بينما تحقق الوكالات الحكومية في امتثال الرقائق التي تستخدمها Deepseek. وسط مراجعات مختلطة لـ Deepseek في الخارج ، على الصعيد المحلي ، فإنها تعاني من نمو غير عادي. بعد إطلاق نموذج R1 ، شهد التطبيق المرتبط بزيادة في حركة المرور ، مما يشير إلى أن النمو في قطاعي التطبيقات سيؤدي إلى قيادة النظام الإيكولوجي الإجمالي لمنظمة العفو الدولية. الجانب الإيجابي هو أن Deepseek سوف يوسع إمكانيات التطبيق ، مما يشير إلى أن الاعتماد على chatgpt لن يكون باهظ الثمن في المستقبل. لقد انعكس هذا التحول في أنشطة Openai الحديثة ، بما في ذلك تقديم نموذج التفكير يسمى O3-Mini لتحرير المستخدمين استجابةً لـ Deepseek R1 ، بالإضافة إلى ترقيات لاحقة جعلت سلسلة التفكير في O3-Mini. أعرب العديد من المستخدمين في الخارج عن امتنانه لـ Deepseek لهذه التطورات ، على الرغم من أن سلسلة الفكر هذه بمثابة ملخص.

بتفاؤل ، من الواضح أن Deepseek يقوم بتوحيد اللاعبين المحليين. مع تركيزها على تقليل تكاليف التدريب ، تنضم العديد من مصنعي الرقاقات في المنبع ، ومقدمي الخدمات السحابية المتوسطة ، والعديد من الشركات الناشئة بنشاط إلى النظام الإيكولوجي ، مما يعزز كفاءة التكلفة لاستخدام نموذج Deepseek. وفقًا لأوراق Deepseek ، يتطلب التدريب الكامل لنموذج V3 فقط 2.788 مليون ساعة من GPU ، وعملية التدريب مستقرة للغاية. تعتبر بنية Moe (مزيج من الخبراء) أمرًا بالغ الأهمية لتقليل تكاليف ما قبل التدريب بعامل عشرة مقارنة بـ LAMA 3 مع 405 مليار معلمة. حاليا ، V3 هو أول نموذج معترف به للجمهور يوضح مثل هذا التباين العالي في MOE. بالإضافة إلى ذلك ، يعمل MLA (اهتمام الطبقة المتعددة) بشكل تآزري ، وخاصة في جوانب التفكير. "كلما كان MOE ، كلما زاد حجم الدفعة المطلوب أثناء التفكير لاستخدام الطاقة الحسابية بالكامل ، مع كون حجم KVCACHE هو العامل المحدد الرئيسي ؛ فإن MLA يقلل بشكل كبير من حجم KVCache" ، أشار باحث من تقنية Chuanjing في تحليل لمراجعة تقنية AI. بشكل عام ، يكمن نجاح Deepseek في مزيج من التقنيات المختلفة ، وليس مجرد واحدة. يمتدح المطلعون على الصناعة القدرات الهندسية لفريق Deepseek ، مع الإشارة إلى التميز في التدريب الموازي وتحسين المشغل ، وتحقيق نتائج رائدة عن طريق تحسين كل التفاصيل. يزداد نهج Deepseek المفتوح المصدر بشكل أكبر للتطوير العام للنماذج الكبيرة ، ومن المتوقع أنه إذا توسعت نماذج مماثلة في الصور ومقاطع الفيديو ، وأكثر من ذلك ، فإن هذا سيحفز الطلب بشكل كبير في جميع أنحاء الصناعة.

فرص لخدمات التفكير الطرف الثالث

تشير البيانات إلى أنه منذ صدوره ، احتلت Deepseek 22.15 مليون مستخدم نشط يوميًا (DAU) في غضون 21 يومًا فقط ، حيث حققوا 41.6 ٪ من قاعدة مستخدمي ChatGPT وتجاوز 16.95 مليون مستخدم نشط يوميًا لـ Doubao ، مما يصبح أسرع تطبيقًا نموًا على مستوى العالم ، ويتصدرون متجر Apple App في 157 دولة. ومع ذلك ، بينما توافد المستخدمون بأعداد كبيرة ، كان المتسللون السيبرانيون يهاجمون تطبيق Deepseek بلا هوادة ، مما تسبب في ضغط كبير على خوادمه. يعتقد محللو الصناعة أن هذا يرجع جزئيًا إلى بطاقات نشر Deepseek للتدريب مع عدم وجود قوة حسابية كافية للتفكير. أبلغ أحد المطلعين على مستوى الصناعة مراجعة تقنية الذكاء الاصطناعي ، "يمكن حل مشكلات الخادم المتكررة بسهولة عن طريق فرض رسوم أو تمويل لشراء المزيد من الآلات ؛ في النهاية ، يعتمد على قرارات Deepseek." هذا يقدم مفاضلة في التركيز على التكنولوجيا مقابل الإنتاج. اعتمد Deepseek إلى حد كبير على تقدير الكمية الكمومية للوصول الذاتي ، بعد أن تلقى القليل من التمويل الخارجي ، مما أدى إلى انخفاض ضغط التدفق النقدي نسبيًا وبيئة تكنولوجية أنقى. حاليًا ، في ضوء المشكلات المذكورة أعلاه ، يحث بعض المستخدمين Deepseek على وسائل التواصل الاجتماعي على رفع عتبات الاستخدام أو تقديم ميزات مدفوعة لتعزيز راحة المستخدم. بالإضافة إلى ذلك ، بدأ المطورون في استخدام واجهة برمجة التطبيقات الرسمية أو واجهات برمجة تطبيقات الطرف الثالث للتحسين. ومع ذلك ، أعلنت منصة Deepseek المفتوحة مؤخرًا ، "موارد الخادم الحالية نادرة ، وتم تعليق إعادة شحن خدمة API."

 

هذا لا شك في أنه يفتح المزيد من الفرص لبائعي الطرف الثالث في قطاع البنية التحتية لمنظمة العفو الدولية. في الآونة الأخيرة ، أطلقت العديد من عمالقة السحابة المحلية والدولية واجهات برمجة تطبيقات Deepseek - كانت عمالقة Overseas Microsoft و Amazon من بين أول من انضم إلى نهاية يناير. اتخذ الزعيم المحلي ، Huawei Cloud ، الخطوة الأولى ، حيث أصدرت خدمات التفكير Deepseek R1 و V3 بالتعاون مع التدفق القائم على السيليكون في 1 فبراير. تشير تقارير من مراجعة تقنية الذكاء الاصطناعي إلى أن خدمات التدفق المستندة إلى السيليكون شهدت تدفقًا من المستخدمين ، على نحو فعال "" المنصة ". أصدرت شركات التكنولوجيا الثلاث الكبرى-بات (Baidu ، Alibaba ، Tencent) و Bytedance-أيضًا عروضًا منخفضة التكلفة ومحدودة في الوقت الذي تبدأ في 3 فبراير ، تذكرنا بحروب أسعار البائعين السحابة في العام الماضي التي تم إشعالها من خلال إطلاق نموذج V2 من Deepseek ، حيث بدأ Deepseek يطلق عليه "Brice Butcher". إن الإجراءات المحمومة للبائعين السحابيين تكرر العلاقات القوية السابقة بين Microsoft Azure و Openai ، حيث استثمرت Microsoft في عام 2019 في عام 2019 ، استثمارًا كبيرًا بقيمة مليار دولار في Openai وجنيت فوائد بعد إطلاق Chatgpt في عام 2023. ومع ذلك ، بدأت هذه العلاقة الوثيقة في التهاب العيوب بعد أن تم تصويرها من Llama المفتوحة ، مما يسمح للبائعين الآخرين خارج Microsoft Azurestystem. في هذه الحالة ، لم تتجاوز Deepseek ChatGPT فقط من حيث حرارة المنتج ، ولكنها قدمت أيضًا نماذج مفتوحة المصدر بعد إصدار O1 ، على غرار الإثارة المحيطة بإحياء Llama لـ GPT-3.

 

في الواقع ، يقوم مقدمو الخدمات السحابية أيضًا بوضع أنفسهم كبوابات مرور لتطبيقات الذكاء الاصطناعي ، مما يعني أن تعميق العلاقات مع المطورين يترجم إلى المزايا الوقائية. تشير التقارير إلى أن Baidu Smart Cloud لديها أكثر من 15000 عميل يستخدمون نموذج Deepseek عبر منصة Qianfan في يوم إطلاق النموذج. بالإضافة إلى ذلك ، تقدم العديد من الشركات الأصغر حلولًا ، بما في ذلك التدفق القائم على السيليكون ، وتكنولوجيا Luchen ، وتكنولوجيا Chuanjing ، والعديد من مقدمي الذكاء الاصطناعي الذين أطلقوا دعمًا لنماذج DeepSeek. لقد تعلمت مراجعة تقنية الذكاء الاصطناعى أن فرص التحسين الحالية للنشر الموضعي لـ Deepseek موجودة بشكل أساسي في مجالين: أحدهما يتحسن لخصائص sparsity لنموذج MOE باستخدام نهج التفكير المختلط لنشر نموذج MOE البالغ 671 مليار معلمة محليًا أثناء الاستفادة من استنتاج GPU/وحدة المعالجة المركزية الهجينة. بالإضافة إلى ذلك ، فإن تحسين MLA أمر حيوي. ومع ذلك ، لا يزال نموذج Deepseek يواجهان بعض التحديات في تحسين النشر. "نظرًا لحجم النموذج والعديد من المعلمات ، فإن التحسين معقد بالفعل ، لا سيما بالنسبة للعمليات المحلية حيث سيكون تحقيق التوازن الأمثل بين الأداء والتكلفة أمرًا صعبًا" ، صرح باحث من تقنية Chuanjing. تكمن العقبة الأكثر أهمية في التغلب على حدود سعة الذاكرة. "إننا نعتمد نهجًا تعاونًا غير متجانس لاستخدام وحدات المعالجة المركزية والموارد الحسابية الأخرى ، مما نضع فقط الأجزاء غير المشتركة من مصفوفة MOE المتفرقة على وحدة المعالجة المركزية/DRAM للمعالجة باستخدام مشغلي وحدة المعالجة المركزية عالية الأداء ، بينما تبقى الأجزاء الكثيفة على GPU". تشير التقارير إلى أن إطار عمل ktransforms من تشوانجينغ مفتوح المصدر يضخون في المقام الأول الاستراتيجيات والمشغلين المختلفة في تنفيذ المحولات الأصلية من خلال قالب ، مما يعزز سرعة الاستدلال بشكل كبير باستخدام طرق مثل CudaGraph. خلق Deepseek فرصًا لهذه الشركات الناشئة ، حيث أصبحت مزايا النمو واضحة ؛ أبلغت العديد من الشركات عن نمو العملاء الملحوظين بعد إطلاق واجهة برمجة تطبيقات Deepseek ، حيث تلقيت استفسارات من العملاء السابقين الذين يبحثون عن تحسينات. لاحظ المطلعون على الصناعة ، "في الماضي ، كانت مجموعات العملاء التي تم إنشاؤها إلى حد ما مغلقة في الخدمات الموحدة للشركات الأكبر ، ملزمة بإحكام بمزايا التكلفة بسبب النطاق. ومع ذلك ، بعد الانتهاء من نشر Deepseek-R1/V3 قبل مهرجان الربيع ، تلقينا فجأة طلبات تعمها من العديد من العملاء المعروفين ، وذلك حتى العملاء الذين كانوا في السابق يتواصلون لإدخالنا. في الوقت الحالي ، يبدو أن Deepseek يجعل أداء الاستدلال النموذجي أمرًا متزايدًا بشكل متزايد ، ومع اعتماد نماذج كبيرة أوسع ، سيستمر هذا في التأثير على التطور في صناعة AI Infra بشكل كبير. إذا كان من الممكن نشر نموذج على مستوى Deepseek محليًا بتكلفة منخفضة ، فسيساعد ذلك بشكل كبير على جهود التحول الرقمي للحكومة والمؤسسات. ومع ذلك ، تستمر التحديات ، لأن بعض العملاء قد يحملون توقعات كبيرة فيما يتعلق بقدرات نموذجية كبيرة ، مما يجعل من الواضح أن موازنة الأداء والتكلفة تصبح حيوية في النشر العملي. 

لتقييم ما إذا كان Deepseek أفضل من ChatGpt ، من الضروري فهم اختلافاتهم الرئيسية ونقاط القوة وحالات الاستخدام. هذه مقارنة شاملة:

ميزة/الجانب ديبسيك chatgpt
ملكية طورتها شركة صينية تم تطويره بواسطة Openai
نموذج المصدر مفتوح المصدر الملكية
يكلف حرة في الاستخدام ؛ خيارات وصول API أرخص الاشتراك أو التسعير لكل استخدام
التخصيص قابل للتخصيص للغاية ، مما يسمح للمستخدمين بالتعديل والبناء عليه التخصيص المحدود المتاح
الأداء في مهام محددة يتفوق في مجالات معينة مثل تحليلات البيانات واسترجاع المعلومات متعدد الاستخدامات مع الأداء القوي في مهام الكتابة الإبداعية والمحادثة
دعم اللغة التركيز القوي على اللغة الصينية والثقافة دعم اللغة الواسعة ولكن المتمحور حول الولايات المتحدة
تكلفة التدريب انخفاض تكاليف التدريب ، محسّنة للكفاءة تكاليف تدريب أعلى ، تتطلب موارد حسابية كبيرة
تباين الاستجابة قد تقدم ردود مختلفة ، ربما تتأثر بالسياق الجيوسياسي إجابات متسقة بناءً على بيانات التدريب
الجمهور المستهدف تهدف إلى المطورين والباحثين الذين يريدون المرونة تهدف إلى المستخدمين العامين الذين يبحثون عن قدرات محادثة
استخدام الحالات أكثر كفاءة لتوليد الكود والمهام السريعة مثالي لتوليد النص ، والرد على الاستفسارات ، والمشاركة في الحوار

منظور حاسم حول "تعطيل nvidia"

في الوقت الحاضر ، بصرف النظر عن Huawei ، فإن العديد من مصنعي الرقائق المحلي مثل Moore Threads و Muxi و Biran Technology و Tianxu Zhixin يتكيفون أيضًا مع نموذجين Deepseek. وقالت شركة تصنيع رقاقة لـ AI Technology Review ، "بنية Deepseek يوضح الابتكار ، ومع ذلك لا يزال LLM. يركز تكييفنا مع Deepseek بشكل أساسي على تطبيقات التفكير ، مما يجعل التنفيذ الفني واضحًا وسريعًا إلى حد ما." ومع ذلك ، يتطلب نهج MOE مطالب أعلى من حيث التخزين والتوزيع ، إلى جانب ضمان التوافق عند النشر مع الرقائق المحلية ، وتقديم العديد من التحديات الهندسية التي تحتاج إلى حل أثناء التكيف. وقال ممارس في الصناعة استنادًا إلى الخبرة العملية: "في الوقت الحالي ، لا تتطابق القوة الحسابية المحلية في Nvidia في قابلية الاستخدام والاستقرار ، مما يتطلب مشاركة المصنع الأصلية لإعداد بيئة البرمجيات ، واستكشاف الأخطاء وإصلاحها ، وتحسين الأداء التأسيسي". في نفس الوقت ، "نظرًا لمقياس المعلمة الكبير لـ Deepseek R1 ، فإن القوة الحسابية المحلية تستلزم المزيد من العقد للتوازي. بالإضافة إلى ذلك ، لا تزال مواصفات الأجهزة المحلية متأخرة إلى حد ما ؛ على سبيل المثال ، لا يمكن لـ Huawei 910B حاليًا دعم استنتاج FP8 الذي قدمته Deepseek." أحد أبرز النقاط في نموذج Deepseek V3 هو إدخال إطار تدريب دقيق لـ FP8 ، والذي تم التحقق من صحته بشكل فعال على نموذج كبير للغاية ، مما يمثل إنجازًا كبيرًا. في السابق ، اقترح اللاعبون الرئيسيون مثل Microsoft و Nvidia العمل ذي الصلة ، لكن الشكوك لا تزال قائمة في الصناعة فيما يتعلق بالجدوى. من المفهوم أنه بالمقارنة مع INT8 ، فإن الميزة الأساسية لـ FP8 هي أن القياس الكمي بعد التدريب يمكن أن يحقق دقة خاسرة تقريبًا مع تعزيز سرعة الاستدلال بشكل كبير. عند مقارنة مع FP16 ، يمكن لـ FP8 إدراك ما يصل إلى مرتين تسارع على تسارع H20 من NVIDIA وأكثر من 1.5 مرة على H100. والجدير بالذكر ، كمناقشات حول اتجاه القوة الحسابية المحلية بالإضافة إلى النماذج المحلية ، تكتسب زخماً ، تكهنات حول ما إذا كان يمكن تعطيل NVIDIA ، وما إذا كان يمكن تجاوز خندق CUDA ، أصبح منتشرة بشكل متزايد. إحدى الحقائق التي لا يمكن إنكارها هي أن Deepseek تسبب بالفعل في انخفاض كبير في القيمة السوقية لـ NVIDIA ، لكن هذا التحول يثير أسئلة حول سلامة الطاقة الحسابية الراقية لـ NVIDIA. يتم تحدي الروايات المقبولة سابقًا فيما يتعلق بالتراكم الحسابي الذي يحركه رأس المال ، ومع ذلك يبقى من الصعب على Nvidia استبداله بالكامل في سيناريوهات التدريب. يوضح تحليل استخدام Deepseek العميق لـ CUDA أن المرونة - مثل استخدام SM للاتصال أو معالجة بطاقات الشبكة مباشرة - لا يمكن استيعابها في وحدات معالجة الرسومات العادية. تؤكد وجهات نظر الصناعة على أن خندق NVIDIA يشمل النظام البيئي CUDA بأكمله بدلاً من CUDA نفسها فقط ، وتعليمات PTX (تنفيذ مؤشر الترابط الموازي) التي يستخدمها Deepseek جزءًا من النظام الإيكولوجي CUDA. "على المدى القصير ، لا يمكن تجاوز القوة الحسابية لـ NVIDIA - وهذا واضح بشكل خاص في التدريب ؛ ومع ذلك ، فإن نشر البطاقات المحلية للمنطق سيكون أسهل نسبيًا ، لذلك من المحتمل أن يكون التقدم أسرع. يركز تكييف البطاقات المحلية في المقام الأول على الاستدلال على التكنولوجيا. بشكل عام ، من وجهة نظر الاستدلال ، فإن الظروف مشجعة على رقائق النماذج الكبيرة المحلية. إن فرص الشركات المصنعة للرقائق المحلية في عالم الاستدلال أكثر وضوحًا بسبب متطلبات التدريب العالية بشكل مفرط ، مما يعيق الدخول. يزعم المحللون أن ببساطة تسخير بطاقات الاستدلال المحلية يكفي ؛ إذا لزم الأمر ، يكون الحصول على آلة إضافية أمرًا ممكنًا ، في حين أن نماذج التدريب تشكل تحديات فريدة - يمكن أن تصبح زيادة عدد الآلات مرهقة ، ويمكن أن تؤثر معدلات الخطأ المرتفعة سلبًا على نتائج التدريب. يتميز التدريب أيضًا بمتطلبات محددة على نطاق الكتلة ، في حين أن المطالب على مجموعات الاستدلال ليست صارمة ، وبالتالي تخفيف متطلبات وحدة معالجة الرسومات. حاليًا ، لا يتجاوز أداء بطاقة H20 من NVIDIA عرض Huawei أو Cambrian ؛ قوته تكمن في التجميع. استنادًا إلى التأثير الكلي على سوق الطاقة الحسابية ، مؤسس Luchen Technology ، أنت يانغ ، الذي لوحظ في مقابلة مع مراجعة تكنولوجيا الذكاء الاصطناعى ، "قد يقوض Deepseek مؤقتًا إنشاء وتأجير التدريبات المتزايدة للغاية ، والطلب على الأرجح من خلال الإبلاغ عن المدى المدى. دفع الطلب المستمر في سوق الطاقة الحسابية. " بالإضافة إلى ذلك ، "إن الطلب المتزايد على Deepseek على خدمات التفكير والضوء أكثر توافقًا مع المشهد الحسابي المحلي ، حيث تكون القدرات المحلية ضعيفة نسبيًا ، مما يساعد على تخفيف النفايات من موارد الخمول بعد إنشاء المجموعة ؛ وهذا يخلق فرصًا قابلة للحياة للمصنعين عبر مستويات مختلفة من النظام البيئي الحسابي المحلي." تعاونت Luchen Technology مع Huawei Cloud لإطلاق خدمات APIs و Cloud Series Series Series و Cloud Series القائمة على الطاقة الحسابية المحلية. أعربت يانغ عن تفاؤلها حول المستقبل: "غرس ديبسيك الثقة في الحلول المنتجة محليًا ، وتشجيع حماسًا أكبر واستثمارًا في القدرات الحاسوبية المحلية للمضي قدمًا."

微信图片 _20240614024031.jpg1

خاتمة

ما إذا كان Deepseek "أفضل" من ChatGPT يعتمد على الاحتياجات المحددة وأهداف المستخدم. بالنسبة للمهام التي تحتاج إلى المرونة والتكلفة المنخفضة والتخصيص ، قد تكون Deepseek متفوقة. بالنسبة للكتابة الإبداعية ، والاستفسار العام ، وواجهات المحادثة السهلة الاستخدام ، قد تأخذ ChatGPT زمام المبادرة. تخدم كل أداة أغراض مختلفة ، وبالتالي يعتمد الاختيار بشكل كبير على السياق الذي يتم استخدامه فيه.

ابحث عن محلول كابل ELV

الكابلات السيطرة

ل BMS ، الحافلة ، الصناعية ، كابل الأجهزة.

نظام الكابلات المنظم

الشبكة والبيانات ، كابل الألياف البصرية ، سلك التصحيح ، الوحدات النمطية ، اللوحة الوجه

2024 مراجعة المعارض والأحداث

16 أبريل-18 ، 2024 طاقة الشرق الأوسط في دبي

16 أبريل-18 ، 2024 Securika في موسكو

May.9th ، 2024 New Products & Technologies Launch Event في Shanghai

22 أكتوبر -25 ، 2024 الأمن الصين في بكين

Nov.19-20 ، 2024 Connection World KSA


وقت النشر: فبراير -10-2025