تُظهر الورقة البحثية الأخيرة من DeepSeek اتجاهًا تقنيًا مثيرًا للاهتمام. الفكرة الأساسية هي فصل جزء الذاكرة طويلة المدى في نماذج اللغة الكبيرة عن أوزان النموذج، وتحويلها إلى تخزين في أجهزة الذاكرة، مما يقلل بشكل كبير من ضغط الذاكرة الرسومية. التقنية المذكورة في الورقة، وهي تقنية n-gram، تعتمد على هذا المفهوم — من خلال تخزين المعلومات الاعتمادية طويلة المدى في ذاكرة خارجية، بدلاً من الاعتماد على معلمات النموذج الداخلية.
من الناحية المادية، ماذا يعني هذا التحول في الهيكلية؟ ستتزايد الحاجة إلى الذاكرة بشكل كبير. مع تطور النماذج الكبيرة في هذا الاتجاه، قد يدخل سوق ذاكرة DDR5 دورة نمو جديدة. شركة Micron، كمزود رئيسي للذاكرة، ستكون المستفيد على المدى الطويل.
من منظور الاستثمار، قد تستمر ضغوط أسعار ذاكرة DDR5 في الارتفاع. إذا تم تطبيق وترويج هذه التقنية بشكل فعلي، فإن توقع مضاعفة السعر هذا العام ليس مبالغًا فيه — وذلك يعتمد على التقدم الفعلي في تدريب النماذج ونشرها.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تُظهر الورقة البحثية الأخيرة من DeepSeek اتجاهًا تقنيًا مثيرًا للاهتمام. الفكرة الأساسية هي فصل جزء الذاكرة طويلة المدى في نماذج اللغة الكبيرة عن أوزان النموذج، وتحويلها إلى تخزين في أجهزة الذاكرة، مما يقلل بشكل كبير من ضغط الذاكرة الرسومية. التقنية المذكورة في الورقة، وهي تقنية n-gram، تعتمد على هذا المفهوم — من خلال تخزين المعلومات الاعتمادية طويلة المدى في ذاكرة خارجية، بدلاً من الاعتماد على معلمات النموذج الداخلية.
من الناحية المادية، ماذا يعني هذا التحول في الهيكلية؟ ستتزايد الحاجة إلى الذاكرة بشكل كبير. مع تطور النماذج الكبيرة في هذا الاتجاه، قد يدخل سوق ذاكرة DDR5 دورة نمو جديدة. شركة Micron، كمزود رئيسي للذاكرة، ستكون المستفيد على المدى الطويل.
من منظور الاستثمار، قد تستمر ضغوط أسعار ذاكرة DDR5 في الارتفاع. إذا تم تطبيق وترويج هذه التقنية بشكل فعلي، فإن توقع مضاعفة السعر هذا العام ليس مبالغًا فيه — وذلك يعتمد على التقدم الفعلي في تدريب النماذج ونشرها.