انتهت الحقبة التي كانت فيها القدرة على استخدام الموارد الحاسوبية بحرية دون التفكير في التكلفة. يتزايد سعر معدل التجزئة، وهذا يغير كل شيء.



قبل عامين كنا نعيش في عالم مختلف. عندما تفتح واجهة برمجة التطبيقات — كانت النماذج الكبيرة تولد بشكل مستمر رمزًا، نصًا، ردودًا على أي شيء. لم يكن أحد يهتم بأننا نضع في الموجه آلاف الكلمات من المستندات، نجبر GPT-4 على القيام بأشياء صغيرة مثل تكبير النص. لماذا؟ لأنه كان رخيصًا. كان المستثمرون يدفعون. الشركات تدعم ذلك. كانت فترة الاستخدام المجاني للموارد.

لكن الحلم انتهى. تزداد قوة الحوسبة في كل مكان — هذا ليس تنبؤًا، بل واقع يحدث الآن. الصراع على NVIDIA H100 أصبح نزاعًا جيوسياسيًا. يقترب استهلاك الطاقة لمراكز البيانات من حدود الشبكات الكهربائية. اللاعبون الكبار لم يعودوا يلعبون على خيرية.

عندما يتوسع عملك وتتجاوز الطلبات اليومية الملايين، يتحول الدفع البسيط مقابل 1K من الرموز إلى تدفق من التكاليف. إنها آلة لسحب الأموال. كابوس يوقظ مديري المالية في الشركات الناشئة في منتصف الليل. أصبح الرمز وحدة نقدية حقيقية.

أين تضيع رموزك؟ غالبًا لا يفهم الناس ذلك. ينظرون إلى الفواتير الشهرية التي تتزايد، كأنها كتاب غير مفهوم. الضياع يحدث في أقل الأماكن وضوحًا.

الأول: تتحدث بأدب مع الذكاء الاصطناعي. «مرحبًا، هل يمكنك المساعدة؟ شكرًا جزيلاً، أرجوك...» هذا طبيعي للبشر، لكن في اقتصاد الرموز هو سرقة. النماذج الكبيرة لا تحتاج إلى «رجاء» و«شكرًا». كل كلمة — رمز، كل مسافة — مال. والأسوأ — التعليمات النظامية الطويلة التي تتكرر في كل جلسة: «اتبع العشرة مبادئ...» «إذا لم تعرف، قل لا أعرف...» هل هي مفيدة؟ نعم. لكن إذا تكررت ملايين المرات، فهي خسائر فلكية.

الثاني: RAG غير المسيطر عليه. المثالي: استخراج ثلاثة جمل ذات صلة. عمليًا: يسأل المستخدم شيئًا، والنظام يستخرج عشرات الآلاف من صفحات PDF ويضعها في النموذج. المطور يفكر: «دعها تبحث بنفسها». هذا ليس كسلًا، بل جريمة ضد القدرة الحاسوبية. المعلومات غير ذات الصلة لا تعيق فقط آلية الانتباه، بل تؤدي أيضًا إلى استهلاك فلكي للرموز. كنت تعتقد أنك طرحت سؤالًا بسيطًا، لكنك في الواقع جعلت النموذج يقرأ نصف مكتبة.

الثالث: وكيل بلا قيود. وضع ReAct يجعل الذكاء الاصطناعي يتفكر ويتصرف كإنسان. لكن إذا تم إيقاف واجهة برمجة التطبيقات أو دخلت المنطق في حلقة، فإن الوكيل سيدور بلا نهاية. كل دورة تفكير تستهلك رموزًا مكلفة — فهي تكلف عدة أضعاف المدخلات. الوكيل بدون آلية توقف طارئة صحيحة هو ثقب أسود يبتلع ميزانيتك.

كيف نقتصد؟ الأول: التخزين المؤقت الدلالي. طلبات المستخدمين غالبًا ما تكون متشابهة. «كيف أعيد تعيين كلمة المرور؟» تأتي مئات المرات في اليوم. بدلاً من GPT-4، كل مرة — تحول الطلب إلى متجه، وتقارنه مع ذاكرة التخزين المؤقت. إذا كانت التشابهات عالية، تعيد الرد من الذاكرة. بدون رموز. تأخير من ثوانٍ إلى ميلي ثانية. هذا ليس فقط توفيرًا، بل قفزة في التجربة.

الثاني: ضغط التعليمات. السياق الطويل — خطيئة. الخوارزميات المعتمدة على إنتروبيا المعلومات تحلل الكلمات الحيوية، وتحدد الزائدة. يمكن ضغط النص من 1000 رمز إلى 300، مع الحفاظ على الجوهر. تسمح للآلات بالتواصل بلغة الآلات — قد يبدو غير أنيق للبشر، لكن الذكاء الاصطناعي يفهم. أنت توفر 70% من التكاليف.

الثالث: توجيه النماذج. لا ترمِ كل شيء على النموذج الأغلى. للمهام البسيطة مثل استخراج الكيانات أو الترجمة، استخدم نماذج مفتوحة أرخص مثل Llama 3 8B. للمفكرات المنطقية المعقدة — استخدم GPT-4o أو Claude 3.5 Sonnet. مثل شركة منظمة بشكل جيد: الطلبات التي يمكن أن يقررها الاستقبال لا تذهب إلى المدير العام. من يضبط ذلك بدقة، يمكنه تقليل التكاليف الإجمالية للرموز إلى عُشر المنافسين.

لقد فهم الطليعة ذلك بالفعل. عند النظر إلى أنظمة الوكلاء الأحدث — خاصة تلك التي تتجه نحو الأجهزة المحمولة — نرى معركة لتحقيق أقصى قدر من كفاءة الرموز. على الجهاز المحمول، لا يوجد مجال للسعة الكبيرة للسياق. القدرة على النقل محدودة، والذاكرة محدودة، والطاقة محدودة.

يتحكم OpenClaw في استخدام الرموز تقريبًا حتى الهوس. بدلاً من تطبيق السياق الكامل بشكل خشن، يعتمد على البيانات المنظمة. يجبر النموذج على إخراج النتائج في مخطط JSON صارم. لا يسمح للذكاء الاصطناعي «بالحديث» — بل يجبره على «ملء النماذج». هذا يقلل من الرموز غير الضرورية، ويوفر البيانات.

يُظهر Hermes Agent من Nous Research إدارة جراحية للسياق. بدلاً من تخزين كل التاريخ، يستخدم ذاكرة ديناميكية. الذاكرة العاملة: آخر 3-5 محادثات. الذاكرة طويلة المدى: عندما يفيض السياق، يلخص النموذج الخفيف الحوار في عدة جمل، ويخزنها في قاعدة بيانات متجهية. تم حذف الحوار القديم، لكن المعرفة محفوظة. هذا ليس نفايات، بل إزالة جراحية. هذا التحكم في السياق لا يقتصر على تجاوز القيود الفيزيائية فحسب، بل يحقق أيضًا انخفاضًا سريعًا في التكاليف على المستوى الكلي.

الاتجاه الرئيسي واضح: الوكلاء المستقبليون لن يتنافسوا على استخدام المزيد من الأدوات، بل على أداء المهام الأكثر تعقيدًا بميزانية رموز محدودة جدًا. الرقص في السلاسل. من يرقص بشكل أفضل، يفوز.

لكن كل هذا تفاصيل تقنية. في جوهره — هو تغيير في طريقة تفكير صناعة الذكاء الاصطناعي بأكملها. سابقًا، كنا نعتبر الرموز كسلعة استهلاكية. رأيت خصمًا — أضفته إلى السلة. لا يهم إذا كانت النموذج الكبيرة ضرورية حقًا، المهم أن «تبدو رائعة». كانت الشركات تدمج نماذج اللغة الكبيرة بشكل أعمى في كل شيء، وتمنح حسابات لكل موظف، حتى لقائمة الطعام. وعندما تأتي الفاتورة — يصاب الجميع بالصدمة.

الآن، يجب أن نتحول إلى التفكير الاستثماري. كل استهلاك للرمز هو استثمار. مع الاستثمارات، نحسب العائد على الاستثمار. هذا الرمز أنفقته — ماذا جلب لي؟ زاد معدل إغلاق التذاكر؟ قل وقت إصلاح الأخطاء؟ أم أنه مجرد «ها-ها، هذا الذكاء الاصطناعي المضحك»؟

إذا كانت وظيفة تستخدم التعلم الآلي التقليدي تكلف 10 سنتات، والنموذج الكبير يتطلب دولارًا واحدًا لكل رمز، لكنه يزيد التحويل بنسبة 2% فقط — قم بقصها بلا تردد. لم نعد نسعى إلى «ذكاء اصطناعي كبير وشامل»، بل إلى «ضربات صغيرة ومتقنة» دقيقة.

يجب أن نتعلم قول «لا» لأقسام الأعمال. عندما يسألون: «هل يمكن للذكاء الاصطناعي قراءة جميع 100 ألف تقرير وإعطاء ملخص؟» — اسأل: «هل ستغطي إيراداتك تكاليف عدة ملايين من الرموز؟» احسبها. وفر. احسب الرموز، مثل مالك متجر تقليدي.

لا يبدو الأمر كأنه سايبربانك. يبدو ريفيًا. لكنه خطوة ضرورية نحو نضوج الذكاء الاصطناعي.

الارتفاع المستمر في معدل التجزئة ليس أزمة، بل تنظيف متأخر. لقد ثقب فقاعة الدعم غير المحدود وأعاد الجميع إلى الواقع البارد. وهو أمر جيد. لقد أجبر على التخلي عن الإيمان الأعمى بـ«القوة العظيمة — المعجزة» واستعادة احترام الكفاءة الهندسية.

الشركات التي نجت وتطورت — ليست تلك التي تمتلك أغلى النماذج. بل تلك التي، مع مراقبة تغير أرقام الرموز بسرعة، تظل هادئة وواثقة بأنها تربح أكثر مما تنفق. عندما يتراجع المد، يتضح من يسبح عاريًا. هذه المرة، يتراجع الاستفادة من معدل التجزئة. فقط من يقتنص كل قطرة من الرمز كأنه ذهب، يمكنه أن يضع درعًا حقيقيًا.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت