تقنيات الذكاء الاصطناعي والتشفير تقود ثورة في صناعة بوتات نموذج VLA يفتح عصر الأتمتة الجديد

#突破重大 في صناعة البوتات: الذكاء الاصطناعي والتشفير يقودان عصر الأتمتة الجديد

تطوير الذكاء الاصطناعي السريع يعيد تشكيل توقعات الناس حول البوتات. مع بدء نماذج اللغة الكبيرة في التفاعل مع العالم الخارجي، يعتقد الكثيرون أن وكالات الذكاء الاصطناعي قد وصلت إلى قمتها. ومع ذلك، إذا نظرنا إلى الأعمال الكلاسيكية للخيال العلمي، سنجد أن ما يتوق إليه البشر حقًا هو البوتات البشرية التي يمكنها التفاعل في العالم المادي.

يعتقد خبراء الصناعة أن مجال الروبوتات سيشهد قريبًا انفراجة كبيرة مشابهة لـChatGPT. ستقوم هذه المقالة أولاً بتحليل كيف غيرت تقنيات الذكاء الاصطناعي المشهد الصناعي في السنوات الأخيرة، ثم تستكشف كيف ستشكل التقدمات التقنية مثل البطاريات، والتأخير، وجمع البيانات المستقبل، بالإضافة إلى دور التشفير في ذلك. أخيرًا، سنركز على المجالات الرئيسية مثل سلامة الروبوتات، والتمويل، والتقييم، والتعليم.

! لحظات ChatGPT للروبوتات: ثورة الأتمتة مدفوعة ب الذكاء الاصطناعي والتشفير

1. عوامل التحول الرئيسية

(1)突破 الذكاء الاصطناعي

لقد وفرت التقدمات في نماذج اللغة الكبيرة متعددة الوسائط "الدماغ" الضروري لبوتات تنفيذ المهام المعقدة. تقوم البوتات بشكل أساسي بإدراك البيئة من خلال الرؤية والسمع.

تتخصص نماذج رؤية الكمبيوتر التقليدية في الكشف عن الكائنات وتصنيفها، لكنها تجد صعوبة في تحويل المعلومات البصرية إلى تعليمات عمل هادفة. على الرغم من أن نماذج اللغة الكبيرة تظهر أداءً ممتازًا في فهم النصوص وتوليدها، إلا أن قدرتها على إدراك العالم المادي محدودة.

من خلال نموذج التفاعل البصري-اللغوي-العملي ( VLA )، تستطيع بوتات دمج الإدراك البصري وفهم اللغة والقيام بالعمل الفعلي في إطار حسابي موحد. في فبراير 2025، أطلقت إحدى شركات الذكاء الاصطناعي نموذج تحكم عام للروبوتات البشرية Helix، حيث وضع هذا النموذج VLA مع قدراته على العموم بدون عينات وبنيته المزدوجة معيارًا جديدًا للصناعة. تتيح خاصية العموم بدون عينات للبوتات التكيف مع مشاهد جديدة وأشياء جديدة وتعليمات جديدة دون الحاجة إلى إعادة التدريب على كل مهمة. تفصل البنية المزدوجة بين الاستدلال عالي المستوى والاستدلال خفيف الوزن، مما يحقق توازنًا بين التفكير الشبيه بالإنسان والدقة الفورية في الروبوتات البشرية التجارية.

(2) أصبحت بوتات اقتصادية واقعًا

تتميز التقنيات التي تغير العالم بصفة مشتركة - إمكانية الانتشار. لقد تحققت الهواتف الذكية وأجهزة الكمبيوتر الشخصية وتقنية الطباعة ثلاثية الأبعاد من الانتشار من خلال الأسعار التي يمكن أن يتحملها الطبقة الوسطى. عندما تنخفض أسعار بعض بوتات إلى أقل من سعر سيارة متوسطة أو الحد الأدنى من الدخل السنوي في الولايات المتحدة، فإن تصور عالم يتم فيه إنجاز الأعمال البدنية والمهام اليومية بشكل رئيسي بواسطة بوتات لم يعد بعيد المنال.

(3) من التخزين إلى سوق المستهلكين

تكنولوجيا الروبوتات تتوسع من حلول التخزين إلى مجال الاستهلاك. عالمنا مصمم للبشر - يمكن للبشر القيام بجميع أعمال الروبوتات المتخصصة، بينما لا تستطيع الروبوتات المتخصصة القيام بجميع أعمال البشر. لم تعد شركات الروبوتات تقتصر على تصنيع الروبوتات الخاصة بالمصانع، بل تتجه الآن إلى تطوير الروبوتات البشرية الأكثر عمومية. لذلك، فإن تكنولوجيا الروبوتات ليست موجودة فقط في المستودعات، بل ستتغلغل في الحياة اليومية.

التكلفة هي واحدة من العقبات الرئيسية في قابلية التوسع. المؤشر الأكثر أهمية هو التكلفة الشاملة لكل ساعة، والتي يتم حسابها على أنها مجموع تكلفة الفرصة البديلة للوقت المستغرق في التدريب والشحن، وتكلفة تنفيذ المهام، وتكلفة شراء البوتات، مقسومًا على إجمالي ساعات تشغيل البوتات. يجب أن تكون هذه التكلفة أقل من مستوى الأجور المتوسطة في الصناعة ذات الصلة لتكون تنافسية.

لتحقيق اختراق شامل في مجال التخزين، يجب أن تكون التكلفة الشاملة للروبوتات أقل من 31.39 دولار في الساعة. وفي أكبر سوق استهلاكي - قطاع التعليم الخاص والخدمات الصحية، يجب أن يتم التحكم في هذه التكلفة لتكون أقل من 35.18 دولار. حالياً، تتجه الروبوتات نحو أن تكون أكثر تكلفة وأعلى كفاءة وأكثر عمومية.

! لحظات ChatGPT للروبوتات: ثورة الأتمتة المدفوعة ب الذكاء الاصطناعي والتشفير

2. خطوة突破 جديدة في تقنية بوتات

(1) تحسين البطارية

تظل تقنية البطاريات هي نقطة الضعف في الروبوتات الصديقة للمستخدم. أدت القيود المفروضة على تقنية البطاريات في السيارات الكهربائية المبكرة إلى قصر مدة التشغيل وارتفاع التكلفة وانخفاض الجدوى، مما جعلها صعبة الانتشار، ويواجه الروبوت نفس المصاعب. بعض الروبوتات المعروفة لا تتجاوز مدة تشغيلها مرة واحدة 90 دقيقة إلى ساعتين. من الواضح أن المستخدمين لا يرغبون في شحن البطارية يدويًا كل ساعتين، لذا أصبحت الشحن الذاتي والبنية التحتية للتوصيل هي الاتجاهات الأساسية للتطوير. حاليًا، يتوفر نوعان رئيسيان من الشحن للروبوتات: استبدال البطارية أو الشحن المباشر.

وضع استبدال البطارية يحقق التشغيل المستمر عن طريق استبدال بطارية المجموعة المستنفدة بسرعة، مما يقلل من وقت التوقف إلى الحد الأدنى، وهو مناسب لمشاهد الحقول أو المصانع. يمكن تنفيذ هذه العملية يدويًا أو تلقائيًا.

تستخدم الشحن بالتحريض طريقة الطاقة اللاسلكية، وعلى الرغم من أن الشحن الكامل يستغرق وقتًا طويلاً، إلا أنه يمكن تحقيق عملية أوتوماتيكية بالكامل بسهولة.

(2) تحسين التأخير

يمكن تقسيم العمليات ذات الكمون المنخفض إلى فئتين: الإدراك البيئي والتحكم عن بُعد. يشير الإدراك إلى قدرة بوتات على إدراك الفضاء من حولها، بينما يشير التحكم عن بُعد تحديدًا إلى التحكم في الوقت الفعلي من قبل المشغل البشري.

أظهرت الأبحاث أن أنظمة إدراك بوتات تبدأ بمستشعرات رخيصة، لكن الحاجز التكنولوجي يكمن في برامج الدمج، والحوسبة منخفضة الطاقة، والدورات الدقيقة في المللي ثانية. عندما تكمل البوتات تحديد المواقع، ستقوم الشبكات العصبية خفيفة الوزن بتحديد العقبات، والأرفف أو العناصر البشرية. بعد إدخال تسميات المشهد في نظام التخطيط، يتم إنشاء تعليمات المحرك على الفور لإرسالها إلى القدمين أو مجموعة العجلات أو الذراع الآلية. إن تأخير الإدراك الذي يقل عن 50 مللي ثانية يعادل سرعة رد فعل الإنسان - أي تأخير يتجاوز هذه العتبة سيؤدي إلى حركات غير متناسقة للبوتات. لذلك، يجب أن يتم 90% من القرارات محليًا من خلال شبكة بصرية-لغوية-حركية واحدة.

يجب أن تضمن بوتات ذاتية التحكم أداءً عاليًا لنموذج VLA مع تأخير أقل من 50 مللي ثانية؛ بينما تتطلب بوتات التحكم عن بُعد ألا يتجاوز تأخير الإشارة بين جهاز التشغيل والبوت 50 مللي ثانية. هنا تظهر أهمية نموذج VLA بشكل خاص - إذا تم معالجة الإدخالات البصرية والنصية بواسطة نماذج مختلفة ثم تم إدخالها في نموذج لغوي كبير، فإن التأخير الإجمالي سيتجاوز عتبة 50 مللي ثانية.

(3) تحسين جمع البيانات

هناك ثلاث طرق رئيسية لجمع البيانات: بيانات الفيديو من العالم الحقيقي، البيانات الاصطناعية، وبيانات التحكم عن بُعد. تكمن العقبة الرئيسية بين البيانات الواقعية والبيانات الاصطناعية في سد الفجوة بين سلوك الروبوتات الفيزيائي ونماذج الفيديو/المحاكاة. تفتقر بيانات الفيديو الواقعية إلى تفاصيل فيزيائية مثل ردود الفعل اللمسية، أخطاء حركة المفاصل، وتشوه المواد؛ بينما تفتقر البيانات المحاكية إلى متغيرات غير متوقعة مثل أعطال المستشعرات ومعامل الاحتكاك.

أكثر طرق جمع البيانات الواعدة هي التحكم عن بُعد - حيث يقوم مشغل بشري بالتحكم عن بُعد في بوتات لتنفيذ المهام. لكن تكلفة العمالة هي العامل الرئيسي المقيد لجمع البيانات عن بُعد.

تطوير الأجهزة المخصصة يوفر أيضًا حلولًا جديدة لجمع بيانات عالية الجودة. بعض الشركات تجمع بين الطرق السائدة والأجهزة المخصصة لجمع بيانات حركة الإنسان متعددة الأبعاد، والتي يتم تحويلها بعد المعالجة إلى مجموعات بيانات مناسبة لتدريب الشبكات العصبية للبوتات، مع دورات تكرارية سريعة لتوفير بيانات عالية الجودة بكميات هائلة لتدريب الذكاء الاصطناعي للبوتات. هذه الأنابيب التقنية تقلل معًا من مسار التحويل من البيانات الخام إلى البوتات القابلة للتنفيذ.

! لحظات ChatGPT للروبوتات: ثورة الأتمتة مدفوعة ب الذكاء الاصطناعي والتشفير

3. المجالات التي تركز عليها

(1) التشفير التقنية و بوتات融合

يمكن أن يحفز التشفير الأطراف غير الموثوقة على تحسين كفاءة شبكة البوتات. استنادًا إلى المجالات الرئيسية المذكورة أعلاه، يمكن أن يعزز التشفير الكفاءة في ثلاثة مجالات: ربط البنية التحتية، تحسين التأخير، وجمع البيانات.

شبكة البنية التحتية الفيزيائية اللامركزية ( DePIN ) من المتوقع أن تحدث ثورة في بنية الشحن. عندما تعمل الروبوتات البشرية مثل السيارات على مستوى العالم، يجب أن تكون محطات الشحن في متناول اليد مثل محطات الوقود. تتطلب الشبكات المركزية استثمارات أولية ضخمة، بينما تقوم DePIN بتوزيع التكاليف على مشغلي العقد، مما يجعل مرافق الشحن تتوسع بسرعة إلى المزيد من المناطق.

يمكن لـ DePIN أيضًا استخدام البنية التحتية الموزعة لتحسين تأخير التحكم عن بُعد. من خلال تجميع موارد الحوسبة من نقاط الحافة الجغرافية الموزعة، يمكن معالجة أوامر التحكم عن بُعد بواسطة العقد المحلية أو الأقرب المتاحة، مما يقلل إلى الحد الأدنى من مسافة نقل البيانات ويقلل بشكل كبير من تأخير الاتصالات. ولكن المشاريع الحالية لـ DePIN تركز بشكل أساسي على التخزين اللامركزي، وتوزيع المحتوى، ومشاركة النطاق الترددي، على الرغم من وجود مشاريع تظهر مزايا الحوسبة الحافة في البث المباشر أو إنترنت الأشياء، إلا أنها لم تمتد بعد إلى مجال الروبوتات أو التحكم عن بُعد.

التحكم عن بُعد هو أكثر طرق جمع البيانات الواعدة، ولكن تكلفة توظيف الكيانات المركزية لمهنيين لجمع البيانات مرتفعة للغاية. تعمل DePIN على حل هذه المشكلة من خلال تحفيز الأطراف الثالثة لتوفير بيانات التحكم عن بُعد عبر رموز التشفير. بعض المشاريع تعمل على بناء شبكة عالمية لمشغلي التحكم عن بُعد، وتحويل مساهماتهم إلى أصول رقمية موثقة، مما يشكل نظاماً لامركزياً غير مصرح به - يمكن للمشاركين من خلاله تحقيق الأرباح، والمشاركة في الحوكمة، والمساعدة في تدريب بوتات AGI.

(2) الأمان دائمًا هو الشاغل الرئيسي

الهدف النهائي لتكنولوجيا الروبوتات هو تحقيق الاستقلالية الكاملة، لكن البشرية لا ترغب في رؤية الاستقلالية تحول الروبوتات إلى أسلحة هجومية. لقد أثار موضوع أمان النماذج اللغوية الكبيرة القلق، وعندما تمتلك هذه النماذج القدرة على الحركة الفعلية، تصبح سلامة الروبوتات شرطًا أساسيًا لقبول المجتمع.

الأمن الاقتصادي هو أحد أعمدة ازدهار بيئة البوتات. بعض الشركات في هذا المجال تقوم ببناء طبقة تنسيق آلي لامركزية، من خلال التشفير لإثبات هوية الأجهزة، والتحقق من الوجود المادي، والوصول إلى الموارد. على عكس إدارة سوق المهام البسيطة، تمكن هذه الأنظمة البوتات من إثبات معلومات الهوية والموقع الجغرافي وسجلات السلوك بشكل مستقل دون الاعتماد على وسطاء مركزيين.

يتم تنفيذ قيود السلوك والمصادقة على الهوية من خلال آليات على السلسلة، مما يضمن إمكانية تدقيق الامتثال من قبل أي شخص. ستحصل بوتات التي تتوافق مع معايير الأمان ومتطلبات الجودة واللوائح الإقليمية على مكافآت، بينما سيواجه المخالفون عقوبات أو إلغاء تأهيل، مما يساهم في إنشاء آلية للمسؤولية والثقة في شبكة الروبوتات المستقلة.

يمكن لشبكة إعادة الرهن من الطرف الثالث أيضًا أن توفر ضمانات أمان متكافئة. على الرغم من أن نظام معلمات العقوبة لا يزال بحاجة إلى تحسين، إلا أن التكنولوجيا ذات الصلة قد دخلت المرحلة العملية. من المتوقع أن يتم تشكيل معايير الأمان في الصناعة قريبًا، وعندها سيتم نمذجة معلمات العقوبة بالإشارة إلى هذه المعايير.

4. سد الفجوات في تقنية البوتات

على عكس الذكاء الاصطناعي، فإن دخول مجال بوتات يكون صعبًا عندما تكون الموارد المالية محدودة. لتحقيق انتشار البوتات، يجب خفض عتبة تطويرها إلى مستوى سهولة تطوير تطبيقات الذكاء الاصطناعي. نحن نعتقد أن هناك مجالًا للتحسين في ثلاثة مجالات: آلية التمويل، نظام التقييم، والبيئة التعليمية.

التمويل هو نقطة الألم في مجال بوتات. تطوير برامج الكمبيوتر يتطلب فقط جهاز كمبيوتر وموارد حوسبة سحابية، بينما بناء بوت كامل الوظائف يتطلب شراء محركات وأجهزة استشعار وبطاريات وغيرها من الأجهزة، مما يجعل التكلفة تتجاوز بسهولة 100,000 دولار. هذه الخصائص المادية تجعل تطوير البوتات أقل مرونة وأعلى تكلفة مقارنةً بالتشفير.

تظل بنية تقييم بوتات السيناريوهات الواقعية في مرحلة مبكرة. لقد تم إنشاء نظام واضح لدوال الخسارة في مجال الذكاء الاصطناعي، ويمكن اختبارها بشكل كامل في بيئات افتراضية. ومع ذلك، لا يمكن تحويل الاستراتيجيات الافتراضية الممتازة مباشرة إلى حلول فعالة في العالم الحقيقي. يحتاج البوتات إلى مرافق تقييم لاستراتيجيات الاستقلالية لاختبارها في بيئات واقعية متنوعة من أجل تحقيق تحسين تدريجي.

عندما تنضج هذه البنية التحتية ، سيتدفق عدد كبير من المواهب ، وستعيد الروبوتات البشرية رسم منحنى الانفجار الخاص بـ Web2. بعض الشركات تتقدم في هذا الاتجاه - حيث تقوم مشاريعها مفتوحة المصدر بتحويل الأجهزة الأصلية إلى وكلاء ذكيين قابلين للتطوير وذوي وعي اقتصادي. يمكن أن تكون وحدات الرؤية واللغة والتخطيط الحركي قابلة للتوصيل والتشغيل مثل تطبيقات الهواتف المحمولة ، وتعرض جميع خطوات الاستدلال باللغة الإنجليزية الواضحة ، مما يجعل من الممكن للمشغلين تدقيق أو تعديل السلوك دون الحاجة إلى التفاعل مع البرنامج الثابت. تتيح هذه القدرة على الاستدلال باللغة الطبيعية للجيل الجديد من المواهب الدخول بسلاسة إلى مجال الروبوتات ، مما يمثل خطوة رئيسية نحو إطلاق ثورة الروبوتات على منصة مفتوحة ، تمامًا كما فعلت حركة المصدر المفتوح في تسريع الذكاء الاصطناعي.

كثافة المواهب تحدد مسار الصناعة. نظام التعليم الشامل المنظم مهم للغاية لتزويد مجال الروبوتات بالمواهب. بدأت بعض الشركات في تقديم منهاج تعليم عام يعتمد على الروبوتات البشرية في المدارس العامة K-12 في الولايات المتحدة. صمم هذا المنهاج ليكون غير مرتبط بمنصة، ويمكن أن يتكيف مع أشكال الروبوتات المختلفة، مما يوفر للطلاب فرصًا للتطبيق العملي. هذه إشارة إيجابية تعزز من حكم الصناعة: في السنوات القادمة، سيكون مستوى موارد التعليم في مجال الروبوتات مماثلاً لمجال التشفير.

5. آفاق المستقبل

نموذج الرؤية-اللغة-العمل ( VLA ) والابتكار وتأثيرات الاقتصاد الكبير، قد ولدت روبوتات إنسانية فعالة واقتصادية وشاملة. مع توسع روبوتات التخزين في سوق المستهلكين، أصبحت الأمان، ونماذج التمويل، وأنظمة التقييم اتجاهات استكشاف حاسمة. يعتقد الخبراء في الصناعة بشدة أن التشفير سيقوم من خلال ثلاثة

AGI2.54%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 4
  • إعادة النشر
  • مشاركة
تعليق
0/400
WalletDetectivevip
· منذ 12 س
أشعر بالضياع، ما الذي حدث مجددًا؟
شاهد النسخة الأصليةرد0
ChainSpyvip
· منذ 14 س
هذا الذكاء الاصطناعي لم يبدأ العمل الجاد بعد، كل يوم يتفاخر.
شاهد النسخة الأصليةرد0
StablecoinArbitrageurvip
· منذ 14 س
*sigh* دورة ضجة تقنية أخرى... يظهر لي هوامش الربح على التحكيم الروبوتي أولاً بصراحة
شاهد النسخة الأصليةرد0
DaoDevelopervip
· منذ 14 س
مثير للاهتمام كيف يمكن أن تؤمن zk-proofs تفاعلات البشر والروبوتات بصراحة
شاهد النسخة الأصليةرد0
  • تثبيت