Coconote
AI notes
AI voice & video notes
Try for free
🤖
فهم المحولات التوليدية المتقدمة
Sep 10, 2024
مقدمة في المحول التوليدي المولد مسبقًا (GPT)
معنى GPT
: المحول التوليدي المدرب مسبقًا.
توليد نص
: روبوتات تنتج نصوص جديدة.
التدريب المسبق
: تعلم النموذج من بيانات ضخمة.
المحول
: نوع محدد من الشبكات العصبية.
شرح المحول
شرح بصري
: متابعة تدفق البيانات خطوة بخطوة.
أنواع النماذج
:
نماذج تأخذ الصوت وتنتج نص.
نماذج تنتج خطاب من نص فقط.
أدوات مثل
: Dolly وMidjourney تستخدم المحولات لإنتاج الصور من نصوص.
تاريخ المحولات
تاريخ الاختراع
: المحول الأصلي تم تقديمه بواسطة Google في 2017.
هدفه: ترجمة النصوص بين اللغات.
نموذج ChatGPT
:
يتوقع الكلمة التالية بناءً على جزء من النص.
عملية التنبؤ
كيفية التنبؤ
:
تقديم مقتطف نصي.
أخذ عينة عشوائية من توزيع الاحتمالات.
إلحاق العينة بالنص وتكرار العملية.
التجارب مع GPT-2 وGPT-3
: إنتاج نصوص معقولة من تحفيزات معينة.
تدفق البيانات عبر المحول
تقسيم المدخلات
إلى رموز:
كلمات أو أجزاء من كلمات.
ربط الرموز بالمتجهات.
عملية كتلة الانتباه
:
تحديث معاني الكلمات في السياق.
تحسين الفهم بناءً على السياق.
كتل الإدراك الحسي
:
معالجة المتجهات في نفس الوقت.
التدريب والتعلم الآلي
التعلم الآلي
: نماذج تتعامل مع البيانات لتحديد سلوكيات محددة.
الانحدار الخطي
: نموذج بسيط في التعلم الآلي.
تعقيد النماذج
:
GPT-3 يحتوي على 175 مليار معلمة.
الأوزان والمصفوفات
الأوزان
: تحدد كيفية تصرف النموذج.
المصفوفات
: تمثل البيانات المدخلة.
مصفوفة التضمين
: تحويل الكلمات إلى متجهات.
تضمين الكلمات
تضمين الكلمات
: تمثيل الكلمات في مساحة عالية الأبعاد.
علاقات دلالية
: الاتجاهات تحمل معنى سياقي.
مصفوفة إلغاء التضمين
: تستخدم لتوقع الكلمات التالية.
دالة Softmax
تحويل الأرقام إلى توزيع احتمالي
:
قيم بين 0 و1، مجموعها 1.
يعزز القيم الأكبر.
تأثير درجة الحرارة
: يحدد مستوى العشوائية في الاختيار.
ختام
النقطة الأساسية
: فهم كيفية عمل المحولات وفهم العمليات الأساسية.
الفصول القادمة
: التركيز على كتل الانتباه وكيفية العمل.
📄
Full transcript