يُعد الذكاء الاصطناعي عالماً عميقاً ومعقداً. غالبًا ما يعتمد العلماء الذين يعملون في هذا المجال على المصطلحات الفنية واللغة المتخصصة لشرح ما يعملون عليه. ونتيجة لذلك، نضطر بشكل متكرر إلى استخدام تلك المصطلحات التقنية في تغطيتنا لصناعة الذكاء الاصطناعي. لهذا السبب، اعتقدنا أنه سيكون من المفيد تجميع مسرد مصطلحات مع تعريفات لبعض أهم الكلمات والعبارات التي نستخدمها في مقالاتنا.
سنقوم بتحديث هذا المسرد بانتظام لإضافة إدخالات جديدة حيث يكشف الباحثون باستمرار عن طرق جديدة لدفع حدود الذكاء الاصطناعي مع تحديد مخاطر السلامة الناشئة.
AGI (الذكاء الاصطناعي العام)
الذكاء الاصطناعي العام، أو AGI، هو مصطلح غامض. ولكنه يشير بشكل عام إلى الذكاء الاصطناعي الذي يكون أكثر قدرة من الإنسان العادي في العديد من المهام، إن لم يكن معظمها. وصف الرئيس التنفيذي لشركة OpenAI، سام ألتمان، مؤخرًا الذكاء الاصطناعي العام بأنه “مكافئ لإنسان متوسط يمكنك توظيفه كزميل عمل”. وفي الوقت نفسه، يُعرّف ميثاق OpenAI الذكاء الاصطناعي العام بأنه “أنظمة مستقلة للغاية تتفوق على البشر في معظم الأعمال ذات القيمة الاقتصادية”. يختلف فهم Google DeepMind قليلاً عن هذين التعريفين؛ حيث يرى المختبر الذكاء الاصطناعي العام على أنه “ذكاء اصطناعي لا يقل قدرة عن البشر في معظم المهام المعرفية”. هل أنت مرتبك؟ لا تقلق – كذلك الخبراء في طليعة أبحاث الذكاء الاصطناعي.
وكيل الذكاء الاصطناعي (AI agent)
يشير وكيل الذكاء الاصطناعي إلى أداة تستخدم تقنيات الذكاء الاصطناعي لأداء سلسلة من المهام نيابة عنك – تتجاوز ما يمكن أن يفعله روبوت محادثة ذكاء اصطناعي أبسط – مثل تقديم تقارير النفقات، أو حجز التذاكر أو طاولة في مطعم، أو حتى كتابة وصيانة التعليمات البرمجية. ومع ذلك، كما أوضحنا سابقًا، هناك الكثير من القطع المتحركة في هذا الفضاء الناشئ، لذا قد يعني “وكيل الذكاء الاصطناعي” أشياء مختلفة لأشخاص مختلفين. كما أن البنية التحتية لا تزال قيد الإنشاء لتحقيق قدراته المتوخاة. لكن المفهوم الأساسي يشير إلى نظام مستقل قد يعتمد على أنظمة ذكاء اصطناعي متعددة لتنفيذ مهام متعددة الخطوات.
سلسلة التفكير (Chain of thought)
عند طرح سؤال بسيط، يمكن للعقل البشري الإجابة دون حتى التفكير كثيرًا فيه – أشياء مثل “أي حيوان أطول، الزرافة أم القطة؟” ولكن في كثير من الحالات، غالبًا ما تحتاج إلى قلم وورقة للتوصل إلى الإجابة الصحيحة لأن هناك خطوات وسيطة. على سبيل المثال، إذا كان لدى مزارع دجاج وأبقار، ولديهم معًا 40 رأسًا و 120 ساقًا، فقد تحتاج إلى كتابة معادلة بسيطة للتوصل إلى الإجابة (20 دجاجة و 20 بقرة).
في سياق الذكاء الاصطناعي، يعني التفكير المتسلسل لنماذج اللغة الكبيرة تقسيم المشكلة إلى خطوات وسيطة أصغر لتحسين جودة النتيجة النهائية. عادة ما يستغرق الأمر وقتًا أطول للحصول على إجابة، ولكن من المرجح أن تكون الإجابة صحيحة، خاصة في سياق المنطق أو البرمجة. يتم تطوير نماذج التفكير من نماذج اللغة الكبيرة التقليدية وتحسينها للتفكير المتسلسل بفضل التعلم المعزز.
التعلم العميق (Deep learning)
مجموعة فرعية من التعلم الآلي ذاتي التحسين حيث يتم تصميم خوارزميات الذكاء الاصطناعي بهيكل شبكة عصبية اصطناعية (ANN) متعدد الطبقات. وهذا يسمح لها بإجراء ارتباطات أكثر تعقيدًا مقارنة بأنظمة التعلم الآلي الأبسط، مثل النماذج الخطية أو أشجار القرار. يستلهم هيكل خوارزميات التعلم العميق من المسارات المترابطة للخلايا العصبية في الدماغ البشري.
نماذج الذكاء الاصطناعي للتعلم العميق قادرة على تحديد الخصائص المهمة في البيانات بنفسها، بدلاً من مطالبة المهندسين البشريين بتحديد هذه الميزات. يدعم الهيكل أيضًا الخوارزميات التي يمكنها التعلم من الأخطاء، ومن خلال عملية التكرار والتعديل، تحسين مخرجاتها الخاصة. ومع ذلك، تتطلب أنظمة التعلم العميق الكثير من نقاط البيانات لتحقيق نتائج جيدة (الملايين أو أكثر). كما أنها تستغرق عادةً وقتًا أطول للتدريب مقارنة بخوارزميات التعلم الآلي الأبسط – لذا تميل تكاليف التطوير إلى أن تكون أعلى.
الانتشار (Diffusion)
الانتشار هو التقنية الكامنة وراء العديد من نماذج الذكاء الاصطناعي المولدة للفن والموسيقى والنصوص. مستوحاة من الفيزياء، تقوم أنظمة الانتشار “بتدمير” بنية البيانات ببطء – على سبيل المثال، الصور والأغاني وما إلى ذلك – عن طريق إضافة ضوضاء حتى لا يتبقى شيء. في الفيزياء، يكون الانتشار تلقائيًا ولا رجعة فيه – لا يمكن استعادة السكر المنتشر في القهوة إلى شكل مكعب. لكن أنظمة الانتشار في الذكاء الاصطناعي تهدف إلى تعلم نوع من عملية “الانتشار العكسي” لاستعادة البيانات المدمرة، واكتساب القدرة على استعادة البيانات من الضوضاء.
التقطير (Distillation)
التقطير هو أسلوب يستخدم لاستخلاص المعرفة من نموذج ذكاء اصطناعي كبير باستخدام نموذج “المعلم والطالب”. يرسل المطورون طلبات إلى نموذج المعلم ويسجلون المخرجات. تتم مقارنة الإجابات أحيانًا بمجموعة بيانات لمعرفة مدى دقتها. ثم تُستخدم هذه المخرجات لتدريب نموذج الطالب، الذي يتم تدريبه لتقريب سلوك المعلم.
يمكن استخدام التقطير لإنشاء نموذج أصغر وأكثر كفاءة بناءً على نموذج أكبر مع الحد الأدنى من فقدان التقطير. من المحتمل أن تكون هذه هي الطريقة التي طورت بها OpenAI نموذج GPT-4 Turbo، وهو إصدار أسرع من GPT-4.
بينما تستخدم جميع شركات الذكاء الاصطناعي التقطير داخليًا، فمن المحتمل أيضًا أن تكون بعض شركات الذكاء الاصطناعي قد استخدمته للحاق بالنماذج الرائدة. عادةً ما ينتهك التقطير من منافس شروط خدمة واجهات برمجة تطبيقات الذكاء الاصطناعي ومساعدي الدردشة.
الضبط الدقيق (Fine-tuning)
يشير هذا إلى مزيد من التدريب لنموذج ذكاء اصطناعي لتحسين الأداء لمهمة أو مجال أكثر تحديدًا مما كان عليه سابقًا محور تركيز تدريبه – عادةً عن طريق إدخال بيانات جديدة ومتخصصة (أي موجهة نحو المهام).
تتخذ العديد من الشركات الناشئة في مجال الذكاء الاصطناعي نماذج لغوية كبيرة كنقطة انطلاق لبناء منتج تجاري ولكنها تتنافس لزيادة الفائدة لقطاع أو مهمة مستهدفة من خلال استكمال دورات التدريب السابقة بالضبط الدقيق بناءً على معرفتها وخبرتها الخاصة بالمجال.
GAN (الشبكة التوليدية التنافسية)
الشبكة التوليدية التنافسية (GAN) هي نوع من أطر التعلم الآلي التي تدعم بعض التطورات المهمة في الذكاء الاصطناعي التوليدي عندما يتعلق الأمر بإنتاج بيانات واقعية – بما في ذلك (وليس فقط) أدوات التزييف العميق (deepfake). تتضمن الشبكات التوليدية التنافسية استخدام زوج من الشبكات العصبية، إحداهما تعتمد على بيانات التدريب الخاصة بها لتوليد مخرجات يتم تمريرها إلى النموذج الآخر لتقييمها. وبالتالي، يلعب هذا النموذج الثاني، المميز (discriminator)، دور المصنف لمخرجات النموذج المولد – مما يمكنه من التحسن بمرور الوقت.
يتم إعداد هيكل GAN كمنافسة (ومن هنا جاءت كلمة “تنافسية”) – حيث يتم برمجة النموذجين بشكل أساسي لمحاولة التفوق على بعضهما البعض: يحاول المولد تجاوز مخرجاته من خلال المميز، بينما يعمل المميز على اكتشاف البيانات المولدة صناعياً. يمكن لهذه المنافسة المنظمة تحسين مخرجات الذكاء الاصطناعي لتكون أكثر واقعية دون الحاجة إلى تدخل بشري إضافي. على الرغم من أن الشبكات التوليدية التنافسية تعمل بشكل أفضل للتطبيقات الأضيق (مثل إنتاج صور أو مقاطع فيديو واقعية)، بدلاً من الذكاء الاصطناعي للأغراض العامة.
الهلوسة (Hallucination)
الهلوسة هي المصطلح المفضل في صناعة الذكاء الاصطناعي لوصف قيام نماذج الذكاء الاصطناعي باختلاق الأشياء – أي توليد معلومات غير صحيحة حرفيًا. من الواضح أنها مشكلة كبيرة لجودة الذكاء الاصطناعي.
تنتج الهلوسات مخرجات ذكاء اصطناعي توليدي يمكن أن تكون مضللة وقد تؤدي حتى إلى مخاطر في الحياة الواقعية – مع عواقب وخيمة محتملة (فكر في استعلام صحي يعرض نصيحة طبية ضارة). هذا هو السبب في أن معظم الأدوات التوليدية للذكاء الاصطناعي تحتوي الآن في تفاصيلها الدقيقة على تحذيرات للمستخدمين للتحقق من الإجابات التي يولدها الذكاء الاصطناعي، على الرغم من أن هذه التنازلات عادة ما تكون أقل بروزًا بكثير من المعلومات التي توزعها الأدوات بلمسة زر واحدة.
يُعتقد أن مشكلة اختلاق الذكاء الاصطناعي للمعلومات تنشأ نتيجة للفجوات في بيانات التدريب. بالنسبة للذكاء الاصطناعي التوليدي للأغراض العامة بشكل خاص – المعروف أيضًا أحيانًا باسم النماذج التأسيسية – يبدو هذا صعب الحل. ببساطة لا توجد بيانات كافية لتدريب نماذج الذكاء الاصطناعي على حل جميع الأسئلة التي يمكن أن نطرحها بشكل شامل. خلاصة القول: لم نخترع الإله (بعد).
تساهم الهلوسات في الدفع نحو نماذج ذكاء اصطناعي متخصصة و/أو رأسية بشكل متزايد – أي ذكاء اصطناعي خاص بمجال معين يتطلب خبرة أضيق – كوسيلة لتقليل احتمالية فجوات المعرفة وتقليص مخاطر المعلومات المضللة.
الاستدلال (Inference)
الاستدلال هو عملية تشغيل نموذج ذكاء اصطناعي. إنه إطلاق العنان لنموذج لتقديم تنبؤات أو استخلاص استنتاجات من البيانات التي شوهدت سابقًا. للتوضيح، لا يمكن أن يحدث الاستدلال بدون تدريب؛ يجب أن يتعلم النموذج الأنماط في مجموعة من البيانات قبل أن يتمكن من الاستقراء بفعالية من بيانات التدريب هذه.
يمكن للعديد من أنواع الأجهزة إجراء الاستدلال، بدءًا من معالجات الهواتف الذكية إلى وحدات معالجة الرسومات القوية إلى مسرعات الذكاء الاصطناعي المصممة خصيصًا. ولكن ليست جميعها قادرة على تشغيل النماذج بشكل جيد بنفس القدر. ستستغرق النماذج الكبيرة جدًا وقتًا طويلاً لتقديم تنبؤات على، على سبيل المثال، جهاز كمبيوتر محمول مقابل خادم سحابي مزود بشرائح ذكاء اصطناعي متطورة.
نموذج اللغة الكبير (LLM)
نماذج اللغة الكبيرة، أو LLMs، هي نماذج الذكاء الاصطناعي التي تستخدمها مساعدات الذكاء الاصطناعي الشائعة، مثل ChatGPT و Claude و Gemini من Google و Llama AI من Meta و Microsoft Copilot أو Le Chat من Mistral. عندما تتحدث مع مساعد ذكاء اصطناعي، فإنك تتفاعل مع نموذج لغة كبير يعالج طلبك مباشرة أو بمساعدة أدوات مختلفة متاحة، مثل تصفح الويب أو مترجمي الأكواد.
يمكن أن يكون لمساعدي الذكاء الاصطناعي ونماذج اللغة الكبيرة أسماء مختلفة. على سبيل المثال، GPT هو نموذج اللغة الكبير لـ OpenAI و ChatGPT هو منتج مساعد الذكاء الاصطناعي.
نماذج اللغة الكبيرة هي شبكات عصبية عميقة تتكون من مليارات المعلمات الرقمية (أو الأوزان، انظر أدناه) التي تتعلم العلاقات بين الكلمات والعبارات وتنشئ تمثيلاً للغة، وهو نوع من الخرائط متعددة الأبعاد للكلمات.
يتم إنشاء هذه النماذج من ترميز الأنماط التي تجدها في مليارات الكتب والمقالات والنصوص. عندما تطرح سؤالاً على نموذج لغة كبير، يقوم النموذج بإنشاء النمط الأكثر احتمالاً الذي يناسب السؤال. ثم يقوم بتقييم الكلمة التالية الأكثر احتمالاً بعد الكلمة الأخيرة بناءً على ما قيل من قبل. كرر، كرر، وكرر.
الشبكة العصبية (Neural network)
تشير الشبكة العصبية إلى الهيكل الخوارزمي متعدد الطبقات الذي يدعم التعلم العميق – وبشكل أوسع، الطفرة الكاملة في أدوات الذكاء الاصطناعي التوليدي بعد ظهور نماذج اللغة الكبيرة.
على الرغم من أن فكرة استلهام المسارات المترابطة بكثافة للدماغ البشري كهيكل تصميم لخوارزميات معالجة البيانات تعود إلى الأربعينيات من القرن الماضي، إلا أن الظهور الأحدث بكثير لأجهزة معالجة الرسومات (GPUs) – عبر صناعة ألعاب الفيديو – هو الذي أطلق العنان حقًا لقوة هذه النظرية. أثبتت هذه الرقائق أنها مناسبة تمامًا لتدريب الخوارزميات بطبقات أكثر بكثير مما كان ممكنًا في العصور السابقة – مما مكّن أنظمة الذكاء الاصطناعي القائمة على الشبكات العصبية من تحقيق أداء أفضل بكثير عبر العديد من المجالات، بما في ذلك التعرف على الصوت والملاحة الذاتية واكتشاف الأدوية.
التدريب (Training)
يتضمن تطوير الذكاء الاصطناعي للتعلم الآلي عملية تُعرف بالتدريب. بعبارات بسيطة، يشير هذا إلى إدخال البيانات حتى يتمكن النموذج من التعلم من الأنماط وإنشاء مخرجات مفيدة.
يمكن أن تصبح الأمور فلسفية بعض الشيء في هذه المرحلة من مكدس الذكاء الاصطناعي – نظرًا لأنه قبل التدريب، فإن الهيكل الرياضي المستخدم كنقطة انطلاق لتطوير نظام التعلم هو مجرد مجموعة من الطبقات والأرقام العشوائية. فقط من خلال التدريب يتشكل نموذج الذكاء الاصطناعي حقًا. في الأساس، إنها عملية استجابة النظام للخصائص الموجودة في البيانات التي تمكنه من تكييف المخرجات نحو هدف منشود – سواء كان ذلك تحديد صور القطط أو إنتاج قصيدة هايكو عند الطلب.
من المهم ملاحظة أنه ليس كل الذكاء الاصطناعي يتطلب تدريبًا. لا تحتاج أنظمة الذكاء الاصطناعي القائمة على القواعد والتي تمت برمجتها لاتباع تعليمات محددة مسبقًا يدويًا – على سبيل المثال، مثل روبوتات المحادثة الخطية – إلى الخضوع للتدريب. ومع ذلك، من المرجح أن تكون أنظمة الذكاء الاصطناعي هذه أكثر تقييدًا من أنظمة التعلم الذاتي (المدربة جيدًا).
ومع ذلك، يمكن أن يكون التدريب مكلفًا لأنه يتطلب الكثير من المدخلات – وعادةً ما تتجه أحجام المدخلات المطلوبة لمثل هذه النماذج نحو الأعلى.
يمكن أحيانًا استخدام الأساليب المختلطة لاختصار تطوير النموذج والمساعدة في إدارة التكاليف. مثل إجراء ضبط دقيق قائم على البيانات لذكاء اصطناعي قائم على القواعد – مما يعني أن التطوير يتطلب بيانات وحوسبة وطاقة وتعقيدًا خوارزميًا أقل مما لو كان المطور قد بدأ البناء من الصفر.
نقل التعلم (Transfer learning)
أسلوب يتم فيه استخدام نموذج ذكاء اصطناعي تم تدريبه مسبقًا كنقطة انطلاق لتطوير نموذج جديد لمهمة مختلفة ولكنها عادةً ما تكون ذات صلة – مما يسمح بإعادة تطبيق المعرفة المكتسبة في دورات التدريب السابقة.
يمكن أن يؤدي نقل التعلم إلى تحقيق وفورات في الكفاءة عن طريق اختصار تطوير النموذج. يمكن أن يكون مفيدًا أيضًا عندما تكون البيانات الخاصة بالمهمة التي يتم تطوير النموذج من أجلها محدودة إلى حد ما. ولكن من المهم ملاحظة أن النهج له قيود. من المحتمل أن تتطلب النماذج التي تعتمد على نقل التعلم لاكتساب قدرات معممة تدريبًا على بيانات إضافية من أجل الأداء الجيد في مجال تركيزها.
الأوزان (Weights)
الأوزان أساسية لتدريب الذكاء الاصطناعي، لأنها تحدد مقدار الأهمية (أو الوزن) الممنوح لميزات مختلفة (أو متغيرات الإدخال) في البيانات المستخدمة لتدريب النظام – وبالتالي تشكيل مخرجات نموذج الذكاء الاصطناعي.
بعبارة أخرى، الأوزان هي معلمات رقمية تحدد ما هو الأبرز في مجموعة بيانات لمهمة تدريب معينة. تحقق وظيفتها من خلال تطبيق الضرب على المدخلات. يبدأ تدريب النموذج عادةً بأوزان يتم تعيينها عشوائيًا، ولكن مع تقدم العملية، يتم تعديل الأوزان حيث يسعى النموذج للوصول إلى مخرجات تطابق الهدف بشكل أوثق.
على سبيل المثال، يمكن لنموذج ذكاء اصطناعي للتنبؤ بأسعار المساكن تم تدريبه على بيانات عقارية تاريخية لموقع مستهدف أن يتضمن أوزانًا لميزات مثل عدد غرف النوم والحمامات، وما إذا كان العقار منفصلاً أو شبه منفصل، وما إذا كان به موقف سيارات، ومرآب، وما إلى ذلك.
في نهاية المطاف، تعكس الأوزان التي يربطها النموذج بكل من هذه المدخلات مدى تأثيرها على قيمة العقار، بناءً على مجموعة البيانات المحددة.