Rememberizer Docs
تسجيل الدخولاشتراكاتصل بنا
دليل
دليل
  • لماذا Rememberizer؟
  • خلفية
    • ما هي تضمينات المتجهات وقواعد بيانات المتجهات؟
    • مسرد
    • المصطلحات القياسية
  • الاستخدام الشخصي
    • البدء
      • ابحث في معرفتك
      • الوصول إلى فلتر الذكريات
      • المعرفة العامة
      • إدارة معرفتك المدمجة
  • التكاملات
    • تطبيق Rememberizer
    • تكامل Rememberizer مع Slack
    • تكامل Rememberizer مع Google Drive
    • تكامل Rememberizer مع Dropbox
    • تكامل Rememberizer مع Gmail
    • تكامل Rememberizer مع الذاكرة
    • خوادم Rememberizer MCP
    • إدارة التطبيقات الخارجية
  • موارد المطورين
    • نظرة عامة على المطور
  • خيارات التكامل
    • تسجيل واستخدام مفاتيح API
    • تسجيل تطبيقات Rememberizer
    • تفويض تطبيقات Rememberizer
    • إنشاء GPT لـ Rememberizer
    • تكامل LangChain
    • متاجر المتجهات
    • تحدث إلى Slack تطبيق الويب النموذجي
  • تكامل المؤسسات
    • أنماط تكامل المؤسسات
  • مرجع واجهة برمجة التطبيقات
    • الصفحة الرئيسية لوثائق واجهة برمجة التطبيقات
    • المصادقة
  • واجهات برمجة التطبيقات الأساسية
    • البحث عن المستندات حسب التشابه الدلالي
    • استرجاع المستندات
    • استرجاع محتويات المستندات
    • استرجاع محتوى Slack
    • تذكر المحتوى إلى Rememberizer
  • الحساب والتكوين
    • استرجاع تفاصيل حساب المستخدم الحالي
    • قائمة تكاملات مصادر البيانات المتاحة
    • المذكرات
    • الحصول على جميع المعرفة العامة المضافة
  • واجهات برمجة تطبيقات تخزين المتجهات
    • وثائق تخزين المتجهات
    • الحصول على معلومات تخزين المتجهات
    • الحصول على قائمة بالوثائق في تخزين المتجهات
    • الحصول على معلومات الوثيقة
    • إضافة وثيقة نصية جديدة إلى تخزين المتجهات
    • رفع الملفات إلى تخزين المتجهات
    • تحديث محتوى الملف في تخزين المتجهات
    • إزالة وثيقة في تخزين المتجهات
    • البحث عن وثائق تخزين المتجهات حسب التشابه الدلالي
  • موارد إضافية
    • الإشعارات
      • شروط الاستخدام
      • سياسة الخصوصية
      • B2B
        • حول وكيل Reddit
  • الإصدارات
    • صفحة ملاحظات الإصدار
  • إصدارات 2025
    • 25 أبريل 2025
    • 18 أبريل 2025
    • 11 أبريل 2025
    • 4 أبريل 2025
    • 28 مارس 2025
    • 21 مارس 2025
    • 14 مارس 2025
    • 17 يناير 2025
  • إصدارات 2024
    • 27 ديسمبر 2024
    • 20 ديسمبر 2024
    • 13 ديسمبر 2024
    • 6 ديسمبر 2024
  • 29 نوفمبر 2024
  • 22 نوفمبر 2024
  • 15 نوفمبر 2024
  • 8 نوفمبر 2024
  • 1 نوفمبر 2024
  • 25 أكتوبر 2024
  • 18 أكتوبر 2024
  • 11 أكتوبر 2024
  • 4 أكتوبر 2024
  • 27 سبتمبر 2024
  • 20 سبتمبر 2024
  • 13 سبتمبر 2024
  • 16 أغسطس 2024
  • 9 أغسطس 2024
  • 2 أغسطس 2024
  • 26 يوليو 2024
  • 12 يوليو 2024
  • 28 يونيو 2024
  • 14 يونيو 2024
  • 31 مايو 2024
  • 17 مايو 2024
  • 10 مايو 2024
  • 26 أبريل 2024
  • 19 أبريل 2024
  • 12 أبريل 2024
  • 5 أبريل 2024
  • 25 مارس 2024
  • 18 مارس 2024
  • 11 مارس 2024
  • 4 مارس 2024
  • 26 فبراير 2024
  • 19 فبراير 2024
  • 12 فبراير 2024
  • 5 فبراير 2024
  • 29 يناير 2024
  • 22 يناير 2024
  • 15 يناير 2024
  • وثائق LLM
    • وثائق Rememberizer LLM جاهزة
Powered by GitBook
On this page
  • كيف تستخدم Rememberizer تمثيلات المتجهات
  • فهم تضمينات المتجهات
  • ما وراء النص: التضمينات متعددة الوسائط
  • التطبيقات في العالم الحقيقي
  • كيف يختلف بحث Rememberizer القائم على المتجهات عن البحث القائم على الكلمات الرئيسية
  • الموارد التقنية
  • أساس الذكاء الاصطناعي الحديث
  1. خلفية

ما هي تضمينات المتجهات وقواعد بيانات المتجهات؟

لماذا تعتبر Rememberizer أكثر من مجرد قاعدة بيانات أو محرك بحث عن الكلمات الرئيسية

PreviousخلفيةNextمسرد

Last updated 20 days ago

تستخدم Rememberizer تمثيلات المتجهات في قواعد بيانات المتجهات لتمكين البحث عن التشابه الدلالي ضمن مصادر المعرفة الخاصة بالمستخدم. هذه طريقة أكثر تقدمًا وتعقيدًا لاسترجاع المعلومات مقارنةً بالبحث عن الكلمات الرئيسية في المحتوى من خلال محرك بحث تقليدي أو قاعدة بيانات.

كيف تستخدم Rememberizer تمثيلات المتجهات

في شكلها الأكثر تقدمًا (كما تستخدمه Rememberizer)، يتم إنشاء تمثيلات المتجهات بواسطة نماذج اللغة ذات الهياكل المشابهة لنماذج الذكاء الاصطناعي LLMs (نماذج اللغة الكبيرة) التي تدعم نماذج GPT من OpenAI وخدمة ChatGPT، بالإضافة إلى نماذج/خدمات من Google (Gemini)، وAnthropic (Claude)، وMeta (LLaMA)، وغيرها.

فهم تضمينات المتجهات

كيف تبدو تضمينة المتجهات؟ اعتبر نقطة إحداثية (x,y) في بعدين. إذا كانت تمثل خطًا من الأصل إلى هذه النقطة، يمكننا التفكير فيها كخط له اتجاه - بعبارة أخرى، متجه في بعدين.

في سياق Rememberizer، تضمينة المتجهات عادةً ما تكون قائمة من عدة مئات من الأرقام (غالبًا 768، 1024، أو 1536) تمثل متجهًا في فضاء عالي الأبعاد. يمكن أن تمثل هذه القائمة من الأرقام أوزانًا في نموذج Transformer تحدد المعنى في عبارة مثل "ومضة برق من العدم." هذه هي نفس التمثيل الأساسي للمعنى المستخدم في نماذج مثل GPT-4. نتيجة لذلك، تتيح تضمينة المتجهات الجيدة نفس الفهم المتقدم الذي نراه في نماذج اللغة الحديثة للذكاء الاصطناعي.

ما وراء النص: التضمينات متعددة الوسائط

يمكن أن تمثل التضمينات المتجهة أكثر من مجرد نص—يمكنها أيضًا ترميز أنواع أخرى من البيانات مثل الصور أو الصوت. مع النماذج المدربة بشكل صحيح، يمكنك المقارنة عبر أنواع الوسائط، مما يسمح بمقارنة تضمين متجه للنص بصورة، أو العكس.

حاليًا، يتيح Rememberizer عمليات البحث ضمن مكون النص في مستندات ومعرفة المستخدم. قدرات البحث من النص إلى الصورة ومن الصورة إلى النص موجودة في خارطة طريق Rememberizer للتطوير المستقبلي.

التطبيقات في العالم الحقيقي

تستفيد الشركات التكنولوجية الكبرى من تضمينات المتجهات في منتجاتها:

كيف يختلف بحث Rememberizer القائم على المتجهات عن البحث القائم على الكلمات الرئيسية

يجد البحث القائم على الكلمات الرئيسية المطابقات الدقيقة أو المرادفات المحددة مسبقًا. بالمقابل، يجد بحث Rememberizer القائم على المتجهات المحتوى الذي يرتبط مفهوميًا، حتى عند استخدام مصطلحات مختلفة. على سبيل المثال:

  • قد يفوت البحث القائم على الكلمات الرئيسية عن "رعاية الكلاب" وثيقة ذات صلة حول "صيانة صحة الكلاب"

  • سيعترف بحث Rememberizer القائم على المتجهات بهذه المفاهيم على أنها متشابهة دلاليًا ويعيد كلاهما

تجعل هذه القدرة Rememberizer قوية بشكل خاص لاسترجاع المعلومات ذات الصلة من مصادر المعرفة المتنوعة.

قريبًا: تصور عملية البحث القائم على المتجهات

ستوضح هذه المخططة سير العمل الكامل للبحث الدلالي في Rememberizer:

  • تقسيم الوثائق والمعالجة المسبقة

  • عملية توليد تضمين المتجهات

  • التخزين في قاعدة بيانات المتجهات

  • تضمين استعلام البحث

  • حساب تطابق التشابه

  • مقارنة جنبًا إلى جنب مع البحث التقليدي القائم على الكلمات الرئيسية

الموارد التقنية

لفهم كيفية عمل تضمينات المتجهات وقواعد بيانات المتجهات بعمق:

أساس الذكاء الاصطناعي الحديث

تطورت التقنيات وراء تضمينات المتجهات بشكل كبير على مر الزمن:

أحد الجوانب الملحوظة لنماذج Transformer هو خصائصها في التوسع - كلما استخدمت بيانات أكثر وكان لديها معلمات أكثر، تحسن فهمها وقدراتها بشكل كبير. تم ملاحظة هذه الخاصية في التوسع مع نماذج مثل GPT-2 وقد دفعت التقدم السريع في قدرات الذكاء الاصطناعي.

هذا يجعل تمثيلات المتجهات خيارًا طبيعيًا لاكتشاف المعرفة ذات الصلة التي يجب تضمينها في سياق مطالبات نماذج الذكاء الاصطناعي. التقنيات مكملة ومرتبطه من الناحية المفاهيمية. لهذا السبب، فإن معظم مقدمي خدمات LLMs كخدمة ينتجون أيضًا تمثيلات المتجهات كخدمة (على سبيل المثال: أو ).

جوجل تستخدم تضمينات المتجهات لتعزيز كل من بحث النصوص (من نص إلى نص) وبحث الصور (من نص إلى صورة) ()

ميتا (فيسبوك) قامت بتنفيذ التضمينات في بحث شبكتها الاجتماعية ()

سناب شات تستخدم تضمينات المتجهات لفهم السياق وتقديم إعلانات مستهدفة ()

ابدأ مع

تقدم Pinecone (خدمة قاعدة بيانات المتجهات)

مكتبة FAISS من Meta: "FAISS: مكتبة للبحث الفعال عن التشابه والتجميع للمتجهات الكثيفة" من تأليف جونسون، دووز، وجيغو (2017) تقدم رؤى شاملة حول البحث الفعال عن تشابه المتجهات ()

قدمت الورقة البحثية لعام 2017 "الانتباه هو كل ما تحتاجه" () بنية Transformer التي تدعم نماذج LLM الحديثة ونماذج التضمين المتقدمة

أسست "الجيران الأقرب التقريبي: نحو إزالة لعنة الأبعاد" (، ) النظرية للبحث الفعال عن التشابه في الفضاءات عالية الأبعاد

أظهرت BERT (2018، ) قوة التدريب ثنائي الاتجاه لمهام فهم اللغة

وضعت الطرق السابقة مثل GloVe (2014، ) وWord2Vec (2013، ) الأساس لتضمينات الكلمات العصبية

للحصول على تفاصيل التنفيذ الفني وإرشادات موجهة للمطورين حول استخدام مخازن المتجهات مع Rememberizer، انظر .

كان الباحثون في Google وراء بنية Transformer الأصلية الموصوفة في "الانتباه هو كل ما تحتاجه" ()، على الرغم من أن العديد من المنظمات قد بنت على هذا العمل الأساسي ووسعت منه منذ ذلك الحين.

نقطة نهاية تمثيلات Together AI
تمثيلات النص والرمز من OpenAI
مرجع
مرجع
مرجع
نظرة عامة من Hugging Face
مقدمة جيدة لتضمينات المتجهات
مستودع GitHub
مرجع
1998
2010
مرجع
مرجع
مرجع
مخازن المتجهات
مرجع براءة الاختراع
تصور لفضاء متجه متعدد الأبعاد
تصور لفضاء متجه متعدد الأبعاد