مسرد
قاموس شامل للمصطلحات والمفاهيم المستخدمة في Rememberizer
يوفر هذا القاموس تعريفات للمصطلحات والمفاهيم الرئيسية المستخدمة في وثائق Rememberizer. استخدمه كمرجع عندما تواجه مصطلحات غير مألوفة.
ملاحظة: يمثل هذا القاموس المصطلحات القياسية لـ Rememberizer. بينما قد تواجه بعض الاختلافات الطفيفة في الوثائق، يجب اعتبار المصطلحات والتعريفات المقدمة هنا المرجع المعتمد.
A
API Key: رمز مصادقة آمن يُستخدم للوصول إلى نقاط نهاية واجهة برمجة التطبيقات الخاصة بـ Rememberizer برمجيًا. تُستخدم مفاتيح واجهة برمجة التطبيقات بشكل أساسي للوصول إلى مخزن المتجهات ودمج المعرفة العامة.
Authorized Request Origin: إعداد أمان يحدد المجالات التي يمكنها إجراء طلبات واجهة برمجة التطبيقات إلى Rememberizer، مما يحد من هجمات تزوير الطلبات عبر المواقع المحتملة.
ب
عمليات الدفعة: معالجة عناصر متعددة (بحث، تحميل، إلخ) في طلب واحد لتحسين الكفاءة. يدعم Rememberizer عمليات الدفعة للأحمال العالية.
حجم الدفعة: عدد العناصر المعالجة معًا خلال عمليات مثل الهجرة، البحث، أو إدخال الوثائق، مما يؤثر على الأداء واستخدام الموارد.
ج
تقسيم: عملية تقسيم الوثائق إلى قطع ذات حجم مثالي (عادةً 512-2048 بايت) مع حدود متداخلة للحفاظ على السياق أثناء عمليات البحث عن المتجهات.
معرف العميل: معرف عام يصدر للتطبيقات الخارجية يمكّن من تفويض OAuth2 مع Rememberizer.
سر العميل: مفتاح خاص يصدر مع معرف العميل يجب أن يبقى آمناً ويستخدم لمصادقة التطبيق أثناء تدفقات OAuth2.
تنظيم قائم على المجموعات: الطريقة التي يتم بها تنظيم مخازن المتجهات في Rememberizer، حيث يحتوي كل مخزن على مجموعة معزولة خاصة به لإدارة البيانات.
المعرفة المشتركة: معلومات منشورة من قبل المستخدمين يمكن الوصول إليها من قبل مستخدمين أو تطبيقات أخرى، مما يخلق مورد معرفة مشترك. المعرفة المشتركة تستند إلى ميمنتو ويمكن الوصول إليها عبر واجهة برمجة التطبيقات. يُشار إليها أحيانًا بـ "المعرفة المشتركة" في واجهة المستخدم.
نوافذ السياق: المحتوى المحيط المضمن مع القطع المطابقة في نتائج البحث، والتي يتم التحكم بها بواسطة معلمات prev_chunks
و next_chunks
.
تشابه جيب التمام: مقياس للتشابه بين المتجهات يتم حسابه من خلال إيجاد جيب التمام للزاوية بينها، ويستخدم كمقياس البحث الافتراضي في Rememberizer.
E
نموذج التضمين: نموذج ذكاء اصطناعي يقوم بإنشاء تضمينات متجهة من النص. يدعم Rememberizer عدة نماذج تضمين، بما في ذلك نموذج OpenAI text-embedding-3-large و text-embedding-3-small.
أنماط تكامل المؤسسات: طرق موحدة لتنفيذ Rememberizer في بيئات المؤسسات الكبيرة، بما في ذلك التصاميم المعمارية للأمان، والتوسع، والامتثال.
ج
الإعدادات العالمية: تكوينات على مستوى النظام للتحكم في الأذونات والسلوكيات الافتراضية عبر جميع التطبيقات المتصلة في Rememberizer.
H
HNSW (العالم الصغير القابل للتنقل الهرمي): خوارزمية فهرسة تقدم دقة أفضل لمجموعات البيانات الكبيرة على حساب متطلبات الذاكرة الأعلى، متاحة كخيار فهرسة في مخازن المتجهات الخاصة بـ Rememberizer.
I
خوارزمية الفهرسة: الطريقة المستخدمة لتنظيم المتجهات لاسترجاع فعال. يدعم Rememberizer خوارزميات IVFFLAT (افتراضي) و HNSW.
IVFFLAT: خوارزمية فهرسة توفر توازنًا جيدًا بين سرعة البحث والدقة لقواعد بيانات المتجهات، وتستخدم كافتراضي في Rememberizer.
ك
مصدر البيانات: الأصول المختلفة للبيانات في Rememberizer، بما في ذلك التكاملات مع منصات مثل Google Drive وSlack وDropbox وGmail. يُشار إليها أيضًا باسم "مصدر المعرفة" أو "التكامل" في بعض السياقات.
L
تكامل LangChain: وظيفة تتيح استخدام Rememberizer كأداة استرجاع في تطبيقات LangChain، داعمة لأنظمة RAG (التوليد المعزز بالاسترجاع).
م
ميمنتو: آلية تصفية تتحكم في المعرفة التي يتم مشاركتها مع التطبيقات الخارجية، مما يسمح للمستخدمين بمشاركة ملفات أو مستندات أو مجموعات محتوى محددة بشكل انتقائي. يُشار إليها أحيانًا باسم "فلتر ميمنتو" في واجهة المستخدم.
تكامل الذاكرة: ميزة تمكّن التطبيقات من تخزين معلومات قيمة في Rememberizer لاسترجاعها لاحقًا، مع أذونات قراءة/كتابة قابلة للتكوين. يُشار إليها أيضًا باسم "الذاكرة المشتركة" في بعض السياقات.
O
مصادقة OAuth2: بروتوكول التفويض القياسي المستخدم لتطبيقات الطرف الثالث للوصول إلى بيانات Rememberizer بموافقة المستخدم، مما يوفر وصولاً مفوضًا آمنًا. أحيانًا يتم اختصاره إلى "OAuth" في الوثائق.
R
RAG (التوليد المعزز بالاسترجاع): تقنية تجمع بين أنظمة الاسترجاع (مثل Rememberizer) والنماذج التوليدية لتوفير استجابات أكثر دقة وموثوقية بناءً على معرفة محددة.
قراءة خاصة/كتابة خاصة: مستوى إذن حيث يمكن للتطبيقات الوصول فقط إلى بيانات الذاكرة الخاصة بها وتعديلها في Rememberizer.
قراءة الكل/كتابة خاصة: مستوى إذن حيث يمكن للتطبيقات قراءة بيانات الذاكرة من جميع التطبيقات ولكن يمكنها فقط تعديل بيانات الذاكرة الخاصة بها.
إعادة الفهرسة: عملية إعادة بناء فهارس المتجهات بعد تغييرات كبيرة لتحسين أداء البحث في مخازن المتجهات في Rememberizer.
RememberizerRetriever: فئة المسترجع الخاصة بـ LangChain التي تتفاعل مع قدرات البحث الدلالي في Rememberizer.
Rememberizer GPT: تطبيق GPT مخصص يتكامل مع واجهة برمجة التطبيقات الخاصة بـ Rememberizer لتوفير الوصول إلى المعرفة الشخصية داخل ChatGPT.
مخزن المتجهات في Rememberizer: خدمة قاعدة بيانات متجهات قائمة على PostgreSQL مع امتداد pgvector تتعامل مع تقسيم البيانات، وتحويلها إلى متجهات، وتخزين بيانات النص. تُستخدم مصطلحات "مخزن المتجهات" و"قاعدة بيانات المتجهات" بالتبادل في وثائق Rememberizer، مع كون "مخزن المتجهات" هو المصطلح المفضل.
S
Search Metric: الطريقة الرياضية المستخدمة لحساب التشابه بين المتجهات. يدعم Rememberizer التشابه الكوني (افتراضي)، والمنتج الداخلي، والمسافة L2 (الإقليدية). تُستخدم مصطلحات "المسافة" و"التشابه" و"المطابقة" أحيانًا بالتبادل للإشارة إلى مدى ارتباط المتجهات ببعضها البعض.
Semantic Search: وظيفة البحث التي تجد المحتوى بناءً على المعنى بدلاً من الكلمات الرئيسية فقط، مما يسمح بنتائج ذات صلة مفهومية حتى عندما تختلف المصطلحات.
Shared Memory: نظام يسمح لتطبيقات الطرف الثالث بتخزين البيانات والوصول إليها في حساب مستخدم Rememberizer، مما يوفر الاستمرارية عبر تطبيقات متعددة.
V
قاعدة بيانات المتجهات: قاعدة بيانات متخصصة مُحسّنة لتخزين واسترجاع تمثيلات المتجهات بكفاءة، مما يمكّن من قدرات البحث الدلالي.
أبعاد المتجه: حجم تمثيلات المتجهات (عادةً 768-1536 رقمًا)، مما يؤثر على التفاصيل والدقة الملتقطة في التمثيل الدلالي.
تمثيلات المتجهات: تمثيلات عددية (قوائم من عدة مئات من الأرقام) تلتقط المعنى الدلالي للنص، مما يسمح بإجراء مقارنات تشابه تتجاوز مطابقة الكلمات الرئيسية. وغالبًا ما يُشار إليها ببساطة باسم "التمثيلات" في السياقات التقنية.
اتفاقيات رأس API
عند استخدام واجهات برمجة التطبيقات الخاصة بـ Rememberizer، يجب اتباع اتفاقيات الرأس التالية:
رأس التفويض:
Authorization: Bearer YOUR_JWT_TOKEN
رأس مفتاح API:
X-API-Key: YOUR_API_KEY
(كما هو موضح)رأس نوع المحتوى:
Content-Type: application/json
الموارد ذات الصلة
لمزيد من الشروحات المتعمقة حول المفاهيم الأساسية:
Last updated