البحث عن وثائق تخزين المتجهات حسب التشابه الدلالي
البحث في مستندات Vector Store باستخدام التشابه الدلالي وعمليات الدفعة
Last updated
البحث في مستندات Vector Store باستخدام التشابه الدلالي وعمليات الدفعة
Last updated
vector-store-id
سلسلة
مطلوب. معرف متجر المتجهات الذي سيتم البحث فيه.
q
سلسلة
مطلوب. نص استعلام البحث.
n
عدد صحيح
عدد النتائج التي سيتم إرجاعها. الافتراضي: 10.
t
رقم
عتبة المطابقة. الافتراضي: 0.7.
prev_chunks
عدد صحيح
عدد الأجزاء قبل الجزء المطابق لتضمينه. الافتراضي: 0.
next_chunks
عدد صحيح
عدد الأجزاء بعد الجزء المطابق لتضمينه. الافتراضي: 0.
تتطلب هذه النقطة النهائية المصادقة باستخدام مفتاح API في رأس x-api-key
.
400
طلب غير صالح - معلمات مطلوبة مفقودة أو تنسيق غير صالح
401
غير مصرح - مفتاح API غير صالح أو مفقود
404
غير موجود - لم يتم العثور على متجر المتجهات
500
خطأ في الخادم الداخلي
استخدم معلمات prev_chunks
و next_chunks
للتحكم في مقدار السياق المضمن مع كل تطابق:
اضبط كلاهما على 0 للحصول على تطابقات دقيقة بدون سياق
اضبط كلاهما على 1-2 للحصول على تطابقات مع سياق ضئيل
اضبط كلاهما على 3-5 للحصول على تطابقات مع سياق كبير
يتحكم معلم t
في مدى دقة تصفية المطابقات:
القيم الأعلى (مثل 0.9) تعيد فقط المطابقات القريبة جدًا
القيم الأدنى (مثل 0.5) تعيد المزيد من المطابقات بتنوع أكبر
القيمة الافتراضية (0.7) توفر نهجًا متوازنًا
لتطبيقات عالية الإنتاجية، يدعم Rememberizer عمليات جماعية فعالة على مخازن المتجهات. تعمل هذه الطرق على تحسين الأداء عند معالجة استعلامات بحث متعددة.
عند تنفيذ عمليات الدفعات لعمليات بحث متجر المتجهات، ضع في اعتبارك هذه الممارسات الجيدة:
حجم الدفعة الأمثل: بالنسبة لمعظم التطبيقات، فإن معالجة 5-10 استفسارات في وقت واحد توفر توازنًا جيدًا بين الإنتاجية واستخدام الموارد.
الوعي بتحديد المعدل: قم بتضمين آليات تأخير بين الدفعات (عادةً 1-2 ثانية) لتجنب الوصول إلى حدود معدل واجهة برمجة التطبيقات.
معالجة الأخطاء: نفذ معالجة أخطاء قوية للاستفسارات الفردية التي قد تفشل ضمن دفعة.
إدارة الاتصالات: بالنسبة للتطبيقات ذات الحجم الكبير، نفذ تجميع الاتصالات لتقليل التكاليف.
تكوين المهلة: قم بتعيين مهلات مناسبة لكل طلب لمنع الاستفسارات التي تستغرق وقتًا طويلاً من حظر الدفعة بأكملها.
معالجة النتائج: ضع في اعتبارك معالجة النتائج بشكل غير متزامن عند توفرها بدلاً من الانتظار للحصول على جميع النتائج.
المراقبة: تتبع مقاييس الأداء مثل متوسط وقت الاستجابة ومعدلات النجاح لتحديد فرص التحسين.
بالنسبة للتطبيقات الإنتاجية ذات أحجام الاستفسارات العالية جدًا، ضع في اعتبارك تنفيذ نظام قائمة انتظار مع عمليات عمال لإدارة الدفعات الكبيرة بكفاءة.
تتيح لك هذه النقطة البحث في متجر المتجهات الخاص بك باستخدام التشابه الدلالي. إنها تعيد المستندات التي ترتبط مفهوميًا باستفسارك، حتى لو لم تحتوي على الكلمات الرئيسية الدقيقة. وهذا يجعلها قوية بشكل خاص لاستفسارات اللغة الطبيعية والإجابة على الأسئلة.
Initiate a search operation with a query text and receive most semantically similar responses from the vector store.
The ID of the vector store.
The search query text.
Number of chunks to return.
Matching threshold.
Number of chunks before the matched chunk to include.
Number of chunks after the matched chunk to include.
The API key for authentication.
Search results retrieved successfully.