البحث عن وثائق متجر المتجهات حسب التشابه الدلالي
البحث في مستندات Vector Store باستخدام التشابه الدلالي وعمليات الدفعة
Initiate a search operation with a query text and receive most semantically similar responses from the vector store.
The ID of the vector store.
The search query text.
Number of chunks to return.
Matching threshold.
Number of chunks before the matched chunk to include.
Number of chunks after the matched chunk to include.
The API key for authentication.
Search results retrieved successfully.
Search results retrieved successfully.
طلبات مثال
curl -X GET \
"https://api.rememberizer.ai/api/v1/vector-stores/vs_abc123/documents/search?q=كيف%20نقوم%20بدمج%20منتجنا%20مع%20أنظمة%20طرف%20ثالث&n=5&prev_chunks=1&next_chunks=1" \
-H "x-api-key: YOUR_API_KEY"const searchVectorStore = async (vectorStoreId, query, numResults = 5, prevChunks = 1, nextChunks = 1) => {
const url = new URL(`https://api.rememberizer.ai/api/v1/vector-stores/${vectorStoreId}/documents/search`);
url.searchParams.append('q', query);
url.searchParams.append('n', numResults);
url.searchParams.append('prev_chunks', prevChunks);
url.searchParams.append('next_chunks', nextChunks);
const response = await fetch(url.toString(), {
method: 'GET',
headers: {
'x-api-key': 'YOUR_API_KEY'
}
});
const data = await response.json();
console.log(data);
};
searchVectorStore(
'vs_abc123',
'كيف نقوم بدمج منتجنا مع أنظمة طرف ثالث',
5,
1,
1
);معلمات المسار
vector-store-id
سلسلة
مطلوب. معرف متجر المتجهات الذي سيتم البحث فيه.
معلمات الاستعلام
q
سلسلة
مطلوب. نص استعلام البحث.
n
عدد صحيح
عدد النتائج التي سيتم إرجاعها. الافتراضي: 10.
t
رقم
عتبة المطابقة. الافتراضي: 0.7.
prev_chunks
عدد صحيح
عدد الأجزاء قبل الجزء المطابق لتضمينه. الافتراضي: 0.
next_chunks
عدد صحيح
عدد الأجزاء بعد الجزء المطابق لتضمينه. الافتراضي: 0.
تنسيق الاستجابة
المصادقة
تتطلب هذه النقطة النهائية المصادقة باستخدام مفتاح API في رأس x-api-key.
استجابات الخطأ
400
طلب غير صالح - معلمات مطلوبة مفقودة أو تنسيق غير صالح
401
غير مصرح - مفتاح API غير صالح أو مفقود
404
غير موجود - لم يتم العثور على متجر المتجهات
500
خطأ في الخادم الداخلي
نصائح تحسين البحث
نوافذ السياق
استخدم معلمات prev_chunks و next_chunks للتحكم في مقدار السياق المضمن مع كل تطابق:
اضبط كلاهما على 0 للحصول على تطابقات دقيقة بدون سياق
اضبط كلاهما على 1-2 للحصول على تطابقات مع سياق ضئيل
اضبط كلاهما على 3-5 للحصول على تطابقات مع سياق كبير
عتبة المطابقة
يتحكم معلم t في مدى دقة تصفية المطابقات:
القيم الأعلى (مثل 0.9) تعيد فقط المطابقات القريبة جدًا
القيم الأدنى (مثل 0.5) تعيد المزيد من المطابقات بتنوع أكبر
القيمة الافتراضية (0.7) توفر نهجًا متوازنًا
العمليات الجماعية
لتطبيقات عالية الإنتاجية، يدعم Rememberizer عمليات جماعية فعالة على مخازن المتجهات. تعمل هذه الطرق على تحسين الأداء عند معالجة استعلامات بحث متعددة.
تنفيذ البحث الجماعي
تحسين الأداء لعمليات الدفعات
عند تنفيذ عمليات الدفعات لعمليات بحث متجر المتجهات، ضع في اعتبارك هذه الممارسات الجيدة:
حجم الدفعة الأمثل: بالنسبة لمعظم التطبيقات، فإن معالجة 5-10 استفسارات في وقت واحد توفر توازنًا جيدًا بين الإنتاجية واستخدام الموارد.
الوعي بتحديد المعدل: قم بتضمين آليات تأخير بين الدفعات (عادةً 1-2 ثانية) لتجنب الوصول إلى حدود معدل واجهة برمجة التطبيقات.
معالجة الأخطاء: نفذ معالجة أخطاء قوية للاستفسارات الفردية التي قد تفشل ضمن دفعة.
إدارة الاتصالات: بالنسبة للتطبيقات ذات الحجم الكبير، نفذ تجميع الاتصالات لتقليل التكاليف.
تكوين المهلة: قم بتعيين مهلات مناسبة لكل طلب لمنع الاستفسارات التي تستغرق وقتًا طويلاً من حظر الدفعة بأكملها.
معالجة النتائج: ضع في اعتبارك معالجة النتائج بشكل غير متزامن عند توفرها بدلاً من الانتظار للحصول على جميع النتائج.
المراقبة: تتبع مقاييس الأداء مثل متوسط وقت الاستجابة ومعدلات النجاح لتحديد فرص التحسين.
بالنسبة للتطبيقات الإنتاجية ذات أحجام الاستفسارات العالية جدًا، ضع في اعتبارك تنفيذ نظام قائمة انتظار مع عمليات عمال لإدارة الدفعات الكبيرة بكفاءة.
تتيح لك هذه النقطة البحث في متجر المتجهات الخاص بك باستخدام التشابه الدلالي. إنها تعيد المستندات التي ترتبط مفهوميًا باستفسارك، حتى لو لم تحتوي على الكلمات الرئيسية الدقيقة. وهذا يجعلها قوية بشكل خاص لاستفسارات اللغة الطبيعية والإجابة على الأسئلة.
Last updated