انقسم النقاش حول llms.txt إلى معسكرَين، وكلاهما يبيع اليقين. يُسمّيه أحدهما "robots.txt الجديد" وفرصة SEO التالية: أضف ملفاً واحداً وانتصر على حركة مرور الذكاء الاصطناعي. أما الثاني فيقتبس من Google ويُعلن أن الفكرة برمّتها ميتة في المهد. كلا القراءتَين يتجاوزان البيانات — وفي منتصف 2026 باتت البيانات كافية لحسم معظم الجدل.
إليك النسخة الصادقة أوّلاً. تُظهر سجلات الخوادم أن زواحف الذكاء الاصطناعي لا تطلب الملف إلا نادراً. إرشادات بحث Google لا تستخدمه. ومع ذلك، فريق Chrome في Google بات يُدقّق وجوده، والطبقة من تصفح الوكيل (agentic browsing) التي يخدمها طبقة حقيقية، وتكلفة نشره لا تتجاوز عشرين دقيقة. نحن ننشر ملفنا الخاص — /llms.txt و/llms-full.txt — وفي وقت لاحق من هذا الدليل نُعلّق عليه سطراً سطراً، لترى شكل الملف العامل وسبب اهتمامنا به.
ما يلي: المواصفة، وتناقض Google في مايو 2026 الذي لم يُوفِّقه أحد، وما تقوله 515 مليون حدث بوت عن الاعتماد، ومكدّس أذونات الزاحف الكامل، والاقتصاديات من الزحف إلى النقر خلف نقاش الحجب، ومصفوفة قرار الحجب أو الفتح حسب نوع العمل.
ما هو llms.txt — وما ليس هو
llms.txt ملف بتنسيق Markdown عادي في جذر نطاقك، يمنح النماذج اللغوية فهرساً منسّقاً لموقعك: من أنت، وأيّ الصفحات تُعدّ أساسية، وأين تقع الإجابات الموثوقة. اقترح Jeremy Howard، المؤسس المشارك لـ Answer.AI وfast.ai، المواصفة في 3 سبتمبر 2024. المنطلق عملي لا طوباوي: HTML المبني للبشر يحمل ضوضاء — تنقل، نصوص برمجية، لافتات موافقة — وسياق النماذج محدود، فأعطِ الآلة خريطة نظيفة بدلاً من إجبارها على استخراج واحدة بنفسها.
للمواصفة مستويان. /llms.txt هو الفهرس المختصر: ملخص وروابط منسّقة. /llms-full.txt هو البديل الموسّع: المحتوى الكامل مضمَّناً في وثيقة واحدة قابلة للقراءة الآلية، لتحميل وكيل ما يعرفه عنك في طلب واحد.
لا يقلّ أهمية ما ليس الملف هذا. ليس robots.txt — لا يمنح شيئاً ولا يحظر شيئاً، ولا توجد آلية إنفاذ خلفه. ليس إشارة ترتيب؛ لم تُعلن أي محركة بحث أنها تقرأه للترتيب. وليس تحكماً في الوصول: الزاحف الذي يتجاهله لا يخسر شيئاً. robots.txt يقول "إليك ما يُتاح لك جلبه." llms.txt يقول "إليك ما يستحق القراءة." هذان عملان مختلفان، وخلطهما ينتج معظم القراءات السيئة.
تناقض Google في مايو 2026
في غضون عشرة أيام من مايو 2026، أجرى Google خطوتَين تتجهان في اتجاهَين متعاكسَين — ولهذا يستطيع كلا المعسكرَين الاستشهاد بـ Google بوجه رابط الجأش.
الخطوة الأولى: في 5 مايو 2026، أضاف Google تدقيقاً لملف llms.txt في Lighthouse، وهو أداة جودة المواقع، ضمن فئة تصفح الوكيل (agentic browsing) الجديدة. يُنبّه التدقيق على موقعك إذا أعاد جلب /llms.txt خطأ خادم، وتُبيّن الوثائق المبرّر صراحة: "بدون هذا الملف، قد تقضي الوكلاء وقتاً أطول في الزحف على الموقع لفهم هيكله العالي المستوى ومحتواه الرئيسي" (ppc.land).
الخطوة الثانية: في 15 مايو 2026، نشر Google إرشاداته الرسمية حول تحسين المواقع لميزات الذكاء الاصطناعي التوليدي في البحث — AI Overviews وAI Mode. llms.txt غائب عنها. تُعيد الإرشادات التأكيد على ما قاله ممثلو بحث Google منذ ظهور المواصفة: SEO (تحسين محركات البحث) التقني القياسي هو ما يهم لميزات الذكاء الاصطناعي في البحث، والملف غير ضروري لذلك.
التوفيق هو أنه لا تناقض — هناك طبقتان. بحث Google، بما في ذلك AI Overviews، يرتب ويستشهد بمحتوى من فهرس HTML القائم؛ llms.txt لا دور له هناك اليوم، وكان Google ثابتاً في هذا. أما التصفح الوكيل — وكيل ذكاء اصطناعي يزور موقعك لإنجاز مهمة نيابةً عن مستخدم — فهو نمط استهلاك مختلف باحتياجات مختلفة، وهذه هي الطبقة التي بدأ فريق Chrome بتدقيقها. من يخبرك أن "Google يطلبه" أو "Google أعلن موته" يستشهد بطبقة ويتجاهل الأخرى.
ما تُظهره سجلات الخوادم: واقع الاعتماد
لقصة الاعتماد نصفان: الناشرون ينشرون الملف بشكل متزايد، والزواحف تتجاهله في معظمه.
وجد تحليل مجمّع لـ 515 مليون حدث بوت أن طلبات /llms.txt تشكّل نسبة ضئيلة من حركة مرور زواحف الذكاء الاصطناعي — هامش خطأ مقارنة بحجم جلب الصفحات (aeo.press). GPTBot وClaudeBot وPerplexityBot يطلبون صفحات HTML في معظمهم، كما تفعل زواحف البحث دائماً. الأنابيب التي تُغذّي مجموعات بيانات التدريب وفهارس الاسترجاع مهندسة لـ HTML على نطاق الويب؛ والملف الـ Markdown الموازي تحسينٌ لم تعتمده تلك الأنابيب.
على جانب النشر، أنشأ 7.4 بالمائة من شركات Fortune 500 — 37 من 500 — ملف llms.txt بحلول 31 مارس 2026 (ppc.land). اعتمدته مواقع توثيق المطوّرين بسرعة أكبر بكثير، لأن وكلاء البرمجة هم المستهلك الوحيد الذي يقرأ هذه الملفات بشكل قابل للإثبات اليوم.
إذاً الملخص الصادق للسجلات: نشر llms.txt لا يُغيّر كيفية قراءة زواحف الذكاء الاصطناعي الكبرى لموقعك بشكل قابل للقياس في 2026. من يبيعه بوصفه مفتاح حركة مرور الذكاء الاصطناعي يبيع أمام الأدلة.
مكدّس أذونات زاحف الذكاء الاصطناعي في 2026
يُناقَش llms.txt بمعزل عن غيره، لكنه أداة واحدة في مكدّس من خمس طبقات تتحكم — أو تحاول التحكم — فيما تفعله أنظمة الذكاء الاصطناعي بمحتواك.
| الطبقة | ما تتحكم فيه | من يُنفّذها | واقع الامتثال | حكمنا |
|---|---|---|---|---|
| توجيهات robots.txt (GPTBot, ClaudeBot, PerplexityBot, Google-Extended) | ما إذا كان يجوز للزواحف المُعلَنة جلب صفحاتك؛ Google-Extended يحكم تدريب Gemini لا البحث | لا أحد — بروتوكول طوعي | المختبرات الكبرى تحترم زواحفها المُعلَنة؛ خلافات موجودة — اتهمت Cloudflare Perplexity باستخدام زواحف غير مُعلَنة للتحايل على الحجب في 2025 | مفتاح التشغيل/الإيقاف الفعلي — اضبطه بوعي |
| سياسة إشارات المحتوى (contentsignals.org) | تُعلن كيفية استخدام المحتوى المجلوب: بحث، مدخل ذكاء اصطناعي، تدريب ذكاء اصطناعي | لا أحد تقنياً؛ تُؤطَّر الإشارات باعتبارها تحفظاً للحقوق | حديث جداً لقياسه؛ ينتشر عبر robots.txt الذي تديره Cloudflare | لا تكلفة؛ يخاطب المحامين أكثر من البوتات |
| الحجب الافتراضي في Cloudflare (Nieman Lab) | يحجب زواحف الذكاء الاصطناعي المعروفة على حافة الشبكة للنطاقات الجديدة، منذ 1 يوليو 2025 | Cloudflare — الطلبات المحجوبة لا تصل إلى خادمك | مُنفَّذ فعلياً عبر حصة كبيرة من الويب | الطبقة الوحيدة ذات الأسنان؛ اقلبها بوعي لا بالتوريث |
| الدفع بالزحف | يفرض على زواحف الذكاء الاصطناعي رسوماً لكل طلب بدلاً من الحجب الصريح | سوق Cloudflare، في مرحلة تجريبية | مبكر؛ يعتمد على موافقة المختبرات على الدفع | ذو صلة بالناشرين الكبار، لا بمواقع B2B |
| llms.txt / llms-full.txt | لا شيء — قائمة قراءة استشارية للنماذج والوكلاء | لا أحد | معدلات جلب ضئيلة في سجلات الخوادم؛ Lighthouse يُدقّق وجوده الآن | تأمين رخيص للويب الوكيل؛ صفر تأثير على SEO اليوم |
لاحظ النمط. الطبقات التي يتجادل عليها الناس — llms.txt، إشارات المحتوى — استشارية. الطبقة التي غيّرت سلوك الزاحف بين عشية وضحاها هي حافة Cloudflare، وهي التي لم يضبطها معظم أصحاب المواقع بوعي قط.
اقتصاديات الزحف إلى النقر: ما الذي يعيده "إعطاء المحتوى للذكاء الاصطناعي"
يرتكز دافع الحجب الافتراضي على حقيقة اقتصادية، فلنُبيّنها بوضوح. وضعت بيانات Cloudflare Radar للربع الأول من 2026 نسبة الزحف إلى الإحالة — الصفحات المجلوبة لكل نقرة بشرية محالة — عند نحو 1,276:1 لـ GPTBot التابع لـ OpenAI ونحو 23,951:1 لـ ClaudeBot التابع لـ Anthropic (Cloudflare). كان زحف البحث التقليدي يُعيد على المواقع بنسب أقل بمراتب. تستهلك أنظمة الذكاء الاصطناعي المحتوى على نطاق صناعي ولا تُعيد تقريباً أي حركة مرور مباشرة.
إذا كان عملك يربح من مشاهدات الصفحات، فهذا التفاوت يقترب من الوجودي، ويتبع منطقياً منه تمرد الناشرين — إلى جانب تجربة Cloudflare للدفع بالزحف.
لكن النسبة تقيس النقرات، والنقرات ليست العائد الوحيد. الزحف الذي لا يُرسل زائراً يظل يحدد ما إذا كان النموذج يعرف وجودك، ويصفك بدقة، ويُسمّيك حين يطلب مشترٍ قائمة مرشحين. بالنسبة لشركة B2B، كثيراً ما تكون إجابة الذكاء الاصطناعي هي نقطة التواصل: يسأل عميل محتمل ChatGPT مقارنة موردين، يحصل على إجابة مُجمَّعة مما استطاعت الزواحف قراءته، ولا يُسجّل تحليلاتك اللقاء أصلاً. فصّلنا هذا التحول في AEO مقابل GEO مقابل SEO — الهدف ينتقل من الفوز بالنقرة إلى أن تكون الإجابة المسترجَعة، المستشهَد بها بدقة.
الحجب أم الفتح؟ مصفوفة القرار حسب نوع العمل
لا توجد إجابة شاملة، لأن حسابات الزحف إلى النقر تختلف باختلاف الغرض من محتواك.
| نوع العمل | منطق الإيرادات | زواحف الذكاء الاصطناعي | llms.txt | المنطق |
|---|---|---|---|---|
| ناشر / إعلام | مشاهدات الصفحات والاشتراكات هي المنتج | احجب أو تفاوض عبر الدفع بالزحف | تخطَّه | عند 1,276:1 وأسوأ، الوصول المفتوح إعانة لمنتج شخص آخر |
| علامة تجارية B2B / خدمات | الموقع أصل مبيعات؛ أن تُعرَف أهم من أن تُزار | افتح | انشره | تريد أن تكون قابلاً للاسترجاع حين يسأل المشترون الذكاء الاصطناعي عن موردين |
| تجارة إلكترونية | بيانات المنتج تدفع الاكتشاف؛ الوكلاء يساعدون المشتريات بشكل متزايد | افتح؛ راقب تكاليف البنية التحتية | انشره بعناوين URL للمنتج والسياسة | الغياب لحظة مقارنة وكيل بين خيارات يعني خسارة إيرادات |
| ترخيص المحتوى | المحتوى نفسه هو الأصل المُسعَّر | احجب ثم تفاوض | تخطَّه | الندرة هي رافعة التفاوض |
بالنسبة لمعظم شركات B2B — عملاؤنا، ونحن — الإجابة هي الفتح. موقعك التسويقي موجود لكي تعرف السوق ما تفعله. نظام ذكاء اصطناعي يقرأه ويُعيده بدقة لعميل محتمل يؤدي مهمة الموقع مجاناً. حجب GPTBot لحماية محتوى هدفه الكامل أن يُعرَف يقلب الاستراتيجية رأساً على عقب. ومع انتقال المشتريات نحو تفاعلات B2A (من الأعمال إلى الوكيل)، حيث يُنجز برنامج ما كان يفعله إنسان، تتضاعف قابلية الاسترجاع: الأصل الجدير بالحماية هو الدقة، لا الوصول. الحفاظ على هذه الدقة عبر منصات الذكاء الاصطناعي هو جوهر عمل ظهور الذكاء الاصطناعي.
عواقب الويب المنغلق: المواقع المحجوبة تجعل ويكيبيديا وكيلك
والآن التأثير من الدرجة الثانية الذي لا يُسعّره أحد تقريباً. تحجب Cloudflare زواحف الذكاء الاصطناعي افتراضياً للنطاقات الجديدة. الناشرون يحجبون أو يُجزّئون الوصول. الدفع بالزحف يُسعّر ما كان مجانياً. الويب المفتوح، كما تراه زاحفة ذكاء اصطناعي، يتقلص.
ما زالت النماذج تحتاج مصادر تأسيسية، فيتمركز الاسترجاع في مجموعات البيانات عالية الموثوقية التي تبقى مفتوحة بطبيعتها: ويكيبيديا، Wikidata، السجلات العامة، المستودعات الأكاديمية. رخصة ويكيبيديا الحرة تتيح إعادة الاستخدام، ومحتواها منظَّم ومستشهَد به، ولا يقف خلف أي جدار زحف. كل موقع يُغلق يجعل المصادر التي تبقى مفتوحة أثقل وزناً فيما تعرفه أنظمة الذكاء الاصطناعي وتقوله.
العواقب على علامة تجارية مباشرة. إذا كان موقعك مُظلَماً أمام الزواحف — باختيار أو بإعدادات CDN الافتراضية — فمقالة ويكيبيديا الخاصة بك، وكيانك في Wikidata، والمصادر المفتوحة الأخرى تصبح السجل الفعلي الذي يقرأه الذكاء الاصطناعي عنك. هذا هو الارتباط الاستراتيجي الذي تفوّته نقاشات llms.txt، ولهذا نعامل الحضور الموسوعي كبنية تحتية لا كغرور: إنه الجزء من سجلك الذي يبقى قابلاً للاسترجاع مهما تطور مكدّس الأذونات. الميكانيكا مُغطَّاة في AEO ويكيبيديا وخدمتنا في Wikidata وبيانات المعرفة؛ الصورة التكتيكية الأوسع في تكتيكات SEO لويكيبيديا 2026.
ملف llms.txt الخاص بنا، مُعلَّقاً
ننشر المستويَين — wikibusines.net/llms.txt وwikibusines.net/llms-full.txt — مُعاد توليدهما من بيانات الموقع الأساسية، ويمكنك قراءتهما مباشرة. إليك أسطراً حقيقية من الملف المختصر، مع المنطق خلف كل اختيار:
# WikiBusines — LLM-readable summary
WikiBusines is a trust-infrastructure and AI-visibility company.
Full machine-readable profile (all services, prices, FAQ, blog index):
https://www.wikibusines.net/llms-full.txt
- Founded: 2010 — operating 15+ years
- Publication success rate (past year): 93%
…
- Wikipedia Notability Audit (€490 / €750 / €1,900, credited toward
project): https://www.wikibusines.net/wikipedia-notability-audit
…
## What we do not claim
- We do not guarantee Wikipedia publication. We run a risk-managed,
source-first process and recommend alternative routes when notability
is insufficient.
الجملة الأولى تُعرِّف الكيان في سطر واحد. إذا قرأ نموذج عشرين رمزاً فقط من ملفك، فينبغي أن تقول تلك الرموز ما أنت عليه. اكتبها كتعريف معجمي، لا كشعار.
مؤشر الملف الكامل يُنفّذ تصميم المستويَين في المواصفة. يبقى الفهرس قابلاً للتصفح السريع؛ وكيل يريد كل شيء يتبع رابطاً واحداً ويحصل على كل خدمة وسعر وإجابة في الأسئلة الشائعة في جلب واحد.
الحقائق تحمل أرقاماً وتواريخ. "Founded: 2010" و"93%" ادعاءات يمكن للنموذج استرجاعها وإعادتها بدقة. الصفات النعتية لا تستطيع ذلك.
أسطر الخدمة تقرن عناوين URL الأساسية بالأسعار. حين يُسأل وكيل عن تكلفة تدقيق الجدارة بالملاحظة (Notability Audit — معايير أهلية ويكيبيديا)، تجلس الإجابة والوجهة على السطر ذاته.
قسم "ما لا ندّعيه" هو الجزء الذي لن تكتبه معظم الشركات أبداً. النماذج تُردّد مصادرها؛ إذا ادّعى ملفك أكثر مما يجب، ادّعت إجابة الذكاء الاصطناعي أكثر مما يجب، وبدأت أول مكالمة مع العميل المحتمل بتصحيح. الإفصاح عن حدود خدمتك ذاتها هو تأمين دقة — نفس منطق الفرق الصادق الذي نُطبّقه في كل صفحة.
إجمالي الجهد: نحو عشرين دقيقة، بالإضافة إلى إعادة التوليد عند تغيّر الحقائق. العائد الواقعي في 2026 هو قابلية القراءة الوكيلة وتدقيق Lighthouse نظيف، لا ترتيبات. نُعامله بوصفه تأميناً رخيصاً، مُسعَّراً على هذا الأساس.
الأسئلة الشائعة
هل يُفيد llms.txt في SEO؟
لا يوجد دليل على ذلك. إرشادات بحث Google لمايو 2026 لا تستخدم الملف، ولم تُعلن أي محركة بحث أنها تقرأه للترتيب أو لـ AI Overviews. إذا كانت الاستشهادات في بحث الذكاء الاصطناعي هي الهدف، فالعمل يبقى تقليدياً: HTML قابل للزحف، وبيانات منظَّمة، ومصادر خارجية موثوقة تتحدث عنك.
هل سيقرأ ChatGPT ملف llms.txt الخاص بي فعلاً؟
نادراً، بناءً على الأدلة الحالية. تُظهر تحليلات تغطّي مئات الملايين من أحداث البوت أن GPTBot وأقرانه يجلبون HTML ويتجاهلون /llms.txt إلى حد بعيد. المستهلكون القريبون المدى للملف هم متصفحات الوكيل وأدوات البرمجة — فضلاً عن Lighthouse، الذي يُشير تدقيقه إلى أين يتجه فريق Chrome في Google.
هل تستحق شركة صغيرة الاهتمام؟
يكلف نحو عشرين دقيقة ولا يُغيّر شيئاً يمكن قياسه اليوم، فعامله باعتباره تأميناً اختيارياً منخفض التكلفة. تخطّيه معقول؛ فعله بشكل صحيح رخيص. إذا نشرته، حافظ على دقته وأعد توليده عند تغيّر الحقائق — ملف قديم يُخطئ في أسعارك أسوأ من لا ملف.
هل أحجب زواحف الذكاء الاصطناعي ريثما أقرر؟
تحقق أولاً إذا كنت تفعل ذلك بالفعل. إذا انضم نطاقك إلى Cloudflare بعد 1 يوليو 2025، فربما تكون زواحف الذكاء الاصطناعي محجوبة افتراضياً دون أن يكون أي أحد في شركتك قد قرّر ذلك. مهما كان موقفك، اجعله قراراً لا إعداداً موروثاً.
llms.txt أرخص وأقل أثراً طبقات في قابلية القراءة للذكاء الاصطناعي. الطبقات المؤثرة هي ما إذا كانت المصادر التي تثق بها أنظمة الذكاء الاصطناعي — ويكيبيديا، Wikidata، منصات المعرفة — تصفك بدقة، وما إذا كان سجل قابل للقراءة الآلية لشركتك موجوداً أصلاً. هذا ما نبنيه: انظر LLM Hub للهندسة المعمارية الكاملة، أو ابدأ بفتح ملف llms.txt الخاص بنا بجانب نطاقك. إذا أعاد نطاقك 404، فأنت الآن تعرف تماماً ما الذي يكلفك ذلك وما لا يكلفك.