רוב החברות חושבות על ויקיפדיה כדבר אחד: "אנחנו רוצים דף בויקיפדיה." אבל ויקיפדיה אינה אנציקלופדיה אחת — היא בערך 340 אנציקלופדיות נפרדות, כל אחת בשפתה שלה, עם קהילת מתנדבים משלה, כלליה שלה, ודעתה שלה האם החברה שלכם ראויה לערך. המהדורה האנגלית מקבלת את רוב תשומת הלב בחדרי הישיבות המערביים. היא גם זו שהלקוחות שלכם בסאו פאולו, ריאד, ג'קרטה וקייב פחות סביר שיקראו.
זהו החלק בשיחת הנראות ה-AI שמדלגים עליו. אנשים מתעסקים בכניסה אל ה-Knowledge Panel האנגלי ושוכחים שעוזר AI שעונה על שאלה בפורטוגזית, ערבית, אינדונזית או אוקראינית מגיע קודם למקורות בשפה הזו — ולרוב, הכוונה היא לויקיפדיה הפורטוגזית, הערבית, האינדונזית או האוקראינית, שמעולם לא שמעה עליכם.
מאמר זה עוסק בכך שהרב-לשוניות תיעשה נכון: לא "לתרגם את הדף האנגלי לארבעים שפות", שזה נכשל, אלא אסטרטגיה מכוונת הבנויה על ישות Wikidata (מסד נתונים חופשי ומובנה התומך בויקיפדיה) אחת ומאוחדת, קריאה צלולה של כללי כל מהדורה לשפה באופן עצמאי, ורשימת עדיפויות שפות המונעת מהמקומות שבהם השוק שלכם ממש נמצא. המאמר כנה לגבי העלות וישיר לגבי אופני הכשל, כי הגרסה הרב-לשונית של העבודה הזו היא המקום שבו מבוזבזים הכי הרבה כספים.
מדוע השפה חשובה יותר ממה שרוב הצוותים מניחים
התחילו בהבנה כיצד מודל שפה גדול עונה על שאלה. כאשר משתמש כותב בספרדית, המודל אינו מתרגם בשקט לאנגלית, שואב עובדות אנגליות וחוזר ומתרגם. הוא שואב מהתבניות שלמד מטקסטים בספרדית — והמקור הכבד ביותר בכל מאגר אימון בספרדית הוא כמעט תמיד ויקיפדיה הספרדית. אותו הדבר נכון לגרמנית, יפנית, ערבית, הינדית וכל מהדורה מרכזית אחרת. ויקיפדיה בכל שפה היא מקור עוגן לפלח השפה הזה במודל.
כך, חברה בעלת ערך חזק בויקיפדיה האנגלית ותו לא מיוצגת היטב כשמישהו שואל את ChatGPT (מודל שפה גדול של OpenAI) עליה באנגלית — ובפועל בלתי נראית, ואף מיוצגת בצורה שגויה, כשאותה שאלה נשאלת בטורקית. למודל אין עוגן טורקי לישות הזו. הוא יסרב, יהלוצין, או יבלבל את החברה שלכם עם חברה בשם דומה שיש לה נוכחות טורקית.
גוגל פועלת באותה דרך ברמת הישות. Knowledge Panel המוצג למשתמש בצרפת נסמך על אותות בצרפתית; שורת התיאור מגיעה לעתים קרובות מהפסקת הפתיחה של ויקיפדיה הצרפתית, לא האנגלית. אם אין ערך צרפתי, גוגל נסוגה למה שניתן לאסוף — לעתים קרובות שום דבר נקי, לפעמים מתחרה.
התוצאה המעשית: נראות ה-AI ומנועי החיפוש היא מקומית, גם כשהמותג שלכם גלובלי. דף אנגלי אחד הוא ראש גשר, לא קמפיין. אם ההכנסות שלכם מגיעות משתים-עשרה מדינות, תשתית המוניטין שלכם קיימת בערך באחת מהן. הפער בין "יש לנו דף בויקיפדיה" ל"אנחנו מתוארים נכון בכל שוק שאנחנו מוכרים בו" הוא עצום, והוא בדיוק הפער שעולה עסקאות כשעוזר ה-AI של הלקוח הפוטנציאלי חוזר עם "לא מצאתי מידע מהימן על החברה הזו."
כיצד Sitelinks וישות Wikidata אחת מאחדות מותג
הנה המנגנון שהופך את הרב-לשוניות לקוהרנטית ולא לכאוטית. לכל מהדורה לשונית של ויקיפדיה יש ערך משלה על החברה שלכם — פרוזה שונה, עורכים שונים, רשימות מקורות שונות. כשנותרים לבדם, אלה ארבעים דפים מנותקים שמכונות אולי יבינו ואולי לא יבינו שהם מתארים את אותה ישות. מה שמחבר ביניהם הוא Wikidata (מסד נתונים ידע מובנה חופשי המופעל על ידי קהילת ויקימדיה).
פריט Wikidata אחד — QID אחד, הכתובת הקבועה של הישות הבלתי תלויה בשפה — נמצא במרכז. כתבנו בהרחבה על אופן פעולת השכבה המובנית הזו בהסבר שלנו על Wikidata ו-Knowledge Graph, אך היבט הרב-לשוניות הוא החלק הראוי לדגש כאן: ה-QID זהה בין אם הממשק הוא אנגלית, יפנית או ערבית. Q42 הוא Douglas Adams בכל מקום. ה-QID של החברה שלכם היא החברה שלכם בכל מקום.
מחוברים לאותה ישות יחידה הם Sitelinks (קישורים בין-אתריים) — אחד לכל ערך בויקיפדיה לשונית. Sitelink הוא הקישור הרשמי שאומר "פריט Wikidata זה מתאים לערך זה במהדורה לשונית זו." כאשר הערכים הגרמניים, הספרדיים והיפניים שלכם מקושרים חזרה לאותו QID, שלושה דברים קורים:
- מכונות יודעות שמדובר באותה ישות. גוגל ומודלי שפה הקוראים כל אחד מהערכים הללו יכולים לנתח אותו לזהות אחת עם קבוצה אחת של עובדות מובנות. ללא בלבול, ללא כפילות.
- סרגל השפות הבין-ויקי מתמלא. קוראים וסורקים רואים שהערך קיים ב-N שפות — אות גלוי לישות מבוססת ורב-שוקית ולא דף חד-פעמי.
- עובדות מובנות נשארות עקביות בין המהדורות. תאריך ייסוד, מטה ראשי, אתר רשמי, אנשי מפתח, סמל מניה — אלה חיים פעם אחת בפריט Wikidata ומזינים כל שפה. תקנו עובדה במקום אחד; היא נכונה בכל מקום.
זוהי הארכיטקטורה. ערכים רבים בשפות רבות, ישות משותפת אחת. הערכים נושאים את הפרוזה ואת המקרה להוכחת הכשירות הלשונית; פריט Wikidata נושא את הזהות ואת העובדות הקריאות-לבוט. דלגו על שכבת Wikidata ותקבלו ערמת דפים שאינם מכירים זה את זה. בנו אותה כראוי ותקבלו ישות גלובלית קוהרנטית שמנועי חיפוש ומודלי AI יכולים לתאר בדיוק בכל שפה שנשאלים בה.
מלכודת העצמאות: כל מהדורה קובעת את הכללים שלה עצמה
עכשיו החלק שמפתיע כמעט כל לקוח, ואי-ההבנה היקרה ביותר בעבודת ויקיפדיה הרב-לשונית: המהדורות הלשוניות הן קהילות עצמאיות עם כללים עצמאיים. אין רשות ויקיפדיה מרכזית שמאשרת ערך פעם אחת ומפיצה אותו. קרן ויקימדיה מפעילה את השרתים; היא אינה מפעילה את ההחלטות העריכתיות.
משמעות הדבר היא שנושא יכול להיות בעל ערך משגשג במהדורה אחת ולהימחק תוך ראייה במהדורה אחרת. בפועל:
- ויקיפדיה האנגלית (Wikipedia:Notability — קריטריוני הכשירות לכל נושא) היא בעלת הנחיות הכשירות המפותחות ביותר ולכאורה המחמירות ביותר, עם מנגנון מחיקה גדול, מהיר ומאורגן היטב. לעבור אנגלית זה רף גבוה.
- ויקיפדיה הגרמנית ידועה בכך שהיא מחמירה יותר מהאנגלית בערכי חברות — קהילתה סובלנית במיוחד לכל דבר שנקרא כפרסומי, ו"Relevanzkriterien" (קריטריוני רלוונטיות) מיושמים בקפדנות. הרבה חברות שעוברות באנגלית נדחות או נמחקות בגרמנית.
- מהדורות בגודל בינוני משתנות מאוד. חלקן מסבירות פנים ובמעקב דליל; לאחרות יש מספר עורכים מסורים עם דעות חזקות וזיכרון ארוך.
- מהדורות קטנות יותר עשויות להיות גמישות יותר בכשירות אך רגישות יותר לאיכות התרגום ולערכים שברור שמקורם במקום אחר.
המלכודת היא ההנחה שערך אנגלי מאושר הוא דרכון. הוא לא. כל מהדורה מעריכה את הנושא מול תקן הכשירות שלה, תוך שימוש בנורמות המקור-האמין שלה — ומה שנחשב למקור אמין שונה לפי שפה ומדינה. מקור שהוא תקן-זהב בעולם דובר האנגלית עשוי להיות בלתי ידוע, או לא מהימן, אצל עורכי מהדורה אחרת, שמעריכים את המדיה הלאומית שלהם אחרת.
ההשלכה לאסטרטגיה היא ישירה: כל שפה היא שאלת כשירות נפרדת. אינכם יכולים לצטט השקה רב-לשונית כ"הדף האנגלי כפול N." כל מהדורה זקוקה להערכה משלה — האם הנושא עובר את הרף של הקהילה הזו, עם מקורות שהקהילה הזו מכבדת? כל סוכנות שמבטיחה פרסום אחיד בין מהדורות ללא הערכה לכל מהדורה בנפרד היא או חסרת ניסיון או עומדת לשלוח דפים שיימחקו. (אנחנו מתייחסים לכל מהדורה כמשימה נפרדת בדיוק מסיבה זו; חבילת המקורות עוברת, שיפוט הכשירות לא עובר.)
תעדוף שפות לפי ערך שוק, לא יוקרה
ברגע שמקבלים שלכל מהדורה יש עלות אמיתית וסיכון אמיתי, השאלה היא: אילו מהדורות? התשובה השגויה היא "כמה שיותר" או "אלה שנשמעות מרשימות." התשובה הנכונה מונעת מהמקום שבו העסק שלכם פועל בפועל — היכן אתם מוכרים, מגייסים עובדים, מגייסים כסף ועומדים בפני חשיפת מוניטין.
דרך שימושית לחשוב על זה היא בשכבות, ממפה כל שפה לנימוק עסקי ולא לספירת דגלים:
| שכבה | מהדורות (דוגמאות) | מתי כדאי |
|---|---|---|
| עוגן | אנגלית | כמעט תמיד ראשונה. המהדורה המצוטטת ביותר, בעלת המשקל הכבד ביותר ב-LLM, נקודת ההתייחסות שגוגל נסמכת עליה גלובלית. הדף שממנו כל מהדורה אחרת שואלת מקורות. |
| שווקים מרכזיים | גרמנית, צרפתית, ספרדית, יפנית, פורטוגזית | שפות ההכנסות, המשקיעים או שוקי הגיוס הגדולים ביותר שלכם. כל אחת מהן עוגן LLM ראשי בפני עצמה. גרמנית במיוחד אם אתם פועלים ב-DACH — ותכננו את הרף המחמיר שלה. |
| אזורי אסטרטגי | ערבית, הינדית, רוסית, קוריאנית, איטלקית, הולנדית, טורקית, אוקראינית, פולנית | אזורים בעלי אוכלוסייה גדולה או ערך גבוה שבהם יש לכם נוכחות ממשית. כדאי כשיש פעילות עסקית אמיתית, לא רק "נרצה להיראות בינלאומיים." |
| זנב ארוך | כל השאר (אינדונזית, תאית, וייטנאמית, סוואהילית, קטלנית וכד') | רק עם סיבה קונקרטית: כניסה לשוק ספציפי, שותפות מקומית, בעיית מוניטין אזורית. כיסוי לצורך ראווה כאן הוא עלות גרידא. |
שני עקרונות עומדים מאחורי הטבלה. ראשית, עקבו אחרי ההכנסות והסיכון. חברת B2B שלקוחותיה הם יצרנים גרמנים זקוקה למהדורה הגרמנית הרבה יותר ממה שהיא זקוקה לתריסר מהדורות קטנות שנראות טוב בשקופית. מותג צרכני שמתרחב לדרום-מזרח אסיה מחזיק בסדרי עדיפויות הפוכים. רשימת השפות הנכונה היא מסמך עסקי לפני שהיא מסמך ויקיפדיה — ולכן אנחנו מגדירים עבודה רב-לשונית כחלק משירותי B2B בויקיפדיה הרחבים יותר, ומתחילים משווקיכם ולא מחבילה גנרית.
שנית, כל מהדורה שאתם מוסיפים היא מהדורה שחייבים לתחזק. זוהי העלות שרוב הצוותים שוכחים בשלב התכנון ומגלים מאוחר יותר. ארבעים ערכים בארבעים שפות הם ארבעים משטחים לוונדליזם, עריכות אקראיות, הצעות מחיקה, ונסיגה הדרגתית בעובדות — בשפות שאיש בצוות שלכם לא יכול לקרוא. הוספת שפה אינה רכישה חד-פעמית; היא אחריות מתמשכת. זה לבדו מספיק סיבה להיות אכזריים לגבי רשימת העדיפויות. מהדורות פחות, מתוחזקות היטב, עדיפות על מהדורות רבות שנותרות להתכלות.
תרגום אינו יצירה
הנה אופן הכשל שאנחנו מוזמנים לתקן בתדירות הגבוהה ביותר: חברה (או ספק זול) לוקחת את הערך האנגלי, מעבירה אותו בתרגום מכונה או מתרגם מתחיל, ומדביקה את התוצאה לויקיפדיה הגרמנית, הצרפתית והספרדית. תוך ימים, לפעמים שעות, הדפים מתויגים, מורדים לטיוטה, או מוצעים למחיקה. הכסף הלך והמותג כעת עם שובל גלוי של ערכים שנדחו, מה שמקשה על הניסיון הבא עוד יותר.
זה נכשל מסיבות מבניות, לא קוסמטיות:
- מקורות לא מתורגמים. ערך אנגלי בנוי על מקורות אמינים בשפה האנגלית. הקהילה הגרמנית רוצה מקורות בגרמנית (או לפחות מוכרים בגרמנית), הנשקלים לפי נורמות האמינות שלה. ערך מתורגם לרוב מצטט רשימת מקורות שהקהילה המקבלת פשוט אינה מקבלת, ומותיר את מקרה הכשירות לא מוכח במהדורה הזו. תרגום הפרוזה לא מתרגם את הראיות הבסיסיות.
- סגנון ומבנה שונים בין מהדורות. לכל קהילה יש מוסכמות לגבי מבנה הערך, מה שייך לפסקת הפתיחה, כיצד מתארים חברות, מה נחשב לפרסומי. תרגום מילולי של ערך אנגלי לעתים קרובות נקרא כפרסומי או בנוי בצורה מוזרה לעיני עורכי מהדורה אחרת, גם כשהמקור האנגלי היה נקי.
- פרוזה שתורגמה על ידי מכונה היא ניתנת לזיהוי ואינה מהימנה. עורכים מזהים חפצי MT מיד. ערך שנראה כאילו עבר דרך מתרגם מאותת "תוכן פרסומי מיובא" — בדיוק הדגל שמפעיל בדיקה ומחיקה.
- הטיעון לכשירות חייב להיות מוצג לקהילה ההיא. לשרוד ביקורת פירושו שהערך עובר בבירור את הרף של המהדורה הזו עם מקורות שהמהדורה הזו מכבדת. זה שיפוט עריכתי ותרגיל איסוף מקורות, לא משימת המרת שפה.
הניסוח הכנה: כל גרסה לשונית היא ערך חדש שנכתב באופן מקורי עבור הקהילה הזו, חולקת עם האחרים את המחקר הבסיסי וחבילת המקורות אך בנויה מחדש כדי לעמוד בכשירות מקומית, מקורות, סגנון ומבנה. הדף האנגלי מעגן את רשימת המקורות ואת העובדות; הדף הגרמני נכתב כערך גרמני על ידי מי שמכיר את תקני הקהילה הגרמנית. לכן השקה רב-לשונית אמיתית מתומחרת לפי מהדורה עם השלמת מקורות לכל מהדורה, ולא כמשימת תרגום בסיטונאות. מי שמוכר לכם "נתרגם את הדף שלכם ל-30 שפות" מוכר לכם 30 מחיקות.
Wikidata כעמוד שדרה רב-לשוני עבור Knowledge Panels ברחבי העולם
חזרו לשכבה המובנית, כי Wikidata עושה עבודה שקטה וכבדה בכל שוק בו-זמנית — והיא החלק בעל המינוף הגבוה ביותר והעלות הנמוכה ביותר באסטרטגיה רב-לשונית.
פריט Wikidata אחד שנבנה היטב נושא תוויות ותיאורים רב-לשוניים: שם הישות ותיאור קצר בכל שפה שאתם ממלאים. כשגוגל מרכיבה Knowledge Panel עבור משתמש בקוריאה, שם הישות והסוג שלה יכולים להגיע ישירות מהתוויות הקוריאניות בפריט Wikidata שלכם. אותה ישות משרתת את הלוח הערבי, הספרדי וההינדי. רשומה מובנית אחת, עיבודים מקומיים רבים.
זה חשוב ביותר במצב השכיח מאוד שבו אין לכם ערך ויקיפדיה בשפה מסוימת. היזכרו מעבודת שכבת הישות שלנו של-Wikidata יש רף נמוך הרבה יותר מלויקיפדיה — קיום ניתן לאימות ויכולת זיהוי, לא תקן הכשירות הגבוה שערך מצריך. לכן אפילו בשווקים שבהם ערך ויקיפדיה מלא עדיין אינו מציאותי, פריט Wikidata נקי ורב-לשוני יכול עדיין להזין:
- את שם הישות ולסוגה, מקומיים, ב-Knowledge Panel של אותו שוק.
- עובדות מובנות עקביות — תאריך ייסוד, מטה ראשי, אתר רשמי, מזהים — שאינן תלויות בקיום ערך בשפה כלשהי.
- קישור
sameAsהקושר את הישות שלכם לרשומות סמכות (VIAF, ISNI, LEI, ORCID במידה שחל) שהן עצמן בלתי-תלויות בשפה.
לכן הרצף לשוק חדש לרוב הוא: לוקליז את שכבת Wikidata קודם — תוויות, תיאורים ועובדות מובנות בשפת היעד — שזה זול, מהיר ועוזר ללא תלות; ואז שאפו לערך ויקיפדיה מלא במהדורה הזו רק היכן שמקרה הכשירות וערך השוק מצדיקים זאת. עמוד השדרה של Wikidata נותן לכם קו בסיס של זהות מדויקת ניתנת לקריאה ממוחשבת בכל שפה בשבריר מעלות הערך, ואינו פוגע בשום ערך עתידי. הוא המהלך הפחות-שמומש בעבודת ישות בינלאומית.
ממשל: תחזוקת N גרסאות ללא חשיפה למלחמות עריכה
היום שבו הערך האחרון מפורסם אינו סוף הפרויקט — הוא תחילת שלב התחזוקה, ותחזוקה רב-לשונית קשה אמיתית מתחזוקה חד-לשונית. כעת יש לכם N משטחים ב-N שפות, חלקן שאיש בצוות הפנימי שלכם אינו יכול לקרוא, וכולן ניתנות לעריכה על ידי כל אחד על פני כדור הארץ.
הסיכונים מוכפלים עם כל מהדורה:
- וונדליזם וקידום אקראי בשפה שאיש מבפנים אינו עוקב עליה יכולים לשבת חיים שבועות.
- נסיגה הדרגתית בעובדות — עורך בעל כוונות טובות "מתקן" את תאריך הייסוד שלכם או המטה ראשי במהדורה אחת, ועכשיו הסיפור המובנה שלכם אינו עקבי בין השווקים.
- הצעות מחיקה מקומיות יכולות להתחיל בכל מהדורה בכל עת, לעתים קרובות הרבה לאחר הפרסום, ויש לענות עליהן בשפה הזו, לקהילה הזו, בתנאים של הקהילה הזו.
- מלחמות עריכה הן המלכודת שמכניסה מותגים לחדשות. משווק פנימי להוט שמתחבר כדי "לתקן" ביקורת בערך הצרפתי, מחזיר עריכה של עורך מתנדב, מוחזר בעצמו, מסלים — זה בדיוק כיצד נכס מוניטין שקט הופך למבוכה פומבית. החשיפה לניגוד עניינים (WP:COI — מדיניות ניגוד עניינים של ויקיפדיה) מוכפלת עם כל מהדורה שבה מישהו עשוי להתפתות להתערב.
ממשל רב-לשוני תקין נראה כך:
- ניטור מרכזי על פני כל המהדורות, עם רשימות מעקב והתראות שאינן תלויות בכך שמישהו יקרא בשטף כל שפה מדי יום.
- עובדות מנוהלות ב-Wikidata, כך שתיקון מופץ ולא מוזן ביד ל-N ערכים באופן לא עקבי.
- אין עריכה פנימית ישירה של מהדורה כלשהי על ידי אנשים עם ניגוד עניינים ברור. שינויים מוצעים בשקיפות, בדפי שיחה, תחת גילוי נאות — אותה דיסציפלינת עריכה בתשלום (WP:PAID — מדיניות ויקיפדיה לעורכים שכירים) השומרת דף חד-לשוני בטוח, מוחלת על כולם.
- הגנה מנוהלת על ידי אנשים המכירים כל קהילה. דיון מחיקה בויקיפדיה הפולנית מנוצח על ידי מי שמבין נורמות כשירות פולניות ויכול לטעון בפולנית, לא על ידי העתק-הדבק מתורגם מההגנה האנגלית.
זהו החצי הלא-מבריק והחוזר של עבודה רב-לשונית, וזו הסיבה שכיסוי מתמשך — ראו תמיכה שנתית בויקיפדיה — אינו מכירת תוספות אלא הדרך האחראית היחידה לשמור על טביעת רגל בת מהדורות מרובות. תיק של ארבעים ערכים שאינם מתוחזקים אינו נשאר נכס. הוא מתכלה לארבעים אחריויות, חלקן שגויות בשקט, בשפות שתגלו שהן שבורות רק כשעוזר ה-AI של לקוח פוטנציאלי יחזור על השגיאה אליכם.
השקה רב-לשונית בשלבים
הרכיבו את כל זה והרצף הנכון הוא מכוון, לא בהולת-קרקע. אנחנו מנהלים תוכניות רב-לשוניות בשלבים כך שכל צעד מפחית סיכונים מהצעד הבא והתקציב עוקב אחרי הראיות.
שלב 0 — אסטרטגיה ומפת שפות. לפני כל ניסוח, החליטו אילו מהדורות ומדוע, המונע על ידי השווקים, ההכנסות והסיכונים האמיתיים שלכם — תרגיל השכבות לעיל, מומר לרשימת עדיפויות קונקרטית. פלט: תוכנית שפות מדורגת עם נימוק עסקי לכל מהדורה והערה כנה על אילו מהן (גרמנית במיוחד) נושאות רף קשה יותר.
שלב 1 — עמוד שדרה של Wikidata. בנו או נקו את פריט Wikidata האחד קודם: QID אחד, עובדות מובנות, קישורי רשומות סמכות, ותוויות ותיאורים רב-לשוניים עבור כל שוק יעד — כולל אלה שלא מתוכנן בהם ערך עדיין. זה זול, מהיר, ומשפר מיידית את זיהוי הישות המקומי בכל מקום. הוא גם הפיגום שאליו כל ערך מאוחר יותר מקושר דרך Sitelinks.
שלב 2 — ערך העוגן. צרו את הערך האנגלי (או לעתים, המהדורה הרלוונטית ביותר לעסק שלכם) דרך יצירת דף ויקיפדיה ראויה — הערכת כשירות, ניסוח מקורי, סקירת קהילה, ניטור לאחר פרסום. זה מעגן את חבילת המקורות שממנה ישאבו שאר המהדורות.
שלב 3 — מהדורות שוק מרכזי, לפי סדר עדיפויות. השיקו את מהדורות השפות בעלות הערך הגבוה ביותר אחת בכל פעם, כל אחת כערך שנכתב באופן מקורי עם השלמת מקורות לכל מהדורה והערכת כשירות משלה — לא תרגומים. ביצוע בסדר רצפי פירושו שאתם לומדים מהיענות כל קהילה לפני ההתחייבות לבאה, ותוכלו לעצור או לשנות סדרי עדיפויות אם הרף של מהדורה מסוימת מתגלה כגבוה מהצפוי.
שלב 4 — מהדורות אסטרטגיות וזנב ארוך, לפי הצדקה. הוסיפו מהדורות נוספות רק כשמופיעה סיבת שוק קונקרטית. התנגדו למשיכת היוקרה. כל תוספת היא התחייבות תחזוקה.
שלב 5 — ממשל רב-לשוני מתמשך. ניטור מרכזי, עקביות עובדות מונעת-Wikidata, עריכה מגולה ושקופה, והגנת מחיקה לכל קהילה בנפרד על פני כל הטביעה — ברציפות, כל עוד הדפים חשובים.
החוט המחבר הוא כנות לגבי עלות וסיכון. ויקיפדיה רב-לשונית ו-Wikidata שנעשו היטב הם אחד מחתיכות תשתית הנראות ה-AI הגלובלית החזקות ביותר שחברה יכולה להחזיק — הדבר שגורם למודל לתאר אתכם בדיוק בין אם נשאלים באנגלית, ערבית או יפנית. שנעשו כבהלת-תרגום בסיטונאות, הן דרך מהירה לבזבז הרבה כסף ולייצר מחיקות בשפות שאינכם יכולים לקרוא. ההבדל כולו נמצא בדיסציפלינה: ישות מאוחדת אחת, כבוד לכל מהדורה עם כלליה העצמאיים, שפות שנבחרו לפי ערך שוק, ותחזוקה שמטופלת כחלק מהעבודה ולא כמחשבה שלאחר מעשה.
מוכרים ביותר משוק אחד ולא בטוחים אילו מהדורות לשוניות כדאיות? שלחו אלינו מייל ל-team@wikibusines.com ואנחנו נשלח מפת עדיפויות שפות כנה ומונעת-שוק — כולל אילו מהדורות היינו מדלגים עליהן.