ארמון הזיכרון של שרלוק הפך לכלי AI
MemPalace הוא פרויקט קוד פתוח חדש שמשתמש בטכניקת 'ארמון הזיכרון' בת 2,000 שנה כדי לחסוך 99% מהטוקנים באחזור זיכרון AI. איך זה עובד בפועל?
זוכרים את הסצנה ההיא בשרלוק של BBC? הוא נורה, קורס אל הרצפה, ונסוג אל תוך הראש של עצמו. דלתות. חדרים. כל אחד מחזיק פיסת מידע שהוא צריך כדי לשרוד את שלושים השניות הבאות. בסדרה קוראים לזה “ארמון הזיכרון” שלו.
זו לא המצאה של תסריטאי. זו טכניקה בת 2,000 שנה שקיקרו תיאר בספרו דה אורטורה. וזה הרעיון המרכזי מאחורי פרויקט ה-AI עם הכי הרבה כוכבים בגיטהאב ברגעים אלה.
כל חברות הזיכרון ל-AI מספרות לכם בדיוק את הסיפור ההפוך. השיחות שלכם ארוכות מדי, מבולגנות מדי, יקרות מדי. אז תנו לנו לסכם אותן ל”עובדות” ולזרוק את השאר.
פרויקט אחד בקוד פתוח טוען את ההפך ! שמרו הכל מילה במילה. ארגנו את זה כמו בניין. תנו ל-LLM להסתובב בין החדרים.
MemPalace הושק ב-5 באפריל, קפץ למקום הראשון בטרנדים של גיטהאב תוך 48 שעות, וכבר צבר 43,000 כוכבים. הרעיון הגיע מהשחקנית מילה גובוביץ’, אחרי שנתקלה בקיר שכולנו נתקלים בו: היא רצתה AI שזוכר את 20,000 השיחות הקודמות שלה. את ההנדסה עשה בן סיגמן ממעבדות Libre.
הארכיטקטורה בת 2,000 השנים
סנאטורים רומאים שיננו נאומים שלמים על ידי הנחת כל רעיון בחדר דמיוני. כשהם נזקקו לנקודה מסוימת, הם “הלכו” בבניין בתוך הראש שלהם. הטכניקה נקראת Method of Loci והפרוייקט מתרגם אותה ישירות למבנה נתונים:
אגפים (Wings) מחזיקים הקשר ברמה העליונה: אדם, פרויקט, תחביב
חדרים (Rooms) מחזיקים נושאים ספציפיים בתוך כל אגף (לוגיקת הרשאות, תמחור רבעון שלישי, תכנון חופשה)
מסדרונות (Halls) מחברים חדרים בין אגפים לפי סוג זיכרון: עובדות, החלטות, העדפות, אירועים, תובנות
מגירות (Drawers) מחזיקות את קטעי השיחה המקוריים, מילה במילה
ארונות (Closets) מחזיקים מצביעי סיכום שמחזירים אל המגירה המקורית
שום דבר לא נמחק. שום דבר לא נכתב מחדש על ידי LLM “ליעילות”. הטקסט המקורי נשאר שלם. המבנה עושה את עבודת האחזור.
המספר ששווה לזכור: 170 טוקנים
כשאתם פותחים סשן חדש, MemPalace טוען בערך בסך הכל 170 טוקנים של הקשר קריטי: מי אתם, על מה אתם עובדים, מה ההעדפות שלכם. הוא חופר בארמון העמוק יותר רק כשהשאילתה דורשת את זה.
סיכום LLM על פני כל היסטוריית השיחה שורף 650,000 טוקנים ומעלה עבור אותה רמת אחזור. אפס קריאות API. אפס תלות בענן. הכל רץ מקומית. ובעיקר - ה״מוח״ שלכם יכול לזוז איתכם- לכל מודל שפה, ובעלות אפסית עם ביצועים חזקים מאוד.
רגע התיקון ששווה ללמוד ממנו
MemPalace הושק עם טענה גדולה עוד יותר: 100% במבחן LongMemEval, הבנצ’מרק הסטנדרטי לזיכרון ארוך טווח ב-AI. הכלי הראשון בהיסטוריה שהגיע לציון מושלם.
זה לא היה נכון, לפחות לא באופן שה-README רמז.
תוך שעות ספורות מההשקה, מפתחים בגיטהאב וב-X פירקו את קוד הבנצ’מרק. ה-100% הגיע מטלאים ממוקדים שתוקנו בדיוק לשלוש השאלות שהמערכת החמיצה בהתחלה. במצב raw, בלי התיקונים הספציפיים למבחן, הציון האמיתי היה 96.6%.
תוך 48 שעות, הצוות פרסם תיקון פומבי. ואף הודה לקהילה ישירות על כך ש”תפסה בעיות אמיתיות”.
זה די נדיר. באקוסיסטם שבו חברות מסתירות את המתודולוגיה של הבנצ’מרק מאחורי טקסט שיווקי, תיקון פומבי תוך 48 שעות זה הסיפור האמיתי. זו גם הסיבה שהמספר 96.6% אמין היום, שם שה-100% לא היה.בינתיים, הצוות כבר חזר בו מפיצ’ר הדחיסה AAAK שלהם עצמם (מוזמנים לקרוא לעומק בגיט), והודה שהוא פחות יעיל מהגישה הפשוטה של שמירה מילה במילה. כנות כזאת כלפי הכלי שלך עצמך שווה יותר מכל ציון בנצ’מרק.
מה שווה לקחת הלאה לעבודה שלכם עם AI
סיכום זו נוחות, לא דרישה.
בחנו את ההנחה שחלונות הקונטקסט מחייבים אתכם לדחוס.
אחזור מבני מעל טקסט מקורי (כמו בשיטה המוצעת) יכול להשיג אותה רמת אחזור כמו סיכום, בעלות של 1/1000 מהטוקנים.
MemPalace משוחרר תחת רישיון MIT. אפשר לחבר אותו ל-Claude Desktop או Cursor דרך MCP כבר היום. אגב שימו לב שצצו לפרויקט ״אתרים״ מורעלים, לכן כדאי לעבוד ישירות מול הגיט הרשמי, של מילה ובן (שאין לו אתר).
שמרו את כל הקבצים שלכם שם, בבית הזה - שיש בו ארונות ומגירות, ותראו איך אתם שורפים פחות טוקנים, ומקבלים יותר ערך של קונטקסט.
הרומאים ידעו שאיפה אתה שם דבר חשוב לא פחות ממה הדבר הזה.
אלפיים שנה אחר כך, גם סוכני ה-AI נוטים להסכים.
מוזמנים לנסות להתקין אצלכם, לספר לי איך הזכרון שלכם עכשיו



כבר הרבה שנים שאני אוהב את הטכניקה הזו, ומנסה להשתפר בה כל הזמן. אני גם אוהב את מילה כשחקנית עוד מימי האלמנט החמישי.
זה שילוב מעניין ממש