מ
MishpatIL-Bench
מדד שכנוע משפטי ישראלי
מי בנה ולמה

המדד הזה פותח על-ידי Hammurabi

גילוי נאות, ראש בראש: MishpatIL-Bench נבנה ומופעל על-ידי Hammurabi, שגם נמדדת בו. אין כיום מדד עצמאי לבחינת מערכות AI על משפט ישראלי — המדדים הקיימים בעולם (LegalBench, Harvey BigLawBench, Vals AI) נבנו עבור משפט אנגלו-אמריקאי. כדי שלעורך-דין ישראלי יהיה כלי השוואה אמיתי, חברה אחת בנתה אותו. אנחנו.

זה דפוס מקובל בתעשייה. Harvey פיתחו את BigLawBench. Vals AI מפעילים את המדד שלהם. Anthropic, OpenAI ו-Google מפרסמים benchmark-ים שהם בנו על המודלים שלהם. הקוד הפתוח, המתודולוגיה הגלויה, וההפרדה בין הקריטריונים לבין החלטות הסקור — אלה מה שמאפשרים לסומכי-הדעת לבחון את הניטרליות בעצמם.

מה ייחודי במשפט הישראלי

מערכת המשפט הישראלית כוללת כללי ניסוח ייחודיים: מספור עברי, פורמט ציטוט מסוים (ע"א 1234/56 שם נ' שם, פ"ד לב(1) 100), היררכיית ערכאות מובחנת (שלום / מחוזי / עליון / בג"ץ / משפחה / עבודה / מנהליים), ועמידה בתקנות סדר הדין האזרחי. אף אחד מהמדדים הבינלאומיים לא בודק את הדברים האלה.

איך פועל המדד

מגבלות הבדיקה

הוגנות דורשת לציין במפורש מה המדד לא בודק ומה ההגבלות שלו:

איך לבדוק את התוצאות עצמאית

שלוש דרכים לאמת: