ניהול מטא-דאטה (Metadata)
מטא-דאטה היא 'נתונים על נתונים': מה שמאפשר למצוא מידע, להבין אותו ולסמוך עליו.
מה זה מטא-דאטה
מטא-דאטה היא המידע שמתאר, מקטלג ונותן הקשר לנתונים. כמו קטלוג הכרטיסיות בספרייה שמאפשר למצוא ספר לפי נושא או מחבר, מטא-דאטה מאפשרת למצוא נתון, להבין את משמעותו ולדעת אם אפשר לסמוך עליו. נהוג לחלק אותה לשלושה סוגים שמשלימים זה את זה.
שלושת הסוגים, לעומק
מטא-דאטה עסקי
נותן את ההקשר והמשמעות: מה הנתון אומר ומי אחראי עליו. כולל:
- שמות והגדרות לא-טכניים של מונחים, ישויות ותחומי מידע.
- חוקים עסקיים, כללי איכות ונוסחאות חישוב.
- פרטי הבעלים והנאמנים האחראים על המידע.
- סיווג רמת האבטחה והפרטיות.
מטא-דאטה טכני
מתאר את המבנה הפיזי ואת המערכות. כולל:
- שמות פיזיים של טבלאות ועמודות, וסכמות של פורמטים.
- הגדרות והרשאות גישה (כללי CRUD: יצירה, קריאה, עדכון, מחיקה).
- תיעוד תהליכי ETL ומיפוי מקור-ליעד.
- חוקי גיבוי והתאוששות.
מטא-דאטה תפעולי
מתעד את הביצוע בפועל: מה קרה לנתון ומתי. כולל:
- יומני ריצה (Logs), כולל היסטוריית חילוץ ושגיאות.
- תבניות שימוש בשאילתות ובדוחות (תדירות וזמני ביצוע).
- חוקי מחיקה (Purging), ארכוב ושימור.
- סטטוס עמידה בהסכמי רמת שירות (SLA).
מילון מונחים עסקי מול מילון נתונים
שני המונחים נשמעים דומים אבל משרתים קהל שונה. אחד מסביר משמעות עסקית, השני מתעד מבנה טכני.
| היבט | מילון מונחים עסקי | מילון נתונים |
|---|---|---|
| מטרה | שפה ארגונית משותפת ומשמעות עסקית | הגדרת מבנה טכני של קבוצות נתונים |
| תוכן | מושגים, הגדרות, מילים נרדפות ובעלים | שמות שדות, סוגי נתונים, אורכים ואילוצים |
| למי | הנהלה, גורמים עסקיים ונאמני נתונים | מפתחים, מנתחי מערכות ואנשי DBA |
מטא-דאטה אקטיבית מול פסיבית
פסיבית נשענת על הזנה ידנית. מכיוון שהיא דורשת תחזוקה אנושית מתמדת, היא מתיישנת מהר, מאבדת רלוונטיות והופכת בעצמה לממגורה מבודדת.
אקטיבית היא גישה חיה שמשתמשת ב-ML וב-AI כדי לאסוף ולנתח מטא-דאטה ברציפות מכל הארגון. היא לומדת מהנתונים, מזהה מגמות, וממליצה או אף מיישמת פעולות מתקנות אוטומטית, למשל עצירת צינור נתונים בעת תקלת איכות.
איך מטא-דאטה מניעה אוטומציה
מטא-דאטה אקטיבית עובדת כמו מערכת עצבים של הארגון. ברגע שנתון חדש נכנס, הוא מתויג מיד (למשל "מידע אישי רגיש"). התיוג משדר אירוע (Event) שמפעיל בקרות משילות אוטומטיות: מיסוך נתונים (Masking), אכיפת הגבלות גישה או הפעלת חוקי איכות, הכל בלי התערבות אדם ובמהירות שמונעת דליפה או שימוש בנתון שגוי.
דוגמה: ניתוח השפעה
צוות מתכנן לשנות עמודה בטבלת מקור. בלי מטא-דאטה, אף אחד לא יודע מי תלוי בה. עם שושלת ומטא-דאטה, אפשר לראות מראש שכל דוח ההכנסות הרבעוני ושני מודלים נשענים על אותה עמודה, ולתאם את השינוי לפני שהוא שובר דברים במורד הזרם.
מטא-דאטה היא הבסיס לקטלוג ושושלת נתונים, ומזינה את חוקי איכות הנתונים.