יום שלישי, 12 בינואר 2010

סדנאת SKOS


אתמול השתתפתי בסדנא שארגנה "מקש", המסגרת שמרכזת את השתתפות ישראל במיזם ATHENA ומשרד ה- W3C בישראל המופעל על ידי איגוד האינטרנט הישראלי. המפגש היה במוזיאון ארץ ישראל ברמת אביב.
נושא הסדנא היה ייצוג מילונים מבוקרים באמצעות SKOS. SKOS הוא ראשי תיבות של Simple Knowledge Organization System. 


הרעיון העיקרי הוא שבאמצעות SKOS אפשר לאחד ולחבר בין מערכות ניהול ידע (KOS). הכוונה היא לתזאורוסים שונים ואפילו פולקסונומיות. הבעיה מוכרת. לכל מאגר מידע או ספריה יש טקסנומיה משלה. כדי לחפש נושא במספר מאגרים, אנחנו חייבים לעשות את זה אחד אחד וכל פעם לנסות למצוא את מילת המפתח המתאימה שהוגדרה על ידי אותה מאגר.


SKOS הוא אנטולוגיה הבנויה באמצעות RDF השפה העיקרית של הרשת הסמנטית. SKOS מאפשר בניה של אונטולוגיה (תזאורוס מאד מתקדם עם המון אפשרויות ייצוג של מידע). בעזרת SKOS אפשר לבטא נושא אחד במספר דרכים.
המטרה היא לפרסם בקלות אוצר מילים מבוקר ומובנה לשימוש בעזרת הרשת הסמנטית. זה יאפשר בסופו של דבר איחזור מידע יעיל ומדויק יותר.


המרצה שניהלה את רוב הסדנא היתה רגינה שטיין. רגינה היא  האחראית על טכנולוגיות המידע במרכז התיעוד של גרמניה לתולדות האומנות. מטבע הדברים היא התייחסה בעיקר למוזיאונים ופחות לספריות. בקהל היתה נוכחות גדולה של ספרנים ומרצים למידע וספרנות אבל יש כמובן הרבה במשותף. גם בספריה וגם במוזיאון יש צורך לקטלג פריטי מידע ובעיות של איחוד בין קטלוגים תמיד צצים. בעולם המוזיאונים זה יותר בעייתי. לנו בספריות יש שיטת קיטלוג אחד מרכזית MARC שרוב הספריות משתמשות בו. רגינה הסבירה שזה לא כך במוזיאונים. יש כנראה מספר שיטות קיטלוג שונות וכל מוזיאון יכולה להשתמש בשיטה שמתאימה לו.
רגינה הראתה מספר שיטות כגון  CDWA, CCO, Spectrum, Museumdat, CIDOC CRM, LIDO. יש שדות בקיטלוג פריטי אומנות והיסטוריה שלא באים לידי ביטוי ב MARC. כדי לפתור את הבעיות הללו של פריטים זההים המקוטלגים באופן שונה, רגינה נעזרת ב SKOS. אפשר לאחד לא רק בין נושאים בתזאורוסים השונים אלא גם שדות כמו מחבר או יוצר (בעצם תזאורוס של מחברים או מקומות וכד'). יתכן מחבר שיש לו כמה שמות או כינויים וכל מאגר משתמש בשם אחר למרות שמדובר על אותו בן אדם.





בסדנא דיברה גם אליסון קופיאצקי שבונה את מאגר המידע של מוזיאון ישראל. היא דיברה על Europeana- פורטל חיפוש של אוצרות התרבות וההיסטוריה האירופאית. גם מוזאיאונים בישראל משתתפים בפרויקט הזה וכמובן מתעוררת שוב הבעיה של תזאוריסם שונים. היא הראתה את המאמצים הנעשים במוזיאון ישראל כדי לבנות מאגר יעיל וטוב.


אחריה דיברה אורה זהבי מהספריה באוניברסיטת חיפה. היא דיברה על פרויקט הצילומים העתיקים שלהם ועל בעיות במיפתוח.


הרגע המעניין ביותר בסדנא היה כשהתפתח דיון ספונטני בתוך הקהל בין רחל קידר, דב ווינר, סוזן לזינגר, ויהודית בר-אילן. רחל העלתה אפשרות לאחד בין תזאורוסים ישראליים ויהודיים כמו ספרית הקונגרס (תרגום בר אילן), מפתח חיפה, ejewish ואחרים. דב אמר שאפשר לעשות את זה עם SKOS והביא דוגמא לאיחוד גיאוגרפי (שם מקום) בין תזאורוסים.


בסך הכל הקהל למד על אפשרויות נוספות עתידיות לגבי מיפתוח וקיטלוג. לדעתי בשנים הקרובות יצטרכו להתחיל ללמד את הנושאים הללו. קיטלוג, מיון ומיפתוח לא יעלמו אבל הכלים והטכניקות ישתנו ועל הספרנים והמידענים להיות מוכנים לכך.

למיטב הבנתי SKOS תוכל לפתור בעיה מאד ידועה ומרכזית בספריות אקדמאיות. כל ספרן משתמש ב ULI כדי לאתר ספרים בספריות אחרות. אפשר לחפש לפי כותר או מחבר אבל לא לפי נושא ("מילה מתוך נושא" זה לא "נושא"). הסיבה לכך ברורה. לכל ספריה טקסונומיה או תזאורוס משלה ואין אפשרות לעשות metasearch יעיל ביניהם.
לדעתי SKOS אמורה לעשות את האיחוד הזה. זה יהיה הרבה עבודה ידנית (כפי שהסבירה רגינה) אבל זה ישנה מאד את הגישה שלנו למידע ולספרים בספריות.
בתחילת הסדנא ד"ר ישע סיוון מנהל המשרד הישראלי של ה W3C הודיע שלאיגוד האינטרנט יש תקציבים המיועדים לפרויקטים המשתמשים או המפתחים טכנולוגיות של ה W3C. צריך רק מישהו שירים את הכפפה.



תודה לאייל סלע על התמונות

אין תגובות:

Real Time Web Analytics