יום חמישי, 5 במרץ 2009

Freebase - explore

Freebase מבוסס על כלים סמנטיים שמנתחים את המידע של כל הערכים ב Wikipedia (ומקומות אחרים) והופך אוסף של מסמכים פשוטים לנתונים מובנים במסד נתונים. לשם השואה ניתן לומר שאת המשפט "צופן דה-וינצ'י הוא ספר של 300 עמודים שנכתב על ידי דן בראון" ניתן להפוך ל כותר: צופן דה-וינצ'י , עמודים: 300 , מחבר: דן בראון
בדומה לויקי כל אחד יכול למלא שדות נוספים לפי הידע שלו.
ניתן בצורה זו לשאול שאלות מורכבות ולקבל תשובות מדויקות (בתאוריה כמובן). ניתן להשתמש ב API של Freebase לבנות יישומים ולנצל את כל המידע שלהם. זה מה שעושה Powerset. שיחקתי קצת עם Powerset אבל לא התרשמתי במיוחד. הכנסתי נתונים ל Freebase וכששאלתי עליהם ב Powerset לא קיבלתי תשובה. הכלי יפה אבל אפשר להסתדר די טוב עם Google ו Wikipedia.
אבל היום גיליתי את קטגורית ה explore בתפריט של Freebase... והתלהבתי.
ב explore בוחרים נושא (למשל פוליטיקאים). Freebase כבר ניתח את כל המידע על כל הפוליטיקאים ב Wikipedia ולזה נוספו גם נתונים ממשתמשי Freebase. אחרי שקיבלתי רשימה של 20000 פוליטיקאים, Freebase מאפשר לי לסווג אותם לפי נושאים (נולד ב, נפטר ב, עסק ב, חינוך, בני משפחה, דת וכו'). אני יכול להגביל את רשימת הפוליטיקאים לפוליטיקאים יהודיים שנולדו בשנת 1940 שעסקו בעבר במשפטים ולאביהם קראו יעקב. אין כאלה כנראה אבל אפשר לפחות לשאול את השאלה. במנוע חיפוש רגיל אי אפשר לבנות שאילתא מורכבת כל כך. מנוע החיפוש יחפש מסמך בו יופיע המילה פוליטיקאי, 1940, יהודי, משפטים ויעקב והתוצאות יהיו בהתאם.

יש עוד הרבה עבודה לחברת Metaweb שיצרה את Freebase ועוד ויתר ל Powerset ודומיהם אבל כלים כאלו מראים שחלום ה Semantic Web מתקרב גם אם זה יקח עוד כמה שנים.
Freebase משלב בין web 2.0 (האפשרות לכל משתמש להעלות נתונים למאגר) לבין כלים סמנטיים. זוהי אחת הדרכים המוצלחות המובילות ל Web 3.0.עוד בנושא זה ב 4.5.2009 בכנס Info 2009.
Reblog this post [with Zemanta]

תגובה 1:

שרה כהן אמר/ה...

הי דניאל ,
מאוד מאוד מעניין .

Real Time Web Analytics