יום ראשון, 26 באפריל 2009

Wolfram Alpha


בשבועות האחרונים הופיעו הרבה מאמרים ופוסטים באתרי טכנולוגיה לגבי ה "Google Killer" החדש - Wolfram Alpha. שירות זה עדיין לוטה בערפל ולמרות מספר ראיונות עם מנהל החברה, אי אפשר עדיין לראות את Alpha בפעולה.

מי שעומד מאחורי הפרויקט החדש הוא חברת Mathematica חברת תוכנה מתקדמת המתמחה בחישובים computation (הדגמה).

אז מה בדיוק עושה Wolfram Alpha?

זה לא בדיוק מנוע חיפוש. היוצרים קוראים לה מנוע חישוב ידע. המנוע החדש נותן תשובות לשאלות בשפה טבעית. מה שמיוחד באתר זה שהוא מתמחה בשאלות כמותיות (כמו כמה משתמשי אינטרנט יש באירופה? כמה מ"מ גשם ירד בתל-אביב בחורף 2002? או כמה אטומים יש בבקבוק קוקה קולה?)

מנוע חיפוש רגיל מנסה למצוא מילות מפתח, מנוע חיפוש סמנטי מנסה להבין את משמעות מילות המפתח, אבל Wolfram Alpha מחשב חישובים מורכבים ועונה על שאלות כשהתשובה היא מספר.

בחודש הבא האתר החדש אמור להתחיל לפעול. נראה אם הוא באמת עומד בצפיות.
וידאו: Stephen Wolfram (המנכ"ל) מרצה על המנוע החדש באוניברסיטת הארוורד.

יום רביעי, 22 באפריל 2009

הדגמה לשימוש ב Explore של Freebase

בפוסט קודם כתבתי על Freebase וליתר דיוק על האפשרות של Explore. עמי הזכיר את הפוסט הזה בצמתי מידע (תודה).

לפני חודשיים התקנתי במחשב את Jing כתחליף חינם ל Camtasia.
Jing מצלם את מסך המחשב וקולט בוידיאו את הפעילות שלי בזמן אמת. אלכסי צילם את השימוש ב Jing באמצעות Jing (מזכיר משהו כמו ציור של Escher) והדגים את זה בבלוג שלו השבוע.

השתמשתי ב Jing כדי "להקליט" סרטון הדגמה של Explore.
נכנסתי ל Freebase ובחרתי מהתפריט את Explore. יש רשימה של קטגוריות שמתוכו בחרתי את Government.
כאן מתחיל הסרט.
בחרתי תת-קטגוריה politicians ובעזרת הפילטר הגדרתי רק פוליטיקאים יהודים. זה צמצם את הרשימה ל 2000. לאחר מכן עם הפילטר הגדרתי מקצוע (הכוונה חוץ מהמקצוע הפוליטי) "שחקן/ית". נשארו שניים.

צפו בסרטון

נסו לחפש ב Google "פוליטיקאים יהודים שגם שחקנים"!?!?

אי אפשר לעשות חיפוש מורכב שכזה באמצעות מילות מפתח (יהודי, פוליטיקאי, שחקן) בלבד. בשביל זה נועדה הרשת הסמנטית.

חשבתי לשלב את הסרטון במצגת שלי לכנס בעוד שבועיים אבל הוא מוסיף עוד 2 מגה למצגת שכבר מאד כבדה גם ככה. נראה לי שאוותר עליו אבל בהחלט אתייחס ל Explore של Freebase.

יום שלישי, 21 באפריל 2009

מה יגידו הנכדים?

חיפשתי היום ציטוט של Tim Berners-Lee להרצאה שלי בכנס Info 2009 בעוד שבועיים. יש המון אתרים שמציעין ציטוטים של מפורסמים לאורך היסטוריה אבל את הציטוט שחיפשתי מצאתי דווקא ב Wiki Quotes שלדעתי הוא הכי מסודר ונעים לעין (כל השאר משלבים המון פרסומות מעצבנות).

בין הציטוטים המיוחסים ל TimBL מצאתי את הציטוט הבא:

"Imagine that everything you are typing is being read by the person you are applying to for your first job. Imagine that it's all going to be seen by your parents and your grandparents and your grandchildren as well".

נקודה למחשבה באמת. הדברים שאני כותב בבלוג זה לא כל כך חשובים ואם אי פעם נכד שלי יראה אותם באיזה ארכיון של הרשת, זה לא יפריע לי ואני מניח שגם לא יפריע לו. אבל יש בלוגרים או בעלי חשבונות Facebook, Twitter וכד' שכותבים המון שטויות. זה לא מפריע להם עכשיו אבל מה הם יגידו לילדים שלהם שיעלו על ה tweets המביכים האלה בעוד כמה שנים.
קראתי כתבה על חברות כח אדם שבודקים את חשבונות ה Facebook או MySpace של מועמדים. לא כולם מתקינים בחשבון שלהם אפליקציות של World Cat יש גם אפליקציות פחות "ראויות" שעלולות לפגוע בסופו של דבר בבעל החשבון.
אחד הבעיות בכלי כמו twitter הוא שמה שאתה כותב מגיע לכל ה followers שלך ולא רק לאלו אליהם התכוונת. אלכסי אמר לי היום, מה קורה אם אני כותב בTwitter על הערב הנחמד שהיה עם החברה. לא כל קוראי ה tweets שלי הוזמנו למסיבה... הסתרתי את זה מהם עד עכשיו אז למה לגלות בצורה כזו בוטה.
צריך לזכור שמה שעולה לרשת, קשה מאד להוריד. מי יראה את זה בעוד 10 או 20 שנה?




יום ראשון, 19 באפריל 2009

World Digital Library


לאחרונה הושק האתר החדש של הספריה הדיגיטלית העולמית. השם המופצץ הזה לא ממש עומד בציפיות.

היוזמה כמובן מאד ברוכה. מי שעומד מאחורי הפרויקט הוא האו"ם (UNESCO) שהרימה את הכפפה שזרק מנהל ספרית הקונגרס ג'יימס בילינגטון ב 2005. לי נראה שהם שחררו את האתר לעולם עוד לפני שסיימו את מלאכת האיסוף.
מבחינה ויזואלית האתר נראה מושקע ומעודכן אבל מבחינת התוכן ניכרת מאד החוסר. אתר שמתיימר להיות הספריה האוניברסלית לא יכול להרשות לעצמו להציג בקושי 1000 פריטים.
הרעיון הוא לאסוף פריטים ישנים מספריות ומוזאונים מרחבי העולם, ולהעביר אותם בצורה דיגיטלית לאתר. מדובר על ספרים עתיקים, מפות, סרטונים וכד' מקוטלגים וממוינים לפי דיואי.

המשתתפים הם ספריות ומוזאונים המעבירים את התכנים שלהם למנהלי האתר. הנציג הישראלי הוא הספריה הלאומית.

החסרון הרציני הוא שיטת החיפוש. האתר בנוי בצורה המעודדת דפדוף (browsing) ולא חיפוש. אין חיפוש מתקדם, דבר שמאד חשוב בסוג כזה של אתר. מי שמתעסק עם סוגי חומרים אלה הם בד"כ חוקרים ואקדמיים (מי עוד מתעניין במפות עתיקות של אירופה או ספר תהילים מלפני 500 שנה). חוקר בד"כ מחפש פריט ספציפי ואם אין לו אפשרות לחפש לפי שדות ספציפיים כמו מספר המיון או האוסף, אין לו דרך להגיע ליעדו. בינתיים מכיוון שהאוסף כל כך קטן אפשר לעבור על כל הפריטים במספר דקות ולא צריך שדות חיפוש מתקדמים אבל זה כמובן גישה לא רצינית.

אני מקווה שספריות ומוזיאונים ישתפו יותר פעולה ויאפשרו גישה פתוחה יותר לאוצרותיהם.

פרויקט כזה הוא חשוב אך מנהלי האתר לא יכולים לעבוד ללא עזרה.

בהצלחה.



Real Time Web Analytics