יום חמישי, 31 בדצמבר 2009

שנת 2009 בטוויטר

סוף השנה האזרחית הגיע ואיתה תוצאות ה Zeitgeist של Twitter כפי שפורסם באתר http://www.whatthetrend.com/
אתר זה עוקב אחרי טרנדים ב Twitter על פי נושאים (המסומנים ב #) או מילים בהם נעשה הכי הרבה שימוש.
בדרך כלל בדף הכניסה ל Twitter אפשר לראות דוגמאות של "הנושאים החמים" הרגע, היום והשבוע. באתר whatthetrend יש יותר פירוט וכן הסבר ליד כל טרנד המסביר למה הכוונה. המשתמשים יכולים בעצמם להוסיף הסברים.

בכל מקרה הם פרסמו את הטרנדים הפופולריים ביותר השנה. לא היו הרבה הפתעות. הנה מספר דוגמאות:

#iranelection
michael Jackson
Google Wave
Swine Flue
Susan Boyle

יום רביעי, 30 בדצמבר 2009

כנס משתמשי Ex Libris בישראל


אתמול נערך הכנס השנתי של מאל"י (משתמשי אקס ליבריס בישראל) באוניברסיטה העברית בירושלים.
ניצלתי את ההזדמנות ולפני תחילת הכנס קפצתי לספריה הלאומית. במשך השנה מצטברים אצלי מספר ספרים/מאמרים שאני רוצה לראות שיש להם שם ושאי אפשר להזמין בהשאלה בין ספריתית. לאחר שעה של קריאה הבנתי שאני מאחר ומיהרתי לקצה השני של הקמפוס לכנס. איחרתי.

אחת ממטרות הכנס היה לבחור מועמדים לועדת ההיגוי החדשה. היו מספר מועמדים שהיו מקובלים על כולם ולא היה צורך בסוף לערוך בחירות. בהצלחה לועד החדש.

הבוקר הוקדש בעיקר ל Ex Libris. ראשון דיבר המנכ"ל והנשיא מתי שם טוב. הוא דיבר על מצב החברה ועל כך שהשנה למרות המשבר הכלכלי היו הרבה הצלחות בשיווק התוכנות. יש אלפי ספריות ברחבי העולם המשתמשות במוצריהם, ביניהם האוניברסיטאות המובילות ו 39 ספריות לאומיות. מכובד מאד. הוא הזכיר את המוצרים החדשים כמו bX ו URM והזכיר גם את Primo Central. בינתיים ספריית אוניברסיטת חיפה היא היחידה שרכשה את Primo אבל יש עוד מספר ספרייות שמתכננות לרכוש את התוכנה. לצערי, בינתיים הספריה שלנו לא ביניהם. בסוף חברת אקס ליבריס העניקה לפרופסור אלחנן אדלר מתנה (כנראה חנוכיה מכסף) על מפעל חייו.

לאחריו דיברה כרמית מרקוס מנהלת השיווק של מוצר חדש בשם URM. תוכנה זו אמורה להחליף עם הזמן את "אלף". זוהי מערכת ניהול ספריה הכוללת את כל הכלים השונים של הספריה. בשונה מאלף, היא תעבוד בענן (cloud computing או SaaS) זאת אומרת ללא התקנות אלא התוכנה והטיפול בה יעשה אצל אקס ליבריס.

לאחר ארוחת הצהריים דיבר פרופסור אלחנן אדלר שאני מניח לימד קוראים רבים של בלוג זה. הכנס הוקדש לכבודו של אלחנן שפורש בימים אלו. נושא ההרצאה היה מיחשוב הספריה בארץ. הוא סיקר את הנושא משנות ה-70 שאז התחילו להשתמש במחשבים לראשונה בספריה, סוגי המחשבים, שיטות הקיטלוג והכנת הכרטיסיות והקמתם של ה ULS, מפתח חיפה וה ULI. הוא הזכיר שבהתחלה הספרנים בישראל לא רצו להשתמש ב MARC ונוצרו כל מיני שיטות קיטלוג יצירתיות ומקוריות על ידי ספרנים שונים, דבר שגורם בעיות עד היום. אלחנן הזכיר את תוכנת "אלף" שהתחילה כפרויקט של האוניברסיטה העברית ותיאר את הגירסאות השונות עד ל Aleph 500 של ימינו.

יהודית בר אילן ראש המחלקה שך לימודי מידע באוניברסיטת בר אילן, דיברה על השינויים שעברו על כתבי העת במשך השנים. היא הזכירה את Philosophical Transactions שהתחיל להפרסם ב 1665 וקיים עד היום. היא דיברה על DOI שמעניק זיהוי מתמיד וקבוע לפריטי מידע באינטרנט. כלי שדוחף את הנושא הזה קדימה הוא CrossRef  שמקשר ומפנה בין מאמרים. זה בולט מאד בביבליוגרפיות, ששם רואים הפניות למאמרים ולידם את ה DOI שמקשר לאותם מאמרים. יהודית דיברה על מלמ"ד שנוסדה ב 1997 על ידי ועד משתמשי "אלף" ובראשה עומד אלחנן. היא צחקה שאי אפשר היום למצוא דפי ווב ישנים של מלמ"ד ב Internet Archive. בשנת 1998 היו למלמ"ד רק 3 מאגרי מידע: ABI, WOS, Academic Press. בשנת 2002 היו כבר קרוב ל-50 מאגרים. יהודית דיברה גם על Google Scholar ועל הבעיות הרבות ואי הדיוקים שלו. היא סיימה עם התיחסות לנושא של כתבי עת ב open access על יתרונותיהם וחסרונותיהם.

יוסף בראנס מאוניברסיטת חיפה, כאחד שעבד שנים רבות עם אלחנן דיבר עליו ועל העבודה היומיומית במחשוב הספריה בחיפה . הוא מצא כל מיני "כלים" ישנים בהם השתמשו אז (זה היה לפני תקופתי כך שלא אוכל לפרט) והראה אותם בהרצאתו. הוא העניק לאלחנן פטיש בו אלחנן השתמש בישבות צוות כדי להשתיק את המשתתפים.

בסוף דיברה אורלי סימון שעבדה עם אלחנן שנים רבות בספריה הלאומית. היא תיארה את דמותו של אלחנן ואת מומחיותו בתחום מיחשוב הספריה, דיגיטציה וקיטלוג.

הערה נכונה העיר יוסי טיסונה יושב ראש מאל"י היוצא. בהרצאותיהם של אלחנן ויוסף על הטכנולוגיות הישנות בספריה כל הקהל צחק ונהנה. יוסי אמר שבעוד 20 שנה יסתכלו עלינו ועל התקופה שלנו והספרנים הצעירים של העתיד יצחקו גם כן. נקודה נכונה זו מביאה אותי לחשוב מה יגידו קוראים שימצאו את הבלוג שלי באיזה ארכיון אינטרנט בעתיד.

אם מישהו קורא שורות אלו בשנת 2030+ וצוחק, תזכרו: 
nanos gigantum humeris insidentes

יום שני, 28 בדצמבר 2009

עוד חשבון בטוויטר


פתחתי חשבון נוסף בטויטר. לחשבון זה אמורים להגיע כל הפוסטים מבלוג זה. שם החשבון הוא @72elders
זה נכון שהם גם כך מגיעים לחשבון הרגיל שלי @danieljl אבל לא הרבה עוקבים אחרי. אני מתכנן להפיץ את החשבון החדש בצורה יותר רצינית. החשבון הישן עדיין ישאר כחשבון האישי והעיקרי שלי.

יום ראשון, 27 בדצמבר 2009

התאמה אישית של תוצאות חיפוש עם Surf Canyon

יש המון כלים שמתיימרים לעשות התאמה אישית לצרכי החיפושים שלנו ברשת.
אישית אני לא אוהב אותם במיוחד. "התאמה אישית" זהו מושג בעייתי. הצרכים שלי לפעמים משתנתים, אולי אני מחפש מידע עבור מישהו אחר, אולי אני עובד על שני פרויקטים דומים אבל שונים מנקודת המבט....

בכל מקרה מצאתי כלי מעניין שמפעיל התאמה אישית תוך כדי חיפוש בצורה מעניינת.
קוראים לזה Surf Canyon וזה תוסף לדפדפן Explorer ו Firefox.
כשאני מקבל את דף תוצאות החיפוש (SERP) אני יכול לסמן את התוצאה שנראית לי ביותר. בעזרת Surf Canyon" אקבל מיד תוצאות דומות לתוצאה שסימנתי. התוצאות הרלוונטיות נדלות מתוך יתר רשימת התוצאות.
זה אומר שגם אם יש הפניה טובה בדף העשירי של תוצאות החיפוש (לשם בד"כ אף אחד לא מגיע), אקבל אותו על הדף הראשון בהתאם לתוצאה מוצלחת שאסמן.

נחמד אבל לא נראה לי שאשתמש בזה.


יום חמישי, 24 בדצמבר 2009

התוכנית של סדנת SKOS

שלשום הודענו לגבי סדנא בנושא SKOS שמארגנת איגוד האינטרנט הישראלי ועמותת מקש. הסדנא תתקיים ב-11 בינואר 2010 במוזיאון ארף ישראל ברמת אביב.

הסדנה מיועדת לעוסקים או המתכוונים לעסוק בתחום הספרנות, רשמות במוזיאונים, ארכיונים ויתר מדעי המידע



באתר האיגוד פורסמה תכנית הסדנא.

יום שלישי, 22 בדצמבר 2009

לראשונה FireFox עוקף את Internet Explorer



לראשונה בהיסטוריה של מלחמת הדפדפנים, עברה Firefox (בגירסה 3.5 החדשה) את אחוז המשתמשים בדפדפן הפופולרי של מיקרוסופט -  Internet Explorer.
אחוז המשתמשים ב Firefox 3.5 הוא 22%. זה לא נשמע הרבה אבל זה עדין הגירסה הכי פופולרית היום מבין כל הגירסאות השונות של הדפדפנים. IE בגירסה 8 זוכה לפופולריות של 20% וגירסה 7 לקצת יותר. אם ניקח את כל הגירסאות השונות של IE ביחד נגיע ל 55%. אבל אם נבדוק לפי גירסאות, FF 3.5 היא המנצחת.

המידע הגיע מבדיקה של StatCounter



Reblog this post [with Zemanta]

יום שני, 21 בדצמבר 2009

סדנת SKOS בישראל



השנה (2009) התעסקנו הרבה ביישומים של הרשת הסמנטית -Semantic Web. זה היה גם נושא ההרצאה שלי בכנס טלדן 2009.

לרשת הסמנטית ולמקצוע הספרנות הרבה במשותף. למרות שהמטרה איננה בדיוק זהה, יש לשניהם משימה לקטלג פריטי מידע בצורה מפורטת על פי כללים מוגדרים (ומתפתחים). בספריות משתמשים בשיטות קיטלוג כמו MARC או DC, והרשת הסמטית משתמשת ב RDF.

SKOS הוא ראשי התיבות של Simple Knowledge Organization System, שיטה לארגון מידע המבוססת על RDF שהיא הטכנולוגיה העיקרית של הרשת הסמנטית. SKOS מאפשר בניית אוצר מילים מובנה ומבוקר. ניתן להציג טזאוריסים, כותרות נושאים, טקסונומיות ופולקסונומיות בעזרת SKOS.זה יאפשר בסופו של דבר הוספה ואיחוד של קטלוגים לתוך סביבת הרשת הסמנטית.
 ראיתי בשנים האחרונות הרבה מאמרים בכתבי עת בספרנות בנושא שילוב הספריה עם טכנולוגיות של הרשת הסמנטית. ספריות בעולם התחילו כבר להשתמש ב SKOS כשספריית הקונגרס היא אחת המובילות בתחום.

בעוד שבועיים ב 11.10.2010 איגוד האינטרנט הישראלי, יערוך סדנא בנושא:


ההשתתפות אינה כרוכה בתשלום אבל צריך להירשם מראש. קישור לטופס ההרשמה.

אני מקווה מאד להגיע.

הנה חלק  מההזמנה הרשמית:

הסדנא תתקיים ב-11 בינואר 2010 במוזיאון ארץ ישראל ברמת אביב, תל אביב.
הסדנא מאורגנת במשותף על ידי מקש, המסגרת שמרכזת את השתתפות ישראל במיזם ATHENA ומשרד ה- W3C בישראל המופעל על ידי איגוד האינטרנט הישראלי.
 הסדנא מיועדת לאנשי מדעי המידע - ספרנים, רשמים במוזיאונים, ארכיונאים – מספריות מוזיאונים וארכיונים מישראל ולאנשי המחשב שפועלים יחד איתם.

המטרה המרכזית של הסדנא היא הכרות עם ייצוגם של מילונים מבוקרים (דוגמת תזאורוס וטקסונומיות) באמצעות SKOS Simple Knowledge Organization System. כמו כן תתקיים היכרות בלתי אמצעית עם המערכות החדשות של מטה-דטה לתיאור עצמי תרבות (Cultural Objects). הסדנא תתקיים בשפה האנגלית.
 Regine Stein אחראית על טכנולוגיות המידע במרכז התיעוד של גרמניה לתולדות האומנות. במסגרת זו היא הייתה שותפה לפיתוח ויישום של הסטנדרטים CDWA , CDWA Light ו- LIDO . מזה מספר שנים מובילה Regine את יישום ה-SKOS בקנה מידה רחב לאינטגרציה של מערכות המידע של המוזיאונים והספריות בגרמניה.


יום ראשון, 20 בדצמבר 2009

צילום במקום חיפוש בעזרת Google Goggles

לפני כשבועיים Google השיקה שירות חדש בשם Google Goggles. זהו נסיונה של חברת Google להיכנס לתחום במדעי המחשב הקרוי Computer Vision. טכנולוגיות מתקדמות מאפשרות למחשב לחלוץ נתונים מתוך גרפיקה.
המוצר החדש של Google מאפשר צילום בעזרת הטלפון הסלולרי ואז שליחת התמונה ישר למנוע החיפוש של Google. אם אצלם תמונה של הכותל למשל, Goggles ישלח את התמונה לחיפוש ואקבל רשימת תוצאות חיפוש ב Google כאילו שחיפשתי במנוע החיפוש עצמו.
אפשר גם לצלם כריכה של ספר, כרטיסי ביקור, חפצי אמנות וכד'. Google  יחפש עבורי את המידע באינטרנט.

הנה סרט ההדגמה:


ובאותו ענין. פרויקט מדהים שפותח על ידי ארבעה חוקרים סיניים וישראלי, משלב טכנולוגיות זיהוי תמונה עם כלי עיבוד תמונה.
לפרויקט קוראים Photo Sketch.
אני מצייר תמונה של רכב למשל וכותב לידו מאזדה. ליד הרכב אני מצייר ילדים משחקים בכדור וכותב גם את זה. ברקע אני כותב שמים כחולים. Photo Sketch מחפש תמונות רלוונטיות, מעבד אותם ומשלב אותם יחד לתמונה שלמה.
אפשר לקרוא מחקר בנושא אבל נראה לי שעדיף לצפות בהדגמה:



Sketch2Photo: Internet Image Montage from Tao Chen on Vimeo.

יום שלישי, 15 בדצמבר 2009

החיפושים המדוברים ביותר ב Twitter

לקראת סוף השנה, Twitter חשף את הנושאים המדוברים ביותר לשנת 2009. לא היו הפתעות כמובן. הנושאים שהרעישו את העולם בלטו במיוחד ב Twitter. כמובן שבמקום נושאים פוליטיים ומדיניים הדגש היה יותר על דמויות מפוסמות (לטוב או לרע), או דברים קטנים מחיי היום יום. בדומה לחדשות ב Digg, לא כל מה שמשודר במהדורת החדשות באמת מעניין את הציבור.

הרשימה נחלקה לקטגוריות כמו חדשות, אנשים, סרטים, ספורט וטכנולוגיה.
 בין הנושאים המדוברים היו:
Windows 7, Michael Jackson, Iran election, Google Wave, Paranormal Activity, Susan Boyle, Swine Flu, Tiger  Woods



ותודה לתמי נויטל על ה Tweet שלה עם קישור לכתבה בנושא הזה.

יום שני, 14 בדצמבר 2009

מי צריך חיפוש בזמן אמת


בשבוע שעבר נערך כנס Le Web השנתי בפריס. השתדלתי לצפות בחלק מהשידור (שודר בשידור חי) ולעקוב אחרי המשתתפים בTwitter. הנושא החם כמובן היה ה real time web. כולם הזכירו את העדכון המהיר (שלא לומר מידי) של מידע באמצעות כלים שונים עם דגש על Twitter. זה היה בולט במיוחד בקרב המשתתפים עצמם. תוך כדי ההרצאות הגיבו המשתתפים לדברים שנאמרו בעזרת הודעות Twitter לחשבון מיוחד שנבנה לקראת הכנס. העדכונים נוספו כל כמה שניות. לפעמים תוך דקה אחת התווספו יותר ממאה תגובות (Tweets) למה שנאמר באולם ההרצאות.

אחד הפאנלים המעניינים נוהל על ידי Andrew Keen מחבר הספר Cult of the Amateur. הוא כתב בעבר באופן ביקורתי נגד הרשת החברתית וגם בפאנל תפס את מקום ה"מתנגד" או יותר נכון הסקפטי בנושא זה. הוא ראיין כמה מנהלי סטארטאפים בתחום ה real time.

אחד הנושאים שעלה היה Google Trends החדש, עליו כתבנו בפוסט הקודם. המשתתפים לא כל כך הבינו איך תוצאות חיפוש בזמן אמת יתרמו ל Google. הם הסבירו שההצלחה של Google היא באלגוריתם המצוין שמביא תוצאות חיפוש טובות דהיינו התוצאות הכי רלוונטיות לחיפוש. תוצאות בזמן אמת הם בדרך כלל יהיו חסר ערך. אם אחפש למשל מידע על "חנוכה", Google (הרגיל) יכוון אותי לדף ב Wikipedia, אתר משרד החינוך, רשימת שירי חנוכה, הלכות חנוכה, מידע על החג וכו'. לעומת זאת בחיפוש בזמן אמת (ש Google רוצה להציג בדף התוצאות) יופיעו הודעות אישיות מתוך Twitter ו Facebook כמו ברכות של חברים לרגל החג או הזמנה אישית למסיבת חנוכה - לא ממש תוצאות חיפוש מוצלחות.

אחד המשתתפים Tobias Peggsממנהלי מנוע החיפוש בזמן אמת OneRiot הסביר את החשיבות של תוצאות בזמן אמת מבחינה סטטיסטית. הוא הסביר ש 20% מהחיפושים הם חיפושי הכוונה ז"א מישהו רוצה להגיע לאתר מסוים, במקום לכתוב את כל ה URL, הוא פשוט יקליד את שם האתר במנוע חיפוש ויגיע אליו. 40% מהחיפושים הם אחר מידע ממוקד כגון מתכונים, מידע ביוגרפי, ידע כללי, הדרכה מעשית וכו'. יתר 40% מהחיפושים הם אחר דמויות, מוצרים, סרטים וכד'. סוג כזה של חיפוש דורש תוצאות עדכניות. לאחר מותו של דודו טופז המחפשים רצו מידע מידי לגבי ההתאבדות והחקירה, איך זה קרה, איך הגיבו החברים והתקשורת. לא ענין אותם מידע ישן ביוגרפי לגביו. תוצאות חיפוש בזמן אמת יכולים מאד לסייע בסוג כזה של חיפוש.
יש הרבה אמת בדבריו. יש חיפושים שדורשים את התוצאות המיידיות. אבל לדעתי כדאי היה להפריד בין התוצאות המידייות לבין יתר התוצאות בצורה ברורה יותר.
Reblog this post [with Zemanta]

יום רביעי, 9 בדצמבר 2009

Real Time Google


בשעה טובה גם Google עלה על עגלת ה real time web (רשת בזמן אמת) ומציע כלי נסיוני חדש לחיפוש בזמן אמת. כלי זה מצטרף לשחקנים הגדולים בתחום כמו OneRiot, Collecta ועוד. Googe השיקה את השירות החדש השבוע באחד הארועים התקופתיים שלהם בהם הם מכריזים על כלים חדשים.

אמנם Google שיחק קצת עם הרעיון הזה בעבר, דבר שבא לידי ביטוי ב Google Twitter Search. שירות זה מבוסס על Google Custom Search , שירות שכבר קיים כמה שנים בה Google מאפשר להגדיר אתרים ספציפיים בהם הוא יערוך את החיפוש, במקרה זה האתר הוא Twitter.בשירות זה Google שואב את תוצאות חיפוש מתוך Twitter. יש המון מנועי חיפוש ל Twitter ו Google Twitter Search הוא רק אחד מהם.

אבל הכלי החדש Google Trends הוא הרבה יותר מרשים. הוא שואב את המידע גם ממקורות אחרים בנוסף ל Twitter כמו בלוגים, רשתות חברתיות ואתרי חדשות שמתעדכנים לעיתים קרובות. המידע המעודכן מוצג בצורה יפה קרוב לראש תוצאות החיפוש בחלון נע. אפשר לראות כמה דוגמאות תחת הכותרת Hot Topics שכרגע רלוונטיים בעיקר לחדשות בארה"ב.

אפשרות נוספת לעדכונים בזמן אמת בעזרת Google היא על ידי שימוש ב options המופיע בצד שמאל של התוצאות (בגירסה האנגלית). אם לוחצים על updates מקבלים את תוצאות החיפוש מתוך Twitter ו Friendfeed. קצת מתחת ל updates מופיע latest. אם לוחצים על זה מקבלים תוצאות דומות לחיפוש בעזרת Google Trends דהיינו עדכונים מהדקות האחרונות מתוך כל מיני בלוגים ואתרי חדשות.
בעברית זה קצת יותר מוגבל. ב "אפשרויות" (בצד ימין כמובן) אין אפשרות מקבילה ל updates למרות שאפשר לחפש באתרי חדשות או בלוגים. יש רק אפשרות של "בשעה האחרונה" שזה בכלל לא רע.

יהיה מעניין לבדוק את השירותים הללו ברגע שמתרחש איזה אירוע דרמטי וחשוב, אבל אירוע משמח לשם שינוי.




פוסט בנושא בבלוג הרשמי של Google.

יום שישי, 4 בדצמבר 2009

Sentiment Analysis

שלשום התפרסם מאמרון שכתבתי באתר http://www.buzzer.co.il/ בנושא Sentiment Analysis.
מדובר על טכנולוגיות של ניתוח טקסט המצליחות לזהות את תחושת הכותב על פי המילים בהם השתמש.

המאמר

Real Time Web Analytics