יום חמישי, 15 במרץ 2012

חיפוש "חדש" בגוגל. מה חדש?

Image representing Google as depicted in Crunc...Image via CrunchBase
החדשות הגדולות לכאורה היום במדורי הטכנולוגיה הם הידיעה על החיפוש הסמנטי החדש של Google שאמור להיכנס לשימוש בחודשים האחרונים. מקור הידיעה היא לא אחת מאתרי הטכנולוגיה הפופולריים כמו  Mashable, Techcrunch ודומיהם אלא אתר ה Wall Street Journal.

בארץ קצת התלהבו מזה וכולם מתייחסים לכתבה.

חיפוש סמנטי זה לא דבר חדש. עובדים על זה כבר המון זמן. 
את תחום הרשת הסמנטית חוקרים ומפתחים כבר יותר מעשור. ברור היה לכולם שכל העבודה הקשה נועדה בין היתר ואולי בעיקר כדי לאפשר חיפוש מידע יעיל יותר ברשת. מנועי החיפוש ובראשם Google נכנסו לשוק הזה לפני כמה שנים והם מנצלים טכנולוגיות סמנטיות כבר היום.
הרעיון הוא שמנוע החיפוש "יבין" את מה שאנחנו רוצים ויוכל לתת לנו לינקים לאתרים רלוונטיים, וזאת למרות שהוא מתעלם ממילת המפתח (הלא מוצלחת שלנו).
בדרך כלל מנוע חיפוש מחפש מילים. אבל חיפשו למשל את צמד המילים social network. מעבר לתוצאות הצפויות כמו קישור לסרט וההגדרה של ויקיפדיה, אנו מקבלים גם לינק לפייסבוק ול My Space. זה קורה כי גוגל יודע שאלו הם אתרי רשתות חברתיות ויתכן שזה מה שאנו מחפשים. הוא לא התייחס במקרה זה לצמד המילים אלא למשמעות שלהם. קיבלנו תוצאה נכונה ולא אתר אינטרנט שפשוט מופיעים בה שני המילים. הקלידו את המילה tweet ומיד תופנו לאתר של Twitter למרות שהמילה tweet לא מופיע שם.

בעתיד יהיה אפשר להקליד מילים כמו "ירוק בחוץ ואדום בפנים" ולהגיע לאתרים על אבטיחים. מנוע החיפוש הסמנטי פשוט יודע את נתוני הצבע של הפרי המתוק הזה ויבין למה אנו מתכוונים. זה קורה כי כל המידע מובנה כבסיס נתונים. על אבטיח יהיה מידע:
צבע בחוץ - ירוק
צבע בפנים- אדום
משקל -1ק"ג-5ק"ג
אקלים - ...
מידע תזונתי- ...
וכו'.
אם כל המידע הזה אפשר לבנות שאלות מתוחכמות ולקבל מידע מדויק.

כך עובדים הקטלוגים שלנו בספריות. אני מחפש "מחבר: ש"י עגנון", ומקבל כתוצאה רשימה של ספרים שהוא כתב. אני לא מקבל רשימה של ש"י עגנון" אלא רשימה של ספרים כי הגדרתי אותו כמחבר של X ואני רוצה את X.

בכתבה הדגישו שתי נקודות: קבלת נתונים לגבי נושא השאילתא, ומענה על שאלות.

בעבר היה אפשר להקליד ב Google שם של סרט, ומיד היה מתקבל לא רק לינקים לאתרים אלא פירוט של מידע לגביו ומקומות ושעות ההקרנה. כנ"ל לגבי מידע ביבליוגרפי על ספרים ומסעדות. הנתונים הללו כבר קיימים באתרים, מה שגוגל עשה זה להבין למה המספרים האלה מתייחסים (שעה, כתובת וכו') ולהציג אותם במקום ברור ברשימת התוצאות. משום מה אפשרות זאת לא כל כך קיימת היום.
ב Yahoo זה גם עובד. הקלדתי את המילים War Horse ובמקום לקבל קישורים לאתרים, קיבלתי המון מידע מתוך האתר הרלוונטי.


הדוגמא המובאת בכתבה ב WSJ היא בעצם אותו דבר. נכתוב מילה כמו שם של מקום ובמקום קישורים לאתרים, נקבל מידע.

לגבי מענה על שאלות על זה כבר דיברנו בעבר. יש הרבה אתרים טובים כמו cha cha או Ask וחלקם פועלים על טכנולוגיה סמנטית כמו True knowledge.

השיפור בתוצאות החיפוש קיים כבר כיום אבל לא תמיד אנו שמים לב אליו. התרגלנו למידע איכותי יותר.
לא יהיה לגוגל מנוע חיפוש חדש-סמנטי. פשוט מאחורי הקלעים הוא יעבוד עם טכנולוגיות סמנטיות היכולות להניב תוצאות טובות יותר. המעבר יהיה הדרגתי ואולי לא נרגיש בו בכלל.

המצב כבר יותר טוב ממה שהיה לפני חמש או עשר שנים וזה למרות שיש הרבה יותר דפי רשת. אולי בחודשים הקרובים תוצאות החיפוש ישתפרו עוד יותר.

הנה כתבה מצוינת של דני סליבן מ Search Engine land שגם הגיב היום לכתבה ב WSJ.
בסוף, עמית סינגהל שראוין בכתבה, הגיב לדברים הקצת מלהיבים מדי של ה WSJ גם כן.




Enhanced by Zemanta

2 comments:

דורה אמר/ה...

מרתק. גוגל היא באמת חברה מדהימה שמטרתה לשרת את הציבור ולתת את השירות הטוב ביותר. חיפשתי ספרטקוס, מתוך כוונה לסדרות בטלוויזיה, ואכן קיבלתי קישור.

Morya Melamed אמר/ה...

מעניין מאוד. אבל כאן נשאלת השאלה עד כמה האלגוריתמים של גוגל יוכלו לעמוד באתגר הסמנטי. וגם איך הדבר ישפיע על העוסקים בקידום בגוגל

Real Time Web Analytics