گراف دانش یا Knowledge Graph چیست و چگونه کار می‌کند؟

🎉«داستان هم‌مسیری» سال 1400 تریبون منتشر شد🎉

Knowledge Graph یا گراف دانش گوگل چیست؟

با گراف دانش گوگل و نحوه عملکرد آن آشنا شوید

اگر می‌خواهید به گوگل در درک محتوای خود کمک کنید و کاری کنید تا این موتور جستجو بتواند محتوای موجود در سایت شما را با نگاهی مشابه انسان (و نه ماشین!) بررسی کند، باید نحوه تأثیرگذاری بر موضوعات در گراف دانش را درک کنید.

گراف دانش می‌تواند به موتورهای جستجو مانند گوگل کمک کند تا از داده‌های ساختار یافته در جهت درک موضوعات مختلف استفاده کند.

داده‌های معنایی و نشانه‌گذاری به نوبه خود به پیوند مفاهیم و ایده‌ها کمک کرده و تبدیل ‌آن‌ها را به داده‌های ساختار یافته برای پر کردن گراف دانش گوگل آسان‎تر می‌کنند.

گراف دانش گوگل چیست؟

دایره‌المعارف‌های قدیمی را یادتان می‌آید؟ کتاب‌هایی که درباره هر موضوعی یک اطلاعات کلی به ما می‎داد. گراف دانش گوگل هم یک دایره‌المعارف مجازی بر مبنای داده‌‌های واقعی است که گوگل برای تولید عناصر خاصی از نتایج جستجو به آن مراجعه می‎‌کند و هدف اصلی آن، ارتقای کیفیت نتایج است. در واقع گوگل با استفاده از گراف دانش سعی می‌کند در کوتاه‌ترین زمان، اطلاعات اولیه یک موضوع را به شما نشان بدهد.

بیایید طور دیگری نگاه کنیم و گراف دانش را به عنوان نقطه تلاقی بین یک دایره‌المعارف و یک پایگاه داده در نظر بگیریم. هر مقاله توسط توسعه‏‌دهندگان «Entity (موجودیت)» یا « Topic(موضوع)» در مقاله‏‌های مربوط به مشتری گوگل، نامیده می‌شود.

یک موضوع می‌تواند درباره هر چیزی باشد و مانند اکثر پایگاه‌های داده‌، دارای یک شناسه منحصر به فرد است که گاهی اوقات می‌توانید آن را در آدرس‌های گوگل یا همان URLها مشاهده کنید. چیزی شبیه به [kgmid =/g/11f0vfyswk & hl]‌، اگرچه نام پارامتر «kgmid» بسته به نوع موضوع می‌تواند تغییر کند.

معمولا چیزهای متعددی در مورد یک موضوع وجود دارد:

  • یک نام یا لیبل (مانند «الویس پریسلی»).
  • یک یا چند تایپ (مانند «شخص»).
  • یک دیسکریبشن یا توضیح (در این مثال «خواننده»).
  • لیستی از URL‌های تصویری (در اغلب موارد با رعایت کپی رایت).
  • توضیحات مفصل (معمولا بخشی از متن به همراه آدرس اینترنتی منبع).

با این حال‌، گوگل می‌گوید در حالی که اطلاعات موجود در لیست فوق ممکن است مستقیما در API جستجوی ‌آن‌ها موجود باشد‌، ‌آن‌ها این داده‌ها را به شکل قابل توجهی به صورت داخلی افزایش می‌دهند.

بنابراین موضوع در این مورد خاص‌، ممکن است شامل تاریخ تولد و مرگ الویس نیز باشد.

شاید بتوان این را هم گفت او با پریسیلا پریسلی ازدواج کرده بود.

آثار هنری او ممکن است شامل «Hound Dog» باشد.

این لیست می‌تواند همین‌طور ادامه داشته باشد و کامل‌تر شود.

می بینید که این مقاله تفاوت چندانی با مقاله دایره‌المعارف ندارد‌، اما چون همه حقایق در زمینه‌هایی مانند «با …. ازدواج کرده»‌، برای ماشین بسیار آسان‎تر می‌شود که نقاط را بین موضوعات متصل کند.

همچنین از ماشین برای بازگرداندن اطلاعات مناسب در زمان مناسب هنگام درخواست شخص (به عنوان مثال) پشتیبانی می‌کند. مثلا:‌ «همسر الویس پریسلی کیست؟»

گراف دانش گوگل چیست؟

نکته مهم در مورد ابهام‌زدایی

گراف‌های دانش زیادی در جهان وجود دارند و گراف دانش گوگل فقط یک از آن‌ها است. موارد دیگر شامل  dbpedia.com‌، Wikidata.org و Inlinks.net هستند.

در واقع‌، هر داده نیمه ساختار یافته‎‌ای می‌تواند به عنوان گراف دانش توصیف شود‌، از جمله دائره‌المعارف‌ها یا پایگاه‌های داده‌‌ای مانند IMDB.

مشخص است که گوگل، گراف دانش خود را در ابتدا از مجموعه داده‌های دیگر از جمله ویکی پدیا و دفتر اطلاعات CIA تهیه کرده است .

همچنین یک تصور غلط رایج وجود دارد که پنل دانش گوگل، همان گراف دانش گوگل است. این امر درست نیست‌، اگرچه پنل دانش ممکن است زیر مجموعه ای از داده‌ها را در گراف نشان دهد.

پنل دانش، تجسم مواردی از داده‌هاست که از طریق گراف دانش گوگل به هم متصل شده‏اند‌، اما نمودار دانش گوگل ثبت بصری کمتری درباره موضوعات دارد.

ابهام‌زدایی نهایی در واژه‌شناسی یا ترمینولوژی اتفاق می‌افتد. به‏‌طور کلی، گراف دانش توسط «موجودیت‌ها» توصیف می‌شود‌، اما گوگل در داکیومنت‌های عمومی خود از موجودیت‌ها به عنوان «موضوعات» یاد می‌کند.

این یک کلمه «کاربرپسند» برای استفاده است اما می‌تواند تشخیص اینکه گوگل به طور خاص به موجودیت‌ها اشاره می‌کند را دشوار کند.

به‌طور کلی به هر موجودیتی یک نوع موضوع داده می‌شود که ممکن است یک شخص؛ سازمان؛ رویداد؛ مکان یا کشور باشد.

اگر هیچ یک از این موارد نباشد‌، معمولا به سادگی می‌توان آن را به عنوان «شی» تگ‌گذاری کرد، اگرچه ممکن است انواع موجودیت‌ها توسط گوگل همچنان توسعه یابند.

API پردازش زبان طبیعی گوگل این سرنخ را به ما می‌دهد که این موتور جستجو در حال استفاده از طبقه‌بندی‌های موضوعی است مثل: «کار هنری» و «کالای مصرفی».

درست است که گراف دانش روز به روز در حال توسعه و تکامل است، اما به نظر می‌رسد در حال حاضر برای طبقه‌‎بندی صحیح موجودیت‌ها بسیار ضعیف عمل می‌کند.

علاوه بر این‌، تحقیقات اولیه‌ای که انجام شده، نشان می‌دهد که کمتر از ۲۰ درصد موجودیت‌ها، موجودیت‌هایی هستند که در الگوریتم پردازش زبان طبیعی خود گوگل‌ شناخته می‌شوند.

گراف دانش روز به روز در حال توسعه و تکامل است

برخی از مزایای گراف دانش (برای گوگل)

با سازماندهی اطلاعات جهان بر اساس موضوع‌، به جای کرالینگ و ایندکس کردن ساده صفحات وب و وب‌سایت‌ها‌، یک موتور جستجو می‌تواند از مزایای متعددی بهره‌مند شود. این مزایا شامل مقیاس‌، تنوع‌، یکپارچگی اطلاعات و سرعت است.

مزیت مقیاس‌بندی

تعداد صفحات وب، موضوعی است که به شدت مورد بحث است و در حالی که بسیاری معتقدند تعداد ‌آن‌ها بی‌شمار است‌، احتمالا تریلیون‌ها صفحه در فضای اینترنت داریم که هر روز با سرعت زیادی گسترش می‌یابند.

در مقابل‌، تعداد موضوعاتی که بشر قادر به درک آن‌هاست بسیار کمتر است (شاید در حدود صدها میلیارد) و با سرعت بسیار کمتری در حال رشد است.

این بدان معناست که تکرار بی‌رویه‌ای از ایده‌ها در محتوای موجود در وب وجود دارد. با ذخیره اطلاعات مربوط به یک موضوع به صورت نیمه ساختار یافته‌، اطلاعات موجود در اینترنت، فضای بسیار کمتری را اشغال می‌کند و تکرار کمتری هم خواهد داشت.

مزیت منابع داده متنوع

ذخیره اطلاعات در مورد یک موضوع به گوگل اجازه می‌دهد تا به جای ارسال کاربر به یک صفحه وب‌، از منابع داده متعددی استفاده کند. این بدان معناست که گوگل می‌تواند حقایق مهم در مورد یک موضوع را گردآوری کرده و ‌آن‌ها را به شیوه مناسب‌تری برای کاربر نمایش دهد.

علاوه بر این‌، اطلاعات مربوط به یک موضوع از نظر تئوری می‌تواند از منابع مختلفی فراتر از اینترنت گرفته شود.

مزیت انسجام اطلاعات

در حالی که گراف دانش گوگل هنوز می‌تواند حاوی اطلاعات غلط و خطاهایی باشد که ممکن است به متخصصان سئو یا افرادی با نیت‌های بد، امکان سوءاستفاده بدهد. این رویکرد این مزیت را دارد که حداقل «یک نقطه مشخص حقیقت‌یابی» در اختیار گوگل قرار می‌دهد، حداقل برای موضوعاتی که بخث‌برانگیز نیستند.

ممکن است لازم باشد یک حقیقت تازه در مورد موضوعی مشخص از یک آستانه کیفی عبور کند تا به گراف دانش گوگل اضافه شود، اما بعید است که این آستانه‌ها توسط گوگل به‌طور آشکار مورد بحث قرار گیرد.

از جنبه منفی که به این ماجرا نگاه کنیم‌، تکیه بر یک نقطه مشخص حقیقت‌یابی می‌تواند تنوع اطلاعات را کاهش دهد و اگر منابع داده‌ای خودشان جانبدارانه باشند‌، مطلب استخراج شده نیز مستعد سوگیری می‌شود.

مزیت بازیابی اطلاعات (سرعت)

با سازماندهی اطلاعات بر اساس موضوع‌، بازیابی اطلاعات بسیار سریع‌تر می‌شود، هم برای گوگل و هم برای کاربری که به دنبال سوزن در انبار کاه است.

چگونه کار می‌کند: جایی که می‌بینید از گراف دانش گوگل استفاده شده است

ما پیش‌تر توضیح دادیم که پنل با گراف دانش یکسان نیست‌، این موضوع همچنان مشخص‌ترین دلیل استفاده از گراف دانش برای اکثر متخصصان سئو است.

با این حال‌، بیشترین استفاده از گراف دانش برای بسیاری از کاربران تلفن‌های هوشمند اندروید در ویژگی «گوگل دیسکاور» آ‌ن‌هاست که هر روز در home screen موبایل‌شان قرار می‌گیرد.

گوگل می‌تواند از اطلاعات مربوط به رفتار شما برای درک موضوعاتی که برای‌تان مهم هستند استفاده کند و همچنین می‌تواند موضوعات مرتبط با سابقه را بر اساس سابقه هر کاربر به او نشان بدهد.

موضوعات را می‌توان در گوگل ترندز نیز مشاهده کرد .

از اینجا‌، گوگل همچنین موضوعاتی را که ممکن است به یکدیگر مرتبط باشند‌ نشان می‌دهد‌، اگرچه به نظر می‌رسد این داده‌ها در حال حاضر از جستجوهای دیگر توسط همان کاربران جمع‌آوری شده است‌، که گاهی اوقات می‌تواند منجر به لیست موضوعات مرتبط غیر‌منتظره‌ای بشود.

به کمک نالج گراف موضوعات را می‌توان در گوگل ترندز نیز مشاهده کرد

گوگل همچنین API جستجوی گراف دانش را همان‌طور که در بالا نشان داده شده، ارائه می‌دهد و در خروجی API NLP خود موجودیت‌ها را مشخص می‌کند.

جستجوی گوگل: و همچنین پنل دانش، وقتی سوالی را در جستجوی گوگل تایپ می‌کنید که می‌تواند با استفاده از گراف دانش به آن پاسخ دهد‌، با یک نمایش دقیق و ارزشمند در SERPS خود مواجه می‌شوید. این اتفاق اغلب به ضرر نتایج اصلی جستجو است‌ و کلیک روی لینک وب‌سایت‌ها تا حد زیادی پایین می‌آورد. در واقع وقتی شما کلمه‌ای را در گوگل جستجو می‌کند، احتمال زیادی دارد که جواب‌تان را از طریق گراف دانش پیدا کنید، بدون اینکه لازم باشد وارد هیچ سایتی بشوید.

این پاسخ‌ها همچنین در قالبی هستند که گوگل می‌تواند در جستجوی صوتی از ‌آن‌ها استفاده کند.

همچنین موجودیت‌ها در جستجوهای تصویری، بسیار قابل مشاهده هستند‌. اغلب تصاویر را در اطراف شخص یا مکان مشخصی گروه‌بندی می‌کنند. این یک مثال عالی است برای اینکه بفهمیم چگونه می‌توان از گراف دانش برای ذخیره منابع دیگر داده‌ها به غیر از صفحات وب استفاده کرد.

اشتراک‌گذاری‌:

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

-

با وارد کردن ایمیل خود از خبرنامه های به روز تریبونی با خبر شوید: