الگوریتم MUM گوگل نیازهای شما را می‎فهمد: ۱۰۰۰ برابر قوی‏تر از الگوریتم BERT!

1

درک زبان طبیعی برای موتورهای جستجو، یک کار پیچیده است‌، اما به لطف سرمایه‌‎گذاری مداوم گوگل در زمینه هوش مصنوعی‌، به سطح کاملا جدیدی رسیده است. در I/O سال ۲۰۲۱، گوگل الگوریتم جدیدی را معرفی کرد کهMultitask United Model  یا همان MUM نام گرفت. به گفته گوگل‌، این الگوریتم جدید ۱۰۰۰ برابر قوی‌تر از الگوریتم BERT است که در سال ۲۰۱۹ منتشر شده بود. MUM در آینده وارد محصولات گوگل می‌شود.

MUM: Multitask Model United چیست؟

MUM یک مدل زبانی است که بر اساس همان سیستم ترانسفورماتور BERT ساخته شده که در سال ۲۰۱۹ روی کار آمد. BERT یک مدل زبانی قدرتمند است که در زمان انتشارش، پیشرفت بزرگی را به وجود آورد. با این حال‌، توانایی‌های الگوریتم MUM در حال افزایش است: طبق گفته گوگل‌، این الگوریتم ۱۰۰۰ برابر قوی‏تر از الگوریتم BERT عمل می‌کند.

بخش زیادی از قدرت و توانایی MUM، از این واقعیت ناشی‌ می‌شود که‌ این الگوریتم مولتی تسک است و می‌تواند چند کار را با هم انجام دهد. دیگر نیازی نیست که تسک‌ها یکی پس از دیگری انجام شوند، MUM آمده تا چندین کار همزمان انجام گیرند. این بدان معناست که‌ الگوریتم جدید گوگل می‌تواند متن را بخواند‌، معنا را درک کند‌، دانش عمیقی در مورد موضوع ایجاد کند‌، از ویدئو و صوت برای تقویت و غنی‎‌سازی آن استفاده کند‌، از بیش از ۷۵ زبان استفاده کرده و این یافته‌ها را به محتوای چند لایه ترجمه کند تا به سوالات پیچیده کاربر پاسخ‌ دهد. همه این کارها یک‌باره انجام می‌شوند! شگفت‌انگیز است، نه؟

قدرت الگوریتم MUM چقدر است؟

در I/O سال ۲۰۲۱، پرابهاکار راغوان (یکی از متخصصان گوگل)‌، نحوه کارکرد این الگوریتم را توضیح داد. او از پرسش پیچیده «من کوه قله آدامز را فتح کرده‌ام و اکنون‌ می‌خواهم در پاییز آینده برای کوهنوردی به کوه فوجی بروم، برای آماده سازی باید چه کار کنم؟» برای نشان دادن آنچه الگوریتم MUM‌ می‌تواند انجام دهد استفاده کرد. در یک سشن جستجوی معمولی‌، باید همه جنبه‌های مختلف را خودتان جستجو کنید. هنگامی که همه چیز را در اختیار دارید‌، باید آن را با هم ترکیب کنید تا همه سوالات‌تان پاسخ داده شود.

در حال حاضر‌، MUM اینسایت‏‌های بسیاری از منابع مختلف را در جنبه‌های مختلف جستجو ترکیب‌ می‌کند‌، از اندازه‎‌گیری کوه‌ها تا پیشنهاد لباس بارانی‌ (زیرا پاییز، فصل بارندگی در کوه فوجی است) تا استخراج اطلاعات از منابع ژاپنی، زیرا مطالب بیشتری در مورد این موضوع خاص به آن زبان نوشته شده است.

در جستارهای پیچیده‌‎ای مانند مثال بالا، همه چیز به ترکیب موجودات‌، احساسات و قصد فهمیدن معنای چیزی برمی‌گردد. ماشین‌ها در درک زبان انسان مشکل دارند و الگوریتم‌هایی مانند BERT و MUM تقریبا می‌توانند خودشان را به زبان طبیعی نزدیک کنند.

MUM با پردازش زبان و افزودن ویدئو و تصاویر‌، گامی فراتر‌ می‌برد زیرا می‌تواند چند کار را در یک زمان انجام دهد. این امر امکان ایجاد یک نتیجه ارزشمند را فراهم‌ می‌کند که با ارائه یک بخش کاملا جدید از محتوا، به پرسش پاسخ‌ کاربر می‌دهد. الگوریتم MUM حتی در Google Lens هم گنجانده‌ می‌شود‌، بنابراین‌ می‌توانید دوربین خود را روی کفش‎‌های کوهنوردی خود ببرید و بپرسید آیا این کفش‌ها برای پیاده‌روی تا کوه فوجی مناسب هستند؟

البته‌ هدف نهایی همه این الگوریتم‌‏ها این است که به شما کمک کند تا اطلاعات بیشتری را – به احتمال زیاد در محدوده خود گوگل – با جستجوهای کمتری دریافت کنید. ما شاهد افزایش مداوم نتایج ارزشمند و پاسخ‌های خیلی دقیق بوده‌ایم که هر روز بصری‌‎تر و برجسته‌تر‌ می‌شوند و در کوتاه‌‎ترین زمان در اختیار ما قرار می‌گیرند. بسیاری از این تحولات، چه در داخل و چه خارج از جستجو‌، تصویر گوگل را به نوعی ترسیم‌ می‌کند که‌ می‌خواهد پاسخ بیشتر سوالات شما را بدهد.


در بلاگ تریبون بخوانید: لیست کامل الگوریتم های گوگل


در مسیر جستجوی بصری‌، محاوره‌ای و کاملا مبتنی بر هوش مصنوعی

گوگل خیلی بی‌سروصدا و آرام در حال تبدیل شدن به یک موتور جستجوی کاملا مجهز به هوش مصنوعی است. حتی موتور جستجو هم کلمه درستی برای آن نیست‌، زیرا بیشتر شبیه یک دستگاه ارائه‌دهنده دانش است.

به طور روز افزون، گوگل ایده جستجو را برای ورود اطلاعات زیادی از منابع دیگر – میکروفون‌، دوربین‌، تلویزیون‌، پوشیدنی‌، بلندگوهای هوشمند‌، باز‌ می‌کند (شما Fitbit را خریده‌اید‌، یادتان می‌آيد؟) برای این که به همه این اهداف برسیم و راهی پیدا کنیم که این ماشین‌ها بتوانند رفتار منطقی‌تری داشته باشند، جستجوها و نوع ارائه‌ آن‌ها باید تغییر پیدا کنند. یک میکروفون روی fitness tracker، باید کوئری‌های شما را بشنود و متوجه آن‌ها بشود، در حالی که دستیار صوتی باید با آن اطلاعات کاری انجام دهد و به‌طور مفیدی پاسخگوی آن‌ها باشد.

درک زبان، کلید اصلی موتورهای جستجو است. توسعه مدل‌های زبانی فوق‌العاده قدرتمند‌، کارآمد و انعطاف‌پذیر که بتوانند محتوا را برای ارائه آن پاسخ‎ها به صورت مختصر و طبیعی تولید کنند‌، بسیار ضروری خواهد بود.

در I/Oی ۲۰۲۱‌، نمونه دیگری از این مورد را مشاهده کردیم: LaMDA.

LaMDA چیست؟

LAMDA مخفف Language Model for Dialogue Applications  است که یکی دیگر از سرآمدان بزرگ هوش مصنوعی در I/Oی سال ۲۰۲۱‌، LaMDA یا مدل زبانی برای اپلیکیشن‏‌های گفتگو بود. این یک فناوری جدید برای برقراری ارتباط با هوش مصنوعی است – مانند یک چت بات – اما بسیار طبیعی‌‎تر از آن. این مدل‌ می‌تواند به شیوه‌‏ای آزادتر از هوش مصنوعی قبلی صحبت کند‌، زیرا این‏‌ها اغلب یک مسیر ساده از A به B را دنبال می‌کنند. به عنوان مثال هنگام تغییر موضوعات‌، Chatbots به راحتی دچار گیج شدن و سردرگمی می‌شود.

LaMDA در حال رفع این مشکل است. این مدل‌ می‌تواند اطلاعات زیادی در مورد یک موضوع به دست بیاورد و در یک گفتگوی دو طرفه شرکت کند – حتی اگر خارج از موضوع اصلی عمل کند. گوگل، دموی یک مدل LaMDA را که در زمینه سیاره پلوتون آموزش دیده است، نشان داد تا در این مورد با یکی از محققان گفتگو کند. البته این مدل کامل نیست، اما ایده خوبی از آینده‌‏ای که می‎توانیم انتظار داشته باشیم را به ما ارائه می‌دهد.

سوالاتی که ایجاد می‌شوند

البته می‌دانیم که همه این تحولات سوالاتی را برای افراد ایجاد‌ می‌کند. به عنوان مثال‌، اگر گوگل واقعا بتواند محتوا را به همه زبان‌ها بخواند‌، بشنود و ببیند و آن را در قالب جدید – بسته به زمینه و محتوای تولید شده توسط هوش مصنوعی – مجددا ارائه دهد، چه کسی صاحب این محتواست؟ و چه کسی مسئول این نتایج خودکار است؟ آیا این میخ دیگری روی تابوت حوزه‎ای به نام تولید محتواست؟

و سوگیری در هوش مصنوعی چطور؟ سوگیری و اخلاق موضوعات مهمی در هوش مصنوعی هستند و اگر ما در این باره حرف می‌زنیم که قرار است هوش مصنوعی در زندگی آینده ما نقش بسیار زیادی داشته باشد، باید از بی‏‌طرفی و قابلیت اطمینان آن مطمئن باشیم. البته‌، گوگل به‌طور خاص در مطلبی از سوگیری هوش مصنوعی یاد‌ می‌کند و هنوز در حال آموزش این مدل است. محققان هوش مصنوعی در گوگل نیز کمی در مورد KELM صحبت کردند: راهی برای تعیین اطلاعات غیرواقعی و محتوای سمی در متون که در نهایت ممکن است باعث سوگیری در مدل‌ها شود.

گوگل الگوریتم MUM را راه می‌اندازد

گوگل در حال آزمایش الگوریتم MUM است و این کار را تا زمانی که اطمینان کافی در مورد آن پیدا نکند، ادامه خواهد داد. هیچ‏ زمان‌بندی مشخصی در مورد زمان راه‌اندازی آن وجود ندارد‌، اما در مورد الگوریتم BERT زمان زیادی طول نکشید.

 

معرفی MUM ممکن است به معنای به دست آوردن نتایج جستجوی بهتر باشد‌، اما از طرفی می‌تواند به معنی نوع جدیدی از نتایج جستجو هم باشد. این‌ می‌تواند بر نحوه تفکر شما در مورد محتوا تاثیر بگذارد. ممکن است پاسخ به سوالات مخاطبان و حل مشکلات آن‌ها اهمیت چندانی نداشته باشد‌، زیرا احتمالا از قبل توسط سیستم انجام شده است. در عوض‌، ممکن است بهتر باشد که محصول خود را بهبود بخشیده و بر ایجاد اولویت برند تمرکز کنید. مردم باید به بهترین شکل با نام تجاری شما روبه‌‎رو شوند. به راه‌هایی برای درخشیدن و دیده شدن فکر کنید و راه‌هایی پیدا کنید که ترافیک‌ سایت‌تان را به مشتریان دائمی تبدیل می‌کند.

نحوه آماده شدن برای الگوریتم MUM

در آینده‌ای نزدیک، الگوریتم گوگل در خواندن و درک متن مانند یک انسان عمل خواهد کرد. بنابراین‌، چگونه‌ می‌توانید برای این مدل زبانی جدید و مسیری که گوگل پیش گرفته است، آماده شوید؟ اول از همه‌، با افزودن انواع اسکیما یافته به صفحات خود‌ می‌توانید به موتورهای جستجو مانند گوگل اطلاعات بیشتری در مورد محتواهای‌تان بدهید. این به گوگل کمک‌ می‌کند تا بفهمد چه چیزی در یک صفحه وجود دارد و شما را واجد شرایط برای دریافت رتبه‌های بالاتر در صفحه نتایج خود می‎کند. اگر تجربه زیادی در زمینه برنامه نویسی ندارید‌، افزونه Yoast SEO‌ می‌تواند به طور خودکار داده‌های ساختار یافته لازم را به سایت شما اضافه کند.

علاوه بر این‌، شما باید متون خوبی داشته باشید که خواندن آن‏ها آسان باشد و به صورت طبیعی بهینه‏‌سازی شوند. برای اینکه رتبه بهتری از گوگل بگیرید، به هیچ عنوان متن خود را با کلمه کلیدی پر نکنید‌، سعی کنید چیزی بنویسید که مخاطبان شما به خواندن آن ترغیب شوند. چیزی جدید‌، جذاب و با ساختار خوب. استفاده از امکان آنالیز خوانایی در افزونه Yoast می‌تواند به شما کمک کند. این به شما بازخورد دقیقی در مورد متن‌تان و آنچه‌ می‌توانید در آن بهبود دهید‌ می‌دهد.

1 دیدگاه
  1. خرید خط 0912 می گوید

    خیلی خوب بود و موفق باشیدو خسته نباشیدو جالب بود

دیدگاه خود را ثبت کنید

آدرس ایمیل شما منتشر نخواهد شد.