شرکت IBM هفته گذشته روشی را معرفی کرد که میتواند کارایی اجرای الگوریتمها هوش مصنوعی را برای کاربرهایی که به دقت بالا نیاز ندارند افزایش دهد. اولین ترفند این شرکت استفاده از تکنیکی است که در آن محاسبات بهصورت ۸ بیتی صورت میگیرد و ترفند دوم تکنیکی استفاده از تراشههای آنالوگ با دقتی برابر با ۸ بیت است. هر دو این تکنیکها در بزرگترین کنفرانس هوش مصنوعی و یادگیری ماشین دنیا با عنوان NeurlPS2018 با جزییات شرح داده شدند.
جفری ولسر معاون و مسئول آزمایشگاه مرکز نحقیقات آلمادن IBM در وبلاگ خود نوشته:
کاربردهای آینده هوش مصنوعی نیاز به پاسخ بسیار سریعتر، حجم محاسبات هوش مصنوعی بالاتر و دادههای چندمنظوره از رشتههای مختلف خواهد بود. برای دستیابی به تمام قابلیتهای هوش مصنوعی، ما سختافزاری جدید با رویکرد ویژه به هوش مصنوعی طراحی کردهایم؛ از شتابدهندهها و سختافزارهای هدفمند برای عملیات حجیم هوش مصنوعی در تراشههای جدید تا تراشههای کوانتومی آینده.
یکی از تلاشهای عمدهی IBM در حوزهی هوش مصنوعی، توسعه سختافزارهای ویژهای است که بهجای اجرای وظایف خاص و مشخص هوش مصنوعی، در فعالیتهای عامتر به کار گرفته شوند و به انسانها در حل مشکلات کمک کنند.
حرکت از پردازش اعداد شناور ۱۶ بیتی به ۸ بیتی در نگاه اول شاید یک پسرفت به نظر بیاد، اما بسیاری از عملیات هوش مصنوعی مانند تشخیص گفتار و ترجمه چندان هم به دقت بالای محاسبات نیاز ندارند، در عوض باید بهصورت بلادرنگ و بدون تأخیر انجام شوند. پایین آوردن دقت محاسبات، درها را برای اجرای این عملیات با مصرف توان کمتر و بالابردن کارایی باز میکند. آنطور که ولسر میگوید واحدهای پردازشی اعداد شناور ۱۶ بیت ۴ برابر فضای کمتری نسبت به واحدهای پردازش ۳۲ بیتی اشغال میکنند.
در مقاله علمی با عنوان «تربیت یادگیری عمیق شبکه عصبی با اعداد شناور ۸ بیتی»، محققان IBM توضیح دادهاند که چگونه درکنار کاهش دقت محاسبات از ۳۲ بیت به ۱۶ بیت، صحت محاسبات ۸ بیتی را نیز در عملیاتی نظیر ResNet50، AlexNet و BN50_DNN که در کاربردهایی همچون تشخیص متن، گفتار و تصویر مورد استفاده قرار میگیرد حفظ کردهاند. آنها ادعا کردهاند روش ابداعیشان مدت زمان لازم برای تربیت شبکه را نسبت به عملیات ۱۶ بیتی دو تا چهار مرتبه کاهش داده است.
مقاله علمی دوم –دقت ۸ بیتی در ضرب درون حافظهای با تغییر فاز حافظه- روشی را توضیح میدهد که دقت ذاتی پایین تراشههای آنالوگ هوش مصنوعی را جبران میکند، بهگونهای که عملیات ضرب عددی را با دوبرابر دقت تراشههای دیجیتال ۸ بیتی و ۳۳ بار مصرف توان کمتر انجام میدهد.
هدف این مقاله بازتعریف حافظه از تعریف سنتی ذخیرهسازی داده به تعریف جدید ذخیرهسازی و پردازش داده است. این معماری جدید بهتنهایی میتواند مصرف انرژی را تا ۹۰ درصد کاهش دهد.
رسلر در ادامه نوشته است:
دقت به دست آمده در تحقیقات جدید ما میتواند پردازش درون حافظهای را بهعنوان یک روش با کارایی بالا و مصرف توان اندک در کاربردهایی مانند اینترنت اشیا و پردازش مرزی مطرح کند. همچنین درکنار شتابدهندههای دیجیتال، تراشههای آنالوگ ما بهصورت اختصاصی برای توسعه تربیت شبکههای عصبی و ارایه راهکار برای دادههای تصویری، گفتاری، متنی در حال ظهور طراحی شدهاند.
دیپمایند، زیرمجموعهی شرکت مادر گوگل یعنی آلفابت است که در بریتانیا و در حوزهی هوش مصنوعی فعالیت میکند. این شرکت سال گذشته خبر از طراحی و توسعهی هوشی برای کسب مهارتبازی شطرنج و شوگی داد. شوگی، نوعی بازی ژاپنی شبیه به شطرنج است. هدف دیپ مایند، طراحی هوشی با نام AlphaZero بود که با یادگیری شخصی، مهارت کافی را در بازیهای فکری کسب کند.
آلفازیرو بهگونهای طراحی شد تا بدون آموزش خارجی، خودش بهتنهایی بازیهای شطرنج، شوگی و بازی تختهای چینی به نام Go را بیاموزد. محصول جدید دیپمایند توانست در هر حوزه، قهرمانان آن را شکست دهد. موفقیت بهدستآمده، مرحلهای جدید از یادگیری بازیهای دونفره توسط کامپیوتر را نشان میدهد. منظور از این بازیهای دونفره، بازیهایی مانند شطرنج هستند که تصمیمگیری در آنها براساس اتفاقات رخداده در بازیهای قبلی، قابل یادگیری و پیشبینی باشد.
موفقیت دیپ مایند بسیار مهم و تأثیرگذار بود. البته کمی طول کشید تا منبعی معتبر، یک بررسی جامع از روند کار و موفقیت هوش مصنوعی انجام دهد. بههرحال شرکت در هفتهی گذشته اعلام کرد که مجلهی معتبر علمی Science این رخداد را تأیید کرد و تیتر روی جلد خود را به آن اختصاص داد.
دیوید سیلور محقق ارشد پروژهی آلفازیرو در کنفرانس خبری مراسم NeurIPS ۲۰۱۸ در مونترئال گفت:
چند سال پیش، برنامهی ما به نام AlphaGoتوانست قهرمان ۱۸ دوره از مسابقات گو را با نتیجهی ۴ بر یک شکست دهد. این رخداد برای ما شروع یک مسیر بود. هدف اصلی ما، توسعهی سیستم یادگیری جامعی بود که بازیهای مختلف را تا سطح بسیار حرفهای بیاموزد.
آلفازیرو، قدم بعدی ما در این مسیر محسوب میشود. هوش مصنوعی جدید، از ابتدا بازیها و قوانین آنها را آموخت و بدون هیچ آموزش دیگر، موفق شد تا قهرمانان جهان را در بازیهای شطرنج، گو و شوگی شکست دهد.
سیلور در ادامه توضیح داد که انتخاب بازیهای مذکور، بهخاطر پیچیدگی و همچنین تاریخچهی طولانیمدت آنها از لحاظ تلاش هوش مصنوعی برای شکست دادن انسانها، انتخاب شدند. او دربارهی این بازیها میگوید:
شطرنج، نشاندهندهی دستاوردی است که توسط انواع هوش مصنوعی سنتی قابل دستیابی بود. موفقیت در این بازی توسط نمونههای قبلی هوش مصنوعی و تلاش برای عالی کردن آنها بهدست آمد. ما میخواستیم توانایی هوش جدید را در دستیابی به موفقیتهای نمونههای پیچیدهی قبلی، تنها از راه یادگیری بررسی کنیم.
دلیل انتخاب شوگی نیز دشواری یادگیری آن توسط برنامههای کامپیوتری بود. درواقع این بازی یکی از معدود بازیهای تختهای (بهجز بازی بسیار چالشی گو) است که یادگیری آن برای برنامههای خاص کامپیوتری هم دشوار است. تنها در یکی دو سال گذشته بود که آمارهایی از پیروزی برنامههای کامپیوتری بر قهرمانان شوگی منتشر شد.
ماری کمپل یک محقق هوش مصنوعی در مرکز تحقیقات آیبیام واتسون در نگارش مقاله به تیم دیپمایند کمک کرده است. او اعتقاد دارد این دستاورد، پایانی بر تلاشهای چند دهه در حوزهی هوش مصنوعی بود. کمپل عضو تیم تحقیقاتی آیبیام در پروژهی دیپ بلو بود که در سال ۱۹۹۷، قهرمان شطرنج آن زمان یعنی گری کاسپاروف را شکست داد.
کمپل اعتقاد دارد محققان هوش مصنوعی برای چالشهای جدید، دیگر باید به فکر نسل جدیدی از بازیها باشند. در بازیهای مورد نظر کمپل، برخلاف شطرنج، همهی اطلاعات لازم برای تصمیمگیری، بهصورت واضح وجود ندارند. بهعنوان مثال در بازیهای کارتی همچون پوکر، بازیکنان کارتها را نزدیک به خود نگه میدارند و تصمیمگیری، دشوارتر خواهد بود. بسیاری از بازیهای چندنفرهی آنلاین مانند StarCraft، Dota و Minecraft نیز در این دستهبندی قرار میگیرند.
ماری کمپل در مصاحبه با مجلهی Spectrum از مؤسسهی IEEE دربارهی چالش بازیهای نسل جدید میگوید:
بازیهای چندنفره، از بازی گو هم دشوارتر هستند اما آنچنان دشوار محسوب نمیشوند. درحالحاضر نیز یک گروه توانسته است بهترین بازیکنان Dota 2 را شکست دهد. البته، بازی آنها نسخهای محدود از بازی اصلی بود. استارکرافت مقداری دشوارتر بهنظر میرسد. البته بهنظر من هردو بازی از اهداف قابل دستیابی تا ۲ یا ۳ سال آینده خواهند بود.
مقالهی منتشرشده دربارهی مسیر موفقیت آلفازیرو، این هوش مصنوعی را با نمونههای دیگر متخصص در بازیهای شطرنج و شوگی مانند Stockfish، Elmo و محصول IBM یعنی Deep Blue بررسی میکند. درواقع آلفازیرو بهجای دیکته شدن قوانین بهصورت دستی، از یک شبکهی عصبی عمیق برای یادگیری بهره میبرد. شبکهی عصبی در بحث هوش مصنوعی، نشاندهندهی توابع ریاضیاتی لایهای است که عملکرد نورونهای مغز انسان را شبیهسازی میکند.
روش پویای بازی آلفازیرو، استراتژیهای خلاقانه و غیرمعمولی را نتیجه میدهد. قهرمان دو دوره مسابقات شطرنج و استاد بزرگ رشته یعنی متیو سدلر و قهرمان مسابقات بینالمللی زنان در شطرنج یعنی ناتاشا رگان در کتاب آیندهی خود از روشهای آلفازیرو الهام گرفتهاند و به بررسی این هوش مصنوعی و هزار بار بازی آن پرداختهاند.
سدلر درمورد هوش مصنوعی آلفازیرو میگوید:
موتورهای هوش مصنوعی سنتی، بسیار قوی هستند و چند اشتباه واضح محدود در بازی انجام میدهند. البته در موقعیتهایی که هیچ راهکار قابلمحاسبهی مشخصی وجود نداشته باشد، این نمونههای سنتی دچار اشتباه میشوند. اما آلفازیرو با یک پیشرفت قابل ملاحظه، سبک بازی خود را در بازهی گستردهای از استراتژیها تغییر میدهد.
در موقعیتهای غیرقابل پیشبینی، احساسات، بینش و شهود مورد نیاز هستند که آلفازیرو اینها را بهکار میگیرد. آلفازیرو مانند انسانی با اشتیاق بالا بازی میکند که سبکی بسیار زیبا محسوب میشود.
بهعنوان مثالی از روش کار آلفازیرو، هوش مصنوعی توانست اصولی مانند شروع بازی، حفاظت از پادشاه و استراتژی چینش مهرههای پیاده را بیاموزد. روش بازی بهاین صورت است که پادشاه حریف محاصره میشود، سپس حرکات حریف محدود شده و حرکات مهرههای هوش مصنوعی افزایش پیدا میکند. نکتهی جالب توجه دیگر آن است که آلفازیرو برخلاف انسان، از قربانی کردن مهرههای خود برای اهداف بلندمدت، ترسی ندارد.
یادگیری بازیهای فکری مذکور توسط آلفازیرو، نیازمند شبیهسازی میلیونها بازی در مقابل خودش بود. فرایند یادگیری بازی به این صورت با نام Reinforcement Learning شناخته میشود. در روش مذکور، سیستم جایزه و تنبیه، هوش مصنوعی را بهسمت اهداف مشخصی پیش میبرد. آلفازیرو ابتدا بهصورت تصادفی بازی میکرد اما پس از مدتی، پارامترها را بهنوعی تنظیم کرد تا علاوهبر فرار از شکست، سبک بازی اختصاصی خود را پیدا کند.
زمان مورد نیاز برای آموزش آلفازیرو، به نوع بازی بستگی داشت. حداقل، ۷۰۰ هزار مرحلهی آموزشی (هر مرحله شامل ۴۰۹۶ موقعیت تخته) روی سیستمهای مجهز به ۵ هزار واحد پردازش تانسور (TPU) و ۱۶ تیپییو نسل دوم (مدارهای مجتمع اختصاصی گوگل برای یادگیری ماشین)، در مدت ۹ ساعت، ساخت و بازی کردن شطرنج را انجام داد. برای شوگی و گو نیز به ۱۲ ساعت و ۱۳ روز زمان نیاز بود.
آلفازیروی حرفهای از الگوریتم جستجوی مونت کارلو (الگوریتم جستجوی ابتکاری برای فرایندهای تصمیمگیری) برای انتخاب هر حرکت استفاده میکند. این هوش مصنوعی جستجوها را بسیار سریع انجام میدهد. البته، هوش مصنوعی موقعیتهای بسیاری را در بازی بررسی میکند که نسبت به بررسیهای یک استاد بزرگ شطرنج، کارایی کمتری دارد؛ اما آلفازیرو در مقایسه با نمونههای دیگر موقعیتهای کمتری را بررسی میکند.
محققان دیپ مایند برای بررسی دقیقتر تواناییهای آلفازیرو، آن را در رقابت با الگوریتمهای دیگر همچون Stockfish و Elmo و همچنین نسل قبلی یعنی آلفاگوزیرو امتحان کردند. سختافزار مورد استفاده برای بازیها، سیستمی با ۴۴ هستهی پردازشی و ۴ عدد از نسل اول تیپییوهای مخصوص گوگل بود. این سختافزار، از لحاظ قدرت پردازش و استدلال با سیستمی مجهز به چندین کارت گرافیک انویدیا تایتان وی برابری میکند. آلفازیرو در رقابت با الگوریتمهای مذکور، بردهای متعدد و قابل توجهی را کسب کرد.
اخیراً مدیر علوم کاربردی بخش هوش مصنوعی الکسا، روهی سَریکایا، با پستی در وبلاگ الکسا دربارهی جزئیات پیشرفتهایشان در زمینهی فناوریهای یادگیری ماشین صحبت کرد. این پیشرفتها، Alexa را قادر میسازند تا با دانستن اطلاعات مرتبط به موضوع، صحبت کاربر را بهتر درک کند. به گفتهی سریکایا، این بهبودها نقش خوبی در کاهش دشواری صحبت با الکسا و خوشصحبتتر شدن آن داشتهاند.
از پاییز امسال، آمازون در حال کار روی روشهای خودآموزی بوده است که کمک میکنند این دستیار مجازی اشتباهات خود را بهشکل خودکار برطرف کند. سریکایا میگوید این قابلیت نیازی به تصحیح کاربر ندارد و خودش با توجه به علائم ضمنی یا صریح مربوطه از طرف کاربر، تعامل نامطلوب و اشتباه در درک مطلب را شناسایی میکند. علائم مربوطه، موارد مختلفی را شامل میشود، از قبیل: سابقهی تعاملات، سلیقهی کاربر، اینکه از کدام امکانات الکسا استفاده میکند، الکسا در چه وسیلهای قرار دارد و در کدام قسمت خانه قرار گرفته است. این ویژگی که پیش از این در حالت بتا بود، هفتهی گذشته در آمریکا در دسترس کاربران قرار گرفت.
برای مثال در فاز بتا، الکسا یاد گرفت دستور اشتباه کاربر را که گفته بود «آهنگ Good for What را پخش کن» تشخیص دهد و با پخش آهنگ Nice for What از Drake آن را تصحیح کند. این ویژگی، پتانسیل زیادی برای کاهش دشواری تعامل با دستیارهای مجازی دارد. آمازون میگوید اکنون سیستم جدید هر روز این ویژگی را روی فرمانهای مرتبط با موسیقی کاربران اعمال میکند.
الکسا همچنین توانایی تعامل بدون اسم (name-free) دارد که این مورد هم باعث طبیعیتر شدن کار با آن میشود. کاربر میتواند بگوید: «یک ماشین برای من بگیر» و الکسا بدون پرسیدن نام سرویس اشتراک سفر، متوجه دستور میشود. این ویژگی از روز جمعه علاوهبر آمریکا در کشورهای انگلستان، کانادا، استرالیا، هند، آلمان و ژاپن نیز عرضه شد.
تعامل بدون اسم مرتبط با خانهی هوشمند نیز از جمعه در آمریکا منتشر شد. از این پس میتوان از فرمانهای سادهتری استفاده کرد. مثلاً افراد میتوانند صرفاً بگویند: «الکسا، نظافت را شروع کن.» برای مقایسه، در گذشته باید شکل کلی دستورها را بهخاطر داشتند و آنها را دقیق میگفتند: «الکسا، به رومبا بگو نظافت را شروع کن.»
در نهایت قابلیت ادامهی موضوع (context carryover) نیز بهبود یافته است و الکسا میتواند در طول مکالمه با کاربر، متوجه اشارهی او به صحبتهای قبلی شود. سریکایا مینویسد:
برای مثال اگر کاربر بگوید: «هوای سیاتل چطور است؟» و پس از پاسخ الکسا، بپرسد: «بوستون چطور؟» الکسا تشخیص میدهد که منظور کاربر هوای بوستون است. اگر بعد از پاسخ دربارهی هوای بوستون کاربر بگوید: «آنجا چه رستورانهای خوبی دارد؟» الکسا متوجه میشود کاربر در مورد رستورانهای بوستون صبحت میکند.