نماد آخرین خبر

هوش مصنوعی، طراح پروتئین می‌شود!

منبع
ايسنا
بروزرسانی

ایسنا/ به گزارش ایسنا، نویسنده این گزارش در مورد تولید یک پروتئین با هوش مصنوعی نوشته است: من از هوش مصنوعی برای طراحی یک پروتئین افتضاح استفاده کردم. با پیروی از دستورالعمل‌های گام به گام، یک مدل زبانی پروتئین (PLM) ابتدایی ساختم. نوعی هوش مصنوعی (AI) که به جای کلمات، توالی‌های پروتئینی را تولید می‌کند. با چند خط کد کپی و پیست شده، از مدل خواستم که یک توالی کوتاه از اسیدهای آمینه را ایجاد کند.

به نقل از نیچر، من نمی‌دانستم پروتئین من چقدر نامناسب است تا اینکه از آلفا فولد (AlphaFold) که هوش مصنوعی پیش‌بینی‌کننده ساختار پروتئین دیپ‌مایند گوگل (Google DeepMind) است، خواستم ساختار آن را پیش‌بینی کند. ساختار پیش‌بینی شده دارای مارپیچ، حلقه و سایر عناصر واقع‌گرایانه بود. اما آلفافولد نسبت به پیش‌بینی خود زیاد مطمئن نبود و این نشان می‌داد مولکول من احتمالا نمی‌تواند در سلول‌های آزمایشگاه ساخته شود، چه برسد به اینکه کار مفیدی انجام دهد.

اکنون، افرادی مثل من که به‌صورت آماتور در زیست‌شناسی محاسباتی فعالیت می‌کنند، امید تازه‌ای یافته‌اند.

دانشمندان در حال توسعه نسل جدیدی از ابزارهای هوش مصنوعی زیستی هستند که دستورالعمل‌ها را به زبان ساده دریافت کرده و آنها را به پروتئین‌ها و سایر مولکول‌ها، از جمله داروهای بالقوه، تبدیل می‌کنند. این مدل‌ها همچنین به محققان اجازه می‌دهند تا با سلول‌ها به زبان انگلیسی معمولی «صحبت» کنند تا عملکرد داخلی آنها را رمزگشایی کرده و درک زیستی دیگری را به دست آورند.

این تازه‌ترین تحول در انقلاب زیست‌هوش مصنوعی (bio-AI) است که در حال دگرگون کردن حوزه‌هایی مانند طراحی پروتئین و زیست‌شناسی ساختاری است. مدل‌های زبانی بزرگ (PLMs) و دیگر ابزارهای هوش مصنوعی به دانشمندان این امکان را می‌دهند که مولکول‌هایی مانند آنزیم‌ها و پادتن‌ها را با نسبتی از سهولت طراحی کنند. اما بهره‌برداری کامل از این ابزارها معمولا نیازمند تخصص قابل‌توجهی است.

دانشمندان می‌گویند مدل‌هایی که به کاربران امکان می‌دهند محصولات زیستی را با استفاده از متن ساده بررسی کنند، می‌توانند موانع پیوستن به انقلاب هوش مصنوعی زیستی را کاهش دهند. این هوش‌های مصنوعی همچنین این پتانسیل را دارند که کنترل بیشتری بر طراحی‌ها و خروجی‌های حاصل فراهم کنند.

محمد القریشی، زیست‌شناس محاسباتی در دانشگاه کلمبیا در شهر نیویورک، می‌گوید: اگر بتوانیم دقیقا مشخص کنیم چه می‌خواهیم و پروتئینی با آن ویژگی‌ها طراحی شود، مفید خواهد بود.

تبدیل دستور متنی به پروتئین

ماه گذشته، گروهی به رهبری فاجی یوان (Fajie Yuan)، دانشمند یادگیری ماشینی در دانشگاه وست‌لیک در هانگژو، چین، نشان داد که یک مدل تبدیل متن به پروتئین که گروهش توسعه داده است، می‌تواند پروتئین‌های عملکردی، از جمله آنزیم‌های آزمایش‌شده در آزمایشگاه و پروتئین‌های فلورسنت، را طراحی کند که در طراحی‌های خود جدید هستند و شبیه مولکول‌های موجود نیستند. یوان می‌گوید: ما اولین کسانی هستیم که یک آنزیم عملکردی را فقط با استفاده از متن طراحی می‌کنیم. این درست مثل داستان‌های علمی تخیلی است.

این مدل که پینال نام دارد، یکی از چندین هوش مصنوعی طراحی پروتئین است که می‌تواند با زبان معمولی هدایت شود که برخلاف توالی پروتئین یا مشخصات مبتنی بر ساختار است که در بیشتر هوش‌های مصنوعی مشابه رایج هستند.

آنتونی گیتر (Anthony Gitter)، زیست‌شناس محاسباتی در دانشگاه ویسکانسین-مدیسون، می‌گوید: این روزهای اولیه این مدل‌های هوش مصنوعی زیستی است. من آن را به عنوان یک حوزه پرخطر و پربازده می‌بینم.

چگونه با متن یک مولکول بسازیم؟

آموزش مدل‌های هوش مصنوعی زیستی برای برقراری ارتباط به زبان انگلیسی یا هر زبان دیگری معمولا شامل قرار دادن آنها در معرض توضیحات متنی از داده‌های زیستی است. گروه یوان، پینال را با استفاده از توضیحات مختصری از ساختارها، عملکردها و سایر ویژگی‌های ۱.۷ میلیارد پروتئین آموزش دادند. پس از آموزش‌های اضافی، این مدل می‌توانست یک دستور را دریافت کند و صدها طرح توالی تولید کند. این به صورت عمومی در دسترس نیست.

یکی از دستوراتی که محققان استفاده کردند این بود: لطفا پروتئینی طراحی کنید که یک الکل دهیدروژناز باشد، این اشاره به به یک آنزیم دارد که الکل را متابولیزه می‌کند. یوان و همکارانش سپس از ابزارهای محاسباتی دیگری برای شناسایی امیدوارکننده‌ترین طرح‌ها استفاده کردند و با همکاری یک زیست‌شناس، فعالیت آنزیمی آنها را آزمایش کردند.

دو مورد از هشت طرح الکل دهیدروژناز با موفقیت تجزیه الکل را کاتالیز کردند، البته با کارایی بسیار کمتر از آنزیم‌های طبیعی. یوان می‌گوید گروهش همچنین پروتئین‌های فلورسنت سبز (GFP) و آنزیم‌های تجزیه‌کننده پلاستیک را طراحی کرده است که همگی از نظر توالی با نمونه‌های طبیعی متفاوت هستند.

چندین گروه دیگر مدل‌های هوش مصنوعی مشابهی را توسعه داده‌اند، از جمله مدلی به نام ESM-۳ که می‌تواند با کلمات کلیدی و همچنین با توالی‌ها و ساختارهای پروتئینی هدایت کرد. یک شرکت نوپا به نام ۳۱۰.ai ابزاری اختصاصی به نام MP۴ توسعه داده است که مجموعه‌ای از پروتئین‌ها را از ورودی‌های متنی طراحی می‌کند، از جمله چندین پروتئین که در آزمایشگاه می‌توانند به منبع انرژی سلولی ATP متصل شوند. تیموتی رایلی (Timothy Riley)، معاون رئیس این بررسی، می‌گوید این شرکت از این مدل برای طراحی پروتئین‌هایی استفاده می‌کند که مانند داروهای  GLP-۱که درمان‌های چاقی پرفروشی هستند، عمل می‌کنند.

کتی وی (Kathy Wei)، یکی از بنیانگذاران این شرکت، می‌گوید یکی از چالش‌های مدل‌هایی مانند ۳۱۰.ai، ارائه دستورالعمل‌های متنی مناسب برای پیروی یک هوش مصنوعی است، اگرچه مدل‌های زبانی بزرگ می‌توانند به ایجاد دستورالعمل‌های موفق کمک کنند. او این را به روزهای اولیه هوش مصنوعی‌های تولیدکننده تصویر مانند Dall-E تشبیه می‌کند و می‌گوید: در هوش مصنوعی تولید کننده تصویر برخی از دستورالعمل‌ها مثمر ثمرتر از بقیه بودند و به عنوان مثال، تلاش‌های مدل‌ها برای به تصویر کشیدن دست انسان اغلب یک عامل برای لو رفتن جعلی بودن تصویر به شمار می‌رفت.

در مقابل وی می‌گوید MP۴ به جای دست‌های عجیب و غریب، گاهی اوقات می‌تواند پروتئین‌هایی با توالی‌های تکراری را تولید کند.

طراحی دارو

طراحی پروتئین تنها زمینه‌ای نیست که دانشمندان در آن از هوش مصنوعی استفاده می‌کنند. مجموعه‌ای از مدل‌ها با هدف اعمال رویکردی مشابه در طراحی مواد شیمیایی طراحی شده‌اند.

به عنوان مثال، سال گذشته، گروه گیتر مدلی را منتشر کرد که مولکول‌های کوچک را در پاسخ به پیام‌های متنی طراحی می‌کند و نشان داد که می‌تواند مهارکننده‌های شبه‌دارویی از اهداف پروتئینی شناخته شده طراحی کند.

این طرح‌ها در آزمایشگاه بررسی نشده‌اند، اما ابزارهای محاسباتی که به طور گسترده در کشف دارو استفاده می‌شوند، نشان می‌دهند که برخی از آنها امیدوارکننده هستند.

دانشمندان همچنین از هوش مصنوعی زیستی برای «صحبت» با سلول‌ها استفاده می‌کنند. تلاش‌ها برای توالی‌یابی تمام مولکول‌های آران‌ای در سلول‌های منفرد به یک روش اساسی در زیست‌شناسی سلولی تبدیل شده است و تنوع ناشناخته‌ای را آشکار می‌کند. اما کریستوف بوک (Christoph Bock)، زیست‌شناس محاسباتی در دانشگاه پزشکی وین، می‌گوید: تفسیر این آزمایش‌های داده‌محور معمولا نیازمند همکاری فشرده بین زیست‌شناسان و دانشمندان داده است.

به عنوان یک راه میانبر، آزمایشگاه او یک چت‌بات هوش مصنوعی به نام CellWhisperer۴ توسعه داد. این چت‌بات می‌تواند دستورالعمل‌های ساده انگلیسی را دریافت کند برای مثال دستورالعملی مانند: این سلول‌ها را با جزئیات توصیف کن و خلاصه‌ای را به صورت متن ساده دریافت کند، یا به کاربران اجازه دهد با «به هم چسباندن» سلول‌های مورد علاقه، نمایش بصری از جمعیتی از سلول‌های متنوع را بررسی کنند. باک می‌گوید: این به یک شریک جرم در تجزیه و تحلیل داده‌های شما تبدیل می‌شود.

جملات سلولی

در تلاشی دیگر، یک مدل هوش مصنوعی، مجموعه داده‌های توالی‌یابی شده از تک سلولی را به فهرست‌های طولانی از ژن‌هایی که سلول‌ها بیان می‌کنند، ترجمه می‌کند و این داده‌ها را به یک مدل زبانی بزرگ (LLM) موجود منتقل می‌کند. مدل حاصل، به نام  Cell۲Sentence، می‌تواند یک مجموعه داده تک سلولی را دریافت کند و ویژگی‌هایی مانند نوع سلول را به زبان انگلیسی ساده توصیف کند.

و از آنجا که این مدل بر اساس مقالات و داده‌های زیستی آموزش دیده است، می‌تواند نقاط را به هم متصل کند و کارهایی مانند پیش‌بینی چگونگی تغییر ژن‌های بیان شده توسط یک سلول توسط یک داروی ایمونوتراپی سرطان را انجام دهد. دیوید ون دایک (David van Dijk)، زیست‌شناس محاسباتی در دانشگاه ییل در نیوهیون، کنتیکت، که این کار را به همراه دانشمندانی در مرکز تحقیقات گوگل و سازمان‌های دیگر رهبری می‌کرد، می‌گوید: مدل ما می‌تواند بین زبان زیستی و زبان انسانی ترجمه انجام دهد.

گیتر به صورت دوره‌ای توانایی مدل‌های زبانی بزرگ آماده برای طراحی پروتئین‌ها را ارزیابی می‌کند، اما هنوز تحت تاثیر نتایج قرار نگرفته است.

القرشی می‌گوید موج کنونی از هوش‌های مصنوعی زیستی سخنگو «کمی نمایشی» است. اما او اضافه می‌کند که ایده‌ی تقویت مدل‌های زبانی بزرگ (LLMs) با داده‌های علمی، مانند توالی‌های پروتئینی و ساختارهای شیمیایی، ایده‌ای امیدوارکننده است. او می‌گوید: تعجب نخواهم کرد اگر برخی از شرکت‌های بزرگ فناوری هم‌اکنون در حال کار روی این موضوع باشند.

بعد از تلاش ناموفقم، به رابط وب پینال رفتم و عبارت «یک پروتئین خوب برای من بساز» را تایپ کردم. وقتی توالی را به آلفافولد وصل کردم، پیش‌بینی بسیار قابل اعتمادتری را ارائه کرد. مدل ساخته شده شبیه مخلوطی از اسپاگتی و فوسیلی بود، بنابراین انتظار نداشتم که بتواند واکنشی را کاتالیز کند، پلاستیک بخورد یا کار خاصی انجام دهد. اما این یک شروع است.

به پیج اینستاگرامی «آخرین خبر» بپیوندید
instagram.com/akharinkhabar

اخبار بیشتر درباره

اخبار بیشتر درباره