
پروتئینها مولکولهایی هستند که در طبیعت کار میکنند و یک صنعت کامل در حال ظهور است که با موفقیت آنها را برای اهداف مختلف اصلاح و تولید میکند. اما این زمان می برد و تصادفی است. Cradle قصد دارد با یک ابزار مجهز به هوش مصنوعی که به دانشمندان میگوید چه ساختارها و توالیهای جدیدی این پروتئین را وادار میکند آنچه را که میخواهند، تغییر دهد. این شرکت امروز با یک دور بذر قابل توجه از مخفی کاری خارج شد.
هوش مصنوعی و پروتئین ها اخیراً در اخبار بوده اند، اما بیشتر به دلیل تلاش های تیم های تحقیقاتی مانند DeepMind و Baker Lab. مدلهای یادگیری ماشینی آنها دادههای توالی RNA را بهراحتی جمعآوری میکنند و ساختاری را که پروتئین اتخاذ میکند، پیشبینی میکنند – مرحلهای که هفتهها و تجهیزات تخصصی گران قیمت طول میکشد.
اما به همان اندازه که این فرصت در برخی زمینه ها باورنکردنی است، برای برخی دیگر تنها یک نقطه شروع است. اصلاح یک پروتئین برای پایدارتر شدن یا اتصال به یک مولکول خاص دیگر بسیار بیشتر از درک شکل و اندازه کلی آن است.
“اگر شما یک مهندس پروتئین هستید و می خواهید خاصیت یا عملکرد خاصی را در یک پروتئین مهندسی کنید، فقط دانستن اینکه چگونه به نظر می رسد کمکی نمی کند. استف ون گریکن، مدیرعامل و یکی از بنیانگذاران کرادل، توضیح داد که اگر تصویری از یک پل داشته باشید، به شما نمی گوید که قرار است سقوط کند یا نه.
او ادامه داد: «آلفافولد دنباله ای می گیرد و پیش بینی می کند که پروتئین چگونه به نظر می رسد. “ما برادر مولد آن هستیم: شما ویژگی هایی را که می خواهید طراحی کنید انتخاب می کنید، و مدل دنباله هایی را تولید می کند که می توانید آنها را در آزمایشگاه خود آزمایش کنید.”
پیشبینی اینکه پروتئینها چه کاری انجام خواهند داد – به ویژه آنهایی که برای علم جدید هستند در محل به دلایل زیادی یک کار دشوار است، اما در زمینه یادگیری ماشینی بزرگترین مشکل این است که داده های کافی در دسترس نیست. بنابراین کرادل بسیاری از مجموعه دادههای خود را در یک آزمایشگاه مرطوب ایجاد کرد، پروتئین را بعد از پروتئین آزمایش کرد و مشاهده کرد که به نظر میرسد چه تغییراتی در توالیهای آنها چه تأثیراتی دارد.
جالب اینجاست که خود این مدل دقیقاً بیوتکنولوژیک نیست، بلکه مشتق شده از همان “مدل های زبان بزرگ” است که موتورهای تولید متن مانند GPT-3 را تولید می کند. ون گریکن خاطرنشان کرد که این مدلها در نحوه درک و پیشبینی دادهها به زبان محدود نمیشوند، ویژگی جالب «تعمیمسازی» که محققان هنوز در حال بررسی آن هستند.

نمونه هایی از Cradle UI در عمل. اعتبار تصویر: تاب خوردن
توالیهای پروتئینی که کرادل میخورد و پیشبینی میکند، البته به زبانی که ما میشناسیم نیستند، اما توالیهای خطی نسبتاً سادهای از متن هستند که معانی مرتبطی دارند. ون گریکن گفت: «این مانند یک زبان برنامه نویسی بیگانه است.
البته مهندسان پروتئین درمانده نیستند، اما کار آنها لزوماً شامل حدس و گمان های زیادی است. می توان نسبتاً مطمئن بود که در بین 100 دنباله ای که آنها تغییر می دهند ترکیبی است که اثر مورد نظر را ایجاد می کند، اما فراتر از آن همه چیز به آزمایش جامع ختم می شود. یک اشاره کوچک در اینجا می تواند کارها را به میزان قابل توجهی سرعت بخشد و از حجم عظیمی از کار بی ثمر جلوگیری کند.
او توضیح داد که این مدل در سه لایه اصلی کار می کند. ابتدا ارزیابی می شود که آیا یک دنباله داده شده “طبیعی” است یا خیر. آیا این یک توالی معنی دار از اسیدهای آمینه یا تصادفی است. این شبیه به یک مدل زبان است که به سادگی می تواند با اطمینان 99٪ بگوید که جمله به زبان انگلیسی (یا سوئدی، در مثال ون گریکن) است و کلمات در ترتیب صحیح هستند. او این را از «خواندن» میلیونها دنباله از این قبیل که توسط تجزیه و تحلیل آزمایشگاهی تعیین شده است، میداند.
سپس به معنای واقعی یا بالقوه زبان خارجی پروتئین نگاه می کند. او گفت: «تصور کنید که ما یک سکانس به شما می دهیم و این دمایی است که در آن آن توالی شکسته می شود. “اگر این کار را برای چندین توالی انجام دهید، می توانید نه تنها بگویید “این طبیعی به نظر می رسد”، بلکه “به نظر می رسد 26 درجه سانتیگراد است.” این به مدل کمک می کند تا بداند روی کدام مناطق پروتئین تمرکز کند.
سپس این مدل میتواند دنبالههایی را برای گنجاندن – حدسهای اساساً آموزشدیده، اما نقطه شروع قویتر از صفر پیشنهاد کند. سپس مهندس یا آزمایشگاه میتوانند آنها را آزمایش کرده و آن دادهها را به پلتفرم Cradle برگردانند، جایی که میتوان آنها را دوباره مصرف کرد و برای تنظیم دقیق مدل برای موقعیت استفاده کرد.

تیم Cradle در یک روز خوب در مقر خود (ون گریکن در مرکز است). اعتبار تصویر: تاب خوردن
اصلاح پروتئین ها برای اهداف مختلف در بیوتکنولوژی مفید است، از طراحی دارو تا ساخت زیستی، و مسیر از یک مولکول وانیل به یک مولکول سفارشی، موثر و کارآمد می تواند طولانی و گران باشد. هر روشی برای کوتاه کردن احتمال دارد حداقل مورد استقبال تکنسین های آزمایشگاهی قرار گیرد که باید صدها آزمایش را فقط برای رسیدن به یک نتیجه خوب انجام دهند.
Cradle در مخفی کاری فعالیت می کند و اکنون در حال ظهور است، با جمع آوری 5.5 میلیون دلار در یک دور اولیه با همکاری Index Ventures و Kindred Capital با مشارکت فرشتگان John Zimmer، Feike Siebesma و Emily Leproust.
ون گریکن گفت که این بودجه به تیم اجازه میدهد تا جمعآوری دادهها را گسترش دهد – هر چه بیشتر در مورد یادگیری ماشینی بهتر باشد – و روی محصول کار کند تا آن را “خود خدمترسانتر” کند.
ون گریکن در بیانیه مطبوعاتی گفت: “هدف ما کاهش هزینه و زمان برای بازاریابی یک محصول مبتنی بر زیستی با سفارشات بزرگ است، به طوری که هر کسی – حتی “دو بچه در گاراژ” – بتواند یک بیوگرافی بیاورد. محصول مبتنی بر قرار دادن در بازار.