
دستیابی به رانندگی مستقل ایمن به ساعتها نرمافزار آموزشی تقریباً بیپایان برای هر موقعیتی نیاز دارد که ممکن است قبل از قرار دادن وسیله نقلیه در جاده ایجاد شود. از لحاظ تاریخی، شرکتهای مستقل مجموعهای از دادههای دنیای واقعی را جمعآوری کردهاند تا الگوریتمهای خود را آموزش دهند، اما آموزش سیستمی که چگونه موارد لبه را تنها بر اساس دادههای دنیای واقعی مدیریت کند، غیرممکن است. نه تنها این، بلکه حتی جمعآوری، مرتبسازی و برچسبگذاری تمام آن دادهها در وهله اول زمان زیادی طول میکشد.
اکثر شرکتهای خودروهای خودران، مانند کروز، وایمو و وابی، از دادههای مصنوعی برای آموزش و آزمایش مدلهای ادراک با سرعت و سطح کنترل استفاده میکنند که با دادههای جمعآوریشده از دنیای واقعی غیرممکن است. Parallel Domain، استارتاپی که یک پلتفرم تولید داده برای شرکتهای مستقل ایجاد کرده است، میگوید دادههای مصنوعی یک جزء حیاتی برای مقیاسبندی هوش مصنوعی، تقویت سیستمهای بینایی و ادراک و آمادهسازی آنها برای غیرقابل پیشبینی بودن دنیای فیزیکی است.
این استارتآپ به تازگی دور سری B 30 میلیون دلاری را بسته است مارس کاپیتال، با مشارکت سرمایه گذاران بازگشتی Costanoa Ventures، Foundry Group، Calibrate Ventures و Ubiquity Ventures. Domain موازی بر بازار خودرو متمرکز است و داده های مصنوعی را برای برخی از OEM های اصلی که سیستم های کمک راننده پیشرفته می سازند و شرکت های رانندگی مستقلی که سیستم های خودران بسیار پیشرفته تر می سازند، ارائه می دهد. به گفته کوین مک نامارا، یکی از بنیانگذاران و مدیرعامل، اکنون دامنه موازی آماده گسترش به سمت هواپیماهای بدون سرنشین و بینایی رایانه های همراه است.
مک نامارا به TechCrunch گفت: «ما همچنین رویکردهای هوش مصنوعی مولد برای تولید محتوا را دو برابر می کنیم. چگونه میتوانیم از برخی از پیشرفتهای هوش مصنوعی مولد برای آوردن تنوع بسیار بیشتری از چیزها، افراد و رفتارها به دنیای خود استفاده کنیم؟ زیرا باز هم، بخش سخت اینجا واقعاً این است که وقتی یک رندر دقیق از نظر فیزیکی داشته باشید، چگونه میلیون ها سناریو مختلف را که یک ماشین باید با آنها مقابله کند، بسازید؟
به گفته مک نامارا، این استارت آپ همچنین به دنبال استخدام تیمی برای حمایت از پایگاه مشتریان رو به رشد خود در آمریکای شمالی، اروپا و آسیا است.
ساخت دنیای مجازی

نمونه ای از داده های مصنوعی دامنه موازی. اعتبار تصویر: دامنه موازی
زمانی که دامنه موازی در سال 2017 تأسیس شد، این استارتاپ بیش از حد بر ایجاد جهان های مجازی بر اساس داده های نقشه برداری دنیای واقعی متمرکز بود. در طول پنج سال گذشته، Parallel Domain به نسل جهانی خود افزوده است و آن را پر از ماشینها، افراد، زمانهای مختلف روز، آب و هوا و طیف وسیعی از رفتارهایی کرده است که این دنیاها را جالب میکند. این به مشتریانی اجازه می دهد که دامنه موازی از آنها حساب می شود مک نامارا گفت: گوگل، کانتیننتال، وون پلنت و موسسه تحقیقاتی تویوتا – برای تولید دوربین های پویا، رادار و داده های لیدار که برای آموزش و آزمایش سیستم های بینایی و ادراک خود نیاز دارند.
پلت فرم داده مصنوعی دامنه موازی از دو حالت تشکیل شده است: آموزش و آزمایش. هنگام آموزش، مشتریان پارامترهای سطح بالایی را توصیف می کنند – برای مثال، رانندگی در بزرگراه با 50٪ باران، 20٪ در شب و یک آمبولانس در هر دنباله – که می خواهند مدل خود را بر روی آنها آموزش دهند، و سیستم صدها هزار مورد تولید خواهد کرد. نمونه هایی که متناسب با آن پارامترها هستند.
در سمت تست، Parallel Domain یک API ارائه میدهد که به مشتری اجازه میدهد قرار دادن چیزهای پویا در جهان را کنترل کند، که سپس میتواند برای آزمایش سناریوهای خاص به شبیهساز آنها متصل شود.
این شرکت به TechCrunch گفت، برای مثال، Waymo بهویژه مشتاق استفاده از دادههای مصنوعی برای آزمایش شرایط آب و هوایی مختلف است. (سلب مسئولیت: Waymo یک مشتری تایید شده دامنه موازی نیست.) Waymo زمان را به عنوان یک لنز جدید می بیند که می تواند در تمام مایل هایی که در دنیای واقعی و شبیه سازی طی کرده است اعمال شود، زیرا یادآوری تمام این تجربیات با زمان تصادفی غیرممکن است. شرایط
چه برای آزمایش و چه برای آموزش، زمانی که نرم افزار Parallel Domain یک شبیه سازی ایجاد می کند، می تواند به طور خودکار برچسب هایی را برای مطابقت با هر عامل شبیه سازی شده ایجاد کند. این به تیمهای یادگیری ماشینی کمک میکند تا آموزش و آزمایشهای تحت نظارت را بدون نیاز به انجام فرآیند برچسبگذاری دادههای سخت انجام دهند.
دامنه موازی دنیایی را متصور است که در آن شرکتهای مستقل از دادههای مصنوعی برای بیشتر، اگر نه همه، نیازهای آموزشی و آزمایشی خود استفاده میکنند. امروزه نسبت بین داده های مصنوعی و واقعی از شرکتی به شرکت دیگر متفاوت است. شرکتهای با سابقهتر با منابع تاریخی برای جمعآوری دادههای زیاد از دادههای مصنوعی برای حدود 20 تا 40 درصد نیازهای خود استفاده میکنند، در حالی که شرکتهایی که زودتر در فرآیند توسعه محصول هستند، 80 درصد در مقابل 20 درصد از دنیای واقعی به مصنوعی متکی هستند. به مک نامارا
جولیا کلاین، شریک مارس کپیتال و اکنون یکی از اعضای هیئت مدیره دامنه موازی، گفت که معتقد است داده های مصنوعی نقش مهمی در آینده یادگیری ماشین ایفا خواهند کرد.
“دریافت داده های دنیای واقعی که برای آموزش مدل های بینایی کامپیوتری به آن نیاز دارید، اغلب یک مانع است، و از نظر اینکه بتوانیم آن داده ها را بدست آوریم، آنها را برچسب گذاری کنیم، آنها را برای موقعیتی آماده کنیم که واقعا بتوان از آنها استفاده کرد، مشکل است. کلاین به TechCrunch گفت. چیزی که ما با Domain موازی دیدیم این است که آنها این فرآیند را تا حد زیادی سرعت میبخشند و همچنین مواردی را که ممکن است حتی در مجموعه دادههای دنیای واقعی به دست نیاورید، بررسی میکنند.